Literaturtipps

two women sitting on leather chairs in front of table
Foto von Amy Hirschi

Standards der Personaldiagnostik.
Von Uwe P. Kanning.
Hogrefe, Göttingen 2004.

Leistungstests im Personalmanagement.
Von Stefan Krumm & Lothar Schmidt-Atzert.
Hogrefe, Göttingen 2009.

Psychologische Personalauswahl.
Von Heinz Schuler.
Hogrefe, Göttingen 2000.

Wünschenswerte Kriterien

Normierung: Sofern Arbeitgeber im eigenen Unternehmen keine eigenen Normen berechnet oder andere Entscheidungsregeln zur Bewertung der Testergebnisse festlegen, ist es sinnvoll, auf Normen des Testanbieters zurückzugreifen. Die Normen müssen sich auf Stichproben beziehen, die zum Einsatzgebiet passen (also zum Beispiel keine US-Normen in Europa). Zudem müssen sie hinreichend groß (in der Regel > 1.000 Personen) und nicht veraltet sein (maximal zehn Jahre).

Soziale Validität: Die Testverfahren sollten so beschaffen sein, dass die Teilnehmer sie akzeptieren können. Entsprechende Studien zeigen, dass Testverfahren eine deutlich geringere Akzeptanz bei Bewerbern finden als Interviews oder Assessment-Center. Dies gilt insbesondere für Intelligenztest. Dabei entsteht leider ein Dilemma: Intelligenztests sind besonders valide Verfahren, erscheinen den Probanden per Augenschein aber dubios. Es ist nun keine sinnvolle Lösung, deshalb auf valide Verfahren zu verzichten. Vielmehr sollten die Anwender selbst etwas für die Akzeptanz tun, beispielsweise, indem sie den Probanden vor der Untersuchung glaubwürdig vermittelt, dass es sich um nachweislich valide Instrumente handelt. Berufsspezifische Verfahren sind hier im Vorteil, da sie Aufgaben verwenden, die weniger abstrakt sind und daher auch augenscheinlich einen Bezug zum Arbeitsalltag besitzen. Einige wenige Verfahren stellen zudem Informationsmaterial für die Probanden zur Verfügung, um die soziale Validität zu steigern. Auch dies ist ein Vorteil gegenüber herkömmlichen Instrumenten.

Ökonomie: Häufig wählen Anwender die Testverfahren nach ihren absoluten Kosten aus. Weitaus sinnvoller wäre es, wenn sie die relativen Kosten berücksichtigen würden, indem sie die absoluten Kosten an dem zu erwartenden Nutzen relativieren und dahingehend verschiedene Testverfahren miteinander vergleichen. Dabei sind zahlreichen Faktoren zu berücksichtigen, zum Beispiel Kosten für die Anschaffung und Durchführung des Testverfahrens, zeitliche Belastung, Validität des Verfahrens, Anzahl und Bedeutung der fraglichen Stellen und Dauer des Verbleibs der neuen Mitarbeiter im Unternehmen. Inzwischen stellt die Forschung mehrere Modelle zur groben Abschätzung des monetären Nutzens einer diagnostischen Prozedur zur Verfügung. Ein überschaubares Model findet sich bei Krumm und Schmidt-Atzert (2009). In die Schätzung fließen unter anderem die folgenden Variablen ein: Validität, Anzahl der Stellen, die zu besetzen sind, voraussichtliche Verweildauer der neuen Mitarbeiter im Unternehmen, Bruttojahresgehalt sowie der Leistungsunterschied zwischen abgewiesenen und eingestellten Bewerbern.

Finden Unternehmen kein geeignetes Testverfahren, so können sie darüber nachdenken, ein eigenes entwickeln zu lassen. Dies ist aber nur dann ökonomisch sinnvoll, wenn sie es entsprechend häufig einsetzen beziehungsweise die Zielgruppe von sehr großer Bedeutung für das Unternehmen ist.

Notfalls sollten Arbeitgeber lieber auf den Einsatz von Testverfahren verzichten. Denn ein schlechtes Testverfahren richtet letztlich mehr Schaden an, als es Nutzen bringt.

Notwendige Kriterien

Objektivität: Für das Ergebnis der Untersuchung muss die Person des Diagnostikers irrelevant sein. Unabhängig davon, ob Frau X oder Herr Y den Test durchführt, muss bei ein und demselben Probanden dasselbe Ergebnis resultieren.

Reliabilität: Der Testanbieter muss für jede einzelne Skala seines Testverfahrens die Koeffizienten für die Reliabilität (Cronbachs Alpha) offenlegen. Handelt es sich um Merkmale, die über die Zeit hinweg stabil sind (Intelligenz, Persönlichkeit, soziale Kompetenzen), so ist zusätzlich für jede Skala des Tests die Retest- Reliabilität bezogen auf einen Zeitraum von mehreren Monaten anzugeben. Neben den eigentlichen Koeffizienten erfährt der Kunde Details zu den durchgeführten Studien (Stichprobengröße, Art der untersuchten Probanden; wurde gegebenenfalls nur das amerikanische Original untersucht oder auch dessen Übersetzung?).

Validität: Es müssen umfangreiche Ergebnisse vorliegen, mit deren Hilfe die Validität des Testverfahrens belegt wurde. Korrelationen zu anderen Testverfahren (Innere kriterienbezogene Validität) sind durchaus legitim und wichtig, sie allein reichen aber nicht aus. Die Studien müssen auch einen Bezug zu Kriterien des Berufslebens (zum Beispiel Leistung oder Arbeitszufriedenheit; Äußere kriterienbezogene Validität) herstellen. Selbstverständlich muss der Testanbieter völlig transparent darstellen, wie die Ergebnisse zustande gekommen sind (Stichproben, Berechnungsprozeduren). Studien, die sich allein auf ein amerikanisches Original beziehen, haben eine geringe Aussagekraft, sofern nicht sichergestellt ist, dass es durch die Übersetzungen zu keinen inhaltlichen Veränderungen gekommen ist.

Manche Testanbieter geben ihren Kunden keine detaillierten Informationen zu diesen grundlegenden Kriterien – vielleicht auch, weil gar keine Studien vorliegen. Die Produkte solcher Anbieter sind grundsätzlich zu meiden. Die Kunden sollten hier selbstbewusst auftreten und nicht bereit sein, die sprichwörtliche „Katze im Sack“ zu kaufen.

Neben diesen notwendigen lassen sich wünschenswerte Kriterien benennen (Abbildung 1):

Praxisbeispiel

Schauen wir uns abschließend noch ein Praxisbeispiel zum Einsatz von Testverfahren an: Eine große Behörde wollte die Potenziale ausgewählter Mitarbeiterinnen und Mitarbeiter im Hinblick auf mögliche Führungsaufgaben untersuchen. Um die spezifischen Anforderungen der infrage kommenden Führungsposition zu ermitteln, führte die Behörde zunächst mit mehreren Arbeitsplatzexperten (Stelleninhaber, deren Mitarbeiter, Vorgesetzte, interne Kunden und Kollegen) Einzelinterviews nach der Methode der Kritischen Ereignisse. Hierbei fragt der Interviewer sowohl nach erfolgskritischen Situationen des Berufsalltags, die zukünftige Stelleninhaber zu bewältigen haben, als auch nach guten und schlechten Verhaltensbeispielen bezogen auf diese Situationen. Die Auswertung der Interviews ergab sechs arbeitsplatzspezifische Kompetenzdimensionen, für die ein Assessment-Center entwickelt wurde (Tabelle 1).

In der Potenzialanalyse kamen mehrere Testverfahren zum Einsatz, die grundlegende Kompetenzen erfassen, welche losgelöst von der spezifischen Führungsposition von Bedeutung sind. Die erste Wahl fiel auf einen Klassiker der Intelligenzdiagnostik (I-S-T 2000-R). Die Intelligenz hat sich mehrfach in der Forschung als der wichtigste Einzelprädiktor beruflichen Erfolgs erwiesen. Da die Kandidaten sich in den kommenden Jahren noch viel neues Wissen aneignen müssen und in der Führungsposition mit komplexen Aufgaben konfrontiert werden, die möglichst rational zu lösen sind, bot sich hier eine Intelligenzmessung in besonderer Weise an. Doch auch Untersuchungen anderer Persönlichkeitsmerkmale wie Gewissenhaftigkeit und Leistungsmotivation sowie natürlich auch soziale Kompetenzen waren notwendig, damit der Arbeitgeber sich ein umfassendes Bild machen konnte. Auch hierfür wählte die Behörde ausschließlich Testverfahren aus, zu denen umfangreiche Studien vorliegen (LMI, BIP, ISK; vgl. Tabelle 1). Da es sich bei diesen Instrumenten ausnahmslos um Fragebögen zur Selbstbeschreibung handelte und damit zu rechnen war, dass manche Kandidaten zu einer extrem verzerrenden Selbstdarstellung neigen, kam zudem ein kurzer Fragebogen zur Identifizierung ausgeprägter Selbstdarsteller zum Einsatz (IGIP). Die Durchführung des gesamten Verfahrens mit gleichzeitig jeweils acht Kandidaten nahm zwei Tage Zeit in Anspruch. Nach der Auswertung der Ergebnisse führte die Behörde mit jedem Teilnehmer ein ausführliches Feedbackgespräch und legte einen individuellen Entwicklungsplan fest.

Das Beispiel verdeutlicht den Stellenwert von Tests in der Personaldiagnostik. Im Zentrum der Diagnostik stehen Instrumente, die für die spezifischen Anforderungen eines Arbeitsplatzes maßgeschneidert entwickelt werden (Interview und AC). Tests ergänzen diese Verfahren, indem sie auf einem abstrakteren Niveau grundlegende Kompetenzen erfassen. Nur wenn die Testverfahren wissenschaftlichen Kriterien genüge leisten, sind sie in der Lage, ihre wichtigen Aufgaben in der Praxis tatsächlich erfüllen zu können.

Quelle: personal manager Zeitschrift für Human Resources Ausgabe 2 März / April 2013

Werfen wir zunächst einen Blick auf häufig anzutreffende Scheinargumente, die allesamt ungeeignete Kriterien zur Auswahl eines Testverfahrens sind (Abbildung 1):

Scheinkriterien

Zufriedene Kunden: Testanbieter werben gern damit, dass ihre Kunden durchweg gute Erfahrungen mit ihren Produkten gesammelt hätten. Natürlich ermöglicht ein solches Verkaufsargument keine Aussage über die Qualität eines Testverfahrens. Man sollte es vollständig ignorieren. Zum einen lässt sich nicht überprüfen, ob beziehungsweise wie viele Kunden tatsächlich zufrieden sind, zum anderen spiegelt die Zufriedenheit der Kunden die tatsächlich Qualität des Verfahrens kaum wider. Zufrieden dürften die meisten Kunden schon sein, wenn sie keine massive Fehlentscheidung getroffen haben und ihre Stellenbesetzung nicht wieder rückgängig machen mussten. Dieser Anspruch ist denkbar gering. Ziel einer guten Personaldiagnostik ist es nicht, zwischen völlig ungeeigneten und halbwegs geeigneten Kandidaten zu unterscheiden, sondern den Grad der Eignung so abzubilden, dass Unternehmen zwischen guten, sehr guten und brillanten Kandidaten differenzieren können. Innerhalb der Gruppe der Geeigneten lassen sich bisweilen Leistungsunterschiede von bis zu 100 Prozent ausmachen. Inwieweit ein Test in der Lage ist, auch im Bereich der Geeigneten zu differenzieren, erschließt sich dem Betrachter leider nicht per Augenschein. Die tatsächliche Validität des Tests berechnen Arbeitgeber so gut wie nie im eigenen Unternehmen. Daher wissen die Verantwortlichen auch nicht, wie wirksam der Test im eigenen Hause ist und ob eine Alternative nicht sinnvoller gewesen wäre.

Namhafte Anwender: Ähnlich gelagert ist das Werben mit namhaften Firmen, die ein Testverfahren anwenden. Anbieter wollen damit insbesondere kleineren Firmen suggerieren, dass es sich um ein besonders gutes Verfahren handele. Allzu leicht sind diese verführt, zu glauben, dass ein renommierter Konzern automatisch auch ein qualitativ sehr hochwertiges Auswahlverfahren hat. Leider entspricht dies nicht der Realität. Zwar geben größere Unternehmen oft vergleichsweise viel Geld für die Personaldiagnostik aus, dies führt aber nicht dazu, dass sie tatsächlich nur hochwertige Testverfahren einsetzen. Auch in großen Unternehmen führen Führungskräfte unstrukturierte Interviews und HR-Abteilungen organisieren Assessment-Center, die ihr Geld nicht wert sind. Selbst zu den Anwendern völlig absurder Methoden, wie etwa der Graphologie oder der Schädeldeutung, gehören sehr bekannte Firmen. „Die Großen“ können sich Anwender in Sachen Personaldiagnostik also leider nicht immer zum Vorbild nehmen.

Weite Verbreitung: Da Testverfahren in der Praxis so gut wie nie auf ihren tatsächlichen Nutzen hin untersucht werden und insbesondere kleinere Firmen sich darauf verlassen, dass ein etablierter Test automatisch auch hochwertig sei, entsteht eine Art Lawineneffekt. Je mehr Firmen den Test einsetzen, desto überzeugender wird das Produkt für Anwender, die selbst die Qualität eines Tests nicht einschätzen können. Entscheiden auch Sie sich für den Test, so werden Sie selbst zu einem Teil der Lawine und verstärken den Prozess für die nachfolgenden Anwender. Wer hier ausbrechen will, muss sich ein unabhängiges Urteil bilden.

Jahrzehntelange Erfahrungen: Gern verweisen Anbieter darauf, dass ein Test seit Jahrzehnten erfolgreich auf dem Markt ist. Auch dies spricht leider nur für ein professionelles Marketing und ist kein Beleg für die Qualität. Stellen wir uns nur einmal einen Personalchef vor, der seit zehn Jahren einen bestimmten Test einsetzt. Je länger er ihn verwendet, desto größer wird der psychologische Druck, die Investition vor sich und vor anderen zu rechtfertigen. Die Wahrscheinlichkeit, dass Anwender ein Verfahren kritisch hinterfragen, sinkt daher mit zunehmender Nutzungsdauer. Welche Kriterien zur Auswahl eines Testverfahrens sind nun aber aussagekräftig? Grundlegend ist hier zwischen notwendigen und hinreichenden Kriterien zu unterscheiden. Die notwendigen Kriterien müssen unbedingt erfüllt sein, die hinreichenden sind wünschenswert. Wenden wir uns zunächst den unbedingt notwendigen Kriterien zu, die ein Test zu erfüllen hat (Abbildung1):