Sie sind auf Seite 1von 258

Personalauswahl kompetent gestalten

Diagnostik- und Testkuratorium


Hrsg.

Personalauswahl
kompetent gestalten
Grundlagen und Praxis der Eignungsdiagnostik nach DIN 33430

Mit 26 Abbildungen
Herausgeber
Diagnostik- und Testkuratorium
Gießen
Deutschland

ISBN 978-3-662-53771-8    ISBN 978-3-662-53772-5 (eBook)


DOI 10.1007/978-3-662-53772-5

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detail-
lierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

© Springer-Verlag GmbH Deutschland 2018


Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrück-
lich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbe-
sondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung
und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt
auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen-
und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden
dürften.
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in
diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die
Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes,
etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebiets-
bezeichnungen in veröffentlichten Karten und Institutionsadressen neutral.

Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier

Springer ist Teil von Springer Nature


Die eingetragene Gesellschaft ist Springer-Verlag GmbH Deutschland
Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
V

Vorwort

z DIN 33430 – eine Norm für die Eignungsdiagnostik


Was macht gute Personalarbeit aus? Wesentliche Komponenten sind
55 die „richtige“ Person zur „richtigen“ Zeit auf den „richtigen“ Arbeitsplatz bringen
55 Menschen für zukünftige berufliche Aufgaben fördern und entwickeln

Das Herzstück der Arbeit ist die Passung zwischen der Welt der Arbeit und der Welt der Person.
Diese Passung ist gleichermaßen eine zentrale Voraussetzung für den Organisationserfolg wie
für den persönlichen Erfolg, für Gesundheit und Zufriedenheit. Im Zentrum guter Personal-
arbeit steht also die Eignungsdiagnostik, die Personalauswahl für Interne und Externe. Es geht
darum, zu erkennen, wann jemand wofür „richtig“ gut passt.
Zu der Frage, was eine qualitativ hochwertige Personalauswahl ausmacht, wurden in der
Praxis seit Jahrzehnten wertvolle Erfahrungen gesammelt. Von Anfang an wurde die Praxis
von der Wissenschaft und Forschung begleitet. Theorien und Methoden wurden entwickelt,
die Erfahrungen wurden systematisch in Evaluationsstudien ausgewertet.
Im Jahre 2002 wurden die gesammelten Erkenntnisse aus Wissenschaft und Praxis erst-
mals in Form einer DIN Norm, der DIN 33430, publiziert und allen Interessentinnen und Inte-
ressenten zur Verfügung gestellt. Zwölf Jahre später, im Jahr 2016, wurde eine überarbeitete
Fassung der DIN 33430 unter dem Titel „Anforderungen an berufsbezogene Eignungsdiag-
nostik“ der Öffentlichkeit vorgestellt. Die neue Fassung der Norm trägt den Veränderungen auf
dem Arbeitsmarkt (z.B. Personalmangel, Globalisierung), der Digitalisierung (z.B. Online-Tes-
tung), den veränderten gesetzlichen Rahmenbedingungen sowie aktuellen Erkenntnisse (z.B.
Metastudien, Qualitätsstandards wie der ISO 10667) Rechnung.

z Das Buch zur Norm


Die Erfahrungen zeigen, wie wichtig eine solide Wissensbasis für die Gestaltung einer qualita-
tiv hochwertigen Praxis der internen und externen Personalauswahl ist. Das Diagnostik- und
Testkuratorium hat sich daher dazu entschlossen, ein Buch zu gestalten, in dem die Inhalte der
DIN 33430 erläutert und praxisgerecht aufbereitet werden. Die Autorinnen und Autoren des
vorliegenden Buches erklären den Prozess der Personalauswahl nach DIN 33430 von A wie
„Anforderungsanalyse“ bis Z wie „Zielerreichungsevaluation“.
Im ersten Kapitel des Buches erläutern die Autoren die Architektur der DIN 33430 mit ihren
drei qualitätstragenden Säulen (1) Prozess, (2) Verfahren und (3) Personen. Bei den „Personen“
geht es um diejenigen, die die Eignungsdiagnostik gestalten und/oder daran mitwirken. Qua-
litativ hochwertig ist Eignungsdiagnostik nur dann, wenn die Personen, die diese Diagnostik
gestalten, durchführen und auswerten, ihr Handwerk verstehen. Im ersten Buchkapitel wird
dargestellt, welche Anforderungen in der DIN 33430 an solche Personen gestellt werden und
wie man nachweisen kann, dass man diesen Anforderungen gerecht wird. Dabei verlangen die
Regeln der DIN 33430 jeder Person nur so viel an Qualifikation ab, wie für die Ausübung ihrer
Aufgaben im eignungsdiagnostischen Prozess notwendig ist. In der Norm werden drei Quali-
fikationsprofile unterschieden.
In einer Folgeinitiative zur DIN 33430 hat die Föderation Deutscher Psychologenvereini-
gungen eine „Fortbildungs- und Prüfungsordnung zur Personenlizenzierung für berufsbezo-
gene Eignungsbeurteilungen nach DIN 33430“ erlassen. Der Nachweis, dass man über die nach
VI Vorwort

DIN 33430 für die jeweilige Rolle im eignungsdiagnostischen Prozess notwendigen Kenntnisse
verfügt, wird durch das Bestehen einer Prüfung erbracht. Prüfungsgegenstand ist das vorlie-
gende Buch. Es gibt drei verschiedene Arten von Lizenzen, die unterschiedlich umfangreiche
Kenntnisse repräsentieren, wobei der Umfang der Kenntnisse über die Anzahl der Buchkapi-
tel operationalisiert ist:
55 Lizenz BV für Beobachter/-innen, die an Verhaltensbeobachtungen und -beurteilungen
beteiligt sind (Gegenstand der Prüfung: 7 Kap. 1 und 7 Kap. 2)
55 Lizenz BE für Beobachter/-innen, die an direkten mündlichen Befragungen beteiligt sind
(Gegenstand der Prüfung: 7 Kap. 1, 7 Kap. 2 und 7 Kap. 3)
55 Lizenz E für Eignungsdiagnostiker/-innen (Gegenstand der Prüfung: 7 Kap. 1 bis 7 Kap. 6
sowie der Text der DIN 33430)

Zusätzlich zu den Kenntnissen werden noch angeleitete Praxiserfahrungen gefordert. Details


zur Lizenzierung und zu den Prüfungen sind Gegenstand von 7 Kap. 1, in dem auch rechtliche
Aspekte der Eignungsdiagnostik angesprochen werden.
Der Ausgangspunkt jeder Personalauswahl ist das Anforderungsprofil – was es damit auf
sich hat, erläutern die Autoren des zweiten Kapitels. Darüber hinaus geht es in diesem Kapitel
um die Konstruktion, Durchführung und Auswertung von Verfahren zur Verhaltensbeobach-
tung und -beurteilung, z.B. Gruppendiskussionen und Rollenspiele. Thematisiert werden auch
Beurteilungsfehler sowie Trainings für Beobachter/-innen.
Fast immer werden im Rahmen der Personalauswahl Interviews mit Kandidatinnen und
Kandidaten geführt, gelegentlich auch Gespräche mit Dritten, z.B. Referenzgeberinnen und
-gebern. Im dritten Kapitel wird erläutert, wie solche Interviews und Gespräche systematisch
und strukturiert vorbereitet, durchgeführt und ausgewertet werden. Im zweiten Abschnitt des
dritten Kapitels geht es um rechtliche Aspekte der Gesprächsführung, z.B. um die Zulässigkeit
und Unzulässigkeit von Interviewfragen und um die Rechtsfolgen unzulässiger Fragen.
Noch ausführlicher werden die Grenzen, die das Recht der Eignungsdiagnostik zieht, im
dritten Abschnitt des vierten Kapitels besprochen. Hier geht es vor allem um den Datenschutz
sowie um das Allgemeine Gleichbehandlungsgesetz (AGG). Die Autoren zeigen auf, wie die
Einhaltung der DIN (2016) hilft, die Rechtssicherheit der Personalauswahl zu erhöhen. In den
beiden vorhergehenden Abschnitten des vierten Kapitels geht es darum, wie man eine Anfor-
derungsanalyse durchführen kann, um das in 7 Kap. 1 bereits beschriebene Anforderungspro-
fil zu gewinnen. Das vierte Kapitel bietet außerdem einen Überblick über die Verfahren, die
für die Personalauswahl zur Verfügung stehen (z.B. Auswertung von Bewerbungsunterlagen,
Interviews, Präsentationsübungen, Persönlichkeitsfragebogen und Intelligenztests). Diese Ver-
fahren werden kategorisiert, und es wird erläutert, was bei den Verfahren im Allgemeinen oder
bei ihrer Durchführung im Besonderen jeweils zu beachten ist.
Die Konstruktion, Auswahl und die fachgerechte Nutzung von Verfahren sowie die Inter-
pretation der Verfahrensergebnisse setzen statistisch-methodische Kenntnisse voraus. Diese
werden im fünften Kapitel vermittelt. Die Autoren erläutern sowohl Grundbegriffe wie Kor-
relation und Messfehler als auch die Grundzüge der Klassischen Testtheorie sowie der Item-
Response-Theorie. Ein weiterer Schwerpunkt des fünften Kapitels liegt auf den sogenannten
„Hauptgütekriterien“ von Verfahren, Objektivität, Zuverlässigkeit (Reliabilität) und Gültig-
keit (Validität).
Welche Verfahren der Personalauswahl sich bewährt haben, wird im sechsten Kapitel
anhand der Ergebnisse empirischer (Meta-)Studien erläutert. Außerdem zeigen die Autoren,
welche Aspekte bei einer Evaluation berücksichtigt werden können und welche Randbedingun-
gen (Grundquote und Selektionsquote) zu günstigen bzw. ungünstigen Trefferquoten führen.
VII
Vorwort

Schließlich zeigen die Autoren, wie der monetäre Nutzen von Vorgehensweisen und Verfahren
der Eignungsbeurteilungen geschätzt werden kann.
Nur wer informiert ist, kann ein eignungsdiagnostisches Verfahren auswählen, regelgerecht
anwenden, interpretieren und hinsichtlich der Qualität beurteilen. Qualitativ hochwertige Eig-
nungsdiagnostik setzt nicht nur kompetente Anwender/-innen voraus, sondern auch Informa-
tionen über Verfahren. Mit der DIN 33430 wird geregelt, welche Informationen zu einem Ver-
fahren vorliegen müssen – im Anhang des vorliegenden Buches werden diese Anforderungen
erläutert. Der Anhang umfasst außerdem die sogenannte „DIN SCREEN Checkliste“. Mit dieser
Checkliste lässt sich prüfen, ob den Informationspflichten, die die Autorinnen und Autoren
der DIN den Anbieterinnen und Anbietern von Verfahren auferlegen, im konkreten Einzel-
fall genüge getan wird. Der Text erläutert die Anwendung dieser sogenannten „DIN SCREEN
Checkliste“. Die Checkliste repräsentiert den „Standard zur Information und Dokumentation
von Instrumenten zur Erfassung menschlichen Erlebens und Verhaltens des Diagnostik- und
Testkuratoriums der Föderation Deutscher Psychologenvereinigungen“. Diese Checkliste steht
auch im Internet zum freien Download bereit (http://link.springer.com/978-3-662-53772-5 unter
„Back Matter“).

z Hinweise zur Nutzung des Buches


Hinweisen möchten wir darauf, dass mit der Abkürzung „DIN“ im vorliegenden Buch, sofern
nichts anderes vermerkt, die DIN 33430 in der Fassung von 2016 gemeint ist. Die Begriffe „Gül-
tigkeit“ und „Validität“ werden als Synonyme genutzt, ebenso die Begriffe „Zuverlässigkeit“
und „Reliabilität“.
Das Buch ist in einer geschlechtergerechten Sprache geschrieben. Wenn Frauen und Männer
gleichermaßen gemeint sind, werden sie auch sprachlich gleich behandelt, indem wir beide
Geschlechter explizit erwähnen. Dieses Prinzip wird durchbrochen, wenn wir Originalzitate
aus der DIN 33430 wiedergeben, da der Text der DIN keine geschlechtergerechte Sprache nutzt,
von uns aber korrekt wiedergegeben werden muss. Natürlich sind auch bei den Zitaten aus der
DIN immer Frauen und Männer gemeint.
Wie oben bereits erwähnt, ist das Buch Gegenstand der Prüfung zur Personenlizenzierung
für berufsbezogene Eignungsbeurteilungen nach DIN 33430. Wer diese Prüfung absolvieren
möchte, muss unbedingt die entsprechenden Ausführungen dazu in 7 Kap. 1, 7 Abschn. 1.1.4
lesen. Dort wird beispielsweise erläutert, dass einige Ausführungen im Buch nicht prüfungsre-
levant sind. Hierzu zählen alle als „Exkurs“ gekennzeichneten Informationen sowie die Inhalte
einiger, diesbezüglich explizit mit einer Fußnote gekennzeichneten Tabellen.

z Danksagungen
Das Diagnostik- und Testkuratorium ist zuständig für alle Aspekte der Qualitätssicherung und
Qualitätsoptimierung des diagnostischen Prozesses in Forschung und Anwendung, soweit es
sich um Diagnostik menschlichen Erlebens und Verhaltens handelt. Qualitativ hochwertige
Personalauswahl bedarf qualifizierter Eignungsdiagnostikerinnen und -diagnostiker sowie
Beobachter/-innen, die den Qualitätsstandard der DIN 33430 in der Praxis umsetzen. Wir sind
überzeugt davon, mit dem vorliegenden Buch maßgeblich zur Qualifizierung der Eignungs-
diagnostiker/-innen beizutragen.
Zum Abschluss des Vorworts möchten wir einigen Personen, die sich um das vorliegende
Buch verdient gemacht haben, danken. Das Buch wäre in der vorliegenden Form nicht möglich
geworden, wenn es uns nicht gelungen wäre, eine Gruppe von doppelt-qualifizierten Kollegin-
nen und Kollegen als Autorinnen und Autoren zu gewinnen. Die Autorinnen und Autoren sind
nicht nur ausgewiesene Expertinnen und Experten in ihrem Fach, sie kennen darüber hinaus
VIII Vorwort

auch die eignungsdiagnostische Praxis. Außerdem verfügen sechs der neun Autorinnen und
Autoren (zumindest eine Autorin/ein Autor pro Kapitel) über jahrelange Erfahrungen als Trai-
ner/-in zur DIN-Fortbildung. Sie haben erfahren, wie man Wissen vermitteln muss, damit es
ankommt. Unser Dank gilt daher zunächst den Autorinnen und Autoren der Beiträge.
Darüber hinaus möchten wir uns bei Cordula Bork und Pascale Bothe aus der Abteilung
Psychologische Diagnostik der JLU Gießen für umfassende Korrekturlesungen und konstruk-
tiv-kritische Anregungen bedanken.
Schließlich geht unser Dank an die Mitarbeiterinnen und Mitarbeitern des Springer-Ver-
lags für die professionelle Begleitung des Buches, insbesondere an Heiko Sawczuk (Planung),
Judith Danziger (Projektmanagement) und Dr. Marion Sonnenmoser (Lektorat).

Diagnostik- und Testkuratorium, Juni 2017


IX

Autorenportraits

Dr. Markus Bühner


ist Universitätsprofessor und Lehrstuhlinhaber für Psychologische
Methodenlehre und Diagnostik an der Ludwig-Maximilians-Univer-
sität München. Der Diplom-Psychologe war langjähriges Mitglied des
Diagnostik- und Testkuratoriums, ist Autor verschiedener Lehrbücher
auf dem Gebiet der Statistik, Diagnostik und Testkonstruktion und ist
darüber hinaus seit über zehn Jahren als Berater großer Konzerne tätig.
Er entwickelte für diese Fragebogen, Leistungstests und Online-Tools,
evaluierte zahlreiche Auswahlverfahren und beriet sie in Fragen der Eig-
nungsbeurteilung. Markus Bühner ist (Mit-)Autor von über 80 nationa-
len und internationalen Fachpublikationen sowie Gutachter vieler psy-
chologischer und medizinischer Fachzeitschriften. Er wurde zweimal
für exzellente Lehre an der Universität Graz ausgezeichnet und war in
zahlreichen verantwortungsvollen Positionen an der Universität und in
Fachgesellschaften tätig.

Diagnostik- und Testkuratorium (DTK).


Das Diagnostik- und Testkuratorium (DTK) ist ein vom Berufsverband
Deutscher Psychologinnen und Psychologen e.V. und von der Deut-
schen Gesellschaft für Psychologie e.V. getragenes Gremium. Das DTK
ist zuständig für alle Aspekte der Qualitätssicherung und Qualitätsop-
timierung des diagnostischen Prozesses in Forschung und Anwendung,
soweit es sich um Diagnostik menschlichen Erlebens und Verhaltens
handelt. Zu den Aufgaben des DTK zählt u.a. die Entwicklung, Imple-
mentierung und Sicherung der Einhaltung von diagnostischen Leitli-
nien, die Steuerung und Supervision der Lizensierung nach DIN 33430,
die Akkreditierung von Anbieterinnen und Anbietern zur diagnosti-
schen Fort- und Weiterbildung sowie die Information und Aufklärung
der Öffentlichkeit über Möglichkeiten und Grenzen psychologischer
Diagnostik.

Luise Franke-Bartholdt
ist wissenschaftliche Mitarbeiterin am Lehrstuhl Persönlichkeitspsycho-
logie und Diagnostik an der Technischen Universität (TU) Chemnitz.
Die Diplom-Psychologin hat an der TU Chemnitz studiert. Sie forscht,
unter anderem im Rahmen ihres Promotionsvorhabens, zu Einflussfak-
toren auf die Qualität von Anforderungsanalysen sowie zu Ursachen und
Folgen von (un-)moralischem Mitarbeiterverhalten in Organisationen.
Die Befunde ihrer Arbeiten hat sie bereits erfolgreich auf verschiedenen
Tagungen im wissenschaftlichen ebenso wie im praktischen Kontext prä-
sentiert. Neben der universitären Laufbahn war sie an der Entwicklung
und Evaluation von eignungsdiagnostischen Projekten in den Anwen-
dungsfeldern Ausbildung, Studium und Beruf beteiligt.
X Autorenportraits

Dr. Stefan Höft


ist Professor für Personalpsychologie und Eignungsdiagnostik an der
Hochschule der Bundesagentur für Arbeit (HdBA) in Mannheim. Der
Diplom-Psychologe arbeitete nach seiner Promotion zur berufsbezo-
genen Persönlichkeitsdiagnostik sechs Jahre lang als Fachkoordinator
„Verhaltensorientierte Diagnostik“ am Deutschen Zentrum für Luft- und
Raumfahrt e.V. (DLR) und betreute dort die Assessment-Center-Verfah-
ren im Rahmen des Auswahlprogramms für Verkehrsflugzeugführer/-
innen. Seit 2007 lehrt er an der HdBA (und auch als Lehrbeauftragter
an den Universitäten Mannheim und Heidelberg) zu den theoretischen
und praktischen Verbindungen zwischen beruflicher Eignungsdiagnos-
tik und beruflicher Beratung. Als langjähriges Vorstandsmitglied des
Arbeitskreis Assessment Center e.V. hat er unterschiedlichste Projekte
zur Wissenschafts-Praxis-Synergie initiiert und begleitet, u.a. die natio-
nalen Assessment-Center-Standards in der Version 2004 und 2016, zwei
Buchherausgeberschaften und fünf Themenhefte in wissenschaftlichen
Zeitschriften.

Dr. Martin Kersting


ist Universitätsprofessor für Psychologische Diagnostik an der Justus-
Liebig-Universität Gießen. Der Diplom-Psychologe, der Mitglied der
DIN Kommission, des Arbeitskreises Assessment Center sowie Vorsit-
zender des Diagnostik- und Testkuratoriums ist, war über zehn Jahre
als Personalberater tätig. Am Bildungs- und Wissenschaftszentrum der
Bundesfinanzverwaltung leitete Kersting fast drei Jahre den Bereich
„Führung und Steuerung“ und war u.a. für die Führungskräftetrainings
verantwortlich. Martin Kersting ist (Mit-)Autor verschiedener Tests zu
kognitiven Kompetenzen und „soft skills“ sowie von über 100 Publika-
tionen und über 200 Vorträgen zu personalpsychologischen Themen.
Im Jahr 2015 wurde Martin Kersting vom Personalmagazin zu den „füh-
renden Köpfen des Personalwesens“ gekürt. Sowohl 2015 (Platz 2) als
auch 2016 (Platz 3) wurde Martin Kersting von der Jury „UnicumBeruf “
im bundesweiten Wettbewerb zum „Professor des Jahres“ (Kategorie
„Medizin/Naturwissenschaften“) gewählt.

Dr. Stefan Krumm


ist Universitätsprofessor für Psychologische Diagnostik, Differentielle
und Persönlichkeitspsychologie an der Freien Universität Berlin. Der
Bankkaufmann und Diplom-Psychologe promovierte an der Philipps-
Universität Marburg. Danach war er als Senior-Consultant für eine
Unternehmensberatung sowie für eine wissenschaftliche Transferein-
richtung an der WWU Münster tätig. Seit 2013 leitet Stefan Krumm die
von ihm gegründete wissenschaftliche Transfer- und Beratungseinrich-
tung „fu diagnostik“. Zusammen mit seinem Team betreut er Groß- und
mittelständische Unternehmen bei der Konzeption, Implementierung
und Evaluation von eignungsdiagnostischen Verfahren. Neben seiner
XI
Autorenportraits

praktischen Tätigkeit forscht Stefan Krumm zu Fragen der Technolo-


gisierung der Arbeit, des demografischen Wandels und der situativen
Testverfahren. Seine Forschungsergebnisse sind in zahlreichen inter-
nationalen Fachzeitschriften veröffentlicht. Seit 2016 ist Stefan Krumm
Associate Editor beim European Journal of Psychological Assessment.

Rechtsassessor Ingo Püttner


arbeitet in der Personalabteilung der Berufsgenossenschaft Holz und
Metall in Mainz. Er befasst sich mit allen praxisrelevanten Rechtsfragen
des Arbeits- und Beamtenrechts und führt auch arbeitsgerichtliche Ver-
fahren. Sein besonderes Interesse gilt den rechtlichen Rahmenbedingun-
gen von Auswahlverfahren, der Anwendung des Allgemeinen Gleich-
behandlungsgesetzes sowie dem Einsatz der elektronischen Identität im
Arbeitsleben. Zu diesen Themen verfasst er Beiträge in Fachzeitschrif-
ten und Lehrbüchern. Darüber hinaus berät er gelegentlich Institutio-
nen und Unternehmen auf dem Gebiet der Mitbestimmung nach dem
Betriebsverfassungs- und Personalvertretungsgesetz. Seit vielen Jahren
ist er ehrenamtlicher Richter der Fachkammer für Personalvertretungs-
recht des Bundes am Verwaltungsgericht Mainz.

Dr. Lothar Schmidt-Atzert


ist Universitätsprofessor für Psychologische Diagnostik an der Phil-
ipps-Universität Marburg (Promotion an der Justus-Liebig-Universität
Gießen, Habilitation an der Julius-Maximilians-Universität Würzburg).
Er hat zahlreiche Publikation u.a. zur beruflichen Eignungsdiagnostik
verfasst, ist Erstautor des Standardwerks „Psychologische Diagnostik“
(5. Aufl. 2012) und hat mehrere Tests entwickelt (u.a. d2-R: Elektronische
Fassung des Aufmerksamkeits- und Konzentrationstest, 2017; Koautor
R. Brickenkamp). Seit 2007 ist er wissenschaftlicher Leiter von Projekten,
in denen die Anforderungen an zahlreiche Studiengänge der Philipps-
Universität Marburg ermittelt und Online-Tests für Studieninteressierte
zur Erkundung der eigenen Passung zu den Studiengängen entwickelt
und evaluiert werden. Für herausragende Arbeiten auf dem Gebiet der
Psychologischen Diagnostik wurde er mit dem „Preis für computerge-
stützte Diagnostik“ (2005) und dem „Alfred-Binet-Preis“ (2015) geehrt.

Dr. Anja Strobel


ist Universitätsprofessorin für Persönlichkeitspsychologie und Diagnos-
tik an der Technischen Universität (TU) Chemnitz. Die Diplompsycho-
login promovierte an der Technischen Universität (TU) Dresden und war
dort auch als Juniorprofessorin für Prozessorientierte Diagnostik tätig.
Die Aussagekraft von Auswahlprozessen und die Kompetenz von Inter-
viewenden stellen wesentliche Schwerpunkte ihrer Arbeit dar. Darüber
hinaus beschäftigt sich Anja Strobel mit dem Persönlichkeitsmerkmal
kognitiver Motivation sowie mit Bedingungen und Konsequenzen (un-)
XII Autorenportraits

moralischen Verhaltens von Mitarbeitern in Organisationen. Ihre bis-


herigen Arbeiten mündeten in zahlreiche Buchbeiträge und Zeitschrif-
tenartikel sowie Fragebogen. Anja Strobel setzt sich unter anderem als
Mitglied im Arbeitskreis Assessment Center e.V. intensiv für eine hohe
Qualität der Eignungsbeurteilung und eine enge Verzahnung von For-
schung und Praxis ein. Den Transfer praxisrelevanten Wissens treibt
sie über zahlreiche Projekte mit Industriepartnern sowie als Dozentin
und Referentin in verschiedenen Kontexten voran. In ihrer Lehrtätig-
keit verbindet sie aktuelle wissenschaftliche Befunde mit umfassender
Praxiserfahrung. Sie wurde an den Universitäten Dresden und Chem-
nitz mehrfach für hervorragende Lehre ausgezeichnet.

Dr. Matthias Ziegler


ist Universitätsprofessor für Psychologische Diagnostik an der Hum-
boldt-Universität zu Berlin. Er studierte Psychologie an der Philipps-
Universität Marburg und promovierte und habilitierte an der LMU in
München. Matthias Ziegler ist (Mit-)Autor von mehr als 100 Publika-
tionen, u.a. zu den Themen Persönlichkeit und Persönlichkeitsmessung,
Leistungsvorhersage, Faking und lebenslanges Lernen. Daneben hat er
zahlreiche Tests selbst entwickelt oder war an der Entwicklung beratend
beteiligt. In den Jahren 2013 bis 2017 leitete er als Editor in Chief das
European Journal of Psychological Assessment. Seit 2016 ist Matthias
Ziegler Mitglied des Diagnostik- und Testkuratoriums. Neben der aka-
demischen Laufbahn leitete er zahlreiche eignungsdiagnostische Pro-
jekte in verschiedenen Unternehmen zu Themen wie Kompetenzmo-
dellierung, Azubi-Auswahl, Mitarbeitergespräche, Assessment-Center,
Führungskräfteentwicklung oder Eignungsinterviews.
XIII

Inhaltsverzeichnis

1 Einführung in die DIN 33430. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1


Martin Kersting und Ingo Püttner
1.1 Qualitätssicherung und -optimierung in der Eignungsdiagnostik. . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Wozu eine Norm für die Eignungsdiagnostik?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Entwicklung, Bedeutung und Nutzen von Normen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.3 Die aktuelle DIN 33430 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.4 Folgeinitiativen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.1.5 Qualitätsstandards. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.1.6 Qualitätssichernde und qualitätsoptimierende Maßnahmen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.7 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2 Rechtliche Rahmenbedingungen der Eignungsdiagnostik - I . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.1 Rechtliche Rahmenbedingungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2 Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung. . . . . 27


Stefan Höft und Martin Kersting
2.1 Anforderungsprofil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Verhaltensbeobachtung und -beurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2.1 Von der Alltagsbeobachtung zur systematischen Verhaltensbeobachtung:
Eine Begriffsbestimmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2.2 Rahmenbedingungen der eignungsdiagnostischen Verhaltensbeobachtung . . . . . . . . . . . . . . . 34
2.2.3 Prozess der Verhaltensbeobachtung und -beurteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.4 Weitere Aufgaben der Beobachter/-innen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.2.5 Fehler bei der Beobachtung und Beurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.2.6 Trainingstechniken für Beobachter/-innen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.2.7 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3 Eignungsinterviews/direkte mündliche Befragungen. . . . . . . . . . . . . . . . . . . . . . . . . . . 65


Anja Strobel, Luise Franke-Bartholdt, Ingo Püttner und Martin Kersting
3.1 Eignungsinterview. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.1.1 Begriffsbestimmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.1.2 Strukturierung als Merkmal zur Interviewklassifikation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.1.3 Güte des Eignungsinterviews . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.1.4 Der Interviewprozess. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.1.5 Verzerrungen im Interviewprozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.1.6 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.2 Zulässigkeit von Fragen, Offenbarungspflichten und Rechtsfolgen. . . . . . . . . . . . . . . . . . . . . 84
3.2.1 Informationsinteresse der Arbeitgeberin/des Arbeitgebers versus
Persönlichkeitsrecht der Kandidatinnen und Kandidaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.2.2 Zulässige, anforderungsbezogene Fragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.2.3 Unzulässige Fragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.2.4 Besonderheiten in tendenziösen Organisationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
XIV Inhaltsverzeichnis

3.2.5 Rechtsfolgen unzulässiger Fragen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88


3.2.6 Umgang mit Informationen, nach denen man nicht hätte fragen dürfen. . . . . . . . . . . . . . . . . . . . 89
3.2.7 Befragung von Referenzgeberinnen und -gebern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.8 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

4 Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie


rechtliche Rahmenbedingungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Stefan Höft, Ingo Püttner und Martin Kersting
4.1 Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik . . . . . . . . . . 97
4.1.1 Konzeptionelle Zugänge. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.1.2 Perspektiven- und Methodenvielfalt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.1.3 Spezifische Zielpositionsanalysen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.1.4 Zusammenführung der Informationen in einem Anforderungsprofil. . . . . . . . . . . . . . . . . . . . . . 107
4.1.5 Festlegung und Konkretisierung notwendiger Ausprägungsgrade der
Eignungsmerkmale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.1.6 Eignungsmerkmal und Gesamteignung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.1.7 Dokumentation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.1.8 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.2 Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen. . . . . . . . . . 112
4.2.1 Auswahl von Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.2.2 Fünf Verfahrenskategorien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.2.3 Anforderungen an Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
4.2.4 Möglichkeiten und Grenzen der Verfahren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.2.5 Anforderungen an computerbasierte und internetgestützte Verfahren. . . . . . . . . . . . . . . . . . . 123
4.2.6 Durchführungsbedingungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.2.7 Generische Eignungsmerkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.2.8 Vorgehensweisen und Strategien der Eignungsbeurteilung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.2.9 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.3 Rechtliche Rahmenbedingungen der Eignungsdiagnostik - II. . . . . . . . . . . . . . . . . . . . . . . . . 140
4.3.1 Mitbestimmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
4.3.2 Datenschutz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
4.3.3 Berufspflichten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.3.4 Gütekriterien aus rechtlicher Sicht. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
4.3.5 Rechtliche Bedeutung von DIN-Normen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
4.3.6 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

5 Statistisch-methodische Grundlagen der Eignungsbeurteilung . . . . . . . . . . . . . . 155


Markus Bühner, Matthias Ziegler und Martin Kersting
5.1 Einführung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
5.2 Statistisch-methodische Grundlagen für die Auswahl von Verfahren . . . . . . . . . . . . . . . . . 157
5.2.1 Stichprobe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.2.2 Maße der zentralen Tendenz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.2.3 Streuungsmaße. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.2.4 Zusammenhangsmaße. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
5.2.5 Multiple lineare Korrelation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
XV
Inhaltsverzeichnis

5.3 Testtheorien: Klassische Testtheorie und Item-Response-Theorien. . . . . . . . . . . . . . . . . . . . 165


5.3.1 Latente und manifeste Variablen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
5.3.2 Klassische Testtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.3.3 Item-Response-Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.4 Gütekriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.4.1 Zuverlässigkeit bzw. Reliabilität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.4.2 Konfidenzintervalle und der Vergleich der Ergebnisse verschiedener
Kandidatinnen und Kandidaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.4.3 Gültigkeit bzw. Validität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
5.4.4 Objektivität. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
5.4.5 Norm- und kriteriumsorientierte Messungen und Ergebnisrückmeldung . . . . . . . . . . . . . . . . . 182
5.4.6 Fairness. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
5.5 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

6 Evaluation der Eignungsbeurteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189


Lothar Schmidt-Atzert, Stefan Krumm und Martin Kersting
6.1 Was ist Evaluation?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
6.2 Wie wird evaluiert?. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
6.2.1 Vergleichsmaßstäbe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
6.2.2 Erfolgskriterien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
6.3 Diagnostische Urteilsbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.3.1 Formen der Urteilsbildung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
6.3.2 Strategien der regelgeleiteten Urteilsbildung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
6.4 Ergebnisse einschlägiger Evaluationsstudien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
6.4.1 Kriteriumsgültigkeit von verfahrensbasierten Eignungsbeurteilungen. . . . . . . . . . . . . . . . . . . . 200
6.5 Rahmenbedingungen für treffsicher Prognosen: Grund- und Auswahlquote. . . . . . . . . . 210
6.6 Monetäre Nutzenschätzung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
6.7 Evaluation/Ableitung von Verbesserungsmaßnahmen im Einzelfall . . . . . . . . . . . . . . . . . . 217
6.8 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220

Serviceteil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
Anhang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
Martin Kersting
A1 Zur Information über und Dokumentation von Instrumenten zur Erfassung
menschlichen Erlebens und Verhaltens – Die DIN SCREEN Checkliste 1,
Version 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
A1.1 Informationen als Grundlage der Verfahrensauswahl und des Verfahrenseinsatzes. . . . . . . . 224
A1.2 Handhabung der Checkliste „DIN SCREEN“. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
A1.3 Qualitätsprüfung, -sicherung und -optimierung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231
A1.4 DIN SCREEN, Version 3, Checkliste 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
A1.5 Fazit. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
Stichwortverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
1 1

Einführung in die DIN 33430


Martin Kersting und Ingo Püttner

1.1 Qualitätssicherung und -optimierung in der


Eignungsdiagnostik – 2
1.1.1 Wozu eine Norm für die Eignungsdiagnostik? – 3
1.1.2 Entwicklung, Bedeutung und Nutzen von Normen – 3
1.1.3 Die aktuelle DIN 33430 – 5
1.1.4 Folgeinitiativen – 13
1.1.5 Qualitätsstandards – 15
1.1.6 Qualitätssichernde und qualitätsoptimierende Maßnahmen – 18
1.1.7 Fazit – 20

1.2 Rechtliche Rahmenbedingungen der


Eignungsdiagnostik - I – 20
1.2.1 Rechtliche Rahmenbedingungen – 21

Literatur – 24

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_1
2 Kapitel 1 · Einführung in die DIN 33430

1 Überblick
Im ersten Kapitel des vorliegenden Buches erläutern wir einige
Grundlagen der Eignungsdiagnostik nach DIN 33430. Zunächst
(7 Abschn. 1.1) stellen wir DIN-Normen im Allgemeinen
und die DIN 33430 im Besonderen vor. Wir gehen auf Fragen
ein wie: Kann man die Eignungsdiagnostik „normieren“?
Welche Vorteile bietet eine Norm? Die DIN 33430 ist, wie
wir erläutern werden, ein Qualitätsstandard. Wir ordnen die
DIN 33430 in den Kontext anderer eignungsdiagnostischer
Qualitätsstandards ein und nennen Maßnahmen zur Qualitäts-
sicherung. Im 7 Abschn. 1.2 erläutern wir die grundlegenden
rechtlichen Rahmenbedingungen, die auch solche Personen
beachten müssen, die lediglich an einem Verfahren mitwirken,
z.B. als Beobachter/-innen. Hier geht es vor allem um den
gesetzlich verankerten Schutz der Persönlichkeit, der dem
Informationsinteresse der Arbeitgeberin/des Arbeitsgebers
Grenzen setzt.

1.1 Qualitätssicherung und -optimierung in der


Eignungsdiagnostik

Martin Kersting

Das DIN A 4 Format für Papier ist ein Begriff, aber wozu gibt es
eine DIN-Norm für die berufsbezogene Eignungsdiagnostik (also
für die interne und externe Personalauswahl) und was genau
wird da „genormt“? In 7 Abschn. 1.1 erklären wir ausgewählte
Grundsätze der Normungsarbeit und den Unterschied
zwischen Produktnormen (z.B. für Schreibpapier-Formate) und
Dienstleistungsnormen (wie der DIN 33430). Schwerpunkt des
7 Abschn. 1.1 ist die Erläuterung der DIN 33430. Thematisiert
werden Anwendungsbereich, Inhalt und Nutzen der Norm. Wir
gehen kurz auf die Historie dieser Norm ein und erläutern dann
die Architektur der DIN 33430 mit ihren drei Säulen Prozess,
Verfahren und Personen.
Bezüglich der Qualifizierung von Personen werden in der DIN
33430 unterschiedliche Aufgaben oder „Rollen“ im Prozess der
Eignungsdiagnostik unterschieden. Jeder Person wird nur so
viel an Qualifikation abverlangt, wie für die Ausübung ihrer
Aufgaben im eignungsdiagnostischen Prozess notwendig ist.
Personen können eine „Lizenz für berufsbezogene Eignungs-
beurteilungen nach DIN 33430“ erwerben – was es damit sowie
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
3 1

mit entsprechenden Fortbildungen auf sich hat, ist ebenso


Gegenstand des Kapitels wie das Thema Organisationszerti-
fizierung. Wir erklären, was ein Qualitätsstandard ist und welche
Qualitätsstandards für den Bereich Eignungsdiagnostik neben
der DIN 33430 existieren – und wie sich diese zur DIN 33430
verhalten. Hinweise auf qualitätssichernde Maßnahmen runden
das Kapitel ab.

1.1.1 Wozu eine Norm für die Eignungsdiagnostik?

Gut geeignetes Personal ist der Schlüssel zum Erfolg für Organisatio- Die Qualität der
nen. Gleichzeitig ist die Passung der Kenntnisse, Fertigkeiten, Fähig- Eignungsdiagnostik ist von
keiten, Interessen und Motive zu den Anforderungen der Ausbildung zentraler Bedeutung sowohl für
oder des Berufs der Schlüssel für Gesundheit und Zufriedenheit. die Organisation als auch für den
Deshalb ist die Qualität der Eignungsdiagnostik von zentraler Bedeu- arbeitenden Menschen
tung für die Arbeitswelt. Entsprechend werden seit vielen Jahrzehn-
ten national und international Erfahrungen systematisch a­ usgewertet,
um besonders bewährte Vorgehensweisen der Eignungsdiagnostik
zu identifizieren. Eine Möglichkeit, diese Erkenntnisse nutzbar zu
machen, besteht in der Formulierung von Normen. Die Norm für den
Bereich Eignungsdiagnostik ist die DIN 33430. Mit Eignungsdiagnos-
tik ist ein zielgerichtetes Vorgehen zur Feststellung der Eignung von
Kandidatinnen und Kandidaten gemeint. In der Praxis spricht man
häufig vom Prozess der „Personalauswahl“. Der Begriff „Personal-
auswahl“ ist gängig, aber nicht umfassend genug, da es auch um die
Beurteilung der Eignung von Mitarbeiterinnen und Mitarbeitern geht.

1.1.2 Entwicklung, Bedeutung und Nutzen von


Normen

DIN-Normen geben den Stand von Wissenschaft und Technik wieder, Die Normentwicklung leistet ein
daher lag es nahe, die Erkenntnisse zur Eignungsdiagnostik in Form Ausschuss, der die „interessierten
einer DIN-Norm zu publizieren. Für den Normungsprozess – nicht Kreise“ repräsentiert
aber für den Inhalt der Norm – ist das Deutsche Institut für Normung
(DIN), ein privater Verein, zuständig. Normung ist keine staatliche
Aufgabe, sondern eine freiwillige Angelegenheit interessierter Kreise.
Die Normen selbst werden nicht vom DIN entwickelt. Das DIN stellt,
falls ein Antrag auf Normung gestellt wird, lediglich einen organisa-
torischen Rahmen für die Normentwicklung zur Verfügung. Darüber
hinaus sorgt das DIN für die Einhaltung der für die Erstellung von
Normen geltenden Grundsätze, denn die Normungsarbeit selbst ist in
Form einer Norm geregelt. Für die Normentwicklung wird ein Aus-
schuss gegründet, der „interessierte Kreise“ (interessiert in Bezug auf
das Normungsvorhaben) repräsentiert. Dadurch soll sichergestellt
4 Kapitel 1 · Einführung in die DIN 33430

werden, dass die Norm der Allgemeinheit dient und nicht etwa ein-
1 seitig die Interessen einer Gruppe (z.B. der „Hersteller/-innen“) in
Form eines Normtextes formuliert werden. Im Fall der DIN 33430
waren u.a. Repräsentantinnen und Repräsentanten des öffentlichen
Dienstes (z.B. Bundesagentur für Arbeit, Bundeswehr), der Wirtschaft
(z.B. Konzerne wie die Deutsche Telekom und die Deutsche Lufthansa)
sowie der Wissenschaft (z.B. RWTH Aachen) im Ausschuss vertreten
(7 Exkurs). Selbstverständlich müssen die Mitglieder des Ausschus-
ses über die für die Realisierung des Vorhabens notwendige Fachkom-
petenz verfügen.
Die Erarbeitung einer Norm ist Wichtig ist darüber hinaus die Transparenz der Normungsarbeit.
ein transparenter und partizipativ Eine Norm wird nicht im „Hinterzimmer“ entwickelt und dann in
gestalteter Prozess einem Überraschungscoup der Öffentlichkeit präsentiert. Im Gegen-
teil wird bereits die Absicht, eine Norm zu entwickeln, bekannt gegeben,
und alle interessierten Kreise werden aufgefordert, ihr etwaiges Inte-
resse, an der Normentwicklung mitzuarbeiten, zu bekunden. Das
offene Verfahren gewährleistet, dass alle Interessensgruppen sich betei-
ligen können. Bevor eine Norm veröffentlicht wird, wird ein Norm-
entwurf publiziert. Dieser Entwurf wird „Gelbdruck“ genannt, da er,
anders als die finale Norm, auf gelbem Papier gedruckt wird. Gegen
den „Gelbdruck“ kann formal „Einspruch“ erhoben werden. Die Ein-
sprüche gegen den „Gelbdruck“ werden vom Ausschuss geprüft. Erst
nach den Beratungen des Ausschusses über die Einsprüche wird eine
ggf. gegenüber dem Gelbdruck modifizierte Fassung als DIN-Norm
veröffentlicht.
DIN-Normen sind rechtlich nicht Durch einen Vertrag zwischen der Bundesrepublik Deutschland
verbindlich und können dennoch und dem DIN wird das DIN als nationale Normungsorganisation sowie
rechtliche Bedeutung erlangen als nationale Vertretung in internationalen Normungsorganisationen
anerkannt. Dieser Vertrag sowie der formale Rahmen, der ein regelge-
leitetes Vorgehen unter besonderer Berücksichtigung von Transparenz
und Partizipation vorsieht, stellen Gründe dafür dar, dass DIN-Normen
eine höhere Bedeutung haben als Qualitätsstandards von Vereinigun-
gen oder Verbänden (wie z.B. dem Arbeitskreis Assessment Center;
7 Abschn. 1.1.5). Obwohl DIN-Normen lediglich Empfehlungscharak-
ter haben und rechtlich nicht verbindlich sind, kann sich beispielsweise
der Nachweis der DIN-Konformität als Beweiserleichterung auswirken.
In Rechtsnormen, Betriebsvereinbarungen und Tarifverträgen kann
auf DIN-Normen Bezug genommen werden. In 7 Abschn. 4.3.5 erläu-
tern wir die rechtliche Bedeutung von DIN-Normen und stellen dar,
wie man die eigentlich nicht verbindlichen DIN-Normen verbindlich
werden lassen kann.
Die DIN 33430 ist keine Produktnorm, sondern eine Dienstleis-
tungsnorm. Dienstleistungsnormen formulieren u.a. Anforderungen
an die Qualität der Dienstleistung und regeln u.a. die für die Erbrin-
gung der Dienstleistung notwendigen Qualifikationen der beteiligten
Personen.
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
5 1
Exkurs

Zur Geschichte der DIN 33430


Der Antrag, der letztendlich zur Im Oktober 2011 wurde die ISO-Norm 44 die gewandelte Situation
DIN 33430 führte, wurde 1995 10667 (Assessment Service Delivery: auf dem Arbeitsmarkt (z.B.
vom Berufsverband Deutscher Procedures and methods to assess Personalmangel, Globalisierung)
Psychologen (BdP) eingebracht. Der people in work and organizational 44 veränderte Rahmenbe-
Normungsausschuss, der die DIN settings; 7 Abschn. 1.1.5) dingungen (z.B. die
33430 erarbeitet hat, tagte erstmalig veröffentlicht. Die Entwicklung dieser Verabschiedung des
am 9. Juni 1997. Zum Obmann internationalen Norm erfolgte unter Allgemeinen Gleichbehand-
des Normungsausschusses wurde Mitarbeit des Ausschusses, der die lungsgesetzes im Jahr 2006;
Prof. Dr. L. F. Hornke gewählt. Im DIN 33430 entwickelt hat. Die DIN 7 Abschn. 4.3.5 „Bedeutung bei
Oktober 2000 wurde der Gelbdruck 33430 ist unabhängig von der ISO Diskriminierungsklagen“)
zur DIN 33430 veröffentlicht, die 10667 weiterhin in Kraft. 44 erweiterte diagnostische
Publikation der „ersten“ Fassung der Im September 2010 hat der Möglichkeiten (z.B. internet-
DIN 33430 erfolgte im Juni 2002. verantwortliche Ausschuss mit den gestützte Verfahrensdarbietung;
Nach anfänglicher Kritik hat sich Arbeiten zur Modifikation der DIN 7 Abschn. 4.2.6)
die DIN 33430 etabliert. Auch wenn 33430 begonnen. Gründe für die
ihr Bekanntheitsgrad zu wünschen Überarbeitung waren u.a. Im Oktober 2014 wurde der
übrig lässt, ist der Ausdruck „DIN 44 neue Erkenntnisse (z.B. Entwurf zur „neuen“ DIN 33430
33430“ für diejenigen, die die Norm Metastudien; 7 Abschn. 6.4.1) der Öffentlichkeit zur Prüfung und
kennen, zum Synonym für Qualität in 44 andere Qualitätsstandards wie Stellungnahme vorgelegt. Im Juli
der Eignungsdiagnostik geworden. die ISO 10667 (7 Abschn. 1.1.5) 2016 wurde die „neue“ DIN 33430
Mittlerweile wurde die DIN 33430 44 Ideen zur Verbesserung der DIN mit dem Titel „Anforderungen an
in zahlreichen Ausschreibungen als 33430, die aus Praxiserfahrungen berufsbezogene Eignungsdiagnostik“
Qualitätsforderung genutzt. abgeleitet wurden verabschiedet.

1.1.3 Die aktuelle DIN 33430

DIN 33430: Nutzen und Anwendungsbereiche


Im Folgenden geben wir wieder, welchen Nutzen die DIN (2016) (im
Folgenden meinen wir mit der Abkürzung DIN immer die DIN 33430
aus Juli 2016) nach Ansicht ihrer Autorinnen und Autoren stiftet und
auf welche Bereiche die Norm anzuwenden ist.

> Nutzen der DIN 33430


Die DIN 33430 formuliert „Anforderungen an berufsbezogene
Eignungsdiagnostik“. Sie dient
a. „Anbietern von Dienstleistungen (organisationsinterne
und -externe Auftragnehmer im Sinne dieser Norm)
als Leitfaden für die Planung und Durchführung von
Eignungsbeurteilungsprozessen;
b. Auftraggebern in Organisationen als Maßstab zur
Ausschreibung von Dienstleistungen sowie der Bewertung
externer Angebote im Rahmen berufsbezogener
Eignungsbeurteilungsprozesse;
c. Personalverantwortlichen bei der Qualitätssicherung und
-optimierung von Personalentscheidungen;
6 Kapitel 1 · Einführung in die DIN 33430

d. dem Schutz der Kandidaten vor unsachgemäßer


1 oder missbräuchlicher Anwendung von Verfahren zu
Eignungsbeurteilungen.

Damit trägt die Norm bei


44 zur Verbreitung von wissenschaftlich und fachlich fundierten
Informationen über Verfahren zur Eignungsbeurteilung;
44 zur fachgerechten Entwicklung und zum sachgerechten
Einsatz von Verfahren zur Eignungsbeurteilung;
44 zur kontinuierlichen Verbesserung der Verfahren zur
Eignungsbeurteilung.

Durch die Anwendung der Norm können Fehlentscheidungen


sowie daraus erwachsende negative ökonomische, soziale und
individuelle Folgen für die Organisation und alle Betroffenen
vermieden werden.“
(DIN, 2016, S. 5)

> Anwendungsbereiche der DIN 33430


Als Anwendungsbereiche der Norm benennen die Autorinnen
und Autoren der DIN (2016, S. 6):
„Diese Dienstleistungsnorm enthält Festlegungen und
Leitsätze für Verfahren und deren Einsatz bei berufsbezogenen
Eignungsbeurteilungsprozessen. Sie bezieht sich auf:
a. die Planung von berufsbezogenen Eignungsbeurteilungspro-
zessen;
b. die Auswahl, Zusammenstellung, Durchführung und
Auswertung von Verfahren;
c. die Interpretation der Verfahrensergebnisse und die
Urteilsbildung;
d. die Anforderungen an die Qualifikation der an Eignungsbe-
urteilungsprozessen beteiligten Personen.“
Mit einer Anmerkung wird im Text der DIN (2016) darauf
hingewiesen, dass sich durch die Festlegungen und Leitsätze
„auch Hinweise für die sach- und fachgerechte Entwicklung von
in Eignungsbeurteilungsprozessen einzusetzenden Verfahren“
ergeben (DIN, 2016, S. 6).

Inhalt und Aufbau der DIN


Qualität in der Eignungsdiagnostik Qualität in der Eignungsdiagnostik im Sinne der DIN ruht auf drei Säulen:
im Sinne der DIN ruht auf drei Prozess, Verfahren und Personen. Diese drei Säulen sind in . Abb. 1.1 wie-
Säulen: Prozess, Verfahren und dergegeben. Die Ziffern in der Abbildung beziehen sich auf die Bezeich-
Personen nung der Kapitel im Text der DIN (2016) (nicht auf die Kapitelnum-
mern des vorliegenden Buches). Wir skizzieren im Folgenden diese drei
Säulen, der vorliegende Text kann und soll die Lektüre der DIN (2016)
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
7 1

Prozess Verfahren Personen


Planung (3) Anforderungen an die Qualifikation
Anforderung an Verfahren (5)
Hinweise für die Ausschreibung eignungsdiagnostischer Prozesse

Auftragsklärung (3.1 ) der beteiligten Personen (9)


und Verfahren unter Beachtung der DIN 33430 (C, informativ)

fünf Kategorien von Verfahren (5.1)


Anforderungsanalyse (3.2)
Dokumentation (7)

allgemeine Anforderungen (5.2) Allgemeine Anforderungen (9.1)


Planung (3.3) verfahrensspezifische Anforderungen (5.3)
mediumsspezifische Anforderungen (5.4)
Auswahl und Zusammen-
stellung von Verfahren (4) Datenschutz (5.5) Anforderungen an
Eignungsdiagnostiker(innen) (9.2)
Verfahrensschutz (5.6)
Durchführung, Auswertung,
Interpretation, Urteilsbild (6)
/

allgemeiner Verweis (6.1) Anforderungen an Beobachter(innen),


Durchführung (6.2) die an direkten mündlichen Befragungen
beteiligt sind (9.3.1)
Auswertung (6.3) Dokumentenanalyse Anforderungen an
Datenschutz (5.5)

Handhabungs-
Interpretation / Urteilsbild (6.4) direkter mündlicher
Befragungen hinweise (Anhang A)
Kommunikation / Ergebnis (6.5) Anforderungen an Beobachter(innen),
Verhaltensbeobach- die an Verhaltensbeobachtungen und
tung u. -beurteilung Anforderungen an
- beurteilungen beteiligt sind (9.3.2)
Fragebogen Verfahrens-
Evaluation / Verbesserungs- Tests
hinweise (Anhang B)
maßnahmen (8)

. Abb. 1.1  Die Architektur der DIN (2016) (in Klammern: Kapitel des DIN-Textes)

aber nicht ersetzen. Kenntnisse über die DIN (2016) zählen explizit zu
den Qualifikationsanforderungen (7 Abschn. 1.1.4 „Personenlizenzierung
für berufsbezogene Eignungsbeurteilungen“), die in der Norm an Eig-
nungsdiagnostiker/-innen gestellt werden (DIN 2016, S. 24). Das heißt,
Eignungsdiagnostiker/-innen müssen den Originaltext der DIN (2016)
sorgfältig lesen. In den folgenden Abschnitten stellen wir außerdem dar,
in welchen Kapiteln und Abschnitten des vorliegenden Buches die jewei-
ligen Forderungen der DIN erläutert werden.

Prozess
Zu Beginn des eignungsdiagnostischen Prozesses müssen Auftragge- Die DIN 33430 hilft von der
ber/-innen und Dienstleister/-innen nach DIN (2016) miteinander Auftragsklärung bis zur Evaluation
den Auftrag und die Auftragsbedingungen abstimmen (Auftragsklä- bei der Prozessgestaltung
rung). Nach Abschluss des Auftrags sollen sie eine kritische Würdi-
gung des Vorgehens vornehmen. Sie sollen u.a. prüfen, ob die vorher
festgelegten Ziele erreicht wurden und aus den Erfahrungen Verbesse-
rungsmaßnahmen ableiten. In einem gesonderten Abschnitt der DIN
(2016, S. 21) geht es um das Thema „Evaluation“. Auftraggeber-/in und
Dienstleister/-in sollen prüfen, ob die vorab festgelegten Qualitätsziele
erreicht wurden. Dabei geht es nicht nur um die „klassischen“ Analysen
zu Zuverlässigkeit (Reliabilität) und Gültigkeit (Validität) der getroffe-
nen Eignungsbeurteilungen (die Erläuterungen dieser Gütekriterien
finden sich in 7 Kap. 5). Im Text der DIN finden sich explizit auch Eva-
luationskriterien wie die Kosten-Nutzen-Relation (im 7 Abschn. 1.1.6
werden die in der DIN genannten Evaluationskriterien aufgelistet). Das
Thema Evaluation im Allgemeinen sowie die Gültigkeit von Eignungs-
aussagen und die Kosten-Nutzen-Relation eignungsdiagnostischer Ver-
fahren sind Gegenstand des 7 Kap. 6.
8 Kapitel 1 · Einführung in die DIN 33430

Die Entscheidung Ausgangspunkt der Eignungsbeurteilung ist die Anforderungs-


1 für ein Verfahren der analyse, die in 7 Abschn. 4.1 behandelt wird. Sobald das Anforde-
Eignungsbeurteilung setzt rungsprofil (zum Anforderungsprofil 7 Abschn. 2.1) steht, beginnt
einen Überblick über die nach DIN (2016) die Planung des Eignungsbeurteilungsprozesses.
möglichen Verfahren und deren Die Planung ist eine Aufgabe der Eignungsdiagnostiker/-innen,
Qualitätsmerkmale voraus nicht der Beobachter/-innen (zu den unterschiedlichen „Rollen“
im Prozess 7 Abschn. 1.1.3). Im Rahmen dieser Planung ist zu ent-
scheiden, welche Verfahren der Eignungsbeurteilung zur Erfassung
der im Anforderungsprofil genannten Eignungsmerkmale infrage
kommen und in welcher Reihenfolge diese Verfahren angewen-
det werden sollen. Diese Entscheidung kann nur treffen, wer über
einen Überblick über eignungsdiagnostische Verfahren sowie über
die Ergebnisse empirischer Studien zur Aussagekraft der aus diesen
Verfahren abgeleiteten Eignungsbeurteilungen verfügt. Diesen
Überblick vermitteln wir mit dem vorliegenden Buch. Die Verfah-
ren werden im Allgemeinen (7 Abschn. 4.2) sowie im Besonderen
(z.B. Verfahren der Verhaltensbeobachtung und -beurteilung in
7 Abschn. 2.2; mündliche Befragungen/Interviews in 7 Kap. 3) vor-
gestellt. Wichtige Erkenntnisse zur Gültigkeit der aus den Verfahren
abgeleiteten Eignungsaussagen werden in 7 Kap. 6 referiert. Die Erläu-
terung des Begriffs „Anforderungsprofil“ erfolgt in 7 Abschn. 2.1, die
des Begriffs „Eignungsmerkmal“ in 7 Abschn. 4.1.
Den spezifischen Bedürfnissen Die Planung der Eignungsbeurteilung umfasst nach DIN (2016)
von Kandidatinnen und Vorabfestlegungen zu fast allen Prozessschritten: Wie sollen Kandi-
Kandidaten mit Einschränkungen datinnen und Kandidaten angesprochen werden? Welche Auswahl-
sollte – sofern vertretbar – in stufen gibt es? Wie werden die Ergebnisse des Verfahrens festgehalten
angemessener Form entsprochen und kommuniziert? Bezüglich der Durchführung der Eignungsdia-
werden gnostik werden im Text der DIN (2016) Objektivität und Transpa-
renz betont. Neu gegenüber der ersten Fassung der DIN sind in der
aktuellen Fassung (DIN, 2016) die Ausführungen zu Kandidatin-
nen und Kandidaten, die besonderer Hilfen bedürfen, z.B. behin-
derte Menschen wie Personen mit eingeschränktem Hörvermögen
(7 Exkurs).
In der DIN wird auch das In Bezug auf die Regeln zur Durchführung wird im Text der DIN (2016)
Thema „computer- und auch auf die Fragen der Authentifizierung und Überwachung eingegan-
internetgestütztes Testen“ gen, die im Kontext der computer- und internetgestützten Testung eine
behandelt Rolle spielen – dieses Thema wurde in der ersten Fassung der DIN nicht
behandelt. Wir informieren in 7 Abschn. 4.2.5 über das Thema und die
entsprechenden Forderungen der DIN (2016).
Ein DIN-konformer Prozess der Die Autorinnen und Autoren der DIN (2016, S. 20 f.) stellen hohe
Eignungsbeurteilung zeichnet Anforderungen an die Dokumentation der Eignungsbeurteilung. Im
sich u.a. durch eine umfassende 7 Exkurs „Dokumentationsanforderungen nach DIN“ sind Aspekte darge-
Dokumentation aus stellt, die nach DIN (2016, S. 20 f.) zu dokumentieren sind. Außerdem
wird die Notwendigkeit der Einhaltung gesetzlicher Regeln (wie z.B.
Datenschutz) betont. Die Erläuterungen der einschlägigen gesetzlichen
Regelungen nehmen wir in den 7 Abschn. 1.2 und 7 Abschn. 4.3 vor.
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
9 1
Exkurs

Zum Spannungsverhältnis zwischen standardisierter und individualisierter Vorgehensweise


Die Anwendung der Verfahren „Kandidaten mit Einschränkungen irrelevant für das mit dem Verfahren
zur Eignungsbeurteilung darf, so müssen nach ihren spezifischen erfasste Eignungsmerkmal sind“ (DIN
steht es in der DIN (2016, S. 18 f.), Bedürfnissen in Bezug auf die 2016, S. 19).
„nicht zu einer Benachteiligung Eignungsuntersuchung befragt Dies wird im Text der DIN (2016, ebd.)
oder Bevorzugung einzelner werden. Sofern es möglich und anhand des folgenden prägnanten
Kandidaten oder Gruppen führen. fachlich vertretbar ist, sollte den Beispiels illustriert:
Insbesondere ist darauf zu achten, Bedürfnissen in angemessener „Wenn es um die Beherrschung
dass keine Kenntnisse, Fertigkeiten Form entsprochen werden, indem der Grundrechenarten geht,
oder Fähigkeiten das Ergebnis z.B. das ursprüngliche Verfahren kann eine Einschränkung in der
beeinflussen, die nicht zum zu ohne Ergebnisverfälschung der Sehkraft berücksichtigt werden,
erfassenden Eignungsmerkmal individuellen Einschränkung indem die Aufgabenstellung
gehören und zugleich bei der angepasst wird oder alternative und anders (taktil, auditiv) vorgegeben
Zielgruppe des Verfahrens für den spezifischen Kandidaten wird. Eine schriftliche Vorgabe
unterschiedlich ausgeprägt sein besser geeignete Verfahren von Rechenaufgaben würde dazu
können (z.B. Sprachkenntnisse, verwendet werden. In solchen führen, dass der Kandidat mit einer
sofern diese nicht mit dem Verfahren Sonderfällen kann es fachlich Sehbehinderung geringe Leistungen
erfasst werden sollen)“. angemessen sein, unterschiedliche erbringen würde, gleichwohl er
In diesem Kontext gehen die Kandidatinnen/Kandidaten mit die Grundrechenarten beherrscht.
Autorinnen und Autoren der DIN verschiedenen Verfahren zu testen. Geht es hingegen um die Eignung
insbesondere auf Kandidatinnen Dabei sollten die Einschränkungen eines Fahrzeugführers, kann dem
und Kandidaten ein, die Berücksichtigung finden, die zum Bedürfnis nach einem Verzicht auf
besonderer Hilfen bedürfen (z.B. einen negative Auswirkungen auf Verfahren, die Anforderungen an die
bei eingeschränktem Seh- oder die Ausführung der im jeweiligen Sehkraft stellen, nicht entsprochen
Hörvermögen, motorischen Verfahren geforderten Aktivitäten werden, weil die Sehfähigkeit
Beeinträchtigungen bzw. bzw. auf die Verfahrensergebnisse relevant für die Eignung ist“ (DIN
anderweitigen Einschränkungen): haben und die zum anderen 2016, S. 19).

Exkurs

Dokumentationsanforderungen nach DIN (2016, S. 20 f.)


Dokumentiert werden muss Handhabungs- und Verfahrens- einzelnen Bewerters für jede
44 „der zwischen Auftraggeber hinweisen) dokumentiert sind; Kompetenz und jedes Potenzial
und Dienstleister 44 sofern Befragungen (z.B. festzuhalten;
abgestimmte Auftrag zur Interviews) und/oder 44 Abweichungen von den
Eignungsbeurteilung; Verhaltensbeobachtungen Verfahrens- oder Handhabungs-
44 das Vorgehen bei der durchgeführt werden: Die hinweisen jeglicher Art
Anforderungsanalyse; Antworten auf eignungs- (z.B. durch Störungen oder
44 die wesentlichen Ergebnisse der diagnostisch relevante Verfälschungen bzw. durch
Anforderungsanalyse; Interviewfragen und/oder intendierte Veränderungen
44 die Verfahren und deren eignungsdiagnostisch relevante aufgrund der Bedürfnisse von
Abfolge/Ablaufplan; Beobachtungen; Kandidaten, die spezifische
44 die Zuordnung der Verfahren zu 44 sofern mehrere Personen Hilfen benötigen);
den Eignungsmerkmalen (z.B. an einer Befragung (z.B. 44 die Regeln zur Integration
eine Dimensions-Übungs-Matrix Interview) und/oder an einer aller über einen Kandidaten
im Assessment-Center); Verhaltensbeobachtung erhobenen Informationen zu
44 die Instruktionen für die teilnehmen und gleichzeitig einem Eignungsurteil;
Kandidaten, soweit diese nicht eine Beurteilung abgeben, so 44 das Ergebnis der
an anderer Stelle (z.B. in den sind die Beurteilungen jedes Eignungsbeurteilung“.
10 Kapitel 1 · Einführung in die DIN 33430

Verfahren
1 Die zweite Säule der Qualität stellen die Verfahren dar, z.B. die Qualität
des im Rahmen der Eignungsbeurteilung eingesetzten Interviews oder
Fragebogens. In der DIN (2016) werden fünf Kategorien von Verfahren
unterschieden. In 7 Abschn. 4.2 geben wir einen Überblick über alle fünf
Verfahrenskategorien. Im Folgenden weisen wir auf die Abschnitte im
Buch hin, in denen einzelne Verfahren ausführlicher dargestellt werden:
55 Dokumentenanalyse (z.B. die Analyse und Interpretation von
Bewerbungsunterlagen, 7 Abschn. 4.2.2)
55 Verfahren zur Verhaltensbeobachtung und -beurteilung (z.B.
Rollenspiele, 7 Kap. 2)
55 Direkte mündliche Befragungen (z.B. Interview, 7 Kap. 3)
55 Messtheoretisch fundierte Fragebogen (z.B. Persönlichkeitsfrage-
bogen, 7 Abschn. 4.2.2)
55 Messtheoretisch fundierte Tests (z.B. Intelligenztests,
7 Abschn. 4.2.2)

In den 7 Kap. 5 und 7 Kap. 6 wird das Hintergrundwissen vermittelt,


das für eine Qualitätsbewertung der genannten Verfahren notwendig
ist. Ein System zur Beurteilung von messtheoretisch fundierten Frage-
bogen und Tests wird in 7 Abschn. 4.2.3 vorgestellt.
Die in der DIN formulierten Mit der Differenzierung der Verfahren in die fünf Kategorien
Anforderungen an Verfahren sind gewinnt die aktuelle DIN gegenüber der Vorgängerversion an Hand-
zum Teil verfahrensspezifisch habbarkeit. In der 2012er Version der DIN wurde lediglich pauschal von
„Verfahren“ gesprochen. Die Anforderungen an Verfahren waren ent-
sprechend Anforderungen, die gleichermaßen für alle Verfahren gelten
sollten. Demgegenüber werden in der „neuen“ DIN (2016) die Anfor-
derungen spezifisch für die Verfahrensgruppen formuliert.
Für jedes Verfahren müssen laut Für jedes Verfahren müssen laut DIN (2016) Handhabungshinweise
DIN (2016) Handhabungshinweise vorliegen. Für messtheoretisch fundierte Fragebogen und Tests müssen
vorliegen zusätzlich zu den Handhabungshinweisen auch Verfahrenshinweise
vorliegen. Die Anforderungen an Handhabungs-/Verfahrenshinweise
werden in der DIN in den Anhängen A und B formuliert. Die Bedeu-
tung dieser Anforderungen wird in 7 Abschn. 4.2.2 und 7 Abschn. 4.2.2
erläutert. Die Checkliste im 7 Anhang gibt den Inhalt der beiden
Anhänge A und B vollständig wieder. Die Verfahrenshinweise müssen
diejenigen Informationen enthalten, die notwendig sind, um die Qua-
lität des Verfahrens zu beurteilen.
Die DIN ist keine Produktnorm, Trotz der umfassenden Ausführungen zu Verfahren ist die DIN
sondern eine Prozessnorm keine Produktnorm. Dazu schreiben die Autorinnen und Autoren der
DIN (2016, S. 6): „Die Angemessenheit eines Verfahrens für eine kon-
krete Eignungsbeurteilung kann nur im Rahmen seiner spezifischen
Anwendung beurteilt werden. Daher ist dieses Dokument keine Pro-
duktnorm zur isolierten Bewertung der Qualität eines Verfahrens.“
Nach DIN 33430 dürfen nur Verfahren eingesetzt werden, die einen
eindeutigen Bezug zu den infrage stehenden Eignungsmerkmalen auf-
weisen. Daher kann es kein Verfahren geben, das ungeachtet dieses
Anforderungsbezugs „DIN-konform“ ist. Man kann aber umgekehrt
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
11 1
formulieren, dass ein Verfahren die DIN-Konformität eines konkreten
Eignungsbeurteilungsprozesses gefährdet, weil es nicht den in der DIN
(2016) formulierten Anforderungen an Verfahren gerecht wird. Diesen
Aspekt vertiefen wir im 7 Abschn. 4.2.2.

Personen
„Qualität beginnt beim Menschen, nicht bei den Dingen. Wer hier einen Qualität beginnt beim Menschen
Wandel herbeiführen will, muss zuallererst auf die innere Einstellung
aller Mitarbeiter zielen.“ Dieses Zitat wird dem Unternehmensbera-
ter Phillip B. Crosby zugeschrieben. In der Architektur der DIN 33430
stellt der Mensch, respektive seine Qualifikation, eine zentrale Säule der
Qualität dar. Dabei werden unterschiedliche Aufgaben oder Rollen im
Prozess der Eignungsdiagnostik unterschieden. Jeder Person wird nur
so viel an Qualifikation abverlangt, wie für die Ausübung ihrer Aufga-
ben im eignungsdiagnostischen Prozess notwendig ist.
Konkret werden drei Qualifikationsprofile unterschieden:
55 Eignungsdiagnostiker/-innen und verantwortliche
Eignungsdiagnostiker/-innen
55 Beobachter/-innen, die an Verhaltensbeobachtungen und
-beurteilungen beteiligt sind
55 Beobachter/-innen, die an direkten mündlichen Befragungen
beteiligt sind

Umfassende Anforderungen werden an (1) Eignungsdiagnostiker/-in- In der DIN werden drei


nen gestellt, die den gesamten eignungsdiagnostischen Prozess gestal- Qualifikationsprofile
ten und verantworten. Abgespeckte Anforderungen müssen Beobach- unterschieden
ter/-innen erfüllen, die (2) an Verfahren der Verhaltensbeobachtung
und -beurteilung oder (3) an direkten mündlichen Befragungen betei-
ligt sind. Für jedes der drei Profile werden in der DIN (2016, S. 21–26)
„Qualifikationselemente“ aufgelistet. Mit „Qualifikationselement“ ist
der Themenbereich gemeint, zu dem seitens der Beobachter/-innen
und Eignungsdiagnostiker/-innen Kenntnisse vorliegen müssen. Eig-
nungsdiagnostiker/-innen und Beobachter/-innen müssen nach DIN
(2016, S. 24 und 26) beispielsweise Kenntnisse über „Selbstdarstellungs-
strategien“ besitzen. Diese Kenntnisse über Selbstdarstellungsstrategien
stellen also ein „Qualifikationselement“ dar. In den Kapiteln des vorlie-
genden Buches werden alle Qualifikationselemente (Themen), die laut
DIN relevant sind, erläutert. Die Selbstdarstellung der Kandidatinnen
und Kandidaten bzw. die Verfälschbarkeit der Verfahren werden bei-
spielsweise in 7 Kap. 2, 7 Kap. 3 und in 7 Abschn. 4.2.4 ausführlich erläu-
tert. Die Themen des vorliegenden Buch sind entsprechend den Quali-
fikationsforderungen der DIN auf die sechs Kapitel aufgeteilt. Personen
verfügen dann über die notwendige Qualifikation, wenn sie die Themen
der 7 Kap. 1 und 2 (Beobachter/-innen, die an Verhaltensbeobachtun-
gen und -beurteilungen beteiligt sind), der 7 Kap. 1, 2 und 3 (Beob-
achter/-innen, die an direkten mündlichen Befragungen beteiligt sind)
bzw. der 7 Kap. 1, 2, 3, 4, 5 und 6 (Eignungsdiagnostiker/-innen und
verantwortliche Eignungsdiagnostiker/-innen) beherrschen und den
12 Kapitel 1 · Einführung in die DIN 33430

Text der DIN gelesen und verstanden haben. Neben den Kenntnissen
1 verlangt die DIN außerdem, dass Eignungsdiagnostiker/-innen über
„angeleitete Praxiserfahrungen“ verfügen. Für Beobachter/-innen wird
formuliert, dass sie „soweit möglich“ über „angeleitete Praxiserfahrun-
gen“ verfügen. Der Begriff „angeleitete Praxiserfahrungen“ wird in der
DIN nicht näher spezifiziert.
Die in der DIN (2016) genannten Qualifikationsanforderungen
gelten nicht für Personen, die im Rahmen der Eignungsbeurteilung
ausschließlich die Aufgabe haben, Fachwissen und fachliche Fertig-
keiten zu beurteilen. Die Qualifikationen weiterer Assistenzkräfte
(z.B. für die Eingangssichtung der Bewerbungen, Durchführung von
hochstandardisierten Gruppentestungen) sind nicht Gegenstand der
Norm.

Hinweise für Ausschreibungen


Hinweise für die Ausschreibung Ein Nutzen der DIN (2016) besteht darin, dass Organisationen, die
eignungsdiagnostischer Prozesse eignungsdiagnostische Prozesse und Verfahren an Externe verge-
und Verfahren ben wollen und daher Leistungen ausschreiben, auf die DIN (2016)
verweisen können. Wenn der später erfolgende Vertrag ebenfalls die
DIN als Vertragsbestandteil vorsieht, wird die DIN (2016) verbindlich
(7 Abschn. 4.3.5 „Verbindlichkeit durch vertragliche Regelung“). Die
Auftraggeberin/der Auftraggeber hat damit Qualitätsstandards for-
muliert, die Externe im Falle des Zuschlages erfüllen müssen. Der
Verweis auf die Norm entlastet die Vergabestelle, die Qualitätssiche-
rung betreibt, da sie die Qualitätsanforderungen nicht selbst formulie-
ren muss. Die Verwendung der DIN (2016) im Vergabeverfahren setzt
aber voraus, dass in der Ausschreibung bestimmte Informationen ent-
halten sind. Im Anhang C der DIN (2016) werden nützliche „Hinweise
für die Ausschreibung eignungsdiagnostischer Prozesse und Verfahren
unter Beachtung der DIN 33430“ formuliert.

Genormt und individuell zugleich


Das Wort „Normierung“ ist nicht unbedingt positiv besetzt. Wie kann
eine Norm hilfreich dabei sein, einen organisationsspezifischen Prozess
der Eignungsbeurteilung zu gestalten, der der Individualität der Kan-
didatinnen und Kandidaten gerecht wird? Bedeutet „Normierung“
nicht immer Gleichmacherei, ohne Berücksichtigung der spezifischen
Wesensmerkmale? Sollen kleine mittelständische Unternehmen jetzt
genauso vorgehen wie DAX-Konzerne? Werden Organisationen mit
einem Übermaß an Reglementierungen überzogen, ohne Rücksicht
auf den tatsächlichen Bedarf im Einzelfall? Entsprechende Ängste sind
im Kontext der DIN 33430 unbegründet. Wie bereits erwähnt handelt
es sich nicht um eine Produktnorm, sondern um eine Dienstleistungs-
norm. Die Norm zielt nicht auf eine Vereinheitlichung (Gleichmache-
rei) der Eignungsdiagnostik. Ziel der Norm ist es vielmehr, die Dienst-
leistungen im Bereich der Eignungsdiagnostik transparenter werden zu
lassen und Auftraggeberinnen und Auftraggebern einen einheitlichen
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
13 1
Qualitätsstandard für die Bewertung von Dienstleistungsangeboten
zur Verfügung zu stellen.
Eine Vorgehensweise nach DIN 33430 ist zugleich spezifisch und Eine Vorgehensweise nach DIN
standardisiert. Einerseits beruhen die Aussagen der DIN 33430 auf dem 33430 ist zugleich spezifisch und
jeweilig aktuellen Stand der Wissenschaft und repräsentieren damit standardisiert
externe Evidenz. Andererseits bedeutet ein Vorgehen nach DIN 33430
geradezu zwangsweise eine in Bezug auf die Organisationen „indivi-
dualisierte“ Vorgehensweise, indem zu Beginn des Prozesses die spezi-
fische Anforderungsanalyse steht. Die Ergebnisse der Anforderungs-
analyse sind – ungeachtet einiger wiederkehrender Erkenntnisse (siehe
„generische Eignungsmerkmale“; 7 Abschn. 4.2.7) – von Fall zu Fall
unterschiedlich. Da sich die Gestaltung der Eignungsbeurteilung an
den Ergebnissen der Anforderungsanalyse orientiert, entsteht eine
große Vielfalt an DIN-33430-konformen Vorgehensweisen. Die DIN
33430 setzt Leitplanken, um die Qualität zu sichern, aber sie schränkt
die Vielfalt im Vorgehen nicht unnötig ein. Anders als bei bürokrati-
schen Vorschriften, die den Einzelfall unberücksichtigt lassen, geht die
DIN 33430 vom Einzelfall (der Organisation) aus, indem sie das für
den Einzelfall ermittelte Anforderungsprofil zum Ausgangspunkt des
gesamten Prozesses erhebt. Bei der DIN 33430 handelt es sich um eine
Norm, die von dem Startpunkt der Anforderungsanalyse her dynamisch
gedacht werden muss.
Beim Studium des Normtextes muss zwischen Soll- und Muss-­ Zwischen Soll- und Muss-
Formulierungen unterschieden werden. Nur die zuletzt genannten For- Formulierungen der DIN
mulierungen haben normativen Charakter, bei den Soll-Formulierun- unterscheiden
gen handelt es sich um Empfehlungen. Die Autorinnen und Autoren
der DIN 33430 haben darauf geachtet, so wenige Muss-Formulierungen
wie möglich, aber so viele wie nötig zu nutzen.

1.1.4 Folgeinitiativen

Die Publikation der ersten Fassung der DIN 33430 hat zahlreiche Folge-
initiativen nach sich gezogen. Wir gehen hier auf die Personenlizenzie-
rung und die Fortbildung für berufsbezogene Eignungsbeurteilungen
nach DIN 33430 sowie auf die Organisationszertifizierung ein.

Personenlizenzierung für berufsbezogene


Eignungsbeurteilungen
Nach DIN 33430 müssen Eignungsdiagnostiker/-innen sowie Beob- Fortbildungs- und
achter/-innen u.a. über definierte Kenntnisse verfügen. In einer Fol- Prüfungsordnung zur
geinitiative zur DIN 33430 hat die Föderation Deutscher Psycholo- Personenlizenzierung
genvereinigungen erstmalig im Jahr 2004 eine „Fortbildungs- und für berufsbezogene
Prüfungsordnung zur Personenlizenzierung für berufsbezogene Eig- Eignungsbeurteilungen nach
nungsbeurteilungen nach DIN 33430“ erlassen. Die aktuelle, anlässlich DIN 33430
der Publikation der neuen DIN (2016) revidierte Form der Ordnung
ist unter http://www.din33430portal.de/din33430/din33430 zum freien
14 Kapitel 1 · Einführung in die DIN 33430

Download eingestellt. Das Diagnostik- und Testkuratorium hat das


1 vorliegende Buch „Personalauswahl kompetent gestalten: Grundlagen
und Praxis der Eignungsdiagnostik nach DIN 33430“ herausgegeben, in
dem die für die Eignungsbeurteilung nach DIN 33430 benötigten Wis-
sensgrundlagen von verschiedenen Autorinnen und Autoren erläutert
werden. Sowohl die Fortbildungen als auch die Lizenzprüfungen orien-
tieren sich an diesem Buch. Um das Buch zur ersten Fassung der DIN
33430 (Westhoff, Hagemeister, Kersting, Lang, Moosbrugger, Reimann
& Stemmler, 2010) hat sich insbesondere Prof. Dr. K. Westhoff verdient
gemacht. Das Buch erlebte in kurzer Zeit drei Auflagen. Das vorliegende
Buch stellt die Grundlage für die Fortbildungen und Prüfungen nach
der „neuen“ DIN (2016) dar.
Es können drei Lizenzen erworben werden:
55 Lizenz BV für Beobachter/-innen, die an Verhaltensbeobach-
tungen und -beurteilungen beteiligt sind (Gegenstand der
Prüfung: 7 Kap. 1 und 7 Kap. 2)
55 Lizenz BE für Beobachter/-innen, die an direkten mündlichen
Befragungen beteiligt sind (Gegenstand der Prüfung: 7 Kap. 1,
7 Kap. 2 und 7 Kap. 3)
55 Lizenz E für Eignungsdiagnostiker/-innen (Gegenstand der
Prüfung: 7 Kap. 1 bis 7 Kap. 6 sowie der Text der DIN 33430)

Lizenzen Bei allen genannten Gruppen sind die Inhalte der als „Exkurs“ gekenn-
zeichneten Informationen ausgenommen. Häufig finden sich in den
Kapiteln Verweise auf andere Abschnitte und Kapitel im Buch. Die
Stellen aus einem anderen Kapitel, auf die verwiesen wird, zählen
nicht zum prüfungsrelevanten Inhalt des Kapitels. Wenn beispiels-
weise in 7 Kap. 2 auf Kap. 3 verwiesen wird, bezieht sich die Prüfung zu
7 Kap. 2 dennoch ausschließlich auf die Inhalte von 7 Kap. 2.
Keine Zulassungsbeschränkungen Alle Erwachsenen können zu den kostenpflichtigen Lizenzprüfun-
für die Prüfung für gen BV und BE zugelassen werden. Die Zulassung zur kostenpflichtigen
Beobachter/-innen Lizenzprüfung E erfordert zusätzlich zum Mindestalter Praxiserfahrun-
gen in Entwicklung, Planung, Gestaltung und kontrollierter Durchfüh-
rung von Verfahren zur Eignungsbeurteilung sowie deren Evaluation.
Der Nachweis erfolgt über eine Selbsterklärung.
Open-Book-Klausur ohne Die Prüfungsaufgaben setzt der sogenannte Lizenzprüfungsaus-
Auswendiglernen schuss fest. Die Lizenzprüfung auf der Grundlage des vorliegenden
Buches ist eine schriftliche Prüfung unter Aufsicht. Sie wird insofern
in Form einer „Open-Book-Klausur“ durchgeführt, als dass der Text der
DIN 33430 sowie das vorliegende Buch als Hilfsmittel zugelassen sind.

Fortbildung für berufsbezogene


Eignungsbeurteilungen
Sowohl die Fortbildung als auch Die bereits erwähnte Ordnung der Föderation Deutscher Psycholo-
die Prüfung basieren auf dem genvereinigungen umfasst auch Regelungen zur Fortbildungen, die es
vorliegenden Buch den Teilnehmerinnen und Teilnehmern ermöglichen, die nach DIN
(2016) geforderten Kenntnisse und Fertigkeiten für berufsbezogene
Eignungsbeurteilungen zu erwerben. Die Fortbildungen orientieren
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
15 1
sich an dem hier vorliegenden Buch. Entsprechend der Kapitelgliede-
rung des vorliegenden Buches sind sechs Module vorgesehen, wobei das
erste Modul mit Informationsvermittlung ohne Übungsanteile einen
zeitlichen Umfang von einem Tag hat. Die übrigen fünf Module mit
deutlichen Übungsanteilen haben je einen Umfang von zwei Tagen.
55 Modul 1: Einführung in die DIN 33430 (1 Tag)
55 Modul 2: Anforderungsprofil, Verhaltensbeobachtung und
Verhaltensbeurteilung (2 Tage)
55 Modul 3: Eignungsinterviews/direkte mündlichen Befragungen
(2 Tage)
55 Modul 4: Anforderungsanalyse, Verfahren der Eignungsbe-
urteilung sowie rechtliche Rahmenbedingungen (2 Tage)
55 Modul 5: Statistisch-methodische Grundlagen der Eignungs-
beurteilung (2 Tage)
55 Modul 6: Evaluation der Eignungsbeurteilung (2 Tage)

Die Fortbildung für Beobachter/-innen, die an Verhaltensbeobach- Fortbildung und Prüfung sind
tungen und -beurteilungen beteiligt sind (BV), besteht der Ordnung formal unabhängig voneinander
zufolge aus den Modulen 1 und 2. Für Beobachter/-innen, die darüber
hinaus auch an direkten mündlichen Befragungen beteiligt sind (BE),
besteht die Fortbildung aus den Modulen 1, 2 und 3. Die Fortbildung
für Eignungsdiagnostiker-/innen (E) besteht aus den Modulen 1 bis 6.
Die Fortbildungen werden von verschiedenen Organisationen angebo-
ten. Die Teilnahme an der Prüfung ohne den Besuch einer Fortbildung
ist ebenso möglich wie der Besuch der Fortbildung ohne die Prüfung.

Organisationszertifizierungen
Mit einer Personenlizenz können Personen ihre Kenntnisse nachwei- Zertifizierung für Organisationen
sen. Wie aber kann eine Organisation nachweisen, dass ihre eignungs-
diagnostischen Prozesse DIN-33430-konform sind? Zunächst ist es
jeder Organisation unbenommen, eine diesbezügliche Selbsterklä-
rung abzugeben oder eine Vertragspartnerin/einen Vertragspartner,
z.B. eine Kundin/einen Kunden, zu bitten, eine solche Erklärung abzuge-
ben. Organisationen können sich aber auch durch unabhängige Stellen
wie beispielsweise DEKRA, DIN/CERTCO oder TÜV bestätigen lassen,
dass ihre Prozesse normenkonform sind. Für eine solche „Zertifizie-
rung“ wird u.a. ein Audit vor Ort durchgeführt und das Qualitätsma-
nagementhandbuch geprüft. Über eine vom TÜV durchgeführte Pro-
zesszertifizierung nach DIN 33430 eines Personalauswahlverfahrens
für Führungskräfte der Commerzbank AG berichten Dries, Krumm
und Lux (2006).

1.1.5 Qualitätsstandards

Die DIN 33430 ist ein Qualitätsstandard. Qualitätsstandards formu- Qualitätsstandards formulieren
lieren Regeln und Prinzipien für einen Anwendungsbereich, im Fall Regeln und Prinzipien für einen
der DIN (2016) für die Eignungsdiagnostik. Qualitätsstandards richten Anwendungsbereich
16 Kapitel 1 · Einführung in die DIN 33430

Exkurs
1 Eignungsdiagnostische Qualitätsstandards außerhalb der DIN 33430 (Beispiele) und potenzielle Anwen-
dungsbereiche
Die folgenden Qualitätsstandards (im 44 ISO (ISO 10667 (1 und 2); 44 TBS-TK (Testbeurteilungssystem
weitesten Sinne) können im Einzelfall Assessment service delivery; ISO, des Diagnostik- und
zusätzlich zur DIN 33430 von 2011a, 2011b) Testkuratoriums; Testkuratorium,
Interesse sein (wir führen zunächst 44 ITC-CB (International Guidelines 2010; 7 www.zpid.de/
eine Abkürzung auf, dann nennen on Computer-Based and Testkuratorium)
wir den Standard und die Quelle Internet-Delivered Testing; ITC, 44 TF-AC (Guidelines and Ethical
sowie ggf. noch eine URL): 2006; 7 www.intestcom.org) Considerations for Assessment
44 AKAC-AC (Standards der 44 ITC-ST (International Guidelines on Center Operation (Task Force);
Assessment Center Technik the Security of Tests, Examinations, International Task Force
des Arbeitskreis Assessment and Other Assessments; ITC 2014; on Assessment Center, 2015)
Center; AKAC 2016a; 7 www. 7 www.intestcom.org) 44 TF-TU (Test User Qualifications
arbeitskreis-ac.de) 44 ITC-TA (International Guidelines (Task Force), Turner, DeMers, Fox
44 AKAC-I (Interview Standards; for Translating and Adapting & Reed, 2001)
AKAC 2008; 7 www. Tests; ITC, 2005; 7 www. 44 TOP (Standards für Eignungs-
arbeitskreis-ac.de) intestcom.org) und Potenzialdiagnostik im
44 APA (Standards for Educational 44 ITC-TU (International Guidelines Top-Management; AKAC 2016b;
and Psychological Testing; AERA, for Test Use; ITC 2000; 7 www. 7 www.arbeitskreis-ac.de)
2014) intestcom.org)
In . Tab. 1.1 ordnen wir die
44 EFPA (Testbeurteilungssystem 44 SIOP (Principles for the
genannten Standards (mit ihren
der European Federation of validation and use of personnel
Kurzbezeichnungen) ausgewählten
Psychologists Associations; selection procedures; SIOP, 2003;
Anwendungsbereichen zu.
Lindley & Bartram, 2012) 7 www.siop.org/_principles/
principles.pdf )

Prozesse auf ein (Qualitäts-)Ziel aus. Der Erfolg bei der Zielerreichung
wird durch den Qualitätsstandard messbar. Mangelhafte Qualität in
der Eignungsdiagnostik ist häufig auf mangelhaftes Feedback über die
Qualität zurückzuführen. Gütekriterien wie Validität/Gültigkeit und
Reliabilität/Zuverlässigkeit (7 Abschn. 5.4) lassen sich in der Praxis z.B.
aufgrund zu geringer Fallzahlen und/oder zu kurzer Verweildauer des
Personals häufig nicht direkt bestimmen. Als eine Art „Ersatzhandlung“
richtet man die Qualitätskontrolle dann vielleicht an schnell verfügba-
ren, aber bestenfalls sekundären Kriterien aus und prüft, ob das Ver-
fahren der Eignungsbeurteilung „gut angekommen“ ist und die Vakanz
„schnell“ besetzt wurde. Aus Qualitätsstandards lassen sich konkrete
Qualitätsforderungen für den Einzelfall ableiten, so dass die Erfüllung
oder Nichterfüllung im Sinne eines unmittelbaren Feedbacks bestimmt
werden kann und – viel wichtiger – Maßnahmen zur Qualitätsopti-
mierung ergriffen werden können. Qualitätsstandards sind somit Leis-
tungsstandards, die ein gerichtetes Verhalten motivieren.
Andere Qualitätsstandards sind Neben der DIN (2016) gibt es weitere Qualitätsstandards, die für die
von Bedeutung, wenn sie Bereiche Eignungsbeurteilung relevant sind und zum Teil bei der Entwicklung
behandeln, die in der DIN 33430 der DIN (2016) berücksichtigt wurden. (Für einen Überblick über diag-
nicht oder für den aktuellen nostische Standards siehe Kersting, 2008, 2014). Ist es nun ausreichend,
Anwendungsfall nicht ausführlich die DIN (2016) zu kennen und zu beachten oder bedarf es der Berück-
genug behandelt werden sichtigung weiterer eignungsdiagnostischer Standards? Die Antwort auf
diese Frage hängt von dem jeweiligen Anwendungsbereich ab. Sofern
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
17 1

. Tab. 1.1  Qualitätsstandards (zusätzlich zur DIN)*

Hilfreich beim Thema … Qualitätsstandards (zu-


sätzlich zur DIN)**

Anforderungsanalyse SIOP
Hauptgütekriterien eignungsdiagnostischer Verfahren APA
SIOP
Fairness APA
Internationalisierung der Eignungsdiagnostik APA
ISO
ITC-TA
ITC-TU
Mündliche Befragungen/Interviews AKAC-I
Verfahren der Verhaltensbeobachtung und -beurteilung (Assessment Center) TF-AC
AKAC-AC
Messtheoretisch fundierte Tests und Fragebogen - Qualitätsbewertung EFPA
TBS-TK
Computer- und internetgestütztes Testen ITC-CB
ITC-ST
Schutz und Sicherheit (z.B. Schutz vor Täuschungshandlungen, Diebstahl von Materialien usw.) ITC-ST
Zielgruppe Top-Management (Eignungsdiagnostik im Top-Management) TOP
Qualifizierung von Testanwender/-innen TF-TU

* Der Inhalt der Tabelle ist nicht prüfungsrelevant.


** Abkürzungen: siehe Exkurs

man in einem Bereich arbeitet, der von der DIN (2016) nicht oder nicht
ausführlich genug behandelt wird, empfiehlt es sich, weitere Standards hin-
zuziehen. Ein Beispiel ist die Adaption von Verfahren in andere Sprach-/
Kulturräume. Diese Problematik wird in der DIN (2016) kaum themati-
siert, so dass es sinnvoll ist, andere Qualitätsstandards zu Rate zu ziehen
(in diesem Falle die International Guidelines for Translating and Adap-
ting Tests, ITC, 2005). Weitere Standards können außerdem zur Vertie-
fung herangezogen werden. So werden die Gütekriterien von Verfahren
(7 Kap. 5) beispielsweise in den Standards for Educational and Psycholo-
gical Testing (AERA, 2014) ausführlicher behandelt als in der DIN (2016).
Dabei darf man allerdings nicht erwarten, dass bezüglich der Vor- In den Grundüberzeugungen
stellungen über Qualität in der Eignungsdiagnostik Hegemonie herge- stimmen die Autorinnen
stellt sei. Es gibt eine Vielfalt der Ansätze, die den Reichtum der Theorie und Autoren der meisten
und Praxis der Eignungsdiagnostik mit ausmacht. In den Grundüber- Qualitätsstandards überein, im
zeugungen stimmen die Autorinnen und Autoren der meisten Standards Detail gibt es konträre Positionen
überein, im Detail gibt es konträre Positionen. Daher ist bei der Lektüre
anderer Standards zu prüfen, ob die dort getroffenen Aussagen mit den
in der DIN aufgestellten Regeln kompatibel sind. Selbstverständlich
18 Kapitel 1 · Einführung in die DIN 33430

kann man sich auch gegen die Regeln der DIN entscheiden, darf dann
1 aber in diesem Bereich kein DIN-konformes Vorgehen mehr für sich
in Anspruch nehmen. Grundsätzlich ist zu beachten, dass Standards,
die außerhalb Deutschlands formuliert wurden, die spezifischen deut-
schen rechtlichen Rahmenbedingungen (7 Abschn. 1.2; 7 Abschn. 4.3)
nicht berücksichtigen.
Im folgenden 7 Exkurs nennen wir einige Standards, die in Bezug
auf spezifische Anwendungsbereiche zusätzlich zur DIN (2016) hilf-
reich sein können. Wir beschränken uns dabei aus Platzgründen auf
die Nennung des Anwendungsbereiches und des jeweiligen Standards
und verweisen für nähere Informationen auf die jeweils angegebenen
Quellen.

1.1.6 Qualitätssichernde und qualitätsoptimierende


Maßnahmen

Qualität überwachen und Maßnahmen, die der Überwachung der Qualität dienen, auf man-
Ursachen mangelnder Qualität gelnde Qualität aufmerksam machen und Ursachen mangelnder Qua-
beseitigen lität beseitigen, werden im Kontext von Qualitätsmanagementansätzen
als „qualitätssichernde“ Maßnahmen bezeichnet. Mehr Präzision hätte
die Bezeichnung „qualitätssichernde und qualitätsoptimierende Maß-
nahmen“, da mit dieser Bezeichnung das Ideal der kontinuierlichen
Verbesserung zum Ausdruck gebracht wird.
Die Qualität kann nur gesichert und optimiert werden, wenn zu
Beginn des Prozesses definiert wurde, was Qualität bedeutet. Dies ist
die sogenannte Qualitätsforderung. Sie sollte so formuliert sein, dass
die Erfüllung der Forderung geprüft werden kann. Auch Toleranzspiel-
räume sollten definiert sein. Es gibt einige Qualitätsforderungen, die
sich direkt aus der DIN 33430 ergeben, z.B. dass …
55 die Ergebnisse einer Anforderungsanalyse vorliegen müssen
(7 Abschn. 2.1),
55 die Eignungsmerkmale durch verhaltensnahe Beschreibungen
konkretisiert werden müssen (7 Abschn. 2.2),
55 nur Verfahren verwendet werden dürfen, die einen eindeutigen
Anforderungsbezug aufweisen (7 Abschn. 4.1),
55 zu jedem Verfahren Handhabungshinweise vorliegen müssen
(7 Abschn. 4.2).

Einige Qualitätsforderungen und vieles mehr (letztendlich alle Muss-Formulierungen der DIN
ergeben sich direkt aus der DIN (2016)). Die zentrale Maßnahme zur Sicherung und Optimierung der
33430 oder aus Rechtsnormen Qualität der berufsbezogenen Eignungsdiagnostik besteht darin, sämt-
liche Qualitätsforderungen der DIN (2016) zu erfüllen. Auch aus den
rechtlichen Rahmenbedingungen ergeben sich Qualitätsforderungen,
die in jedem Fall einzuhalten sind (z.B. die Diskriminierungsfreiheit,
7 Abschn. 4.3.5 „Bedeutung bei Diskriminierungsklagen“). Geprüft
werden kann die Erfüllung der Qualitätsforderungen z.B. mithilfe von
1.1 · Qualitätssicherung und -optimierung in der Eignungsdiagnostik
19 1
Checklisten. Die Checkliste im 7 Anhang erlaubt es z.B. zu prüfen, ob
die Qualitätsforderungen, die in der DIN in den Anhängen A und B
formuliert werden, erfüllt sind.
Darüber hinaus gibt es Qualitätsforderungen, die sich auf den Ein- Die Erfüllung der im Rahmen der
zelfall beziehen, z.B. das Service Level (z.B. Vereinbarungen zum Leis- Auftragsklärung festgelegten
tungsumfang, zur Schnelligkeit der Bearbeitung, zu den Kosten pro Qualitätsforderungen prüfen
Leistung usw.). Dies Qualitätsforderungen sind nach DIN 33430 im
Rahmen der Auftragsklärung (DIN, 2016, S. 9) zu formulieren. Wie
bereits weiter oben (7 Abschn. 1.1.3 „Inhalt und Aufbau der DIN,
Prozess“) dargestellt, sollen Auftraggeber/-innen und Dienstleister/-
innen laut DIN (2016, S. 21) nach Abschluss des Auftrags eine kriti-
sche Würdigung des Vorgehens vornehmen. Sie sollen u.a. prüfen, ob
die vorher festgelegten Qualitätsforderungen (in der DIN 33430 wird
der Begriff „Qualitätsmerkmale“ genutzt) erfüllt wurden, und sie sollen
aus den Erfahrungen Verbesserungsmaßnahmen ableiten. Qualitäts-
forderungen sind nach DIN (2016, ebd.) beispielsweise
55 „Grad der Erreichung der vorher festgelegten Ziele;
55 Bewertung der erreichten Kosten-/Nutzenrelation;
55 Grad der Nutzung der Ergebnisse der Eignungsbeurteilungen für
Auswahl- und Entwicklungsentscheidungen;
55 Akzeptanz des Vorgehens und der Verfahren seitens der
Kandidaten;
55 Akzeptanz des Vorgehens und der Ergebnisse in der Auftrag
gebenden Institution;
55 Verständlichkeit der Eignungsaussage und/oder Ergebnisbe-
richte“ (DIN 2016, S. 21 f.)

Neben den DIN 33430-spezifischen sowie den einzelfallspezifischen Qua- Allgemeine Maßnahmen
litätsmaßnahmen gibt es allgemeine qualitätssichernde und -optimie- zur Qualitätssicherung und
rende Maßnahmen: -optimierung
55 Konkrete Definition der Qualität einschließlich messbarer Kriterien
55 Nachweisliche Kommunikation der Qualitätsdefinition
gegenüber allen Personen, die für die Qualität verantwortlich sind
55 systematische Qualifizierung der beteiligten Personen
55 strukturierte Abläufe, mit klarer Regelung der Zuständigkeiten
und Verantwortungen
55 Dokumentation nach innen und außen
55 Lenkung der Dokumente und Daten (z.B. Kennzeichnung, wer
welches Dokument wann erstellt hat)
55 systematische Datenerfassung
55 hochwertiger Datenschutz und Datensicherung
55 systematische Datenanalyse
55 Kontrolle der Wirtschaftlichkeit
55 regelmäßige Evaluation/kontinuierliche Überprüfung der
Qualität
55 regelmäßiger Vergleich der eigenen Vorgehensweisen mit
Vorgehensweisen anderer Organisationen (Benchmarking)
20 Kapitel 1 · Einführung in die DIN 33430

1.1.7 Fazit
1
Die Autorinnen und Autoren der DIN formulieren vor dem Hinter-
grund des aktuellen Stands der Wissenschaft und Technik Anforderun-
gen an berufsbezogene Eignungsbeurteilungen. Die Erfüllung dieser
Forderungen, die sich auf Prozesse, Verfahren und Personen beziehen,
ist eine Voraussetzung für Qualität. Im Einzelfall können zusätzliche,
spezifische Qualitätsforderungen formuliert werden. Auch kann es
notwendig werden, weitere Qualitätsstandards heranzuziehen. Qua-
lität setzt Organisationsstrukturen voraus (Strukturqualität), die eine
kontrollierte Gestaltung der Abläufe und Verfahren ermöglichen (Pro-
zessqualität). Der gesamte Ablauf der Eignungsbeurteilung von der
Auftragsannahme über die Planung der Untersuchung bis zur Durch-
führung und Evaluation ist zu dokumentieren. Die mit den Vorge-
hensweisen erzielten Resultate müssen beständig überprüft werden
(Ergebnisqualität).

? Kontrollfragen zu 7 Abschn. 1.1


1. Die Entwicklung einer Norm folgt gewissen Regeln – nennen
Sie mindestens zwei.
2. Welchen Nutzen nehmen die Autorinnen und Autoren für die
DIN 33430 in Anspruch?
3. Die DIN 33430 ist eine Norm. Sind also DIN 33430-konforme
Prozesse der Eignungsdiagnostik alle gleich?
4. Was bedeuten im Kontext der DIN die Begriffe
„Personenlizenz“ und „Organisationszertifizierung“?
5. Außer der DIN 33430 gibt es zahlreiche weitere Qualitäts-
standards für Eignungsdiagnostik. In welchen Fällen lohnt es
sich, auch diese Qualitätsstandards zu kennen?

1.2 Rechtliche Rahmenbedingungen der


Eignungsdiagnostik - I

Ingo Püttner und Martin Kersting

Überblick
Eignungsbeurteilungen müssen rechtlich einwandfrei erfolgen.
Um dies sicherzustellen, wird in der DIN gefordert, dass die an
der Eignungsbeurteilung beteiligten Personen die rechtlichen
Rahmenbedingungen der Eignungsdiagnostik kennen. Welche
Kenntnisse notwendig sind, variiert in Abhängigkeit von der „Rolle“,
die jemand im Prozess der Eignungsbeurteilung einnimmt. Wer als
Beobachter/-in an Verhaltensbeobachtungen und -beurteilungen
beteiligt ist, muss vor allem wissen, dass dem Handeln rechtliche
Schranken gesetzt sind. Im vorliegenden 7 Abschn. 1.2 stellen wir
1.2 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - I
21 1

die in diesem Kontext relevanten Themen vor und vertiefen den


Aspekt Persönlichkeitsschutz. Wer als Beobachter/-in an direkten
mündlichen Befragungen beteiligt ist, muss zusätzlich darüber
informiert sein, welche Fragen (z.B. Interviewfragen an eine
Kandidatin/einen Kandidaten) zulässig sind. Die entsprechenden
Informationen finden sich im 7 Abschn. 3.2. Eignungsdiagnosti-
ker/-innen, die für die Gestaltung von Prozessen und Verfahren
der Eignungsbeurteilung zuständig sind, müssen darüber
hinaus noch über Kenntnisse zu relevanten rechtlichen Themen
sowie Rechtsvorschriften verfügen. In der DIN (2016, S. 24)
werden beispielhaft das Bundesdatenschutzgesetz (BDSG), das
Allgemeine Gleichbehandlungsgesetz (AGG) und das Betriebs-
verfassungsgesetz (BetrVG) genannt. Dabei wird allerdings explizit
betont, dass sich die Kenntnis dieser Gesetze auf die einschlägigen
Ausschnitte begrenzt und es nur um Grundkenntnisse geht. Die
entsprechenden Hinweise finden sich in 7 Abschn. 4.3.

1.2.1 Rechtliche Rahmenbedingungen

Verschiedene rechtliche Gesichtspunkte setzen der Eignungsdiagnos- Rechtliche Gesichtspunkte setzen


tik Grenzen und regeln den Umgang mit den Kandidatinnen und Kan- der Eignungsdiagnostik Grenzen
didaten sowie mit den im Rahmen der Eignungsbeurteilung anfallen-
den Daten. Für Beobachter/-innen, die an Verhaltensbeobachtungen
und -beurteilungen beteiligt sind, sind hier im Einzelnen zu nennen:
1. Persönlichkeitsschutz
2. Mitbestimmung
3. Datenschutz

Wir erläutern im vorliegenden Abschnitt nur den Persönlichkeitsschutz.


Ausführungen zur Mitbestimmung und zum Datenschutz finden sich
in 7 Abschn. 4.3.

Persönlichkeitsschutz
Der verfassungsrechtlich verankerte Schutz der Persönlichkeit setzt dem Mittelbare Drittwirkung der
Informationsinteresse der Arbeitgeberin/des Arbeitsgebers Grenzen Grundrechte
(7 Abschn. 3.2.1). Aus den grundrechtlichen Formulierungen „Die
Würde des Menschen ist unantastbar“ (Art. 1 GG) und „Jeder hat
das Recht auf die freie Entfaltung seiner Persönlichkeit“ (Art. 2 Abs.
1 GG) ergibt sich der hohe Wert des Persönlichkeitsrechts. Unmit-
telbar wirken die Grundrechte zwar nur gegenüber dem staatlichen
Handeln, aber über offene Tatbestände und Generalklauseln mittel-
bar auch im Arbeitsrecht (sog. „mittelbare Drittwirkung der Grund-
rechte“). So ist beispielsweise das arbeitsrechtliche Weisungsrecht „nach
billigem Ermessen“ (§ 315, Bürgerliches Gesetzbuch, BGB und § 106
22 Kapitel 1 · Einführung in die DIN 33430

Gewerbeordnung, GewO) auszuüben. Mangels näherer gesetzlicher


1 Bestimmung, was unter „billig“ im Sinne einer gerechten Ausübung des
Weisungsrechts zu verstehen ist, fließen an dieser Stelle die Wertungen
des Grundgesetzes ein. Dasselbe Prinzip gilt für die in § 75 Betriebs-
verfassungsgesetz (BetrVG) geforderte Behandlung der Betriebsange-
hörigen „nach Recht und Billigkeit“.
Verfahren mit Anforderungsbezug Bei der Wahl der eignungsdiagnostischen Vorgehensweisen und
sind zulässig Verfahren fordert der Persönlichkeitsschutz die Wahrung der Intim-
sphäre der Kandidatinnen und Kandidaten und schützt sie vor einer
unbefugten Ausforschung ihrer inneren Strukturen und Eigenschaften.
Nur an anforderungsbezogenen Informationen hat eine Arbeitgeberin/
ein Arbeitgeber ein berechtigtes Interesse. Diese Forderung haben die
Autorinnen/Autoren der DIN (2016, S. 11) aufgegriffen: „Es dürfen nur
Verfahren verwendet werden, die einen eindeutigen Anforderungsbe-
zug aufweisen und zur Beantwortung der Fragestellung sowie für die
Zielgruppe der Kandidaten geeignet sind.“ Verfahren zur Eignungsbe-
urteilung, die auf die Anforderungen bestimmter Arbeitsplätze oder
Berufsbilder zugeschnitten werden, sind rechtlich zulässig, und zwar
unabhängig davon, ob es sich um eine Dokumentenanalyse, um direkte
mündliche Befragungen (z.B. Interview), um Verfahren zur Verhaltens-
beobachtung und Verhaltensbeurteilung (z.B. Rollenspiele), um mess-
theoretisch fundierte Fragebogen oder um messtheoretisch fundierte
Tests handelt (7 Abschn. 4.2 für einen Überblick über die Verfahren).
Unzulässig sind Verfahren, Hingegen hält das rechtswissenschaftliche Schrifttum Verfahren zur
die über die beruflichen Ermittlung des Intelligenzquotienten oder des allgemeinen Intelligenz-
Anforderungen hinausgehen niveaus (rein quantifizierende Intelligenztests) für unzulässig, nämlich
über die beruflichen Anforderungen hinausgehend (Fitting, Betriebs-
verfassungsgesetz (2014) § 94 Rn. 26; Erfurter Kommentar zum Arbeits-
recht (2016)/Preis § 611 BGB Rn. 309) – ungeachtet ihres hohen Pro-
gnosewerts für den beruflichen Erfolg (zur Intelligenz 7 Abschn. 4.1.1,
zur Prognosekraft von intelligenzbasierten Interpretationen 7 Kap. 6).
Rechtlich problematisch ist also keinesfalls der Einsatz eines Intelli-
genztests (also eines messtheoretisch fundierten Tests), sondern die
Interpretation des Gesamtwertes (IQ) ohne Berücksichtigung des
Anforderungsbezugs der in diesen Gesamtwert eingehenden Einzel-
dimensionen der Intelligenz (z.B. die Fähigkeit zum sprachlichen oder
rechnerischen Denken). Die rechtliche Perspektive, nicht die Intel-
ligenz im Allgemeinen, sondern die spezifischen, anforderungsrele-
vanten Intelligenzdimensionen im Besonderen zu betrachten, findet
ihre Entsprechung in Studien zur Prognosekraft von Testinterpreta-
tionen, die auf der Ebene einzelner Intelligenzdimensionen ansetzen
(z.B. Goertz, Hülsheger und Maier, 2014; Lang, Kersting und Lang,
2010 sowie Salgado, Anderson, Moscoso, Bertua & De Fruyt, 2003).
Großzügige Rechtsprechung Die bislang ergangene Rechtsprechung setzt die Grenzen eher groß-
zügig: Das Bundesverwaltungsgericht hat z.B. die messtheoretisch
fundierten Fragebogen 16-Persönlichkeits-Faktoren-Fragebogen (16
PF) sowie den im Bereich der klinischen Psychologie sowie Psychia-
trie genutzten Minnesota-Test (MMPI) ungeachtet ihres mangelnden
1.2 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - I
23 1
beruflichen Bezugs als Erkenntnisquellen inzident gebilligt (Bundes-
verwaltungsgericht 12.11.1997, Neue Juristische Wochenschrift 1998,
22, 1656-1658).
Bei jedem Verfahren zur Eignungsbeurteilung ist die Einwilligung
der Kandidatin/des Kandidaten erforderlich. Entsprechend wird in der
DIN (2016, S. 18) formuliert: „Es muss die Einwilligung der Kandidaten
in die Eignungsuntersuchung vor dem Hintergrund dieser Informatio-
nen sowie die Zustimmung zur Weitergabe der Verfahrensergebnisse
eingeholt werden.“ Mit der Formulierung „vor dem Hintergrund dieser
Informationen“ sind vorangehende Informationen über die wesentli-
chen Aspekte des Ablaufs der Eignungsbeurteilung gemeint. Außerdem
müssen die Kandidatinnen und Kandidaten vorab über mitwirkende
Personen und deren Funktionen sowie über die Verwendung der Ver-
fahrensergebnisse aufgeklärt werden. Die Einwilligung kann gegenüber
der Arbeitgeberin/dem Arbeitgeber, aber auch gegenüber dem Dienst-
leister/der Dienstleisterin sowie der Eignungsdiagnostikerin/dem Eig-
nungsdiagnostiker erklärt werden, der/die für die/den Auftraggeber/-in
die Eignungsbeurteilung durchführt.

Praxistipp

Eine wirksame Einwilligung könnte lauten:


Zum Inhalt, zur Methodik und zur Auswertung des XX-Diagnostik-
verfahrens bin ich durch das Merkblatt „Das XX-Verfahren – Infos
für Kandidatinnen/Kandidaten“ informiert worden. Ich nehme am
Verfahren teil und willige in die Durchführung ein.
Musterstadt, den ----------------------
-----------------------------
(Unterschrift)

Fazit  Dem aufgrund der Berufsfreiheit berechtigten Interesse der Abwägung zwischen
Arbeitgeberin/des Arbeitgebers, etwas über die Eignung der Kandida- verschiedenen Rechtsgütern
tinnen und Kandidaten zu erfahren, steht das allgemeine Persönlich-
keitsrecht der Kandidatinnen und Kandidaten gegenüber, das sie vor
einer unbefugten Ausforschung schützt. Ein eignungsdiagnostisches
Vorgehen gilt dann als sachgerecht, wenn es sich auf die Anforderungen
der infrage stehenden Ausbildung oder des infrage stehenden Berufs
bezieht. In jedem Fall ist eine Einwilligung der Kandidatinnen und Kan-
didaten erforderlich. Dieser Einwilligung muss eine Information über
die geplante Eignungsbeurteilung vorangehen.

? Kontrollfragen zu 7 Abschn. 1.2


1. Warum dürfen Arbeitgeber/-innen nicht alle Informationen
über Kandidatinnen und Kandidaten einholen, die für sie von
Interesse sind?
2. Welche rechtlichen Themen sind für Beobachter/-innen,
die im Rahmen der Eignungsbeurteilung an
24 Kapitel 1 · Einführung in die DIN 33430

Verhaltensbeobachtungen und -beurteilungen beteiligt sind,


1 von besonderem Interesse?
3. Was muss beachtet werden, wenn man angesichts der
geplanten Eignungsbeurteilung Kandidatinnen/Kandidaten
um eine Einwilligung bittet?

Literatur

Literatur zu 7 Abschn. 1.1


American Educational Research Association, Psychological Association, & National
Council on Measurement in Education (2014). Standards for Educational and Psy-
chological Testing. Washington, DC: American Educational Research Association.
Arbeitskreis Assessment Center (2008). Interview-Standards. Hamburg: Autor.
Arbeitskreis Assessment Center (2016a). Standards der Assessment Center Technik.
Hamburg: Autor.
Arbeitskreis Assessment Center (2016b). Standards für Eignungs- und Potenzialdiag-
nostik im Top-Management. Hamburg: Autor.
DIN (2002). DIN 33430: Anforderungen an Verfahren und deren Einsatz bei berufsbezo-
genen Eignungsbeurteilungen. Berlin: Beuth.
DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Dries, C., Krumm, S., & Lux, V. (2006). Prozesszertifizierung der Führungskräfte-aus-
wahl nach DIN 33430 in einer deutschen Großbank. In K. Westhoff (Hrsg.), Nut-
zen der DIN 33430 - Praxisbeispiele und Checklisten (S. 140–147). Lengerich: Pabst.
International Task Force on Assessment Center Guidelines (2015). Guidelines and
ethical considerations for assessment center operations. Journal of Manage-
ment, 41, 1244–1273.
ISO (2011a). ISO 10667-1. Assessment service delivery - Procedures and methods to
assess people in work and organizational settings - Part 1: Requirements for the
client. Genf: ISO.
ISO (2011b). ISO 10667-2. Assessment service delivery - Procedures and methods to
assess people in work and organizational settings - Part 2: Requirements for service
providers. Genf: ISO.
ITC (2000). International guidelines for test use. USA: Author.
ITC (2005). International Guidelines for Translating and Adapting Tests. USA: Author.
ITC (2006). International guidelines on computer-based and internet-delivered tes-
ting. International Journal of Testing, 6, 143–171.
ITC (2014). International Guidelines on the Security of Tests, Examinations, and Other
Assessments. USA: Author.
Kersting, M. (2014). Qualitätsstandards der Personalauswahl. In H. Schuler & U. P.
Kanning (Hrsg.), Lehrbuch der Personalpsychologie (3. Aufl., S. 325–356). Göttin-
gen: Hogrefe.
Lindley, P. A., & Bartram, D. (2012). Use of the EFPA Test Review Model by the UK and
Issues Relating to the Internationalization of Test Standards. International Jour-
nal of Testing, 12, 108–121.
SIOP, Society for Industrial and Organizational Psychology, Inc. (2003). Principles for
the validation and use of personnel selection procedures (4th ed.). Bowling Green,
OH: Author.
Testkuratorium der Föderation Deutscher Psychologenvereinigungen (2010). TBS-
TK. Testbeurteilungssystem des Testkuratoriums der Föderation Deutscher
Psychologenvereinigungen. Revidierte Fassung vom 09. September 2009. Psy-
chologische Rundschau, 61, 52–56.
Literatur
25 1
Turner, S. M., DeMers, S. T., Fox, H. R., & Reed, G. M. (2001). APA’s guidelines for test
user qualifications. An executive summary. American Psychologist, 56, 1099–
1113.
Westhoff, K., Hagemeister, C., Kersting, M., Lang, F., Moosbrugger, H., Reimann, G.,
& Stemmler, G. (Hrsg.). (2010). Grundwissen für die berufsbezogene Eignungsbe-
urteilung nach DIN 33430 (3. Aufl.). Lengerich: Pabst.

Literatur zu 7 Abschn. 1.2


Goertz, W., Hülsheger, U. R., & Maier, G. W. (2014). The validity of specific cognitive
abilities for the prediction of training success in Germany: A meta-analysis.
Journal of Personnel Psychology, 13, 123–133.
Lang, J. W. B, Kersting, M., Hülsheger, U. R., & Lang, J. (2010). General mental ability,
narrower cognitive abilities, and job performance: The perspective of the nes-
ted-factors model of cognitive abilities. Personnel Psychology, 63, 595–640.
Salgado, J. F., Anderson, N., Moscoso, S., Bertua, C., & De Fruyt, F. (2003a). Internatio-
nal validity generalization of GMA and cognitive abilities: A European commu-
nity meta-analysis. Personnel Psychology, 56, 573–605.
27 2

Anforderungsprofil,
Verhaltensbeobachtung und
Verhaltensbeurteilung
Stefan Höft und Martin Kersting

2.1 Anforderungsprofil – 28

2.2 Verhaltensbeobachtung und -beurteilung – 32


2.2.1 Von der Alltagsbeobachtung zur systematischen
Verhaltensbeobachtung: Eine Begriffsbestimmung – 32
2.2.2 Rahmenbedingungen der eignungsdiagnostischen
Verhaltensbeobachtung – 34
2.2.3 Prozess der Verhaltensbeobachtung und -beurteilung – 35
2.2.4 Weitere Aufgaben der Beobachter/-innen – 51
2.2.5 Fehler bei der Beobachtung und Beurteilung – 51
2.2.6 Trainingstechniken für Beobachter/-innen – 58
2.2.7 Fazit – 60

Literatur – 62

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_2
28 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Überblick
Das 7 Kap. 2 behandelt zwei Themen. Zunächst geht es um das
2 Anforderungsprofil und somit um die Grundlage der gesamten
Eignungsbeurteilung. In 7 Abschn. 2.1 wird erläutert, was unter
einem Anforderungsprofil zu verstehen ist. Dabei wird betont,
dass sich Eignungsmerkmale nicht direkt beobachten lassen,
sondern aus Indikatoren erschlossen werden.
7 Abschn. 2.2 thematisiert eine der fünf Verfahrenskategorien
nach DIN, nämlich die Verfahren zur Verhaltensbeobachtung
und Verhaltensbeurteilung. Nach einer kurzen Begriffs-
bestimmung werden die wesentlichen Arbeitsphasen der
Verhaltensbeobachtung und -beurteilung im Rahmen von
eignungsdiagnostischen Untersuchungen beschrieben.
Neben Aspekten der Vorbereitung (Operationalisierung der
Eignungsmerkmale, Verfahrenskonstruktion, Entwicklung
eines Beobachtungssystems) werden die beobachter-
gestützte Durchführung und Auswertung von Verhaltensbe-
obachtungen behandelt. Zusätzlich wird auf Fehlereinflüsse im
Beurteilungsverlauf und mögliche Präventionsmaßnahmen,
insbesondere in Form von Trainings für Beobachter/-innen,
eingegangen.

2.1 Anforderungsprofil

Die Grundlage der berufsbezogenen Eignungsdiagnostik ist das


Anforderungsprofil.

Definition
Das Anforderungsprofil besteht in einer Zusammen-
stellung der Eignungsmerkmale sowie deren erforderlichen
Ausprägungsgrade, die für die erwartete Leistung und
die Zufriedenheit an einem Arbeitsplatz erforderlich sind.
Anforderungsprofile können auch für ein Aufgabenfeld, für eine
Ausbildung, ein Studium, einen Beruf, usw. formuliert werden.
Das Anforderungsprofil ist das Ergebnis der Anforderungsanalyse.

In der Eignungsdiagnostik dürfen Die Anforderungsanalyse wird in 7 Abschn. 4.1 ausführlich dargestellt.
nach DIN nur Informationen Mit „Eignungsmerkmale“ sind „Qualifikationen, Kompetenzen und
zu anforderungsrelevanten Potenziale sowie berufsbezogene Interessen, Bedürfnisse, Werthaltun-
Eignungsmerkmalen ausgewertet gen, Motive und andere Merkmale einer Person“ gemeint, „die die Vor-
werden aussetzung für die jeweils geforderte berufliche Leistungshöhe und die
berufliche Zufriedenheit sind“ (DIN, 2016, S. 7). In der Eignungsdiag-
nostik dürfen nach DIN „nur Informationen zu anforderungsrelevan-
ten Eignungsmerkmalen ausgewertet werden“ (DIN, 2016, S. 19). In
2.1 · Anforderungsprofil
29 2
7 Abschn. 4.1 werden die Begriffe „Eignungsmerkmal“, „Qualifikatio-
nen“, „Kompetenzen“ und „Potenziale“ erläutert. In 7 Abschn. 4.2.6
werden Eignungsmerkmale, die häufig in Anforderungsprofilen vor-
kommen (z.B. Gewissenhaftigkeit) vorgestellt. Anforderungsprofile
stehen, wie ebenfalls in 7 Kap. 4, 7 Abschn. 4.1.1 dargestellt wird, häufig
in Bezug zu organisationsspezifischen Kompetenzmodellen.
Das 7 Kap. 4 richtet sich an Eignungsdiagnostikerinnen und -diag- Beobachterinnen und Beobachter
nostiker im Sinne der DIN (2016). Wer lediglich als Beobachter/-in an müssen die Eignungsmerkmale
Verhaltensbeobachtungen und -beurteilungen und/oder Interviews/ kennen, die in der konkreten
direkten mündlichen Befragungen beteiligt ist, benötigt keine Kennt- Eignungsbeurteilung eine Rolle
nisse über die Methoden der Anforderungsanalyse. Im Rahmen der spielen, an der sie beteiligt sind
allgemeinen Qualifikationsanforderungen werden den Beobachterin-
nen und Beobachtern zwar durchaus „Kenntnisse über Eignungsbe-
urteilungen sowie über die Eignungsmerkmale“ abverlangt (DIN, 2016,
S. 24), allerdings nur über solche Eignungsbeurteilungen und -merk-
male, „die in der konkreten Eignungsbeurteilung eine Rolle spielen, an
der der Beobachter beteiligt ist“. Die Beobachter/-innen müssen also das
Anforderungsprofil und die Operationalisierung der Eignungsmerk-
male kennen, das dem konkreten Verfahren (Verhaltensbeobachtung
und -beurteilung oder direkte mündliche Befragung), an dem sie mit-
wirken, zugrunde liegt. Sie müssen außerdem beachten, dass nur die
Eignungsmerkmale, die im Anforderungsprofil formuliert sind, rele-
vant für die Eignungsbeurteilung sind.
Im Rahmen des eignungsdiagnostischen Verfahrens wird beurteilt, Anforderungsprofil
wie die Eignungsmerkmale der Kandidatinnen und Kandidaten aus- und Eignungsprofil =
geprägt sind. In der Praxis (nicht aber im Text der DIN) spricht man SOLL-IST-Vergleich
diesbezüglich häufig auch vom „Eignungsprofil“ der Kandidatinnen
und Kandidaten. Das Eignungsprofil (IST-Wert) wird mit dem Anfor-
derungsprofil (SOLL-Wert) verglichen, um über die Passung (Eignung)
zu entscheiden.
Die wichtigste Erkenntnis für Beobachter/-innen besteht darin, Allein auf der Basis von abstrakten
dass es nicht ausreicht, Eignungsmerkmale abstrakt zu beschreiben. Begriffen wie „soziale Kompetenz“
Man kann nicht behaupten, man habe ein Anforderungsprofil erstellt, kann keine abgestimmte
wenn man lediglich abstrakte Begriffe wie „soziale Kompetenz“, „Enga- Eignungsbeurteilung stattfinden
gement“ und „Flexibilität“ aneinandergereiht hat. Bei Begriffen wie
„soziale Kompetenz“ handelt es sich um „Worthülsen“ oder „Hohlwör-
ter“, die jede Beobachterin/jeder Beobachter anders füllt, anders inter-
pretiert. Auf dieser Basis allein kann keine abgestimmte Eignungsbe-
urteilung stattfinden.
Ein Begriff wie „soziale Kompetenz“ erklärt sich nicht aus sich Abstrakte Begriffe müssen mithilfe
selbst heraus. Der abstrakte Begriff muss mithilfe von Verhaltensver- von Verhaltensverankerungen
ankerungen präzisiert werden. Mit Verhaltensanker sind potenzielle präzisiert werden
Beobachtungen gemeint. Niemand kann „soziale Kompetenz“ direkt
beobachten oder messen. Man kann aber beobachten, ob eine Person
Blickkontakt zu einer anderen Person hält. Der für alle Beobachter/-
innen wahrnehmbare Blickkontakt ist dann ein Indikator für die nicht
direkt beobachtbare „soziale Kompetenz“. Der Verhaltensanker zum
Eignungsmerkmal „soziale Kompetenz“ lautet also beispielsweise „hält
30 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Blickkontakt“. Im Rahmen der Verhaltensbeobachtung und -beurtei-


lung kann man dann prüfen, ob eine Kandidatin/ein Kandidat dieses
Verhalten in bestimmten Situationen zeigt.
2 In 7 Abschn. 2.2.3 „Operationalisierung von Eignungsmerkmalen“
Verhaltensnahe wird erläutert, wie dieser Vorgang, der wissenschaftlich „Operationa-
Operationalisierungen lisierung“ genannt wird, funktioniert. In . Tab. 2.2 geben wir ein Bei-
beschreiben Verhaltensweisen, spiel, wie das Eignungsmerkmal „Kooperation“ operationalisiert wird.
die einen Menschen, der Dabei wird zwischen verhaltensnahen Operationalisierungen und kon-
über das infrage kommende kreten Verhaltensbeobachtungen unterschieden. Die verhaltensnahen
Eignungsmerkmal verfügt, im Operationalisierungen beschreiben Verhaltensweisen, die einen Men-
Allgemeinen auszeichnen schen, der über das Eignungsmerkmal „Kooperation“ verfügt, im All-
gemeinen auszeichnen, beispielsweise „Kompromisse zwischen wider-
strebenden Interessen entwickeln“ (. Tab. 2.2). Möglicherweise gibt es
im Auswahlverfahren aber keine Situation, die es ermöglicht, Kom-
promisse zu entwickeln. Die konkreten Verhaltensweisen beziehen
sich auf die konkrete Situation im Auswahlverfahren, z.B. auf das Ver-
halten, das eine Kandidatin/ein Kandidat in einer Gruppendiskussion
zeigen kann, z.B. „das Argument eines anderen Teilnehmers bekräfti-
gen“ (. Tab. 2.2). An den Verhaltensbeispielen in . Tab. 2.2 sieht man,
dass ein Eignungsmerkmal nicht nur durch eine Verhaltensweise indi-
ziert wird (dann wären Eignungsmerkmal und Verhaltensweise iden-
tisch), sondern durch mehrere.
Eignungsmerkmale, die in einem In der Wissenschaft bezeichnet man Eignungsmerkmale auch als
Anforderungsprofil formuliert „Konstrukte“, in der Statistik spricht man von „latenten Variablen“ (7
sind, können nicht direkt Exkurs „Latente und manifeste Variablen“). Dieser Begriff verdeutlicht,
beobachtet werden, sondern dass Eignungsmerkmale „konstruiert“ werden. Eignungsmerkmale
werden aus beobachtbaren werden nicht „gefunden“, sondern „erfunden“. Konstrukte (z.B. die
„Indikatoren“ erschlossen Eignungsmerkmale, die in einem Anforderungsprofil formuliert sind)
können nicht direkt beobachtet oder gemessen werden. Konstrukte (Eig-
nungsmerkmale) werden aus beobachtbaren/messbaren „Indikatoren“
erschlossen. Im Beispiel oben ist der Blickkontakt ein „Indikator“ für
das Eignungsmerkmal „soziale Kompetenz“. In diesem Kapitel behan-
deln wir die Verhaltensbeobachtung und -beurteilung, daher geht es
bei den Indikatoren für das Eignungsmerkmal um beobachtbares Ver-
halten, z.B. um Beobachtungen, die man bei einem Rollenspiel machen
kann. Andere Verfahren der Eignungsbeurteilung nutzen andere Indi-
katoren (7 Exkurs „Die Indikatoren für das Eignungsmerkmal variieren in
Abhängigkeit von dem jeweils eingesetzten Verfahren“in 7 Abschn. 2.2.3).
Von Verhaltensweisen auf . Abb. 2.1 veranschaulicht die Vorgehensweise anhand eines abs-
Eignungsmerkmale und von trakten Eignungsmerkmals und konkreten verhaltensnahen Operatio-
der Gegenwart auf die Zukunft nalisierungen (Kästchen 1 bis 4), die sich auf eine konkrete Situation
schlussfolgern beziehen. In der Grafik wird außerdem die Annahme veranschaulicht,
dass das Eignungsmerkmal zeitlich relativ stabil ist. Ein Mensch, der
über eine hohe Ausprägung in dem Eignungsmerkmal verfügt, wird mit
einer gewissen Wahrscheinlichkeit sowohl in der Gegenwart (während
des eignungsdiagnostischen Verfahrens) als auch in der Zukunft (z.B.
während der Ausbildung oder am Arbeitsplatz) in prototypischen Situ-
ationen Verhaltensweisen zeigen, die typisch für das Eignungsmerkmal
2.1 · Anforderungsprofil
31 2

Gegenwart Zukunft

nicht- Eignungsmerkmal / Konstrukt relativ stabil


beobachtbar

Indikatoren (z. B. Verhalten)

1 2 3 4 usw.
beobachtbar

Situation

. Abb. 2.1  Zur Schlussfolgerung von beobachtbarem Verhalten auf ein Eignungsmerkmal

sind. Wir greifen die . Abb. 2.1 später im Text (7 Abschn. 2.2.3 „Konst-
ruktion von Verfahren zur Verhaltensbeobachtung und -beurteilung“),
wenn wir einige weitere Grundlagen erarbeitet haben, noch einmal
erläuternd auf.

Exkurs

Latente und manifeste Variablen


Im Kontext von statistischen Methoden, die wir in 7 Kap. 5 behandeln,
werden Konstrukte als „latente Variablen“ und Beobachtungen/Messungen
als „manifeste Variablen“ bezeichnet.

Im Rahmen des Anforderungsprofils müssen nicht nur die für Erfolg Nicht nur die Eignungsmerkmale,
und Zufriedenheit relevanten Eignungsmerkmale festgelegt werden, sondern auch die erforderlichen
sondern es müssen auch deren Ausprägungsgrade definiert werden. Ausprägungsgrade müssen im
Ab welcher Ausprägung ist das Eignungsmerkmal so hoch ausgeprägt, Anforderungsprofil hinterlegt
dass es den Anforderungen genügt? Wie eine solche Festlegung vorge- werden
nommen werden kann, erläutern wir in 7 Abschn. 4.1.4. Für Beobach-
ter/-innen ist es ausreichend, diese Ausprägungsgrade im konkreten
Anwendungsfall zu kennen. Schließlich muss im Rahmen der Festle-
gung des Anforderungsprofils auch geklärt werden, „ob und wie ein-
zelne erhobene Werte zu einem Gesamtwert zusammengefasst werden“
(DIN, 2016, S. 10). Die für diese Festlegung relevanten Methoden erläu-
tern wir in den 7 Abschn. 4.1.5 und 7 Abschn. 6.3.2. Beobachter/-innen
benötigen keine Informationen darüber, ob ein einzelnes Eignungs-
merkmal bei der Bildung des Gesamturteils ein bestimmtes Gewicht
erhält oder ob eine Minderleistung in diesem Eignungsmerkmal durch
32 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

eine besonders hohe Leistung in einem anderen Merkmal kompensiert


werden kann usw. Sie sollen die Einschätzung der Ausprägung des Eig-
nungsmerkmals unabhängig von taktischen Erwägungen in Bezug auf
2 das Gesamturteil vornehmen.

2.2 Verhaltensbeobachtung und -beurteilung

Verfahren der Verfahren zur Verhaltensbeobachtung und -beurteilung sind in der Praxis
Verhaltensbeobachtung weit verbreitet. Beispiele für solche Verfahren sind Gruppendiskussio-
und -beurteilung sind eine nen, Rollenspiele und Präsentationsübungen. Auch bei Interviews –
häufig genutzte Methode der nach DIN (2016) eine separate Verfahrenskategorie (7 Abschn. 4.2.2) –
Eignungsbeurteilung findet eine Verhaltensbeobachtung und -beurteilung statt. Deshalb
haben die Autorinnen und Autoren der DIN (2016) sowohl Anforde-
rungen formuliert, die für beide Verfahrenskategorien (sowohl Ver-
fahren zur Verhaltensbeobachtung und -beurteilung als auch mündli-
che Befragungen/Interviews) gelten, als auch Anforderungen, die sich
spezifisch auf die Verhaltensbeobachtung- und -beurteilung beziehen.
Im Folgenden gehen wir auf diese Anforderungen ein und stellen ver-
ständniserleichterndes Hintergrundwissen zur Verfügung.

2.2.1 Von der Alltagsbeobachtung zur


systematischen Verhaltensbeobachtung:
Eine Begriffsbestimmung

Verhaltensbeobachtungen und Verhaltensbeobachtungen und die daraus gezogenen Schlussfolgerun-


-beurteilungen finden auch im gen haben im eignungsdiagnostischen Verfahrenskanon sicherlich die
Alltag statt größte konzeptionelle Nähe zu alltäglichen Personenbeurteilungen,
die wir tagtäglich ohne Zögern vornehmen. Kaum einer wird da zu
einem messtheoretisch fundierten Verfahren, z.B. einem Intelligenztest,
greifen, um die kognitiven Fähigkeiten des Gegenübers zu taxieren. Die
täglichen Gespräche haben nicht den Charakter eines ­strukturierten
diagnostischen Interviews im Sinne der direkten mündlichen Befra-
gungen, wie sie in der DIN 33430 (2016) und in 7 Kap. 3 beschrieben
sind. Die sozialpsychologische Grundlagenforschung zeigt (vgl. z.B.
Parkinson, 2014), dass wir im alltäglichen Umgang schnell bereit sind,
auf Basis von wenigen, lückenhaft wahrgenommenen Verhaltensbe-
obachtungen einem Menschen eine bestimmte Ausprägung eines Eig-
nungsmerkmals (sei es nun zu seiner Teamfähigkeit, seiner Intelligenz
oder seiner emotionalen Stabilität) zu attestieren.
Von der Alltagsbeobachtung Mit einem Verfahren zur Verhaltensbeobachtung und Verhaltens-
zur Verhaltensbeobachtung als beurteilung versucht man, durch die Anwendung wissenschaftlich fun-
diagnostische Methode dierter Prinzipien die Aufnahme, Integration und Verwertung von Ver-
haltensinformationen in Eignungsbeurteilungen so zu gestalten, dass
Fehlereinflüsse reduziert werden und letztlich die Wahrscheinlichkeit
für eine hohe Gültigkeit der getroffenen Aussagen steigt.
Wenn eine Verhaltensbeobachtung als diagnostische Methode ver-
wendet wird, so ist es laut der allgemeinen Begriffsbestimmung von
2.2 · Verhaltensbeobachtung und -beurteilung
33 2
Bodenmann (2006) das Ziel, „mittels systematischer und kontrollierter
Herangehensweise durch die Definition von Beobachtungskategorien,
Beobachtungszeiträumen und -intervallen wie auch des Beobachtungs-
settings offenes oder verdecktes Verhalten einer Person oder mehrerer
Personen sowie deren Interaktionen … deskriptiv zu erfassen“ (S. 151).
In Abwandlung der Bodenmann-Beschreibung kann für die eignungs-
diagnostische Anwendung die Charakterisierung in der nachfolgenden
Definition noch präzisiert werden.

Definition
Verfahren zur Verhaltensbeobachtung und -beurteilung
werden im Rahmen der beruflichen Eignungsdiagnostik
eingesetzt, um innerhalb eines kontrollierten Settings das
gezeigte Verhalten einer Zielperson systematisch zu analysieren.
Das Verhalten wird im Hinblick auf mögliche Anzeichen für die
vorab definierten Eignungsmerkmale analysiert, wobei auch die
Bedingungen (Situationen) berücksichtigt werden, unter denen
das Verhalten auftritt. Bei der dann folgenden Beurteilung wird
auf Grundlage der Beobachtungsbefunde eine Ausprägung der
relevanten Eignungsmerkmale diagnostiziert.

Die im Weiteren behandelten Themenbereiche richten sich an zwei Ziel- Zielgruppen des Kapitels
gruppen, die an der Verhaltensbeobachtung und -beurteilung in unter- „Verhaltensbeobachtung und
schiedlich starkem Maße involviert sind: -beurteilung“
55 Eignungsdiagnostikerinnen und Eignungsdiagnostiker (im
Sinne der DIN, 2016, S. 7, besonders qualifizierte Personen,
die am Prozess der Eignungsbeurteilung mitwirken) erhalten
im Folgenden Informationen zur Gestaltung der Verhaltens-
beobachtung und -beurteilung in allen Prozessschritten, wozu
insbesondere die Vorbereitung (Anforderungsoperationali-
sierung, Verfahrenskonstruktion, Beobachtungssystemerstellung)
und qualitätssichernde Maßnahmen (z.B. die Gestaltung von
Beobachtertrainings) gehören.
55 Beobachterinnen und Beobachter (im Sinne der DIN, 2016,
S. 6, qualifizierte Mitwirkende, die unter Anleitung, Verant-
wortung und Fachaufsicht einer Eignungsdiagnostikerin/eines
Eignungsdiagnostikers an der Durchführung und Auswertung
von eignungsdiagnostischen Verfahren zur Verhaltensbeob-
achtung mitwirken) werden im Folgenden die Wissenselemente
vermittelt, die für die Ausführung ihrer Aufgabe laut DIN
notwendig sind (vgl. DIN, 2016, S. 24-25).

Eignungsdiagnostiker/-innen sind zugleich Beobachter/-innen. Wenn


im Folgenden von Beobachter/-innen die Rede ist, sind somit Eignungs-
diagnostiker-/innen immer mit gemeint. Umgekehrt gibt es Aufgaben,
die nur von Eignungsdiagnostiker/-innen wahrgenommen werden
dürfen. Wenn im Folgenden allein von Eignungsdiagnostiker-/innen
gesprochen wird, bezieht sich das nur auf diese Gruppe.
34 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Analog verhält es sich mit Beobachter/-innen, die bei direkten


mündlichen Befragungen (z.B. Interviews) mitwirken. Die Verhaltens-
beobachtung und -beurteilung ist gleichzeitig eine eigene Verfahrens-
2 kategorie und Bestandteil einer anderen Verfahrenskategorie: Auch bei
direkten mündlichen Befragungen (z.B. Interviews) finden Verhaltens-
beobachtung und -beurteilungen statt. Deshalb müssen Personen, die
an mündlichen Befragungen (z.B. Interviews) mitwirken, laut DIN auch
über die Kenntnisse verfügen, die nach DIN von Personen verlangt
werden, die bei der Verhaltensbeobachtung und -beurteilung mitwir-
ken. Auch diese Gruppe ist daher im Folgenden immer mit gemeint.

2.2.2 Rahmenbedingungen der


eignungsdiagnostischen
Verhaltensbeobachtung

Variationsformen von Prinzipiell können die Rahmenbedingungen für die Beobachtungen


Verhaltensbeobachtungen mit ganz unterschiedlich gestaltet werden. Beispielsweise macht es einen
typischen Ausgestaltungen in der erheblichen Unterschied, ob die Beobachter/-innen selbst an der Situ-
Eignungsdiagnostik ation teilnehmen (z.B. zugleich als Rollenspieler/-in und Beobach-
ter/-in agieren) oder nur beobachten (nicht-teilnehmend). In Anleh-
nung an vergleichbare Systematiken (z.B. Bodenmann, 2006; Spinath &
Becker, 2011; Stemmler & Margraf-Stiksrud, 2015), werden in . Tab. 2.1

. Tab. 2.1  Unterscheidungsmerkmale von Beobachtungsausgestaltungen

unsystematisch-frei systematisch-gebunden
Beobachtung erfolgt ohne vorgegebene Kriterien und Beobachtung erfolgt nach festgelegten Regeln hinsicht-
ergebnisoffen, entspricht am ehesten einer Alltags- lich vorgegebener Kriterien, Ort/Zeit/Dauer sind bestimmt,
beobachtung oder einer Exploration zur Vorbereitung die Auswertung ist festgelegt
einer systematischen Studie
Selbst Fremd
Reflexion des eigenen Verhaltens und Erlebens, z.B. in Beobachtung durch andere Personen, z.B. Bekannte oder
Form von Tagebuchprotokollen geschulte Expertinnen und Experten
Feld Labor
Beobachtung im natürlichen Freizeit- oder Arbeitsum- Beobachtung in künstlich hergestellten Situationen unter
feld, dadurch keine Kontrolle des Geschehens, aber kontrollierten Bedingungen
direkte Übertragbarkeit auf die „Realität“ gegeben
indirekt direkt
Nachträgliche Verhaltensregistrierung auf Basis von Verhaltensregistrierung direkt in der Situation und
Videoanalysen ­unmittelbar
teilnehmend nicht-teilnehmend
Beobachter/-in ist Akteur in der Situation Beobachter/-in ist nur passiv anwesend (z.B. separater
Beobachterplatz) oder nicht anwesend (z.B. findet eine
Videoaufzeichnung statt)

In der rechten Spalte sind die Konstellationen aufgeführt, die in der Eignungsdiagnostik am häufigsten Anwendung
finden
2.2 · Verhaltensbeobachtung und -beurteilung
35 2
wesentliche Unterscheidungsmerkmale für die Gestaltung von Beob-
achtungsvorgängen genannt. In der rechten Spalte der Tabelle sind dabei
die K
­ onstellationen aufgeführt, die in der Eignungsdiagnostik am häu-
figsten Anwendung finden.
Verfahren zur Verhaltensbeobachtung und -beurteilung werden über- Assessment Center: Methoden-
wiegend in kombinierter Form (mit anders gestalteten Verfahren) durch- Mix mit einer harmonisierten
geführt. Diese Verfahrenskombination wird dann häufig als „Assessment Kombination unterschiedlicher
Center“ (AC) bezeichnet. Die DIN umschreibt Assessment Center als Verfahrensansätze
„Methoden-Mix“ (DIN, 2016, S. 12). Bei dieser Kurzbezeichnung geht
allerdings verloren, dass verhaltensorientierte Übungen in spezifischen
AC-Standards als charakterstiftende Kernbestandteile dieser Verfahrens-
kombination angesehen werden (vgl. International Task Force on Assess-
ment Center Guidelines, 2015; Arbeitskreis Assessment Center e.V., 2016).

2.2.3 Prozess der Verhaltensbeobachtung und


-beurteilung
Eignungsdiagnostische
In . Abb. 2.2 sind die Prozessschritte dargestellt, die im Rahmen einer Verhaltensbeobachtung und
Verhaltensbeobachtung und -beurteilung absolviert werden müssen. -beurteilung als Arbeitsprozess in
Sie werden in den nachfolgenden Abschnitten genauer erläutert, indem vier Schritten

1. Erstellen eines Beobachtungssystems


a. Verhaltensnahe Operationalisierung der Eignungsmerkmale
b. Entwicklung eines Beobachtungssystems mit Ablaufsystematik sowie
Beobachtungs- und Beurteilungsbogen
c. Auswahl oder Konstruktion eines Verfahrens
d. Gestaltung von Verfahrenskombinationen

 
2. Zielgerichtete Beobachtung
a. Relevantes Verhalten erkennen
b. Beobachtetes Verhalten protokollieren

 
3. Eignungsmerkmalbezogene Beurteilung
a. Soweit notwendig: Zuweisung der Protokollnotizen zu den einschlägigen
Eignungsmerkmalen
b. Gesamtzusammenschau der Einzelbeobachtungen
c. Eignungsmerkmalbezogene Beurteilung

 
4. Integration der Einzelergebnisse
a. Soweit vorgesehen: Abgleich der Beobachterübereinstimmung
b. Kombination der Einzelergebnisse laut dem vorgesehenen Vorgehen

. Abb. 2.2  Wesentliche Arbeitsschritte bei der Verhaltensbeobachtung und -beurteilung


36 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

zunächst die relevanten Vorgaben der DIN benannt und danach gängige
Umsetzungsformen beschrieben werden. Zuvor erläutern wir in einem
7 Exkurs Rahmenbedingungen für Beobachtungen und Beurteilungen.
2
Exkurs

Bedingungen für eine akkurate Beobachtung


Das „Realistic Accuracy Model“ (RAM) diese Indikatoren auch durch die beeinflussten Prozessphasen
von Funder (1999) wurde im Rahmen Beurteiler/-innen (Beobachter/- sind hier Relevanz und
der persönlichkeitspsychologischen innen, Eignungsdiagnostiker/- Zugänglichkeit.
Forschung zur Akkuratheit von innen) wahrgenommen werden, 44 Quantität und Qualität
Persönlichkeitsbeurteilungen und aus der Art, in der die so der zugrunde liegenden
entwickelt. Es hat das Ziel, den wahrgenommenen Hinweise (Verhaltens-)Informationen:
Gesamtprozess der Beurteilung verwendet werden. Quantität und Qualität der für
abzubilden und dabei Relevanz und Zugänglichkeit von die Beobachtung relevanten
unterschiedliche Moderatoren der Verhaltensindikatoren sind vorrangig Informationen können direkt von
Urteilsakkuratheit zu integrieren. abhängig von den Randbedingungen der Dauer und der Qualität der
Das Modell lässt sich gut an die der Situation, in der die Zielperson beobachteten Interaktions- bzw.
spezifischen Bedingungen der (die Kandidatin/der Kandidat) agiert. Verhaltenssequenz abhängen.
Eignungsdiagnostik adaptieren und Wahrnehmung und Verwendung Wieder sind hier primär die
ist geeignet, erfolgskritische Aspekte der für das Eignungsmerkmal Prozessphasen Relevanz und
der Beobachtung und Beurteilung zu relevanten Informationen hängen Zugänglichkeit betroffen.
verdeutlichen. hingegen stark von der Person des 44 Zielperson: Kandidatinnen und
Der Begriff „Akkuratheit“ kann Empfängers (Beobachter/-innen, Kandidaten unterscheiden sich
an dieser Stelle synonym zu Eignungsdiagnostiker/-innen) ab. darin, wie leicht sie zu beurteilen
Begrifflichkeiten wie „Genauigkeit“ Der schlussendlich erzielte Grad der sind. Eine gute Zielperson
und „Richtigkeit“ verwendet Akkuratheit der Eignungsbeurteilung (Kandidatin/Kandidat)
werden. Der RAM-Ansatz geht als ist direkt abhängig von der Qualität zeichnet sich durch ein hohes
Grundannahme davon aus, dass jedes einzelnen Prozesselements Aktivitätsniveau, durch ein
Persönlichkeitsmerkmale (im Sinne (Funder, 1999, geht hier von einer möglichst konsistentes Verhalten
der DIN als Eignungsmerkmale zu multiplikativen Verknüpfung der und eine hinreichende Offenheit
verstehen) als reale Charakteristika Elemente aus). Funder diskutiert aus, sich unbefangen zu zeigen.
von Personen („Sender“) nur über vier Aspekte, die alleine oder Die genannten Merkmale wirken
einen komplexen Darstellungs- auch in Kombination Einfluss sich direkt auf die Prozessphasen
und Wahrnehmungsablauf mehr auf die unterschiedlichen RAM- Relevanz und Zugänglichkeit
oder minder „akkurat“ von einer Prozessphasen nehmen können: aus. Die Bezeichnung „gut“ in
Beurteilerin/einem Beurteiler 44 Beobachtbarkeit der Eignungs- „gute Zielperson“ bezieht sich
(„Empfänger/-in“) diagnostiziert merkmale: Eignungsmerkmale allein auf die Beobachtbarkeit
werden können. Die durch RAM sind unterschiedlich gut zu und stellt keine Wertung der
beschriebene Prozesskette ist beobachten. Einige Merkmale, Person selbst dar.
in adaptierter Form für akkurate z.B. Extraversion, sind häufig 44 Beurteiler/-innen: Gute
Eignungsmerkmalsbeurteilungen in und leicht zu beobachten. Man Beurteiler/-innen (Eignungs-
. Abb. 2.3 grafisch dargestellt. spricht hier auch von „guten“ diagnostiker/-innen und
Die Akkuratheit einer Eignungsmerkmalen, wobei Beobachter/-innen) müssen eine
Eignungsbeurteilung ist danach sich das „gut“ allein auf die gute Wahrnehmungsfähigkeit
ein Produkt aus vier Elementen: Beobachtbarkeit bezieht und und ein entsprechendes
der Relevanz der gezeigten keine Wertung des Merkmals Urteilsvermögen (vermittelt
Verhaltensweisen für das selbst darstellt. Einfacher über Fachwissen, Erfahrung
betreffende Eignungsmerkmal, beobachtbar sollten wenig und eine entsprechende
der Zugänglichkeit von wertbehaftete, von sich heraus Ausbildung) zusammen mit
Verhaltensindikatoren für die auftretende und weniger durch einer hinreichenden Motivation
beurteilende Person (Beobachter/- Situationskonstellationen aufweisen. Betroffen sind die
innen, Eignungsdiagnostiker/- provozierte Verhaltensin- Prozessphasen Wahrnehmung
innen), dem Ausmaß, in dem dikatoren sein. Die vorrangig und Verwendung.
2.2 · Verhaltensbeobachtung und -beurteilung
37 2

Einflussbereich
Einflussbereich der Empfängerin/ des
der Situation Empfängers

Fremdurteil der
Eignungsmerkmal
Relevanz Zugänglichkeit Wahrnehmung Verwendung Beobachterin/
der Zielperson
des Beobachters

. Abb. 2.3  Das adaptierte „Realistic Accuracy Model“ (RAM) von Funder zur Akkuratheit von Merkmalsbeurteilungen
(übersetzt und angepasst aus Funder, 1995, p. 659, adapted with permission. APA is not responsible for the accuracy of this
translation)

Festlegung eines Beobachtungssystems


Die/der verantwortliche Eignungsdiagnostiker/-in ist für die Vorbereitung DIN-Forderung: Ein
der Beobachtung und Beurteilung, in . Abb. 2.2 mit dem Begriff „Beob- Beobachtungssystem legt
achtungssystem“ umschrieben, verantwortlich. Nach DIN (2016, S. 15) die Rahmenbedingungen der
werden mit dem Beobachtungssystem Festlegungen getroffen, „wann und Beobachtung fest: wann, wo,
wo die Beobachtung erfolgt, welche Verhaltensweisen beobachtet werden was, wie
und in welcher Form die Ergebnisse der Beobachtung dokumentiert
werden“. Damit erfolgt gleichzeitig eine Konkretisierung der in der DIN
in allgemeiner Form beschriebenen Anforderungen zur Planung sowie zur
Auswahl und Zusammenstellung von eignungsdiagnostischen Verfahren.

Operationalisierung von Eignungsmerkmalen


In der DIN (2016, S. 10) wird gefordert, dass über eine Anforderungsana- DIN-Forderung:
lyse die Eignungsmerkmale samt der erforderlichen Ausprägungsgrade Eignungsmerkmale sind alleiniger
identifiziert werden, die relevant sind für die berufliche Leistung auf einem Bezugspunkt für die Beobachtung
Arbeitsplatz bzw. zur erfolgreichen Bewältigung einer Ausbildung, eines
Studiums, eines Berufs bzw. einer beruflichen Tätigkeit und zur berufli-
chen Zufriedenheit. Eignungsmerkmale dienen als Bezugspunkt für die
Beobachtung, da nur eignungsmerkmalrelevante Verhaltensbeobach-
tungen ausgewertet werden sollen (DIN, 2016, S. 19). Alle anderen, im
Sinne der Eignungsmerkmale irrelevanten Beobachtungen finden keine
Beachtung.
In der DIN (2016, S. 10) wird gefordert, dass die Eignungsmerkmale Drei Abstraktionsebenen für
durch verhaltensnahe Schilderung von Beispielaussagen und/oder Bei- Eignungsmerkmale: Abstrakte
spielverhaltensweisen konkretisiert werden. Dies trägt dazu bei, dass Merkmalsumschreibung,
alle Eignungsdiagnostiker/-innen und Beobachter/-innen ein gleiches verhaltensnahe
Verständnis von den Begrifflichkeiten haben und somit bei der Beob- Operationalisierung, konkrete
achtung gemäß dem gleichen Bezugssystem arbeiten. Üblicherweise Verhaltensbeschreibungen
werden hier mindestens drei Abstraktionsebenen unterschieden: Die
abstrakten Eignungsmerkmale werden über verhaltensnahe Operatio-
nalisierungen umschrieben. Aus diesen können wiederum konkrete
Verhaltensbeschreibungen abgeleitet werden. In . Tab. 2.2 (angelehnt
38 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

. Tab. 2.2  Beispiel für eine verhaltensnahe Operationalisierung des Eignungsmerkmals „Kooperation“

Abstraktes Eignungsmerkmal Kooperation


2 (mit allgemeiner Umschreibung) Gute Zusammenarbeit mit anderen Teilnehmerinnen und
Teilnehmern (TN), die sich in einem offenen Informations-
austausch, Rücksichtnahme und Hilfestellungen äußert
Verhaltensnahe Operationalisierungen + Andere TN unterstützen
(meist positive, eher selten auch negative Konkretisierun- + Belange anderer TN berücksichtigen
gen des Eignungsmerkmals)
+ Interesse für die Situation anderer TN zeigen
+K
 ompromisse zwischen widerstrebenden Interessen
entwickeln
− Nur eigene Interessen verfolgen
− Belange und Wünsche anderer TN übergehen
− Situation anderer TN ignorieren
− Auf eigenem Standpunkt beharren
Konkrete Verhaltensbeobachtungen Einschlägige Beispiele für die Operationalisierung „Andere
(durch die Operationalisierungen beschriebene umgrenzte Teilnehmer/-innen unterstützen“:
Gruppen von einschlägigen Verhaltensweisen) + TN erläutert einem anderen TN einen unklaren Punkt
+ TN bekräftigt das Argument eines anderen TN
+ TN willigt in den Vorschlag eines anderen TN ein

an eine Darstellung von Höft & Lüth, 2005) wird dieses anhand des Eig-
nungsmerkmals „Kooperation“ veranschaulicht.
Konkrete Verhaltensanker sind Während die Ebene der Verhaltensoperationalisierungen bereits
spezifisch für die Situation, in in der Anforderungsanalyse ermittelt und fixiert werden muss (vgl.
der sich die Kandidatinnen und 7 Abschn. 4.1 zur Anforderungsanalyse), werden die konkreten Verhal-
Kandidaten befinden (z.B. in tensbeschreibungen sinnvoll nur mit Bezug auf ein spezifisches Verfah-
einem Rollenspiel) ren (z.B. konkretes Verhalten in einem Rollenspiel mit einer bestimmten
Problemsituation) benannt. Entsprechende Formulierungen können
beispielsweise als angepasste Bewertungsanker verwendet werden.
Zudem müssen die Beobachter/-innen prinzipiell qualifiziert sein, aus
den Operationalisierungen einschlägige Verhaltensweisen selbststän-
dig abzuleiten bzw. im Beobachtungszusammenhang zu identifizieren.
Die beispielhaft genannten Verhaltensweisen (Verhaltensanker) stellen
also keine vollzählige Liste aller möglichen Verhaltensweisen dar, die
das betreffende Eignungsmerkmal indizieren.

Konstruktion von Verfahren zur


Verhaltensbeobachtung und -beurteilung
Mit Verfahren zur Verfahren zur Verhaltensbeobachtung und -beurteilung werden von der
Verhaltensbeobachtung und DIN explizit neben Dokumentenanalysen, direkten mündlichen Befra-
-beurteilung werden häufig gungen, messtheoretisch fundierten Fragebogen und Tests als eigen-
anspruchsvolle interpersonale ständige diagnostische Verfahrensgruppe aufgeführt (7 Abschn. 4.2).
Arbeitssituationen nachgestellt
2.2 · Verhaltensbeobachtung und -beurteilung
39 2
Exkurs

Die Indikatoren für das Eignungsmerkmal variieren in Abhängigkeit von dem jeweils eingesetzten
­Verfahren
Wir haben die Operationalisierung vorgenommen. Dann werden Ver- Konzentration können
von Eignungsmerkmalen hier fahren ausgewählt, die sich für die beispielsweise Reaktionszeiten
am Beispiel der Verfahren der Erfassung des Eignungsmerkmals als messbare Indikatoren
Verhaltensbeobachtung und eignen. In dem in diesem Kapitel herangezogen werden.
-beurteilung erläutert. Wie thematisierten Verfahren der Verhal- Bei der Auswertung von
im 7 Abschn. 2.1 dargestellt, tensbeobachtung und -beurteilung Bewerbungsunterlagen
beschränkt sich die Notwendigkeit sind dies konkrete Verhaltensweisen, (Verfahrenskategorie
einer Operationalisierung die im Rahmen dieses Verfahrens „Dokumentenanalyse“ im Sinne der
von Eignungsmerkmalen beobachtbar sind. DIN, 7 Abschn. 4.2.2) sind
aber nicht auf Verfahren der Bei anderen Verfahren die Informationen zum Lebenslauf
Verhaltensbeobachtung und (7 Abschn. 4.2.2) sind es die „Indikatoren“ für nicht direkt
-beurteilung. Eignungsmerkmale andere Indikatoren, z.B. wird beobachtbare Eignungsmerkmale.
müssen grundsätzlich, unabhängig das Eignungsmerkmal beim So könnte man sich beispielsweise
von dem Verfahren, operationalisiert Einsatz eines messtheoretisch darauf verständigen, dass ein
werden. fundierten Fragebogens durch das längerer Arbeitsaufenthalt im
Im Rahmen der Anforderungsanalyse Ankreuzverhalten der Kandidatinnen Ausland als Indikator für das
wird das abstrakte Eignungsmerkmal und Kandidaten indiziert. In einem Eignungsmerkmal „interkulturelle
festgelegt, und es werden verhal- messtheoretisch fundierten Test zur Kompetenz“ gewertet wird.
tensnahe Operationalisierungen Erfassung des Eignungsmerkmals

In . Tab. 2.3 sind mögliche Verfahrensbeispiele für Verfahren zur Ver-


haltensbeobachtung und -beurteilung mit einer kurzen Beschreibung
aufgeführt.
Die in . Tab. 2.3 als Beispiele aufgeführten Verfahren sind als Simu-
lationen einzustufen. Grundidee ist hier, dass erfolgskritische Tätig-
keitsausschnitte der Zielposition nachgestellt werden, und die Leistung

. Tab. 2.3  Beispiele für Verfahren der Verhaltensbeobachtung


und -bewertung

Präsentation Kurze Präsentation eines eingegrenzten Themas, ggf.


unter Einsatz von Hilfsmitteln zur Visualisierung
Rollenspiel Diskussion mit einer/einem nach/einem Skript agieren-
den Rollenspieler/-in, z.B. im Rahmen eines simulierten
Mitarbeiter/-innengesprächs, einer Verkaufsberatung
oder einer Reklamation durch Kunden/-innen
Gruppen­ Diskussion mit mehreren Kandidatinnen/Kandidaten,
diskussion z.B. zu einem vorgegebenen Thema (kompetitive Aus-
gangslage) oder gemeinsame Arbeit an einem Problem
(kooperativer Kontext)
Fallstudie Komplexes Fachproblem, das in Einzelarbeit bearbeitet
werden muss. Um als Verfahren zur Verhaltensbeob-
achtung und -beurteilung klassifiziert zu werden, muss
eine Verhaltensbeobachtung vorgesehen werden, z.B.
indem die Lösung später gegenüber einem Gremium
argumentativ zu vertreten ist
40 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

der/des agierenden Kandidatin/Kandidaten bei der Bewältigung der


Aufgabe beurteilt wird. Generell gilt, dass bei einigen individuellen
(z.B. Präsentation) und bei praktisch allen interaktiven Simulationen
2 (z.B. Rollenspiel, Gruppendiskussion) eine Verhaltensbeobachtung
und -beurteilung zur Auswertung zwingend notwendig sind.
DIN-Forderung: Alle Kandidaten/- In der DIN (2016, S. 13) werden Rahmenbedingungen für die Ver-
innen müssen mit den gleichen fahrensgestaltung formuliert. Für direkte mündliche Befragungen und
Anforderungen konfrontiert für Verfahren zur Verhaltensbeobachtung und -beurteilung gilt, „dass
werden. Hilfreich sind hierfür alle Kandidaten mit gleichen Anforderungen konfrontiert … und auf
Schulungsmaßnahmen und gleiche Weise behandelt werden“ müssen. Maßnahmen, die dazu bei-
genaue Instruktionen tragen, dieses Ziel zu erreichen, sind beispielsweise Schulungsmaßnah-
men sowie die Nutzung von Instruktionen für Beobachter/-innen und
Teilnehmer/-innen.
DIN-Forderung: Die „Übungen“ Speziell für Verfahren der Verhaltensbeobachtung und -beurtei-
müssen so gestaltet werden, dass lung wird in der DIN darauf hingewiesen, dass entsprechende
das interessierende Verhalten Übungen sorgfältig und wenig störungsanfällig konstruiert werden
gezeigt werden kann sollen, um eine Beobachtung und Beurteilung von Eignungsmerk-
malsäußerungen im Verhalten der Kandidatinnen und Kandidaten
abseits von Situationseinflüssen zu ermöglichen. „Die Übungen sollten
nicht zu leicht oder zu schwer sein, sie müssen es ermöglichen, das
Verhalten, welches beobachtet werden soll, zu zeigen“ (DIN, 2016,
S. 15). Als Beispiel wird ausgeführt, dass das Eignungsmerkmal „Kon-
fliktfähigkeit“ in einer Übung nicht beobachtet und beurteilt werden
kann, wenn die Übung keinen Konflikt hervorruft. Instruktionen und
andere Materialien sind so zu gestalten, dass die Ziele der Übung deut-
lich werden.
Eindeutige Vorschriften werden in der DIN zur Erprobung von
Übungen und speziell zum Einsatz von Rollenspielerinnen und Rol-
lenspielern formuliert: „Alle Übungen müssen vor dem Ernstfallein-
satz praktisch erprobt werden. Sofern Rollenspieler eingesetzt werden,
müssen sie ausführliche Anweisungen erhalten, damit sie die Rollen-
spielsituation sowohl über verschiedene Kandidaten hinweg vergleich-
bar gestalten als auch durch individuelle Reaktionen möglichst natür-
lich wirken. Rollenspieler müssen geschult werden und das Rollenspiel
vorab praktisch üben“ (DIN, 2016, S. 15).
Bei der Konstruktion Diese Vorgaben korrespondieren mit Lehrbuchhinweisen und pub-
von Verfahren zur lizierten Best-Practice-Beispielen. In . Tab. 2.4 ist ein Vorgehen dar-
Verhaltensbeobachtung und gestellt, das sich an entsprechende Darstellungen, beispielsweise von
-beurteilung ist eine ausführliche Thornton und Müller-Hanson (2004) oder auch Bolte und Sünderhauf
Vorerprobung mit mehreren (2005), anlehnt.
Überarbeitungsrunden Die theoriegeleitete Konstruktion von Übungen ist in den letzten
einzuplanen Jahren in das Interessenfeld der eignungsdiagnostischen Forschung
gerückt. Im 7 Exkurs „Aktivierung eignungsmerkmalsrelevanten Verhal-
tens in einer Übung“ wird hierzu ein Einblick gegeben.
2.2 · Verhaltensbeobachtung und -beurteilung
41 2

. Tab. 2.4  Typische Ablaufschritte bei der Verfahrenskonstruktion

0 Vorarbeiten In der vorangegangenen Anforderungsanalyse wurden die zu erfas-


senden Eignungsmerkmale festgelegt. Im Zuge der diagnostischen
Planung wurde entschieden, ein Verfahren zur Verhaltensbeobachtung
und -beurteilung einzusetzen.
1 Entwurf eines Szenarios Mit dem Begriff „Szenario“ wird in diesem Zusammenhang eine beruf-
liche Problemsituation oder besondere Herausforderung bei der Tätig-
keitsausübung bezeichnet, z.B. ein schwieriges Mitarbeiter/-innenge-
spräch. Das Szenario muss geeignet sein, bei den Kandidatinnen und
Kandidaten eignungsmerkmalsrelevantes Verhalten zu provozieren.
Kleinere Szenarien mit ähnlich gelagerten Problemstellungen werden
ggf. zusammengefasst oder in einem komplexeren Szenario integriert.
2 Konstruktion eines Ausgestaltung eines ersten vollständigen Entwurfs der Handhabungs-
­Verfahrensprototyps hinweise für den Verfahrensprototyp mit allen notwendigen Materia-
lien sowie Instruktionen für die Teilnehmer/-innen und die Verfahrens-
beteiligten (Rollenspieler/-innen oder Assistenzkräfte), Darlegung der
Ziele der Übung und der erfassten Eignungsmerkmale, Entwicklung
der Verhaltensoperationalisierungen in den Beobachtungs- und Be-
urteilungsbogen.
3 Erprobung des Verfahrensprototyps Erprobung des Prototyps mit „Testpersonen“, die idealerweise hin-
sichtlich Kompetenz und Motivation vergleichbar zur Zielgruppe sind,
sowie mit eingewiesenen Eignungsdiagnostiker/-innen, Beobachter/-
innen und Assistenzkräften; der Fokus der Erprobung liegt auf der
zielgruppenadäquaten Schwierigkeit, der erzielten Realitätsnähe,
der Beobachtbarkeit der Eignungsmerkmale und der Plausibilität des
Prozessablaufs.
4 Revision des Verfahrensprototyps Überarbeitung des Prototyps auf Grundlage der Erfahrungen aus
mit Neuerprobung den Testläufen (basierend z.B. auf freien Beobachtungen zum Pro-
zessverlauf, dem Feedback der Erprobungsbeteiligten sowie ersten
probeweisen Beobachtungen und Beurteilungen des Verhaltens der
„Testpersonen“); falls erforderlich, folgen weitere Probedurchläufe mit
anschließender Überarbeitung.
5 Finalisierung und Kon­struktion von Finalisierung der vorläufigen Endversion mit vollständigen Handha-
Verfahrensvarianten bungshinweisen inklusive Beobachtungs- und Beurteilungsbogen; bei
Gruppenverfahren Entwicklung von angepassten Verfahrensversionen
für unterschiedliche Teilnehmer/-innenzahlen; bei Rollenspielen ggf.
Konstruktion von Parallelversionen; eine separate Erprobung dieser
zusätzlichen Entwicklungen ist dann dringend angeraten.
6 Einschleusung in den R
­ ealbetrieb Vollständige Information der Verfahrensbeteiligten; praktische Erpro-
bung, bei der die Eignungsdiagnostiker/-innen und Beobachter/-in-
nen ihre Aufgaben anhand realistischer Beispiele (Videoaufzeichnun-
gen oder simulierte Rollenspiele) einüben
7 Qualitätssicherung Im laufenden Verfahren erfolgt eine Qualitätssicherung durch Beglei-
tung und Überwachung der Prozesse durch die/den verantwortliche/n
Eignungsdiagnostiker/-in, regelmäßige Reflexions- und Auffrischungs-
workshops für die Verfahrensbeteiligten sowie zeitnahe Verfahrensmo-
difikationen bei identifizierten Mängeln.
42 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Exkurs

Aktivierung eignungsmerkmalsrelevanten Verhaltens in einer Übung

2 Die Forschungsgruppe um Filip


Lievens an der Universität Ghent
hierfür wäre ein Rollenspiel
mit einem/r hilfsbedürftigen
besondere Zielstellungen
für die Kandidaten/-innen in
untersucht seit einigen Jahren Interaktionspartner/-in, der/die der Übung mit Bezug zu den
günstige Rahmenbedingungen mehrmals entsprechende Hinweise Eignungsmerkmalen herausgestellt,
bei der Gestaltung von Verfahren zur Notlage gibt. Zum anderen zum anderen wurden im Skript
zur Verhaltensbeobachtung muss von den Kandidaten/- des/der Rollenspielers/-in gezielt
und -beurteilung. Ein wichtiges innen aber auch ein genügend Aussagen platziert, die in einer
Referenzkonzept stellt dabei die großer Handlungsspielraum in Vorstudie als gute Vorlagen für
Theorie der „Trait-Aktivierung“ der Situation erlebt werden (im eignungsmerkmalsrelevantes
(TAT; vgl. Tett & Guterman, Sinne des TAT-Konzepts muss eine Verhalten identifiziert worden
2000) dar. Nach dem TAT- geringe Situationsstärke vorliegen), waren. Im Ergebnis zeigt
Ansatz sind zwei Faktoren um frei agieren zu können. Im sich, dass die Skripthinweise
ausschlaggebend dafür, ob sich erwähnten Rollenspiel darf deshalb zu einer größeren Anzahl
ein Eignungsmerkmal (bei den der Hilfeappell nicht zu stark von merkmalsrelevanten
TAT-Arbeiten gleichgesetzt mit dem herausgestellt werden, damit der so Verhaltensbeobachtungen führte
persönlichkeitspsychologischen erzeugte Aufforderungscharakter (Erhöhung der Beobachtbarkeit
Trait-Konzept) in Verhalten äußert der Situation nicht uniform zu im Sinne des RAM-Modells von
und somit hinreichend gut einem helfenden Handeln aller Funder, . Abb. 2.3), während
beobachtet werden kann: Zum Kandidaten/-innen führt. sich für die spezifischen
einen muss eine Übung genügend In einer exemplarischen Studie Instruktionsvorgaben keine
situative Anreize bieten, damit aus dem TAT-Forschungskontext Veränderungen ergaben. Die
merkmalsrelevantes Verhalten untersuchen Schollaert und Lievens Autoren werten die Ergebnisse
provoziert werden kann. Eine im (2012) zwei Maßnahmen, mit als deutlichen Hinweis darauf, bei
Grundsatz kooperative Person denen eignungsmerkmalrelevanten der Übungskonstruktion noch
kann also dieses Merkmal nur Verhaltens in einem Rollenspiel gezielter und systematischer
zeigen, wenn ihr hinreichend provoziert werden soll: In der als bisher auf die Provokation
Gelegenheit gegeben wird, Instruktion für die Kandidaten/- eignungsmerkmalsrelevanten
kooperativ zu handeln. Ein Beispiel innen wurden zum einen Verhaltens hinzuarbeiten.

Anhand des Beispiels können wir die . Abb. 2.1 „mit Leben füllen“. In
das Kästchen „Eignungsmerkmal“ würde in diesem Falle „Koopera-
tion“ eingesetzt. Wie alle Eignungsmerkmale ist auch die Kooperation
nicht direkt beobachtbar. Man muss zunächst eine Situation schaffen,
in der Indikatoren für die Kooperation beobachtbar werden. Die Situ-
ation könnte beispielsweise eine Gruppendiskussion sein. Die Indika-
toren in den Kästchen, die in . Abb. 2.1 mit den Ziffern 1 bis 4 bezeich-
net sind, wären die konkreten Verhaltensbeobachtungen entsprechend
der letzten Zeile in . Tab. 2.2, also z.B. „TN erläutert einem anderen TN
einen unklaren Punkt“ usw. Die theoretische Annahme lautet, dass das
Eignungsmerkmal sowohl das in der Gegenwart (in der Gruppendis-
kussion) beobachtbare Verhalten mitbestimmt als auch das Verhalten,
das in Zukunft, also in der Ausbildung oder am Arbeitsplatz, in ver-
gleichbaren Situationen gezeigt wird. Wir dürfen also annehmen, dass
eine Kandidatin, die einer anderen Kandidatin einen unklaren Punkt
erläutert (und weitere entsprechende Verhaltensweisen zeigt), auch in
Zukunft in vergleichbaren Situationen Verhaltensweisen zeigen wird,
die dem abstrakten Eignungsmerkmal „Kooperation“ entsprechen.
2.2 · Verhaltensbeobachtung und -beurteilung
43 2
Gestaltung von Verfahrenskombinationen
Im DIN-Text (2016, S. 14) wird darauf verwiesen, dass in Verfahren zur DIN-Forderung: Zu jedem
Verhaltensbeobachtung und -beurteilung für jedes Eignungsmerkmal Eignungsmerkmal sollte mehr als
mehr als eine Übung (z.B. Rollenspiel, Gruppendiskussion) vorgesehen eine Übung vorgesehen werden
sein sollte. Gleichzeitig muss vorab festgelegt werden, welche Eignungs-
merkmale in welcher Übung durch welche Beobachter/-innen erfasst
werden (DIN, 2016, S. 15).
Entsprechende Festlegungen werden üblicherweise in sogenannten Eine Anforderungs-Übungs-Matrix
„Anforderungs-Übungs-Matrizen“ fixiert. In . Abb. 2.4 ist ein fiktives regelt, welches Eignungsmerkmal
Beispiel mit fünf Eignungsmerkmalen und vier Übungen dargestellt. Alle in welcher Übung erfasst wird
Eignungsmerkmale werden mindestens zweimal erfasst. Um die Beob-
achter/-innen nicht zu überfordern und die Trennschärfe der Beurtei-
lung zu wahren, soll laut DIN-Empfehlung in einem vorgegebenen Zeit-
raum nur eine begrenzte Anzahl von Eignungsmerkmalen gleichzeitig
beurteilt werden. Eine genaue Festlegung wird in der DIN nicht vorge-
nommen. Üblicherweise finden sich in der Fachliteratur Empfehlungen
wie „maximal fünf (besser nur drei)“ Eignungsmerkmale pro Übung
(z.B. Höft, 2013). Im fiktiven Beispiel der . Abb. 2.4 wäre beispielsweise
die Vorgabe, mit dem Rollenspiel vier konzeptionell teilweise sehr ähn-
liche Eignungsmerkmale erfassen zu wollen, kritisch zu hinterfragen.
In der DIN (2016, S. 13) wird explizit erwähnt, dass die Beobach- Der Beobachter/-
ter/-innen den Kandidatinnen und Kandidaten gegenüber unvorein- innenrotationsplan regelt die
genommen vorgehen müssen. Bei einer Verhaltensbeobachtung und übungsspezifische Zuordnung
-beurteilung mit mehreren Übungen kann die sogenannte „Rotation“ der Kandidat/-innen zu den
der Beobachter/-innen zur Unvoreingenommenheit beitragen. Ein fik- Beobachter/-innen
tives Beispiel eines Beobachter/-innenrotationsplans ist in . Abb. 2.5
dargestellt. Die Logik hinter der Rotation ist dem sozialwissenschaft-
lichen Versuchsplanungsprinzip der „Randomisierung“ entlehnt: Die
unbekannten Beurteilungstendenzen einer Beobachterin/eines Beob-
achters werden durch die Rotationstechnik auf unterschiedliche Kan-
didatinnen und Kandidaten verteilt.
Anmerkung zu . Abb. 2.5: Die Beobachter/-innen sind mit den
Buchstaben A bis D gekennzeichnet, die Kandidatinnen und Kandida-
ten mit den Nummer 1 bis 10 und die Durchgänge mit I bis X. In der

Übungen
Rollenspiel Gruppendiskussion Präsentation Fallarbeit
Kooperation X X
Eignungsme

Durchsetzungsvermögen X X
Ausdrucksfähigkeit X X
rkmale

Problemlösung X X X
Emotionale Stabilität X X

Anmerkung: Mit einem „X“ sind die in der jeweiligen Übung erfassten Eignungsmerkmale
gekennzeichnet.

. Abb. 2.4  Beispiele für eine Anforderungs-Übungs-Matrix


44 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Gruppendiskussion Rollenspiel Gruppenarbeit


Durch-
2 gang I II I/II III/IV V/VI VII/VIII IX/X I II

A 1,2 6,7,8 1 3 5 7 9 1,3,8 4,6,10


Beobachter/-in

B 1,2 6,7,8 2 4 6 8 10 2,9 7,5

C 3,4,5 9,10 1 3 5 7 9 2,9 7,5

D 3,4,5 9,10 2 4 6 8 10 1,6,8 4,6,10

Kandidatinnen / Kandidaten: 1 bis 10; Beobachter/-innen A bis D; Durchgänge: I bis X

. Abb. 2.5  Beispiel für einen Beobachter/-innenrotationsplan

zweiten Durchführung der Gruppendiskussion nehmen beispielsweise


fünf Kandidatinnen und Kandidaten teil (6, 7, 8, 9, 10). Die Kandidatin-
nen und Kandidaten 6, 7, und 8 werden von den Beobachter/-innen A
und B beobachtet, die Kandidatinnen und Kandidaten 9 und 10 von den
Beobachter/-innen C und D. Im nachfolgenden Rollenspiel wird bei-
spielsweise Kandidatin 5 von Beobachter A und Beobachterin C bewer-
tet, während zeitgleich in einem anderen Raum die Beobachter/-innen
B und D den Kandidaten 6 begutachten.
DIN-Forderung: Kandidaten/- Insgesamt stellt die Vorbereitung und Durchführung einer kombi-
innen müssen zum Tagesablauf nierten Verfahrensserie mit mehreren Übungen einen nicht unerheb-
(Platzierung der Übungen, lichen Planungsaufwand dar. Die Durchführung ist bei mehreren zu
Pausen- und Wartezeiten) begutachtenden Kandidatinnen und Kandidaten auch für diese selbst
informiert werden sehr zeit- und arbeitsaufwändig (vgl. hierzu z.B. von Rüden, 2005). In
der DIN (2016, S. 15) wird ergänzend zu den allgemeinen Hinweisen
zur Durchführung der Eignungsuntersuchung in diesem Zusammen-
hang noch einmal auf die Informationspflicht gegenüber den Kandida-
tinnen und Kandidaten hingewiesen. Sie sind zu Beginn des Verfahrens
darüber zu informieren, welche Übungen wann und wo stattfinden.
Zusätzlich sind sie über etwaige Pausen- und Wartezeiten aufzuklä-
ren. Derartige Informationen tragen auch zur Akzeptanz der Verfah-
ren bei (zur Akzeptanz von Assessment Center siehe Kersting, 2010).

Beobachtung
DIN-Forderung: Bezogen auf die konkrete Gestaltung des Verhaltensbeobachtungspro-
Eignungsdiagnostisch relevante zesses wird in der DIN darauf hingewiesen, dass eignungsdiagnostisch
Beobachtungen sind festzuhalten relevante Beobachtungen in geeigneter Form (z.B. in einem Beobach-
tungsbogen) festzuhalten sind (DIN, 2016, S. 14). Praktisch ausge-
schlossen (allerdings nicht explizit verboten) werden damit Verhaltens-
beurteilungsmethoden, die keine explizite Protokollierungen vorsehen
und mit Eignungsmerkmalsbewertungen arbeiten, die nach Abschluss
der Übung auf Basis von allgemeinen Eindrücken gebildet werden (vgl.
z.B. Stemmler & Margraf-Stiksrud, 2015, S. 43–50).
2.2 · Verhaltensbeobachtung und -beurteilung
45 2
Beobachtungstechniken in der Wissenschaft
Im wissenschaftlichen Anwendungskontext (z.B. Spinath & Becker,
2011; Faßnacht, 2007) werden bei Verfahren der Beobachtung- und
-beurteilung typischerweise Protokollierungsvarianten eingesetzt, die
mit expliziten Beobachtungseinheiten arbeiten.

Definition

Unter „Beobachtungseinheiten“ werden Verhaltensmerkmale


verstanden, die prinzipiell in der Beobachtungssituation mit
erkennbarem Anfang und Ende auftreten können und inhaltlich
eindeutig sowie möglichst verhaltensnah definiert sind.
Konzeptionell sind sie damit auf der Ebene von verhaltensnahen
Operationalisierungen bzw. Verhaltensanker einzustufen
(7 Abschn. 2.2.3).

Idee bei diesem Beobachtungsansatz ist es, das abstrakte Eignungs-


merkmal durch möglichst repräsentative Beobachtungseinheiten zu
umschreiben. Das Eignungsmerkmal „Kooperation“ könnte beispiels-
weise über die Beobachtungseinheiten „greift Vorschlag anderer auf “,
„schlägt einen Kompromiss vor“ und „zeigt Zustimmung“ abgebildet
werden. Zwei wissenschaftliche
Aufgabe der Beobachter/-innen ist es dann, das Auftreten dieser Beobachtungstechniken,
Beobachtungseinheiten (und nur dieser) während der Beobachtungs- um das Auftreten von
sequenz im Protokoll zu registrieren. Hierfür können zwei unterschied- Beobachtungseinheiten zu
liche Techniken verwendet werden: registrieren
55 Bei dem Ereignisstichprobenansatz („event sampling“) wird das
Auftreten einer Beobachtungseinheit im gesamten Beobach-
tungsintervall mit Start und Ende registriert. Damit können
die Häufigkeit des Auftretens und die Dauer gut rekonstruiert
werden.
55 Bei dem Zeitstichprobenansatz („time sampling“) wird der
gesamte Beobachtungszeitraum (z.B. ein 10-minütiges Rollen-
spiel) in Intervalle (z.B. fünf 2-minütige Intervalle) eingeteilt.
Aufgabe der Beobachter/-innen ist es dann, zu registrieren, ob
die Beobachtungseinheit in einem Intervall eingetreten ist oder
nicht. Damit kann die Häufigkeit (bezogen auf die Gesamtzahl
von Intervallen) erfasst werden, die Dauer geht aber weitgehend
verloren. Es kann außerdem nicht mehr registriert werden, ob die
Einheit mehrfach im Intervall aufgetreten ist.

Die Verwendung des gegenüber dem Ereignisstichprobenansatz deut-


lich vereinfachten Zeitstichprobenansatzes ist im Wesentlichen öko-
nomisch und pragmatisch begründet: Wenn z.B. bei einer Eignungs-
untersuchung für lizensierte Verkehrsflugzeugführer/-innen das
Kommunikationsverhalten von Kandidatinnen und Kandidaten bei
46 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Flugmanövern im Flugsimulator untersucht werden soll, wäre ein/eine


traditionell mit Papier, Bleistift und einem Klemmbrett arbeitende/r
Beobachter/-in schnell überfordert, das genaue Auftreten und die Dauer
2 der Beobachtungseinheit in der Situation exakt zu dokumentieren. Das
prinzipielle Auftreten („hat Sprechfunkhinweis bestätigt - ja/nein“) im
Beobachtungsintervall ist hingegen wesentlich einfacher zu erfassen.
Mithilfe von Videoaufzeichnungen, die eine wiederholte Verhaltensana-
lyse ohne Zeitdruck ermöglichen, ist der informationsreichere Ereignis-
stichprobenansatz hingegen deutlich einfacher zu realisieren. Hierfür
stehen schon seit einigen Jahren Softwaresystem zur Verfügung, die
eine komfortable Auswertung ermöglichen. Eignungsdiagnostische
Anwendungen dieser Beobachtungstechniken dürften sich am ehesten
im Kontext von hochstrukturierten Situationen finden, z.B. bei Mensch-
Maschine-Interaktionen (vgl. Höft, Schelling & Maschke, 2010).

Beobachtungstechniken in der eignungsdiagnosti-


schen Praxis
Beispiele für einen freien In der eignungsdiagnostischen Praxis haben sich Beobachtungstech-
Beobachtungsbogen, eine niken etabliert, die sich von der Registrierung weniger ausgewählter
kategorisierte Variante sowie eine Beobachtungseinheiten trennen und in der Form der gewählten Regist-
Checkliste rierung am ehesten als Fortführung des Zeitstichprobenansatzes zu ver-
stehen sind. In . Abb. 2.6 sind drei typische Varianten von eingesetzten
Beobachtungsbogen dargestellt.
55 Die Variante (a) „freier Beobachtungsbogen“ arbeitet im Grund-
prinzip mit einem leeren Bogen. Die Beobachter/-innen notieren
ihres Erachtens relevante Verhaltensbeobachtungen in chrono-
logischer Reihenfolge. Nach Abschluss der Beobachtungsphase

(a) Freier Beobachtungsbogen (b) Kategorisierter Beobachtungsbogen (c) Checkliste

Kandidat/-in: Beobachter/-in: Kandidat/-in: Beobachter/-in:


Kandidat/-in: EM
Beobachter/-in: Kooperation:
Verhaltensindikatoren für
mangelnde Emotionale Stabilität:

Körperliche Anzeichen:
Durchsetzungsvermögen:
Auffälligkeiten in der Gestik/Mimik ____
Motorisch unruhig ____
Schwitzen ____
Zittern ____
Sonstiges:
____
Ausdrucksfähigkeit:

Sprachliche Anzeichen:
Unvollständige/falsche Sätze ____
Lautstärke zu leise/laut ____
Auffälligkeiten in der Aussprache ____
Emotionale Stabilität:
Stottern ____
Sonstiges:
____

. Abb. 2.6  Drei Grundtypen von Beobachtungsbogen


2.2 · Verhaltensbeobachtung und -beurteilung
47 2
gehen sie ihr Protokoll durch und weisen einschlägige Notizen
den zu bewertenden Eignungsmerkmalen zu. Hierfür können
beispielsweise Kürzel für die Eignungsmerkmale in die Spalte am
rechten Blattrand eingetragen werden. Die Informationen dienen
dann als Grundlage für die spätere Bewertung.
55 Die Variante (b) „kategorisierter Beobachtungsbogen“ gibt bereits
nach den relevanten Eignungsmerkmalen gegliederte Protokoll-
felder vor. Die Beobachter/-innen tragen dann bereits während
der Beobachtungsphase ihre Notizen in das Feld des einschlä-
gigen Eignungsmerkmals ein. Nach Abschluss der Beobachtung
liegen die gesammelten Informationen dann in gruppierter Form
vor und können unmittelbar zur Beurteilung herangezogen
werden.
55 Die Variante (c) „Checkliste“ setzt in reinster Form die Logik
des Zeitstichprobenansatzes um: Die Beobachter/-innen sind
hier aufgefordert, im Beobachtungsprozess (= das vorgegebene
Zeitintervall) in Form einer einfachen Strichliste zu vermerken,
wenn eine der vorgegebenen Beobachtungseinheiten (im
Beispiel: körperliche oder sprachliche Indikatoren für mangelnde
emotionale Stabilität) auftritt. Nach Abschluss der Beobachtung
liegt dann eine Häufigkeitsliste (ohne zeitliche Verortung oder
Dauer) als Grundlage für die Beurteilung vor.

Theoretische Grundannahmen zu freien und


gebundenen Beobachtungsansätzen
Die Variante (a) unterscheidet sich von den Varianten (b) und (c) Unterschiedliche
zunächst formal durch die offene Form der Protokollierung und den Beobachtungstechniken
dadurch notwendigen zusätzlichen Auswertungsschritt, bei dem die reflektieren unterschiedliche
freien Protokollnotizen vor der Beurteilung einschlägigen Eignungs- Annahmen zur Urteilsbildung
merkmalen zugewiesen werden müssen. Bei den anderen Varianten
findet direkt eine eignungsmerkmalbezogene Protokollierung statt.
Diese abweichende Vorgehensweise reflektiert ein unterschiedliches
Verständnis von eignungsdiagnostischer Urteilsbildung und bildet
direkt die Ergebnisse der Forschung zur sozialen Urteilsbildung (Fiske &
Taylor, 2013) ab:
55 Der freie Bogen der Variante (a) repräsentiert die Herangehens-
weise des sogenannten „Verhaltensbeobachtungsansatzes“
(z.B. Borman, 1978). Da Beobachtung und Beurteilung unter-
schiedliche Informationsverarbeitungsphasen zugrunde liegen
(Beobachtung: Identifikation, Wahrnehmung, Abruf und
Wiedererkennung von Informationen; Beurteilung: Katego-
risierung, Integration und Evaluation der Beobachtungen),
sollen sie möglichst strikt getrennt werden. Dies wird bei diesem
Ansatz durch eine möglichst hypothesenfreie Beobachtung, dem
zwischengeschalteten Schritt der Zuweisung und der separaten
Bewertung bewerkstelligt.
48 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

55 Die kategorisierten Bogen (b) und (c) sind Gestaltungsformen


des neueren, aus der Forschung zur beruflichen Leistungsbe-
urteilung entlehnten „Bezugsrahmenansatzes“ (z.B. Schleicher &
2 Day 1998; Gorman & Rentsch, 2009). Hier wird davon ausge-
gangen, dass dem Menschen eine hypothesenfreie Beobachtung
prinzipiell nicht möglich ist und sein Wahrnehmungssystem
originär und automatisch kategorisiert. Ziel müsse es deshalb
sein, diese automatisierten Prozesse zu kanalisieren, indem
individuelle Schemata im Idealfall durch einen geteilten Bezugs-
rahmen (hier: das vorgegebene Profil der Eignungsmerkmale)
abgelöst werden. Ein Weg ist hier die kategorisierte Form des
Bogens, der nur eignungsmerkmalrelevante Protokollierungen
ermöglicht.

Individuelle Beurteilung
Während in früheren Zeiten die eignungsmerkmalbezogene Beurtei-
lung nach jeder Übung durchaus auch in Form von freien Verbalgut-
achten erfolgte (vgl. z.B. Fisseni & Fennekels, 1995), hat sich in neueren
Anwendungen durchweg eine numerische Beurteilung durchgesetzt
(vgl. Höft, Obermann & Becker, 2014).
Urteilsbildung bei den Daten, die mit dem Ereignisstichproben- oder dem Zeitstichpro-
wissenschaftlichen benansatz gewonnen wurden, enthalten Informationen zur Häufig-
Beobachtungstechniken keit und Dauer. Um die Intensität der Eignungsmerkmalsausprägung
zu erfassen, können die Beobachtungseinheiten vorab hinsichtlich
ihrer Relevanz und Prototypizität für das Eignungsmerkmal einge-
stuft werden. Zum Beispiel ist die Beobachtungseinheit „Kandidat/-in
X hilft einem/einer anderen Kandidaten/-in“ als relevanter und kon-
zeptionell bedeutsamer für das Eignungsmerkmal „Kooperation“ ein-
zustufen als die Beobachtungseinheit „Kandidat/-in nickt bei einem
Wortbeitrag eines/r anderen Kandidaten/-in“. Durch eine gewich-
tete Aggregation der Einzelinformationen wird dann ein Gesamtwert
generiert.
Urteilsbildung in der In der eignungsdiagnostischen Praxis wird die Ausprägung der
eignungsdiagnostischen Praxis Eignungsmerkmale von den Beobachterinnen und Beobachtern nach
der Inspektion des Beobachtungsprotokolls überwiegend mithilfe von
Beurteilungsskalen taxiert. Üblicherweise werden die Protokollnoti-
zen von den Beobachterinnen und Beobachtern vor der Beurteilung
noch einmal genauer betrachtet: Beim Verhaltensbeobachtungsansatz
werden erst jetzt die Protokollnotizen zu passenden Eignungsmerk-
malen zugewiesen. Beim Bezugsrahmenansatz werden die unter den
Eignungsmerkmalen gesammelten Notizen hinsichtlich ihrer kor-
rekten Zuweisung überprüft. Die Beurteilung leitet sich dann aus der
subjektiven Gewichtung der Notizen hinsichtlich Häufigkeit („Wie
viele Male hat sich der Kandidat kooperativ verhalten?“), Dauer („Hat
die Kandidatin über den gesamten Übungsverlauf hinweg koopera-
tive Verhaltensweisen gezeigt?“) und Intensität („Wie stark waren die
gezeigten kooperativen Verhaltensweisen?“) ab. Genauere Regeln zur
2.2 · Verhaltensbeobachtung und -beurteilung
49 2
Informationsauswertung müssen ggf. von den verantwortlichen Eig-
nungsdiagnostikern/-innen aufgestellt werden.
Bei einer redundanten Beobachtung (= zwei oder mehr Beobach- DIN-Forderung: Bei einer
ter/-innen bewerten die Eignungsmerkmalsausprägung derselben redundanten Beobachtung durch
Person) wird in der DIN (2016, S. 14) gefordert, dass die Beurteilun- mehrere Beobachter/-innen sollte
gen der Beobachter zunächst unabhängig voneinander vorgenommen die Übereinstimmung festgestellt
werden. Zusätzlich sollte bei einer redundanten Beobachtung die Beob- werden
achter/-innenübereinstimmung festgehalten werden (DIN, 2016, S. 21).
Entsprechende Informationen können im Rahmen der Urteilbildung
genutzt werden. Zum Beispiel können von den verantwortlichen Eig-
nungsdiagnostiker/-innen Regeln zum Umgang mit Beurteilungsdis-
krepanzen aufgestellt werden (Beispiel: „Diskussion der Unterschiede
bei einer Abweichung von mehr als einem Notenpunkt“). Zusätzlich
können geringe Beobachter/-innenübereinstimmungskoeffizienten im
Rahmen von Verfahrensevaluationen Hinweise auf notwendigen Hand-
lungsbedarf geben.
Bei den verwendeten Beurteilungsskalen können grob zwei unter- Zwei typische Ansätze
schiedliche Ansätze unterschieden werden (vgl. Höft & Lüth, 2005, zur Gestaltung von
S. 170-172), die auch in . Abb. 2.6 noch einmal beispielhaft dargestellt Beurteilungsskalen
sind (vgl. hierzu 7 Abschn. 4.1 zur Anforderungsanalyse):

(a) Operationalisierungsansatz (b) Verhaltensverankerte Beurteilungsskala

Kandidat/-in: Beobachter/-in: Kandidat/-in: Beobachter/-in:

Kooperation: Kooperation:
+ Andere Teilnehmer (TN) unterstützt
+ Belange anderer TN berücksichtigt Unterstützt andere TN und berücksichtigt Belange anderer TN,
+ Interesse für die Situation anderer TN gezeigt 1 zeigt Interesse für die Situation anderer TN und
+ Kompromisse zwischen widerstrebenden Interessen entwickelt entwickelt kompromisse zwischen widerstrebenden Interessen

- nur eigene Interessen verfolgt


- Belange und wünsche anderer TN übergangen
- Situation anderer TN ignoriert
2
- Auf eigenem Standpunkt beharrt

Arbeitet unauffällig nach Ansprache mit anderen TN


3 zusammen, zeigt keine besondere Engagement zur
Eignungsmerkmalsbezogene Bewertung: Integration anderer

gar nicht vollständig


erfüllt erfüllt
1 -- 2 -- 3 -- 4 -- 5 -- 6 4

Verfolgt nur eigene Interessen und übergeht


5 Belange und Wünsche anderer TN, ignoriert Situation
anderer TN und beharrt auf eigenem Standpunkt

. Abb. 2.7  Beispiele für numerische Urteile (Operationalisierungsansatz und verhaltensverankerte Beurteilungsskalen)
50 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

55 Beim Operationalisierungsansatz wird vor der Globalbeurteilung


des Eignungsmerkmals die Erfüllung von Teilaspekten des
Merkmals beurteilt (im Beispiel a in . Abb. 2.7 sind es vier
2 positive und vier negative Aspekte). Dafür werden häufig die
verhaltensnahen Operationalisierungen verwendet. Allgemeine
Verbalanker mit Bezug auf die Merkmalserfüllung (in . Abb. 2.7
die „Eignungsmerkmalsbezogene Bewertung“ von „>gar nicht<
… bis … >vollständig< erfüllt“ auf einer 6er-Skala) dienen als
Orientierung für die Beurteilung durch die Beobachter/-innen.
55 Bei einer verhaltensverankerten Beurteilungsskala werden
die einzelnen Notenabstufungen durch Verhaltensbeispiele
beschrieben, die graduelle Unterschiede zwischen den Noten
verdeutlichen (im Beispiel b in . Abb. 2.7 eine 5er-Skala mit drei
verbalen Verankerungen). Als Referenz für die Verhaltensanker
dient der absolute Erfüllungsgrad des Eignungsmerkmals, der
letztlich von der verantwortlichen Eignungsdiagnostikerin/dem
verantwortlichen Eignungsdiagnostiker auf der Basis der Ergeb-
nisse der Anforderungsanalyse definiert wird.

Beide Varianten erfüllen die von der DIN geforderte verhaltensbezo-


gene Konkretisierung der Eignungsmerkmale (DIN, 2016, S. 14).
Messtheoretisch gesehen werden hier Daten generiert, die maximal
Ordinalinformationen enthalten (höherer numerischer Wert = stärkere
Ausprägung des Eignungsmerkmals). Häufig wird dieses aber miss-
achtet, indem im weiteren Verlauf der Urteilsbildung z.B. Mittelwerte
gebildet werden.

Integration der Einzelurteile


Gängige Varianten zur Integration Nach Abschluss aller Verfahren erfolgt eine Zusammenführung der
der Einzelurteile Einzelergebnisse, häufig wird ein Gesamturteil gebildet („Einstellung
- ja/nein“, „Aufnahme in das Förderprogramm - ja/nein“ usw.). Neben
den Verfahren zur Verhaltensbeobachtung und -beurteilung finden
hierbei auch alle anderen eingesetzten Verfahren Berücksichtigung.
Die Festlegung der Regeln für die Ergebnisinterpretation kann nicht
an Beobachter/-innen delegiert werden (DIN, 2016, S. 10). Beobach-
ter/-innen sind aber häufig am Prozess der endgültigen Urteilsbildung
beteiligt, deshalb sollen die in der Praxis anzutreffenden Formen der
Urteilsfindung kurz angesprochen werden. Insgesamt können drei Ent-
scheidungsstrategien unterschieden werden (siehe hierzu auch die Aus-
führungen zur sogenannten „mechanischen oder statistischen Urteils-
bildung“ in 7 Kap. 6):
55 Gemeinsame Urteilsfindung in einer Beobachter/-innen-
konferenz: Alle Kandidatinnen und Kandidaten werden einzeln
anhand ihrer Befundlage diskutiert, und es wird ein Konsens-
urteil getroffen.
55 Urteilsbildung durch Verrechnung: Hier werden die Einzelurteile
mithilfe einer statistischen Funktion (einfache Mittelwertbildung
2.2 · Verhaltensbeobachtung und -beurteilung
51 2
oder komplexere Linearkombinationen) zu einem Gesamturteil
zusammengefasst. Eine separate Diskussion findet nicht statt.
55 Gemischter Ansatz: Hier wird die Urteilsbildung durch
Verrechnung z.B. als Ausgangspunkt für eine Diskussion in der
Beobachter/-innenkonferenz genommen. Die durch die statis-
tische Funktion vorgeschlagene Einordnung kann über Einzelfall-
entscheidungen korrigiert werden.

2.2.4 Weitere Aufgaben der Beobachter/-innen

Es sei an dieser Stelle nur kurz darauf hingewiesen, dass das Aufgaben- In der eignungsdiagnostischen
feld von Beobachterinnen und Beobachtern in vielen Anwendungs- Praxis geht das
fällen über die Verhaltensbeobachtung und -beurteilung hinausgeht. Aufgabenspektrum der
In der eignungsdiagnostischen Praxis wird beispielsweise das Feed- Beobachter/-innen häufig über
back der eignungsdiagnostischen Ergebnisse häufig von Beobachter/- die Verhaltensbeobachtung und
innen übernommen. Da als Beobachter/-innen neben externen Bera- -beurteilung hinaus
ter/-innen und Mitarbeiter/-innen der Personalabteilung (vgl. Höft
et al., 2014) häufig Führungskräfte aus der Organisation dienen, hat
dieses eine Doppelfunktion: Zum einen hat sich gezeigt, dass gerade
Feedback von organisationsinternen Entscheidungsträgern/-innen von
Kandidaten/-innen eher akzeptiert wird. Infolge kann die Motivation,
Entwicklungsmaßnahmen gemäß des Feedbacks anzugehen, steigen
(vgl. Thornton, Rupp & Hoffman, 2014). Zum anderen stellt die Feed-
backrolle eine Personalentwicklung für die Führungskraft dar. Durch
die Partizipation wird außerdem die Identifikation mit der getroffenen
Personalentscheidung erhöht.

2.2.5 Fehler bei der Beobachtung und Beurteilung

Die Verhaltensbeobachtung und -beurteilung erfolgt nicht durch Denken in Kategorien


Maschinen, sondern durch Menschen. Bei der menschlichen Infor- und Schemata: Im Alltag
mationsaufnahme und -verarbeitung können sich bestimmte Effekte lebensnotwendig, im Kontext der
ergeben, beispielsweise kann sich ein Sympathieeffekt auf das Urteil Eignungsbeurteilung jedoch eine
auswirken. In diesem Kontext wird in der DIN 33430, wie in der mögliche Fehlerquelle
Praxis, häufig von Beobachtungs- und/oder Beurteilungsfehlern
gesprochen. Wir übernehmen diese Begrifflichkeit, obwohl das
Wort „Fehler“ falsche Assoziationen weckt und das Verständnis
dafür erschwert, dass Menschen Informationen grundsätzlich in
Kategorien und Schemata gruppieren: Die besondere Art, wie wir
Menschen andere Menschen sozial wahrnehmen und Urteile über
Menschen bilden, ist per se kein Fehler oder Defizit, sondern ermög-
licht es, Komplexität rasch und mühelos zu bewältigen. Menschen
orientieren sich immer wieder an vertrauten Mustern und verein-
fachen damit die Welt. Die menschliche Informationsverarbeitung
arbeitet im überwiegenden Maße mit automatisierten Prozessen.
Dies ist in vielen Alltagssituationen hilfreich. Bei der Beobachtung
52 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

und Beurteilung von Menschen kann die menschliche Art zu denken


aber zu unerwünschten Effekten führen, so dass es mit Blick auf das
Ergebnis zulässig erscheint, in diesem Zusammenhang von einem
2 „Fehler“ zu sprechen.
Verhaltensbeobachtung und In . Abb. 2.8 wird der im Weiteren beschriebene Prozess der Ver-
-beurteilung sowie mögliche haltensbeobachtung und -beurteilung genauer aufgeschlüsselt. In die
Fehlerquellen Darstellung fließen unterschiedliche Modellansätze, u.a. von DeNisi,
Cafferty und Meglino (1984) sowie Höft und Funke (2006) ein.

Entwicklung der Handhabungshinweise mit allen Ablaufplänen,


Beobachtungs-/Bewertungsbogen, Untersuchungsmaterialien usw.

Beobachtungsumfeld

Situation

Gezeigtes Verhalten

Rezeption der Informationen


mit Vorverarbeitung und Kategorisierung

Aufgabe der Beobachter/-innen

Speicherung der Informationen

Enkodierung im Gedächtnis
Begleitende
Protokollierung
der Beobachtungen Kurzzeit Langzeit

Zuordnung und Bewertung der erfassten Informationen


in Bezug auf die zu diagnostizierenden Eignungsmerkmale

Kommunikation und Zusammenführung der Bewertungen


(z.B. in Form eines Gesamturteils)

. Abb. 2.8  Detailablauf einer Verhaltensbeobachtung und -beurteilung mit einer Markierung möglicher Fehlerquellen (1-8)
2.2 · Verhaltensbeobachtung und -beurteilung
53 2
Zunächst sollen die unterschiedlichen Fehlerarten im Beobach-
tungs- und Beurteilungsprozess zusammen mit möglichen Gegen-
maßnahmen stichwortartig beschrieben werden. Danach wird noch
einmal gesondert auf mögliche Beobachter/-innentrainingsmethoden
eingegangen.

Fehlereinflüsse und mögliche Gegenmaßnahme


Möglichen Fehlerquellen (eine Sammlung aus unterschiedlichen Auf-
stellungen, u.a. aus Kanning, Hofer & Schulze Willbrenning, 2004;
Spinath & Becker, 2011; Stemmler & Margraf-Stiksrud, 2015 usw.)
werden in . Abb. 2.8 mithilfe von Ziffern (von 1 bis 8) verortet.

z Fehlerquelle 1: Fehler zu Lasten des Beobachtungssystems


Bereits im Vorfeld der eigentlichen Beobachtung können Fehler bei der Fehlerquelle:
Konstruktion des Beobachtungssystems eine gültige Eignungsbeurtei- Beobachtungssystem
lung behindern. Hierzu zählen z.B.:
55 Inhomogene und/oder konzeptionell zu stark überlappende
Eignungsmerkmale führen dazu, dass die Beobachter/-innen
von vornherein nicht in der Lage sind, Verhaltensindikatoren
eindeutig zuzuordnen oder Beurteilungen stringent abzuleiten.
55 Unzureichende Operationalisierung der zu erfassenden Eignungs-
merkmale verleiten Beobachter/-innen dazu, ohne Anleitung und
Absprachen Verhaltensindikatoren selbst zu definieren.
55 Fehler bei der Planung und Ausgestaltung der Beobachtungs- und
Beurteilungsinstrumente können den eigentlichen Arbeits-
prozess unnötig erschweren oder den Aufmerksamkeitsfokus der
Beobachter/-innen falsch lenken.

Gegenmaßnahmen liegen hier in einer sorgfältigen und ausführlichen


Konstruktion mit einer ausführlichen Vorerprobung sowie einer schnel-
len Korrektur bei identifizierten Schwächen im Regelbetrieb.

z Fehlerquelle 2: Fehler zu Lasten des Beobachtungsumfeldes


Unter diesem Punkt werden eher profanere (aber möglicherweise fatale) Fehlerquelle:
Fehlereinflüsse bei der Verfahrensdurchführung zusammengefasst, z.B.: Beobachtungsumfeld
55 Schlechter Blickwinkel und schlechte Lichtverhältnisse beein-
trächtigen die Beobachtbarkeit des Verhaltens der Kandidatinnen
und Kandidaten für die Beobachter/-innen.
55 Störungen im Verfahrensablauf, wie z.B. Unterbrechungen
durch Dritte, bringen den regulären Ablauf durcheinander und
erschweren die Vergleichbarkeit zwischen den Kandidatinnen
und Kandidaten.
55 Technische Störungen bei Video- und/oder Tonaufzeichnungen
verhindern eine reguläre Auswertung.

Gegenmaßnahmen liegen in einer doppelt abgesicherten Vorbereitung,


Bereithaltung von Rückfallalternativen und Gelassenheit.
54 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

z Fehlerquelle 3: Situationsbedingte Fehler


Fehlerquelle: Situation Hierzu gehören Fehler, die durch mängelbehaftete Verfahren zur Ver-
haltensbeobachtung verursacht werden, z.B.:
2 55 Das Verfahren bietet zu wenige Beobachtungsgelegenheiten zu
möglichen eignungsmerkmalsrelevanten Verhaltensindikatoren.
Zum Beispiel können in einer Gruppendiskussion üblicherweise
deutlich schlechter Verhaltensindikatoren für erhöhten Stress
einer Person beobachtet werden als in einem Rollenspiel mit einer
Konfliktsituation.
55 Ein unkontrolliert-dynamischer Verfahrensverlauf erschwert die
Beobachtung und reduziert die Vergleichbarkeit, prototypisch zu
sehen bei einer Gruppendiskussion.

Gegenmaßnahmen sind eine sorgfältige Verfahrenskonstruktion, bei


der die Aktivierung des Eignungsmerkmals über das Verfahren hinweg
überprüft und systematisch manipuliert wird. Dynamisch verlaufende
Verfahren werden durch kontrollierte Interventionen (z.B. plötzliche
Sondernachrichten, die eine Neuorientierung verlangen) zumindest
beeinflusst.

z Fehlerquelle 4: Kandidatinnen- und kandidatenbedingte


Fehler
Fehlerquelle: Manchmal verhält sich die beobachtete Person nicht so, wie es eigent-
Kandidaten/-innenverhalten lich vorgesehen ist, z.B.:
55 Eine falsche Situationsinterpretation führt zu einem für die
Person nicht-repräsentativem Verhalten.
55 Die Person setzt intensiv Selbstdarstellungstechniken (7 Exkurs
„Selbstdarstellungstechniken“) ein.

Gegenmaßnahmen: Die Situationsinterpretation sollte bereits im


Vorfeld geprüft werden, z.B. in einer sorgfältigen Vorerprobung des
Verfahrens (inklusive Instruktionsvorgabe) mit einer Befragung der
Probe-Teilnehmer/-innen. Im laufenden AC-Verfahren kann ggf. das
auffällige Verhalten noch einmal in einem anschließenden Interview
hinterfragt werden.

Exkurs

Selbstdarstellungstechniken
Viele wissenschaftliche Arbeiten zum Interaktionspartnern (hier: die 16 Selbstdarstellungstaktiken
Thema Selbstdarstellungstechniken Beobachter/-innen) hervorrufen bei Verfahren der
greifen auf das sozialpsychologische möchte. Verhaltensbeobachtung und
Konzept des „Impression McFarland, Yun, Harold, Viera und -beurteilung vor, die zunächst grob
Management“ (IM) zurück (z.B. Moore (2005) stellen, orientiert in selbstförderliche Techniken (= ein
Mummendy & Bolten, 1985). an ähnlichen Untersuchungen Bild von sich wird aktiv konstruiert),
Dieser Begriff beschreibt die aktive zur Eindrucksbildung im defensive Techniken (= Reaktionen
Einflussnahme des Akteurs auf Interview (7 Kap. 3), ein auf eine wahrgenommene,
den Eindruck, den er bei seinen Kategoriensystem mit insgesamt angenommene oder tatsächliche
2.2 · Verhaltensbeobachtung und -beurteilung
55 2

Gefährdung des aufgebauten sind auch Bestandteil von Als Gegenmaßnahmen bietet
Images) und nonverbale Taktiken Führungsverhalten), ergaben sich auf sich an, die Beobachtbarkeit
(= Lächeln, zugewandte Gestik, der Verhaltensebene in Übungen, aller als relevant angesehenen
aktiv aufgesuchter Blickkontakt die eine Interaktion vorsahen, Eignungsmerkmale in den
usw.) unterschieden werden. Bei zum Teil erwartungskonform ausgewählten Verfahren anhand
den selbstförderlichen Techniken Zusammenhänge zwischen einschlägiger Verhaltensäußerungen
wird zusätzlich zwischen auf Selbstdarstellungstechniken und kritisch zu prüfen. Im Beobachter/-
andere Personen bezogenen den eigentlich zu erfassenden innentraining müssen zudem die
und selbstbezogenen Taktiken Eignungsmerkmalen. Wenn das konzeptionellen Überlappungen
unterschieden. . Abb. 2.9 gibt eingesetzte Verfahren allerdings nur von Selbstdarstellungstechniken
einen Überblick zur Einteilung und wenige Beobachtungsmöglichkeiten mit den Eignungsmerkmalen
listet beispielhafte Einzeltaktiken auf. für ein vorgegebenes diskutiert werden. So sind geäußerte
McFarland et al. (2005) sowie Eignungsmerkmal bietet, besteht Höflichkeitsfloskeln in einer
Klehe, Kleinmann, Nieß und Grazi die konkrete Gefahr, dass sich Gruppendiskussion („Ja, ich verstehe
(2014) konnten zeigen, dass die die Beobachter/-innen im Sinne Sie“, „Ist jeder der Anwesenden mit
Anzahl und Art der eingesetzten eines klassischen Halo-Fehlers meinem Vorschlag einverstanden?“)
Selbstdarstellungstechniken an der Beurteilung der gut zu zwar Indikatoren von Kooperation,
je nach Verfahren variieren. Da beurteilenden Merkmale orientieren. es sind aber im Vergleich
einige Verhaltensweisen sowohl Bei einem Rollenspiel kann dann zu substanziellen Beiträgen
Indikatoren für Selbstdarstellung möglicherweise ein eloquentes (wie eine situationsadäquate
als auch für Eignungsmerkmale Auftreten mit einer ausgeprägten aktive Hilfestellung für andere
sind (anderen zugewandtes Selbstvermarktung als Anzeichen Kandidatinnen und Kandidaten
Verhalten ist beispielsweise auch von guter Planung/Koordination/ oder eine offene Information zum
eine Facette von Kooperation, Delegation usw. missdeutet werden eigenen Status) sehr schwache
Selbstvermarktungstendenzen (vgl. Höft, 2011). Indikatoren.

Überhöhung des Anderen


Andere Personen intensiv loben und
Auf andere deren stärken betonen, konform gehen
bezogen mit Gegenüber
Selbstförderliche ...
Taktiken
Versuch, aktiv ein Bild von sich
Eigenwerbung
aufzubauen Selbst- Hinweis, dass man selbst
bezogen wünschenswerte Qualitäten aufweist
(Kompetenzen, Gewissenhaftigkeit usw.)
...

Abglanz mitnehmen
verbal Eigenes Image verbessern, indem auf
die bestehende Verbindung mit einer
populären oder einflussreichen
Persönlichkeit hingewiesen wird
Defensive Taktiken
Selbstdarstellungs- Reaktion auf eine wahr-
taktiken genommene, angenommene Ausflüchte, Entschuldungen
bei verfahren der oder tatsächliche Gefährdung Eigene Verantwortung für negative
Verhaltensbeobachtung des eigenen Images Konsequenzen einer Handlung werden
und -beurteilung abgestritten

...

Lächeln, Gestik, Blickkontakt, Rechtfertigung


nonverbal kopfnicken, Händeschütteln Verantwortlichkeit für eigenes Handeln
wird übernommen, negative
Implikationen aber abgelehnt

. Abb. 2.9  Selbstdarstellungstechniken bei Verhaltensübungen (verkürzt nach McFarland et al., 2005, mit freundlicher
Genehmigung von John Wiley and Sons)
56 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

z Fehlerquelle 5: Beobachter/-innenbedingte Fehler bei der


Rezeption der Informationen
Fehlerquelle: Zu den ersten, direkt der Person der Beobachterin/des Beobachters
2 Informationsaufnahme zuzuordnenden Fehlern gehören Verzerrungen, die bereits bei der
Informationsaufnahme stattfinden können, z.B.:
55 Mehrdeutige Reize werden erfahrungs- oder einstellungsgeleitet
wahrgenommen.
55 Konsistenzeffekte umschreiben die Tendenz, Urteile und
Meinungen möglichst widerspruchsfrei zu bilden. Hierzu gehört
auch der Primacy-Effekt: Erste aufgenommene Informationen
dienen danach als Anker für alle weiteren Wahrnehmungen.
55 Beobachter/-innenerwartungseffekte (Rosenthal-/Pygmalion-
Effekt) können durch Vorinformationen ausgelöst werden, die zu
einer hypothesengefilterten Wahrnehmung und Informations-
bewertung führen.
55 Besondere emotionale Beteiligung und Sympathie/Antipathie
zur Kandidatin/zum Kandidaten können die Wahrnehmung und
Beurteilung verzerren.

Die genannten Effekte bei der Rezeption von Informationen wirken sich
auch auf die Erinnerung von Informationen aus (siehe unten). Daher
sind bestimmte Effekte wie der Primacy-Effekt mehreren Kategorien
zugeordnet.

z Fehlerquelle 6: Beobachter/-innenbedingte Fehler bei der


Erinnerung
Fehlerquelle: Erinnerung Fehler aus dieser Gruppe sollten besonders anfallen, wenn eine Proto-
kollierung der Beobachtung erst zeitlich nachgelagert vorgenommen
wird oder – entgegen den Vorgaben – gar nicht, zu wenig oder verhal-
tensfern protokolliert wird.
55 Frühe (= Primacy-Effekt) und späte (= Recency-Effekt)
Informationen haben zunächst einen Erinnerungsvorteil. Der
Primacy-Effekt ist dabei zeitstabil, während der Recency-Effekt
nur bei einem unmittelbar an die Beobachtung anschließenden
Informationsabruf wirkt.
55 Erinnerungsverzerrungen können auch durch die Einbettung in
bestehende Wissensstrukturen entstehen (hier können sowohl
Konsistenz- als auch Kontrasteffekte entstehen).
55 Der Rückschaufehler („knew-it-all-along“, „hindsight bias“)
beschreibt die Tendenz, sich falsch an eigene frühere Vorhersagen
zu erinnern und diese näher bei den späteren Resultaten zu
verorten.
55 Häufigkeits-Validitäts-Fehler („conventional wisdom“)
beschreiben die Tendenz, bestimmte Behauptungen bevorzugt
aus dem Gedächtnis abzurufen zu können und dann als wahr
anzusehen nur, weil sie vorher immer wieder wiederholt
werden.
2.2 · Verhaltensbeobachtung und -beurteilung
57 2
z Fehlerquelle 7: Beobachter/-innenbedingte Fehler bei der
Beurteilung
Hierunter fallen alle Fehler, die direkten Einfluss auf das (numerische) Fehlerquelle: individuelle
Urteil haben, z.B.: Urteilsbildung
55 Anker-/Kontrasteffekte können auftreten, wenn das Urteil zu
einer vorher beobachteten (und nicht repräsentativen) Person als
Bezugspunkt für alle weiteren Beurteilungen dient.
55 Der Halo-Effekt beschreibt die Tendenz, Urteile in Abhängigkeit
von einem besonders hervorstechenden Merkmal zu bilden, das
die anderen Eignungsmerkmale überstrahlt.
55 Beobachter/-innen mit einer Tendenz zur sozialen Erwünschtheit
orientieren sich bei ihrer Beurteilung an anderen, als wichtig
erachteten Beobachter/-innen (situational) oder an antizipierten
allgemeinen Verhaltenserwartungen (kulturell).
55 Logische/theoretische Fehler treten auf, wenn impliziten
Persönlichkeitstheorien (klassisches Beispiel „Brillenträger sind
intelligent“) wirken.
55 „Observer drift“ beschreibt die Veränderung der Bewertungsstan-
dards über die Zeit. Bei der Spezialform des „consensual drift“
tritt eine gleichförmige Veränderung des Beurteilungsstandards
(z.B. Strenge, Milde) über alle Beobachter/-innen hinweg auf (die
resultierende hohe Beobachter/-innenübereinstimmung ist in
diesem Fall kein Indikator für Qualität).
55 Kulturabhängige Beurteilungen liegen vor, wenn von den
Beobachtern/-innen zur Einordnung und Bewertung des
beobachteten Verhaltens nur die für die vorherrschende
Kultur (definiert durch die ethnische Majorität, durch eine
Geschlechtsgruppe, eine bevorzugte Altersgruppe o.ä.) typischen
Verhaltensmuster herangezogen werden. Antworten, die nicht in
dieses vorherrschende Schema passen, werden dann abgewertet
(s. Kersting & Ott, 2015)
55 Bei der Verwendung numerischer Skalen kann es zu einer
Antworttendenz kommen, z.B. nur Anwahl von mittleren Werten
(Tendenz zur Mitte), besonders gute oder schlechte Beurteilungen
(Milde-/Strengeeffekt) oder die Bevorzugung der Extreme.

z Fehlerquelle 8: Beobachter/-innenbedingte Fehler bei der


Kommunikation und Integration der Einzelbeurteilungen
In die letzte Kategorie fallen Fehler, die sich bei der Integration der Fehlerquelle: Kommunikation
Einzelbeurteilungen sowie bei der Kommunikation der Beurteilungen und Integration der
ergeben, z.B.: Einzelbeurteilungen
55 Im Rahmen von Beobachter/-innenkonferenzen kann der
Effekt auftreten, dass ein/e Beobachter/-in ihre/seine geäußerte
Meinung aufgrund eines wahrgenommenen Konformitätsdrucks
an die einer Referenzperson angleicht. Plausibel ist, dass dieses
bevorzugt bei Beobachter/-innen der Fall sein wird, die über
58 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

wenig Beobachtungserfahrung verfügen und/oder auf organisa-


tionshierarchisch niedrigerer Stufe stehen.
55 Unsystematische und frei wechselnde Vorgehensweisen bei der
2 Entscheidungsfindung und der Ableitung des Gesamturteils
führen in der Konsequenz zu fehlerbehafteten Ergebnissen.

Gegenmaßnahmen zu den beobachter/-innenbedingten Fehlerquel-


len 5 bis 8 bestehen darin, zu prüfen, ob es Konstruktionsfehler bei
Elementen der Handhabungshinweise (z.B. unzureichende Festlegung
von Vorgehensweisen und Auswertungsregeln) gibt, die man korrigie-
ren kann. Auch das Verhalten der Person, die das Verfahren der Verhal-
tensbeobachtung und -beurteilung moderiert, kann zur Eindämmung
von bestimmten Fehlern beitragen, da es Aufgabe der Moderation ist,
bei Regelverstößen zu intervenieren. Im Fokus steht aber die Qualifi-
kation der Beobachter/-innen, die durch eine geeignete Auswahl und
ein Training gewährleistet werden muss.

2.2.6 Trainingstechniken für Beobachter/-innen

Beobachter/-innen müssen dem Text der DIN (2016, S. 24-25) zufolge


Kenntnisse über Eignungsbeurteilungen besitzen, die in der konkreten
Eignungsbeurteilung eine Rolle spielen, an der die Beobachter/-innen
beteiligt sind. Die einzelnen Themenbereiche, über die Beobachter/-in-
nen Bescheid wissen müssen, werden in der DIN (ebd.) explizit genannt.
Alle diesbezüglichen Themen wurden in dem vorliegenden Kapitel
behandelt, und viele der Aspekte werden in Beobachter/-innentrainings
standardmäßig als Pflichtelemente erfasst (vgl. Höft & ­Melchers, 2010).
Trainingsformen nach Woehr und Zur Effektivität spezifischer Beobachter/-innen-Trainingstechniken
Huffcutt hat sich die Metanaanalyse von Woehr und Huffcutt (1994) als wichtige
Referenzarbeit erwiesen (bestätigende Befunde finden sich bei Roch,
Woehr, Mishra & Kieszczynska, 2012). Nach einer Literaturrecherche
konnten die Autoren vier Trainingsformen unterscheiden (die folgende
Darstellung folgt Höft & Funke, 2006, S. 169):
55 Beurteilungsfehlertraining: Der Schwerpunkt dieses
Trainingstyps liegt auf der Sensibilisierung der Beobachter/-
innen für typische Beurteilungsfehler (Mildeeffekte, Halo-Fehler,
Tendenz zur Mitte, Kontrastfehler usw.).
55 Training zur Verwendung von Beurteilungsdimensionen
(Eignungsmerkmale): Hier wird die Identifikation von beurtei-
lungsrelevanten Informationen und die korrekte Zuweisung von
Einzelinformationen (z.B. Verhalten im Sinne der Verhaltensanker)
zur einschlägigsten Dimension (Eignungsmerkmal) trainiert.
55 Verhaltensbeobachtungstraining: Trainings dieses Typs legen
besonderen Wert auf die Trennung von Beobachtung und
Bewertung, indem z.B. besonderer Wert auf die Protokollierungs-
technik der Beobachtungen und die zeitliche Abtrennung der
Bewertung gelegt wird. Sie bilden damit die Grundannahmen des
2.2 · Verhaltensbeobachtung und -beurteilung
59 2
„Verhaltensbeobachtungsansatzes“
(7 Abschn. 2.3.8) ab.
55 Bezugsrahmentraining: Bei dieser Trainingsart wird im Sinne des
gleichnamigen Ansatzes (7 Abschn. 2.3.8) anhand von konkreten
Beispielen und Aufgaben die Verwendung der Beurteilungs-
dimensionen (Eignungsmerkmale) eingeübt. Unterschiedliche
Ausprägungsgrade werden über entsprechende prototypische
Verhaltensweisen dargestellt. Im Kontrast zum „Training zur
Verwendung von Beurteilungsdimensionen“ liegt hier der
besondere Schwerpunkt auf der Vermittlung von allgemeinen
Beurteilungsstandards, die von den Beobachtern akzeptiert und
gemeinschaftlich angewendet werden sollen.

In . Tab. 2.5 werden einige typische Elemente von Verhaltensbeob- Mögliche Ausgestaltungen von
achtungs- und Bezugsrahmentrainings skizziert (angelehnt an Höft & Verhaltensbeobachtungs- und
Melchers, 2010). Bezugsrahmentrainings

. Tab. 2.5  Elemente unterschiedlicher Formen von Beobachter/-innentrainings

Trainingselemente im Rahmen eines Verhaltensbeobachtungstrainings


Schritt 1: Information zur – Hinweis und Erläuterung zur Bedeutung einer umfassenden und möglichst verhaltens-
Protokollierung von Ver- bezogenen Protokollierung
haltensbeobachtungen – Übersicht zu und Erläuterung von möglichen Beobachtungsfehler
– Verdeutlichung verhaltensbezogener Notizen (= beschreiben, was jemand genau
macht) anstelle von persönlichkeitsbezogenen („sie ist zurückhaltend“) oder bewer-
tenden („konstruktiver Beitrag“) Notizen
– Üben von verhaltensnaher Protokollierung mithilfe von kleinen Beobachtungssequenzen
Schritt 2: Zuweisung von – Erläuterung der Eignungsmerkmale
Verhalten zu Eignungs- – Veranschaulichung der Zuordnung der notierten Verhaltensbeobachtungen zu den
merkmalen Eignungsmerkmalen
– Üben der Protokollsatzzuordnung zu Eignungsmerkmalen mithilfe von Videobeispie-
len oder Rollenspielsequenzen
Schritt 3: Ableitung der – Darstellung und Diskussion der Ableitung der Beurteilung auf Basis der den Eignungs-
Verhaltensbeurteilung merkmalen zugeordneten Verhaltensbeobachtungen
– Üben der Verhaltensbeurteilung anhand von Beispielen
Trainingselemente eines Bezugsrahmentrainings
Schritt 1: Verhaltensnahe – Verhaltensnahe Konkretisierung und Unterscheidung der Eignungsmerkmale
Operationalisierung und – Üben der Zuordnung von Verhaltensbeispielen zu den Eignungsmerkmalen mithilfe
Abgrenzung der Eig- beispielhafter Verhaltensprotokollierungen
nungsmerkmale
Schritt 2: Vermittlung – Veranschaulichung und Diskussion von im Sinne der Eignungsmerkmale guten, durch-
eines gemeinsamen Be- schnittlichen oder verbesserungsfähigen Verhaltensweisen
urteilungsmaßstabs – Beispielhafte Gruppierung von Verhaltensbeispielen zu unterschiedlichen Leistungs-
niveaus und selbstständige Übung der Trainingsteilnehmer/-innen
– Darstellung der Urteilsableitung aus klassifizierten Verhaltensbeobachtungen
Schritt 3: Üben von Ver- – Probebeurteilung(en) von Teilnehmer/-innen (mithilfe von Videobeispielen oder im
haltensbeurteilungen Rahmen eines Rollenspiels mit anderen vorab instruierten Trainingsteilnehmer/-innen)
– Vergleich der eigenen Beurteilungen mit Experten/-innenurteilen und Diskussion der
aufgetretenen Abweichungen
60 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Die Ergebnisse von Woehr und Huffcutt (1994) zeigen, dass Verhal-
tensbeobachtungs- und Bezugsrahmenstrainings im Vergleich zu den
anderen beiden Trainingsschwerpunkten eine deutlichere Verbesserung
2 der Akkuratheit der Beobachter/-innenurteile bewirken. Experimen-
telle Studien zum direkten Vergleich beider Methodiken zeigten leichte
Vorteile (im Sinne einer besseren Akkuratheit der Urteile) des bezugs-
rahmenorientierten Ansatzes (vgl. Lievens, 2001), allerdings treten hier
auch Verzerrungen bei der Protokollierung auf (vgl. hierzu auch Roch
et al., 2012). Da sich beide Techniken im Grundansatz wiedersprechen
(7 Abschn. 3.2.3) empfehlen Woehr und Huffcutt (1994) eher die Strate-
gie, einen dieser Trainingsansätze mit dem zusätzlichen Beurteilungs-
fehlertraining zu verknüpfen, um somit einen kombinierten Effekt zu
erzielen. Bei letzterem Training müsse aber sorgfältig auf die Gültig-
keit der an die Beobachter/-innen gegebenen Empfehlungen geach-
tet werden, da falsche, weil zu vereinfachende Zielvorgaben (7 Exkurs
„Falsche Hinweise in einem Beurteilungsfehlertraining“) hier sogar zu einer
Verschlechterung der Beobachter/-innenleistungen führen könnten.

Exkurs

Falsche Hinweise in einem Beurteilungsfehlertraining


Zwei irreführende Hinweise in einem Faustregel für eine konkrete 44 „Um einen Halo-Fehler zu
Beurteilungsfehlertraining wären Situation formuliert werden. vermeiden, achten Sie bitte
beispielsweise: So müssen durchweg schlechte darauf, nicht durchweg hohe oder
44 „Beurteilungen zu einem Kandidatinnen und Kandidaten niedrige Werte zu vergeben.“
Eignungsmerkmal verteilen in einem konkreten Verfahren Hier bleibt unberücksichtigt, dass
sich annähernd normalverteilt zur Verhaltensbeobachtung beispielsweise wenig trennscharf
mit vielen Ergebnissen im und -beurteilung negative definierte und operationa-
Mittelbereich und selteneren, Ergebnisse erhalten. Ebenso lisierte Eignungsmerkmale
deutlich negativen und positiven kann es in einem konkreten im Beurteilungsprozess zu
Ausreißern. Achten Sie bei Ihrem Verfahren durch eine für Doppelzuweisungen von
Bewertungsverhalten darauf.“ die Zielgruppe zu leichte Verhaltensbeobachtungen
Entsprechende Problemsituation oder bei und damit zu „echten“
Konvergenzeffekte treten leicht zu erfüllenden Kriterien Zusammenhängen (dem
nur bei großen Stichproben einer verhaltensverankerten sogenannten „true halo“)
und einer Aggregation (z.B. Beurteilungsskala (. Abb. 2.7) führen können. Es liegt also
Mittelwertbildung) von zu einer Häufung von ein Konstruktions- und kein
unabhängig erhobenen Positivurteilen kommen. Beobachtungsfehler vor.
Urteilen auf. Daraus kann keine

2.2.7 Fazit

In diesem Kapitel wurde zunächst erläutert, was ein Anforderungsprofil


ist und welche Anforderungen es erfüllen muss (Operationalisierung
der Eignungsmerkmale).
Im zweiten Abschnitt wurden wesentliche Informationen
zusammengefasst, die im Sinne der DIN 33430 bei einer der Kons-
truktion, Durchführung und Auswertung von Verfahren zur
2.2 · Verhaltensbeobachtung und -beurteilung
61 2
Verhaltensbeobachtung und -beurteilung im Rahmen der Eignungs-
diagnostik zu beachten sind. Damit standen zwei Zielgruppen im Vor-
dergrund: Verfahrensverantwortliche Eignungsdiagnostiker/-innen,
die entsprechende Prozesse planen, umsetzen und betreuen, und Beob-
achter/-innen, die als Verfahrensbeteiligte entsprechende Verhaltens-
beobachtungen und -beurteilungen durchführen.
Die Darstellung hat gezeigt, dass die berufliche Eignungsdiagnostik
in Fortführung der wissenschaftlichen Grundtechniken eigene „praxis-
taugliche“ Ausgestaltungen der Verhaltensbeobachtung und -bewer-
tung entwickelt hat. Die DIN (2016) gibt eine wichtige Orientierung für
die konkrete Ausgestaltung. Verdeutlicht wurde zusätzlich, dass unter-
schiedliche Umsetzungsformen der Beobachtung mit verschiedenen
Prozesstheorien zur Informationsverarbeitung verbunden sind.
Im letzten Abschnitt wurden mögliche verzerrende Einflüsse bei der
Beobachtung und Beurteilung dargestellt und geeignete Gegenmaß-
nahmen diskutiert. Eine wichtige Rolle übernehmen dabei Schulungs-
techniken für die Beobachter/-innen. Hierzu wurden die zwei wichtigs-
ten Techniken (Verhaltensbeobachtungs- und Bezugsrahmentraining)
genauer dargestellt.

? Kontrollfragen
1. Sie möchten im Rahmen einer arbeitsanalytischen Studie (=
keine eignungsdiagnostische Anwendung) das Interaktions-
verhalten von Bankkaufleuten im Filialbetrieb beim
Umgang mit Kunden beobachten. Skizzieren Sie mögliche
Beobachtungsausgestaltungen gemäß . Tab. 2.1.
2. In vielen Anforderungsprofilen findet sich das
Eignungsmerkmal „Belastbarkeit“. Konkretisieren Sie diese
Dimension auf der Ebene der verhaltensnahen Operationali-
sierungen und führen Sie beispielhafte konkrete Verhaltens-
beobachtungen an.
3. Sie möchten das Eignungsmerkmal „Durchsetzungsfähigkeit“
mithilfe eines Verfahrens zur Verhaltensbeobachtung
und -bewertung erfassen. Entwerfen Sie erste Skizzen für
mögliche Szenarios sowie einen passenden Beobachtungs-
und Bewertungsbogen für die Umsetzung in zwei
unterschiedlichen Verfahrenstypen (. Tab. 2.2).
4. Was ist ein Halo-Fehler und welche Gegenmaßnahmen
können vorgenommen werden?

Weiterführende Literatur
Einen Überblick zur Anwendung von Verhaltensbeobachtungen im betrieblichen
Assessment-Center-Kontext bieten die Fachbücher von Obermann (2013) sowie
Thornton, Rupp und Hoffman (2014). Umfangreiche Materialsammlungen finden
sich beispielsweise bei Paschen, Benen, Turck und Stöwe (2013) sowie Eck, Jöri und
Vogt (2010). Einen ersten Einblick in die AC-Forschung geben die Herausgeberwerke
von Schuler (2007) sowie Jackson, Lance und Hoffmann (2012).
62 Kapitel 2 · Anforderungsprofil, Verhaltensbeobachtung und Verhaltensbeurteilung

Literatur

Arbeitskreis Assessment Center e.V. (2016). Standards der Assessment-Center-Methode.

2 Hamburg: Arbeitskreis Assessment Center e.V. http://www.arbeitskreis-ac.de.


Bodenmann, G. (2006). Beobachtungsmethoden. In F. Petermann & M. Eid (Hrsg.),
Handbuch der psychologischen Diagnostik (S. 151–159). Göttingen: Hogrefe.
Bolte, E.-A., & Sünderhauf, K. (2005). Konstruktion von Assessment Center Übungen.
In K. Sünderhauf, S. Stumpf & S. Höft (Hrsg.), Assessment Center: Von der Auftrags-
klärung bis zur Qualitätssicherung (S. 138–154). Lengerich: Pabst.
Borman, W. C. (1978). Exploring Upper Limits of Reliability and Validity in Job Perfor-
mance Ratings. Journal of Applied Psychology, 63, 135–144.
DeNisi, A. S., Cafferty, T. P., & Meglino, B. M. (1984). A Cognitive View of the Perfor-
mance Appraisal Process: A Model and Research Propositions. Organizational
Behavior and Human Performance, 33, 360–396.
DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Eck, C., Jöri, H., & Vogt, M. (2015). Assessment Center: Entwicklung und Anwendung.
Berlin: Springer.
Faßnacht, G. (2007). Systematische Verhaltensbeobachtung. Stuttgart: UTB.
Fiske, S., & Taylor, S. (2013). Social cognition: From brains to culture. London: Sage.
Fisseni, H.-J., & Fennekels, G. P. (1995). Das Assessment Center: Eine Einführung für
Praktiker. Göttingen: Hogrefe.
Funder, D. C. (1995). On the accuracy of personality judgement: A realistic approach.
Psychological Review, 102, 652–670.
Funder, D. C.(1999). Personality judgement. A realistic approach to person perception.
San Diego, CA: Academic Press.
Gorman C., & Rentsch J. (2009). Evaluating frame-of-reference rater training effecti-
veness using performance schema accuracy. Journal of Applied Psychology, 94,
1336–1344.
Höft, S. (2011). Besondere Anreize provozieren besonderes Probandenverhalten:
Psychodiagnostik im Kontext der Personalauswahl. In L. Hornke, M. Amelang
& M. Kersting (Hrsg.), Psychologische Diagnostik – Methoden. Enzyklopädie der
Psychologie (B/II/1, S. 159–194). Göttingen: Hogrefe.
Höft, S. (2013). Assessment Center. In C. Kreklau & J. Siegers (Hrsg.), Handbuch der
Aus- und Weiterbildung (Loseblattwerk, Erg.-Lfg. 246, Fundstelle 4532, 20 Seiten).
Köln: Wolters Kluwer.
Höft, S., & Lüth, N. (2005). Beobachtung und Bewertung im Assessment Center.
Gestaltungsmerkmale eines AC-Beobachtungssystems. In K. Sünderhauf,
S. Stumpf & S. Höft (Hrsg.), Assessment Center: Von der Auftragsklärung bis zur
Qualitätssicherung. (S. 164–180). Lengerich: Pabst.
Höft, S., & Melchers, K. (2010). Training von AC-Beobachtern: Worauf kommt es an?
Wirtschaftspsychologie, 12(2), 32–40.
Höft, S., Stelling, D., & Maschke, P. (2010). Begutachtung der Eignung eines lizenzier-
ten Verkehrsflugzeugführers als Kopilot einer Fluggesellschaft- Michael H., 28
Jahre. In K. Kubinger & T. Ortner (Hrsg.), Psychologische Diagnostik in Fallbeispie-
len (S. 356–369). Göttingen: Hogrefe.
International Task Force on Assessment Center Guidelines (2015). Guidelines and
ethical considerations for assessment center operations. Journal of Manage-
ment, 41, 1244–1273.
Jackson, D. R., Lance, C. E., & Hoffman, B. J. (eds.). (2012). The psychology of assessment
centers. New York: Routledge.
Kanning, U. P., Hofer, S., & Schulze Willbrenning, B. (2004). Professionelle Personenbe-
urteilung. Ein Trainingsbuch. Göttingen: Hogrefe.
Kersting, M. (2010). Akzeptanz von Assessment Centern: Was kommt an und worauf
kommt es an? Wirtschaftspsychologie, 12, 58–65.
Kersting, M., & Ott, M. (2015). Diversity-gerechte Personalauswahl – Wie man die Per-
sonalauswahl gestalten muss, um Potenziale in allen Gesellschaftsgruppen zu
Literatur
63 2
erkennen. In: T. Ringeisen & P. Genkova (Hrsg.). Diversity Kompetenz: Perspektiven
und Anwendungsfelder (S. 1–11). Berlin: Springer.
Klehe, U.-C., Kleinmann, M., Nieß, C., & Grazi, J. (2014). Impression management
behavior in assessment centers: Artificial behavior or much ado about nothing?
Human Performance, 27, 1–14.
Lievens, F. (2001). Assessor Training Strategies and Their Effects on Accuracy, Inter-
rater Reliability, and Discriminant Validity. Journal of Applied Psychology, 86,
255–264.
McFarland, L. A., Yun, G. J., Harold, C. M., Viera, L., & Moore, L. G. (2005). An exami-
nation of impression management use and effectiveness across assessment
center exercises: The role of competency demands. Personnel Psychology, 58,
949–980.
Mummendey, H. D., & Bolten, H.-G. (1985). Die Impression-Management-Theorie. In
D. Frey & M. Irle (Hrsg.), Theorien der Sozialpsychologie. Band III: Motivations- und
Informationsverarbeitungstheorien (S. 57–78). Bern: Huber.
Obermann, C. (2013). Assessment Center: Entwicklung, Durchführung, Trends. Wies-
baden: Gabler.
Parkinson, B. (2014). Soziale Wahrnehmung und Attribution. In K. Jonas, W. Stroebe &
M. Hewstone (Hrsg.), Sozialpsychologie (S.107–140). Berlin: Springer.
Paschen, M., Beenen, A., Turck, D., & Stöwe, C. (2013). Assessment Center professionell.
Göttingen: Hogrefe.
Roch, S. G., Woehr, D., Mishra, V., & Kieszczynska, U. (2012). Rater Training Revisited:
An Updated Meta-analytic Review of Frame of Reference Training. Journal of
Occupational and Organizational Psychology, 85, 370–395.
Schleicher, D. J., & Day, D. V. (1998). A Cognitive Evaluation of Frame-of-Reference
Rater Training: Content and Process Issues. Organizational Behavior and Human
Decision Processes, 73, 76–101.
Schollaert, E., & Lievens, F. (2012). Building situational stimuli in assessment center
exercises: Do specific exercise instructions and role-player prompts increase the
observability of behavior? Human Performance, 25, 255–271.
Schuler, H. (Hrsg.). (2007). Assessment Center zur Potenzialanalyse. Göttingen: Hogrefe.
Spinath, F. M., & Becker, N. (2011). Verhaltensbeobachtung. In Hornke, L. & Kersting,
M. (Hrsg.), Psychologische Diagnostik – Methoden. Enzyklopädie der Psychologie
(B/II/3, S. 325–369). Göttingen: Hogrefe.
Stemmler, G., & Margraf-Stiksrud, J. (2015). Verhaltensbeobachtung. In G. Stemmler &
J. Margraf-Stiksrud (Hrsg.), Lehrbuch Psychologische Diagnostik (S. 13–76). Wien:
Huber.
Tett, R. P., & Guterman, H. A. (2000). Situational trait relevance, trait expression, and
cross-situational, consistency: Testing a principle of trait activation. Journal of
Research in Personality, 34, 397–423.
Thornton, G. C. III, & Mueller-Hanson, R. A. (2004). Developing organizational simulati-
ons: A guide for practitioners and students. Mahwah, NJ: Erlbaum.
Thornton, G. C. III, Rupp D. E., & Hoffman, B. J. (2014). Assessment center perspectives
for talent management strategies. New York: Routledge.
Von Rüden, R. (2005). Logistische Strukturhilfen bei Planung und Design von AC-Pro-
zessen. In K. Sünderhauf, S. Stumpf & S. Höft (Hrsg.), Assesment Center: Von der
Auftragsklärung bis zur Qualitätssicherung (S. 198–215). Lengerich: Pabst.
Woehr, D. J., & Huffcutt, A. I. (1994). Rater training for performance appraisal: A quanti-
tative review. Journal of Occupational and Organizational Psychology, 67, 189–205.
65 3

Eignungsinterviews/direkte
mündliche Befragungen
Anja Strobel, Luise Franke-Bartholdt, Ingo Püttner und Martin Kersting

3.1 Eignungsinterview – 66
3.1.1 Begriffsbestimmung – 66
3.1.2 Strukturierung als Merkmal zur Interviewklassifikation – 68
3.1.3 Güte des Eignungsinterviews – 71
3.1.4 Der Interviewprozess – 72
3.1.5 Verzerrungen im Interviewprozess – 79
3.1.6 Fazit – 83

3.2 Zulässigkeit von Fragen, Offenbarungspflichten und


Rechtsfolgen – 84
3.2.1 Informationsinteresse der Arbeitgeberin/des Arbeitgebers versus
Persönlichkeitsrecht der Kandidatinnen und Kandidaten – 84
3.2.2 Zulässige, anforderungsbezogene Fragen – 85
3.2.3 Unzulässige Fragen – 87
3.2.4 Besonderheiten in tendenziösen Organisationen – 88
3.2.5 Rechtsfolgen unzulässiger Fragen – 88
3.2.6 Umgang mit Informationen, nach denen man nicht hätte fragen
dürfen – 89
3.2.7 Befragung von Referenzgeberinnen und -gebern – 90
3.2.8 Fazit – 90

Literatur – 91

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_3
66 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Übersicht
Die folgenden beiden Kapitel sind den mündlichen Befragungen
gewidmet, also dem Interview mit Kandidatinnen und Kandidaten
und dem Gespräch mit Referenzgeberinnen und -gebern. In
7 Abschn. 3.1 wird erläutert, wie solche Gespräche systematisch
3 vorbereitet, durchgeführt und ausgewertet werden können.
Dabei geht es vor allem darum, wie man das Gespräch gestalten
muss, damit die abgeleiteten Diagnosen möglichst zuverlässig
und gültig sind. Wichtig ist es aber auch, die rechtlichen
Rahmenbedingungen einzuhalten. Diese sind Gegenstand von
7 Abschn. 3.2, in dem es beispielsweise darum geht, welche
Fragen zulässig sind und welchen Offenbarungspflichten
Kandidatinnen und Kandidaten unterliegen.

3.1 Eignungsinterview

Anja Strobel, Luise Franke-Bartholdt und Martin Kersting

Übersicht
In der DIN 33430 (DIN, 2016) werden die zur Eignungsdiagnose
genutzten Verfahren in fünf Kategorien eingeteilt (7 Abschn. 4.2).
Im vorliegenden Kapitel werden Verfahren der Kategorie
„direkte mündliche Befragungen“ vorgestellt, wobei wir auf
das Interview mit Kandidatinnen und Kandidaten sowie das
Gespräch mit Referenzgeberinnen und -gebern eingehen.
Nach Informationen zur Definition, Verbreitung und Akzeptanz
des Interviews wird auf die Strukturierung als wesentliches
Merkmal zur Qualitätssicherung solcher Gespräche eingegangen.
Danach folgt ein Überblick darüber, wie zuverlässig und
gültig Interpretationen und Entscheidungen sind, die aus
Interviews abgeleitet werden. Anschließend werden entlang
der Aussagen der DIN 33430 (DIN, 2016) wesentliche Aspekte
dargestellt, die bei der Planung, Durchführung und Auswertung
von Gesprächen zu beachten sind. Den Abschluss des
Kapitels bilden Ausführungen zu möglichen Verzerrungen im
Interviewprozess.

3.1.1 Begriffsbestimmung

In der DIN 33430 (DIN, 2016) werden als Beispiele für die Verfah-
renskategorie „direkte mündliche Befragungen“ das Interview mit
Kandidatinnen und Kandidaten sowie das Gespräch mit einer „dritten
3.1 · Eignungsinterview
67 3
Person“, z.B. einer Referenzgeberin bzw. einem Referenzgeber, genannt.
Diese befragten Personen werden im Folgenden auch „Interviewte“
genannt. Im vorliegenden Kapitel werden die Begriffe „Eignungs-
interview“, „Interview“ und „Gespräch“ synonym genutzt. Sofern sich
eine Aussage auf das Gespräch mit Referenzgeberinnen und -gebern
bezieht, wird dies explizit herausgestellt. Die berichteten empirischen
Erkenntnisse sind aus Studien abgeleitet, in denen Interviews mit (tat-
sächlichen oder „simulierten“) Kandidatinnen und Kandidaten, nicht
aber mit Referenzgeberinnen und -gebern geführt wurden. Mündliche
Gespräche sind nach DIN 33430 (DIN, 2016) von Personen zu führen,
die bestimmte Qualifikationsanforderungen erfüllen (7 Abschn. 3.1.4
„Planung und Vorbereitung“). Nach DIN 33430 (DIN, 2016) sind dies
Beobachter/-innen oder Eignungsdiagnostiker/-innen. Im Folgenden
wird auch der Begriff der „Interviewenden“ für diese Personen genutzt.
In der DIN 33430 (DIN, 2016) wird explizit berücksichtigt, dass gele-
gentlich Personen an Befragungen mitwirken, die ausschließlich fach-
liche Kenntnisse und Fertigkeiten beurteilen sollen. An diese Personen
werden in der DIN 33430 (DIN, 2016) keine Qualifikationsanforderun-
gen gestellt. Wenn im Folgenden von Interviewenden gesprochen wird,
sind diese Personen nicht mitgemeint.
Das Eignungsinterview als wesentliche Methode der direkten Funktionen des
mündlichen Befragung ist ein weit verbreitetes, effizientes Verfahren, Eignungsinterviews
welches viele Funktionen erfüllt. Das Gespräch kann persönlich oder
auch technisch vermittelt (z.B. via Telefon, Video) geführt werden. Es
ermöglicht den Interviewenden, sich ein Bild von den Kandidatinnen
und Kandidaten zu machen und mehr über ihre Kompetenzen und
Potenziale sowie ihre Qualifikationen zu erfahren. Gleichzeitig können
sich beide Seiten kennenlernen, und die Kandidatinnen und Kandida-
ten erhalten die Möglichkeit, etwas über die Anforderungen der Tätig-
keit sowie über die Organisation zu erfahren. Selbst Vereinbarungen
für die künftige gemeinsame Tätigkeit können im Zuge des Interviews
bereits getroffen werden. In der DIN 33430 (DIN, 2016, S. 14) wird
diese Zweiwertigkeit des Informationsaustauschs expliziert: „Bestand-
teil des Eignungsinterviews sollte auch eine realistische Schilderung der
angestrebten Tätigkeit sein – sofern diese Information nicht an anderer
Stelle bereits gegeben wurde –, damit ein Kandidat eine Entscheidung
im Hinblick auf ein etwaiges Stellenangebot auf der Basis angemessener
Informationen treffen kann.“ Durch die direkte Befragung von Kan-
didatinnen und Kandidaten können im Eignungsinterview anforde-
rungsrelevante Informationen gewonnen werden, die bei der Nutzung
anderer Verfahren ggf. mit einem weit höheren Aufwand in der Erfas-
sung einhergehen. Gleichzeitig können Interviewinformationen auch
ergänzend genutzt werden, um Informationen aus anderen Verfahren,
z.B. aus einem vorab bearbeiteten messtheoretisch fundierten Fragebo-
gen, einordnen und verstehen zu können. Im Text der DIN 33430 (DIN,
2016) findet sich keine Definition der Kategorie „direkte mündliche
Befragungen“. Vor dem Hintergrund der einzelnen Ausführungen im
DIN-Text (ebd.) kann aber die folgende Definition abgeleitet werden.
68 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Definition
Definition Direkte mündliche Befragungen nach DIN 33430 (DIN, 2016)
sind mündliche Verfahren der Eignungsdiagnostik, bei denen auf
der Grundlage eines zielgerichteten, anforderungsbezogenen
direkten Gespräches zwischen Kandidatinnen und Kandidaten
oder Dritten (z.B. Referenzgeberinnen und -gebern) einerseits und
3 trainierten Interviewer/-innen andererseits eine regelgeleitete
Beurteilung der Ausprägung von Eignungsmerkmalen durch
Interviewer/-innen und ggf. Beobachter/-innen erfolgt. Die
mündliche Befragung von Kandidatinnen und Kandidaten kann
auch realistische Schilderungen der angestrebten Tätigkeit
umfassen und Zeit für Fragen der Kandidatinnen und Kandidaten
vorsehen.

Verbreitung und Akzeptanz des Kaum eine Organisation, die ein Verfahren zur internen oder externen
Eignungsinterviews Personalauswahl gestaltet, verzichtet auf ein Interview. In einer 2007
durchgeführten Studie (Schuler, Hell, Trapmann, Schaar & Boramir,
2007) zur externen Personalauswahl setzten alle 125 Organisationen,
die an der Befragung teilgenommen hatten, Interviews ein. Bezüglich
der internen Personalauswahl betrug die Einsatzhäufigkeit knapp 94%
(Hell, Schuler, Boramir & Schaar, 2006). Diese Zahlen verdeutlichen
neben der großen Verbreitung von Eignungsinterviews auch die hohe
Akzeptanz des Verfahrens auf Seiten der Interviewenden (Hell et al.,
2006; Schuler et al., 2007). Auch Interviewte schätzen das Verfahren
aufgrund der Möglichkeit, sich selbst umfassend vorstellen zu können,
der Option, auch selbst Informationen zu erhalten, sowie der Unmittel-
barkeit und Flexibilität des Aufeinander-Eingehens. Eine Metaanalyse
von Anderson, Salgado und Hülsheger (2010) stellt die Ergebnisse von
38 Stichproben aus 17 Ländern bezogen auf die Bewerbereinschätzun-
gen verschiedener Auswahlverfahren zusammen: Das Eignungsinter-
view findet sich in den übergreifenden Präferenzeinschätzungen der
Kandidatinnen und Kandidaten an zweiter Stelle hinter Arbeitsproben.
Auch bei der Beurteilung einzelner Dimensionen von Akzeptanz wie
der wahrgenommenen Möglichkeit, eigene Fähigkeiten zu zeigen, oder
der eingeschätzten interpersonellen Wärme wird das Interview jeweils
sehr positiv eingeschätzt.

3.1.2 Strukturierung als Merkmal zur


Interviewklassifikation

Interviewklassifikation nach Grad Eignungsinterviews und Gespräche mit Referenzgeberinnen und -gebern
der Strukturierung können in sehr verschiedener Art und Weise geführt werden, wobei ein
Hauptunterscheidungsmerkmal deren Strukturierung und Standardi-
sierung ist. Als „unstrukturiert“ bezeichnet man ein Gespräch, welches
ohne Vorgaben durchgeführt und ausgewertet wird. Bei strukturierten
Gesprächen liegen mindestens die zu stellenden Fragen in Form eines
3.1 · Eignungsinterview
69 3
Interviewleitfadens vor. Je nach Grad der Strukturierung kann auch die
Reihenfolge der Fragen bereits festgelegt sein. „Standardisierung“ geht
über die Strukturierung noch hinaus: Bei standardisierten Gesprächen
sind die Fragen und deren Reihenfolge bereits im Vorfeld exakt festgelegt.
Darüber hinaus sind die Antwortoptionen vorgegeben, und auch Aus-
wertung und Interpretation jeder Antwort sind eindeutig festgelegt. Ver-
schiedene Autorinnen und Autoren haben den Begriff der Strukturierung
näher beschrieben (z.B. Chapman & Zweig, 2005). Ein Problem für die
Evaluation (7 Kap. 6) besteht darin, dass unter dem Oberbegriff „struk-
turiert“ häufig sehr unterschiedliche Strukturierungsweisen zusammen-
gefasst werden. In der DIN 33430 (DIN, 2016, S. 14) wird die Forderung
aufgestellt, „dass das Interview hinsichtlich der gestellten Fragen struktu-
riert und/oder (teil-)standardisiert vorgenommen wird“. Strukturierung
bedeutet nach Ansicht der DIN-Autorinnen und -Autoren „eine festge-
legte Abfolge verschiedener Abschnitte bzw. Fragenbereiche des Inter-
views“ (DIN, 2016, ebd.). In den Kontext der Strukturierung fällt auch der
Hinweis aus der DIN (2016, S. 14), dass Aufforderungen an die Kandidatin-
nen und Kandidaten, gegebene Antworten weiter zu erläutern, in standar-
disierter Form erfolgen sollten und dass Informationen zur infrage stehen-
den Tätigkeit sowie mögliche Fragen von Kandidatinnen und Kandidaten
dazu – wenn möglich – in einem separaten Gesprächsabschnitt gebündelt
behandelt werden sollten. Übergreifend kann man den Begriff der Struk-
turierung aber auf mehr beziehen als auf die reine Abfolge der Fragen.
Strukturierung ist in dieser übergeordneten Perspektive ein Merkmal des
gesamten Interviewprozesses (7 Abschn. 3.1.4). Bei der Gestaltung dieses
Prozesses sind vorab festgelegte Regeln hilfreich und nützlich.

> Was bedeutet Strukturierung im Interview?


In der DIN 33430 (DIN, 2016) wird Strukturierung
vordergründig als die Festlegung der Abfolge verschiedener
Abschnitte bzw. Fragenbereiche des Interviews verstanden.
Strukturierung in diesem Sinne setzt das Vorhandensein eines
Interviewleitfadens voraus. Es lassen sich aber noch wesentlich
mehr Forderungen, die in der DIN 33430 (DIN, 2016) gestellt
werden, dem Thema Strukturierung zuordnen (. Tab. 3.1). In
einem solch weiten Verständnis kann man Strukturierung im
Sinne von Huffcutt und Arthur (1994) verstehen als den Grad
der Freiheit, der Interviewenden beim Führen von Interviews
zugestanden wird. Dabei werden Interviews in verschiedene
Strukturierungsstufen unterteilt, die sich auf zwei Dimensionen
beziehen: (1) den Grad der Standardisierung der Fragen und (2)
den Grad der Standardisierung der Bewertung der Antworten
der Kandidatinnen und Kandidaten. Campion, Palmer und
Campion (1997, S. 656) wiederum definieren Struktur als „jede
Anpassung des Interviews, die darauf abzielt, die Gütekriterien
zu verbessern, entweder durch stärkere Standardisierung oder
Hilfen für die Interviewenden hinsichtlich der zu stellenden
Fragen oder die Bewertung der Antworten“ (Übers. v. Verf.).
70 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Weshalb sollten Gespräche strukturiert geführt werden? Die Struktu-


rierung des Interviewprozesses hat sich als wesentlicher Aspekt erwie-
sen, um die Aussagekraft der mithilfe eines Interviews gewonnenen Eig-
nungsbeurteilungen sicherzustellen. Schon sehr früh hat sich gezeigt,
dass die aus Gesprächen abgeleiteten Prognosen des beruflichen Erfolgs
treffsicherer ausfallen, wenn die Gespräche strukturiert geführt werden
3 (z.B. Wagner, 1949; 7 Abschn. 3.1.3).
DIN-Forderung: Strukturierung im Wie setzt man nun Strukturierung im Interviewprozess um?
Interview umsetzen Campion et al. (1997; vgl. auch Jetter, 2003) haben, basierend auf einer
Vielzahl von Studien zur Thematik, eine umfassende Übersicht über
Strukturkomponenten im Interviewprozess und deren Auswirkungen
auf die Güte des Interviews vorgelegt und diese in die beiden Kategorien
(1) Inhalt (z.B. das Durchführen einer Anforderungsanalyse, das Stellen
gleicher Fragen, das Führen längerer Interviews) und (2) Auswertung
(z.B. das Erstellen detaillierter Aufzeichnungen, der Einsatz von meh-
reren Interviewenden, das Nutzen verhaltensverankerter Beurteilungs-
skalen (7 Exkurs „Konstruktion verhaltensverankerter Beurteilungsska-
len“ in 7 Abschn. 4.1.5) unterteilt. Auch Interviewtrainings werden als
bedeutsame Voraussetzung für die Umsetzung von Strukturierungs-
maßnahmen betrachtet. Die wesentlichen Aspekte, die in den bislang
vorliegenden Studien herausgearbeitet wurden, sind in . Tab. 3.1 dar-
gestellt. In der Übersicht sind den Kategorien beispielhafte Aussagen
aus der DIN 33430 (DIN, 2016) zugeordnet.

. Tab. 3.1  Komponenten der Interviewstruktur nach Campion et al. (1997) und beispielhafte Entsprechung im Text
der DIN 33430 (DIN, 2016)

Komponente der Interviewstruktur Aussagen der DIN 33430 (DIN, 2016)

Anforderungsprofile erstellen und daraus „Bei der Vorbereitung sind die Inhalte des Interviews im Hinblick auf
Fragen ableiten die in ­Frage stehenden Positionen anforderungsbezogen zu gestal-
ten.“ (S. 14)
Erstellen und Nutzen von Interviewleitfäden „(…) ist dafür Sorge zu tragen, dass das Interview hinsichtlich der ge-
stellten Fragen strukturiert und/oder (teil-)standardisiert vorgenom-
men wird. Strukturierung bedeutet in diesem Fall eine festgelegte Ab-
folge verschiedener Abschnitte bzw. Fragenbereiche des Interviews.
Dazu muss zumindest ein Interviewleitfaden vorliegen.“ (S. 14)
Günstige Frageformen und -­techniken ver- „Geeignete Fragen im Eignungsinterview sind – neben beruflichen
wenden Wissensfragen und Fragen zu beruflichen Erfahrungen, die für die ent-
sprechende P­ osition Bedeutung haben – vor allem biografiebezogene
und situative ­Fragen.“ (S. 14)
Protokollierung von Antworten „Interviewverlauf und Antworten auf Interviewfragen sowie relevante
Beobachtungen sind für die Eignungsbeurteilung in geeigneter Form
festzuhalten (z.B. Interviewprotokoll bzw. Beobachtungsbogen).“ (S. 14)
Explizite Regeln zur Auswertung der erhobe- „Die Auswertung von Interviews und Verhaltensbeobachtungen muss
nen Informationen: anforderungsorientiert ­regelgeleitet erfolgen.“ (S. 14)
bewerten/­Bewertungsskalen einsetzen
Training der Interviewenden „Interviews und Verhaltensbeobachtungen müssen von Personen
durchgeführt werden, die nachweislich für diese Aufgaben qualifiziert
sind bzw. eigens trainiert wurden.“ (S. 13)
3.1 · Eignungsinterview
71 3
3.1.3 Güte des Eignungsinterviews

In der DIN 33430 (DIN, 2016) findet sich zum Thema Auswahl und
Zusammenstellung von Verfahren der Hinweis, dass die ausgewählten
Verfahren so hochwertig sein sollen, dass „die angestrebte Entschei-
dung, zu der das Verfahren einen Beitrag leistet, mit einer angemesse-
nen Entscheidungssicherheit getroffen werden kann“ (S. 11). In diesem
Kontext wird auf Erkenntnisse aus belastbaren empirischen Untersu-
chungen/Metaanalysen zur Vorhersage von Berufs- und Ausbildungs-
erfolg verwiesen, die in 7 Kap. 6 allgemein besprochen werden. Im
vorliegenden Kapitel wird thematisiert, inwieweit und unter welchen
Bedingungen es aufgrund von Interviews möglich ist, Eignungsbeurtei-
lungen zu treffen, die den Anforderungen an Objektivität, Zuverlässig-
keit und Gültigkeit entsprechen.
Bezogen auf die Objektivität, also die Übereinstimmung von Objektivität von
Beurteilerinnen und Beurteilern in einem Interview, konnte mithilfe Eignungsinterviews
von Metaanalysen (Conway, Jako & Goodman, 1995; Huffcutt, Cul-
bertson & Weyhrauch, 2013) gezeigt werden, dass der Grad an Struk-
turierung einen bedeutsam positiven Einfluss auf die Objektivität von
Eignungsinterviews hat. So fanden Conway et al. (1995) in einer Meta-
analyse von über 100 Übereinstimmungskoeffizienten für unstruk-
turierte Gesprächsformen mittlere Koeffizienten (r = .34). Die Über-
einstimmung stieg mit zunehmender Strukturierung an und lag bei
strukturierten Gesprächen dann in einem hohen Bereich (r = .67). Ähn-
liche Befunde zeigen sich auch in aktuellen Überblickstudien: Huff-
cutt et al. (2013) fanden über fünf Level von Strukturierung hinweg
einen Anstieg der Objektivitätskoeffizienten von im Mittel r = .36 für
ein niedriges Level von Strukturierung auf hohe Werte nahe r = .80 für
die Gruppen mit der stärksten Strukturierung.
Inwieweit die aus Einstellungsinterviews abgeleiteten Eignungs- Gültigkeit der aus
beurteilungen prädiktiv valide für die Vorhersage von Ausbildungs- Eignungsinterviews abgeleiteten
und Berufserfolg sind, wurde außerordentlich umfassend untersucht. Erfolgsprognosen
Moscoso (2000) kann in ihrer Übersichtsarbeit auf acht Metaanaly-
sen zurückblicken, die ausnahmslos zu dem Ergebnis kommen, dass
sich aus Interviews kriteriumsvalide Aussagen ableiten lassen. Auch in
Bezug auf die Gültigkeit ist die Strukturierung das wesentliche Erfolgs-
element zur Gewährleistung der Güte. Die Metaanalyse von Schmidt
und Hunter (1998) berichtet für Eignungsbeurteilungen, die aus Inter-
views abgeleitet wurden, eine prädiktive Validität in Höhe von r = .51
(7 Kap. 6). Huffcutt und Arthur (1994) untersuchten verschiedene
Stufen von Strukturierung und zeigten, dass die prädiktive Validität
generell mit erhöhter Strukturierung wächst, es jedoch ein Optimum
an Strukturierung zu geben scheint, über das hinaus keine Validitäts-
steigerung mehr erfolgt.
Bezogen auf die Gültigkeit der aus Eignungsinterviews abgeleiteten Welche Eignungsmerkmale
Aussagen kann man auch die Frage stellen, welche Eignungsmerkmale werden mit Interviews erfasst?
mit dem Verfahren erfasst werden. Eine ganze Reihe Studien beschäf-
tigte sich mit der Frage, wie hoch der Zusammenhang von Beurteilun-
gen, die aufgrund eines Interviews getroffen wurden, einerseits und
72 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Messungen von kognitiven Fähigkeiten (Intelligenz) andererseits ist.


In der Gesamtschau der Arbeiten zeichnet sich ein mittlerer Zusam-
menhang (um r = .40) als realistischer Schätzwert ab (Roth & Huff-
cutt, 2013). Auch strukturierte und unstrukturierte Gespräche können
dahingehend verglichen werden, welche Eignungsmerkmale sie erfas-
sen. In einem metaanalytischen Vergleich (Salgado & Moscoso, 2002)
3 wurde gezeigt, dass strukturierte Gespräche eher Fachkenntnisse und
Berufserfahrung erfassen. Konventionell (eher unstrukturiert) geführte
Gespräche erfassen hingegen eher Intelligenz und Eignungsmerkmale
wie emotionale Stabilität oder aber soziale Kompetenzen.

3.1.4 Der Interviewprozess

In den folgenden Abschnitten wird auf die konkrete Umsetzung der


Komponenten von Interviewstruktur in der Planung, Durchführung
und Auswertung von Eignungsinterviews jeweils näher eingegangen.

Planung und Vorbereitung


Auftragsklärung Eine gründliche Vorbereitung des Interviewprozesses ist eine wesentli-
che Voraussetzung für ein aussagekräftiges Gespräch. Zu Beginn eines
Interviewprozesses ist wie bei jeder Eignungsbeurteilung zunächst eine
umfassende Auftragsklärung durchzuführen, wobei bei allen Beteilig-
ten Klarheit über Ziele, Rahmenbedingungen und Konsequenzen des
geplanten Vorgehens hergestellt werden sollte. Die DIN 33430 (DIN,
2016) formuliert diesen Anspruch als übergreifende Anforderung an
die Eignungsbeurteilung. Ebenfalls in diese Phase gehört bereits die
Klärung aller organisatorischen Fragen, beispielsweise Überlegungen
zu Terminen und Räumen.
DIN-Forderung: Inhalte des Um Fragen anforderungsbezogen formulieren zu können, wie es in
Interviews anforderungsbezogen der DIN 33430 (DIN, 2016) gefordert wird, ist nach der Auftragsklärung
gestalten eine Anforderungsanalyse unerlässlich (zur sachgerechten Durchfüh-
rung einer Anforderungsanalyse 7 Abschn. 4.1). Auf dieser Grundlage
kann das von Kandidatinnen und Kandidaten geschilderte Verhal-
ten nach einem Interview den Eignungsmerkmalen zugeordnet und
bewertet werden. Das Durchführen einer Anforderungsanalyse ist ein
wesentliches Strukturierungselement im Interview, da sie gleicherma-
ßen die Basis für die Frageformulierung wie auch für das Erstellen von
Auswertungs- und Beurteilungsinstrumenten darstellt und somit eine
möglichst objektive und gültige Entscheidung im Gespräch vorbereitet.
Gespräche mit „Dritten“ Auch die Befragung dritter Personen zu einer Kandidatin bzw.
einem Kandidaten (z.B. für das Einholen von Referenzen) ist anfor-
derungsbezogen zu gestalten. Sie sollte sich konkret auf das frühere
Arbeitsverhältnis und das anforderungsrelevante Verhalten in dieser
Zeit beziehen. Das Gespräch mit Referenzgeberinnen und -gebern darf,
ebenso wie das Einholen von Referenzen, nur mit dem Einverständnis
der Kandidatinnen und Kandidaten erfolgen. Es ist vorab festzulegen,
3.1 · Eignungsinterview
73 3
auf welche Weise Informationen verwendet werden können, wenn ein-
zelne Kandidatinnen und Kandidaten das Gespräch mit Referenzge-
berinnen und -gebern untersagen, während andere damit einverstan-
den sind.
Der nächste unabdingbare Schritt im Interviewprozess ist die Ent- Es muss ein Interviewleitfaden
wicklung eines Interviewleitfadens. Der Leitfaden gewährleistet, dass vorliegen
alle wesentlichen Informationen bei allen Interviewten in weitgehend
gleicher Weise erfasst werden. Er bildet die Basis für eine objektive und
gültige Gesprächsdurchführung und damit ebenfalls eine Entlastung
für die Interviewenden, die die vorbereiteten Fragen verwenden und
sich dadurch im Gespräch besser auf die Interviewten und deren Ant-
worten konzentrieren können.
Ein Leitfaden umfasst den Ablaufplan für das Gespräch ebenso Aufbau des Interviewleitfadens
wie konkret formulierte Fragen. Grob umrissen sollte jeder Leitfa-
den aus einer Gesprächseinleitung, einem Hauptteil zur Erhebung der
Eignungsmerkmale sowie einem Gesprächsabschluss bestehen (vgl.
Jetter, 2003). Westhoff (2009) empfiehlt darüber hinaus, auch erklärende
Überleitungen zu einzelnen Abschnitten sowie notwendige Erklärun-
gen nicht vermeidbarer Fachbegriffe bereits vorab zu formulieren und
dies in den Leitfaden aufzunehmen. Zur Gesprächseröffnung gehören
die Begrüßung, eine Erläuterung des Ablaufs unter Berücksichtigung
der Rahmenbedingungen sowie die Vorstellung der am Interview
beteiligten Personen. Entsprechend umfasst der Interviewleitfaden im
Abschnitt Gesprächseröffnung die dazu notwendigen Informationen.
Auch Fragen zum Werdegang der Kandidatinnen und Kandidaten, ihrer
Motivation zur Bewerbung u. Ä. bieten sich zu Beginn des Gesprächs an
und sollten entsprechend im Leitfaden vorgesehen werden.
Als Ausgangspunkt für die Formulierung der Fragen im Hauptteil Hauptteil des Interviewleitfadens:
des Leitfadens dienen die aus der Anforderungsanalyse abgeleiteten Eig- Erhebung der Eignungsmerkmale
nungsmerkmale. Dabei sollte jedes Eignungsmerkmal durch mehrere
Fragen abgedeckt werden, und es sollten jeweils passende Frageformate
und geeignete Fragetechniken (vgl. folgende Abschnitte) verwendet
werden (DIN, 2016). Auch absehbare Nachfragen bzw. Aufforderungen,
gegebene Antworten weiter zu erläutern, sollten bereits vorab formuliert
werden (DIN, 2016). Eine Integration anderer methodischer Bestand-
teile in das Interview ist ebenfalls möglich. Die DIN 33430 (DIN, 2016,
S. 14) formuliert hierzu: „Im Eignungsinterview können auch Inter-
viewanteile integriert werden, die eine konkrete Leistung verlangen,
z.B. die Präsentation kurzer Fallstudien und Rollenspiele.“ Ist dies ange-
dacht, so müssen auch diese sorgfältig entsprechend ihrer jeweiligen
Verfahrensrichtlinien (z.B. zu Verhaltensbeobachtungen und -beurtei-
lungen 7 Abschn. 2.2) gestaltet werden.

> Formulierung günstiger Fragen und Fragearten im Fragenformulierung


Interview
Für die Formulierung von Fragen im Interviewleitfaden gibt es
eine Reihe Empfehlungen, deren Beachtung sich als günstig
im Sinne einer gültigen Erhebung von Informationen erwiesen
74 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

hat (vgl. Jetter, 2003; Schuler & Mussel, 2016; Westhoff, 2009).
Zunächst sollten sich Fragen immer auf konkretes Verhalten
beziehen. Offene Fragen sind in der Regel diagnostisch
ergiebiger. Geschlossene Fragen eignen sich dann, wenn eine
direkte Abfrage von Informationen sinnvoll ist oder z.B. eine
Frage als Filter für das weitere Vorgehen gestellt werden soll.
3 Fragen sollten nach Möglichkeit nur einen Aspekt ansprechen,
also nicht als Kettenfrage formuliert werden. Suggestivfragen
sind in der Regel ebenso zu vermeiden wie Fragen, die den
Antwortspielraum der Interviewten unnötig einengen. Darüber
hinaus hilft es, wenn Fragen kurz und verständlich formuliert
werden.
Als geeignete Fragearten, um inhaltlich die Informationen zu
den relevanten Anforderungen zu erfassen, sieht die DIN 33430
(DIN, 2016) biografiebezogene und situative Fragen vor (zur
Erläuterung der beiden Fragetypen siehe unten), die jeweils auf
Verhalten in erfolgskritischen Situationen (vgl. 7 Abschn. 4.1.1)
abzielen. Während biografiebezogene Fragen tatsächlich
erlebtes vergangenes Verhalten erfassen, fragen situative
Fragen nach zukünftigem Verhalten.

Biografiebezogene Fragen Biografiebezogene Fragen (vgl. . Abb. 3.1 für ein Beispiel) folgen dem
Grundgedanken, dass Verhalten in vergleichbaren vergangenen Situa-
tionen eine gute Vorhersage des Verhaltens in zukünftigen Situationen
ermöglicht. Die Anwendung dieser Frageart ist umso empfehlenswer-
ter, je mehr Berufserfahrung die befragten Kandidatinnen und Kandi-
daten bereits haben. Angestrebt wird bei biografiebezogenen Fragen
die Erhebung möglichst vollständiger Verhaltensbeispiele, d.h. es soll
ein umfassendes Verständnis der Situation, des darin gezeigten Ver-
haltens sowie des Ergebnisses und damit verbundener Konsequenzen
erreicht werden. Studien konnten zeigen, dass mit biografiebezogenen
Fragen typisches Verhalten erfasst wird und vor allem die Erhebung
relevanter beruflicher Erfahrungen sowie von Persönlichkeitsaspekten
im Vordergrund steht. Interviewformen, die mehrheitlich diese Art der
Fragen nutzen, sind das (Patterned) Behavior Description Interview
(Janz, 1989; Janz, Hellervik & Gilmore, 1986) und das Entscheidungs-
orientierte Gespräch (Westhoff, 2009).
Situative Fragen Situative Fragen (vgl. . Abb. 3.1 für ein Beispiel) stellen eine Art
„mentaler Tätigkeitssimulation“ (Schuler & Mussel, 2016) dar. Grund-
gedanke ist die Annahme, dass im Gespräch geäußerte Absichten eine
gültige Vorhersage von Verhalten ermöglichen. Situative Fragen erfor-
dern eine sorgfältige Konstruktion, da eine Frage alle notwendigen
Informationen zum Verständnis der Situation bereits enthalten muss,
um eine aussagekräftige Antwort der Kandidatinnen und Kandidaten zu
ermöglichen. Situative Fragen sind eher geeignet, maximales Verhalten
zu erfassen, in geringerem Ausmaß auch typisches Verhalten. Inhalt-
lich steht eher die Erfassung arbeitsbezogenen Wissens und kognitiver
Fähigkeiten im Vordergrund. Das Situational Interview (Latham, Saari,
Pursell & Campion, 1980) nutzt vollständig die situative Frageform.
3.1 · Eignungsinterview
75 3

Situative Frage Ihre Arbeitsgruppe arbeitet an einem sehr wichtigen Projekt. Alle Mitglieder möchten eine
gute Note für ihre Arbeit erhalten. Sie haben eine knappe Deadline für die Abgabe. Ein
Gruppenmitglied war im vergangenen Semester in diesem Gebiet sehr erfolgreich. Mit
Unterstützung von zwei anderen Gruppenmitgliedern übernimmt diese Person die Leitung
der Gruppe. Sie führt ein Protokoll und lenkt die Diskussionen. Dennoch haben Sie den
Eindruck, dass diese Person ausschließlich Ideen würdigt, die ihre eigene Position
unterstützen, und Entscheidungen ohne Rüchksprache mit den anderen Gruppenmitgliedern
trifft. Was würden Sie tun?

Biografische Frage Erzählen Sie mir vor einer Situation, in der eine Person die Leitung eines Gruppenprojektes
übernahm und dabei Beiträge von Gruppenmitgliedern ignorierte, die nicht in Einklang mit
ihrer eigenen Meinung standen. wie kam es zu dieser Situation? Was genau haben Sie
getan? Was war das Ergebnis?

Bewertungshinweise

5 andere Gruppenmitglieder einbeziehen; diese nach ihrer Meinung über das Diskussionsthema fragen;
alle darum bitten, sich Notizen zu machen; Person mit Gruppenleitung darum bitten, ihre Mitschriften
an alle zu senden, um Korrekturen und Ergänzungen vornehmen zu können

3 entweder. eine andere Person fragen, ob sie Protokoll führen und an die anderen Gruppenmitglieder
versenden kann
oder: Person mit Gruppenleitung nur dann konfrontieren, wenn ich unzufrieden damit bin, welche
Richtung das Projekt nimmt; nichts unternehmne, wenn ich der Ansicht bin, dass die bisherige Lösung
gut für das Projekt ist
1 nichts tun

Bewertung 1 2 3 4 5

. Abb. 3.1  Beispiele für eine situative Frage und eine biografiebezogene Frage (entnommen aus Klehe & Latham, 2005,
S. 111, Tabelle 1, eigene Übersetzung, mit freundlicher Genehmigung von John Wiley and Sons)

Bei der Wahl zwischen biografiebezogenen und situativen Fragen


sollte nach Huffcutt, Conway, Roth und Klehe (2004) auch die Kom-
plexität der jeweils infrage stehenden Berufe berücksichtigt werden.
Während sich in der Studie von Huffcutt et al. (2004) situative Inter-
views für wenig bis mittel komplexe Berufe gut eigneten (Validitäten von
r = .44 und r = .51), nahm die Aussagekraft der aus situativen Interviews
abgeleiteten Eignungsbeurteilungen mit zunehmender Jobkomplexi-
tät ab (r = .30 für komplexe Berufe). Eine vergleichende Betrachtung
biografiebezogener und situativer Fragen geben Levashina, Hartwell,
Morgeson und Campion (2014). Vieles spricht dafür, beide Fragearten
im Gespräch zu kombinieren, um die Vorteile beider Fragearten nutzen
zu können. Eine Interviewform, die diesen Gedanken aufnimmt, ist das
Multimodale Interview (Schuler, 1992).
Auch die Entwicklung von Regeln für die Auswertung und die Festlegen des Auswertungs- und
Konstruktion von Beurteilungsskalen gehören zur Vorbereitung von Beurteilungsprozesses
Interviews. Laut DIN 33430 (DIN, 2016) müssen Eignungsmerkmale
76 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

durch konkrete Verhaltensweisen beschrieben werden. Die Ausprägun-


gen der Potenziale und Kompetenzen sollten – sofern möglich – durch
vorab festgelegte verhaltensverankerte Beurteilungsskalen beschrie-
ben werden (7 Abschn. 2.2.3 „Individuelle Beurteilung“). Im Rahmen
der Vorbereitung ist bereits festzuhalten, wie die im Interview gewon-
nenen Informationen den Eignungsmerkmalen zugeordnet werden.
3 Dazu gehört auch die Frage, ob bestimmte Informationen oder Eig-
nungsmerkmale ein höheres Gewicht bei der Beurteilung erhalten
(7 Abschn. 3.1.4 „Auswertung“). Zur Vorbereitung zählen auch Festle-
gungen zur Dokumentation.
Training von Interviewenden Abschließend ist im Zuge der Planung und Vorbereitung von
Interviews sicherzustellen, dass Personen als Interviewende eingesetzt
werden, die „nachweislich für diese Aufgaben qualifiziert sind bzw.
eigens trainiert wurden“ (DIN, 2016, S. 13). Die entsprechenden Qua-
lifikationsanforderungen an Beobachter/-innen, die an direkten münd-
lichen Befragungen beteiligt sind, wurden in der DIN 33430 (DIN,
2016) genau spezifiziert. Ein Training sollte sich an diesen Anforde-
rungen ausrichten und entsprechend z.B. auf die Themen Interview-
klassifikationen, Handhabung von Interviewleitfäden, Frage- und
Formulierungstechniken oder die rechtliche Zulässigkeit von Fragen
(7 Abschn. 3.2) eingehen. Im Rahmen eines Trainings sollten nicht nur
die Kenntnisse vermittelt werden, sondern die Trainingsteilnehmer/-
innen sollten auch die praktische Umsetzung üben. Es gibt publizierte
Interviewtrainingskonzepte (z.B. Schuler & Mussel, 2016), an denen
man sich orientieren kann. Ob und inwieweit diese auf die in der DIN
33430 (DIN, 2016) genannten Qualifikationsanforderungen eingehen,
ist im Einzelfall zu prüfen. Die weiter oben genannten Qualifikationsan-
forderungen gelten nach DIN 33430 (DIN, 2016) nicht für Personen, die
im Rahmen ihrer Mitwirkung an Befragungen ausschließlich fachliche
Kenntnisse und Fertigkeiten beurteilen sollen. Zu beachten ist, dass ein
Training allein noch nicht in der Lage ist, die Interviewqualität dauer-
haft sicher zu stellen (7 Exkurs „Regelmäßige Prüfung des Vorgehens im
Interviewprozess“ in 7 Abschn. 3.1.5 „Beobachtungs- und Bewertungs-
fehler im Interview“)
Rahmenbedingungen für die Im Rahmen der Planung des Interviews sind auch eine Reihe orga-
Durchführung klären und für nisatorischer Fragen zu klären. So müssen die Termine unter Berück-
einen störungsfreien Ablauf des sichtigung der zeitlichen und räumlichen Rahmenbedingungen fest-
Interviews sorgen gesetzt werden. Hierbei sollte darauf geachtet werden, dass genügend
Zeit sowohl für die Interviewdurchführung als auch für die Auswer-
tung und Dokumentation zur Verfügung steht. Verfahren, bei denen
Kandidatinnen und Kandidaten zu schnell aufeinanderfolgen und bei
denen für die Beobachter/-innen weder Zeiten für die Beurteilung und
Dokumentation noch für Pausen einkalkuliert wurden, sind unter Qua-
litätsgesichtspunkten zu vermeiden. Die Gespräche sind so zu planen,
dass sie störungsfrei verlaufen können (DIN, 2016). Die Anzahl der
Interviewenden ist ebenso festzulegen wie deren Rollen im Gespräch.
Weiterhin sollte vorab geklärt werden, ob mehrere Interviews mit einer
Kandidatin bzw. einem Kandidaten geführt werden sollen. Ist dies der
3.1 · Eignungsinterview
77 3
Fall, ist es nach Ansicht der DIN-Autorinnen und -Autoren (DIN, 2016,
S. 14) notwendig, die Inhalte der einzelnen Interviews vorab aufeinan-
der abzustimmen.

Durchführung
Im Gespräch setzen die Interviewenden die Vorgaben aus der Gesprächsablauf
Gesprächsvorbereitung um. Analog zum Interviewleitfaden empfiehlt
sich auch in der Durchführung eine grobe Dreiteilung des Gesprächs in
Gesprächseröffnung, Informationserhebungsphase sowie Gesprächsab-
schluss. Der Gesprächsbeginn umfasst dabei alle notwendigen Informa-
tionen zum kommenden Gesprächsverlauf, die Vorstellung aller Betei-
ligten und ihrer Rollen im Interview sowie den Aufbau einer stimmigen
Gesprächsatmosphäre.
Besonders bedeutsam ist die Nutzung des Interviewleitfadens bei Informationserhebung im
der Erhebung der zur Eignungsbeurteilung notwendigen anforderungs- Interview
relevanten Informationen. Je nach Anliegen kommen biografiebezogene
oder situative Fragen zum Einsatz, die in geeigneter Form formuliert
werden (7 Abschn. 3.1.4 „Planung und Vorbereitung“). Die Interview-
situation stellt eine komplexe Aufgabe dar. Die Interviewenden müssen
über die Fähigkeit und Bereitschaft verfügen, aussagekräftige Fragen zu
formulieren, gezielte Nachfragen zu stellen und gleichzeitig zu prüfen,
ob die Schilderungen für die geplante Eignungsbeurteilung ausreichen.
Darüber hinaus müssen sie den Interviewten die Möglichkeit geben,
relevante Inhalte darzustellen. Durch den Einsatz des Interviewleitfa-
dens und die damit einhergehende Beachtung von Strukturierungsas-
pekten wird bereits bei der Durchführung Verzerrungen durch Inter-
viewer/-innenfehler vorgebeugt. So sprechen beispielsweise besonders
in unstrukturierten Gesprächen die Interviewenden häufig mehr als die
Interviewten (z.B. Mayfield, 1964). Dadurch werden weniger Informa-
tionen erfasst und die spätere Urteilsbildung folglich verzerrt. Beim
Stellen der Fragen ist weiterhin zu beachten, dass lediglich rechtlich
zulässige Fragen gestellt werden (7 Abschn. 3.2) und dass der Umgang
mit den Interviewten jederzeit respektvoll und wertschätzend erfolgt.
Die Gleichbehandlung von Kandidatinnen und Kandidaten wird durch
die strikte Anforderungsorientierung und konsistente Nutzung des
Leitfadens befördert. Die Nutzung des Leitfadens schließt aber keines-
falls Nachfragen an die Interviewten aus.
In der abschließenden Phase des Interviews werden wesentliche Informationsaustausch im
Vereinbarungen zu Form und Zeitpunkt der Rückmeldung sowie zum Rahmen der Abschlussphase des
weiteren Vorgehen zwischen Interviewenden und Kandidatinnen und Interviews
Kandidaten getroffen. Weiterhin kann in dieser Phase die notwendige
realistische Schilderung der Tätigkeit durch die Interviewenden erfol-
gen, um im Sinne einer zweiseitigen Entscheidungssituation den Kan-
didatinnen und Kandidaten alle notwendigen Informationen für fun-
dierte Überlegungen zukommen zu lassen (DIN, 2016). Wichtig ist
auch, den Kandidatinnen und Kandidaten genügend Raum für eigene
Fragen zu geben und einen positiven Gesprächsabschluss zu finden.
78 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Protokollierung Um Erinnerungs- und Wiedergabefehler zu reduzieren und eine fun-


dierte Basis für die Auswertung des Interviews zu erhalten, müssen die
Antworten der Kandidatinnen und Kandidaten in jedem Fall protokolliert
werden. Laut DIN 33430 (DIN, 2016, S. 14) sind neben relevanten Beob-
achtungen sowohl der Interviewverlauf als auch Antworten auf Interview-
fragen festzuhalten. Im Text der DIN 33430 (DIN, 2016) werden keine
3 weiteren Aussagen zur Art der Protokollierung getroffen. Über diesen
Text hinausgehend kann die Empfehlung ausgesprochen werden, die Ant-
worten der Interviewten möglichst umfassend zu protokollieren, um als
Interviewende/-r nicht bereits zu diesem frühen Zeitpunkt eine Voraus-
wahl von Informationen vorzunehmen, die später nicht mehr korrigiert
werden kann. Nehmen mehrere Interviewende an einem Gespräch teil,
dann sind Mitschriften durch jeden einzelnen Interviewenden vorzuneh-
men, um anschließend eine unabhängige Beurteilung zu gewährleisten.

Auswertung
Auswertung muss regelgeleitet Nach DIN 33430 (DIN, 2016, S. 14) muss „die Auswertung von Interviews
erfolgen (…) regelgeleitet erfolgen“. Diese vorab zu definierenden Regeln betreffen
beispielsweise die Zuordnung und Gewichtung von Informationen zur
Beurteilung der Ausprägung einzelner Eignungsmerkmale, die Aggrega-
tion der Einschätzungen verschiedener Beurteilerinnen und Beurteiler
oder die Zusammenfassung der Beurteilungen zu einem Gesamturteil.
Sofern mehrere Personen mit Beurteilungsfunktion am Interview teilneh-
men, müssen die Bewertungen den Aussagen der DIN 33430 zufolge (DIN,
2016, S. 14) zunächst unabhängig voneinander vorgenommen werden.
Auswertungsprozess Jetter (2003) unterscheidet mehrere Schritte im Auswertungspro-
zess. Zunächst sind die gewonnenen Informationen den intendier-
ten Eignungsmerkmalen zuzuordnen. Dieses Vorgehen entspricht
dem „Verhaltensbeobachtungsansatz“ (7 Abschn. 2.2.3 „Theoretische
Grundannahmen zu freien und gebundenen Beobachtungsansätzen“).
Dies geschieht anhand der protokollierten Antworten der Interview-
ten (7 Abschn. 3.1.4 „Durchführung“), aus denen im Idealfall für alle
Eignungsmerkmale mehrere aussagekräftige Verhaltensstichproben
gewonnen werden können. Die Angaben der Interviewten werden
zunächst auf ihren Anforderungsbezug geprüft, und irrelevante Infor-
mationen werden verworfen. Die Antworten der Interviewten geben
dabei häufig nicht nur Aufschluss über ein Eignungsmerkmal, sondern
lassen sich verschiedenen Eignungsmerkmalen zuordnen.
Entscheidungsregeln vorab Die einem Eignungsmerkmal zugeordneten Informationen sind
festlegen anschließend zusammenzufassen und mit den Vorgaben des Anfor-
derungsprofils zu vergleichen. Hierbei sollte einer vorab festgelegten
Entscheidungsregel gefolgt werden, die definiert, welche Informationen
mit welchem Gewicht in die Bewertung der Ausprägung des Eignungs-
merkmals eingehen. So könnte eine vorab festgelegte Regel beispiels-
weise vorsehen, solchen Antworten auf Interviewfragen ein besonders
hohes Gewicht zuzuweisen, die den erfolgskritischen Verhaltensweisen
aus der Anforderungsanalyse (7 Abschn. 4.1) entsprechen.
3.1 · Eignungsinterview
79 3
Der Vergleich mit den Vorgaben des Anforderungsprofils stellt die Einstufung der Ausprägung der
Voraussetzung für den dritten Schritt der Auswertung dar: Für jedes Eignungsmerkmale
Eignungsmerkmal ist eine skalenmäßige Einstufung der Ausprägung
basierend auf den Beobachtungen aus dem Interview vorzunehmen.
Dies kann beispielsweise mithilfe verhaltensverankerter Beobach-
tungsskalen geschehen (7 Abschn. 2.2.3 „Individuelle Beurteilung“).
Die Nutzung dieser Skalen sollte vorab in einem Training thematisiert
und geübt worden sein, damit alle Beobachter/-innen gleichermaßen
vertraut mit den Beurteilungsinstrumenten sind. Dies trägt dazu bei,
dass Fehler oder Unterschiede bei der Anwendung vermieden werden
und ein einheitlicher Bewertungsmaßstab angewendet wird.
In der DIN 33430 (DIN 2016, S. 10) wird darauf hingewiesen, dass Mögliche Bildung eines
im Rahmen der Auftragsklärung festzulegen ist, ob und wie einzelne Gesamtwertes
erhobene Werte zu einem Gesamtwert zusammengefasst werden (zur
Bildung eines Gesamtwerts 7 Abschn. 2.2.3 „Integration der Einzel-
urteile“ und 7 Abschn. 4.1.6 sowie 7 Abschn. 6.3.2). Sofern eine Festle-
gung auf einen Gesamtwert erfolgte, sind abschließend die Einzelwerte
nach den entsprechenden Regeln zu einem Gesamtwert zusammenzu-
fassen. Beispielsweise könnte man sich darauf einigen, den Gesamtwert
über eine Summenbildung zu bestimmen, bei der die vorab festgelegte
Gewichtung der Eignungsmerkmale eingerechnet wird. Im Ergebnis
lägen dann ein Profil der Ausprägungen einzelner Eignungsmerkmale
und ein Gesamtwert vor.

3.1.5 Verzerrungen im Interviewprozess

Da es sich bei Eignungsinterviews um komplexe soziale Interaktio-


nen handelt, können verschiedene Verzerrungen im Interviewprozess
auftreten. Diese liegen einerseits auf Seiten der Interviewenden: Das
menschliche Denken folgt Heuristiken und Schemata. Außerdem ist die
menschliche Informationsverarbeitungskapazität begrenzt. Dadurch
kommt es zu den bereits in 7 Kap. 2 ausführlich besprochenen Fehlern
bei der Beobachtung und Bewertung auf Seiten der Interviewenden.
Andererseits können Verzerrungen auf Seiten der Interviewten auf-
treten, die durch Selbstdarstellung versuchen, sich in positiver Art und
Weise zu präsentieren. Im Folgenden werden Verzerrungen dargestellt,
die in Eignungsinterviews besonders relevant sind (vgl. Schuler, 2002).
Die Lektüre und das Verständnis des 7 Kap. 2 mit den grundlegenden
Ausführungen zum Prozess der Beobachtung und Bewertung sowie zu
Selbstdarstellungstechniken werden dabei vorausgesetzt.

Beobachtungs- und Bewertungsfehler im Interview


Verzerrungen treten in unstrukturierten Gesprächen in stärkerem Interviewspezifische
Maße auf als in Interviews mit höherem Strukturierungsgrad (vgl. Beobachtungs- und
Posthuma, Morgeson & Campion, 2002). Zu den relevanten Beobach- Bewertungsfehler
tungs- und Bewertungsfehlern zählen Effekte, die auf einer zu frühen
80 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Eindrucks- und Erwartungsbildung beruhen (in 7 Kap. 2 der Kategorie


„Beobachter/-innenbedingte Fehler bei der Rezeption der Informatio-
nen“ zugeordnet). Besonders bei niedrigem Strukturierungsgrad ten-
dieren Interviewende dazu, ihre Entscheidung zu einem sehr frühen
Zeitpunkt während des Gesprächs zu treffen. Auch das Phänomen des
ersten Eindrucks spielt in diesem Zusammenhang eine Rolle: Dieser
3 beeinflusst, wie nachfolgende Informationen von Interviewenden wahr-
genommen und interpretiert werden. So können beispielsweise Infor-
mationen aus Bewerbungsunterlagen in unstrukturierten Interviews
dazu führen, dass nur spezifische Aspekte erfragt, andere aber nicht the-
matisiert werden. Vorab gebildete Erwartungen können also das Verhal-
ten der Interviewenden beeinflussen, was wiederum auf das Verhalten
der Interviewten wirkt und somit in einer sich selbst erfüllenden Pro-
phezeiung mündet. Darüber hinaus ist bekannt, dass Personen auch im
Interview zu einer Bestätigungstendenz neigen, d.h. bei der Informa-
tionssammlung vorrangig die Informationen aufnehmen, die das eigene
Bild bestätigen. Letztendlich können alle Beobachtungs- und Bewer-
tungsfehler, die in 7 Kap. 2 beschrieben wurden (z.B. Sympathie/Anti-
pathie, Halo-Effekt usw.), auch im Interview auftreten. Ferner können
Reihenfolge- und Kontrasteffekte auftreten, beispielsweise durch die
Abfolge der Interviews. Die Bewertung einer Kandidatin oder eines
Kandidaten wird dabei durch vorauslaufende Interviews beeinflusst.

Exkurs

Regelmäßige Prüfung des Vorgehens im Interviewprozess


In der Forschung (Chapman & allerdings ebenfalls Belege dafür, die relevanten Kriterien für
Zweig, 2005; Huffcutt & dass Interviewende ihre eigenen einen qualitativ hochwertigen
Woehr, 1999) zur Güte von Interviews im Laufe der Zeit Interviewprozess in der Planung,
Eignungsinterviews hat sich gezeigt, modifizieren und sich dadurch Durchführung und Auswertung
dass Trainings (7 Abschn. 3.1.4 nicht mehr in gleicher Weise an von Eignungsinterviews. Das
„Planung und Vorbereitung“) Vorgaben halten (Dipboye, 1994). Instrument wird eingesetzt, um
das Auftreten von Fehlern Eine kontinuierliche Überprüfung durch regelmäßige Prüfung des
vermindern können, da sich des eigenen Vorgehens kann dem eigenen Vorgehens dem Abweichen
trainierte Interviewende eher an entgegenwirken. Eine Möglichkeit von strukturierten Vorgehensweisen
die Vorgaben zur strukturierten zur Umsetzung liegt mit dem entgegenzuwirken. Dabei
Erfassung von Informationen halten Diagnoseinstrument zur Erfassung können wahlweise das Vorgehen
und damit auch Beobachtungs- der Interviewerkompetenz in der in einzelnen Gesprächen
und Bewertungsfehler weniger Personalauswahl (DIPA; Strobel & oder aber mehrere Gespräche
Raum haben. Es finden sich Westhoff, 2009) vor. Es umfasst zusammenfassend beurteilt werden.

Selbstdarstellungsstrategien
Kandidatinnen und Kandidaten möchten in der Regel bei der internen
oder externen Personalauswahl einen guten Eindruck hinterlassen, um
ihre Chancen auf eine Beförderung oder Einstellung zu erhöhen. In
7 Kap. 2 wurden die Selbstdarstellungstechniken erläutert (7 Abb. 2.8),
3.1 · Eignungsinterview
81 3
und es wurde darauf hingewiesen, dass die Anzahl und Art der einge-
setzten Selbstdarstellungstechniken je nach Verfahren variieren. Im
Interview wenden die meisten, wenn nicht sogar alle Interviewten (vgl.
Levashina & Campion, 2007) Selbstdarstellungstechniken an, wobei die
Frage, wie problematisch dies für die Aussagekraft des Interviews ist,
von verschiedenen Seiten betrachtet werden kann (7 Exkurs „Selbst-
darstellung in Eignungsinterviews – Fluch oder Segen?“).
In Bezug auf die in 7 Abschn. 2.2.5 „Fehlereinflüsse und mögli- Häufigkeit verschiedener
che Gegenmaßnahme“ eingeführte Unterscheidung zwischen asser- Selbstdarstellungstechniken in
tiven (z.B. Selbstaufwertungen, Einschmeichelungen) und defensiven Interviews
Techniken (z.B. Rechtfertigungen, Entschuldigungen) kann festge-
halten werden, dass die Kandidatinnen und Kandidaten in Eignungs-
interviews häufiger assertive als defensive Selbstdarstellungsstrategien
nutzen. Dabei sind unter den assertiven Techniken die Selbstaufwer-
tungen häufiger als Einschmeichelungen (Ellis, West, Ryan & DeShon,
2002; Stevens & Kristof, 1995).
Betrachtet man den Wahrheitsgehalt der Selbstdarstellungsinhalte,
lässt sich eine leichte Form des Versuchs, bei dem Interviewenden einen
guten Eindruck zu hinterlassen, von einer schweren Form unterschei-
den. Bei der „leichten Eindrucksbildung“ werden Inhalte zwar über-
trieben dargestellt, aber nicht erfunden. Bei der „schweren Eindrucks-
bildung“ dichten die Kandidatinnen und Kandidaten hingegen etwas
dazu und berichten beispielsweise über Erfahrungen, die sie nicht
gemacht haben. Schwere Eindrucksbildung wird im Interview selte-
ner gebraucht als andere Formen der Selbstdarstellung (Levashina &
Campion, 2007).
Bei situativen Fragen wird im Allgemeinen häufiger Selbstdarstel- Selbstdarstellung bei
lung gezeigt als bei biografiebezogenen Fragen. Dies trifft spezifisch verschiedenen Fragetypen
auf assertive Strategien sowie auf eine leichte Eindrucksbildung zu,
während bezüglich der Häufigkeit von schwerer Eindrucksbildung
sowie defensiven Strategien keine Unterschiede zwischen den Frage-
typen zu bestehen scheinen (Levashina & Campion, 2007).
Bei biografiebezogenen Fragen sind Selbstaufwertungen häufiger,
bei situativen Fragen hingegen Einschmeichelungen (Levashina et al.,
2014). Das ist der Natur der Fragen geschuldet: Während bei biografie-
bezogenen Fragen eigene Erfolge hervorgehoben, Misserfolge hingegen
verborgen werden können, bleibt bei situativen Fragen mehr Raum,
Äußerungen an die Werte und Erwartungen anzupassen, die Organi-
sation oder Interviewende vermeintlich haben.
Personalverantwortliche empfinden eine moderate Form der Selbst- Selbstdarstellung führt zu
darstellung (z.B. positive Eignungsmerkmale betonen, negative Eig- besseren Interviewergebnissen
nungsmerkmale herunterspielen) als angemessen in Auswahlsituatio-
nen, während sie Lügen als unangemessen betrachten (Jansen, König,
Stadelmann & Kleinmann, 2012). Wie metaanalytische Befunde zeigen,
beeinflusst Selbstdarstellung die Ergebnisse von Eignungsinterviews
(Barrick, Schaffer & DeGrassi, 2009; Levashina et al., 2014): Personen,
82 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

die häufiger Selbstdarstellungstechniken einsetzen, erzielen bessere


Interviewergebnisse.
Strukturierung schwächt Auch bezüglich des Raums, den die Selbstdarstellung der Kandi-
den Einfluss von Selbstdarstellung datinnen und Kandidaten im Interview einnimmt, spielt der Grad der
ab Strukturierung von Eignungsinterviews eine wichtige Rolle. Struktu-
rierung hat zunächst per se keinen Einfluss auf die Auftretenshäufig-
3 keit von Selbstdarstellung. Auch in strukturierten Gesprächen wendet
der Großteil der Interviewten Selbstdarstellungstechniken an (z.B. Ellis
et al., 2002). Ein höherer Strukturierungsgrad trägt aber dazu bei, dass
Selbstdarstellung einen geringeren Einfluss auf die Interviewergebnisse
hat (vgl. Metaanalyse von Barrick et al., 2009). So kann eine struktu-
rierte Auswertung nach expliziten Regeln beispielsweise dazu führen,
dass die Aufmerksamkeit der Interviewenden auf anforderungsrele-
vante Informationen und weniger stark auf irrelevante Informationen
gelenkt wird.

Exkurs

Selbstdarstellung in Eignungsinterviews – Fluch oder Segen?


Während die frühere Erfolg der Selbstdarstellung im anzupassen, stellt einen wichtigen
Forschung Selbstdarstellung in späteren Beruf sein. Tatsächlich Teil sozialer Effektivität dar, die
Eignungsinterviews allein als Quelle liegen Hinweise darauf vor, dass auch im Berufsleben eine Rolle
von Fehleinschätzungen betrachtete, Personen, die in Eignungsinterviews spielt (Melchers, Ingold, Wilhelmy &
wird heute verstärkt diskutiert, häufiger Selbstdarstellung einsetzen, Kleinmann, 2015). Selbstdarstellung
ob diese wirklich ausschließlich auch im Beruf bessere Leistungen in Eignungsinterviews kann
negativ zu betrachten ist. In vielen zeigen (Barrick et al., 2009). deshalb sogar dazu führen, dass
Berufen stellt Selbstdarstellung eine Selbstdarstellung setzt voraus, dass die aus den Interviews abgeleiteten
eigenständige Anforderung dar. Personen die Anforderungen einer Eignungsbeurteilungen eine höhere
Der Erfolg der Selbstdarstellung Situation erkennen. Die Fähigkeit, Treffsicherheit bei der Vorhersage
in Eignungsinterviews könnte Anforderungen zu erkennen und von Ausbildungs- und Berufserfolg
insofern aussagekräftig für den das eigene Verhalten an diese erzielen.

Verzerrungen bei Gesprächen mit Dritten


Auch bei Gesprächen mit Dritten, z.B. Referenzgeberinnen und
-gebern, können Verzerrungen auftreten. Da nur Personen befragt
werden dürfen, deren Befragung die Kandidatinnen und Kandida-
ten zugestimmt haben, ist in der Regel eher mit einer beschönigenden
Tendenz zu rechnen. Beispielsweise können Referenzgeberinnen und
-geber von der Wohlwollenspflicht beeinflusst sein, die für das Ver-
fassen von Arbeitszeugnissen gilt. Möglicherweise ist die Auskunfts-
person der Kandidatin oder dem Kandidat gegenüber tatsächlich oder
gefühlt „etwas schuldig“. Viele der hier im Kapitel dargestellten Tipps
zur Gesprächsführung gelten auch für das Gespräch mit Dritten. Ins-
besondere sollten auch diese Gespräche strukturiert erfolgen und die
Fragen in diesen Gesprächen immer auf konkretes, anforderungsrele-
vantes Verhalten bezogen sein.
3.1 · Eignungsinterview
83 3
3.1.6 Fazit

Die DIN 33430 (DIN, 2016) unterscheidet bei direkten mündlichen


Befragungen zwischen Interviews mit Kandidatinnen und Kandidaten
(Selbstbericht) sowie Interviews mit Referenzgeberinnen und -gebern
(Fremdbericht). Interviews stellen weit verbreitete und akzeptierte Ver-
fahren der Eignungsbeurteilung dar. Sie haben sich in einer langen For-
schungstradition als Instrumente erwiesen, aus denen gültige Vorhersa-
gen des Ausbildungs- und Berufserfolgs abgeleitet werden können. Die
Aussagekraft der Vorhersagen wird dabei maßgeblich durch die Struk-
turierung des Interviewprozesses positiv beeinflusst. Die Strukturierung
umfasst beispielsweise die anforderungsorientierte Planung, Durch-
führung und Auswertung der Gespräche, die Nutzung von Interview-
leitfäden, die Verwendung günstiger Frageformen (z.B. biografiebezo-
gene und/oder situative Fragen), eine Protokollierung der Antworten
der Interviewten sowie eine regelgeleitete Auswertung der gewonnenen
Informationen. Die Strukturierung des Interviewprozesses trägt dazu
bei, Verzerrungen im Interviewprozess (z.B. aufgrund von beobach-
ter/-innenbedingten Beobachtungs- und Bewertungsfehlern oder der
Selbstdarstellung der Kandidatinnen und Kandidaten) zu minimieren.

? Kontrollfragen zu 7 Abschn. 3.1


1. Welche Arten direkter mündlicher Befragungen lassen sich
unterscheiden?
2. Was bedeutet Strukturierung im Interview? Verdeutlichen Sie
dies an verschiedenen Komponenten der Interviewstruktur
bzw. deren Entsprechung in der DIN 33430 (DIN, 2016).
3. Wie unterscheiden sich biografiebezogene und situative
Fragen voneinander?
4. Welche Probleme entstehen bei einer unstrukturierten
Auswertung von Gesprächen?

Weiterführende Literatur

Die folgenden Quellen geben jeweils detaillierte Umsetzungshinweise zur Gestal-


tung des Interviewprozesses:
Arbeitskreis Assessment Center (2008). Interview-Standards.
Die „Interview-Standards“ des Arbeitskreis Assessment Center e.V. (2008) sind eine
detaillierte Zusammenstellung von Handlungsempfehlungen zum strukturierten
Vorgehen im gesamten Interviewprozess. Die Standards basieren auf gut bestätigten
Befunden zu den einzelnen Phasen des Interviews und leiten daraus praktikable
Umsetzungshinweise ab. Sie werden jeweils in Form eines Kernsatzes mit der Haupt-
aussage des Standards dargestellt. Dem folgt eine kurze Erläuterung des damit ein-
hergehenden Nutzens. Konkrete Hinweise zeigen dann, wie der Standard in der Arbeit
mit dem Interview umgesetzt werden sollte, während abschließend Beispiele für Ver-
stöße das nicht-erwünschte Vorgehen illustrieren online verfügbar unter. http://www.
arbeitskreis-ac.de/images/attachments/149_akac-interview-standards.pdf
Jetter (2003). Effiziente Personalauswahl. Durch strukturierte Einstellungsgespräche die
richtigen Mitarbeiter finden (2. Aufl.). Stuttgart: Schäffer-Poeschel.
Schuler, H., & Mussel, P. (2016). Einstellungsinterviews vorbereiten und durchführen.
Göttingen: Hogrefe.
84 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

3.2 Zulässigkeit von Fragen,


Offenbarungspflichten und Rechtsfolgen

Ingo Püttner und Martin Kersting

3 In einem Interview sind aus rechtlicher Sicht zwei sich


widersprechende Ziele zu berücksichtigen. Die Arbeitgeberin/
der Arbeitgeber möchte sich ein möglichst zutreffendes Bild über
die Eignung der Kandidatinnen und Kandidaten verschaffen.
Die Kandidatinnen und Kandidaten möchten ihre Privatsphäre
schützen. Im folgenden Beitrag wird erläutert, wie sich aus
der Abwägung dieser Zielstellungen die Zulässigkeit und
Unzulässigkeit von Interviewfragen ergibt. Dabei sind auch
die besonderen Umstände des Einzelfalls zu berücksichtigen.
Beispielsweise erwarten Tendenzbetriebe, dass ihre Mitarbei-
ter/-innen die besonderen Ziele dieser Organisationen
mittragen – darauf gerichtete Fragen sind zulässig. Schließlich
wird dargestellt, welche Rechtsfolgen unzulässige Fragen
haben und wie man mit Informationen umgehen sollte, die die
Kandidatinnen und Kandidaten von sich aus preisgeben, nach
denen man aber nicht hätte fragen dürfen. Für die Befragung von
Referenzgeberinnen und -gebern gelten, wie aufgezeigt wird,
weitgehend die gleichen Regeln.

3.2.1 Informationsinteresse der Arbeitgeberin/des


Arbeitgebers versus Persönlichkeitsrecht der
Kandidatinnen und Kandidaten

Das Persönlichkeitsrecht begrenzt Bei einer Befragung der Kandidatinnen und Kandidaten sowie von
das Informationsinteresse dritten Personen (z.B. Referenzgeberinnen und -gebern) dürfen nur
zulässige Fragen gestellt werden – dies wird auch in der DIN (2016)
betont. Die rechtliche Zulässigkeit ergibt sich dabei, wie bereits in
7 Abschn. 1.3 erläutert, aus einer Abwägung zwischen dem berechtig-
ten Informationsinteresse der Arbeitgeberin/des Arbeitgebers sowie
dem Recht der Kandidatinnen und Kandidaten auf Schutz ihrer Per-
sönlichkeit. Das Interesse der Arbeitgeberin/des Arbeitgebers beim
Einsatz jeglicher Auswahlverfahren besteht darin, die Eignung der
Kandidatinnen und Kandidaten für den freien Arbeitsplatz möglichst
umfassend zu ermitteln. Das Ziel der Arbeitgeberin/des Arbeitgebers,
auf diese Weise die bestmöglichen Beschäftigten zu gewinnen, ist als
Ausfluss der Berufsfreiheit nach Art. 12 Grundgesetz (GG) rechtlich
anerkannt. Auf der anderen Seite sind Kandidatinnen und Kandida-
ten daran interessiert, nicht alle Einzelheiten ihres Charakters und
ihrer Privat- oder gar Intimsphäre preiszugeben. Davor schützt sie das
3.2 · Zulässigkeit von Fragen, Offenbarungspflichten und Rechtsfolgen
85 3
allgemeine Persönlichkeitsrecht, abgeleitet aus den verfassungsrecht-
lichen Grundrechten der Menschenwürde (Art. 1 Abs. 1, GG) und der
freien Entfaltung der Persönlichkeit (Art. 2 Abs. 1 GG) (7 Abschn. 1.3
zum Persönlichkeitsschutz). Mit Blick auf die Praxis im Arbeitsleben
geht der Gesetzgeber davon aus, dass es zum Schutz der Beschäftig-
ten einschließlich der Stellenbewerber/-innen geboten ist, die Grenzen
der Informationsgewinnung durch die Arbeitgeberin/den Arbeitgeber
gesetzlich näher zu regeln. Nach § 32 Abs. 1 Bundesdatenschutzgesetz
(BDSG) (7 Abschn. 4.3) dürfen personenbezogene Daten eines Beschäf-
tigten nur erhoben, verarbeitet und genutzt werden, wenn es für die Ent-
scheidung über die Einstellung erforderlich ist, wobei es auf die Form
der Datenerhebung (automatisiert/nicht automatisiert) nicht ankommt
– ein Grundsatz, der über das Eignungsinterview hinaus für alle Kate-
gorien von Verfahren gilt (zu den Verfahrenskategorien 7 Abschn. 4.2).
Erforderlich ist die Datenerhebung nur, soweit sie berufs- und anforde-
rungsbezogene Informationen umfasst. Insofern füllen die in der DIN
(2016) formulierten Anforderungen an direkte mündliche Befragun-
gen den unbestimmten Rechtsbegriff der „Erforderlichkeit“ mit Inhalt.
Mangels einer detaillierten gesetzlichen Regelung zu einzelnen Arbeit-
geberinnen-/Arbeitgeberfragen orientiert sich die Praxis an der Recht-
sprechung der Arbeitsgerichte, insbesondere des Bundesarbeitsgerichts.

3.2.2 Zulässige, anforderungsbezogene Fragen

Zulässig sind alle Fragen, die sich auf die Anforderungen des in Aussicht
genommenen Arbeitsplatzes und die Inhalte des Arbeitsverhältnisses
beziehen. Im Einzelnen sind das Fragen zu den Themen Qualifikation
und berufliche Erfahrung, Einsatzfähigkeit und Vertragsbedingungen.

> Zulässige Fragethemen


44 Qualifikation und Berufserfahrung
44 Schul-/Studienabschlüsse
44 berufliche Qualifikation(en)
44 Fachkenntnisse
44 Sprachkenntnisse (soweit sie für die Tätigkeit von Belang
sind)
44 beruflicher Werdegang
44 berufliche Erfahrungen (auch die Fragen nach Erfolgen/
Misserfolgen)
44 Einsatzfähigkeit
44 Arbeitseinstellung/-motivation
44 Weiterbildungspotenzial, zeitliche Flexibilität,
Schichtdienst
44 Einschränkungen bei der Arbeitsausübung
(also nicht die abstrakte Frage nach der
Schwerbehinderteneigenschaft)
86 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

44 Krankheiten – nur soweit sie ins Arbeitsverhältnis


wirken (z.B. beim Umgang mit Lebensmitteln oder im
Gesundheitsbereich)
44 Alkohol-/Drogenabhängigkeit
44 Vertragsbedingungen
44 Gehaltsvorstellung
3 44 früheres Gehalt – nur zulässig, wenn die Frage für das neue
Arbeitsverhältnis relevant ist
44 Arbeitserlaubnis
44 möglicher Einstellungszeitpunkt
zu allen Fragethemen s. Müller-Glöge (2016) § 611 BGB Rn. 272
ff. mit Nachweisen der Rechtsprechung

Am Beispiel der Frage nach Behinderungen zeigt sich die Bedeutung


der Anforderungsbezogenheit: Für den Arbeitsplatz einer Bauleiterin/
eines Bauleiters darf erfragt werden, ob der Kandidat/die Kandidatin
auf 20 m hohe Gerüste steigen kann. Nicht anforderungsbezogen wäre
die Frage, ob er/sie schwerbehindert ist. Die Schwerbehinderung könnte
auch Auswirkungen haben, die für den konkreten Arbeitsplatz bedeu-
tungslos sind.

> Speziellere zulässige Fragethemen


Zulässige Fragen zu speziellen Beispiele für speziellere zulässige Fragethemen:
Themen 44 Fähigkeit und Bereitschaft zum Außendienst
44 Fahrerlaubnis („Führerschein“)
44 Einverständnis mit betrieblichem Rauchverbot
44 Bereitschaft, die vorgesehene Betriebskleidung/Uniform zu
tragen
44 einschlägige Vorstrafen (nur berufsbezogene; anzugeben sind
nur Verurteilungen, die in ein polizeiliches Führungszeugnis
aufzunehmen wären)
44 frühere Tätigkeit für das MfS der DDR, nach 1970 (nur für den
öffentlichen Dienst)
44 Bereitschaft, den Wohnsitz in die Nähe des Arbeitsorts zu
verlegen – zulässig, wenn eine kurzfristige Aufnahme der
Arbeit möglich sein muss (Rufbereitschaft)
44 Versetzungsbereitschaft
44 nachwirkendes Wettbewerbsverbot aus einer früheren
Beschäftigung

Offene Fragen, bei denen es freigestellt ist, wie geantwortet wird, sind
ebenfalls zulässig (Beispiel: „Was möchten Sie uns noch über sich mit-
teilen?“). Auch Fragen, die – meist am Beginn des Gesprächs – zum
Aufbau der Kommunikation gestellt werden, sind unbedenklich, z.B.
nach der Anreise.
Anforderungsbezogene Fragen – Strukturierte Interviews (7 Abschn. 3.1.2) müssen gemäß der DIN
rechtlich geboten und auch von (2016) anforderungsbezogen konzipiert sein (7 Abschn. 4.1). Sie dürfen
der DIN verlangt keine unzulässigen Fragen (siehe unten) enthalten. Wenn die Vorgaben
3.2 · Zulässigkeit von Fragen, Offenbarungspflichten und Rechtsfolgen
87 3
der DIN eingehalten werden, billigt die Rechtsprechung der Arbeitge-
berin/dem Arbeitgeber einen Ermessens- und Beurteilungsspielraum
bei der Ausgestaltung der Interviews zu (Verwaltungsgericht (VG) Neu-
stadt (Weinstraße) 07.09.2011 – Aktenzeichen 1 K 382/11. NW – juris).
Das bedeutet, dass das Gericht im Fall eines Rechtsstreits nicht jede
Frage einzeln überprüft.

3.2.3 Unzulässige Fragen

Unzulässig sind alle Fragen, die sich nicht auf berufs- und anforde-
rungsbezogene Informationen richten. Ihr Einsatz ist nicht rechtmäßig,
kommt aber in der Praxis immer wieder vor.

> Unzulässige Fragethemen


44 Enger Persönlichkeitsbereich
44 Schwangerschaft
44 Familienstand, Familienplanung, Übernahme von
Familien- oder Pflegeaufgaben
44 sexuelle Orientierung
44 Behinderung/Schwerbehinderteneigenschaft (abstrakt)
44 Gesundheitszustand (allgemein; zu zulässigen Fragen
nach Krankheiten, 7 Abschn. 3.2.2)
44 genetische Veranlagung (§ 19 Gendiagnostikgesetz,
GenDG)
44 Eigenschaft als Raucher/-in oder Nichtraucher/-in
44 Werteorientierung
44 religiöses Bekenntnis/Weltanschauung
44 Gewerkschaftszugehörigkeit
44 politische Einstellung, Mitgliedschaft in einer Partei
44 abgeleisteter Wehr- oder Zivildienst
44 Herkunft
44 ethnische Zugehörigkeit
44 Staatsangehörigkeit (vgl. oben die zulässige Frage nach
der Arbeitserlaubnis)
44 Vermögen
44 private Vermögensverhältnisse
44 Gehaltspfändungen, -abtretungen (nur zulässig bei
Beschäftigung in besonderen Vertrauenspositionen)
zu den Einzelheiten s. Müller-Glöge (2016) § 611 BGB Rn. 272 ff.

Für den öffentlichen Dienst wird auch in § 7 Abs. 2 des Bundesgleich-


stellungsgesetzes (BGleiG) betont, dass insbesondere Fragen nach dem
Familienstand, einer bestehenden oder geplanten Schwangerschaft
sowie nach bestehenden oder geplanten Familien- oder Pflegeaufga-
ben unzulässig sind. Unzulässig sind Fragen, die in den
Ausnahmen von diesen Grundsätzen gelten für Beschäftigungen in geschützten Privatbereich gehen
tendenziösen Organisationen (7 Abschn. 3.2.4).
88 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

3.2.4 Besonderheiten in tendenziösen


Organisationen

Tendenzbetriebe dürfen das Sogenannte „Tendenzbetriebe“ (Religionsgemeinschaften, Parteien,


Mittragen ihrer Zielsetzung Medienunternehmen, s. den Katalog in § 118 Betriebsverfassungsgesetz
überprüfen (BetrVG)), Gewerkschaften und Arbeitgeberinnen- und Arbeitgeber-
3 verbände, aber auch Lobbyistenvereinigungen und sonstige Organisa-
tionen, deren Ziel es ist, eine bestimmte Idee zu fördern, erwarten von
ihren Mitarbeiter/-innen ein Mittragen dieser besonderen Zielsetzung.
Dies ist legitim und hat auch Niederschlag in den gesetzlichen Rege-
lungen gefunden. Für die Beschäftigten von Religionsgemeinschaften
und ihre Einrichtungen (Beispiel: kirchliche Kindertagesstätten) sowie
von sonstigen Weltanschauungsvereinigungen gehören nach § 9 Allge-
meines Gleichbehandlungsgesetz (AGG) nicht nur die jeweilige Mit-
gliedschaft, sondern auch „ein loyales und aufrichtiges Verhalten im
Sinne ihres jeweiligen Selbstverständnisses“ zu den gerechtfertigten
beruflichen Anforderungen. Also sind darauf gerichtete Fragen zuläs-
sig. Andere tendenziöse Organisationen dürfen im Rahmen eines recht-
mäßigen Zwecks angemessene berufliche Anforderungen stellen und
durch Fragen abprüfen. Beispielsweise wäre das bei einer Partei die
Frage nach der politischen Einstellung. Soweit nach der Art der Tätig-
keit oder der Bedingungen der Ausübung bestimmte wesentliche und
entscheidende berufliche Anforderungen bestehen, ist sogar nach § 8
Abs. 1 AGG eine unterschiedliche Behandlung und damit Befragung
hinsichtlich der in § 1 AGG genannten verbotenen Differenzierungs-
merkmale zulässig. (Beispielsweise ist die Frage nach der sexuellen
Orientierung zulässig für eine Beschäftigung in der Öffentlichkeits-
arbeit eines Schwulen- und Lesbenverbandes).

3.2.5 Rechtsfolgen unzulässiger Fragen

Wenn unzulässige Fragen gestellt werden, muss den Kandidaten/-innen


die Möglichkeit offenstehen, weiter erfolgreich am Auswahlverfahren
teilzunehmen, ohne Informationen weiterzugeben, zu deren Offenba-
rung sie rechtlich nicht verpflichtet sind. Neben der Möglichkeit, zu
schweigen oder ausweichend zu antworten (beides könnte verdäch-
tig erscheinen), billigt die Rechtsprechung in dieser Gesprächssitua-
tion auch unwahre Auskünfte („Recht zur Lüge“, Bundesarbeitsgericht
(BAG) 05.12.1957 – Az. 1 AZR 594/56 - juris; BAG 21.02.1991 – Az.
2 AZR 449/90 - NJW 1991, 2723). Aufgrund einer falschen Antwort
auf eine unzulässige Frage darf die Arbeitgeberin/der Arbeitgeber
den Arbeitsvertrag nicht später (wenn er die Täuschung erkannt hat)
anfechten (§ 123 Bürgerliches Gesetzbuch (BGB)).
Das Recht zur Lüge Wenn sich die unzulässige Frage auf verbotene Differenzierungs-
merkmale aus dem Katalog nach § 1 AGG bezieht, stehen dem/der
Betroffenen wegen diskriminierender Benachteiligung Ansprüche
auf Schadensersatz und Entschädigung nach § 15 AGG zu. Während
3.2 · Zulässigkeit von Fragen, Offenbarungspflichten und Rechtsfolgen
89 3
sich der Schadensersatz auf konkrete Vermögensnachteile (z.B. die
Gehaltsdifferenz bei Nicht-Beförderung) bezieht, richtet sich die Ent-
schädigung auf den immateriellen Schaden durch die Benachteiligung
(maximal drei Monatsgehälter).

z Zurechnung von Fehlverhalten bei Fragen


Die juristische Verantwortung für Fehler im Bewerbungs- und Aus- Wer trägt die juristische
wahlverfahren trägt allein die Arbeitgeberin/der Arbeitgeber – er/sie Verantwortung für Fehler im
ist nämlich der/die potenzielle Vertragspartner/-in. Ein Fehlverhalten Auswahlverfahren?
von Personen, die sie/er dabei zur Hilfe nimmt (z.B. externe Dienstleis-
ter/-innen und externe Eignungsdiagnostiker/-innen), muss sie/er sich
zurechnen lassen (BAG 23.01.2014 – 8 AZR 118/13 - NJW 1996, 2323).
Das gilt auch für weitere Teilnehmer/-innen an Auswahlgesprächen wie
Mitglieder von Mitarbeiter/-innenvertretungen (Betriebsrat, Perso-
nalrat, Schwerbehindertenvertretung) und Gleichstellungsbeauftragte.

> Offenbarungspflichten
Umstände, die die Erfüllung des Arbeitsverhältnisses
vollständig unmöglich machen, hat die Kandidatin/der
Kandidat von sich aus mitzuteilen. Dies gebietet die Rücksicht-
nahmepflicht im vorvertraglichen Anbahnungsverhältnis zur
Arbeitgeberin/zum Arbeitgeber (§ 311 Abs. 2 i. V. m. § 241
Abs. 2 BGB).
Beispiele wären die Alkoholabhängigkeit einer Kraftfahrerin/
eines Kraftfahrers oder ein tätigkeitshinderndes
Wettbewerbsverbot für Mitarbeiter/-innen im Vertrieb.

3.2.6 Umgang mit Informationen, nach denen man


nicht hätte fragen dürfen

So minutiös ein Interview oder eine mündliche Befragung geplant sein


mag – in der Praxis kommt es immer wieder vor, dass Kandidatin-
nen und Kandidaten spontan Dinge mitteilen, nach denen sie niemand
gefragt hat und womöglich auch nicht hätte fragen dürfen, z.B. nach der
sexuellen Orientierung.

Praxistipp

Bei Fällen des „Outings“ ist erhöhte Vorsicht geboten: Zwar sind
weder Eignungsdiagnostiker/-innen noch Beobachter/-innen,
die an direkten mündlichen Befragungen beteiligt sind,
noch sonstige Anwesende bei einer mündlichen Befragung
gezwungen, ihre Ohren zu verschließen. Sie dürfen die ungefragt
geäußerten Informationen entgegennehmen, sollten sie aber
weder kommentieren („das ist ja ein mutiger Schritt von Ihnen,
sich hier zu offenbaren … “) noch nachfragen („Glauben Sie,
90 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

dass Homosexualität in unserem Betrieb von Vorteil ist?“). Denn


auf diese Weise setzen die Gesprächsteilnehmer/-innen sehr
schnell Indizien für eine Ungleichbehandlung in die Welt, die die
Personalentscheidung angreifbar machen können. Gerade wenn
sich die Kandidatin/der Kandidat gezielt zu Themen aus dem
3 Katalog der verbotenen Fragen äußert, sollte die Interviewerin/
der Interviewer diesen Punkt unkommentiert übergehen und
so mit dem Interview fortfahren, wie es im Interviewleitfaden
vorgesehen ist.

Der Umgang mit aufgedrängten Ansonsten gilt auch für freiwillig mitgeteilte Informationen, dass sie
Informationen wahr sein müssen. Andernfalls könnte sich die Arbeitgeberin/der
Arbeitgeber später im Wege der Anfechtung wegen arglistiger Täu-
schung (§ 123 BGB) vom Vertrag lösen.

3.2.7 Befragung von Referenzgeberinnen und


-gebern

Bei der Befragung von Zu der Verfahrenskategorie „direkte mündliche Befragungen“ zählen
Referenzgebern gelten dieselben nach DIN (2016) nicht nur direkte Befragungen der Kandidatinnen
rechtlichen Grenzen und Kandidaten (Eignungsinterview), sondern auch Befragungen
dritter Personen zu den Kandidatinnen und Kandidaten, z.B. durch
Einholen mündlicher Referenzen. Wenn Fragen an Dritte, die der
Kandidat/die Kandidatin als Referenz benannt hat, gerichtet werden,
gelten dieselben rechtlichen Grenzen wie bei einer Befragung des Kan-
didaten/der Kandidatin selbst. Auskünfte darf eine frühere Arbeitge-
berin/ein früherer Arbeitgeber oder ein anderer Dritter nur im Ein-
verständnis mit dem/der Betroffenen erteilen. Die bloße Nennung
früherer Arbeitgeber/-innen im Lebenslauf beinhaltet keine derartige
Einwilligung.

3.2.8 Fazit

Aus rechtlicher Sicht sind nur anforderungsbezogene Fragen zuläs-


sig. Wenn unzulässige Fragen gestellt werden, darf ein Kandidat/eine
Kandidatin auch falsche Angaben machen, um seine/ihre Chancen im
Auswahlverfahren zu wahren. Zusätzlich können unzulässige Fragen
eine (verbotene) Diskriminierung begründen und zu Ersatzansprüchen
nach dem AGG führen. Ein Fehlverhalten eines Beteiligten wird immer
der Arbeitgeberin/dem Arbeitgeber zugerechnet. Bei aufgedrängten
Informationen ist Vorsicht geboten.
Literatur
91 3
? Kontrollfragen zu 7 Abschn. 3.2
1. Wie unterscheiden sich zulässige von unzulässigen Fragen?
2. Gibt es auch Umstände, auf die ein Kandidat/eine Kandidatin
von sich aus hinweisen muss?
3. Wie gehe ich mit einem „Outing“ im Interview um?
4. Welche Grenzen gelten bei der Befragung von Referenzge-
berinnen und -gebern?

Weiterführende Literatur
Schaub, G. (2015). Arbeitsrechtshandbuch (16. Aufl.). München: Beck
Wisskirchen, G., & Bissels, A. (2007). Das Fragerecht des Arbeitgebers bei Einstellung
unter Berücksichtigung des AGG. NZA 169.

Literatur

Literatur zu 7 Abschn. 3.1


Anderson, N., Salgado, J. F., & Hülsheger, U. R. (2010). Applicant reactions in selection:
Comprehensive meta-analysis into reaction generalization versus situational
specificity. International Journal of Selection and Assessment, 18, 291–304.
Arbeitskreis Assessment Center e.V. (2008). Interview-Standards. http://www.
arbeitskreis-ac.de/attachments/149_akac-interview-standards.pdf (Zugriff:
03.12.2015).
Barrick, M. R., Shaffer, J. A., & DeGrassi, S. W. (2009). What you see may not be what
you get: Relationships among self-presentation tactics and ratings of interview
and job performance. Journal of Applied Psychology, 94, 1394–1411.
Campion, M. A., Palmer, D. K., & Campion, J. E. (1997). A review of structure in the
selection interview. Personnel Psychology, 50, 655–702.
Chapman, D. S., & Zweig, D. I. (2005). Developing a nomological network for inter-
view structure: Antecedents and consequences of the structured selection
interview. Personnel Psychology, 58, 673–702.
Conway, J. M., Jako, R. A., & Goodman, D. F. (1995). A meta-analysis of interrater and
internal consistency reliability of selection interviews. Journal of Applied Psycho-
logy, 80, 565–579.
DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Dipboye, R. L. (1994). Structured and unstructured selection interviews: Beyond the
job-fit model. In G. R. Ferris (Hrsg.), Research in Personnel and Human Resources
Management (12. Aufl., S. 79–123). Greenwich: JAI Press.
Ellis, A. J., West, B. J., Ryan, A. M., & DeShon, R. P. (2002). The use of impression
management tactics in structured interviews: A function of question type?
Journal of Applied Psychology, 87, 1200–1208.
Hell, B., Schuler, H., Boramir, I., & Schaar, H. (2006). Verwendung und Einschätzung
von Verfahren der internen Personalauswahl und Personalentwicklung im
10 Jahres-Vergleich. Zeitschrift für Personalforschung, 20(1), 58–78.
Huffcutt, A. I., & Arthur, W. (1994). Hunter and Hunter (1984) revisited: Interview vali-
dity for entry-level jobs. Journal of Applied Psychology, 29, 184–190.
Huffcutt, A. I., Conway, J. M., Roth, P. L., & Klehe, U.-C. (2004). The impact of job com-
plexity and study design on Situational and Behavior Description Interview
validity. International Journal of Selection and Assessment, 12, 262–273.
Huffcutt, A. I., Culbertson, S. S., & Weyhrauch, W. S. (2013). Employment interview
reliability: New meta‐analytic estimates by structure and format. International
Journal of Selection and Assessment, 21, 264–276.
92 Kapitel 3 · Eignungsinterviews/direkte mündliche Befragungen

Huffcutt, A. I., & Woehr, D. J. (1999). Further analysis of employment interview validi-
ty: a quantitative evaluation of interviewer-related structuring methods. Journal
of Organizational Behavior, 20, 549–560.
Jansen, A., König, C. J., Stadelmann, E. H., & Kleinmann, M. (2012). Applicants’ self-
presentational behavior: What do recruiters expect and what do they get? Jour-
nal of Personnel Psychology, 11, 77–85.

3 Janz, T. (1989). Patterned behavior description interviews: The best prophet of the
future is the past. In R. W. Eder & G. R. Ferris (Hrsg),. The employment interview:
Theory, research, and practice (S. 158–168). Newbury Park: Sage.
Janz, T., Hellervik, L., & Gillmore, D. C. (1986). Behavior description interviewing. Bos-
ton: Allyn & Bacon.
Jetter, W. (2003). Effiziente Personalauswahl. Durch strukturierte Einstellungsgespräche
die richtigen Mitarbeiter finden (2. Aufl.). Stuttgart: Schäffer-Poeschel.
Klehe, U., & Latham, G. P. (2005). The predictive and incremental validity of the situa-
tional and patterned behavior description interviews for teamplaying behavior.
International Journal of Selection and Assessment, 13, 108–115.
Latham, G. P., Saari, L. M., Pursell, E. D., & Campion, M. A. (1980). The Situational Inter-
view. Journal of Applied Psychology, 17, 422–427.
Levashina, J., & Campion, M. A. (2007). Measuring faking in the employment inter-
view: Development and validation of an interview faking behavior scale. Jour-
nal of Applied Psychology, 92, 1638–1656.
Levashina, J., Hartwell, C. J., Morgeson, F. P., & Campion, M. A. (2014). The structured
employment interview: Narrative and quantitative review of the research litera-
ture. Personnel Psychology, 67, 241–293.
Mayfield, E. C. (1964). The selection interview: A reevaluation of published research.
Personnel Psychology, 17, 599–616.
Melchers, K. G., Ingold, P. V., Wilhelmy, A., & Kleinmann, M. (2015). Beyond validity:
Shedding light on the social situation in employment interviews. In I. Nikola-
ou & J. K. Oostrom (Hrsg.), Employee Recruitment, Selection, and Assessment:
Contemporary Issues for Theory and Practice (S. 174–171). Hove, UK: Psychology
Press.
Moscoso, S. (2000) Selection interviews: A review of validity evidence, adverse
impact and applicant reactions. International Journal of Selection and Assess-
ment, 8, 237–247.
Posthuma, R. A., Morgeson, F. P., & Campion, M. A. (2002). Beyond employment inter-
view validity: A comprehensive narrative review of recent research and trends
over time. Personnel Psychology, 55, 1–81.
Roth, P. L., & Huffcutt, A. I. (2013). A meta-analysis of interviews and cognitive ability:
Back to the future? Journal of Personnel Psychology, 12, 157–169.
Salgado, J. F., & Moscoso, S. (2002). Comprehensive meta-analysis of the construct
validity of the employment interview. European Journal of Work and Organiza-
tional Psychology, 11, 299–324.
Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods
in personnel psychology: Practical and theoretical implications of 85 years of
research findings. Psychological Bulletin, 124, 262–274.
Schuler, H. (1992). Das Multimodale Interview. Diagnostica, 38, 281–300.
Schuler, H. (2002). Das Einstellungsinterview. Göttingen: Hogrefe.
Schuler, H., Hell, B., Trapmann, S., Schaar, H., & Boramir, I. (2007). Die Nutzung psycho-
logischer Verfahren der externen Personalauswahl in deutschen Unternehmen:
Ein Vergleich über 20 Jahre. Zeitschrift für Personalpsychologie, 6, 60–70.
Schuler, H., & Mussel, P. (2016). Einstellungsinterviews vorbereiten und durchführen.
Göttingen: Hogrefe.
Stevens, C. K., & Kristof, A. L. (1995). Making the right impression: A field study of
applicant impression management during job interviews. Journal of Applied
Psychology, 80, 587–606.
Strobel, A., & Westhoff, K. (2009). Diagnoseinstrument zur Erfassung der Interviewer-
kompetenz in der Personalauswahl (DIPA). Frankfurt am Main: Pearson Assess-
ment.
Literatur
93 3
Wagner, R. (1949). The employment interview: A critical summary. Personnel Psycho-
logy, 2, 17–46.
Westhoff, K. (Hrsg.). (2009). Das Entscheidungsorientierte Gespräch (EOG) als Eignungs-
interview. Lengerich: Pabst.

Literatur zu 7 Abschn. 3.2


DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Müller-Glöge, R., Preis, U., & Schmidt, I. (Hrsg.). (2016). Erfurter Kommentar zum
Arbeitsrecht (16. Aufl.). München: Beck.
95 4

Anforderungsanalyse,
Verfahren der
Eignungsbeurteilung
sowie rechtliche
Rahmenbedingungen
Stefan Höft, Ingo Püttner und Martin Kersting

4.1 Die Anforderungsanalyse als Grundlage der beruflichen


Eignungsdiagnostik – 97
4.1.1 Konzeptionelle Zugänge – 101
4.1.2 Perspektiven- und Methodenvielfalt – 102
4.1.3 Spezifische Zielpositionsanalysen – 103
4.1.4 Zusammenführung der Informationen in einem
Anforderungsprofil – 107
4.1.5 Festlegung und Konkretisierung notwendiger Ausprägungsgrade
der Eignungsmerkmale – 109
4.1.6 Eignungsmerkmal und Gesamteignung – 110
4.1.7 Dokumentation – 111
4.1.8 Fazit – 111

4.2 Verfahren der Eignungsbeurteilung sowie ihre


Möglichkeiten und Grenzen – 112
4.2.1 Auswahl von Verfahren – 113
4.2.2 Fünf Verfahrenskategorien – 113
4.2.3 Anforderungen an Verfahren – 116
4.2.4 Möglichkeiten und Grenzen der Verfahren – 122
4.2.5 Anforderungen an computerbasierte und internetgestützte
Verfahren – 123

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_4
4.2.6 Durchführungsbedingungen – 124
4.2.7 Generische Eignungsmerkmale – 126
4.2.8 Vorgehensweisen und Strategien der Eignungsbeurteilung – 136
4.2.9 Fazit – 138

4.3 Rechtliche Rahmenbedingungen der


Eignungsdiagnostik - II – 140
4.3.1 Mitbestimmung – 140
4.3.2 Datenschutz – 143
4.3.3 Berufspflichten – 145
4.3.4 Gütekriterien aus rechtlicher Sicht – 146
4.3.5 Rechtliche Bedeutung von DIN-Normen – 146
4.3.6 Fazit – 149

Literatur – 150
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
97 4

Im vierten Kapitel wird zunächst die Anforderungsanalyse


thematisiert (7 Abschn. 4.1). Dabei werden verschiedene
Vorgehensweisen erläutert, mit denen man die für Erfolg und
Zufriedenheit relevanten Eignungsmerkmale einschließlich der
für notwendig erachteten Ausprägungshöhe bestimmen kann.
Das Ergebnis der Anforderungsanalyse ist ein Anforderungsprofil
(7 Abschn. 2.1). Steht dieses fest, kann man Verfahren auswählen
oder konstruieren, die eine Prüfung der Eignung (im Sinne
des Anforderungsprofils) der Kandidatinnen und Kandidaten
ermöglichen. Die Autorinnen und Autoren der DIN (2016)
unterscheiden fünf Kategorien von Verfahren. Diese Verfahrens-
kategorien sowie die Anforderungen an die jeweiligen Verfahrens-
kategorien werden in 7 Abschn. 4.2 vorgestellt. Für bestimmte
Eignungsmerkmale gibt es ein großes Angebot an messtheoretisch
fundierten Fragebogen und Tests, ein Beispiel ist das
Eignungsmerkmal Intelligenz. Diese sogenannten „generischen“
Eignungsmerkmale werden in 7 Abschn. 4.2.6 vorgestellt. In
der eignungsdiagnostischen Praxis sind rechtliche Rahmenbe-
dingungen zu beachten, die sich u.a. aus den Regelungen zur
Mitbestimmung, zum Datenschutz und zu Berufspflichten ergeben.
Diese Regelungen werden in 7 Abschn. 4.3 erläutert. Zum
Ende des 7 Abschn. 4.3 geht es um die Frage, welche rechtliche
Bedeutung DIN-Normen zukommt.

4.1 Die Anforderungsanalyse als Grundlage der


beruflichen Eignungsdiagnostik

Stefan Höft und Martin Kersting

Übersicht
Mithilfe einer Anforderungsanalyse zur Zielposition werden
die Eignungsmerkmale bestimmt, die Voraussetzung für Erfolg
und Zufriedenheit bei der beruflichen Tätigkeit, am Arbeitsplatz
und in der Ausbildung bzw. im Studium sind. Das Kapitel gibt
einen Überblick über die relevanten Begrifflichkeiten und
stellt unterschiedliche Analysezugänge vor. Endergebnis ist
ein Anforderungsprofil (7 Kap. 2.1), das als Grundlage für die
Verfahrensauswahl und -konstruktion sowie als Bezugsrahmen für
die Eignungsbeurteilung dient.

Eignungsdiagnostik kann als Passungsanalyse zwischen der berufli-


chen Zieltätigkeit einerseits und der Person mit ihren tätigkeitsrele-
vanten Merkmalen andererseits charakterisiert werden. Wir benutzen
98 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

hier und im Folgenden den Begriff „Beruf “ im erweiterten Sinne. Damit


sind auch berufliche Tätigkeiten ohne formale Qualifikationsnachweise
sowie die Ausbildung und das Studium gemeint. Auch der von uns
genutzte Begriff „Tätigkeit“ kann sich ebenso auf eine berufliche Tätig-
keit beziehen wie auf die Tätigkeiten von Auszubildenden oder Studie-
renden. Wenn vom „Arbeitsplatz“ die Rede ist, ist der Ausbildungs- und
Studienplatz mit gemeint.
Eignungsdiagnostik In . Tab. 4.1. werden drei Ebenen unterschieden, die bei der Eig-
4 als mehrdimensionale nungsdiagnose berücksichtigt werden sollten, um eine gültige Vorher-
Passungsanalyse sage zum Berufserfolg, zur Arbeitszufriedenheit und zu einem lang-
fristigen Verbleib in der Tätigkeit zu treffen:

Zur . Tab. 4.1:


1. Direkt auf die Ausübung der Tätigkeit bezogene (spezifische
oder allgemein relevante) Anforderungen: Die Person muss zur
erfolgreichen Ausübung der Tätigkeit die erforderlichen Fähig-
keiten und Fertigkeiten sowie das Wissen und sonstige relevante
Eignungsmerkmale aufweisen. Diese Aufzählung korrespondiert
mit dem in der amerikanischen Fachliteratur verbreiteten Kürzel
KSAO („knowledge“, „skills“, „abilities“, „other characteristics“).
2. (De-)Motivationspotenzial der Tätigkeit: Eine Person kann
zwar befähigt sein, eine Tätigkeit auszuüben, muss aber nicht
unbedingt motiviert dazu sein, sie auszuüben. Hier spielt die (ggf.
auch nur antizipierte) Arbeitszufriedenheit eine bedeutsame
Rolle, die sich im bedeutsamen Maße aus Interessen, Bedürf-
nissen, Werthaltungen und Motivstrukturen und weniger stark
aus dem Leistungsvermögen der Person speist.
3. Zukünftige Entwicklung der Tätigkeit: Anforderungsanalysen
sollen zukunftsorientiert erfolgen. In der DIN (2016, S. 6) wird
formuliert: Absehbare zukünftige Entwicklungen in „Technik,
Wirtschaft, Gesellschaft sowie innerhalb der Organisation sollten in
einem weiteren Schritt analysiert werden, um abzuschätzen, ob sich

. Tab. 4.1  Eignungsdiagnostik auf unterschiedlichen Ebenen

Charakteristika der beruflichen Eignungsmerkmale der Person


Tätigkeit

Anforderungen, die für die erfolg- Fähigkeiten, Fertigkeiten, Kennt-


reiche Ausübung der Tätigkeit er- nisse und andere erfolgsrelevante
füllt sein müssen Merkmale
• spezifisch nur für die konkrete
Tätigkeit
• allgemein tätigkeitsübergreifend
relevant
Befriedigungspotenzial Interessen, Bedürfnisse, Motive,
Werthaltungen usw.
zukünftige Entwicklungen der Merkmale, die das Entwicklungs-
Tätigkeit potenzial der Person abbilden
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
99 4
möglicherweise Tätigkeiten, Umfeldbedingungen oder Organi-
sationsmerkmale verändern.“ Wenn entsprechende zukünftige
Entwicklungen konkret benannt werden können, sollten die daraus
resultierenden neuen Anforderungen bereits bei der gegenwärtigen
Eignungsbeurteilung berücksichtigt werden. Bei noch nicht
konkret benennbaren Veränderungen müssen ggf. Eignungs-
merkmale berücksichtigt werden, die allgemein zuträglich sind,
Neuerungen in der beruflichen Tätigkeit erfolgreich zu bewältigen
(hierzu gehören z.B. kognitive Fähigkeiten (Intelligenz), Lernfä-
higkeit und -motivation oder auch Offenheit für neue Ideen und
Handlungen; 7 Abschn. 4.2.6, generische Eignungsmerkmale)

Definition
Aufgabe der Anforderungsanalyse im Rahmen der Eignungs-
diagnostik ist es (vgl. DIN, 2016, S. 10), auf systematischem Wege
die Anforderungen und das (De-)Motivationspotenzial einer
Tätigkeit zu erfassen sowie absehbare zukünftige Entwicklungen
mit Relevanz für die Tätigkeitsausübung zu antizipieren. Auf dieser
Grundlage werden dann die personenbezogenen Eignungs-
merkmale (mit den notwendigen Ausprägungsgraden) ermittelt,
die bedeutsam für die gezeigte Leistung und für die Zufriedenheit
mit dem zu besetzenden Arbeitsplatz, dem Aufgabenfeld, der
Ausbildung bzw. dem Studium oder dem Beruf sind.

Das so entwickelte Profil der Eignungsmerkmale, das sogenannte Das Anforderungsprofil


„Anforderungsprofil“ (7 Kap. 2.1), ist ein wichtiger Bezugspunkt für ist der Referenzrahmen
die eignungsdiagnostische Arbeit: Es dient als Referenzrahmen für die für die Gestaltung der
eignungsdiagnostische Verfahrensauswahl und -konstruktion sowie als Eignungsbeurteilung
konzeptionelle Grundlage für die diagnostische Arbeit (Informations-
sammlung und -bewertung, Urteilsbildung).
Eine Anforderungsanalyse lässt sich in Teilbereichen auch als lin-
guistische Arbeit verstehen: Kriterien für die Bewertung der Kandida-
tinnen und Kandidaten müssen in Worte gefasst werden. Sie dienen
als Anker für die nachfolgende eignungsdiagnostische Arbeit und als
Bezugsrahmen für die Kommunikation unter den Verfahrensbetei-
ligten. Von wesentlicher Bedeutung ist in diesem Zusammenhang die
Definition von Eignungsmerkmalen.

Definition
Eignungsmerkmale (nach DIN, 2016, S. 7) sind Qualifikationen, Eignungsmerkmale = Merkmale
Kompetenzen, Potenziale sowie berufsbezogene Interessen, der Person, die relevant sind
Bedürfnisse, Werthaltungen, Motive und andere relevante für berufliche Leistung und
Merkmale einer Person, die die Voraussetzung für die jeweils Zufriedenheit
geforderte berufliche Leistungshöhe und die berufliche
Zufriedenheit sind.
100 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Eignungsmerkmale

Qualifikations- Kompetenzen Potenziale


merkmale

4
formal oder informell gelernte, wiederholbare Fähigkeit einer Person, ihr
nachgewiesenes wissen verhaltensweisen und bislang nicht vertraute
und können abrufbare wissens- Aufgaben zu bewältigen
bestände zur erfolg- und weitere Kompetenzen
reichen Bewältigung zu entwickeln
beruflicher Aufgaben

. Abb. 4.1  Drei Arten von Eignungsmerkmalen nach DIN (2016)

Bei der Definition von Eignungsmerkmalen wird auf andere Begriff-


lichkeiten (genannt werden Qualifikationen, Kompetenzen, Potenziale,
Interessen, Bedürfnisse, Werthaltungen, Motive) zurückgegriffen. Drei
zentrale Merkmalsgruppen werden in der DIN genauer spezifiziert
(. Abb. 4.1).
Qualifikationen, Kompetenzen Mit Qualifikationen sind Wissen und Können gemeint, die formal
und Potenziale als drei Arten von (z.B. Schul- oder Ausbildungsabschluss) oder informell (z.B. Fortbil-
Eignungsmerkmalen dungsnachweise, Arbeitszeugnisse, Referenzen) nachgewiesen sind.
Kompetenzen sind laut der DIN (2016, S. 7) gelernte, wiederholbare
Verhaltensweisen und abrufbare Wissensbestände zur erfolgreichen
Bewältigung beruflicher Aufgaben. Der Begriff ist danach besonders
relevant für die Eignungsbeurteilung von Personen, die sofort ohne
weitere Qualifizierung die Tätigkeit aufnehmen können oder sogar
bereits eine vergleichbare Tätigkeit ausüben. Potenzialbeurteilungen
beziehen sich nach der DIN primär auf tätigkeitsunerfahrene Personen,
die erst durch eine weitere Qualifizierung (Ausbildung, Einarbeitung)
die Tätigkeit ausüben können. Diagnostiziert werden muss, ob sie sich
das für die Verhaltensausübung erforderliche Wissen und Können im
erforderlichen Ausmaß und in der zur Verfügung stehenden Zeit aneig-
nen können. Je nach Alter sind hierbei auch Entwicklungs- und Reife-
prozesse zu berücksichtigen.
In der konkreten Anwendung dürfen die Eignungsmerkmale laut
DIN (2016, S. 10) nicht nur abstrakt (z.B. Leistungsmotivation, Intelli-
genz) formuliert werden, sondern müssen durch verhaltensnahe Schil-
derung von Beispielaussagen bzw. -verhaltensweisen konkretisiert
werden (7 Abschn. 2.1 sowie 7 Abschn. 2.2.3 „Operationalisierung von
Eignungsmerkmalen“). So könnte man z.B. den abstrakten Begriff „Intel-
ligenz“ durch Beispielverhaltensweisen wie „unterscheidet Wesentliches
von Unwesentlichem“ konkretisieren. In 7 Kap. 2 (7 Tab. 2.2) finden sich
solche Beispielverhaltensweisen für das Eignungsmerkmal „Koopera-
tion“. Da die Beispielverhaltensweisen auch im Rahmen der Bewertung
einer Eignungsmerkmalsausprägung als Orientierung (Anker) dienen,
spricht man auch häufig von „Verhaltensankern“.
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
101 4
4.1.1 Konzeptionelle Zugänge

In der DIN wird der Begriff „Anforderungsanalyse“ genutzt. In der


„alten“ DIN (2002) sowie in vielen Titeln der Fachliteratur findet man
den Doppelbegriff „Arbeits- und Anforderungsanalyse“. Diesen kann
man wie folgt auflösen:
1. Die Arbeitsanalyse fungiert beim Einsatz in der Eignungsdiag- Arbeitsanalyse: Beschreibung der
nostik eher als flankierende Maßnahme, indem mit ihrer Hilfe Zielposition in Situationsbegriffen
die Gesamttätigkeit der Zielposition weiter in Aufgabenbereiche
und zugeordneten Einzelaufgaben bis hinunter zu einzelnen
Tätigkeiten aufgeschlüsselt wird. Diese Informationen können
im Rahmen der eignungsdiagnostischen Verfahrenskonstruktion
(z.B. bei der Entwicklung von simulationsorientierten Verfahren
zur Verhaltensbeobachtung und -beurteilung oder bei der Formu-
lierung von situativen Fragen in Interviews) verwendet werden.
2. Der in der DIN genutzte Begriff „Anforderungsanalyse“ Anforderungsanalyse:
beschreibt hingegen den Arbeitsplatz aus dem Blickwinkel der Beschreibung der Zielposition in
arbeitenden Person und ermittelt die Eignungsmerkmale, die für Personbegriffen
die erfolgreiche Bewältigung notwendig sind.

Eckardt und Schuler (1995, S. 536 f.) beschreiben drei mögliche Wege Drei Wege zur Ableitung von
zur Ableitung von Eignungsmerkmalen: Eignungsmerkmalen
1. Bei der erfahrungsgeleitet-intuitiven Methode werden von Exper-
tinnen/Experten basierend auf einer zumeist ganzheitlichen
Betrachtung der Tätigkeit die Anforderungen und Befriedigungs-
potenziale sowie die korrespondierenden Eignungsmerkmale
eingeschätzt.
2. Die arbeitsplatzanalytisch-empirische Methode untersucht die
Zielposition mithilfe sozialwissenschaftlicher Untersuchungsme-
thoden (z.B. Workshops, Fragebogen, standardisierte Interview-
techniken, Beobachtungen).
3. Personbezogen-empirische Methoden arbeiten beispielsweise
mit Extremgruppenvergleichen, bei denen sehr erfolgreich und
weniger erfolgreich arbeitende Mitarbeiter/-innen hinsichtlich
differenzierender Merkmale untersucht werden. In dieselbe
Kategorie können auch kriteriumsbezogene Validierungsstudien
(7 Abschn. 6.4) eingeordnet werden, bei denen empirische
Zusammenhänge zwischen Eignungsmerkmalen und beruf-
lichen Erfolgskriterien identifiziert werden. Wenn sich
beispielsweise zeigt, wie in 7 Abschn. 6.4 ausführlich erläutert,
dass Intelligenztestergebnisse mit dem Erfolg in Ausbildung
und Beruf zusammenhängen, und zwar in unterschiedlichen
Ausbildungs- und Berufsfeldern, so lässt sich daraus auch
rückschließen, dass die Intelligenz in allen diesen Ausbildungen Bei neu gestalteten
und Berufen offenkundig ein bedeutsames Eignungsmerkmal ist. Zielpositionen oder veränderten
Tätigkeitsanforderungen werden
Die erfahrungsgeleitet-intuitive Methode entzieht sich weitgehend einer bevorzugt arbeitsplatzanalytisch-
systematischen Analyse („die Expertin/der Experte hat immer Recht empirische Anforderungsanalyen
… “). Die Qualität der getroffenen Entscheidungen kann am ehesten eingesetzt
102 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

indirekt über die intersubjektive Übereinstimmung unterschiedlicher


Expertinnen/Experten erfasst werden. Die personenbezogen-empiri-
sche Methode kann nur post hoc bei bereits auf der Zielposition arbei-
tenden Personen angewandt werden und ist in einer systematischen
Form am ehesten im wissenschaftlichen Kontext sowie bei Evaluatio-
nen von bereits etablierten eignungsdiagnostischen Verfahrensserien
anzutreffen. Die im Weiteren genauer behandelten arbeitsplatzanaly-
tisch-empirischen Methoden finden in der betrieblichen Praxis häufig
4 Anwendung bei neu gestalteten Zielpositionen oder veränderlichen
Tätigkeitsanforderungen.
Auch bei Anforderungsanalysen Während Eignungsbeurteilungen regelmäßig evaluiert werden
stellt sich die Frage nach der (7  Kap. 6), wird, wie Kersting und Birk (2011) beklagen, nur äußerst
Gültigkeit der Ergebnisse selten überprüft, ob die Ergebnisse der Anforderungsanalyse gültig
sind. Dies ist insbesondere vor dem Hintergrund problematisch, dass
– wie der kurze Einblick in die unterschiedlichen Methoden zeigt – ein
sehr hoher Freiheitsgrad bei der Gestaltung von Anforderungsanaly-
sen besteht, indem sehr unterschiedliche Techniken eingesetzt werden
können. Bereits innerhalb einer Methode, z.B. der arbeitsplatzanaly-
tisch-empirische Methode mit Fragebogen, variieren die Ergebnisse der
Anforderungsanalyse in Abhängigkeit von dem jeweils genutzten Fra-
gebogen (siehe Thunsdorff et al., 2015). Selbstverständlich spielt es auch
eine große Rolle für das Ergebnis, welche Gruppe befragt wird (Kersting
& Birk, 2011).

4.1.2 Perspektiven- und Methodenvielfalt

Bei der Anforderungsanalyse Eine qualitativ hochwertige Anforderungsanalyse zeichnet sich der
sollten unterschiedliche DIN (2016, S. 10) zufolge durch die Berücksichtigung unterschied-
Perspektiven berücksichtigt lichster Perspektiven aus, solange diese relevante und eigenständige
werden Erkenntnisse liefern. Beispielsweise empfiehlt es sich - so kann man
diese Aussage interpretieren -, nicht nur die Vorgesetzten, sondern
nach Möglichkeit auch die Stelleninhaber/-innen anforderungsanaly-
tisch zu befragen. Aber auch die Befragung von Kolleginnen und Kolle-
gen, Mitarbeiterinnen und Mitarbeiter sowie Kundinnen und Kunden
der (zukünftigen) Stelleninhaber/-innen kann wertvolle Erkenntnisse
erbringen. Hierbei ist zu beachten, dass diese Personen bei ihren Berich-
ten vorrangig ihren eigenen Erfahrungsraum schildern werden. Dieser
kann geprägt sein durch einseitige Charakteristika der Organisations-
mitglieder (z.B. männliche Führungskräfte, junge Mitarbeiter/-innen
usw.) und einem bestimmten Kulturrahmen (z.B. nur Personal ohne
Migrationshintergrund). Ebenso können bei den Einschätzungen der
Anforderungen entsprechende Stereotype (z.B. Geschlecht, Alter, Her-
kunft) wirken (s. Kersting & Ott, 2015).
Bei der Anforderungsanalyse Außerdem empfehlen die Autorinnen und Autoren der DIN (2016, S.
sollten unterschiedliche 11) die Nutzung mehrerer, unterschiedlicher anforderungsanalytischer
Erhebungs- und Analyseverfahren Verfahren. Prinzipiell können alle Zugangswege zum Einsatz kommen,
zum Einsatz kommen die Einblicke zum Ablauf und zur Umsetzung der Tätigkeiten sowie zu
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
103 4
ihren Ergebnissen geben können. „Empirische Daten werden mit unter-
schiedlichsten Analysemethoden erhoben. Hierzu zählen Beobachtung,
Interview, Fragebogenerhebung, Beschäftigung mit dem Arbeitsmate-
rial, Auswertung schriftlichen Materials, aber auch eine Arbeitsausfüh-
rung durch den Arbeitsanalytiker“ (Höft & Schuler, 2014, S. 76).

Allgemeine Berufsinformationen und vorliegende


Materialien
Anforderungsrelevante Informationen geben zunächst allgemeine BerufeNet der Bundesagentur
Register zu den Berufssparten, z.B. das Berufsinformationssystem für Arbeit als erster Einstieg für
„BerufeNet“ der Bundesagentur für Arbeit (7 http://berufenet.arbeits- allgemeine Berufsanforderungen
agentur.de) und die damit verbundenen Informationsportale. Diese
Register können als Ergebnis einer ersten (groben) Anforderungsana-
lyse betrachtet werden. Solche Quellen werden insbesondere bei der
Studien- und Berufsberatung eingesetzt (vgl. DIN, 2016, S. 10). Hierbei
müssen dann aber auch weitere beratungsrelevante Faktoren, z.B. die
regionale Arbeitsmarktsituation, berücksichtigt werden (welche Aus-
bildungsberufe werden von lokal ansässigen Unternehmen angebo-
ten). Unternehmensspezifische Konkretisierungen der Anforderungen
spielen hier zunächst keine Rolle.
Sinnvoll kann zusätzlich die Sammlung und Sichtung von bereits
bestehenden Ausarbeitungen sein, beispielsweise vorliegende Tätig-
keits-, Stellen-, Aufgaben- oder Funktionsbeschreibungen, Kompetenz-
modelle sowie Darstellungen von Organisationszielen. Auch aus Ausbil-
dungsordnungen oder Weiterbildungscurricula können Erkenntnisse
zu notwendigen Qualifikationen, Kompetenzen und Potenzialen abge-
leitet werden. Greift man auf vorhandene Informationen zurück, so ist
nach DIN (2016, S. 10) sicher zu stellen, dass sich seit Erstellung dieser
Informationen die Anforderungen nicht bedeutsam verändert haben.

4.1.3 Spezifische Zielpositionsanalysen

Im Rahmen von zielpositionsspezifischen Anforderungsanalysen Drei Beschreibungsebenen bei


können drei Beschreibungsebenen unterschieden werden: Aufgaben- Anforderungsanalysen: Aufgaben-
und Ergebnisse, Verhalten und Eigenschaften. und Ergebnisse, Verhalten und
Eigenschaften

Beschreibungsebene: Aufgaben- und Ergebnisse


Bei dieser Beschreibungsebene werden die Ergebnisse der ursprüngli-
chen Arbeitsanalyse verarbeitet, indem die Zielposition in Aufgaben-
gruppen sowie in damit verbundene Tätigkeiten und Arbeitsergebnis-
sen aufgeschlüsselt wird. Aufgaben- und Ergebnisebene:
Bei einer systematischen Anforderungsanalyse auf Aufgaben- und Aufschlüsselung der Zielposition
Ergebnisebene werden die gesammelten Informationen zu Aufgaben- in Aufgabengruppen sowie in
inventaren zusammengefasst, die je nach Auflösungsgrad und Komple- damit verbundene Tätigkeiten
xität der Zielposition eine bis zu dreistellige Zahl von Einzeltätigkeiten und Arbeitsergebnisse
104 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

umfassen können. (Ein gut dokumentiertes Anwendungsbeispiel schil-


dern Schuler, Funke, Moder & Donat, 1995; eine Zusammenfassung
geben Höft & Schuler, 2005.) Fachexpertinnen und -experten (z.B.
Stelleninhaber/-innen und/oder deren Vorgesetzten) werden danach
gebeten, die Tätigkeiten nach unterschiedlichen Kriterien zu beurtei-
len, z.B. hinsichtlich der Bedeutung für die Gesamttätigkeit, der Häu-
figkeit, der Schwierigkeit, dem Ausmaß negativer Konsequenzen bei
Fehlern, dem Trainingsaufwand o.ä. Aus pragmatischer Sicht hat sich
4 die Beurteilung der „Bedeutsamkeit“ der Einzelaufgaben als am effi-
zientesten herausgestellt (vgl. den Überblick bei Schmitt & Chan,
1995). Mithilfe einer statistisch-explorativen Auswertung der Antwor-
ten können inhaltlich differenzierte, im Umfang reduzierte und nach
Bedeutsamkeit gewichtete Aufgabengruppen gebildet werden.

Beschreibungsebene: Verhalten
Verhaltensebene: Zusätzliche Ein zweiter Zugangsweg, der zusätzlich zum Arbeitsergebnis den Wer-
Berücksichtigung des deprozess („wie kommt es zu einem Arbeitsergebnis bzw. wie wird eine
Zustandekommens einer Aufgabe erledigt?“) erfasst, erfolgt über eine Verhaltensanalyse. Hier
Arbeitsleistung kann zwischen zwei Analysezugängen unterschieden werden:
1. Strukturierte Fragebogenverfahren arbeiten arbeitsplatzüber-
greifend. Häufig wird hier der Fragebogen zur Arbeitsanalyse
(FAA) von Frieling und Hoyos (1978) als Beispiel genannt.
Weitere Verfahren werden beispielsweise im Herausgeberband
von Dunckel (1999) beschrieben. Diese Verfahren beinhalten
einen Standardkatalog von Fragen zur möglichen Ausgestaltung
einer Arbeitstätigkeit. Der Erfüllungsgrad der Kriterien für die
betreffende Tätigkeit wird dann (zumeist von der Arbeitsana-
lytikerin/dem Arbeitsanalytiker) bewertet, und es entsteht ein
zielpositionsspezifisches Verhaltensprofil, dessen Besonder-
heiten durch den Vergleich mit anderen, auf gleiche Weise
erfassten beruflichen Tätigkeitsprofilen identifiziert werden
können.
2. Ein prominentes arbeitsplatzspezifisches Verfahren stellt die
Methode der kritischen Ereignisse (7 Exkurs „Methode der
kritischen Ereignisse“) dar. Ursprünglich von Flanagan (1954) im
Kontext der Leistungsbeurteilung entwickelt, hat sich die Grund-
technik als Standardelement in Workshops mit Fachexpertinnen
und -experten zur verhaltensbezogenen Reflexion bewährt.

Exkurs

Methode der kritischen Ereignisse: Instruktionsbeispiel


(aus Höft & Schuler, 2014, S. 79) Arbeitsweise veranschaulicht. 55 Was waren die Umstände oder
Denken Sie an ein Beispiel für das Beschreiben Sie die Situation und Hintergrundbedingungen, die zu
Arbeitsverhalten einer Mitarbeiterin/ das fragliche Verhalten möglichst diesem Verhalten führten?
eines Mitarbeiters, das eine konkret. Stellen Sie sich dazu die 55 Was war besonders effektiv oder
besonders effektive oder ineffektive folgenden Fragen: ineffektiv an diesem Verhalten?
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
105 4

55 Was waren die Konsequenzen 55 Welche Konsequenzen? Ergebnis Workshops häufig überfordert
dieses Verhaltens? der Handlung (als Konsequenz des sind, spontan echte
Verhaltens) Verhaltensbeschreibungen
Hilfreich ist der Verweis auf folgende
zu generieren. Deshalb
Rahmenfragen: Stellenexperten/-innen schätzen
werden die Ergebnisse häufig
55 Wer? Handelnde Person (Stellenin- die so gesammelten Ereignisse
von den verantwortlichen
haber/-in, Position, Abteilung, kein hinsichtlich ihrer Bedeutsamkeit
Eignungsdiagnostikerinnen/-
Name) ein und treffen auf dieser Basis eine
diagnostikern überarbeitet
55 Wo? Beschreibung der Situation, Auswahl. Anschließend werden die
und dienen nur als Teilelement
äußerer Umstände und Ereignisse anforderungsbezogen
in umfassenderen Workshop-
Hintergrundbedingungen gruppiert.
Verfahren (z.B. Schuler et al., 1995)
55 Was? Beschreibung der Handlung Die Erfahrung zeigt, dass
oder Befragungsinstrumenten
(Wie verhielt sich die Person? Was Teilnehmer/-innen an
(Koch & Westhoff, 2012).
tat sie konkret?) anforderungsanalytischen

Beschreibungsebene: Eigenschaften
Bei einer eigenschaftsbezogenen Anforderungsanalyse dienen eigen-
schaftsbezogene Referenzmodelle als Ausgangspunkt für zumeist holis-
tische Gesamtbeurteilungen, d.h. die Relevanz der jeweils genannten
Eigenschaft wird ohne weitere Differenzierung für die Zielposition als
Ganzes beurteilt. Die identifizierten „Eigenschaften“ können mit den
„Eignungsmerkmalen“ der DIN gleichgesetzt werden. Bekannte Ver-
fahrensbeispiele sind:
1. die Ability Requirement Scales (F-JAS) nach Fleishman und
Quaintance (erweiterte deutsche Version von Kleinmann,
Manzey, Schumacher & Fleishman, 2010), bei der tätigkeitsbe-
zogen die Bedeutsamkeit von 73 Eigenschaften aus fünf Bereichen
(Kognition, Psychomotorik, physische Merkmale, Sensorik/
Wahrnehmung, soziale/interpersonale Fähigkeiten und Fertig-
keiten) bewertet wird, oder
2. an der beruflichen Interessentheorie von John L. Holland orien-
tierte Verfahren (beispielsweise ExploJob von Joerin Fux & Stoll,
2006), die das Befriedigungspotenzial von Berufen im Hinblick
auf sechs Interessendimensionen erfassen (zu den Interessen-
dimensionen 7 Abschn. 4.2.6).

Großer Vorteil solcher Ansätze ist, dass hier mit theoretisch fundier- Eigenschaftsebene: Identifikation
ten, empirisch gut untersuchten Konstrukten (Eignungsmerkmalen) von arbeitsrelevanten
gearbeitet wird, zu denen bereits messtheoretisch fundierte Test- und Personmerkmalen orientiert an
Fragebogenverfahren vorliegen. Beispiele für solche „generischen Eig- einem eigenschaftsbezogenen
nungsmerkmale“ finden sich in 7 Abschn. 4.2.6. Als Sonderform von Referenzmodell
eigenschaftsorientierten Anforderungsanalysen können Anforderungs-
profile angesehen werden, die auf der Basis von Kompetenzmanage-
mentansätze erstellt wurden (7 Exkurs „Kompetenzmanagementansätze Synthetische Validierung:
als Basis für Anforderungsprofile“). Bewertung der Bedeutsamkeit
Die Problematik von holistischen Bewertungen, bei denen stark gene- von Eigenschaften für bestimmte
ralisierende Aussagen zu einer beruflichen Tätigkeit getroffen werden Tätigkeitsfelder, Gewichtung
müssen, umgehen dekomponierende Analyseverfahren wie beispiels- der Tätigkeitsfelder für eine
weise die sogenannte „synthetische Validierung“ (Scherbaum, 2005). Hier bestimmte Zielposition
106 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

wird die Gesamttätigkeit (z.B. auf Basis einer vorangegangenen aufga-


ben- und ergebnisorientierten Anforderungsanalyse) in Aufgabengrup-
pen unterteilt und die Relevanz der Eigenschaften für die spezifischen
Aufgabenbereiche wird bestimmt (vgl. Schuler et al., 1995). Die spätere
Kombination der Einzelbeurteilungen erfolgt durch mathematische Ver-
rechnung. Als zusätzliche Information wird dabei die Bedeutsamkeit
der Aufgabengruppen für die berufliche Tätigkeit berücksichtigt. Durch
diesen „Syntheseansatz“ (Bewertung der Bedeutsamkeit von Eigenschaf-
4 ten für bestimmte Tätigkeitsfelder, Gewichtung der Tätigkeitsfelder für
eine bestimmte ­Zielposition) ist es auch möglich, eine eigenschaftsbezo-
gene Anforderungsanalyse für neuartige Zielpositionen durchzuführen,
die in der vorgesehenen Form bisher noch nicht existieren.

Exkurs

Kompetenzmanagementansätze als Basis für Anforderungsprofile


Als Sonderform von dienen als konzeptionelle Richtlinie beschriebenen Inhalte, Eindeutigkeit
eigenschaftsorientierten für alle Personalinstrumente, neben des Merkmals, Trennschärfe
Anforderungsanalysen können Mitarbeiter/-innengesprächen gegenüber anderen parallel
Kompetenzmanagementansätze und -befragungen, verwendeten Eignungsmerkmalen,
verstanden werden. Im Sinne Leistungsbeurteilungsinstrumenten, theoretische Hinterlegung,
der DIN (2016, S. 7) sind Nachwuchsförderprogrammen empirische Überprüfung der
Kompetenz(management)modelle usw. eben auch für berufliche Konstruktzusammenhänge usw.).
strukturierte Übersichten „über die Eignungsdiagnosen. Die im Empfehlungen (vgl. Höft & Goerke,
in einer Organisation besonders organisationseigenen Modell 2014; Krumm, Mertin &
wesentlichen Kompetenzen, aufgeführten Kompetenzen Dries, 2012) gehen dahin,
bezüglich der vorhandenen werden dann häufig bei einer Kompetenzbegrifflichkeiten
beruflichen Aufgaben oder zielpositionsspezifischen Auswahl und aus organisationseigenen
ausgeübten Tätigkeiten“. Die Inhalte Gewichtung als Eignungsmerkmale Kompetenzmanagementmodellen
von Kompetenzmodellen sind verwendet. Diese Reinterpretation aus Akzeptanzgründen auf der
häufig aus den durch die obersten ist in Fachkreisen nicht unumstritten obersten Titelebene zu verwenden,
Entscheidungsträger/-innen (vgl. z.B. die pointierte Darstellung die Eignungsmerkmale dann aber
definierten Organisationszielen von Schuler, 2014, S. 143-145 oder auf den untergeordneten Ebenen
abgeleitet und formulieren die die Hinweise bei Höft & Schuler, 2014, mithilfe anforderungsanalytischer
Ansprüche, die an das Personal einer S. 86), da die durch psychologische Methoden und Befunde
Organisation zur Zielerreichung Laien definierten Begrifflichkeiten weitergehend zu differenzieren
gestellt werden (vgl. ausführlicher üblicherweise nicht die Qualität und zu spezifizieren. Wichtig ist
Höft & Goerke, 2014). Die von psychologisch weitergehend ein deutlicher Verhaltensbezug
Kompetenzprofile haben damit untersuchten Merkmalen erreichen der Operationalisierungen
einen instrumentellen Nutzen für (z.B. Eindimensionalität des (7 Abschn. 2.2.3 „Operationalisierung
die Unternehmensführung und Konstruktes, Homogenität der von Eignungsmerkmalen“).

Beschreibungsebenen im Überblick
In . Abb. 4.2 sind die dargestellten Beschreibungsebenen noch einmal
im Überblick dargestellt. In einer Prozesskette werden die Zielsetzun-
gen sowie die vorrangigen Ergebnisse der drei Zugangswege dargestellt.
Auf der untersten Ebene wird durch unterschiedlich breite Pfeile ihre
unmittelbare Relevanz für die eignungsdiagnostische Arbeit angedeu-
tet: Während die eigenschaftsorientierten Analysen direkte Informa-
tionen zu relevanten Eignungsmerkmalen und den damit verbunde-
nen bereits vorhandenen Verfahren (z.B. messtheoretisch fundierten
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
107 4

Aufgaben und Ergebnisse Beschreibungs-


ebenen zur
Verhalten beruflichen
Zielposition
Eigenschaften

Ziel: Beschreibung des Arbeitsinhaltes anhand


der Aufgaben und ihrer objektiven Merkmale
Zielsetzung der
unterschiedlichen
Zugangswege
Ziel: Erfassung des
prozessualen Aspektes der Aufgabenerfüllung

Ziel: Identifikation erfolgsrelevanter Fähigkeiten


und Eigenschaften

Ergebnis der
Mögliche Eignungsmerkmale Sammlung kritischer Gewichtete spezifischen
für das Anforderungsprofil Ereignisse Aufgabeninventare Analysen

Verwendung in
Anforderungsprofil mit Verfahrensauswahl der späteren
Eignungsmerkmalen und -konstruktion Diagnostik

. Abb. 4.2  Zielsetzungen und Ergebnisse der drei Beschreibungsebenen der Anforderungsanalyse und ihre spätere
Verwendung in der Diagnostik

Fragebogen und Tests) liefern, geben die Verhaltens- und die Aufga-
ben-/Ergebnisebenen zusätzliche Informationen, die unmittelbar für
die Verfahrenskonstruktion (z.B. zur Szenariogestaltung bei Verfahren
zur Verhaltensbeobachtung und -beurteilung oder zur Entwicklung
situativer Fragen in mündlichen Befragungen) genutzt werden können.

4.1.4 Zusammenführung der Informationen in


einem Anforderungsprofil

Wenn unterschiedliche anforderungsbezogene Informationen mithilfe


sich ergänzender Methoden gesammelt wurden, müssen diese zu einem
Profil verdichtet werden. Im Sinne der DIN (2016) vollzieht sich in
dieser Phase ein Perspektivenwechsel: Wurden vorher in der Anforde-
rungsanalyse die erfolgskritischen Merkmale der berufliche Tätigkeit
untersucht, geht es jetzt darum, die für die erfolgreiche Arbeit notwen-
digen Eignungsmerkmale der Person zu spezifizieren (. Tab. 4.1: der
Fokus wechselt von der linken zur rechten Spalte).
Beim Aufbau des Anforderungsprofils ( 7 Abschn. 2.1 ) sind
mindestens drei Ebenen zu konkretisieren ( 7 Tab. 2.2 für eine
Veranschaulichung):
108 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

1. Ebene 1: Abstraktes Eignungsmerkmal mit Umschreibung der


Dimension
2. Ebene 2: Verhaltensnahe Operationalisierungen, die das
Eignungsmerkmal konkretisieren
3. Ebene 3: Beispielhafte Verhaltenskonkretisierungen

Im Anforderungsprofil werden Die Elemente der Ebenen 1 und 2 können direkt als Ergebnis der Anfor-
mindestens drei Ebenen derungsanalyse formuliert werden. Elemente der Ebene 3 können erst
4 unterschieden formuliert werden, wenn die Verfahrensauswahl/-konstruktion erfolgt
ist (7 Abschn. 2.1).
In der Praxis dominieren bei der Profilerstellung pragmatische
Lösungen, bei denen die vorliegenden Informationen intuitiv und ggf.
auch im Diskurs mit den Auftraggeberinnen und -gebern ausgewählt
und verdichtet werden. Anwendungsbeispiele z.B. im Sinne des syn-
thetischen Validierungsansatzes (vgl. Schuler et al., 1995) und struktu-
rierte Ansätze (Koch & Westhoff, 2012) sind selten. Häufig dienen die
Befunde aus eigenschaftsorientierten Anforderungsanalysen als Aus-
gangspunkt für die Definition der obersten Ordnungsebene, während
aufgaben- und verhaltensbezogene Analyseergebnisse zur Konkreti-
sierung dieser Begrifflichkeiten auf untergeordneten Ebenen dienen.
Von der abstrakten Bezeichnung Bei komplexen Profilen bewährt es sich, eine weitere Ebene zwi-
des Eignungsmerkmals schen 1 (abstraktes Eignungsmerkmal) und 2 (verhaltensnahe Ope-
zur verhaltensnahen rationalisierungen) einzubauen. Auf dieser Ebene wird mithilfe abge-
Operationalisierung grenzter Facetten das Eignungsmerkmal noch einmal konkreter
umschrieben. So kann beispielsweise das Eignungsmerkmal „Koope-
ration“ sinnvoll in die Teilaspekte „Hilfestellungen geben“ und „offene
Informationspolitik“ untergliedert werden, um gezielte Handlungen
von allgemein sinnvollen Vorgehensweisen abzugrenzen. Die erste
Facette subsummiert dann andere verhaltensnahen Operationalisie-
rungen (z.B. „andere Teilnehmer/-innen unterstützen“) als die zweite
(z.B. „ungefragt Auskunft zum eigenen Status geben“), und eine voll-
ständige Abdeckung des Merkmals wird gewährleistet.
Von der verhaltensnahen Im Anforderungsprofil können die auf der dritten Ebene aufgeführ-
Operationalisierung ten Verhaltenskonkretisierungen erst erfolgen, wenn die Verfahrens-
zur beispielhaften auswahl /-konstruktion erfolgt ist (7 Abschn. 2.1). Die Verhaltenskon-
Verhaltenskonkretisierung kretisierungen im Anforderungsprofil sind außerdem nur beispielhaft.
In den Materialien zu den Einzelverfahren zur Verhaltensbeobachtung
und -beurteilung (z.B. in den Materialien zum Rollenspiel) sowie in den
Unterlagen zum Interview werden die Verhaltenskonkretisierungen
dann in den meisten Anwendungsfällen verfahrensspezifisch ausgelegt.
Im Training der Beobachter/-innen wird die selbstständige Herleitung
und Identifikation einschlägiger Verhaltensweisen geübt.
DIN-Forderung: Speziell bei dieser Arbeit ist die häufig auftretende Kulturprägung von
Kulturabhängigkeit der als adäquat eingestuften Verhaltenskonkretisierungen zu berücksichti-
Verhaltenskonkretisierung als gen. Kersting und Ott (2015) führen das Beispiel an, dass für das Eig-
potenzielle Fehlerquelle beachten nungsmerkmal „Kooperation“ häufig positive Verhaltensanker wie „lässt
Gesprächspartner/-in ausreden“ formuliert werden. Gerade diese Anker
ordnen sie als kulturell stereotype Verhaltensanker ein, da beispielsweise
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
109 4
in Bulgarien und Italien kaum jemand Anstoß daran nehme, wenn jemand
Gesprächspartner/-innen in einer Diskussion unterbricht und lebhaft dis-
kutiert. Ein anderes Beispiel ist der Verhaltensanker „spricht auch unange-
nehme Dinge konkret an“ als positiver Indikator für das Eignungsmerkmal
„Ergebnisorientierung“. Auch dieser Anker gibt kulturell stereotype Inter-
pretationen der Eignungsmerkmale wieder, denn die Konventionen in
der Schweiz oder in Asien verbieten es in der Regel, unangenehme Dinge
direkt anzusprechen. Gewählte Konkretisierungen (Verhaltensanker) von
Eignungsmerkmalen müssen entsprechend bei der Profilerstellung im
Hinblick auf die Zielgruppe reflektiert werden, und die Beobachter/-innen
müssen für diese automatisierten kognitiven Prozesse sensibilisiert werden
(7 Abschn. 2.2.5 „Fehlereinflüsse und mögliche Gegenmaßnahme“). Nach
DIN (2016, S. 22) müssen daher Eignungsdiagnostiker/-innen über die
Kulturabhängigkeit von Anforderungen Bescheid wissen, um zu vermei-
den, dass nur Angehörige einer bestimmten Kultur den Anforderungen
gerecht werden können.

4.1.5 Festlegung und Konkretisierung notwendiger


Ausprägungsgrade der Eignungsmerkmale

Im Rahmen der Anforderungsanalyse müssen nach DIN (2016, S. 10) Bei der Festlegung der
nicht nur die erfolgskritischen Eignungsmerkmale festgelegt werden, erforderlichen Ausprägungsgrade
sondern auch die erforderlichen Ausprägungsgrade dieser Eignungs- von Eignungsmerkmalen
merkmale. Für die Konstruktion von Beurteilungsskalen für das Inter- können verhaltensverankerte
view (direkte mündliche Verfahren) und für die Verfahren zur Verhal- Beurteilungsskalen hilfreich sein
tensbeobachtung und -beurteilung geschieht diese Festlegung häufig
im Rahmen der Entwicklung von sogenannten „verhaltensverankerten
Beurteilungsskalen“, deren Grundkonzept auf einen Entwurf von Smith
und Kendall (1963) zurückgeht (7 Exkurs „Konstruktion verhaltensver-
ankerter Beurteilungsskalen“).

Exkurs

Konstruktion verhaltensverankerter Beurteilungsskalen


Schuler, Muck, Hell, Höft, 2. Eine nachfolgende Verhaltensbeschreibungen
Becker und Diemand (2004) Blindzuordnung der den einzelnen Skalenstufen
beschreiben im Kontext der gesammelten Verhaltensweisen zu. In die engere Auswahl
betrieblichen Leistungsbeurteilung zu den Eignungsmerkmalen werden nur Verhaltensweisen
drei Konstruktionsphasen und ihren Ausprägungsstufen genommen, bei denen die
von verhaltensverankerten durch eine zweite Gruppe von Einstufungen der Expertinnen
Beurteilungsskalen: Expertinnen und Experten und Experten eine geringe
1. Fachexpertinnen und -experten gewährleistet die Eindeutigkeit Streuung aufweisen. Zudem
formulieren im Hinblick auf jedes der Indikatoren und dient muss die gesamte Skalenbreite
vorgegebene Eignungsmerkmal als Grundlage für eine erste durch Verhaltensbeschreibungen
Verhaltensweisen, die gute, Vorauswahl der letztendlich abgedeckt werden.
mittlere und schwache genutzten Verhaltensweisen.
Leistungen im Sinne des 3. Eine weitere Gruppe
Merkmals darstellen. ordnet die vorliegenden
110 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

DIN-Forderung: Vorabfestlegung Allerdings müssen im Rahmen der Anforderungsanalyse nicht nur für
der Werte, die bezüglich der die Ergebnisse von Interviews und Verfahren zur Verhaltensbeobach-
Verfahrensergebnisse von den tung und -beurteilung, sondern auch für die Ergebnisse von Dokumen-
Kandidatinnen und Kandidaten tenanalysen sowie messtheoretisch fundierten Fragebogen und Tests
erreicht werden müssen (z.B. über vorab Festlegungen erfolgen, welches Ergebnis zu welcher Eignungsaus-
Cut-off-Werte) sage führt. Ist das Eignungsmerkmal „Intelligenz“ im Sinne der Eignung
bei einem Wert von 100 oder erst bei einem Wert von 115 ausreichend
gut ausgeprägt? Gibt es unterschiedliche Kategorien der Eignung (z.B.
4 „den Anforderungen voll entsprechend“, „den Anforderungen weit-
gehend entsprechend“ usw.)? In Bezug auf messtheoretisch fundierte
Fragebogen und Tests spricht man in diesem Fall von der Festlegung
von Cut-off-Werten (oder Testtrennwerten). Solche Werte können u.a.
durch Ratings von Expertinnen und Experten oder in Relation zu einem
Außenkriterium (siehe Kriteriumsgültigkeit, 7 Abschn. 5.4.3) festgelegt
werden. Bei der Festlegung kann auch die Orientierung an den Norm-
werten hilfreich sein (7 Abschn. 5.4.5, normorientierte und kriteriums-
orientierte Messungen; für die Festsetzung von „Standards“ im Rahmen
der kriteriumsorientierten Diagnostik siehe Herzberg & Frey, 2011).

4.1.6 Eignungsmerkmal und Gesamteignung

DIN-Forderung: Bei der Im Rahmen der Auftragsklärung muss entschieden werden, ob es not-
Feststellung der Gesamteignung wendig ist, nicht nur die notwendige Ausprägung der einzelnen Eig-
die Bedeutsamkeit der nungsmerkmale festzustellen, sondern eine zusammenfassende Eig-
einzelnen Eignungsmerkmale nungsbeurteilung zu treffen. In diesen Fällen ist nach DIN (2016, S. 10)
und notwendige im Rahmen der Anforderungsanalyse zu klären, „in welchem Maße die
Mindestausprägungen einzelnen Eignungsmerkmale bedeutsam sind und ob Mindestausprä-
vorab festlegen gungen für einzelne Eignungsmerkmale verlangt werden“. Es geht also
darum, „ob und wie einzelne erhobene Werte zu einem Gesamtwert
zusammengefasst werden“ (DIN, 2016, S. 10).
Bedeutsamkeit und notwendige Man kann beispielsweise entscheiden, dass alle Eignungsmerkmale
Ausprägungshöhe unterscheiden für die Gesamteignung gleich wichtig sind oder aber einzelnen Eignungs-
merkmalen ein höheres Gewicht zuschreiben. Strategien der regelgelei-
teten Urteilsbildung wie die „Kompensationsstrategie“, die „Und-Stra-
tegie“ sowie die „Oder-Strategie“ werden in 7 Abschn. 6.3.2 beschrieben.
Die Frage der Gewichtung ist unabhängig von der Festlegung von Min-
destwerten. Man kann einem Eignungsmerkmal ein geringes Gewicht
bei der Bildung des Gesamturteils zubilligen und zugleich die Regel for-
mulieren, dass eine Kandidatin/ein Kandidat als ungeeignet eingestuft
wird, wenn sie/er einen gewissen Ausprägungsgrad in diesem Eignungs-
merkmal unterschreitet. Insgesamt wird in der DIN (2016, S. 10) darauf
hingewiesen, dass zwischen der Bedeutsamkeit eines Eignungsmerk-
mals einerseits und der für notwendig erachteten Ausprägungsstärke
(Anforderungshöhe) dieses Merkmals andererseits zu unterscheiden ist.
Regeln für die Von zentraler Bedeutung ist, dass die Festlegung der Regeln für
Ergebnisinterpretation die Ergebnisinterpretation vorab erfolgt. Nach DIN (2016, S. 10)
vorab festlegen geht es darum, zu klären, „ab welchem Skalenwert eines einzelnen
4.1 · Die Anforderungsanalyse als Grundlage der beruflichen Eignungsdiagnostik
111 4
Eignungsmerkmals und/oder des Gesamturteils von welcher Eig-
nungsausprägung ausgegangen wird, ob und wie Cut-off-Werte und
Kompensationsmöglichkeiten vorgesehen werden“. Häufig wird im
Rahmen der Eignungsbeurteilung eine Vielzahl von Werten erhoben,
ohne vorab zu klären, wie man auf Basis dieser Werte zu dem letztendli-
chen Gesamteignungsurteil kommt. In diesem Falle besteht die Gefahr,
dass die Integration der Werte über verschiedene Kandidatinnen und
Kandidaten hinweg unterschiedlich erfolgt und von sachfremden Erwä-
gungen getrieben wird. So wird bei Kandidat 1, den man (ggf. unbe-
wusst) unsympathisch findet, die Gesamteignung in Abrede gestellt,
weil er in Eignungsmerkmal x eine schlechte Ausprägung erzielt hat.
Bei Kandidatin 2, die den gleichen Ausprägungsgrad in Eignungsmerk-
mal x aufweist, den Entscheiderinnen und Entscheidern aber sympa-
thisch ist, argumentiert man hingegen, Eignungsmerkmal x sei nicht
so bedeutsam oder aber könnte durch gute Werte in Eignungsmerk-
mal y (die sowohl Kandidat 1 als auch Kandidatin 2 aufweisen) kom-
pensiert werden.

4.1.7 Dokumentation

Sowohl das Vorgehen bei der Anforderungsanalyse als auch die wesent-
lichen Ergebnisse der Anforderungsanalyse müssen nach DIN (2016,
S. 20) dokumentiert werden.

4.1.8 Fazit

In diesem Kapitel wurden wesentliche Informationen zusammengefasst,


die im Sinne der DIN (2016) bei einer Anforderungsanalyse zu beach-
ten sind. Zentral ist eine umfassende und zukunftsorientierte Identi-
fikation der Eignungsmerkmale, die in Bezug auf die Leistung und die
Zufriedenheit in der jeweiligen Zielposition relevant sind.
Es wurden drei konzeptionelle Zugänge vorgestellt, von denen
die arbeitsplatzanalytisch-empirische Methode ausführlicher behan-
delt wurde. Hier werden drei Beschreibungsebenen für anforderungs-
bezogene Informationen unterschieden (Aufgaben und Ergebnisse,
Verhalten und Eigenschaften), die in das spätere Anforderungsprofil
(7 Kap. 2.1) mit der Bezeichnung des Eignungsmerkmals, verhaltens-
nahen Operationalisierungen und beispielhaften Verhaltenskonkreti-
sierungen integriert werden.
Die Autorinnen und Autoren der DIN betonen die konstitutive
Bedeutung der Anforderungsanalyse für den gesamten Prozess der
Eignungsbeurteilung. „Es dürfen nur Verfahren verwendet werden,
die einen eindeutigen Anforderungsbezug aufweisen (…)“ (DIN, 2016,
S. 11). Die als notwendig erachteten Ausprägungsgrade der Eignungs-
merkmale sowie die Vorgehensweise bei der etwaigen Bildung eines
Gesamturteils müssen vorab festgelegt werden.
112 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

? Kontrollfragen zu 7 Abschn. 4.1


1. Beschreiben Sie, wie die drei in 7 Abschn. 4.1.2
beschriebenen Wege zur Ableitung von Eignungsmerkmalen
konkret ausgestaltet werden können, um Hinweise auf das
Anforderungsprofil von Bankkaufleuten im Filialbetrieb einer
Bank zu erhalten.
2. Definieren Sie zu einer bestimmten Zielposition (z.B.
Bankkaufmann/-frau im Filialbetrieb einer Bank) ausgehend
4 von der entsprechenden BerufeNet-Beschreibung und
eigenen Recherchen relevante Aufgabengruppen sowie damit
verbundene Tätigkeiten und Arbeitsergebnisse.
3. Formulieren Sie zu jeder Aufgabengruppe (Ergebnis der
Aufgabe 2) ein „kritisches Ereignis“.
4. Sie möchten für die Erfassung des Eignungsmerkmals
„Teamfähigkeit“ in einem Verfahren zur Verhaltensbe-
obachtung und -beurteilung (Gruppenarbeit, bei der
gemeinsam ein Betriebsausflug mit Grillfest geplant
werden soll) eine verhaltensverankerte Beurteilungsskala
konstruieren. Skizzieren Sie die Vorgehensweise und erstellen
Sie einen ersten Prototyp für eine mögliche Skala.

Weiterführende Literatur
Eine ausführlichere Darstellung zu traditionellen Arbeits- und Anforderungsanaly-
sen gibt Schuler (2014), während Krumm et al. (2012) stärker auf Kompetenzansätze
eingehen. Einen Überblick zur US-amerikanischen Praxis geben Brannick, Levine
und Morgeson (2007).

4.2 Verfahren der Eignungsbeurteilung sowie ihre


Möglichkeiten und Grenzen

Martin Kersting

In der DIN (2016) werden die zur Eignungsdiagnose genutzten


Verfahren in fünf Kategorien eingeteilt. Diese fünf Kategorien
werden im vorliegenden Kapitel erläutert. Anschließend werden
die Anforderungen der DIN dargestellt, die den unterschiedlichen
Verfahrenskategorien zugeordnet sind. Da die Anforderungen an
direkte Gespräche und Verhaltensbeobachtungen/-beurteilungen
bereits in den 7 Kap. 2 und 7 Kap. 3 erläutert wurden, stehen die
Anforderungen an die messtheoretisch fundierten Fragebogen und
Tests im Fokus des vorliegenden Kapitels. Der Text geht darauf ein,
wie sich die Qualität von Fragebogen und Tests beurteilen lässt.
Vorab werden – vergleichsweise kurz – die Anforderungen an die
Dokumentenanalyse behandelt. Ein Abschnitt über die Möglichkeiten
und Grenzen der Verfahren thematisiert Gesichtspunkte wie die
Verfälschbarkeit und die Akzeptanz der Verfahren.
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
113 4

Immer häufiger werden der Computer und das Internet genutzt,


um Verfahren der Eignungsbeurteilung durchzuführen. Was dabei
zu beachten ist, wird im folgenden Kapitel ebenso erläutert wie
die in diesem Kontext zu beachtende Unterscheidung zwischen
dem geschützten und ungeschützten internetgestützten Testen.
Für die sogenannten „generischen“ Eignungsmerkmale wie
Intelligenz und Gewissenhaftigkeit gibt es ein großes Angebot an
messtheoretisch fundierten Fragebogen und Tests. Daher werden
generische Merkmale aus verschiedenen Bereichen und dazu
„passende“ Fragebogen und Tests skizziert. Im letzten Abschnitt
des Kapitels geht es darum, wie man die Eignungsbeurteilung
strategisch ausrichten kann.

4.2.1 Auswahl von Verfahren

Sobald das Anforderungsprofil (7 Abschn. 2.1) feststeht, beginnt die Verfahren zur Erfassung der
Planung des Eignungsbeurteilungsprozesses. Dabei ist nach DIN (2016, Eignungsmerkmale
S. 11) u.a. festzulegen, welche Verfahren der Eignungsbeurteilung in
welcher Reihenfolge angewendet werden sollen. Dies setzt voraus, dass
sich die Eignungsdiagnostiker/-innen einen Überblick über diejeni-
gen Verfahren verschaffen, die zur Erfassung der Eignungsmerkmale
in Betracht kommen.

4.2.2 Fünf Verfahrenskategorien

Nach DIN (2016) werden die unten hervorgehoben dargestellten fünf Die „Quelle“ der Information
Kategorien von Verfahren unterschieden. Diese Einteilung geht auf das bestimmt die Zuordnung zu einer
CUBE System von Kersting (2011) zurück. Hier werden die Verfahren Verfahrenskategorie
u.a. danach einteilt, welcher „Quelle“ die Informationen entstammen
(7 Exkurs „Das CUBE System“). Demzufolge kann man
55 etwas aus dem Leben der Kandidatinnen und Kandidaten
aufgrund objektiver (im Sinne von: verifizierbarer, also zumindest
prinzipiell nachprüfbarer) Daten (Sachinformationen) in
Erfahrung bringen, z.B. ihren Werdegang, ihre vergangenen
Leistungen analysieren
55 die Kandidatin/den Kandidaten selbst oder Dritte (z.B. (ehemalige)
Vorgesetzte) zur Kandidatin/zum Kandidaten befragen
55 die Kandidatin/den Kandidaten in Situationen bringen/Übungen
absolvieren lassen, die eine bestimmte Realität simulieren (z.B. im
Rollenspiel)
55 die Kandidatin/den Kandidaten selbst (Selbsteinschätzung)
oder eine Auskunftsperson (Fremdeinschätzung) mithilfe eines
Fragebogens befragen
55 die Kandidatin/den Kandidaten testen
114 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

4
METHODE

ON
TI
TA
RE
RP
PROVOZIERTE

TE
IN
REAKTION

. Abb. 4.3  Diagnostische Verfahren - das CUBE System (der Inhalt der Abbildung ist nicht prüfungsrelevant.)

Diese Differenzierung führt zu der Einteilung der Verfahren der Eig-


nungsbeurteilung in fünf Gruppen, wie sie im Folgenden sowie in
. Abb. 4.3 dargestellt ist.

> Wichtig
Fünf Kategorien von Verfahren nach Kersting (2011) in der
modifizierten Fassung nach DIN (2016, S. 12)
a. Dokumentenanalyse (z.B. die Analyse und Interpretation
von Hochschul-, Schul- und Arbeitszeugnissen, dem
Lebenslauf, von Beurteilungen, der Ergebnisse von
Internetrecherchen)
b. Direkte mündliche Befragungen (z.B. Interview, mit
Kandidaten; Gespräch mit einem Referenzgeber)
c. Verfahren zur Verhaltensbeobachtung und -beurteilung
(z.B. Rollenspiele, Gruppendiskussionen, Präsenta-
tionsübungen, Arbeitsproben)
d. Messtheoretisch fundierte Fragebogen (z.B. Persönlich-
keitsfragebogen, Interessenfragebogen)
e. Messtheoretisch fundierte Tests (z.B. Intelligenztests,
Wissenstests, Situational Judgement Tests)

Zuordnung zu einer Kategorie im Die Zuordnung eines konkreten Verfahrens zu einer der fünf Kate-
Einzelfall prüfen gorien kann nicht aufgrund von oberflächlichen Bezeichnungen
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
115 4
vorgenommen werden, sondern ist im Einzelfall zu prüfen. Ein Bei-
spiel ist das „Postkorb“-Verfahren. Hier müssen Kandidatinnen und
Kandidaten in einer vorgegebenen Zeit eine Reihe von Informationen
(z.B. E-Mails, Organigramme und Notizen) bearbeiten und Entschei-
dungen treffen. Es gibt diese Verfahren als „messtheoretisch fundierten
Test“, bei dem die Kandidatinnen und Kandidaten ihre Entscheidungen
auf einem Antwortbogen eintragen oder in den Computer eingeben.
Anschließend wird die Leistung vollständig standardisiert (z.B. mithilfe
einer Schablone) bestimmt. Ebenso gibt es Varianten der Postkorb-
Übung, bei dem die Kandidatinnen und Kandidaten gebeten werden,
nach der Bearbeitungszeit ihre Entscheidungen einem Gremium zu prä-
sentieren, das anschließend die Leistung beurteilt. Diese Variante wäre
der Kategorie „Verfahren zur Verhaltensbeobachtung und -beurteilung“
zuzuordnen. Pauschalzuordnungen wie „ein Postkorb gehört zur Ver-
fahrenskategorie x“ sind daher nicht sinnvoll.
Assessment Center/Development Center, Management-Audits usw. Die Bestandteile eines
stellen im Sinne der DIN (2016) keine eigenständige Verfahrenskatego- Assessment Centers sind
rie dar. Mit diesen Begriffen wird ein Verfahrens-Mix bezeichnet. Ein häufig unterschiedlichen
Management-Audit oder ein Assessment Center umfasst z.B. häufig Verfahrenskategorien zugeordnet
ein Interview (Kategorie: „direkte mündliche Befragungen“) sowie ein
Rollenspiel oder eine Präsentationsübung (Kategorie: „Verfahren zur
Verhaltensbeobachtung und -beurteilung“).
Bei der Verfahrensauswahl sollten laut DIN (2016, S. 12) verschie-
denartige Verfahren im Sinne der fünf verschiedenen Kategorien Berück-
sichtigung finden. Jedes berücksichtigte Verfahren muss einen zusätz-
lichen Nutzen erwarten lassen. Sofern der Nutzen in einer Steigerung
der Aussagekraft des Gesamtverfahrens gesehen wird, geht es dabei um
die sogenannte „inkrementelle Gültigkeit“, die wir in 7 Kap. 5 erläutern.

Exkurs

Das CUBE System


Das CUBE System (ursprünglich Reaktionen können (a) willkürlich- Das CUBE System führt zu
Kersting, 2011, hier in einer frei (reaktionsoffen, wenn einem differenzierteren
modifizierten und erweiterten Kandidatinnen und Kandidaten Bild der diagnostischen
Version) zeigt den Möglichkeitsraum z.B. freigestellt ist, wie sie auf Zugänge als eindimensionale
diagnostischer Vorgehensweisen Interviewfragen antworten), (b) Kategorienansätze. Grundsätzlich
und Zugänge. Der sogenannten willkürlich-standardisiert (wenn ist das System offen für
„CUBE 2-1a“ ist in . Abb. 4.3 Kandidatinnen und Kandidaten Erweiterungen. Außerhalb der
dargestellt. Neben der Dimension z.B. in einem standardisierten Eignungsdiagnostik würde man z.B.
der Verfahrenskategorie, die von Interview zwischen vorgegeben die Dimension „Verfahren“ um die
den Autorinnen und Autoren der Antwortkategorien wählen müssen) Kategorie der psychophysiologische
DIN (2016) aufgegriffen wurde, oder (c) unwillkürlich (z.B. bei einem Diagnostik ergänzen. Mit einer
gibt es zwei weitere Dimensionen. impliziten Assoziationstest) sein. weiteren Dimension könnte man
Zunächst wird unterschieden, In der dritten Dimension des CUBE unterscheiden, ob mit einem
welche Reaktionen seitens der 2-1a geht es um die Interpretation Verfahren eher typisches oder eher
diagnostizierten Personen mit der Daten. Diese kann (i) maximales Verhalten diagnostiziert
den Verfahren (oder Teilen der eigenschaftsorientiert, (ii) behavioral wird (vgl. Klehe & Anderson, 2007).
Verfahren) provoziert werden. Die oder (iii) psychodynamisch erfolgen.
116 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

4.2.3 Anforderungen an Verfahren

Die Unterschiedlichkeit der Verfahren in den fünf Kategorien ist


deshalb bedeutsam, weil sich daraus unterschiedliche Anforderungen
ableiten (. Abb. 4.4).

Handhabungs- und Verfahrenshinweise


4 Für jedes Verfahren müssen In der DIN werden Anforderungen formuliert, die beim Einsatz dia-
Handhabungshinweise vorliegen gnostischer Verfahren erfüllt werden müssen. Es gibt Anforderun-
gen, die für alle fünf Kategorien von Verfahren gelten (. Abb. 4.4). So
müssen nach DIN (2016, S. 12) für jedes Verfahren, egal welcher Kate-
gorie, Handhabungshinweise vorliegen. In den Handhabungshinweisen
sollten u.a. die Anwendungsbereiche des Verfahrens benannt werden
(z.B. bei welcher Personengruppe das Verfahren angewendet werden
kann), und es muss erläutert werden, ob die Anwendung des Verfahrens
besondere Qualifikationen erfordert. Insbesondere sind die Handha-
bungshinweise nach DIN (2016, S. 27) so zu gestalten, dass verschie-
dene Personen in der Lage sind, die Verfahren allein aufgrund dieser
Handhabungshinweise auf die gleiche Art und Weise durchzuführen,
auszuwerten und zu interpretieren. In der Praxis spielen diesbezüglich
der Interviewleitfaden (7 Abschn. 3.1) und das Beobachter-/Beobach-
Für messtheoretisch fundierte terinnenhandbuch eine Rolle, die so gestaltet werden können, dass sie
Fragebogen und Tests die Funktion der Handhabungshinweise erfüllen.
müssen zusätzlich zu den Für messtheoretisch fundierte Fragebogen und Tests müssen zusätz-
Handhabungshinweisen lich zu den Handhabungshinweisen auch Verfahrenshinweise vorliegen
Verfahrenshinweise vorliegen (. Abb. 4.4). In der Praxis werden diese Verfahrenshinweise häufig auch

Handhabungshinweise

zusätzlich: Verfahrenshinweise

Doku- Direkte Verfahren z. Mess- Mess-


menten- mündliche Verhaltens- theoretisch theoretisch
analyse Befragungen beobachtung fundierte fundierte
u.- beurteilung Fragebogen Tests
(z. B. (z. B. (z. B.
Zeugnisse) Interview) Rollenspiel)

teilweise
gemeinsame
gemeinsame Anforderungen
Anforderungen

. Abb. 4.4  Anforderungen an Verfahren


4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
117 4
Testmanual oder Testhandbuch genannt. Die Handhabungshinweise
sind in der Regel ein Bestandteil der Verfahrenshinweise, kein separa-
tes Dokument. In einem Anhang der DIN (2016) ist aufgeführt, welche
Informationen diese Verfahrenshinweise enthalten sollen oder müssen.
Diese Anforderungen sind in der sogenannten „DIN SCREEN Check-
liste 1“ zusammengefasst, die im 7 Anhang vollständig wiedergegeben
ist. Die Checkliste repräsentiert den „Standard zur Information und
Dokumentation von Instrumenten zur Erfassung menschlichen Erle-
bens und Verhaltens des Diagnostik- und Testkuratoriums der Föde-
ration Deutscher Psychologenvereinigungen“. Nur wenn diese Infor-
mationen vorliegen (z.B. der Bericht über die in empirischen Studien
mit dem Verfahren erzielten Ergebnisse), kann die Qualität des Ver-
fahrens beurteilt werden (siehe Kersting, 2006). Die Pflicht, relevante
Informationen zu messtheoretisch fundierte Fragebogen und Tests zur
Verfügung zu stellen, wirkt der Intransparenz des Test- und Fragebo-
genmarktes entgegen.

Anforderungen an die Dokumentenanalyse


Welche Daten im Rahmen der Dokumentenanalyse aus der Biogra-
fie der Kandidatinnen und Kandidaten aus rechtlich zulässigen und
glaubwürdigen Quellen herangezogen werden und wie diese Daten zu
bewerten sind, muss nach DIN 2016 (S. 13) aus dem Anforderungsprofil
(7 Abschn. 2.1) abgeleitet werden. Eine für die Dokumentenanalyse
häufig genutzte Information sind Schulnoten. In 7 Abschn. 6.4.1 gehen
wir auf Schulnoten als Bestandteil der Dokumentenanalyse ein.
Eine andere regelmäßig genutzte Information sind Arbeitszeug-
nisse. Diese sind – häufig bedingt durch den Zwang zum Wohlwollen –
nicht leicht zu interpretieren. Anders, als immer wieder behauptet, gibt
es – abgesehen von vereinzelten Formulierungen wie „war stets bemüht“
– keinen eindeutigen „Geheimcode“, den alle Personen, die ein Zeugnis
erstellen, nutzen und der es ermöglichen würde, alle Arbeitszeugnis-
formulierungen eindeutig zu interpretieren.
Zur Dokumentenanalyse zählt auch die Analyse von elektronischen
Daten, etwa die Analyse von beruflichen Online-Internet-Netzwerken.
Theoretisch zählen auch „big data“-Analysen, wie die Auswertungen
von elektronischen Kommunikationsmustern, von Websites-Besuchen
oder von Daten von „Wearables“ wie Smart-Glasses, zur Dokumenten-
analyse. Der Nutzung sind allerdings strenge rechtliche Grenzen gesetzt
(7 Abschn. 4.3), und die Güte derartiger Analysen ist noch nicht hin-
reichend untersucht.
Häufig ist es sinnvoll, die Informationen aus der Dokumenten- Anforderungsbezogene
analyse zur Vorbereitung von Interviewfragen oder die Arbeitszeug- Identifizierung und Bewertung
nisse zur Vorbereitung auf das direkte Gespräch mit den Referenzge- biografischer Daten
berinnen und -gebern zu nutzen (7 Abschn. 3.1). Wichtig ist, dass die
Analyse – unabhängig von der Art der Informationen – regelgeleitet
erfolgt und die Regeln vorab festgelegt werden. In diesem Kontext ist
nach DIN (2016) auch zu klären, wie mit dem Fehlen von einzelnen
118 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Dokumenten und Teilinformationen in Dokumenten umzugehen ist.


In der DIN (2016, S. 13) wird vorgeschrieben, dass für die Dokumen-
tenanalyse Verantwortliche bestimmt werden, die u.a. die Einhaltung
der einschlägigen aktuellen Datenschutz- und Datensicherheitsbestim-
mungen sicherstellen.

Anforderungen an direkte mündliche Befragungen


4 und an Verfahren der Verhaltensbeobachtung und
-bewertung
Beobachter/-innen oder Bei den „direkten mündliche Befragungen“ (z.B. Interview) sowie den
Eignungsdiagnostiker/-innen „Verfahren zur Verhaltensbeobachtung und -beurteilung“ (z.B. Rollen-
als „Messinstrument“ im spiel) stellen die Beobachter/-innen oder Eignungsdiagnostiker/-in-
übertragenen Sinne nen im übertragenen Sinne das „Messinstrument“ dar. Direkte münd-
liche Befragungen beinhalten stets eine Verhaltensbeobachtung und
-beurteilung, sodass ein Interview eine Spezialform eines Verfahrens
zur Verhaltensbeobachtung und -beurteilung ist. Daraus leiten sich
gemeinsame Anforderungen an beide Verfahrenskategorien ab, etwa
an die Operationalisierung der Eignungsmerkmale, an die Protokol-
lierung und an die regelgeleitete Auswertung. Diese Anforderungen
werden im vorliegenden Buch im 7 Kap. 2 ausführlich erläutert. Darüber
hinaus werden in der DIN (2016) für beide Verfahrenskategorien spezi-
fische Anforderungen formuliert. Die Anforderungen an Verfahren zur
Verhaltensbeobachtung und -beurteilung werden in 7 Kap. 2 beschrie-
ben, die Anforderungen an direkte mündliche Befragungen in 7 Kap. 3.

Anforderungen an messtheoretisch fundierte


Fragebogen und Tests
Die Qualität von Fragebogen und Messtheoretisch fundierte Fragebogen und Tests können nach DIN
Tests ist eine notwendige, aber (2016, S. 16) als Sammlung von Fragen oder Aufgaben definiert werden,
keine hinreichende Bedingung für die gemäß einer wissenschaftlich akzeptierten Inhalts- und Testtheo-
deren Einsatz rie (7 Kap. 5) empirisch fundiert erstellt wurden. Zu „generischen Eig-
nungsmerkmalen“ (7 Abschn. 4.2.6) gibt es umfassendes Angebot an
messtheoretisch fundierten Fragebogen und Tests. Fragebogen und
Tests können als „Produkt“ bezeichnet werden. Die DIN (2016) ist eine
Prozess- und keine Produktnorm. Wenn jemand für einen Test mit Aus-
sagen wie „der Test xy entspricht der DIN (2016)“ wirbt, diskreditiert
sie/er sich vor allem selbst. Wenn man beurteilen möchte, ob die aus
einem messtheoretisch fundierten Fragebogen oder Test abgeleitete Eig-
nungsbeurteilung den Regeln der DIN (2016) entspricht, muss man die
konkrete Verwendung (z.B. den Anforderungsbezug und die Durch-
führungsbedingungen) prüfen. Dennoch werden in der DIN (2016)
Anforderungen an messtheoretisch fundierte Verfahren formuliert,
wobei bezüglich der Anforderungen nicht zwischen Fragebogen und
Test unterschieden wird (. Abb. 4.4). Die Erfüllung dieser Anforderun-
gen ist, so die Formulierung in der DIN (2016, S. 17), „eine notwendige,
aber keine hinreichende Bedingung für den Einsatz solcher Verfahren“.
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
119 4
Ausschlaggebend für die Verfahrensauswahl ist nach DIN (2016, S. 11)
der Anforderungsbezug: „Es dürfen nur Verfahren verwendet werden,
die einen eindeutigen Anforderungsbezug aufweisen und zur Beant-
wortung der Fragestellung sowie für die Zielgruppe der Kandidatinnen/
der Kandidaten geeignet sind.“
Mit den Anhängen A und B (Anforderungen an Handhabungshin-
weise und Verfahrenshinweise) der DIN (2016) wird festgelegt, welche
Informationen über einen messtheoretisch fundierten Fragebogen/Test
vorliegen müssen. Die DIN SCREEN Checkliste 1 gibt den Inhalt der
beiden Anhänge A und B vollständig wieder. Die Liste gilt, wie oben
bereits erwähnt, zugleich als „Standard zur Information und Dokumen-
tation von Instrumenten zur Erfassung menschlichen Erlebens und Ver-
haltens des Diagnostik- und Testkuratoriums der Föderation Deutscher
Psychologenvereinigungen“. Die Checkliste ist im 7 Anhang abgebildet
und steht außerdem unter 7http://link.springer.com/978-3-662-53772-5
(unter „Back Matter“) zum freien Download bereit.
Bei den notwendigen Angaben handelt es sich vor allem um Infor- Umfassende Sachinformationen
mationen, die in empirischen Untersuchungen gewonnen wurden. als Basis der Beurteilung
Diese Untersuchungen müssen nachvollziehbar beschrieben sein. Dies
gilt zum einen für die Untersuchungsgruppe: Welche Art von Personen
(z.B. Alter, Geschlecht, Bildungsstand) haben wann mit welchem Ziel
(z.B. Bewerbung oder Selbsterfahrung) unter welchen Bedingungen
(z.B. anonym oder im „Ernstfall“ einer Personalauswahl; beaufsichtigt
oder unbeaufsichtigt) an der Untersuchung teilgenommen? (Siehe dazu
die Ausführungen zur „Stichprobe“ in 7 Abschn. 5.2.1.) Zum anderen
gilt für die Ergebnisse: Welche empirischen Befunde zur Reliabilität
und Validität (7 Abschn. 5.4) wurden in welcher Art von Untersuchung
erzielt? Bei Fragebogen oder Tests, die einen Vergleich mit Normwerten
vorsehen (7 Abschn. 5.4.5), muss die Gruppe, anhand der die Normen
gewonnen wurden, detailliert beschrieben werden. Verfahrenshinweise,
die sich diesbezüglich mit wolkigen Formulierungen begnügen („Der
Test wird seit vielen Jahrzehnten bei Zehntausenden von Führungskräf-
ten weltweit erfolgreich eingesetzt“) erfüllen die Anforderungen nicht.
Die Auswahl und Zusammenstellung von Verfahren sollte, so wird Evidenzbasierte Auswahl und
im Text der DIN (2016) weiter erläutert, „soweit wie möglich – evi- Zusammenstellung von Verfahren
denzbasiert erfolgen. Das bedeutet beispielsweise, dass Erkenntnisse
aus belastbaren empirischen Untersuchungen/Metaanalysen zur Vor-
hersage von Berufs- und Ausbildungserfolg und andere empirisch gut
bestätigte und zur konkreten Anwendungssituation passende Evidenz
bei der Auswahl und Zusammenstellung von Verfahren berücksich-
tigt werden.“ Entsprechende Befunde werden in 7 Kap. 6 dargestellt.
Die empirische Evidenz tritt anstelle des Evidenzgefühls, das sich Empirische Evidenz anstelle des
beispielsweise aus den „Gutachten“ oder „reports“ zum Fragebogen Evidenzgefühls
ergeben kann. Häufig sprechen Personen Fragebogen eine hohe Quali-
tät zu, weil ihnen das Gutachten/der „report“ „stimmig“ oder „passend“
erscheint. Dieser Eindruck kann aber durch einen einfachen Mecha-
nismus erzeugt werden: Hierzu muss das Gutachten Formulierungen
enthalten, die für alle Menschen zutreffen. Solche Aussagen werden
120 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Barnum-Aussagen genannt. Ein Beispiel ist die Formulierung „In Ihnen


schlummert unentdecktes Potenzial“ (für eine Beschreibung des Effek-
tes siehe Forer, 1949; für aktuelle Beispiele aus gängigen Persönlich-
keitsfragebogen siehe Kersting, Graulich & Bothe, 2015). Ein Rück-
schluss von der subjektiven Empfindung, ob das Gutachten/der „report“
„passt“, auf die Qualität des Fragebogens ist nach DIN (2016, S. 16)
ebenso unzulässig wie eine Qualitätsbewertung des Verfahrens allein
anhand der Fragen und Aufgaben des Verfahrens.
4 Die Informationen in den Verfahrenshinweisen stellen die Grund-
lage für eine Beurteilung der Qualität des jeweiligen Fragebogens oder
Tests dar. Bezüglich der Qualitätskriterien für messtheoretisch fun-
dierte Fragebogen und Tests haben die Autorinnen und Autoren der
DIN (2016) die Kriterien des Testbeurteilungssystems des Diagnostik-
und Testkuratoriums (DTK; siehe Testkuratorium, 2010 und 7 Exkurs
„Das Testbeurteilungssystem des Diagnostik- und Testkuratoriums“) über-
nommen. Die Kriterien werden nachfolgend in hervorgehobener Form
dargestellt, eine Erläuterung der genutzten (Fach-)Begriffe findet sich
in 7 Kap. 5.

Qualitätskriterien für > Qualitätskriterien für messtheoretisch fundierte


messtheoretisch fundierte Fragebogen und Tests (DIN, 2016, S. 16)
Fragebogen und Tests a. Theoretische Fundierung als Ausgangspunkt der
Testkonstruktion
b. Objektivität
c. Normierung
d. Zuverlässigkeit (Reliabilität, Messgenauigkeit)
e. Gültigkeit (Validität)
f. weitere Gütekriterien (z.B. Störanfälligkeit,
Unverfälschbarkeit, Fairness)

Keine pseudorationalen Zu der Frage, wie man die einzelnen Kriterien beurteilt, hat das DTK
Beurteilungen aufgrund der ausführliche Beurteilungsrichtlinien erstellt (Testkuratorium, 2010), die
numerischen Ausprägung von auch online verfügbar sind (7 www.zpid.de/testkuratorium). Zusätzlich
Kennwerten zu den oben genannten Kriterien wird im Rahmen dieser Testbeurtei-
lung noch der Informationsgehalt der Verfahrenshinweise berücksich-
tigt (7 Anhang). Die Qualitätsbeurteilung kann nicht - dies wird in den
Richtlinien ebenso betont wie in der DIN (2016, S. 16) - allein aufgrund
der numerischen Ausprägung von Kennwerten erfolgen. Man kann bei-
spielsweise nicht sinnvoll formulieren, ein Test sei ausreichend reliabel,
wenn der Kennwert eine bestimmte Höhe erreicht (z.B. .80 oder höher).
Ein solches Vorgehen wirkt zwar auf dem ersten Blick „objektiv“, ist
aber scheingenau und pseudorational. Die Kennwerte ergeben sich aus
einem Zusammenspiel aus Merkmalen des Fragebogens/des Tests und
Merkmalen der Untersuchungsgruppe. Daher muss, wie in der DIN
(2016) ausdrücklich formuliert wird, bei der Qualitätsbeurteilung auch
eine Würdigung der empirischen Untersuchungen erfolgen. Entschei-
dend für die resultierenden Kennwerte sind z.B. die Streuungen der
Werte (7 Abschn. 5.2.3 sowie 7 Abschn. 6.2.2) in der jeweiligen Gruppe.
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
121 4
Exkurs

Das Testbeurteilungssystem des Diagnostik- und Testkuratoriums (Testkuratorium, 2010)


Das Diagnostik- und Testkuratorium wird noch bewertet, ob insgesamt die Einhaltung der Regeln des
(DTK) hat ein Testbeurteilungssystem genügend Informationen über Beurteilungsprozesses.
(TBS-TK) erstellt, das in engem den Test vorliegen. Schließlich . Tab. 4.2 zeigt beispielhaft
Zusammenhang zur DIN (2016) gibt es eine Abschlussbewertung. Beurteilungen von messtheoretisch
steht (Testkuratorium, 2010). Für vier der Qualitätskriterien fundierten Fragebogen nach dem
In einem ersten Schritt des wird zusätzlich zu einer freien TBS-TK-System. Alle Testrezensionen
Beurteilungsprozesses wird Bewertung eine „Note“ auf einer nach dem TBS-TK-System stehen
geprüft, ob die Handhabungs- und vierstufigen Skala vergeben („Der unter 7 http://www.zpid.de/
Verfahrenshinweise diejenigen Test erfüllt die Anforderungen“ Testkuratorium zum freien Download
Informationen enthalten, die nach … (a) voll, (b) weitgehend, (c) zur Verfügung. Im Vergleich zur sehr
DIN (2016) notwendigerweise teilweise und (d) nicht“). Die großen Anzahl an Fragebogen und
vorliegen müssen (7 Anhang). Bewertung jedes Verfahren wird Tests liegen nur für eine sehr kleine
Der zweite Schritt beinhaltet die durch zwei Expertinnen/Experten Anzahl an Verfahren Rezensionen
eigentliche Bewertung des Tests vorgenommen, die ihre Beurteilung nach dem TBS-TK-System vor. Man
anhand der oben hervorgehoben zunächst unabhängig voneinander kann das Beurteilungssystem aber
dargestellten sechs Qualitätskriterien vornehmen. Das DTK gewährleistet eigenständig auf die messtheoretisch
für messtheoretisch fundierte die Unvoreingenommenheit der fundierten Fragebogen und Tests
Fragebogen und Tests. Außerdem Rezensentinnen/Rezensenten sowie anwenden, die einen interessieren.

. Tab. 4.2  Bewertungen ausgewählter Fragebogen nach dem TBS-TK-System (Testkuratorium, 2010, Stand der
tabellarischen Übersicht: Juni 2016)*

Testname(Autorinnen/Autoren) Allg. Info Objektivität Zuverlässigkeit Validität

BIP-6F ++ ++ + +
(Hossiep & Krüger, 2012)1
FPI-R ++ ++ + +
(Fahrenberg, Hampel & Selg, 2010)2
OLMT ++ ++ + +
(Schmidt-Atzert, 2005)3
OPQ32 ++ ++ + +
(Bartram, Brown, Fleck, Inceoglu & Ward, 2006)4
NEO-PI-R ++ + + +
(Ostendorf & Angleitner, 2004)5
VVKI + − + −
(Liepmann & Beauducel, 2011)6
Persolog − − + −−
(Geier & Downey, 2010)7
GPOP − − − −−
(Golden, Bents & Blank, 2004)8

* Der Inhalt der Tabelle ist nicht prüfungsrelevant.


Skala: „Der Test erfüllt die Anforderungen“ (++) „voll“, (+) „weitgehend“, (–) „teilweise“ und (– –) „nicht“.
Rezension nach dem TBS-TK-System zu diesem Verfahren von 1Abrell-Vogel & Gerstenberg (2013); 2Rohrmann &
Spinath (2011); 3Ortner & Sokolowski (2008); 4Dormann & Krumm (2010); 5Andresen & Beauducel (2008); 6Moldzio &
Becker (2013); 7König & Marcus (2013); 8Höft & Muck (2009)
122 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

4.2.4 Möglichkeiten und Grenzen der Verfahren

Unterschiede in der Jedes Verfahren der Eignungsbeurteilung eröffnet Möglichkeiten und


Verfälschbarkeit der Verfahren hat Grenzen. Ein Thema im Rahmen der Eignungsbeurteilung ist die
Verfälschbarkeit. Dabei gilt die Sorge zumeist einer Verfälschung mit
dem Ziel, einen guten Eindruck zu erzielen („faking good“). In bestimm-
ten Kontexten, beispielsweise bei Fragen der Verrentung, ist aber auch
das Vortäuschen schlechter Ergebnisse („faking bad“) problematisch.
4 Die Gelegenheit zum „faking good“ ist bei direkten mündlichen Befra-
gungen, Verfahren zur Verhaltensbeobachtung und -beurteilung sowie
messtheoretisch fundierten Fragebogen im deutlich stärkeren Ausmaß
gegeben als bei der Dokumentenanalyse sowie bei den messtheoretisch
fundierten Tests. Die Selbstdarstellung der Kandidatinnen/Kandida-
ten bzw. die Verfälschbarkeit der Verfahren haben wir in den 7 Kap. 2
und 7 Kap. 3 bereits ausführlich thematisiert. Die Ausführungen lassen
sich sinngemäß auf die Problematik der Verfälschbarkeit von messtheo-
retisch fundierten Fragebogen übertragen. In diesem Kontext wurde
auch diskutiert, dass die gelungene Verfälschung Fähigkeiten voraus-
setzt (z.B. Identifizierung der Anforderungen, Selbstdarstellungskom-
petenz), die ggf. berufserfolgsrelevant sind, sodass unklar ist, ob die
Selbstdarstellung ein „Fluch oder Segen“ ist (siehe den entsprechenden
Exkurs in 7 Abschn. 3.1.5 „Selbstdarstellungsstrategien“).
Ein weiterer relevanter Gesichtspunkt ist die Akzeptanz der Ver-
fahren. Interviews (als Beispiel für direkte mündliche Befragungen)
erfreuen sich - auch dies haben wir in 7 Abschn. 3.1 bereits referiert –
sowohl bei den interviewten Personen (siehe z.B. Anderson, Salgado &
Hülsheger, 2010; Hausknecht, Day & Thomas, 2004) als auch bei den
Interviewerinnen und Interviewern (siehe Schuler, Hell, Trapmann,
Schaar & Boramir, 2007) einer großen Beliebtheit.
Bezüglich der Verfahren zur Verhaltensbeobachtung und -beurtei-
lung ist die Frage der Akzeptanz etwas unklarer. In den Metastudien von
Anderson et al. (2010) sowie Hausknecht et al. (2004) schneiden „work
samples“ unter Akzeptanzgesichtspunkten hervorragend ab. Unklar
bleibt aber, ob damit typische AC-Übungen wie Rollenspiele gemeint
sind oder technisch-mechanische Arbeitsproben oder beides. Insge-
samt ist aber aufgrund von Einzelstudien (z.B. Fruhner & Schuler, 1991;
Kersting, 2010) davon auszugehen, dass anforderungsbezogen gestal-
tete Verfahren zur Verhaltensbeobachtung und -beurteilung eine gute
Akzeptanz finden.
Unter Akzeptanzgesichtspunkten sind Intelligenztests zwar kläg-
lich beleumundet, erzielen diesem Vorurteil zum Trotz in empiri-
schen Studien zur Akzeptanz aber keinesfalls schlechte Ergebnisse.
Metanalytisch konnten Anderson et al. (2010) zeigen, dass Intelligenz-
tests in Bezug auf die Gesamtakzeptanz einen mittleren Platz erzielten
und bezüglich Wahrung der Privatsphäre sogar am besten abschnit-
ten. Kersting (2008) konnte anhand einer empirischen Befragung zur
Akzeptanz von fünf gängigen Intelligenztests zeigen, dass Teilneh-
mer/-innen Intelligenztests differenziert beurteilen. Insbesondere
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
123 4
bezüglich der Messqualität und vor allem der Kontrollierbarkeit zogen
die Teilnehmer/-innen eine positive Bilanz. Demgegenüber wurde die
Augenscheinvalidität der Verfahren relativ kritisch eingeschätzt, d.h.
die Teilnehmer/-innen fanden den Einsatz der Tests weniger plausi-
bel. Mittlerweile wird versucht, die Augenscheinvalidität von Intelli-
genztests zu erhöhen, indem die Aufgaben semantisch so eingekleidet
werden, dass sie einen unmittelbaren Bezug zur Welt der Ausbildung
oder des Berufs erhalten (7 Abschn. 4.2.6).
Die Akzeptanz von Persönlichkeitsfragebogen liegt laut der Meta- Hohe soziale Akzeptanz von
analyse von Anderson et al. (2010) nominell etwas unter der Akzep- Interviews
tanz von Intelligenztests. Daten aus Einzelstudien zeigen aber, dass
bestimmte Persönlichkeitsfragebogen gleich gut akzeptiert werden
wie Intelligenztests (Beermann, Kersting, Stegt & Zimmerhofer, 2013).
Der Vorteil von messtheoretisch fundierten Fragebogen besteht u.a. Fragebogen erlauben die
darin, dass – wie im Interview – Verhalten (indirekt) erfasst werden Erfassung von Verhalten, das
kann, das sich einer direkten Beobachtbarkeit entzieht (z.B. weil es bereits schwer zu beobachten ist
vergangen ist oder die Beobachtung zu aufwändig wäre). Bei norm-
orientierten Verfahren kann – ein Vorteil gegenüber dem Interview –
ein Vergleich mit einer Referenzpopulation vorgenommen werden.
Eine hohe Bedeutung kommt der Gültigkeit/Validität (7 Abschn. 5.4.3) Intelligenz als generisches
der aus den Verfahren abgeleiteten Eignungsaussagen zu. Diesbezüglich Eignungsmerkmal
schneiden - wie in 7 Kap. 6 ausführlich berichtet wird - insbesondere intel-
ligenztestbasierte Aussagen gut ab. Dies spricht dafür, dass Intelligenz ein
„generisches Eignungsmerkmal“ ist (7 Abschn. 4.2.6).
Die bisherigen Aussagen pauschalisieren. Natürlich lassen sich die Die Qualität von Verfahren lässt
positiven und negativen Merkmale der Verfahrenskategorien nicht sich nicht pauschal beurteilen
jedem einzelnen Element der Kategorie zuschreiben. Man kann ein
Interview so gestalten, dass es keine Akzeptanz findet. Es gibt Mög-
lichkeiten, Persönlichkeitsfragebogen so zu gestalten, dass sie schwer
zu verfälschen sind (z.B. durch die Nutzung eines sog. „forced-choice“-
Formats). Und mithilfe eines Intelligenztests gewinnt man keine validen
Eignungsbeurteilungen, wenn der Test beispielsweise veraltet ist, die
Aufgaben für die Zielgruppe zu schwer oder zu leicht sind oder der
Test unreliabel misst. Die Merkmale der Verfahrenskategorien geben
den Eignungsdiagnostikerinnen und -diagnostikern eine Orientierung,
welche Kombination welcher Verfahrenskategorien für die zu erfassen-
den Eignungsmerkmale infrage kommt. Anschließend müssen kon-
krete Verfahren mit hoher Qualität ausgewählt oder erstellt werden.

4.2.5 Anforderungen an computerbasierte und


internetgestützte Verfahren

Eignungsdiagnostische Verfahren können auch computerbasiert und Die Durchführung von


internetgestützt eingesetzt werden. Dies gilt prinzipiell für alle Katego- computerbasierten und/oder
rien von Verfahren. Diese Darbietungsform hat, sofern sie „unter Auf- internetgestützten Verfahren kann
sicht“ erfolgt (7 Abschn. 4.2.6), Vorteile bezüglich der Durchführungs-, besonders objektiv erfolgen
Auswertungs- und Interpretationsobjektivität sowie der Ökonomie.
124 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Darüber hinaus wirkt das Medium „zeitgemäß“, was sich positiv auf
die Akzeptanz auswirken kann.
Computergestütztes Ein Verfahren ändert sich nicht grundsätzlich, wenn es computer-
Testen: Systemstabilität basiert und/oder internetgestützt dargeboten wird. Bei dieser Einsatz-
und Funktionsfähigkeit sind form sind aber besondere Anforderungen zu beachten. Diesbezüglich
sicherzustellen wird in der DIN (2016) auf die von der International Test Commis-
sion (ITC, 2006) herausgegebenen „Guidelines on Computer-Based
and Internet-Delivered Testing“ verwiesen (freier Download unter
4 7 https://www.intestcom.org/page/18). In diesen Richtlinien werden
die Anforderungen an den Datenschutz und die Qualität der Tests, die
technischen Voraussetzungen und die Frage der Verantwortlichkeiten
für diese Art von Testungen thematisiert. Die Begriffe „Test“ und „Tes-
tungen“ können in diesem Kontext sehr frei interpretiert werden und
schließen prinzipiell alle Kategorien von Verfahren ein. Ein wichtiger
Punkt ist auch die Kontrolle über das Testen, z.B. die Frage der Authen-
tizität der Teilnehmer/-innen (zu geschützten Testungen s.u.). In der
DIN (2016, S. 17) wird u.a. betont, dass die Systemstabilität und Funk-
tionsfähigkeit auf den relevanten Betriebssystemplattformen sicher-
zustellen ist. Das Ergebnis der Diagnostik darf, so wird in der DIN
(2016, S. 17) hervorgehoben, nicht von eignungsmerkmalirrelevanten
Kenntnissen, Fertigkeiten oder Fähigkeiten beeinflusst werden, bei-
spielsweise von dem Ausmaß der Computerkenntnisse oder der Erfah-
rung im Umgang mit Computern. Entsprechend wichtig ist auch, dass
den Kandidatinnen und Kandidaten bei computerbasierten und inter-
netgestützten Verfahren technische Fragen beantwortet werden. Sofern
diese Verfahren außerhalb von Testzentren durchgeführt werden, soll
laut DIN (2016, S. 19) darauf geachtet werden, dass den Kandidatin-
nen/Kandidaten ein Nutzer-Support für technische Fragen bereitge-
stellt wird.

4.2.6 Durchführungsbedingungen

Durchführungsbedingungen Bereits in 7 Kap. 1 wurde thematisiert, dass die Durchführung der Ver-
festlegen fahren Objektivität gewährleisten muss. Dies geschieht u.a., indem die
Beteiligten die Vorgaben und Empfehlungen in den Handhabungs- und
Verfahrenshinweisen beachten. In 7 Kap. 1 ging es also im Wesentli-
chen darum, dass gegebene Durchführungsbedingungen eingehalten
werden. Welche Bedingungen das sind, legen die Eignungsdiagnos-
tiker/-innen fest. Im Folgenden werden unterschiedliche Durchfüh-
rungsbedingungen skizziert.
Bezüglich der Durchführungsbedingungen sind neben organisato-
rischen Gesichtspunkten (z.B. Räumlichkeiten, Störungsfreiheit) u.a.
zu beachten:
55 Anzahl der gleichzeitig untersuchten Kandidatinnen und Kandi-
daten (z.B. bei messtheoretisch fundierten Tests und Fragebogen
sowie bei Gruppendiskussionen)
55 Dauer der Eignungsbeurteilung insgesamt
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
125 4
55 Dauer der Pausen für die Kandidatinnen und Kandidaten sowie
für die Beobachter/-innen und Eignungsdiagnostiker/-innen
55 Kontrolle über die Untersuchung

Wir möchten hier den zuletzt genannten Aspekt vertiefen. Die Internatio- Vier Modi der Kontrolle bei der
nal Test Commission (ITC, 2006) unterscheidet in Bezug auf die internet- Durchführung
gestützte Testung die „unbeaufsichtigte“ und die „beaufsichtigte“ Testung
und untergliedert jede Stufe in zwei Substufen (. Abb. 4.5). Zum unbeauf-
sichtigten Testen zählt der offene („open“) Modus sowie der kontrollierte
(„controlled“) Modus. Mit dem „offenen Modus“ ist gemeint, dass die
Verfahren vollkommen frei zugänglich sind. In der DIN (2016, S. 19) wird
diesbezüglich von einer „Durchführung ohne Überwachung“ gesprochen.
Kontrolliert bedeutet, dass eine Zugangsbeschränkung besteht, indem
z.B. nur bestimmte Personen Zugangsdaten erhalten und sich beispiels-
weise mit Benutzername und Passwort identifizieren müssen. Dies schließt
natürlich nicht aus, dass andere Personen als die eingeladenen das Ver-
fahren bearbeiten. In der DIN (2016, S. 19) wird diesbezüglich von einer
„halb geschützten Durchführung“ gesprochen. Eine Authentifizierung der
Teilnehmer/-innen eines Verfahrens besteht erst im überwachten sowie
im geleiteten Modus, bei denen das Verfahren „unter Aufsicht“ durchge-
führt wird. Im überwachten („supervised“) Modus müssen sich die Kan-
didatinnen und Kandidaten authentifizieren (z.B. gegenüber einem Admi-
nistrator, der das Login kontrolliert). Im geleiteten („managed“) Modus
wird auch noch die Umgebung kontrolliert, indem das Verfahren bei-
spielsweise in einem Testcenter durchgeführt wird. In der DIN (2016, S.
19) wird nicht zwischen dem überwachten und dem geleiteten Modus
unterschieden, beide gelten als „geschützte Durchführung“. Einen Über-
blick über Studien zu Effekten der unbeaufsichtigten Durchführung von
messtheoretisch fundierten Fragebogen und Tests geben Ott, Ulfert und
Kersting (2017). Die Ausführungen der ITC (2006) beziehen sich vorran-
gig auf messtheoretisch fundierte Fragebogen und Tests, die Ausführun-
gen sind aber prinzipiell auf alle Verfahrenskategorien anwendbar. So ist
im übertragenen Sinne auch das Verfassen von Bewerbungsunterlagen

XQEH EH
DXIVLFKWLJW DXIVLFKWLJW
RIIHQ EHUZDFKW

NRQWUROOLHUW JHOHLWHW

. Abb. 4.5  Unterschiedliche Modi der Kontrolle bei der Verfahrensdurchführung


126 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

in der Regel eine „unbeaufsichtigte Testung“, weil nicht kontrolliert wird,


wer die Unterlagen erstellt. Häufig werden Teilnehmer/-innen vor einem
Verfahren der Verhaltensbeobachtung und -beurteilung oder einem Inter-
view gebeten, etwas vorzubereiten (eine Präsentation, eine „case-study“
usw.) – auch hierbei besteht ein Kontrollverlust.
Die Ergebnisse einer Testung ohne Die mangelnde Beaufsichtigung eines Verfahrens geht mit Ein-
Aufsicht sollten später überprüft schränkungen der Durchführungsobjektivität einher. Eine Organisa-
werden tion sollte auf der Basis dieser Daten keine Endauswahl von Kandidatin-
4 nen und Kandidaten vornehmen, weil sie nicht weiß, wer das Verfahren
bearbeitet hat und welche Hilfsmittel eingesetzt wurden. Organisatio-
nen können die unkontrollierte Testung aber als Screening nutzen. Auf
diese Weise können Organisationen beispielsweise Kandidatinnen und
Kandidaten die Teilnahme an weiteren Verfahren verwehren, die selbst
unter unkontrollierten Bedingungen die Anforderungen nicht erfüllen
(7 Abschn. 4.2.7 zur „sequenziellen Strategie“). Bei den Kandidatinnen
und Kandidaten, die die Testung ohne Aufsicht erfolgreich bewälti-
gen, sollte nach DIN (2016, S. 19) die Plausibilität der Ergebnisse dieses
Screening-Verfahrens in einem späteren Auswahlschritt unter Aufsicht
überprüft werden. Unbeaufsichtigte Online-Testungen sind auch die
Grundlage von Self-Assessments (7 Exkurs).
Verständnisprobleme lassen Risiken bei der unbeaufsichtigten Testung bestehen jenseits der
sich bei einer unbeaufsichtigten Authentizität der teilnehmenden Person u.a. darin, dass man nicht auf
Testung nicht ausräumen Verständnisprobleme seitens der Teilnehmer/-innen bei der Instruktion
sowie bei der Interpretation des Ergebnisses eingehen kann.

Exkurs

Self-Assessment
Ein ganz anderer Blick auf die Testung Bei internetgestützten Self- sich noch weitere Informationen
unter Aufsicht eröffnet sich, wenn Assessments können potenzielle einzuholen. Das Self-Assessment
nicht die Organisation etwas über Kandidatinnen und Kandidaten erfolgt zum eigenen Vorteil der
Kandidatinnen und Kandidaten z.B. die Anforderungen sowie die Teilnehmer/-innen – mit einem
wissen will, sondern wenn eine Passung ihrer eigenen Fähigkeiten, „Betrug“ betrügen sie sich selbst.
Organisation Personen dabei Kenntnisse und Interessen zu den Natürlich dient das Self-Assessment
unterstützen möchte, etwas über sich Anforderungen anonym, orts- und auch der Organisation: Es kann dazu
selbst in Erfahrung zu bringen. Dies ist zeitunabhängig kennen lernen. führen, dass sich letztendlich weniger,
bei sogenannten „Self-Assessments“ Dies befähigt sie, eine qualifizierte aber besser geeignete Kandidatinnen
(zur Erläuterung siehe Ott et al. , „Selbstselektion“ vorzunehmen und und Kandidaten bewerben –
2017) der Fall. Diesbezüglich haben sich für oder gegen eine Bewerbung und dann unter kontrollierten
unbeaufsichtigte Verfahren ein großes zu entscheiden. Natürlich kann die Bedingungen untersucht werden.
Potenzial für die Eignungsdiagnostik. Entscheidung auch darin bestehen,

Generische Eignungsmerkmale 4.2.7 Generische Eignungsmerkmale


sind nicht nur für spezifische
Ausbildungen und Berufe Wie in 7 Abschn. 4.1 beschrieben, gibt es unterschiedliche Methoden
bedeutsam, sondern für eine der Anforderungsanalyse sowie unterschiedliche Beschreibungsebenen.
große Menge von Ausbildungen Eine der drei erläuterten Beschreibungsebenen ist die Ebene der „Eigen-
und Berufen schaften“. Der Begriff „Eigenschaft“ kann hier synonym zum Begriff
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
127 4
„Eignungsmerkmal“ verstanden werden. Während die beiden anderen
Beschreibungsebenen (Aufgaben und Ergebnisse einerseits sowie Ver-
halten andererseits) in der Regel spezifisch auf konkrete Tätigkeiten und
Berufe bezogen sind, sind viele Eigenschaften tätigkeits- und berufs-
übergreifend relevant. Ein Beispiel ist die Intelligenz. In empirischen
Metastudien hat sich gezeigt, dass Intelligenz praktisch in allen Berufen
bedeutsam ist (7 Kap. 6), wobei die Bedeutung mit der Komplexität
der Tätigkeit steigt. Es handelt sich bei der Intelligenz also nicht um
ein für einen bestimmten Beruf bedeutsames, spezifisches Eignungs-
merkmal, sondern um ein für sehr viele Berufe bedeutsames Eignungs-
merkmal. Daher spricht man von einem „generischen“ Eignungsmerk-
mal. Ähnlich verhält es sich mit anderen Eigenschaften, wie z.B. der
Gewissenhaftigkeit.
Im Folgenden skizzieren wir einige generische Eignungsmerkmale
aus vier Bereichen:
55 (kognitive) Fähigkeiten (einschl. Wissen)
55 Persönlichkeit im engeren Sinne
55 Motive
55 Interessen

Die diesen Bereichen zugeordneten Eignungsmerkmale (wie Intelli- Für generische Eignungsmerkmale
genz und Gewissenhaftigkeit) sind in gut ausgearbeitete und empirisch gibt es ein großes Angebot an
überprüfte differentiell-psychologische oder persönlichkeitspsycho- etablierten messtheoretisch
logische Theorien eingebettet. Für generische Eignungsmerkmale gibt fundierten Fragebogen und Tests
es ein großes Angebot an etablierten messtheoretisch fundierten Fra-
gebogen und Tests. Diese Verfahren kann man nutzen, um festzustel-
len, wie diese Eignungsmerkmale bei Kandidatinnen und Kandidaten
ausgeprägt sind. Dies ist der Grund, warum wir diese Merkmale und
Theorien hier im Kapitel „Verfahren“ behandeln. Allerdings erlaubt die
Konzeption des Buches nur eine sehr kurze, skizzenhafte Darstellung.
Zur Erarbeitung eines tiefergehenden Verständnisses verweisen wir auf
die weiterführende Literatur.

Intelligenz
In 7 Kap. 6 werden die Ergebnisse einschlägiger Evaluationsstudien Intelligenz als bedeutsames
dargestellt, die aufzeigen, dass Intelligenztestergebnisse substanziell Eignungsmerkmal
mit Kriterien fast jeder Art von Ausbildungs- und Berufserfolg zusam-
menhängen. Dies konnte sowohl mit sehr umfangreichen US-ame-
rikanischen Daten als auch mit europäischen Daten gezeigt werden
(7 Tab. 6.3). Daraus lässt sich im Sinne der personbezogen-empirischen
Methode der Anforderungsanalyse (7 Abschn. 4.1.1) ableiten, dass Intel-
ligenz häufig ein bedeutsames Eignungsmerkmal ist und im Rahmen der
Eignungsbeurteilung der Einsatz von Intelligenztests häufig geboten ist.
Es gibt zahlreiche Intelligenztests, die grundsätzlich für den Einsatz Theorien als Grundlage für die
infrage kommen. Welchen der vielen Tests soll man auswählen? Die Auswahl von Fragebogen und
Antwort auf diese Frage hängt von vielen Kriterien ab, beispielsweise Tests
von den Qualitätsmerkmalen der Tests ( 7 Abschn. 4.2.2 sowie die
128 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Ausführungen zu Gütekriterien in 7 Abschn. 5.4). Von zentraler Bedeu-


tung ist außerdem, was mit den Tests erfasst wird. Auf welches Merkmal
genau lässt sich aufgrund der Testergebnisse schließen? Es geht um die
Konstruktgültigkeit (7 Abschn. 5.4.3) und somit um Theorien. Deshalb
muss, wer ein Verfahren auswählt, über einschlägige Theorien zu dem
jeweiligen Eignungsmerkmal Bescheid wissen. Das gilt für die Intelli-
genz ebenso wie für jedes andere Eignungsmerkmal. Dabei gibt es in
der Regel nicht nur eine, sondern mehrere, ggf. konkurrierende Theo-
4 rien zu einem Merkmal.
Das Berliner Für den Bereich der Intelligenz möchten wir hier das Berliner Intel-
Intelligenzstrukturmodell ligenzstrukturmodell (BIS; Jäger, 1982, 1984) skizzieren. Das Modell
ist in . Abb. 4.6 dargestellt. Das Modell hat sich im deutschsprachi-
gen Bereich etabliert, international ist eher das Cattell-Horn-Carroll
(CHC-Modell) von Bedeutung (McGrew, 2005, 2009). Das BIS-Modell
wurde auf der Basis von empirischen Analysen mit einer sehr großen
Anzahl unterschiedlicher Intelligenzaufgaben entwickelt und hat daher
einen hohen Generalitätsanspruch. Intelligenz lässt sich dem Modell
zufolge auf drei Ebenen beschreiben: Auf der generellen Ebene ist die
allgemeine Intelligenz als Integral aller Fähigkeiten angesiedelt. Auf der
nächsten Ebene stehen vier sogenannte „Operationen des Denkens“ und
drei Inhaltsfaktoren des Denkens (siehe die nachfolgend hervorgehobe-
nen Definitionen „Die Fähigkeiten des BIS-Modells sowie ‚Kreuzpro-
dukte‘ “). Die Operationen und Inhalte kann man kreuzklassifizieren.

Al - gB IS
Allgemeine Intelligenz
Inh
alt
n

e
ne
tio
era
Op

E Einfallsreichtum
figural-bildhaft F
M Merkfähigkeit
numerisch N
B Bearbeitungsgeschwindigkeit

verbal V K Verarbeitungskapazität

. Abb. 4.6  Das Berliner Intelligenzstrukturmodell (BIS; Jäger et al., 1997, mit
freundlicher Genehmigung)
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
129 4
Dies ergibt die zwölf Kombinationen auf der dritten Modellebene (siehe
die nachfolgend hervorgehobenen Definitionen „Die Fähigkeiten des
BIS-Modells sowie ‚Kreuzprodukte‘“). Das BIS ist somit ein zugleich
hierarchisches und mehrdimensionales Modell.

> Die Fähigkeiten des BIS-Modells sowie „Kreuzprodukte“


(Jäger, Süß & Beauducel, 1997, S. 6/7)
44 Operative Fähigkeiten
44 Verarbeitungskapazität (K): Verarbeitung komplexer
Informationen bei Aufgaben, die nicht auf Anhieb zu
lösen sind, sondern Heranziehen, vielfältiges Beziehungs-
stiften, formal-logisch exaktes Denken und sachgerechtes
Beurteilen von Informationen erfordern
44 Einfallsreichtum (E): Flexible Ideenproduktion, die
Verfügbarkeit vielfältiger Informationen, Reichtum an
Vorstellungen und das Sehen vieler verschiedener Seiten,
Varianten, Gründe und Möglichkeiten von Gegenständen
und Problemen voraussetzt, wobei es um problem-
orientierte Lösungen geht, nicht um ein ungesteuertes
Luxurieren der Fantasie
44 Merkfähigkeit (M): Aktives Einprägen und kurzfristiges
Wiedererkennen oder Reproduzieren von verschieden-
artigem Material (…)
44 Bearbeitungsgeschwindigkeit (B): Arbeitstempo,
Auffassungsleichtigkeit und Konzentrationskraft beim
Lösen einfach strukturierter Aufgaben von geringem
Schwierigkeitsniveau
44 Inhaltsgebundene Fähigkeiten
44 Sprachgebundenes Denken (V): Grad der Aneignung und
der Verfügbarkeit des Beziehungssystems Sprache
44 Zahlengebundenes Denken (N): Grad der Aneignung und
der Verfügbarkeit des Beziehungssystems Zahlen
44 Anschauungsgebundenes, figural-bildhaftes Denken (F):
Einheitsstiftendes Merkmal scheint hier die Eigenart des
Aufgabenmaterials zu sein, dessen Bearbeitung figural-
bildhaftes und/oder räumliches Vorstellen erfordert
44 Kreuzprodukte
44 Verarbeitungskapazität verbal
44 Verarbeitungskapazität numerisch
44 Verarbeitungskapazität figural
44 Einfallsreichtum verbal
44 Einfallsreichtum numerisch
44 Einfallsreichtum figural
44 Merkfähigkeit verbal
44 Merkfähigkeit numerisch
44 Merkfähigkeit figural
44 Bearbeitungsgeschwindigkeit verbal
44 Bearbeitungsgeschwindigkeit numerisch
44 Bearbeitungsgeschwindigkeit figural
130 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Theorien und Modelle als Ein Intelligenzmodell wie das BIS ermöglicht eine inhaltlich fundierte
Orientierungsrahmen für das Entscheidung darüber, welchen der vielen Intelligenztests man einset-
praktische eignungsdiagnostische zen möchte. Im Rahmen der Anforderungsanalyse kann man festlegen,
Handeln welche intellektuelle Fähigkeit von Bedeutung ist. Ist es die Verarbei-
tungskapazität oder ist es die Merkfähigkeit? Dann sucht man den Test,
der die entsprechende Fähigkeit indiziert. Dabei kann man nicht immer
auf die Angaben der Testautorinnen und -autoren bzw. der Vertriebsab-
teilung der Testvertreiber übernehmen. So werden die Raven-Matrizen
4 (Raven, Raven & Court, 1998) beispielsweise als Tests zur Erfassung der
allgemeinen Intelligenz dargestellt. Betrachtet man aber die Aufgaben
(Aufgaben zum schlussfolgernden Denken mit figuralem Aufgabenma-
terial), wird deutlich, dass es sich im Lichte des BIS-Modells um einen
Test zur figuralen Verarbeitungskapazität handelt (Süß & Schweickert,
2002). Theorien und Modelle sind somit ein wichtiger Orientierungs-
rahmen für das eignungsdiagnostische Handeln. Dies haben wir hier am
Beispiel der Intelligenz demonstriert, die Aussage gilt aber auch für die
im Folgenden kürzer behandelten generischen Eignungsmerkmale aus
dem Bereich Persönlichkeit im engeren Sinne, Motive sowie Interessen.
Matrizentests und Strukturtests Es gibt zahlreiche Intelligenzmodelle und Intelligenztests. Kersting
und Palmer (2017) stellen ausgewählte Intelligenzmodelle und für die
Eignungsbeurteilung geeignete Intelligenztests ausführlich dar, wobei
auch auf die Diagnose der Kreativität sowie auf Erweiterungen des Intel-
ligenzbegriffes (z.B. emotionale Intelligenz) eingegangen wird. Im vor-
liegenden Abschnitt werden nur wenige Intelligenztests beispielhaft
herausgegriffen. Weit verbreitet sind sogenannte „Matrizentests“ wie
die Raven-Matrizen (Raven, Raven & Court, 1998), der Bochumer Mat-
rizentest (BOMAT; Hossiep, Turck & Hasella, 1999) und der adaptive
Matrizentest (Hornke, Etzel & Rettig, 2006). Diese Tests sehen nur einen
Aufgabentyp vor und erlauben den Rückschluss auf eine Intelligenzdi-
mension. Demgegenüber erlauben Intelligenzstrukturtests Interpreta-
tionen auf der Ebene mehrerer Intelligenzdimensionen. Beispiele sind
der I-S-T 2000 R (Liepmann, Beauducel, Brocke & Amthauer, 2007), die
Wechsler Adult Intelligence Scale IV (WAIS-IV; deutsche Fassung von
Petermann, 2015) sowie der WIT-2 (Kersting, Althoff & Jäger, 2008).
Intelligenztests mit simulativem Neben den Hauptgütekriterien kann auch die Akzeptanz eines Ver-
Charakter fahrens für die Verfahrensauswahl von Bedeutung sein (7 Abschn. 4.2.3).
Ein wichtiges Kriterium in diesem Zusammenhang ist nach Kersting
(2008) die Augenscheinvalidität. Die Augenscheinvalidität von Intel-
ligenztests wird in der Regel kritisch beurteilt (Kersting, ebd.). Die
Teilnehmer/-innen können nicht verstehen, wieso der Erfolg bei der
Bearbeitung von abstrakten Aufgaben etwas mit dem Erfolg in einer
konkreten Ausbildung oder in einem konkreten Beruf zu tun haben
soll. Um dieser Kritik konstruktiv zu begegnen, kann man Intelligenz-
tests auswählen, deren Aufgaben semantisch so eingekleidet sind, dass
sie zur Berufswelt passen. Anstelle von abstrakten Syllogismen müssen
die Teilnehmer/-innen, wie bei einer „case study“ Zeitungsnachrich-
ten oder reale Tabellen und Grafiken interpretieren. In diesem Sinne
handelt es sich bei diesen Intelligenztests um „Simulationen“. Der
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
131 4
Begriff „Simulation“ wird häufig exklusiv für Verfahren der Verhal-
tensbeobachtung und -beurteilung genutzt, etwa für Rollenspiele. Letzt-
endlich ist es aber bei Verfahren aller fünf Kategorien (7 Abschn. 4.2.2)
möglich, Elemente der Berufswelt zu „simulieren“. Gleichzeitig stoßen
alle Simulationen an ihre Grenzen, schon allein dadurch, dass die Kan-
didatinnen und Kandidaten wissen, dass es sich nur um eine Simula-
tion handelt.
Der simulative Charakter der Intelligenztests soll sich positiv auf
die Augenscheinvalidität auswirken. Derartige Intelligenztests werden
häufig nur als PC-Tests angeboten. Beispiele sind etwa die Verfahren
„numerical screening“ bzw. „verbal screening“ von CEB/SHL, das Ver-
fahren „scales“ („numerical“/„verbal“) von „cut-e“, die „Diagrammana-
lysen“ und weitere Verfahren von Eligo, das Verfahren „Kappa“ sowie
weitere Verfahren von HR Diagnostics, die Verfahren der ITBCon-
sulting, sowie der SMART-Test (Kersting, 2014). Beim SMART-Test
werden die Teilnehmer/-innen in die Rolle einer Mitarbeiterin/eines
Mitarbeiters des Online-Versandhandels „inversagi“ versetzt. Alle Auf-
gaben sind in eine Rahmengeschichte („overarching scenario“) einge-
bunden. Anders als bei den meisten herkömmlichen Intelligenztests
können die Teilnehmer/-innen – wie in der Realität - selbst entschei-
den, in welcher Reihenfolge sie die Aufgaben bearbeiten und wie sie
die insgesamt zur Verfügung stehende Zeit auf die einzelnen Aufgaben
aufteilen. Für Rechenaufgaben steht ihnen – ebenfalls wie im Alltag –
ein Taschenrechner zur Verfügung.
Intelligenztests mit einer semantisch auf die Berufswelt abgestimm- Der simulative Charakter der
ten Oberfläche, die sowohl in computerisierter Form als auch in Papier- Intelligenztests soll sich positiv
form vorliegen, sind beispielsweise die Arbeitsprobe zur berufsbezo- auf die Augenscheinvalidität
genen Intelligenz (AZUBI-BK) von Schuler und Klingner (2005), das auswirken
Verfahren Analyse des Schlussfolgernden und Kreativen Denkens
(ASK) von Schuler und Hell (2005).

Persönlichkeit im engeren Sinne


Obwohl die Intelligenz zweifelsohne ein Persönlichkeitsmerkmal ist, Das Fünf-Faktoren-Modell der
werden in Persönlichkeitsmodellen kognitive Fähigkeiten wie die Intel- Persönlichkeit
ligenz in der Regel ausgegliedert. Als Rahmenmodell für die Persönlich-
keit im engeren Sinne (ohne kognitive Fähigkeiten) hat sich das Fünf-
Faktoren-Modell der Persönlichkeit (FFM) nach Costa und McCrae
(zitiert nach Borkenau & Ostendorf, 2008) etabliert. Häufig wird das
FFM auch als „Big Five“-Modell bezeichnet, obwohl das FFM einer-
seits und das „Big Five“-Modell andererseits streng genommen Unter-
schiede aufweisen. Das Verhalten von Menschen lässt sich dem FFM
zufolge als Indikator für Neurotizismus, Extraversion, Offenheit für
Erfahrungen, Verträglichkeit und Gewissenhaftigkeit interpretieren.
Das FFM kann als Orientierungsrahmen die Auswahl oder Konstruk-
tion von Verfahren zur Erfassung von Persönlichkeitsmerkmalen im
engeren Sinne leiten. In der eignungsdiagnostischen Praxis werden Eig-
nungsmerkmale in der Regel positiv formuliert. Entsprechend spricht
132 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

. Tab. 4.3  Wirkung der Dimensionen des Fünf-Faktoren-Modells (geringfügig modifiziert nach Lord 2011, S. 16)

FFM Dimension Art der Wirkung

Neurotizismus (geringer Neu- Intensivität und Häufigkeit negativer Gefühle, die aus negativen Überzeugungen
rotizismus = hohe emotionale über das Leben im Allgemeinen, über sich selbst und über andere Menschen ent-
Stabilität) stehen, und ihr Einfluss auf die Anpassungsfähigkeit
Extraversion Auf die Außenwelt gerichtete Energie und Bedürfnis nach äußerer Stimulation

4 Offenheit für Erfahrungen Empfänglichkeit für einen weiten Bereich innerer und äußerer Quellen von Erfah-
rungen und für neuen Input
Verträglichkeit Wahrscheinlichkeit, die Standpunkte und Belange anderer Menschen zu berück-
sichtigen, zu akzeptieren und von ihnen beeinflusst zu werden
Gewissenhaftigkeit Stärke der Zielsetzung und des Antriebs zur Zielerreichung

man von „emotionaler Stabilität“ und meint damit gering ausgeprägten


Neurotizismus im Sinne des FFM. Die fünf FFM-Dimensionen sind in
. Tab. 4.3 nach ihrer „Wirkung“ näher beschrieben. Es gibt konkurrie-
rende Modelle der Persönlichkeit, die mehr oder weniger Dimensionen
vorsehen und diese Dimensionen anders deuten. Zumeist gelingt aber
eine Zuordnung der Dimensionen konkurrierender Modelle zu den
Dimensionen des FFM, sodass diesem eine Schlüsselfunktion zukommt.
Intelligenztests um Fragebogen Wie in 7 Tab. 6.1 dargestellt, erwies sich in empirischen Studien ins-
zur Gewissenhaftigkeit ergänzen besondere die Dimension „Gewissenhaftigkeit“ als bedeutsam für den
Erfolg im Beruf – auch wenn die prognostische Gültigkeit (Validität)
von Eignungsurteilen, die auf der Basis von Persönlichkeitsfragebogen
zur Gewissenhaftigkeit getroffen werden, deutlich geringer ist als die
von intelligenztestbasierten Eignungsurteilen. Fragebogen zur Gewis-
senhaftigkeit sind, wie in 7 Abschn. 6.4.1 ausgeführt, unter Validitäts-
gesichtspunkten eine gute Ergänzung zu Intelligenztests. Die Aussage-
kraft von Eignungsaussagen, die sich aus Fragebogen zu den übrigen
vier Dimensionen des FFM herleiten, ist in 7 Tab. 6.2 dargestellt.
„Little Thirty“: Zu jeder Dimension Mit fünf Dimensionen die gesamte Persönlichkeit beschreiben zu
des FFM können sechs Facetten wollen bedeutet zwangsläufig, die Dimensionen sehr heterogen und
unterschieden werden „breit“ zu fassen. Die Bezeichnung „big“ im „Big Five“-Modell bezieht
sich darauf, dass das Modell auf dem Kontinuum „Generalität – Spezi-
fität“ auf der Seite der hohen Generalität angesiedelt ist. Auf der Seite
der hohen Spezifität steht der „Little Thirty“ genannte Ansatz, bei dem
jede der fünf Dimensionen des FFM in sechs spezifische Facetten unter-
gliedert wird. So gliedert sich die Dimension „Extraversion“ beispiels-
weise in die sechs Facetten Herzlichkeit, Geselligkeit, Durchsetzungs-
fähigkeit, Aktivität, Erlebnishunger und Frohsinn. In der Wissenschaft
ist die Frage noch offen, ob die Vorhersage beruflicher Leistungen eher
mit den „breiten“, generellen Dimensionen oder aber mit der spezifi-
schen Beschreibungsebene der Facetten gelingt.
Die „NEO“-Fragebogen Etablierte Fragebogen, deren Entwickler sich direkt am FFM-Mo-
dell orientierten, sind der NEO-PI-R (Ostendorf & Angleitner, 2004)
sowie der NEO-FFI (Borkenau & Ostendorf, 2008). Der Einsatz des
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
133 4
NEO-PI-R (ebd.) erlaubt eine Diagnose auf der Facettenebene des FFM-
Modells. Mit 240 Items ist der Fragebogen recht umfangreich. Mit dem
deutlich verkürzten (60 Items) Fragebogen NEO-FFI (ebd.) gewinnt
man Werte für die fünf globalen Faktoren, nicht aber für die Facetten.
Während die Fragen (Items) der beiden Fragebogen NEO-FFI und Berufsbezogene Formulierung der
NEO-PI-R „allgemein“ formuliert sind, beziehen sich die Items von Fragen im „BIP“
berufsbezogenen Verfahren explizit auf die Arbeitswelt. Als Beispiele
können das Bochumer Inventar zur berufsbezogenen Persönlichkeits-
beschreibung (BIP; Hossiep & Paschen, 2003) oder das BIP sechs Fak-
toren (BIP-6F; Hossiep & Krüger, 2012) genannt werden. Diesen Ver-
fahren liegt zwar nicht das FFM-Modell zugrunde, die Dimensionen
des BIP lassen sich aber den Dimensionen des FFM mehr oder minder
gut zuordnen. Ein weiteres prominentes Beispiel für messtheoretisch
fundierte Fragebogen aus dem Bereich der Eignungsdiagnostik ist
der Occupational Personality Questionnaire 32 (OPQ32; SHL Group
Limited, 2007). Die Zahl 32 steht für die Anzahl an erfassten Verhaltens-
stilen. Der Test basiert nicht auf dem FFM-Modell, erlaubt durch spezi-
fische Zuordnungen der Skalen aber auch eine Abbildung der FFM-Di-
mensionen. Dies zeigt, dass es möglich ist, die Dimensionen der meisten
Persönlichkeitsmodelle in das FFM-Modell einzuordnen. Die Arbeit
mit dem FFM-Modell hat somit integrativen Charakter.
In . Tab. 4.2 sind Beurteilungen nach dem Testbeurteilungssystem Schlechte Noten für „Typentests“
des Diagnostik- und Testkuratoriums für acht Persönlichkeitsfrage-
bogen abgebildet, darunter auch die hier kurz besprochenen Verfah-
ren BIP-6F, NEO-PI-R und OPQ32 sowie zwei Beispiele für die in der
eignungsdiagnostischen Praxis weit verbreiteten „Typentests“ (GPOP
sowie Persolog). Beide Typentests wurden sehr kritisch beurteilt.

Motive
Motive sowie die im nachfolgenden 7 Abschn. 4.2.6 behandelten Motive (und Interessen)
Interessen sind nach Herzberg und Roth (2014) im Vergleich zu den sind stärker umwelt-
bislang besprochenen Persönlichkeitsmerkmalen im engeren Sinne und kulturabhängig als
weniger stark genetisch verursacht und stärker situativ (umwelt-) Persönlichkeitsmerkmale im
bedingt – somit auch kulturabhängiger. Motive (und Interessen) engeren Sinne
sind außerdem zeitlich weniger stabil als Persönlichkeitsmerkmale
im engeren Sinne.
Ein bedeutsames generisches Eignungsmerkmal ist die Motiva- Motive: Warum tut ein Mensch
tion. Während die Persönlichkeitsmerkmale im engeren Sinne nach etwas?
McClelland (1985) beschreiben, wie sich ein Mensch verhält, erklären
die Motive den Grund des Verhaltens: Warum tut ein Mensch etwas?
Was will er damit erreichen? Dabei kann ein Mensch ein Ziel auf unter-
schiedliche Art und Weise erreichen. Daraus ergibt sich, dass Motiven –
anders als den Persönlichkeitsmerkmalen im engeren Sinne – nicht
direkt bestimmte Verhaltensweisen zugeordnet werden können. Die
Motivation liefert sozusagen die Energie, die Persönlichkeit im engeren
Sinne beeinflusst hingegen, welche Verhaltensweisen mobilisiert
werden (Brunstein, 2003).
134 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

. Tab. 4.4  Grundmotive nach McClelland

Machtmotiv Leistungsmotiv Anschlussmotiv

Annäherung Hoffnung auf Macht Hoffnung auf Erfolg Hoffnung auf Anschluss
Vermeidung Furcht vor Machtverlust Furcht vor Misserfolg Furcht vor Zurückweisung

4 Eine etablierte Theorie zu Motiven stammt von McCelland (1985).


In dieser Theorie werden die in . Tab. 4.4 dargestellten drei Motiv-
gruppen („big three“) unterschieden, wobei bei jedem der drei Motive
noch untergliedert wird in eine (a) annähernde und eine (b) meidende
Tendenz (. Tab. 4.4).
Implizite und explizite Motive Eine wichtige Unterscheidung im Kontext der Motive ist außerdem
unterscheiden die Differenzierung in implizite und explizite Motive. Über einige ihrer
Motive sind sich Menschen bewusst. Dies sind die expliziten Motive.
Solche Motive benennen Menschen als Begründung für ihr Verhalten.
Andere Motive bleiben einer Person selbst hingegen ganz oder teil-
weise verschlossen. Diese impliziten Motive können die Personen nicht
benennen, es zeigt sich aber, dass gerade die impliziten Motive, die von
den expliziten Motiven weitgehend unabhängig sind, ausschlaggebend
für das Verhalten sind.
Der Einsatz von Verfahren zur Die Motivdiagnostik wird im Rahmen der Eignungsbeurteilung ver-
Diagnostik impliziter Motive ist nachlässigt. Dies gilt für die Berücksichtigung der Motive im Allgemei-
in der eignungsdiagnostischen nen, notgedrungen aber für die Diagnostik der impliziten Motive im
Praxis problematisch Besonderen. Die Diagnostik der impliziten Motive erfordert bestimmte,
indirekte Verfahren (s. Schmukle & Egloff, 2011) wie z.B. implizite Asso-
ziationstests (IAT; Greenwald, McGhee & Schwartz, 1998), projektive
Verfahren (z.B. den thematische Apperzeptionstest, TAT; Murray, 1943),
semi-projektive Verfahren (z.B. das Multi-Motiv-Gitter, MMG; Soko-
lowski & Schmalt, 2010) oder objektive Tests sensu Cattell (z.B. der
Objektive Leistungsmotivationstest, OLMT; Schmidt-Atzert, 2004).
Diese Verfahren funktionieren u.a. deshalb, weil sie für die untersuch-
ten Personen intransparent sind. Die Intransparenz ist aber unter recht-
licher Perspektive im Rahmen der Eignungsdiagnostik bedenklich
(7 Abschn. 1.3 sowie 7 Abschn. 4.3). Ungeachtet der rechtlichen Seite
dürfte die mangelnde Transparenz zu einer geringeren Akzeptanz führen,
wenn die Transparenz zu einem späteren Zeitpunkt aufgehoben wird.
Fragebogen zur Erfassung Zur Anwendung kommen in der Praxis der Eignungsdiagnostik
expliziter Motive daher eher Fragebogen, mit denen explizite Motive erfasst werden,
die als Ursache für von „außen“ gefordertes (respondentes) Verhalten
gelten. Ein entsprechendes Verfahren ist das Leistungsmotivations-
inventar (LMI) von Schuler und Prochaska (2001), mit dessen Hilfe
ausschließlich Motive erfragt werden. Andere Fragebogen umfassen
einzelne Skalen zur Diagnostik expliziter Motive. Das Bochumer Inven-
tar zur berufsbezogenen Persönlichkeitsbeschreibung (BIP; Hossiep
& Paschen, 2003) sieht beispielsweise Skalen zur Leistungsmotivation,
Gestaltungsmotivation und Führungsmotivation vor.
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
135 4
. Abb. 4.7  Hexagonales Strukturmodell I A
der beruflichen Interessen nach Holland
(1985, © Pearson)

R S

C E

Interessen
Insbesondere die Zufriedenheit, aber auch der Erfolg in einer Ausbil- Sechs Interessenstypen im
dung, einem Studium oder Beruf sollte auch etwas mit den Interessen hexagonalen Strukturmodell der
einer Person zu tun haben. Bei Interessen geht es darum, welchen Wert beruflichen Interessen
eine Person einer „Sache“ (im weitesten Sinne) zuschreibt, welche Tätig-
keiten man gerne „mag“. Holland (1985) nimmt in seiner sogenannten
„Kongruenztheorie“ an, dass sich sowohl Personen als auch Tätigkei-
ten (Berufe) nach sechs Interessenstypen klassifizieren lassen. Im hexa-
gonalen Strukturmodell der beruflichen Interessen, dem sogenannten
„RIASEC-Modell“ (. Abb. 4.7) von Holland (1985) werden die folgen-
den sechs Bereiche unterschieden:
55 R - Realistic (handwerklich-technische Orientierung)
55 I - Investigative (untersuchend-forschende Orientierung)
55 A - Artistic (künstlerische Orientierung)
55 S - Social (soziale Orientierung)
55 E - Enterprising (unternehmerische Orientierung)
55 C - Conventional (ordnend-verwaltende Orientierung)

Die Platzierung der Interessensbereiche auf der Fläche der Grafik


ist nicht zufällig: Benachbarte Interessensbereiche sind „verwandt“,
weiter entfernt angeordnete Interessensbereiche sind auch inhaltlich
„fremder“.
Eine Kongruenz zwischen den Interessen einer Person einerseits Eine Kongruenz zwischen den
und der Umwelt andererseits sollte mit einer höheren beruflichen Interessen einer Person und der
Zufriedenheit einhergehen. Diese Annahme konnte empirisch bestätigt Umwelt trägt zu Zufriedenheit
werden (z.B. Spokane, Meir & Catalano, 2000). In Metastudien konnten und Erfolg bei
auch Zusammenhänge zwischen Interessen einerseits und Erfolgs- und
Leistungskriterien andererseits gezeigt werden (Van Iddekinge, Roth,
Putka & Lanivich, 2011). Sowohl für die Zufriedenheit als auch für die
Leistung waren die Effekte aber gering.
Während die Diagnostik der Interessen sich in den letzten Jahr- Interessenstests
zehnten mehr oder weniger auf die Studienfachorientierung und die werden im Rahmen der
Berufswahlberatung begrenzte, führt der Trend zu Self-Assessments Studienfachorientierung, der
(7 Exkurs zu Self-Assessment weiter oben) dazu, Interessen indirekt Berufswahlberatung und im
auch bei der Personalauswahl zu berücksichtigen. Interessenstests sind Rahmen von Self-Assessments
häufig Bestandteil von Self-Assessments. Self-Assessments tragen zur eingesetzt
Selbstselektion bei, sodass die Reflexion über die Passung zwischen
136 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Interessen und Berufsumwelt dazu führen kann, dass sich potenzielle


Kandidatinnen und Kandidaten zu tatsächlichen Kandidatinnen und
Kandidaten entwickeln oder aber auch von einer Bewerbung absehen.
Beispiele für aktuelle etablierte Interessenstests auf der Basis des
hexagonalen Strukturmodells der beruflichen Interessen von Holland
(1985) sind der Allgemeine Interessen-Struktur-Test - Revision (AIST-
R; Bergmann & Eder, 2005) sowie der Explorix (Joerin Fux, Stoll, Berg-
mann & Eder, 2003). Eine Einteilung der Berufe nach diesem Modell
4 kann, wie in 7 Abschn. 4.1.1 bereits erwähnt, mithilfe des Verfahrens
ExploJob (Joerin Fux & Stoll, 2006) vorgenommen werden.

4.2.8 Vorgehensweisen und Strategien der


Eignungsbeurteilung

Ein Vorgehen ist strategisch, wenn Die Eignungsdiagnostik sollte strategisch erfolgen. Damit ist gemeint,
es Regeln gibt, deren Einhaltung dass für das Vorgehen ein genauer Plan zur Zielerreichung vorliegt. Die
zur Zielerreichung führen Strategie betrifft alle Prozessphasen, von der Ansprache der Kandida-
tinnen und Kandidaten (wo und über welches Medium erreiche ich
die Personen, die über die laut Anforderungsanalyse relevanten Eig-
nungsmerkmale verfügen?), über die Auswahl und Durchführung der
Verfahren bis zur Integration und Interpretation der Daten. Letztend-
lich ist eine Strategie eine Sammlung von Regeln, deren Einhaltung der
Erreichung des jeweiligen Ziels dient und die Eignungsdiagnostik leitet.
Es gibt Makrostrategien und Mikrostrategien. Makrostrategien
beziehen sich auf die Ebene der Verfahren: Welche Verfahren werden
in welcher Reihenfolge angewendet? So kann man beispielsweise eine
sogenannte „sequenzielle Makrostrategie“ realisieren und nach jedem
Verfahren aufgrund der Verfahrensergebnisse Kandidatinnen und Kan-
didaten von der Teilnahme an weiteren Verfahren ausschließen („pre-
reject“-Strategie). Unter ökonomischen Gesichtspunkten empfiehlt es
sich diesbezüglich, aussagekräftige Verfahren, die mit wenig Aufwand
durchzuführen sind, an den Prozessbeginn zu stellen. Ein ohne Aufsicht
bearbeiteter, internetgestützt dargebotener messtheoretisch fundierter
Test könnte zu Screening-Zwecken an den Beginn des Verfahrens gestellt
werden. Mit einem Telefoninterview kann man wichtige Einstellungs-
voraussetzungen wie den Gehaltswunsch, die Verfügbarkeit, aber auch
– mit Abstrichen – die Beherrschung einer Fremdsprache prüfen. Unter
Aufsicht durchgeführte messtheoretisch fundierte Fragebogen und Tests
sind Verfahren mit mittlerem Aufwand, die in der Mitte des Prozesses
stehen können. Aufwändige Verfahren wie Interviews und Verfahren der
Verhaltensbeobachtung und -beurteilung sollten unter dem Gesichts-
punkt der Ökonomie für das Prozessende eingeplant und nur noch mit
wenigen Kandidatinnen und Kandidaten durchgeführt werden.
Sequenzielle Makrostrategie: Eine weitere Strategie („pre-accept“-Strategie) besteht darin, Kan-
Nicht alle Kandidatinnen und didatinnen und Kandidaten, die besonders hohe Werte in den Verfah-
Kandidaten bearbeiten alle ren der frühen Phasen des Prozesses erzielen, ohne die Teilnahme an
Verfahren weiteren Verfahren zu akzeptieren.
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
137 4
Welche Strategie angemessen ist, leitet sich aus dem Ziel der Eig- Das Ziel bestimmt die Strategie
nungsbeurteilung ab. Zielt man nicht nur oder nicht so sehr auf Öko-
nomie, sondern auf Akzeptanz, wird man die Anordnung strategisch
anders gestalten und z.B. mit internen Kandidatinnen und Kandidaten
in jedem Fall ein Interview führen und diese nicht allein aufgrund eines
messtheoretisch fundierte Tests vom weiteren Prozess ausschließen.
Mikrostrategien beziehen sich auf die Abfolge der Elemente inner- Mikrostrategie: Nicht alle
halb eines Verfahrens. So gibt es z.B. messtheoretisch fundierte adaptive Kandidatinnen und Kandidaten
Tests, bei denen die getesteten Kandidatinnen und Kandidaten nicht alle bearbeiten die gleichen Elemente
Aufgaben (Items) des Tests bearbeiten, sondern aufgrund der Ergeb- eines Verfahrens
nisse bei einer Aufgabe die nächste Aufgabe maßgeschneidert ausge-
wählt wird. Vergleichbar könnte ein Interviewleitfaden (7 Abschn. 3.1)
eine Verzweigung der Fragen in Abhängigkeit von den Antworten der
Kandidatinnen und Kandidaten vorsehen. Im Rollenspiel könnten die
Rollenspieler/-innen auf der Basis verzweigter Skripte in vergleichbarer
Weise individuell und zugleich halbwegs standardisiert auf das Verhal-
ten der Kandidatinnen und Kandidaten reagieren.
Eine andere Unterscheidung betrifft die Differenzierung in Selekti- Selektions- und
ons- und Modifikationsstrategien. Entscheidend für die Wahl zwischen Modifikationsstrategie
diesen Strategien ist das Ziel der Eignungsbeurteilung. Dieses wird im
Rahmen der Auftragsklärung festgelegt. Möchte man Personen „aus-
wählen“ oder „verändern“? Je nach Ziel wird man eine Selektions- oder
eine Modifikationsstrategie anwenden. Die Strategien können sich statt
auf Personen auch auf „Bedingungen“ beziehen. Mit „Bedingungen“ ist
im weitesten Sinne die Situation gemeint, z.B. der Ausbildungs- oder
Arbeitsplatz. Diese Unterscheidung der Strategien, die in . Abb. 4.8
veranschaulicht wird, geht auf Cronbach und Gleser (1965) zurück. In
dieser . Abb. 4.8 werden die Personen und Bedingungen abstrakt als
„Objekte der Handlung“ bezeichnet.
Bei der Selektionsstrategie werden entweder Personen oder Bedin- Bedingungsselektion: Auf welche
gungen ausgewählt bzw. zugeordnet. Die Auswahl von Personen ist der Stelle passt die Kandidatin/der
Kandidat?

Objekte der Handlungsstrategie


Handlung
Selektionsstrategie Modifikationsstrategie

Personenselektion Personenmodifikation
Personen (z. B. Zulassung zu Ausbildungen
od. Studiengängen, Stellenvergabe) (z. B. Training, Coaching usw.)

Bedingungsselektion
Umwelt- Bedingungsmodifikation
bedingungen (z. B. Auswahl eines Studiengangs
(z. B. Neugestaltung des Arbeitsplatzes)
oder einer Ausbildungsrichtung)

. Abb. 4.8  Selektions- und Modifikationsstrategie (modifiziert nach Cronbach & Gleser, 1965, © Lee J. Cronbach and Goldine
C. Gleser)
138 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

klassische Fall der Personalauswahl: Gegeben eine Stelle, wird unter


verschiedenen Kandidatinnen und Kandidaten eine Person für diese
Stelle ausgewählt. Man könnte aber auch anders vorgehen und eine
Bedingung auswählen: Gegeben eine Kandidatin/ein Kandidat, wird
eine für diese Person „passende“ Stelle (oder ein passendes Training)
ausgewählt. In Zeiten des Personalmangels ist diese zuletzt genannte
Modifikation von Bedingungen: „Bedingungsselektion“ eine erfolgsversprechende Strategie (siehe Kers-
Wie muss ich den Arbeitsplatz ting, 2013).
4 gestalten, damit er zu der Bei der Modifikationsstrategie werden entweder Personen oder
Lebenssituation der Mitarbeiterin/ Bedingungen „verändert“. So kann man Personen durch Schulun-
des Mitarbeiters passt? gen Kompetenzen vermitteln und/oder ihr Verhalten durch Trai-
nings verändern. Ein Beispiel für die Veränderung der Bedingungen
ist die Umgestaltung eines Präsenz-Arbeitsplatzes zu einem „home-
office“-Arbeitsplatz, damit Personen, die nur eingeschränkt mobil
sind, die Arbeit von zu Hause erledigen können. Diagnostik, die im
Kontext der Modifikationsstrategie eingesetzt wird, nennt man auch
„Förderdiagnostik“.
Mit der Beurteilung der Trotz der unterschiedlichen Strategien geht es immer darum, die
Eignungsmerkmale können Eignungsmerkmale von (internen oder externen) Kandidatinnen und
unterschiedliche Ziele verfolgt Kandidaten zu beurteilen. Nach diesem Vier-Felder-Schema zielt die
werden Diagnostik je nach Strategie darauf ab,
1. die Kandidatinnen und Kandidaten mit den „passenden“
Eignungsmerkmalen/der „passenden“ Ausprägung der Eignungs-
merkmale zu identifizieren (Personenselektion),
2. die Eignungsmerkmale von Kandidatinnen und Kandidaten
zu identifizieren, die für die erfolgreiche Zuordnung zu Bedin-
gungen (Bedingungsselektion) oder zu
3. Trainings-/Schulungsmaßnahmen (Verhaltensmodifikation)
oder
4. für die Veränderung der Bedingungen (Bedingungsmodifikation)
entscheidend sind.

Strategien der Urteilsbildung Strategien der Urteilsbildung sind u.a. die klinische und mechanische
Urteilsbildung sowie das kompensatorische Modell, die Und-Strategie
und die Oder-Strategie (alle genannten Strategien werden in 7 Kap. 6
erläutert).

4.2.9 Fazit

Eignungsbeurteilungen müssen strategisch geplant, durchgeführt


und ausgewertet werden. Die Auswahl der Verfahren und deren
Auswertung richtet sich danach aus, welche Eignungsmerkmale bei
welcher Gruppe von Kandidatinnen und Kandidaten mit welchem
Ziel bewertet werden sollen. Bei der Verfahrensauswahl sollten
nach DIN (2016, S. 12) verschiedenartige Verfahren berücksichtigt
4.2 · Verfahren der Eignungsbeurteilung sowie ihre Möglichkeiten und Grenzen
139 4
werden. Es gibt fünf verschiedene Kategorien von Verfahren, die
unterschiedliche Stärken und Schwächen aufweisen. Für generische
Eignungsmerkmale gibt es ein großes Angebot an messtheoretisch
fundierten Fragebogen und Tests. Eine der Fragestellung angemes-
sene Qualität der Verfahren ist eine notwendige, wenn auch nicht
hinreichende Voraussetzung für eine DIN-konforme Eignungsbe-
urteilung. Grundlage der Qualitätsbewertung von messtheoretisch
fundierten Fragebogen und Tests sind Informationen aus empiri-
schen Untersuchungen, die in den Verfahrenshinweisen berichtet
werden müssen. Die Beurteilungsrichtlinien des Diagnostik- und
Testkuratoriums (Testkuratorium, 2010) zeigen auf, wie die Infor-
mationen zu beurteilen sind. Der genaue Plan für die Gestaltung
der Eignungsbeurteilung hängt davon ab, welches Ziel mit der Eig-
nungsbeurteilung verfolgt wird. Will man eine Person für eine Stelle
auswählen, oder hat man mehrere Stellen und überlegt, welche der
Stellen für eine Person „passt“? Will man zur Weiterentwicklung der
Person beitragen oder die Situationen so verändern, dass die Person
damit besser klar kommt? Eine qualitativ hochwertige Eignungsbe-
urteilung richtet die Strategie nach den jeweiligen Zielen aus.

? Kontrollfragen zu 7 Abschn. 4.2


1. Im Rahmen eines Assessment Centers müssen die
Kandidatinnen und Kandidaten auf der Basis von
Tageszeitungen eine „Presseschau“ vorbereiten und
durchführen. Die Beurteilung der Leistung erfolgt durch eine
Kommission. Um welche Kategorie von Verfahren nach DIN
handelt es sich?
2. Was ist bei der Dokumentenanalyse zu beachten?
3. Die Durchführung von internetgestützten Verfahren
kann bezüglich der Personenidentität mehr oder weniger
kontrolliert erfolgen – was ist in diesem Kontext mit einem
„kontrollierten Modus“ gemeint?
4. Wieso bezeichnet man die Intelligenz als ein „generisches
Eignungsmerkmal“?
5. Was bezeichnet man in der Eignungsdiagnostik als
„Makrostrategie“?
6. Was bezeichnet man in der Eignungsdiagnostik als
„Modifikationsstrategie“?

Weiterführende Literatur
Cook, M. (2016). Personnel Selection. Adding Value Through People - A Changing Pictu-
re. Chichester: Wiley.
Hossiep, R., & Mühlhaus, O. (2005). Personalauswahl und -entwicklung mit Persönlich-
keitstests. Göttingen: Hogrefe.
Schuler, H. (2014). Psychologische Personalauswahl: Eignungsdiagnostik für Personal-
entscheidungen und Berufsberatung. Göttingen: Hogrefe.
140 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

4.3 Rechtliche Rahmenbedingungen der


Eignungsdiagnostik - II

Ingo Püttner und Martin Kersting

In der DIN (2016) wird von Eignungsdiagnostiker/-innen gefordert,


dass sie die rechtlichen Rahmenbedingungen von Eignungs-
4 beurteilungen kennen. Die Kenntnisse der Eignungsdiagnosti-
ker/-innen sollten in dieser Hinsicht breiter und tiefer sein als die
von Personen, die als Beobachter/-innen an Verfahren mitwirken.
Da es keine kompakte gesetzliche Regelung gibt, die sich
ausschließlich und umfassend mit Eignungsdiagnostik beschäftigt,
ergeben sich die rechtlichen Rahmenbedingungen aus Vorgaben
zu verschiedenen Themen. Im Einzelnen sind hier zu nennen:
44 Persönlichkeitsschutz
44 Mitbestimmung
44 Datenschutz
44 Berufspflichten
44 Gütekriterien aus rechtlicher Sicht
44 rechtliche Bedeutung von DIN-Normen

Die Anforderungen, die sich aus dem Persönlichkeitsschutz ableiten


und die für Beobachter/-innen besonders relevant ist, haben
wir bereits in 7 Abschn. 1.3 erläutert. Für das direkte mündliche
Gespräch relevante Aspekte wurden in 7 Abschn. 3.2 thematisiert.
Wir erläutern im Folgenden die Punkte 2 („Mitbestimmung“) bis 6
(„rechtliche Bedeutung von DIN-Normen“).
Dabei engen die rechtlichen Vorgaben teilweise die
Gestaltung der Eignungsdiagnostik ein (Persönlichkeitsschutz,
Mitbestimmung, Datenschutz), teilweise wenden sie sich nur an
Berufspsychologinnen und -psychologen (Berufspflichten) oder
stehen als Qualitätsmaßstäbe zur Verfügung (Gütekriterien).
Die rechtliche Bedeutung der DIN-Norm misst sich daran,
inwieweit ihre Anwendung verbindlich ist oder ihre
Verbindlichkeit bewirkt werden kann. Auswirkungen hat das
insbesondere bei Streitigkeiten über diskriminierende Benachtei-
ligungen bei Auswahlverfahren.
Die in diesem Abschnitt zitierten Gesetze werden vom Bundesjus-
tizministerium unter 7 www.gesetze-im-internet.de zur
Verfügung gestellt.

4.3.1 Mitbestimmung

Die Beteiligung von Mitarbeiter/-innenvertretungen ist in vielen


Fällen Voraussetzung für den rechtssicheren Einsatz der Eignungsdia-
gnostik. An dem Verhältnis zwischen Arbeitgeber/Arbeitgeberin und
4.3 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - II
141 4
Mitarbeiter/-innenvertretung ist eine externe Dienstleisterin/ein exter-
ner Dienstleister nicht direkt beteiligt. Sie/Er kann aber beratend hinzu-
gezogen werden, wenn es um die Einführung eignungsdiagnostischer
Verfahren im Betrieb geht.

Betriebsverfassung
Das Betriebsverfassungsgesetz (BetrVG) gilt in allen privatrechtlich
organisierten Organisationen (Betrieben), z.B. in der Rechtsform der
AG, der GmbH, der KG, der OHG usw. Dabei kommt es nicht darauf
an, ob die Anteilseigner/-innen ihrerseits öffentliche Träger sind, wie
beispielsweise bei einer Stadtwerke GmbH. Mitbestimmungsrechte
kommen nur zum Tragen, wenn im Betrieb ein Betriebsrat existiert.
Wenn in einem großen Unternehmen betriebsübergreifend eine
Regelung getroffen werden soll, kommt auch die Zuständigkeit eines
Gesamtbetriebsrats (GBR) oder Konzernbetriebsrats (KBR) in Betracht.
Ein Mitbestimmungsverfahren wird ausgelöst, wenn die Arbeit-
geberin/der Arbeitgeber sich entschließt, eine allgemeine Regelung
zum Einsatz von eignungsdiagnostischen Verfahren einzuführen. Die
Durchführung eines eignungsdiagnostischen Verfahrens in einem Ein-
zelfall ist hingegen mitbestimmungsfrei. Die Mitbestimmung hat den
Sinn, unzulässige Methoden der Informationsgewinnung zu verhin-
dern und damit die Persönlichkeitsrechte von Beschäftigten und Kan-
didatinnen und Kandidaten zu wahren. Je nach eingesetztem Verfahren
kommen verschiedene Mitbestimmungstatbestände zu Tragen:
Personalfragebogen bedürfen nach § 94 Abs. 1 BetrVG der Zustim-
mung des Betriebsrats. Ein Personalfragebogen ist ein Formular (als Papier
oder online) mit Angaben zu den (internen und externen) Kandidatinnen
und Kandidaten. Mit einem Personalfragebogen dürfen nur Informationen
erfasst werden, die man auch im Interview erfragen dürfte (7 Abschn. 3.2
zur Zulässigkeit von Fragen). Ein Personalfragebogen gehört nach der DIN
(2016) zu den Verfahren der Dokumentenanalyse (7 Abschn. 4.2). Inter-
viewleitfäden (7 Abschn. 3.1) sind rechtlich wie Personalfragebogen einzu-
ordnen, sofern hier konkrete Fragen formuliert sind, die den Kandidatin-
nen und Kandidaten im Interview gestellt werden sollen. Das heißt, auch
derartige Interviewleitfäden bedürfen der Zustimmung des Betriebsrates.
Andere Verfahren der Eignungsbeurteilung (z.B. andere Verfahren
der Dokumentenanalyse wie etwa die Analyse des Lebenslaufes), direkte
mündliche Befragungen (z.B. Interview), Verfahren zur Verhaltensbe-
obachtung und -beurteilung (z.B. Rollenspiele, Gruppendiskussionen),
messtheoretisch fundierte Fragebogen (z.B. Persönlichkeitsfragebogen)
und messtheoretisch fundierte Tests (z.B. Intelligenztests) unterliegen
als sogenannte „allgemeine Beurteilungsgrundsätze der Mitbestim-
mung des Betriebsrats“ nach § 94 Abs. 2 BetrVG.
Wenn die Arbeitgeberin/der Arbeitgeber seine Auswahlentschei-
dungen unmittelbar an das Ergebnis der Eignungsbeurteilung binden
will, ist das Eignungsbeurteilungsverfahren als Auswahlrichtlinie anzu-
sehen. Damit greift zusätzlich der Mitbestimmungstatbestand in § 95
BetrVG (Auswahlrichtlinien).
142 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Die Einführung In derartigen Regelungen kann die Arbeitgeberin/der Arbeitgeber


eignungsdiagnostischer Verfahren auf die DIN (2016) als Verfahrensnorm Bezug nehmen. Dies hat den
unterliegt der Mitbestimmung des Vorteil, dass sie/er dem Betriebsrat anerkannte Qualitätsanforderungen
Betriebsrats vorlegen und auf diese Weise leichter seine Zustimmung erlangen kann.

z Ablauf des Mitbestimmungsverfahrens


Das Mitbestimmungsverfahren Im Grundsatz bedeutet die Mitbestimmung, dass der Arbeitgeber/
führt zu einer die Arbeitgeberin die Initiative zu einer Regelung ergreift und dem
4 Betriebsvereinbarung Betriebsrat zur Zustimmung vorlegt. In Form einer Betriebsvereinba-
rung bestimmt dann der Betriebsrat mit. Die Zustimmung des Betriebs-
rats ist Wirksamkeitsvoraussetzung für die Regelung. Das bedeutet, dass
das eignungsdiagnostische Verfahren oder die Auswahlrichtlinie ohne
die Zustimmung des Betriebsrats nicht angewandt werden darf. Wenn
der Betriebsrat nicht zustimmt, kann der Arbeitgeber/die Arbeitgebe-
rin auf sein/ihr Vorhaben verzichten oder die betriebliche Einigungs-
stelle einberufen.
Nur in Betrieben mit mehr als 500 Beschäftigten kann der Betriebs-
rat von sich aus die Einführung einer Auswahlrichtlinie verlangen
(„Initiativrecht“).

> Wichtig
Ohne vorherige Zustimmung des Betriebsrats dürfen die
eignungsdiagnostischen Verfahren nicht durchgeführt werden.

Öffentliche Organisationen
In öffentlich-rechtlich organisierten Betrieben („Dienststellen“) ist die
Mitbestimmung in eigenen Gesetzen geregelt: In Bundesbehörden gilt
das Bundespersonalvertretungsgesetz (BPersVG), in Landesbehörden
und bei kommunalen Trägern gelten die jeweiligen Landespersonal-
vertretungsgesetze mit vergleichbaren Regelungen. In den Dienststel-
len werden jeweils Personalräte gewählt.
Die Mitbestimmungstatbestände umfassen für die Arbeitnehme-
rinnen und -nehmer des öffentlichen Dienstes Personalfragebogen und
Beurteilungsrichtlinien (§ 75 BPersVG), für Beamtinnen und Beamte
zusätzlich Auswahlrichtlinien (§ 76 BPersVG).
Im öffentlichen Dienst wird Auch wenn die Mitbestimmung für Arbeitnehmerinnen und
die Mitbestimmung durch -nehmer und für Beamtinnen und Beamte unterschiedlich ausgestal-
Personalräte ausgeübt tet ist, bemühen sich die Dienstherren regelmäßig, für Auswahlver-
fahren einheitliche Regelungen zu treffen und darüber mit den Per-
sonalräten Dienstvereinbarungen abzuschließen. Ansonsten gelten
für das Mitbestimmungsverfahren ähnliche Grundsätze wie im
Betriebsverfassungsrecht.
Die Gleichstellungsbeauftragten Zusätzlich werden in Behörden Gleichstellungsbeauftragte
sind zusätzlich zu beteiligen gewählt. Sie haben die Aufgabe, den Schutz der Beschäftigten vor
Benachteiligungen wegen ihres Geschlechts, insbesondere bei
Benachteiligungen von Frauen, hinzuwirken und die Vereinbarkeit
4.3 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - II
143 4
von Familie, Pflegeaufgaben und Berufstätigkeit zu fördern (§ 25 Bun-
desgleichstellungsgesetz, BGleiG). Sie sind an jeder Personalentschei-
dung zu beteiligen (§ 27 Abs. 1 Nr. 1 BGleiG) und wirken auch an
der Ausgestaltung von Beurteilungsrichtlinien mit (§ 27 Abs. 1 Nr.
3 BGleiG).

Schwerbehindertenvertretung
Die in größeren Organisationen gewählten Schwerbehindertenvertre-
tungen haben für die Eignungsbeurteilung aufgrund spezieller Beteili-
gungsrechte folgende Bedeutung:
Nach § 95 Sozialgesetzbuch IX (SGB IX) hat die Schwerbehinder-
tenvertretung beim Vorliegen von Bewerbungen schwerbehinderter
Menschen das Recht auf Einsicht in die entscheidungsrelevanten Teile
der Bewerbungsunterlagen und auf Teilnahme an den Vorstellungsge-
sprächen. Als schwerbehindert gelten Menschen mit einem Grad der
Behinderung von mindestens 50 und ihnen gleichgestellte behinderte
Menschen (§ 68 SGB IX).
Bei Personalentscheidungen treffen die Arbeitgeberin und den Die zu Gunsten von Schwerbehin-
Arbeitgeber zugunsten der Schwerbehinderten besondere Pflichten derten geltenden Sonderregelun-
nach § 81 Abs. 4 SGB IX: „Die schwerbehinderten Menschen haben gen werden von den Schwerbe-
gegenüber ihren Arbeitgebern Anspruch auf (…) bevorzugte Berück- hindertenvertretungen überwacht
sichtigung bei innerbetrieblichen Maßnahmen der beruflichen Bildung
zur Förderung ihres beruflichen Fortkommens, (…) unter Berücksich-
tigung der Behinderung und ihrer Auswirkungen auf die Beschäftigung.
(…) Ein Anspruch nach Satz 1 besteht nicht, soweit seine Erfüllung für
den Arbeitgeber nicht zumutbar oder mit unverhältnismäßigen Auf-
wendungen verbunden wäre.“
Im öffentlichen Dienst sind darüber hinaus schwerbehinderte und Im öffentlichen Dienst
gleichgestellte Kandidatinnen und Kandidaten zu Vorstellungsgesprä- sind Schwerbehinderte zu
chen einzuladen, wenn sie nicht offensichtlich ungeeignet sind (§ 82 Vorstellungsgesprächen
SGB IX). Die Schwerbehindertenvertretung wacht über die Einhaltung einzuladen
der Einladungspflicht.

4.3.2 Datenschutz

Der Datenschutz dient der Verwirklichung des Rechtes auf informatio- Der Schutz der
nelle Selbstbestimmung: Jedem Menschen soll selbst überlassen sein, personenbezogenen Daten ist
welche persönlichen Informationen andere über ihn erfahren, sammeln gesetzlich geregelt
und verarbeiten dürfen. Den Hintergrund bildet das bereits erwähnte all-
gemeine Persönlichkeitsrecht, hergeleitet aus Art. 1 und 2 GG (7 Kap. 1.3).
Entsprechend regeln das Bundesdatenschutzgesetz (BDSG) und die
Landesdatenschutzgesetze den Umgang mit personenbezogenen Daten.
Geschützt sind „Einzelangaben über persönliche oder sachliche Verhält-
nisse einer bestimmten oder bestimmbaren Person“ (§ 3 Abs. 1 BDSG).
Dazu gehören Angaben zur beruflichen Situation, zur Qualifikation und
144 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

zum Werdegang genauso wie Informationen zur ethnischen Herkunft,


religiösen und politischen Orientierung, Gesundheit und zum Sexualle-
ben. Die unbefugte Offenbarung oder Weitergabe von geschützten Daten
kann als Ordnungswidrigkeit (§ 43 BDSG), bei Taten mit Gewinnerzie-
lungsabsicht als Straftat verfolgt werden (§ 44 BDSG). Zur Umsetzung der
europäischen Datenschutz-Grundverordnung ist ein – inhaltsähnliches –
neues Allgemeines Bundesdatenschutzgesetz (ABDSG) in Vorbereitung.
Für die Nutzung von personenbezogenen Daten von Beschäftigten
4 sowie Kandidatinnen und Kandidaten trifft § 32 BDSG eine ausdrück-
liche Regelung:
„§ 32 Datenerhebung, -verarbeitung und -nutzung für Zwecke des
Beschäftigungsverhältnisses
(1) Personenbezogene Daten eines Beschäftigten dürfen für Zwecke
des Beschäftigungsverhältnisses erhoben, verarbeitet oder genutzt werden,
wenn dies für die Entscheidung über die Begründung eines Beschäfti-
gungsverhältnisses oder nach Begründung des Beschäftigungsverhält-
nisses für dessen Durchführung oder Beendigung erforderlich ist. (…)
(2) Absatz 1 ist auch anzuwenden, wenn personenbezogene Daten
erhoben, verarbeitet oder genutzt werden, ohne dass sie automatisiert
verarbeitet oder in oder aus einer nicht automatisierten Datei verarbei-
tet, genutzt oder für die Verarbeitung oder Nutzung in einer solchen
Datei erhoben werden.“
Dadurch wird der Umgang mit den Daten auf das für das Beschäf-
tigungsverhältnis Erforderliche begrenzt (Grundsatz der Datenspar-
samkeit). Daher dürfen bei der Anbahnung des Beschäftigungsver-
hältnisses nur anforderungsbezogene Daten erhoben werden. In der
DIN (2016, S. 11) wird formuliert: „Es dürfen nur Verfahren ver-
wendet werden, die einen eindeutigen Anforderungsbezug aufwei-
sen und zur Beantwortung der Fragestellung sowie für die Zielgruppe
der Kandidaten geeignet sind.“ Aus dieser rechtlichen Rahmenbedin-
gung ergibt sich auch die in 7 Abschn. 3.2 erläuterte Begrenzung des
Fragerechts.
Anders verhält es sich bezüglich des Umgangs mit den Daten von
Beschäftigten. Für diese Gruppe dürfen weitere Daten genutzt werden,
wenn die Nutzung dieser Daten zur Durchführung des Beschäftigungs-
verhältnisses erforderlich ist. Ein Beispiel ist die Zugehörigkeit zu einer
anerkannten Religionsgemeinschaft, für die Steuern abgeführt werden
müssen.
Für die Erhebung und Nutzung Die Begrenzung gilt auch für die Suche nach Informationen über ein-
von Arbeitnehmer/-innendaten zelne Kandidaten und Kandidatinnen im Internet: Webseiteninhalte, auf
gilt § 32 BDSG die Kandidaten und Kandidatinnen die potenziellen Arbeitgeber/-innen
gezielt hinweisen, dürfen unproblematisch ausgewertet werden. Auch
frei zugängliche, berufsbezogene Quellen können verwertet werden (z.B.
in XING, LinkedIn). Tabu sind als privat erkennbare Inhalte, insbeson-
dere solche, die nur nach vorheriger Anmeldung in einem freizeitorien-
tierten Netzwerk (Facebook, StudiVZ u.ä.) einsehbar sind.
Bewerbungsunterlagen dürfen nur aufbewahrt werden, solange sie
für das Stellenbesetzungsverfahren von Bedeutung sind. Die Dauer der
4.3 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - II
145 4
Praxistipp

Das Einverständnis kann beispielweise mit folgender Erklärung


eingeholt werden:
„Mit der Speicherung meiner Daten über das aktuelle
Bewerbungsverfahren hinaus im Bewerber/-innenpool der XY-AG
bin ich einverstanden. Die XY-AG sichert zu, die Daten nur für
die Zwecke von Stellenbesetzungen zu verwenden und nicht
weiterzugeben.“
optional: „Die Löschung meiner Daten kann ich jederzeit
verlangen.“

zulässigen Aufbewahrung ist nicht explizit geregelt. Über den Abschluss


der Auswahl hinaus dürfen Bewerbungsunterlagen nur bis zum Ablauf
der Frist für die Geltendmachung von Ansprüchen wegen Diskriminie-
rung aufbewahrt werden, also zwei Monate ab Bekanntgabe der Ent-
scheidung lang (siehe § 15 Abs. 4 Allgemeines Gleichbehandlungsge-
setz). Eine längerfristige Datenhaltung ist nur mit Einverständnis der
Betroffenen zulässig.
Auskunft über die gespeicherten Daten kann nach Datenschutzrecht (§§ Bewerbungsdaten dürfen nur
19 und 34 Bundesdatenschutzgesetz) immer gefordert werden. Darüber begrenzte Zeit genutzt werden
hinaus haben Beschäftigte ein Recht auf Einsicht in ihre vollständige
Personalakte, gleichgültig ob sie auf Papier oder in elektronischer Form
geführt wird (§ 83 BetrVG).

4.3.3 Berufspflichten

Berufspsychologinnen und -psychologen und die für sie tätigen Gehil-


fen sind (worauf auch die DIN, 2016, S. 18 hinweist) an die Schweige-
pflicht nach § 203 Strafgesetzbuch gebunden
(1) „Wer unbefugt ein fremdes Geheimnis, namentlich ein zum per-
sönlichen Lebensbereich gehörendes Geheimnis oder ein Betriebs- oder
Geschäftsgeheimnis, offenbart, das ihm als … Berufspsychologen mit
staatlich anerkannter wissenschaftlicher Abschlussprüfung … anver-
traut worden oder sonst bekannt geworden ist, wird mit Freiheitsstrafe
bis zu einem Jahr oder mit Geldstrafe bestraft.“ …
(3) „Den in Abs. 1 Genannten stehen ihre berufsmäßig tätigen
Gehilfen und die Personen gleich, die bei ihnen zur Vorbereitung auf
den Beruf tätig sind.“
Für die Praxis der Berufsausübung ist entscheidend, inwieweit die Berufspsychologinnen und
Kandidatinnen und Kandidaten dem Psychologen/der Psychologin im -psychologen und ihre
Wege der Einwilligung die Weitergabe der gewonnenen Erkenntnisse Mitarbeiter/-innen unterliegen
gestatten. Eine Einwilligung für berufsbezogene Zwecke umfasst die der Schweigepflicht, soweit sie
Weitergabe der Ergebnisse in einem Ergebnisbericht, dessen Inhalte nicht durch Einwilligung davon
die DIN (2016, S. 20) beschreibt. entbunden werden
146 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

4.3.4 Gütekriterien aus rechtlicher Sicht

Rechtlich sind Gütekriterien In der DIN (2016) werden Gütekriterien für Verfahren der Eignungs-
anerkannt, nämlich für Messgeräte beurteilung genannt, z.B. die Kriterien Gültigkeit, Zuverlässigkeit und
Objektivität. In 7 Kap. 5 werden diese und weitere Kriterien erläutert,
7 Kap. 6 informiert exemplarisch über die Ergebnisse von Studien zur
Gültigkeit der aus bestimmten Verfahren abgeleiteten Eignungsbeurtei-
lungen. Dabei handelt es sich um die Kriterien, die aus Sicht der Exper-
4 tinnen und Experten für die Messung von Eignungsmerkmalen rele-
vant sind. Wie aber verhält es sich aus rechtlicher Sicht? Es gibt keine
gesetzliche Regelung zu Gütekriterien eignungsdiagnostischer Verfah-
ren. Inwieweit die in der DIN (2016) genannten Gütekriterien auch den
Anforderungen der Rechtsordnung genügen, kann nur im Vergleich
mit vorhandenen Regelungen für Messinstrumente beurteilt werden.
Für eichpflichtige Messgeräte postuliert die Mess- und Eichverordnung
(MessEV) folgende Gütekriterien:
„§ 7 (1) Messgeräte müssen
1. … die Fehlergrenzen einhalten, die in den gerätespezifischen
Anforderungen nach § 8 festgelegt sind; sind Fehlergrenzen nicht
ausdrücklich bestimmt, müssen Messgeräte eine Fehlergrenze
einhalten, die dem Stand der Technik unter Berücksichtigung
der vorgesehenen Nutzungsdauer und der zu erfüllenden
Messaufgabe entspricht,
2. im Hinblick auf den vorgesehenen Verwendungszweck geeignet,
zuverlässig und messbeständig sein,
3. gegen Verfälschungen von Messergebnissen geschützt sein,
4. die Messergebnisse in geeigneter Form darstellen und gegen
Verfälschung gesichert verarbeiten,
5. prüfbar sein.“

Die in der DIN (2016) vorgesehenen Anforderungen für Verfahren


entsprechen also einem bereits in der Rechtsordnung vorhandenen
Regelungsmodell.

4.3.5 Rechtliche Bedeutung von DIN-Normen

Verbindlichkeit oder Empfehlung?


Es gibt keine Pflicht, DIN-Normen DIN-Normen sind rechtlich nicht verbindlich. Niemand, also auch
anzuwenden keine Arbeitgeberin/kein Arbeitgeber ist verpflichtet, sie anzuwenden.
Niemand, also auch keine Kandidatin/kein Kandidat kann ihre Anwen-
dung verlangen. Denn dem DIN e.V. (Deutsches Institut für Normung)
fehlt als privater Organisation die staatliche Rechtsetzungsbefugnis.
Gleichwohl sollen DIN-Normen der Allgemeinheit dienen, indem sie
den jeweiligen technischen Standard angeben. Daher wird im Bundes-
anzeiger auf neue DIN-Normen hingewiesen.
4.3 · Rechtliche Rahmenbedingungen der Eignungsdiagnostik - II
147 4
Verbindlichkeit durch vertragliche Regelung
DIN-Normen sind nicht „von selbst“ verbindlich. Man kann aber
verschiedene Möglichkeiten ergreifen, um DIN-Normen verbind-
lich werden zu lassen. Wer beispielsweise als Auftraggeberin/Auf-
traggeber mit Anbieterinnen/Anbietern von Dienstleistungen einen
Vertrag über die Gestaltung und/oder Durchführung eines Verfahrens
der Eignungsbeurteilung schließt, kann die DIN 33430 als verbindli-
chen Vertragsbestandteil vereinbaren. Dadurch erspart man sich eine
Übernahme des gesamten Textes der DIN in das Vertragsdokument.
Auftraggeber/-innen und Dienstleister/-innen könnten dazu Folgen-
des regeln:

„Die Auftragnehmerin/der Auftragnehmer verpflichtet sich, den Prozess


der Vorauswahl nach den Regelungen der DIN (2016) vorzunehmen.“

Auf diese Weise erwirbt die Auftraggeberin/der Auftraggeber einen


Anspruch auf eine Leistung nach der DIN-Norm. Es ist auch möglich,
den Vertrag auf nur einzelne Abschnitte der DIN (2016) zu beziehen.
Bereits die Ausschreibung einer eignungsdiagnostischen Dienst- Man kann die DIN in Verträge
leistung kann sich auf die DIN beziehen. Die Autorinnen und Autoren einbeziehen
der DIN (2016) geben in einem separaten Anhang entsprechende „Hin-
weise für die Ausschreibung eignungsdiagnostischer Prozesse und Ver-
fahren unter Beachtung der DIN 33430“.

Verbindlichkeit durch Inbezugnahme


In Gesetzen und Rechtsverordnungen kann auf die DIN-Norm Bezug Man kann die DIN in andere
genommen werden. Dasselbe ist in Tarifverträgen und in Betriebs- Regelwerke einbeziehen
vereinbarungen und Dienstvereinbarungen möglich. In solchen
Fällen erlangt die DIN-Norm Rechtsverbindlichkeit, bezogen auf den
Anwendungsbereich dieser Regelungen. Gerade bei betrieblichen
Auseinandersetzungen um den Standard bei Verfahren zur internen
und externen Personalauswahl werden sich Arbeitgeber/-innen und
Mitarbeiter/-innenvertretung am ehesten auf die DIN (2016) einigen
können.

Verbindlichkeit durch Ausfüllung von unbestimmten


Qualitätsstandards
Unbestimmte Begriffe wie „allgemein anerkannte Regeln der Technik“
können im Wege der Auslegung mit den Inhalten der DIN-Norm aus-
gefüllt werden.

Ein Beispiel aus der Ausbildungsverordnung für den gehobenen all-


gemeinen Verwaltungsdienst in Nordrhein-Westfalen:
Die Auswahlmethode ist „unter Berücksichtigung der in Wissenschaft
und Praxis sich entwickelnden Erkenntnisse über Personalauswahlver-
fahren“ zu bestimmen (§ 4 VAPgD BA vom 05.08.2008).
148 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Die DIN (2016) ist geeignet, die Erkenntnisse über die Durchführung
von Verfahren zur internen und externen Personalauswahl zusammen-
fassend anzugeben, und füllt auf diese Weise den unbestimmten Rechts-
begriff in der Verordnung aus.
Die DIN kann unbestimmte Derselbe Gedanke gilt auch bei der Auslegung unklarer vertragli-
Begriffe mit Inhalt füllen cher Regelungen. Anerkannt ist dieses Prinzip von der Rechtsprechung
z.B. im Mietrecht (Bundesgerichtshof 06.04.2004 Az. VIII ZR 355/03,
NJW 2005, 218).
4
Bedeutung bei der Konkurrentenklage
Bei der Besetzung von Arbeitsplätzen im öffentlichen Dienst gilt für die
Arbeitgeber/-in/die Dienstherren die Bindung an das Recht auf gleichen
Zugang zu öffentlichen Ämtern (Art. 33 Abs. 2 GG). Wegen des daraus
resultierenden Anspruchs auf ein willkürfreies Auswahlverfahren muss
auf Wunsch der unterlegenen Kandidatin/des unterlegenen Kandida-
ten die Auswahlentscheidung begründet werden. Wenn die DIN (2016)
beachtet wurde, wird der Klägerin/dem Kläger (der Konkurrentin/dem
Konkurrenten) vor Gericht kaum der Beweis gelingen, die Auswahl sei
willkürlich, also nicht anforderungsbezogen getroffen worden.
Entsprechend hat sich das Verwaltungsgericht Neustadt zu Stellen-
besetzungsrichtlinien mit strukturierten Interviews geäußert:
Bei DIN-konformen „Der Dienstherr darf die Auswahlentscheidung über die Vergabe
Auswahlverfahren scheidet der eines mit Führungsfunktion verbundenen Beförderungsdienstpostens
Vorwurf von Willkür aus zwischen den im Ergebnis ihrer dienstlichen Beurteilungen im Wesent-
lichen gleich guten Bewerbern aufgrund strukturierter Interviews nach
einem der Norm DIN 33430 entsprechenden, vom TÜV zertifizierten
Verfahren zur psychologischen Eignungsdiagnostik treffen.“ (Verwal-
tungsgericht Neustadt (07.09.2011 Az. 1 K 382/11.NW, juris, Rn. 40)

Bedeutung bei Diskriminierungsklagen


Auch private Arbeitgeberinnen und Arbeitgeber werden durch das All-
gemeine Gleichbehandlungsgesetz (AGG) gezwungen, eine diskrimi-
nierungsfreie Personalauswahl nachzuweisen, d.h. objektive Auswahl-
kriterien zu dokumentieren und im Streitfall darzulegen. Dies spielt
eine Rolle bei behaupteten Diskriminierungen wegen Rasse, ethnischer
Herkunft, Geschlecht, Religion/Weltanschauung, Behinderung, Alters
oder sexueller Identität (§§ 1, 7 AGG). Wenn im Streitfall die Auswahl-
entscheidung gerichtlich angegriffen wird, wirkt sich die Einhaltung
der DIN als Beweiserleichterung aus. Durch ein DIN-konform gestal-
tetes und dokumentiertes Auswahlverfahren lassen sich Anzeichen für
eine Diskriminierung („Indizien“) überzeugend entkräften.

Praxisbeispiel: Ein kurdischstämmiger Kandidat kommt mit dem


Hausmeister seines Wunschbetriebs ins Gespräch und erfährt, dass
der Chef aus Izmir kommt und noch nie einen Kurden eingestellt
hat. Obwohl er fachlich qualifiziert ist, wird der Kandidat nicht zum
Literatur
149 4
Vorstellungsgespräch eingeladen, sondern erhält eine Absage. Kann
er eine Entschädigung nach dem AGG verlangen?
Der Hausmeister ist zwar nicht am Auswahlverfahren beteiligt, hat aber Die Einhaltung der DIN
ein Indiz für eine Benachteiligung wegen der ethnischen Herkunft des erleichtert die Abwehr von
Kandidaten gesetzt. Wenn der Kandidat objektiv für den Arbeitsplatz ungerechtfertigten Ansprüchen
geeignet ist, kann er deswegen nach § 15 Abs. 2 AGG eine Entschädi- wegen Diskriminierung
gung verlangen (maximal 3 Monatsgehälter). Um den Anspruch ab-
zuwehren, müsste der Arbeitgeber darlegen und beweisen, dass er
den Kandidaten entgegen des Indizes nicht wegen seiner Herkunft
abgelehnt hat. Das wird ihm umso leichter gelingen, je lückenloser er
die Anforderungen und die Auswahlkriterien dokumentiert hat. Diese
lückenlose Dokumentation ist nach der DIN (2016) vorgesehen.

4.3.6 Fazit

Da Eignungsdiagnostik nicht im rechtsfreien Raum stattfindet, müssen


im Auswahlverfahren rechtliche Rahmenbedingungen beachtet werden.
Grenzen der Informationsgewinnung werden vor allem durch den Daten-
schutz gesetzt. Wo Mitarbeiter/-innenvertretungen existieren, haben sie
bei der Einführung von eignungsdiagnostischen Verfahren mitzubestim-
men. Die Einhaltung der DIN (2016) hilft an dieser Stelle, aber auch im
Fall von gerichtlichen Auseinandersetzungen, die Willkürfreiheit im Aus-
wahlverfahren darzulegen. Auf diese Weise lässt sich auch das Risiko von
Entschädigungsforderungen wegen Diskriminierungen beherrschen.

? Kontrollfragen zu 7 Abschn. 4.3


1. Bei welchen Maßnahmen hat der Betriebsrat
mitzubestimmen?
2. Welche Daten dürfen für Beschäftigungsverhältnisse erhoben
werden?
3. Wie kann ein Psychologe/eine Psychologin bei der Eignungs-
diagnostik seiner/ihrer Berufspflicht zur Verschwiegenheit
genügen?
4. Welche Möglichkeiten gibt es, der DIN-Norm zu rechtlicher
Verbindlichkeit zu verhelfen?

Weiterführende Literatur
Baßlsperger, M. (2014). Personalauswahlinstrumente. Zeitschrift für Beamtenrecht, 3,
73-79.
Bauer, J.-H., & Krieger, S. (2016). 10 Jahre AGG – Tops und Flops. Neue Zeitschrift für
Arbeitsrecht, 17, 1041-1046.
Franzen, M. (2013). Rechtliche Rahmenbedingungen psychologischer Eignungstests.
Neue Zeitschrift für Arbeitsrecht, 1, 1-5.
Hayn-Habermann, B. (2013). Regeln der Technik und DIN-Normen, NJW-Spezial 2013,
684-685.
Müller-Glöge, R., Preis, U., & Schmidt, I. (Hrsg.). (2016). Erfurter Kommentar zum
Arbeitsrecht (16. Aufl.). München: Beck.
Schaub, G. (2015). Arbeitsrechtshandbuch (16. Aufl.). München: Beck.
150 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Literatur

Literatur zur 7 Abschn. 4.1


Brannick, M. T., Levine, E. L., & Morgeson, F. P. (2007). Job and work analysis. Thousand
Oaks, CA: Sage.
DIN (2002). DIN 33430: Anforderungen an Verfahren und deren Einsatz bei berufsbezo-
genen Eignungsbeurteilungen. Berlin: Beuth.
DIN (2016). Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin: Beuth.
Dunckel, H. (Hrsg.). (1999). Handbuch psychologischer Arbeitsanalyseverfahren.
4 Zürich: vdf.
Eckardt, H. H., & Schuler, H. (1995). Berufseignungsdiagnostik. In R. S. Jäger & F. Peter-
mann (Hrsg.), Psychologische Diagnostik. Ein Lehrbuch (S. 533–551). Weinheim:
Beltz PVU.
Flanagan, J. C. (1954) The critical incident technique. Psychological Bulletin, 51,
327–359.
Frieling E., & Hoyos, Graf C. (1978). Der Fragebogen zur Arbeitsplatzanalyse (FAA). Bern:
Huber.
Herzberg, P. Y., & Frey, A. (2011). Kriteriumsorientierte Diagnostik. In L. F. Hornke, M.
Amelang, & M. Kersting (Hrsg.), Methoden der psychologischen Diagnostik. Enzyk-
lopädie der Psychologie (B/II/2, S. 281–324), Göttingen: Hogrefe.
Höft, S., & Goerke, P. (2014). Traditionelle Arbeits- und Anforderungsanalyse trifft
modernen Kompetenzmanagementansatz: Rosenkrieg oder Traumhochzeit?
Wirtschaftspsychologie, 16(1), 5–14.
Höft, S., & Schuler, H. (2005). Empirische Arbeits- und Anforderungsanalysen: Ein
Anwendungsbeispiel mit einem kombinierten aufgaben-, verhaltens- und
eigenschaftsorientierten Analyseansatz. In K. Sünderhauf, S. Stumpf, & S. Höft
(Hrsg.), Assessment Center von der Auftragsklärung bis zur Qualitätssicherung
(S. 72–88). Lengerich: Pabst.
Höft, S., & Schuler, H. (2014). Personalmarketing und Personalauswahl. In H. Schuler &
K. Moser (Hrsg.), Lehrbuch Organisationspsychologie (5. Aufl., S. 55–126). Bern:
Huber.
Joerin Fux, S., & Stoll, F. (2006). Explojob: das Werkzeug zur Beschreibung von Berufsan-
forderungen und -tätigkeiten. Bern: Huber.
Kersting, M., & Birk, M. (2011). Zur zweifelhaften Validität und Nützlichkeit von
Anforderungsanalysen für die Interpretation eignungsdiagnostischer Daten. In
P. Gelléri & C. Winter (Hrsg.). Potentiale der Personalpsychologie: Einfluss personal-
diagnostischer Maßnahmen auf den Berufs- u. Unternehmenserfolg (S. 83–95).
Göttingen: Hogrefe.
Kersting, M., & Ott, M. (2015). Diversity-gerechte Personalauswahl – Wie man die Per-
sonalauswahl gestalten muss, um Potenziale in allen Gesellschaftsgruppen zu
erkennen. In T. Ringeisen & P. Genkova (Hrsg.). Diversity Kompetenz: Perspektiven
und Anwendungsfelder (S. 1–11). Berlin: Springer.
Kleinmann, M., Manzey, D., Schumacher, S., & Fleishman, E. A. (2010). F-JAS - Fleish-
man Job Analyse System für eigenschaftsbezogene Anforderungsanalysen.
Deutschsprachige Bearbeitung des Fleishman Job Analysis Survey. Göttingen:
Hogrefe.
Koch, A., & Westhoff, K. (2012). Task-Analysis-Tools (TAToo) - Schritt für Schritt Unter-
stützung zur erfolgreichen Anforderungsanalyse. Lengerich: Pabst.
Krumm, S., Mertin, I., & Dries, C. (2012). Kompetenzmodelle. Göttingen: Hogrefe.
Scherbaum, C. A. (2005). Synthetic validity: Past, present, and future. Personnel Psy-
chology, 58, 481–515.
Schmitt, N., & Chan, D. (1995). Personnel selection: A theoretical approach. Thousand
Oaks, CA: Sage.
Schuler, H. (2014). Psychologische Personalauswahl (4. Aufl.). Göttingen: Hogrefe.
Schuler, H., Funke, U., Moser, K., & Donat, M. (1995). Personalauswahl in Forschung
und Entwicklung. Eignung und Leistung von Wissenschaftlern und Ingenieuren.
Göttingen: Hogrefe.
Literatur
151 4
Schuler, H., Muck, P., Hell, B., Höft, S., Becker, K., & Diemand, A. (2004). Entwicklung
eines multimodalen Systems zur Beurteilung von Individualleistungen. In H.
Schuler (Hrsg.), Beurteilung und Förderung beruflicher Leistung (S. 133–158). Göt-
tingen: Hogrefe.
Smith, P. C., & Kendall, L. M. (1963). Retranslation of expectations: An approach to
the construction of unambiguous anchors to rating scales. Journal of Applied
Psychology, 47, 149–155.
Thunsdorff, C., Michaelis, L., Weis, S., Kersting, M., Schmitt, M., & Ulfert, A.-S. (2015).
Studieneignung für spezifische Studienfächer - welche Rolle spielt die Auswahl
der Anforderungsanalysemethode bei der Identifizierung erfolgsrelevanter
Eigenschaften? Das Hochschulwesen, 63, 98–103.

Literatur zu 7 Abschn. 4.2


Anderson, N., Salgado, J. F., & Hülsheger, U. R. (2010). Applicant reactions in selection:
Comprehensive meta-analysis into reaction generalization versus situational
specificity. International Journal of Selection and Assessment, 18, 291–304.
Beermann, D., Kersting, M., Stegt, S., & Zimmerhofer, A. (2013). Vorurteile und
Urteile zur Akzeptanz von Persönlichkeitsfragebogen. PersonalQuarterly, 65,
41–45.
Bergmann, C., & Eder, F. (2005). Allgemeiner Interessen-Struktur-Test - Revision (AIST-R).
Göttingen: Beltz Test.
Borkenau, P., & Ostendorf, F. (2008). NEO-FFI - NEO-Fünf-Faktoren-Inventar nach Costa
und McCrae. Göttingen: Hogrefe.
Brunstein, J. C. (2003). Implizite Motive und motivationale Selbstbilder: Zwei Prä-
diktoren mit unterschiedlichen Gültigkeitsbereichen. In J. Stiensmeier-Pelster
& F. Rheinberg (Hrsg.), Diagnostik von Motivation und Selbstkonzept (S. 59–88).
Göttingen: Hogrefe.
Cronbach, L. J., & Gleser, G. C. (1965). Psychological tests and personnel decisions
(2nd ed.). Urbana, Il: University of Illinois Press.
DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Forer, B. R. (1949). The fallacy of personal validation: A classroom demonstration of
gullibility. Journal of Abnormal Psychology, 44, 118–123.
Fruhner, R., & Schuler, H. (1991). Gibt es Unterschiede in der Bewertung von Assess-
ment-Center Aufgaben in Abhängigkeit vom eigenen Abschneiden? In H. Schuler
& U. Funke (Hrsg.), Eignungsdiagnostik in Forschung und Praxis (S. 313–319). Stutt-
gart: Verlag für Angewandte Psychologie.
Greenwald, A. G., McGhee, D. E., & Schwartz, J. L. K. (1998). Measuring individual
differences in implicit cognition: The Implicit Association Test. Journal of Perso-
nality and Social Psychology, 74, 1464–1480.
Hausknecht, J. P., Day, D. V., & Thomas, S. C. (2004). Applicant reactions to selection pro-
cedures: An updated model and meta-analysis. Personnel Psychology, 57, 639–683.
Herzberg, P. Y., & Roth, M. (2014). Persönlichkeitspsychologie. Wiesbaden: Springer.
Holland, J. L. (1985). Making vocational choices: A theory of vocational personalities
and work environments. Englewood-Cliffs: Prentice-Hall.
Hornke, L. F., Etzel S., & Rettig, K. (2006). Adaptiver Matrizen Test. Mödling: Schuhfried.
Hossiep, R., & Krüger, C. (2012). Bochumer Inventar zur berufsbezogenen Persönlich-
keitsbeschreibung – 6 Faktoren (BIP-6F). Göttingen: Hogrefe.
Hossiep, R., & Paschen, M. (2003). Bochumer Inventar zur berufsbezogenen Persönlich-
keitsbeschreibung (BIP) (2. Aufl.). Göttingen: Hogrefe.
Hossiep, R., Turck, D., & Hasella, M. (1999). BOMAT - advanced. Bochumer Matrizentest.
Göttingen: Hogrefe
International Test Commission (ITC) (2006). International guidelines on computer-
based and internet-delivered testing. International Journal of Testing, 6, 143-171.
Jäger, A. O. (1982). Mehrmodale Klassifikation von Intelligenzleistungen. Experimen-
tell kontrollierte Weiterentwicklung eines deskriptiven Intelligenzstrukturmo-
dells. Diagnostica, 28, 195–226.
152 Kapitel 4 · Anforderungsanalyse, Verfahren der Eignungsbeurteilung sowie rechtliche Rahmenbedingungen

Jäger, A. O. (1984). Intelligenzstrukturforschung: Konkurrierende Modelle, neue Ent-


wicklungen, Perspektiven. Psychologische Rundschau, 35, 21–35.
Jäger, A. O., Süß, H.-M., & Beauducel, A. (1997). Berliner Intelligenzstruktur - Test.
Form 4. In W. Sarges, & H. Wottawa (Hrsg.), Handbuch wirtschaftspsychologischer
Testverfahren (S. 95–101). Lengerich: Pabst.
Joerin Fux, S., & Stoll, F. (2006). Explojob: das Werkzeug zur Beschreibung von Berufsan-
forderungen und -tätigkeiten. Bern: Huber.
Joerin Fux, S., Stoll, F., Bergmann, C., & Eder, F. (2003) EXPLORIX – das Werkzeug zur
Berufswahl und Laufbahnplanung. Adaptation und Weiterentwicklung des Self-Di-

4 rected Search (SDS) nach John Holland. Bern: Huber.


Kersting, M. (2006). Zur Beurteilung der Qualität von Tests: Resümee und Neube-
ginn. Psychologische Rundschau, 57, 243–253.
Kersting, M. (2008). Zur Akzeptanz von Intelligenz- und Leistungstests. Report Psy-
chologie, 33, 420–433.
Kersting, M. (2010). Akzeptanz von Assessment Centern: Was kommt an und worauf
kommt es an? Wirtschaftspsychologie, 12, 58–65.
Kersting, M. (2011). Managementdiagnostik: Verfahren und Qualitätsaspekte. In
C. Niedereichholz, J. Niedereichholz & J. Staude (Hrsg.), Handbuch der Unterneh-
mensberatung. Organisationen führen und verwalten (Kz. 3960, S. 1–18). Berlin:
Schmidt.
Kersting, M. (2013). Management-Diagnostik in Zeiten des Personalmangels. In
W. Sarges (Hrsg.), Management-Diagnostik (4. Aufl., S. 524–530). Göttingen:
Hogrefe.
Kersting, M. (2014). SMART – berufsbezogener Test zur kognitiven Kompetenz. Mödling:
Schuhfried.
Kersting, M., Althoff, K., & Jäger, A. O. (2008). Wilde-Intelligenztest 2 (WIT-2). Göttin-
gen: Hogrefe.
Kersting, M., Graulich, V., & Bothe, P. S. (2015). Das beschreibt mich und andere. Perso-
nalmagazin, 182, 28–33.
Kersting, M., & Palmer, C. (2017). Testverfahren: Kognitive Fähigkeiten. In D. E. Krause
(Hrsg.), Personalauswahl. (S. 127-157) Heidelberg: Springer Gabler.
Klehe U.-C., & Anderson, N. (2007). Working hard and working smart: Motivation and
ability during typical and maximum performance. Journal of Applied Psychology,
92, 978–992.
Lord, W. (2011). Das NEO-Persönlichkeitsinventar in der berufsbezogenen Anwendung.
Göttingen: Hogrefe.
Liepmann, D., Beauducel, A., Brocke, B., & Amthauer, R. (2007). Intelligenz-Struktur-
Test 2000 R (I-S-T 2000 R) (2. Aufl.). Göttingen: Hogrefe.
McClelland, D. C. (1985). Human motivation. Glenview: Scott, Foresman & Comp.
McGrew, K. S. (2005). The Cattell-Horn-Carroll theory of cognitive abilities. In D. P.
Flanagan & P. L. Harrison (Hrsg.), Contemporary intellectual assessment: Theories,
test, and issues (2. Aufl., S. 136–181). New York: Guilford Press.
McGrew, K. S. (2009). CHC theory and the human cognitive abilities project: Standing
on the shoulders of the giants of psychometric intelligence research. Intelligen-
ce, 37, 1–10.
Murray, H. A. (1943). Thematic Apperception Test (TAT). Cambridge: Harvard University
Press.
Ostendorf, F., & Angleitner, A. (2004). NEO-PI-R - NEO Persönlichkeitsinventar nach
Costa und McCrae - Revidierte Fassung. Göttingen: Hogrefe.
Ott, M., Ulfert, A.-S., & Kersting, M. (2017). Self-Assessment. In D. E. Krause (Hrsg.),
Personalauswahl (S. 215-242). Heidelberg: Springer Gabler.
Wechsler Adult Intelligence Scale -(WAIS-IV)Petermann, F. (2015). Wechsler Adult Intel-
ligence Scale - Fourth Edition (WAIS-IV) (dt. Version, 2. Aufl.). Frankfurt: Pearson
Assessment.
Raven, J. C., Raven, J., & Court, J. H. (1998). Advanced progressive matrices (APM).
Frankfurt: Pearson Assessment.
Schmidt-Atzert, L. (2004). Objektiver Leistungsmotivations Test (OLMT). Mödling:
Schuhfried.
Literatur
153 4
Schmukle, St. C., & Egloff, B. (2011). Indirekte Verfahren zur Erfassung von Persönlich-
keit. In L. F. Hornke, M. Amelang & M. Kersting (Hrsg.), Enzyklopädie der Psycho-
logie. Persönlichkeitsdiagnostik (S. 73–120). Göttingen: Hogrefe.
Schuler, H., & Hell, B. (2005). ASK - Analyse des Schlussfolgernden und Kreativen
­Denkens. Bern: Huber.
Schuler, H., Hell, B., Trapmann, S., Schaar, H. & Boramir, I. (2007). Die Nutzung psycho-
logischer Verfahren der externen Personalauswahl in deutschen Unternehmen.
Ein Vergleich über 20 Jahre. Zeitschrift für Personalpsychologie, 6, 60–70.
Schuler, H., & Klingner, Y. (2005). Arbeitsprobe zur berufsbezogenen Intelligenz (AZUBI-
BK). Göttingen: Hogrefe.
Schuler, H., & Prochaska, M. (2001). Leistungsmotivationsinventar (LMI). Göttingen:
Hogrefe.
SHL Group Limited (2007). Occupational Personality Questionnaire (OPQ32). User
Manual. Thames Ditton, UK: SHL Group Limited.
Sokolowski, K., & Schmalt, H.-D. (2010). Das Multi-Motiv-Gitter (MMG). Mödling:
Schuhfried
Spokane, A. R., Meir, E. I., & Catalano, M. (2000). Person-environment congruence and
Holland’s theory. Journal of Vocational Behavior, 57, 137–187.
Süß, H.-M. & Schweickert, S. (2002). Was ist ein gutes Maß für die Allgemeine Intelli-
genz? Eine Studie zur Konstruktvalidität von Intelligenztests. Mannheim: Universi-
tät, Lehrstuhl Psychologie II.
Testkuratorium der Föderation Deutscher Psychologenvereinigungen (2010).
­TBS-TK. Testbeurteilungssystem des Testkuratoriums der Föderation Deutscher
Psychologenvereinigungen. Revidierte Fassung vom 09. September 2009.
Psychologische Rundschau, 61, 52–56.
Van Iddekinge, C. H., Roth, P. L., Putka, D. J., & Lanivich, S. E. (2011). Are you interes-
ted? A Meta-Analysis of relations between vocational interests and employee
performance and turnover. Journal of Applied Psychology, 96, 1167–1194.

Literatur zu 7 Abschn. 4.3


DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
155 5

Statistisch-methodische
Grundlagen der
Eignungsbeurteilung
Markus Bühner, Matthias Ziegler und Martin Kersting

5.1 Einführung – 156

5.2 Statistisch-methodische Grundlagen für die Auswahl


von Verfahren – 157
5.2.1 Stichprobe – 158
5.2.2 Maße der zentralen Tendenz – 158
5.2.3 Streuungsmaße – 160
5.2.4 Zusammenhangsmaße – 161
5.2.5 Multiple lineare Korrelation – 163

5.3 Testtheorien: Klassische Testtheorie und Item-


Response-Theorien – 165
5.3.1 Latente und manifeste Variablen – 165
5.3.2 Klassische Testtheorie – 166
5.3.3 Item-Response-Modelle – 169

5.4 Gütekriterien – 172


5.4.1 Zuverlässigkeit bzw. Reliabilität – 172
5.4.2 Konfidenzintervalle und der Vergleich der Ergebnisse verschiedener
Kandidatinnen und Kandidaten – 177
5.4.3 Gültigkeit bzw. Validität – 178
5.4.4 Objektivität – 182
5.4.5 Norm- und kriteriumsorientierte Messungen und
Ergebnisrückmeldung – 182
5.4.6 Fairness – 185

5.5 Fazit – 186

Literatur – 187

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_5
156 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Übersicht
Im diesem Kapitel werden einige der Kenntnisse vermittelt, die
nach der DIN (2016, S. 23) für die Auswahl und die fachgerechte
Nutzung von Verfahren sowie die Interpretation der Verfahrens-
ergebnisse (einschließlich der Erstellung eines Ergebnisberichts)
notwendig sind: statistisch-methodische Grundlagen, Kenntnisse
der Klassischen Testtheorie und Item-Response-Theorien,
Testkonstruktionsgrundlagen und Gütekriterien von Verfahren.

5
5.1 Einführung

Einteilung von Verfahren Die Verfahren, die laut DIN 33430 zur Eignungsbeurteilung einge-
setzt werden können, lassen sich in verschiedene Kategorien eintei-
len (7 Abschn. 4.2). Die Ergebnisse, die solche Verfahren über einzelne
Personen oder Gruppen von Personen liefern, werden meist mithilfe
von Zahlen ausgedrückt, z.B. mit der Anzahl richtig gelöster Aufgaben
in einem Intelligenztest oder einer Punktzahl für die Antwort auf eine
Interviewfrage.
Voraussetzung für Damit Eignungsbeurteilungen sinnvoll durchgeführt werden
Eignungsbeurteilungen können, muss sichergestellt werden, dass Personen (1) sich im Grad der
Ausprägung eines Eignungsmerkmals unterscheiden, (2) diese Unter-
schiede mit relevanten Verhaltensweisen zusammenhängen und (3)
die Messung das Gütekriterium der Skalierung erfüllt (vgl. Kubinger &
Proyer, 2004).
Skalierung als zentrales Nach Bühner (2011) ist das Gütekriterium der Skalierung ein
Gütemerkmal einer Messung überaus bedeutsames Gütekriterium eines Verfahrens. Es kann durch
die Anwendung statistischer Methoden auf empirische Daten im
Rahmen von Testtheorien überprüft werden. Warum ist dies nun eine
zentrale Frage und steht zu Beginn dieses Kapitels? Der Grund hierfür
ist, dass dieses Gütekriterium ausschlaggebend dafür ist, ob man von
einer Messung sprechen kann oder „nur“ Punkte zählt. Nehmen wir an,
wir führen einen Hochsprungwettbewerb durch. Wir verteilen Punkte,
wie wir es von Tests kennen: Wer eine Aufgabe löst bzw. Höhe meis-
tert, bekommt einen Punkt. Wer die Aufgabe nicht löst bzw. eine Höhe
nicht meistert, bekommt keinen Punkt. An dem Wettbewerb nehmen
zwei Personen, Caesar und Diogenes, teil. Caesar springt über die erste
gemeinschaftlich festgelegte Höhe und scheitert. Nun springt Dioge-
nes und meistert die Höhe. Es steht 1:0 für Diogenes. Caesar nimmt
die nächste Latte in Angriff, die wesentlich höher liegt als die erste,
und überspringt diese. Danach springt Diogenes erneut und scheitert.
Der Wettbewerb endet mit einem Gleichstand: 1:1. Mit diesem Ergeb-
nis kann Caesar nicht zufrieden sein, denn er ist höher gesprungen als
Diogenes. Die Punktvergabe deutet jedoch keinen Leistungsunterschied
an. Was sind Erklärungen hierfür?
5.2 · Statistisch-methodische Grundlagen für die Auswahl von Verfahren
157 5
Eine von mehreren Ursachen für dieses Ergebnis ist, dass unsere Messen
Hochsprunganlage die real erzielten Leistungen nicht abbildet. Das
Gütekriterium der Skalierung ist nicht erfüllt. Würde man einen Test im
Rahmen einer Eignungsbeurteilung einsetzen, in dem leistungsstärkere
Personen nicht mehr Punkte erzielen als leistungsschwächere, hätte man
ein Problem. Gelingt die Abbildung eines Eignungsmerkmals, spricht
man von einer strukturerhaltenden Abbildung, und das Gütekriterium
der Skalierung ist erfüllt: Wenn Caesar doppelt so hoch gesprungen ist
wie Diogenes, sollte seine Punktzahl auch doppelt so hoch ausfallen.
Wenn wir nicht nur Punkte zählen, sondern ein bestimmtes Eignungs-
merkmal mithilfe von Zahlen oder Zeichen strukturerhaltend abbil-
den, sprechen wir bezüglich dieser Zahlen oder Zeichen von einem
Messwert.
Allerdings kann ein solches Ergebnis auch durch eine weitere Messfehler
Ursache erklärt werden, nämlich durch einen Fehler bei der Messung.
Vielleicht war Caesar beim erstem Sprung unkonzentriert, und er hat
deshalb diese erste Höhe nicht übersprungen. Das heißt, wir müssen
uns auch mit Fehlern bei Messungen auseinandersetzen. Testtheorien
liefern ein mathematisches Modell, um die Skalierung eines Punktwerts
zu gewährleisten (7 Abschn. 5.3).
Bezüglich der Gütekriterien für messtheoretisch fundierte Frage- Gütekriterien
bogen und Tests, die auf Basis von Testtheorien entwickelt wurden,
unterscheidet man Haupt- und Nebengütekriterien. Auf diese wird in
7 Abschn. 5.4 eingegangen. Grundsätzlich gelten diese Gütekriterien
auch für Dokumentenanalysen, direkte mündliche Befragungen und
Verfahren zur Verhaltensbeobachtung und -beurteilung. Wir erläutern
die Kriterien im Folgenden aber am Beispiel von messtheoretisch fun-
dierten Fragebogen und Tests. Besitzen wir durch den Einsatz solcher
Verfahren Messwerte verschiedener Personen, können wir mithilfe
dieser Messwerte sehr viel über die Ausprägungen der Eignungsmerk-
male der Personen erfahren sowie Vergleiche zwischen den Personen
im Rahmen einer Eignungsbeurteilung anstellen. Dazu müssen wir ver-
schiedene Statistiken betrachten und richtig interpretieren. Ein Ver-
ständnis dieser Statistiken ist auch notwendig, um die Angaben zur Güte
eines Verfahrens kritisch prüfen zu können. Die wichtigsten Statistiken
werden in 7 Abschn. 5.2 ausführlich dargestellt.

5.2 Statistisch-methodische Grundlagen für die


Auswahl von Verfahren

In der DIN (2016) werden im normativen Anhang B „Anforderungen


an Verfahrenshinweise für messtheoretisch fundierte Fragebogen und
Tests“ formuliert. Hier wird verlangt, dass in den Verfahrenshinweisen
(auch „Testmanuale“ genannt) die Ergebnisse von mit dem Verfahren
durchgeführten empirischen Untersuchung(en) zu berichten sind. Was
gehört zu einem „solchen“ Bericht? Wichtig sind u.a. Informationen zur
158 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Stichprobe und darüber, wie sich die Messwerte zu dem Eignungsmerk-


mal, z.B. die Punktwerte zum Ergebnis in einem Rechtschreibtest, ver-
teilen. Im folgenden Abschnitt werden der Begriff der Stichprobe und
die Verteilung von Messwerten erläutert.

5.2.1 Stichprobe

Stichprobe Unter einer Stichprobe ohne weitere Definition wird meist eine Gruppe
zufällig ausgewählter Personen aus einer Population verstanden. Wir
5 möchten beispielsweise aus den Werten einer begrenzten Anzahl an
Personen, die einen messtheoretisch fundierten Test bearbeitet haben,
auf eine Grundgesamtheit schließen. Für die folgenden Beispiele
betrachten wir eine Stichprobe von 30 Personen, die einen Wissens-
test bearbeitet haben. Es ist sehr bedeutsam, aus welchen Personen sich
eine Stichprobe zusammensetzt. In der DIN (2016, S. 28) wird verlangt,
dass die Stichprobe genau beschrieben wird. Beispielsweise müssen in
den Verfahrenshinweisen Angaben zu Alter, Geschlecht, Bildung und
Status (z.B. Azubis, Berufstätige usw.) getroffen werden. Darüber hinaus
wird verlangt, dass die Situation beschrieben wird, in der die Perso-
nen das Verfahren bearbeitet haben. Es kann z.B. einen großen Unter-
schied machen, ob ein Persönlichkeitsfragebogen freiwillig und anonym
bearbeitet wurde oder unter der Ernstfallbedingung der Personalaus-
wahl. Auch die Frage, ob eine Testung unter Aufsicht oder unter nicht-
kontrollierten Bedingungen, z.B. über das Internet von „zu Hause“
aus, stattgefunden hat (zur Kontrolle der Untersuchungsbedingungen
7 Abschn. 4.2), ist wichtig und muss laut DIN in den Verfahrenshinwei-
sen beantwortet werden.
Repräsentativität der Stichprobe Soll beispielsweise Intelligenz gemessen werden, und die Stichprobe,
die den Intelligenztest bearbeitet hat, stammt lediglich aus Bayern und
nicht aus dem gesamten Bundesgebiet, ist die Stichprobe vielleicht noch
für Bayern repräsentativ, aber eben nicht für die Bunderepublik. Reprä-
sentativ meint, dass man alle Menschen in Bayern kennt und virtuell in
eine Urne legt. Danach zieht man dann eine Stichprobe einer bestimm-
ten Menge per Zufall aus der Urne. Ist eine Stichprobe nicht reprä-
sentativ, gelten die ermittelten Größen nur für die Stichprobe oder für
Populationen, die bezüglich der Eignungsmerkmale genauso wie die
Stichprobe zusammengesetzt sind. Mit „Größe“ meinen wir hier und
im Folgenden den mathematischen Größenbegriff.

5.2.2 Maße der zentralen Tendenz

Im folgenden Abschnitt erläutern wir einige Größen, die Verteilungen


beschreiben. Man benötigt diese Größen, um einen Eindruck über die
Ausprägungen von Messwerten einzelner Kandidatinnen und Kan-
didaten zu erhalten. Sie zeigen das Ausmaß der Unterschiedlichkeit
5.2 · Statistisch-methodische Grundlagen für die Auswahl von Verfahren
159 5
von Kandidatinnen und Kandidaten und wie homogen oder hetero-
gen deren Leistungen sind.
Nehmen wir an, eine Organisation führt einen kurzen Wissenstest Maße der zentralen Tendenz von
im Rahmen einer Eignungsbeurteilung durch. Für jede Person wird der Verteilungen
Organisation ein Messwert als Gesamtwert im Wissenstest übermit-
telt. Will man nun wissen, wie gut die Personen im Wissenstest abge-
schnitten haben, gibt es verschiedene Möglichkeiten: Zunächst betrach-
tet man Verteilungen, die sich aus den Messwerten der Kandidatinnen
und Kandidaten ergeben. Verteilungen lassen sich durch bestimmte sta-
tistische Größen beschreiben. Diese sind Maße der zentralen Tendenz
wie Modalwert, Median, Mittelwert sowie Streuungsmaße wie Spann-
weite, Interquartilabstand, Varianz und Standardabweichung. Diese
Begriffe werden im Folgenden erläutert.
Eine Verteilung ergibt sich, wenn man die Messwerte einer Stich- Verteilung
probe der Größe nach ordnet, auf einer Achse anordnet und dann auf
der anderen Achse deren Auftretenshäufigkeiten mit einem Balken
darstellt.
Es kann von Interesse sein, was der häufigste Messwert war, der im Modalwert
Kandidatinnen- und Kandidatenfeld auftrat. Man nennt diesen Wert
Modalwert (Modus). Nehmen wir an, für die 30 Kandidatinnen und
Kandidaten liegen die folgenden Werte des Wissenstests vor: 20% mit
dem Messwert 0 (keine Aufgabe richtig gelöst), 20% mit dem Messwert 1
(1 Aufgabe richtig gelöst), 40% mit dem Messwert 2 (2 Aufgaben richtig
gelöst) und 20% mit dem Messwert 3 (3 Aufgaben richtig gelöst). In
diesem Fall haben die meisten der 30 Kandidatinnen und Kandidaten
einen Messwert von 2 erzielt, daher beträgt der Modalwert 2.
Nimmt man alle Messwerte der Kandidatinnen und Kandidaten, Median
ordnet diese nach ihrer Größe und stellt fest, unter welchem Wert 50%
der Kandidatinnen und Kandidaten liegen, erhält man den Median der
Messwerte. Nehmen wir an, der Median sei ebenfalls 2. Das bedeutet,
dass 50% der Kandidatinnen und Kandidaten einen Wert im Wissens-
test aufweisen, der schlechter oder gleich gut ist als der Wert 2.
Meistens wird der Wert berechnet, von dem alle anderen Mess- Mittelwert
werte der Kandidatinnen und Kandidaten den geringsten numerischen
Abstand aufweisen, der Mittelwert. Stellt man sich vor, Alexander der
Große, Pythagoras und Xanthippe hätten an dem Wissenstest teilge-
nommen und die Gesamtbewertungen 1, 2 und 3 erhalten. Der Mittel-
wert errechnet sich aus der Summe der Einzelbeurteilungen (1 + 2 +
3 = 6) geteilt durch die Anzahl der 3 Messwerte und ergibt im Beispiel 2.
In . Abb. 5.1 sind für drei unterschiedliche Verteilungen die Maße Symmetrische und schiefe
der zentralen Tendenz dargestellt. Für eine symmetrische Verteilung, Verteilungen
wie in . Abb. 5.1a abgebildet, fallen Modus, Median und Mittelwert auf
denselben Messwert. Würde man diese Verteilung ausschneiden und am
Median falten, stünde auf beiden Seiten nichts über. Die Verteilungen in
. Abb. 5.2b und . Abb. 5.2c sind schiefe Verteilungen. Median, Mittel-
wert und Modus fallen nicht zusammen. Je nachdem, auf welcher Seite
die Verteilung steiler ist, werden die Verteilungen auch als rechts- oder
160 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

a) SYMMETRISCHE
VERTEILUNG

Häufigkeit
Modalwert Median
Mittelwert
Messwerte
b) LINKSSTEILE c) RECHTSSTEILE

5 VERTEILUNG VERTEILUNG

Modalwert Median Modal-


wert
Median
Mittelwert
Mittelwert

. Abb. 5.1a–c  Darstellung von unterschiedlichen Verteilungen mit den entsprechenden Lagemaßen

linkssteil bezeichnet. Bei schiefen Verteilungen muss genau darauf


geachtet werden, wie mit Maßen der zentralen Tendenz argumentiert
wird. Nehmen wir an, die . Abb. 5.1b würde die Einkommensvertei-
lung in einer Organisation widerspiegeln. So könnte bei . Abb. 5.1b ein
Betriebsrat zu Recht behaupten: „Die meisten Mitarbeiter/-innen ver-
dienen schlecht.“ Der Vorstandsvorsitzende könnte anhand derselben
Verteilung ebenfalls zu Recht argumentieren: „Im Durchschnitt verdie-
nen die Mitarbeiter/-innen gut.“ Angemessen bei schiefen Verteilungen
ist die Interpretation des Medians. Der liegt bei schiefen Verteilungen
in der Mitte zwischen Mittelwert und Modus. Es gibt auch Verteilun-
gen, die zwei oder mehr Gipfel haben und wie ein Gebirge aussehen.
In vielen Fällen deutet eine mehrgipflige Verteilung auf unterschied-
liche Personengruppen hin, die ein Verfahren bearbeitet haben. Bei-
spielsweise ergibt sich bei einem Intelligenztest häufig eine dreigipflige
Verteilung der Messwerte, wenn man Schüler/-innen aus Hauptschu-
len, Realschulen und Gymnasien untersucht, da sich deren Intelligenz
häufig unterscheidet.

5.2.3 Streuungsmaße

Streuungsmaße von Verteilungen Neben der Beschreibung der zentralen Tendenz einer Verteilung kenn-
zeichnen auch Streuungsmaße (auch Dispersionsmaße genannt) Ver-
teilungen. Dispersionsmaße geben an, wie stark Werte um unter-
schiedliche Maße der zentralen Tendenz streuen. Wir stellen vier
5.2 · Statistisch-methodische Grundlagen für die Auswahl von Verfahren
161 5
gebräuchliche Maße vor: Spannweite, Interquartilabstand, Varianz und
Standardabweichung.
Nehmen wir an, von unseren 30 Kandidatinnen und Kandidaten Spannweite (Range)
haben wir die Messwerte der Reihe nach geordnet und bestimmen nun
den höchsten und den niedrigsten Wert. Nehmen wir an, der nied-
rigste Wert beträgt 0 und der höchste Wert 3. Damit beträgt die Spann-
weite (höchster minus niedrigster Wert): 3 – 0 = 3. Bei diskreten Werten
müsste man noch "+1" rechnen, um die Spannweite zu bestimmen.
Zur Bestimmung des Interquartilabstands ordnet man die Mess- Interquartilabstand (IQA)
werte analog wie beim Median vom kleinsten bis zum größten. Dann
bestimmt man zwei Messwerte: Der erste Messwert ist der Wert, den 25%
oder weniger der Kandidatinnen und Kandidaten erzielen, z.B. der Wert
1. Der zweite Messwert ist der Messwert, den 75% oder weniger der Kan-
didatinnen und Kandidaten erzielen, z.B. der Wert 2. Man zieht nun den
2. vom 1. Messwert ab. Die Differenz beider Messwerte kennzeichnet den
Interquartilabstand (2 – 1 = 1) und begrenzt die mittleren 50% der Kan-
didatinnen und Kandidaten in ihrer Messwertausprägung. Das heißt,
in einer Bandbreite von einem Punkt liegen die mittleren 50% der Kan-
didatinnen und Kandidaten in ihrem Wissenstestergebnis. In unserem
Beispiel würde dies bedeuten, dass die Kandidatinnen und Kandidaten
sehr nahe mit ihren Messwertausprägungen beieinander lägen.
Bei der Berechnung der Varianz werden alle Messwerte der Kandi- Varianz (SD2)
datinnen und Kandidaten vom Mittelwert abgezogen. Diese Differen-
zen werden dann quadriert und addiert, und die Summe wird durch die
Anzahl der Kandidatinnen und Kandidaten geteilt. Würde man die Abwei-
chungen der Messwerte vom Mittelwert vor dem Addieren nicht quad-
rieren, würde sich eine Summe von Null ergeben. Nehmen wir an, es sind
drei Messwerte (1, 2 und 3) erhoben worden. Teilt man nun die Summe
von 6 durch 3, ergibt sich als Mittelwert 2. Wenn wir nun vom Mittelwert
die Messwertabweichungen bilden 2 – 1 = 1 und 2 – 2 = 0 und 3 – 2 = –1,
erhalten wird eine Summe von Null: 1 + 0 + (–1) = 0. Wenn wir aber die
Werte quadrieren und addieren, erhalten wir 12 + 02 + (–1)2 = 1 + 0 + 1 = 2.
Wenn wir nun die Summe 2 durch die Anzahl der Messwerte teilen, erhal-
ten wir eine Varianz von 0.66 (= 2 / 3). Die Varianz beeinflusst viele statis-
tische Größen, z.B. die Zuverlässigkeit eines Verfahrens (7 Abschn. 5.4).
Die Standardabweichung ist die Wurzel aus der Varianz und beträgt Standardabweichung (SD)
für unser Beispiel 0.82. Die Standardabweichung ist ein wichtiger Wert,
denn er kennzeichnet die typische Abweichung der Messwerte vom Mit-
telwert. Darüber hinaus spielt die Standardabweichung eine wichtige
Rolle bei der Normierung von Tests bzw. der Interpretation normierter
Testergebnisse (7 Abschn. 5.4.5).

5.2.4 Zusammenhangsmaße

Im Folgenden gehen wir auf Maße ein, die den Zusammenhang bzw. die
Korrelation zwischen verschiedenen Messwerten, z.B. zwischen Intelli-
genz und Berufserfolg, beschreiben. Das Verständnis einer Korrelation
162 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

ist für das Verständnis von Testtheorien ebenso zentral wie die Kennt-
nis von Größen, die eine Verteilung charakterisieren. Häufig wird die
Aussagekraft eines Verfahrens und somit dessen Güte anhand von Kor-
relationen zwischen Verfahrensergebnissen einerseits und anderen
Variablen, wie Berufserfolg, andererseits dargestellt (7 Kap. 6). Bei der
Korrelation handelt es sich um einen zentralen Begriff im Rahmen der
Eignungsbeurteilung.
Korrelation (r) Es gibt viele Arten von Zusammenhängen bzw. Korrelationen. Die
Wahl des geeigneten Korrelationsmaßes hängt von bestimmten Rand-
bedingungen ab. Wir wollen an dieser Stelle das am häufigsten einge-
5 setzte Korrelationsmaß besprechen: die Produkt-Moment-Korrelation.
Eine Produkt-Moment-Korrelation (r) ist ein Maß für den linearen, sta-
tistischen Zusammenhang zwischen zwei Merkmalen. Beispielsweise
beträgt der Zusammenhang zwischen Intelligenz und beruflichem
Erfolg etwa r = 0.50 (genauer Zusammenhang 7 Kap. 6). Die Interpre-
tation des linearen Zusammenhangs lautet: Je höher die Intelligenz der
Kandidatinnen und Kandidaten ausfällt, desto höher fällt im Durch-
schnitt auch der berufliche Erfolg dieser Personen aus.
Wertebereich einer Der Wertebereich einer Korrelation liegt zwischen +1 und –1. Eine
Produkt-Moment-Korrelation Korrelation von 0 bedeutet, es besteht kein linearer Zusammenhang
zwischen zwei Messwerten. Eine Korrelation von +1 gibt an, dass ein
perfekter linearer Zusammenhang besteht. Betrüge die Korrelation zwi-
schen Intelligenz und Berufserfolg beispielsweise 1.0, wäre es mithilfe
der Kenntnis der Messwertausprägung der Intelligenz möglich, den
beruflichen Erfolg ohne einen Fehler vollständig vorherzusagen. Das ist
in der Praxis nicht möglich, die Korrelationshöhen sind kleiner als 1.0.
Eine Korrelation von –1 gibt an, dass ein perfekt negativer Zusammen-
hang besteht. Das negative Vorzeichen bedeutet Folgendes: Je größer die
Werte in dem einen Merkmal ausfallen, umso kleiner fallen die Werte
im Durchschnitt in dem anderen Merkmal aus. Salopp formuliert für
unseren Beispielzusammenhang: Je höher die Intelligenz, desto nied-
riger im Durchschnitt der berufliche Erfolg.
Kausalität und Korrelation Eine Korrelation darf nicht „kausal“ interpretiert werden. Kausali-
tät kann durch eine starke Theorie nahegelegt oder durch eine zeitliche
Abfolge erhärtet werden. Wenn wir die Variable Geschlecht mit der Abi-
turnote korrelieren, hat die Abiturnote sicherlich nicht das Geschlecht
zum Zeitpunkt der Geburt bestimmt. Das Geschlecht war von Beginn an
da. Es ist plausibler, dass das Geschlecht zu unterschiedlichen Abiturno-
ten geführt hat. Allerdings müssen auch für diese kausale Interpretation
andere Einflussgrößen, sogenannte „Drittvariablen“ oder „Mediatoren“,
als Ursache ausgeschlossen werden. Beispielsweise könnten durch das
Geschlecht unterschiedliche Stereotype bei Lehrerinnen und Lehrern
aktiviert werden, die die Benotung beeinflussen. Dies würde bedeuten,
dass nicht das Geschlecht zu Notenunterschieden führt, sondern die
Aktivierung von Stereotypen bei den Lehrerinnen und Lehrern. Der
durch die Korrelation zwischen Geschlecht und Abiturnote implizierte
direkte kausale Zusammenhang würde nicht existieren.
5.2 · Statistisch-methodische Grundlagen für die Auswahl von Verfahren
163 5

100

90

80
3XQNWHLQ,+.3UIXQJ

70

60

50

40

30
90 100 110 120 130
:,7*HVDPWZHUW

. Abb. 5.2  Darstellung einer Korrelation im Streudiagramm (aus Schmitz-Atzert &


Deter, 1993)

In . Abb. 5.2 ist eine Korrelation aus einer Arbeit von Schmidt- Beispiel einer Korrelation
Atzert und Deter (1993) als Streudiagramm grafisch veranschaulicht.
Auf der horizontalen Achse sind IQ-Werte aus dem Wilde-Intelligenz-
test zu Ausbildungsbeginn abgetragen und auf der vertikalen Achse
die Note in der IHK-Abschlussprüfung am Ausbildungsende nach drei
Jahren. Nehmen wir an, zum Bestehen der Abschlussprüfung wären
70 Punkte nötig. Jeder Punkt in der Abbildung entspricht einer/einem
Auszubildenden mit ihrem/seinem Messwert im Wilde-Intelligenz-
Test (WIT-Gesamtwert) und in der IHK-Abschlussprüfung. Insgesamt
steigt mit höherem Intelligenzmesswert auch die Durchschnittsnote an
und umgekehrt.

5.2.5 Multiple lineare Korrelation

In vielen Fällen hat man nicht nur einen Messwert (z.B. Intelligenz- Multiple lineare Korrelation
messwert), mit dem man einen anderen Messwert (z.B. Berufserfolg)
vorhersagen möchte, sondern mehrere Messwerte, z.B. Messwerte
aus Assessment Centern, Interviews und Schulnoten. Der Messwert,
der vorhergesagt werden soll, wird auch als Kriterium bezeichnet.
Die Größen, die das Kriterium vorhersagen (z.B. die Ergebnisse im
Interview oder im Intelligenztest), werden auch als Prädiktoren oder
164 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Einflussgrößen (wenn auch nicht kausal gemeint), Variablen oder mani-


feste Variablen bezeichnet. Häufig korrelieren die Prädiktoren auch
untereinander, beispielsweise Intelligenzmesswerte und Schulnoten.
Ein/Eine Eignungsdiagnostiker/-in ist daran interessiert, zu erfahren,
auf welche Prädiktoren sie/er bei der Vorhersage von beruflichem Erfolg
verzichten kann, weil ein weiterer Prädiktor dasselbe auch misst. In
diesem Fall hätte einer der Prädiktoren keine „inkrementelle Gültigkeit“
(siehe unten). Und sie/er möchte wissen, welche Prädiktoren mehr zur
Vorhersage beitragen als andere Prädiktoren. Darüber hinaus möchte
sie/er gerne erfahren, wie groß der Vorhersagebeitrag aller Prädiktoren
5 gemeinsam ist. Diese Informationen liefern ihr/ihm multiple Regres-
sionsanalysen. Über die Ergebnisse solcher Analysen wird häufig in Ver-
fahrenshinweisen berichtet. Angegeben werden meistens die multiple
lineare Korrelation (R) und standardisierte Regressionsgewichte (häufig
als β-Gewichte bezeichnet). Standardisierte Regressionsgewichte geben
die Wichtigkeit der Prädiktoren im Vergleich an: Je höher die standar-
disierten Regressionsgewichte ausfallen, desto mehr trägt ein Prädiktor
zur Vorhersage eines Kriteriums bei. Die multiple lineare Korrelation
spiegelt den Zusammenhang eines Kriteriums mit allen Prädikto-
ren wider. In der DIN (2016, S. 30) wird der Einsatz von statistischen
Optimierungsprozeduren wie der multiplen linearen Regression mit
Berichtspflichten verbunden. So sind bei multiplen Regressionsanaly-
sen neben den Regressionsgewichten und der multiplen linearen Kor-
relation (R) auch die einfachen Korrelationen mit dem Kriterium anzu-
geben. Dies stellt sicher, dass die Analysen nachvollziehbar sind und
ein Vergleich zu anderen Analysen hergestellt werden kann, in denen
nur einfache Korrelationen berichtet werden. Darüber hinaus sollten,
so wird in der DIN (2016, S. 30) formuliert, die statistischen Optimie-
rungsprozeduren in handlungsleitende Beurteilungsregeln umgesetzt
werden. „Wenn beispielsweise gezeigt wird, dass die multiple Vorher-
sagbarkeit eines Kriteriums unter Einbezug mehrerer Prädiktoren (z.B.
mehrere Skalen eines Tests) deutlich höher ist als die einfachen Kor-
relationen zwischen einzelnen Prädiktoren und diesem Kriterium, so
sollte dem Anwender erläutert werden, wie er die verschiedenen Prä-
diktoren so kombinieren/gewichten kann, dass der Vorteil praktisch
nutzbar wird.“
Kreuzvalidierung Wenn multiple lineare Regressionsanalysen als Gültigkeitsnach-
weis (siehe unten) angeführt werden, sollte nach DIN (2016, S. 30) die
Auswahl der Prädiktoren und die Höhe des multiplen linearen Zusam-
menhangs mithilfe einer erneuten Untersuchung oder mithilfe ange-
messener statistischer Methoden zusätzlich gesichert werden. Im ersten
Fall spricht man von einer Kreuzvalidierung.
Inkrementelle Gültigkeit Es wird häufig im Rahmen von Regressionsanalysen auch von inkre-
menteller Validität oder Gültigkeit eines Prädiktors gesprochen. Damit
ist beispielsweise der folgende Fall gemeint: Angenommen, sowohl
das Assessment-Center-Ergebnis als auch das Intelligenztestergebnis
werden als Prädiktoren beruflichen Erfolgs herangezogen. Die Vorher-
sage des beruflichen Erfolgs würde besser ausfallen, wenn zusätzlich
5.3 · Testtheorien: Klassische Testtheorie und Item-Response-Theorien
165 5
zu dem Assessment-Center-Ergebnis noch das Intelligenztestergeb-
nis berücksichtigt würde. Das Intelligenztestergebnis verbessert also
die Vorhersage des Kriteriums über das Assessment-Center-Ergebnis
hinaus, es ist demnach inkrementell. Nach der DIN (2016, S. 12) muss
bei der Zusammenstellung mehrerer Verfahren jedes berücksichtigte
Verfahren einen zusätzlichen Nutzen erwarten lassen. Die inkremen-
telle Gültigkeit eines Verfahrens stellt einen solchen Nutzen dar.
Die Ergebnisse der Prüfung eines Verfahrens zur Eignungsbeurtei- Stichprobenabhängigkeit der
lung hängen nicht nur von der Qualität des Verfahrens, sondern auch dargestellten statistischen Größen
von der jeweils untersuchten Gruppe ab. Die Ergebnisse, die beispiels-
weise zur Gültigkeit und Zuverlässigkeit der Messwerte an einer Gruppe
(z.B. Studierenden) gewonnen wurden, können nicht ohne Weiteres auf
eine andere Gruppe (z.B. mittleres Management) übertragen werden.

5.3 Testtheorien: Klassische Testtheorie und Item-


Response-Theorien

Mithilfe von Testtheorien lassen sich zwei wichtige Eigenschaften von


Messwerten absichern: Die statistische Eindimensionalität und die
Zuverlässigkeit eines messtheoretisch fundierten Fragebogens oder
Tests (gilt auch für Interviews und Verhaltensbeobachtung). Auf diese
beiden Eigenschaften möchten wir im Folgenden eingehen. Zunächst
soll jedoch der Begriff des Konstrukts erläutert werden.

5.3.1 Latente und manifeste Variablen

Unter dem Begriff „Eignungsmerkmal“ werden, wie in 7 Kap. 2 bereits Ein Eignungsmerkmal ist ein
erläutert, in der DIN (2016, S. 7) Qualifikationen, Kompetenzen und Konstrukt
Potenziale sowie berufsbezogene Interessen, Bedürfnisse, Werthaltun-
gen sowie Motive gefasst. An verschiedenen Stellen im Buch haben wir
bereits darauf hingewiesen, dass Eignungsmerkmale wie die Intelligenz
keine „Gegenstände“ sind, die man direkt beobachten oder vermessen
kann. Es sind gedankliche Konzepte, die aus Überlegungen und Erfah-
rungen abgeleitet worden sind, um beobachtbares Verhalten zu erklären.
In der Wissenschaft bezeichnet man solche Merkmale als „Konstrukt“.
Eine weitere, alternative Bezeichnung, die im Kontext von statistischen
Methoden genutzt wird, ist die Bezeichnung „Variable, latente Variable“.
Ein Konstrukt ist nicht direkt beobachtbar. In 7 Kap. 2 haben wir Manifeste Variablen
erläutert, wie ein Eignungsmerkmal (ein Eignungsmerkmal ist ein
Konstrukt) über beobachtetes Verhalten (z.B. Lächeln, Annäherungs-
oder Vermeidungsverhalten), physikalische Messungen (z.B. Reak-
tionszeiten) oder Selbstauskünfte (z.B. Bewertung der Aussage „Ich
bin gesellig“ auf einer mehrstufigen Ratingskala) erschlossen werden
kann. Diese Beobachtungen oder Messungen werden in der Wissen-
schaft als „manifeste Variablen“ bezeichnet. In einem messtheoretisch
fundierten Fragebogen oder Test gibt es Aufgaben oder Fragen, die
166 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

die Teilnehmer/-innen bearbeiten sollen. Diese Aufgaben oder Fragen


nennt man „Items“. Sie dienen dazu, nicht direkt beobachtbare Eig-
nungsmerkmale zu erschließen.
Eindimensionalität Innerhalb der latenten Variablen unterscheidet man reflektive und
formative latente Variablen. Reflektive latente Variablen sind statistisch
eindimensional. Die Testeigenschaft der statistischen Eindimensiona-
lität stellt sicher, dass nur eine latente Variable das Antwortverhalten
der Items erklärt. Messungen müssen statistisch eindimensional sein.
Wenn wir eine Intelligenzmessung durchführen und eine Kandidatin/
ein Kandidat ein unterdurchschnittliches Ergebnis erzielt, müssen wir
5 sicher sein, dass dieses Ergebnis nur genau eine Ursache hat und zwar
die, die im Anforderungsprofil der Stelle genannt ist, hier kognitive
Leistungsfähigkeit (Intelligenz). Ein Interpretationsproblem bei mehr-
dimensionalen Messungen würde resultieren, wenn latente Variablen,
die nicht anforderungsrelevant sind, die Messwerte und somit die Eig-
nungsbeurteilung mitbestimmen würden. Die Eigenschaft der statis-
tischen Eindimensionalität wird mit vielen Begriffen bezeichnet, die
leider nicht sehr konsistent gebraucht werden: Anstelle von statistischer
Eindimensionalität wird auch von „lokaler (stochastischer) Unabhän-
gigkeit“ oder „Homogenität“ gesprochen. Die Überprüfung der statis-
tischen Eindimensionalität erfolgt u.a. mithilfe einer konfirmatorischen
Faktorenanalyse (zur konfirmatorischen Faktorenanalyse siehe Bühner,
2011). Die statistische Prüfung der Eindimensionalität ist eine Voraus-
setzung der Zuverlässigkeitsschätzung (siehe unten).
Formative latente Variablen Neben reflektiven latenten Variablen gibt es noch formative latente
Variablen. Ein wesentlicher Unterschied besteht in der Beziehung zwi-
schen den manifesten Variablen/dem beobachtbaren Verhalten (z.B. der
Bearbeitung der Items eines messtheoretisch fundierten Verfahrens) und
der latenten Variablen. Im Fall von reflektiven latenten Variablen geht
man davon aus, dass das Itemantwortverhalten von der latenten Variab-
len vorhergesagt wird. Weil die Items eines Intelligenztests dasselbe
messen, korrelieren sie zwangsläufig miteinander. Bei formativen laten-
ten Variablen wird ein umgekehrter Zusammenhang zwischen latenten
Variablen und dem beobachtbaren Verhalten angenommen. Ein Beispiel
ist das Konstrukt „sozioökonomischer Status“. Die Items zur Messung
des sozioökonomischen Status definieren bzw. formieren das Konstrukt.
Ob Indikatoren eines Konstrukts formativ oder reflektiv sind, ergibt sich
u.a. aus der Konstruktdefinition. Wir beschränken uns im vorliegen-
den Beitrag auf reflektive latente Variablen, da sie die Grundlage für die
meisten messtheoretisch fundierten Verfahren darstellen. Für eine ver-
tiefende Betrachtung sei auf das Buch von Bühner (2011) verwiesen.

5.3.2 Klassische Testtheorie

Klassische Testtheorie In den meisten Fällen wird der Konstruktion von messtheoretisch
fundierten Fragebogen und Tests die Klassische Testtheorie (KTT)
zugrunde gelegt (Rost, 1999).
5.3 · Testtheorien: Klassische Testtheorie und Item-Response-Theorien
167 5
Um die Zuverlässigkeit eines Kennwerts bestimmen zu können, Grundannahmen der Klassischen
benötigen wir ein mathematisches Modell. Stellen wir uns dazu Testtheorie
zunächst Folgendes vor: Eine Person wird zufällig aus einer Popula-
tion von Kandidatinnen und Kandidaten entnommen. Diese Person
könnte theoretisch zu unendlich vielen verschiedenen Messzeitpunk-
ten getestet werden. Bildet man den Mittelwert dieser unendlich vielen
Messwerte, erhält man den sogenannten „wahren Wert“ der Person.
Wir testen die Person aber zufällig zu einem bestimmten dieser vielen
Messzeitpunkte und greifen einen Wert heraus.

Definition
Der Beobachtungswert einer
Der zufällig herausgegriffene Wert einer Person heißt Person setzt sich additiv aus
Beobachtungswert (X) und setzt sich additiv aus einem wahren einem wahren Wert und einem
Wert (τ, Tau) und einem Messfehler (Epsilon, ε) zusammen: Messfehler zusammen
XPerson = τPerson + εPerson

Definition
Der wahre Wert einer Person ist
Der wahre Wert (τ, Tau) einer Person auf einem Item oder in definiert als der Erwartungswert
einem Test ist als Mittelwert der Verteilung der unendlich vielen der Verteilung der unendlich
Beobachtungswerte einer einzigen Person definiert. Das heißt, vielen beobachteten Werte einer
würde man eine Person theoretisch unendlich oft hintereinander einzigen Person
testen und den Mittelwert dieser theoretischen Messwerte-
verteilung angeben, wäre das der wahre Wert der Person:
τPerson = Erw (X). Mittelwerte von theoretischen Verteilungen
werden auch als Erwartungswerte (Erw) bezeichnet.

Das Wort „wahrer Wert“ bezieht sich auf eine Größe einer hypotheti-
schen Verteilung, sodass der Wahrheitsbegriff nicht mit der „Realität“
verwechselt werden darf. Wir können eine Person nicht unendlich oft
testen, sondern in der Regel führen wie eine Messung durch. Diese ist
in der Regel messfehlerbehaftet.
Aus den Grundannahmen der beiden Definitionen ergeben sich
Folgerungen, auf die wir hier nicht eingehen, die interessierten Leser/-
innen seien hier auf das Lehrbuch von Bühner (2011) verwiesen. Das
durch die Theorie aufgestellte mathematische Grundgerüst dient dazu,
ein Zuverlässigkeitsmaß zu definieren.
Ein wichtiges Gütekriterium für Verfahren (zu den Gütekriterien Definition: Reliabilität als
siehe unten) ist die Zuverlässigkeit, auch Reliabilität genannt. In der Varianzverhältnis
DIN (2016, S. 9) wird die Zuverlässigkeit als Grad der Genauigkeit
eines Verfahrens definiert, mit dem es das gemessene Merkmal erfasst.
Die Klassische Testtheorie definiert die Reliabilität eines Messwerts
als das Verhältnis der Varianz (VAR) der wahren Werte VAR(τ) und
der Varianz der Beobachtungswerte VAR(X). Dieses Varianzverhält-
nis ergibt sich auch, wenn man die Varianz der wahren Werte VAR(τ)
168 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

durch die Summe aus der Varianz der wahren Werte VAR(τ) und der
Fehlervarianz VAR(ε) teilt: VAR(τ) / VAR(X) bzw. (VARτ) / ((VAR(X)
+ VAR(ε)).
Es stellt sich die Frage, wie wir dieses Varianzverhältnis schätzen
wollen, denn wir kennen aus den empirischen Daten nur die Varianz
der Beobachtungswerte VAR(X). Die Schätzung der Reliabilität richtet
sich nach den Modellen der Klassischen Testtheorie. Auf diese soll an
dieser Stelle nicht eingegangen werden (vgl. Bühner, 2011).
Wertebereich der Reliabilität Der Wertebereich der Reliabilität liegt zwischen 0 und 1. Je höher
der Anteil der Varianz der wahren Werte VAR(T) an der Varianz
5 der beobachteten Werte VAR(X) bei gleichbleibender Fehlervarianz
VAR(E) ausfällt, desto höher fällt auch die Reliabilität aus.
Betrachten wir zur Veranschaulichung zwei Beispiele:
55 In Beispiel 1 messen wir die Länge deutscher Autobahnen. Uns
unterläuft im Durchschnitt ein Messfehler von 10 cm. Wir haben
hier eine große Zuverlässigkeit vorliegen, da sich die wahren
Werte der verschiedenen Autobahnen sehr stark unterscheiden
und 10 cm kaum ins Gewicht fallen.
55 In Beispiel 2 veranstalten wir einen Weitsprungwettbewerb. Im
Durchschnitt unterläuft uns bei dieser Messung ein Messfehler
von 10 cm. Die Zuverlässigkeit ist unbefriedigend. Ein
Wettbewerb mit so einer ungenauen Leistungserfassung würde
keinen Spaß bereiten.

Veranschaulichung der Reliabilität Der Messfehler (10 cm) in Beispiel 2 hat sich gegenüber Beispiel 1 nicht
verändert, aber die wahren Werte der Springer liegen näher beieinan-
der als die Längen der Autobahnen. Beträgt die Reliabilität eines Mess-
werts 0.50, heißt das, dass die Unterschiede zwischen den Personen
in diesem Messwert zu gleichen Anteilen durch systematische Unter-
schiede (Varianz) und Messfehlerunterschiede (Messfehlervarianz)
bestimmt werden.
Reliabilität in konkrete Man kann mithilfe der Zuverlässigkeit den Fehler bei der Messung
Fehlerwerte umrechnen einer Person schätzen (7 Abschn. 5.4.1). Angenommen, die Reliabili-
tät eines Intelligenztests beträgt 0.70. Sofern einige weitere Annahmen
(siehe Bühner, 2011, S. 196) gelten, beträgt der Fehler bei der Messung
durchschnittlich etwa 8 IQ-Punkte. Das heißt, die Person könnte heute
bei der Testung einen IQ von 110 erzielen und morgen einen Wert von
118 und übermorgen von 102, und diese unterschiedlichen Messwerte
derselben Person könnte man alleine mit dem Fehler bei der Messung
erklären. Zur Erinnerung sei darauf hingewiesen, dass in diesem Fall,
also einer geschätzten Reliabilität von 0.7, „nur“ 30% der interindivi-
duellen Unterschiede auf Messfehler zurückgehen.
Trennschärfe Um die Eignung von Items für einen messtheoretisch fundierten
Fragebogen oder Test zu überprüfen, wird in fast allen Fällen die Trenn-
schärfe eines Items herangezogen. Die Trennschärfe ist definiert als die
Korrelation eines Items mit der Summe der restlichen Items eines Tests
oder Fragebogens. Dabei wird überprüft, ob eine höhere Ausprägung
auf einem Item auch mit höheren Ausprägungen auf den restlichen
5.3 · Testtheorien: Klassische Testtheorie und Item-Response-Theorien
169 5
Items einhergeht. Die restlichen Items können dabei als eine grobe
Schätzung für die Messwerte einer Person auf der latenten Variable
angesehen werden. Man prüft also, wie hoch ein Item mit dem Konst-
rukt zusammenhängt.
Items unterscheiden sich in ihrer Schwierigkeit oder Leichtigkeit. Itemschwierigkeit
Ein guter Test sollte, wie eine Hochsprunganlage, verschieden schwere
Items enthalten. Es wäre sehr langweilig, einen Hochsprungwettbewerb
durchzuführen, indem man zwar oft hintereinander springt, aber die
Latte immer auf 1,50 Meter hängt. In der Regel wollen wir die Ausprä-
gungen unterschiedlicher Eignungsmerkmale, z.B. Fähigkeiten und
Eigenschaften verschiedener Kandidatinnen und Kandidaten, diffe-
renzieren. Daher darf ein Test nicht zu viele leichte Items und nicht zu
viele schwere Items beinhalten. Wenn wir die Latte auf 2,20 Meter legen
und dann immer um einen Zentimeter erhöhen, erfahren wir über die
Fähigkeit eines Nicht-Olympioniken wohl wenig, ebenso, wenn wir die
Latte auf 20 Zentimeter legen. Das heißt, der Test muss uns über unsere
Kandidatinnen und Kandidaten Informationen liefern, und das setzt
unterschiedliche Itemschwierigkeiten voraus.
Die Itemschwierigkeit wird als Größe durch den Mittelwert der Ant- Quantifizierung der
worten einer Testaufgabe bestimmt. Bei Testaufgaben, die mit richtig Itemschwierigkeit
(codiert mit 1) und falsch (codiert mit 0) zu beantworten sind, ent-
spricht dies dem relativen Anteil richtig gelöster Items. Beispielsweise
lösen von 100 Kandidatinnen und Kandidaten 10 eine Aufgabe richtig.
Dann ist die Itemschwierigkeit 0.10, oder anders ausgedrückt lösen im
Durchschnitt 10% der Personen das Item. In einem Persönlichkeits-
fragebogen gibt es keine „richtigen“ oder „falschen“ Antworten. Hier
kreuzen Personen in der Regel das an, was am ehesten auf sie zutrifft.
Man spricht daher statt von Itemschwierigkeit auch von Itempopula-
rität. Hier würde für unser Beispiel eine Itemschwierigkeit/-populari-
tät bedeuten, dass dem Item 10% der Personen zugestimmt haben. Bei
Items mit mehreren Antwortkategorien (Likert-Antwortskalen) wird
also ebenfalls der Mittelwert zur Bestimmung der Schwierigkeit genutzt.
Ist die Aufgabenschwierigkeit numerisch hoch (in der KTT defi- Hohe psychometrische
nierte psychometrische Itemschwierigkeit), würde man umgangs- Schwierigkeit = leichtes Item
sprachlich von einem „leichten“ Item sprechen, d.h. viele haben die
Aufgabe gelöst oder dem Item zugestimmt.

5.3.3 Item-Response-Modelle

Item-Response-Modelle (IRT) beschäftigen sich mit der Frage, wie Ant- Item-Response-Modelle
worten auf Items erklärt werden können, und nutzen dazu explizit die
Idee latenter Variablen. Die Frage, die solche Modelle stellen, ist ganz
konkret: Von welchen Modellparametern hängt die erfolgreiche Itembe-
antwortung ab? Parameter sind dabei als Größen theoretischer Modelle
definiert und werden immer im Zusammenhang mit statistisch theore-
tischen Modellen verwendet. Betrachten wir dazu folgendes Beispiel:
Es wird nach der nächsten Zahl in der folgenden Zahlenreihe gefragt:
170 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

„2 4 6 8 10 ?“ Zur Auswahl stehen die folgenden Wahlmöglichkeiten:


„11, 12, 13 14, 15, 16“.
Rasch-Modell Im einfachsten IRT-Modell wird angenommen, dass die Itemlösung
schlicht davon abhängt, wie schwer das Item ist und wie fähig im Ver-
gleich dazu die Person ist. Das heißt, je mehr die Fähigkeit der Person
(Personenparameter) die Itemschwierigkeit (Itemparameter) übersteigt,
desto wahrscheinlicher löst eine Person ein Item. Dieses Modell wird
auch als Rasch-Modell bezeichnet. In unserem Beispiel entspricht die
Personenfähigkeit der Ausprägung einer Person auf der latenten Variab-
len, die die Itemlösung vorhersagt. Das Item erfasst vermutlich so etwas
5 wie „schlussfolgerndes Denken mit Zahlen“.
Erschöpfende Statistik im Rasch- Wenn dieses beschriebene Modell gilt, ist der Test statistisch ein-
Modell sind Personenparameter dimensional. Als erschöpfende Statistik der Personenfähigkeit werden
bzw. Logit-Werte sogenannte „Logit-Werte“ herangezogen, die auch als „Personenpara-
meter“ bezeichnet werden.
Grafischer Modelltest als häufig Ein weit verbreiteter Test für dieses Modell ist der sogenannte „grafi-
eingesetzte Modellkontrolle für sche Modelltest“, der zwar kein statistischer Test ist, aber grafisch schön
das Rasch-Modell aufzeigt, welche Items eines Tests nicht statistisch eindimensional sind.
In der am häufigsten angewandten Variante dieses Tests wird die Stich-
probe am Median des Gesamttestmesswerts geteilt, und in beiden Teil-
stichproben mit hoher und niedriger Fähigkeit werden die Itempa-
rameter geschätzt. Sind diese in beiden Stichproben nach grafischer
Inspektion in etwa gleich, geht man davon aus, dass das Rasch-Modell
gilt. In vielen Fällen werden auch statistische Modelltests zur Überprü-
fung des Rasch-Modells herangezogen. Da die Überprüfung des Rasch-
Modells große Stichprobengrößen benötigt, fallen diese oft signifikant
aus (Heene, Draxler, Ziegler & Bühner, 2011). Dies bedeutet jedoch,
dass die Annahme, dass das Rasch-Modell in der Grundgesamtheit gilt,
verworfen werden muss. Oft sind die Modellabweichungen jedoch nur
minimal. Der am häufigsten eingesetzte statistische Test zur Überprü-
fung des Rasch-Modells ist der Andersen-Likelihood-Quotienten-Test.
Birnbaum-Modell oder Nun wäre es in unserem Beispiel mit der Zahlenreihe auch möglich,
2-PL-Modell dass die latente Variable „schlussfolgerndes Denken mit Zahlen“ die
Lösung von unterschiedlichen Items eines Tests unterschiedlich gut
vorhersagen kann. In einem solchen Fall wird ein weiterer Parame-
ter für die Itemlösung angenommen, nämlich der sogenannte „Trenn-
schärfeparameter“, der für jedes Item unterschiedlich ausfallen kann,
beispielsweise für das Item „2 4 8 16 32 ?“ anders als für das Item „2 4 6
8 10 ?“ Daher wird im Rahmen des sogenannten „Birnbaum-Modells“
(2-parametrisches logistisches Modell, 2PL-Modell) ein mithilfe der
Trennschärfeparameter gewichteter Personenparameter für die Ausprä-
gung der Eigenschafts- oder Fähigkeitsausprägung angegeben, der wie-
derum eine erschöpfende Statistik der Fähigkeits- oder Eigenschaftsaus-
prägung darstellt. Das Birnbaum-Modell kann beispielsweise mithilfe
bestimmter konfirmatorischer Faktorenanalysen geprüft werden.
3-PL-Modell Schließlich könnte durch die Auswahl von mehreren Antwort-
möglichkeiten auch Raten eine Rolle spielen und damit die Richtig-
lösung von einem zusätzlichen Rateparameter abhängen. Dies wird in
5.3 · Testtheorien: Klassische Testtheorie und Item-Response-Theorien
171 5
3-parametrisches logistischen Modellen (3PL-Modellen) berücksich-
tigt. Wenn wir bei dem Item „2 4 6 8 10 ?“ die Antwortmöglichkeiten
„11, 12, 13, 14, 15, 16“ zur Auswahl vorgeben, ist die Ratewahrschein-
lichkeit, wenn man das Ergebnis nicht weiß, 1/6 (Eins durch die Anzahl
der Antwortmöglichkeiten).
Erweitert man das Modell auf sogenannte „Likert-Antwortskalen“,
sagen Item-Response-Modelle vorher, welche Antwortkategorie eine
Person wählt: Betrachten wir z.B. das folgende Item und die dazugehö-
rigen Antwortkategorien:
Ich gehe gerne aus ……… Trifft nicht zu ❶-❷-❸-❹-❺ Trifft voll
und ganz zu
Das Modell soll hier vorhersagen, ob eine Person beispielsweise
die Antwortkategorie 3 oder 4 wählt. Dafür sind nach dem Modell
die Eigenschaftsausprägung der Person (Personenparameter) und die
Antwortschwellen (Schwellenparameter) relevant. Antwortschwellen
kann man sich wie Latten auf einer Hochsprunganalage vorstellen. Sie
liegen zwischen zwei Antwortkategorien ❶-❷ oder ❷-❸ oder ❸-❹
oder schließlich ❹-❺. Je höher die Latte hängt, desto höher muss die
Eigenschaftsausprägung sein, um die darüber liegende Antwortkate-
gorie anzukreuzen.
Zusammenfassend erklären Item-Response-Modelle, durch welche Item-Response-Modelle erklären,
Parameter die Itemantworten vorhergesagt werden können, z.B. (je nach durch welche Parameter die
IRT-Modell) durch Fähigkeits- bzw. Eigenschafts-, Item-, Trennschärfe- Itemantworten vorhergesagt
oder Rateparameter. Auch die Zugehörigkeit einer Person zu einer werden können
bestimmten Klasse kann die Lösungswahrscheinlichkeit eines Items
bestimmen. Die einzelnen Parameter können mithilfe komplexer sta-
tistischer Methoden geschätzt werden. Es gibt für viele Modelle statis-
tische Modelltests, die prüfen, ob das entsprechende Testmodell in der
Grundgesamtheit verworfen werden muss. Der Vorteil der Modelltests
liegt darin, dass bei Geltung der meisten Modelle auch die Annahme
der statistischen Eindimensionalität gilt.
Im Rahmen von Item-Response-Modellen besitzen Personen- Einheiten von Personen-
und Itemparameter eine Logit-Einheit. Werte von +3 bedeuten eine und Itemparametern in
sehr hohe Fähigkeits-oder Eigenschaftsausprägung bzw. bezogen auf Item-Response-Modellen
die Itemparameter, ein sehr schweres Item (wenige Personen haben es
gelöst oder wenige Personen haben dem Item zugestimmt). Werte von
-3 bedeuten eine sehr geringe Fähigkeits- oder Eigenschaftsausprägung
bzw. bezogen auf die Itemparameter, ein sehr leichtes Item (viele Per-
sonen haben es gelöst oder viele Personen haben dem Item nicht zuge-
stimmt). Es ist hier also genau umgekehrt zur Interpretation der Item-
schwierigkeit in der Klassischen Testtheorie.
In der Klassischen Testtheorie wird angenommen, dass der Mess- Zuverlässigkeit im Rahmen von
fehler für alle Personen unabhängig von ihrer Fähigkeits- oder Eigen- Item-Response-Modellen
schaftsausprägung gleich ausfällt. Im Rahmen von Item-Response-
Modellen wird berücksichtigt, welche Information einzelne Items für
die Messung einer Fähigkeit- oder Eigenschaftsausprägung liefern.
Im Rahmen von Item-Response-Modellen kann für jede Ausprägung
einer Person ein Messfehler angegeben werden. Der Messfehler wird
172 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

ebenfalls in Logiteinheiten angegeben, beispielsweise hat eine Person


einen Personenparameter von -1 Logit und dieser einen Messfehler
von 0.3 Logits.

5.4 Gütekriterien

Im folgenden Abschnitt werden Gütekriterien besprochen, die zur


Beurteilung von Verfahren der Eignungsbeurteilung herangezogen
werden. Es sei hier kurz angemerkt, dass streng genommen nicht das
5 Verfahren über eine bestimmte Güte verfügt, sondern die Interpretation
der Messwerte (die mithilfe des Verfahrens bei einer Stichprobe unter
bestimmten Bedingungen gewonnen wurden).
Existenz von Verfahrenshinweisen Um entscheiden zu können, in welchem Ausmaß die Gütekriterien
als Qualitätskriterium erfüllt sind, bedarf es einer Vielzahl von Informationen. Nach DIN ist
genau geregelt, welche Informationen das sind und in welcher Form diese
Informationen zur Verfügung zu stellen sind. Die notwendigen Infor-
mationen müssen in Handhabungs- oder Verfahrenshinweisen stehen.
Über die Anforderungen an diese Hinweise haben wir in 7 Abschn. 4.2
bereits berichtet. Alleine die Existenz von Handhabungs- und Verfah-
renshinweisen, die die Anforderungen erfüllen, stellt somit eine not-
wendige, keinesfalls aber hinreichende Voraussetzung für Qualität dar.
Unterscheidung von Haupt- und Man unterscheidet zwei Klassen von Gütekriterien: Hauptgütekrite-
Nebengütekriterien rien wie Reliabilität (Zuverlässigkeit), Validität (Gültigkeit), Objektivi-
tät und Skalierung sowie Nebengütekriterien. Wir beschreiben hier die
Hauptgütekriterien, wovon die Skalierung bereits zu Beginn des Kapi-
tels besprochen wurde. Außerdem gehen wir auf zwei wichtige Neben-
gütekriterien ein, und zwar auf die Normierung und die Fairness. Das
Nebengütekriterium Ökonomie bezieht sich auf die Kosten und Dauer
der Datenerhebung, die im Verhältnis zum Nutzen stehen sollen. Auf
den Aspekt des monetären Nutzens gehen wir ausführlich in 7 Kap. 6
ein. Das Nebengütekriterium der Unverfälschbarkeit wird in Bezug auf
Verfahren der Verhaltensbeobachtung und -beurteilung sowie in Bezug
auf Interviews indirekt in 7 Kap. 2 und 7 Abschn. 3.1 thematisiert.

5.4.1 Zuverlässigkeit bzw. Reliabilität

Zuverlässigkeit bzw. Reliabilität Wir hatten weiter oben bereits die Zuverlässigkeit behandelt und berich-
tet, dass die Zuverlässigkeit bzw. Reliabilität in der DIN definiert ist
als Grad der Genauigkeit eines Verfahrens, mit dem es das gemessene
Merkmal erfasst. Im folgenden Abschnitt werden verschiedene Mög-
lichkeit vorgestellt, mit denen man die Reliabilität schätzen kann. Dabei
unterscheiden wir, ob es sich bei den Verfahrensergebnissen um eine
Quantifizierung (Messung der Ausprägung eines Eignungsmerkmals)
oder um eine Klassifizierung (die Kandidatin A wird als Typ X oder Y
klassifiziert) handelt. Klassifizierungen werden häufig auf der Basis von
„Typentests“ getroffen.
5.4 · Gütekriterien
173 5
In den Verfahrenshinweisen müssen, so steht es in der DIN (S. 29), Methoden der
Angaben zur Zuverlässigkeit des Verfahrens getroffen werden. Diese Reliabilitätsschätzung
Angaben müssen aus empirischen Studien abgeleitet sein. Dabei sollte
ausgeführt werden, warum welche Methode der Zuverlässigkeitsbe-
stimmung verwendet wurde. Auch die Art der genutzten Stichprobe
sowie die Bedingungen der Datenerhebung sind zu erläutern. Grund-
sätzlich gibt es nur eine Zuverlässigkeit, die auf verschiedene Arten und
Weisen geschätzt werden kann. Man unterscheidet folgende gängige
Methoden der Zuverlässigkeitsschätzung, die alle voraussetzen, dass
der Test vorher auf Eindimensionalität geprüft wurde:
55 Retest-Korrelation
55 Paralleltest-Korrelation
55 Split-Half-Korrelation
55 Interne Konsistenz, z.B. Cronbachs Alpha oder Omega
(McDonald, 1970; hier ist die Eindimensionalitätsannahme der
Items nicht zwingend erforderlich)

Wie oben bereits dargestellt, weisen Korrelationen einen Wertebereich Wertebereich der Reliabilität
von -1 bis +1 auf, Reliabilitäten per Definition aber einen Wertebereich
von 0 bis 1. Werden negative Korrelationen als Reliabilitäten geschätzt,
sind diese Null.
Eine besondere Bedeutung kommt der Retestung zu. Sofern mit Retest-Korrelation
dem Verfahren Eignungsmerkmale erfasst werden, für die eine zumin-
dest relative Zeit- und Situationsstabilität angenommen wird, sollte,
so wird in der DIN 33430 formuliert, „die Zuverlässigkeit (auch) über
die Retest-Methode bestimmt oder die Retest-Reliabilität durch einen
geeigneten Untersuchungsplan geschätzt werden“ (DIN, S. 29). Die
Retest-Korrelation oder auch Test-Retest-Korrelation wird ermittelt,
indem ein Verfahren in einem gewissen Zeitabstand denselben Per-
sonen zweimal vorgelegt wird. Wir würden annehmen, dass bei einer
messfehlerfreien Messung eines stabilen Merkmals bei der Wiederho-
lungsmessung genau der gleiche Messwert resultiert wie bei der ersten
Messung.
Bezüglich der Abweichung zwischen der ersten und zweiten Absolute Stabilität
Messung gibt es zwei Fälle zu unterscheiden. Wenn der Messwert bei
einer Wiederholungsmessung gleich hoch ausfällt wie bei der ersten
Messung, spricht man von absoluter Stabilität.
Relative Stabilität meint hingegen, dass sich der Messwert bei Relative Stabilität
allen getesteten Personen gleich verändert. Beispielsweise könnten
alle Personen, die zweimal einen Intelligenztest bearbeiten, aufgrund
von Übungseffekten bei der zweiten Messung drei IQ-Punkte besser
abschneiden als bei der ersten Messung. Wird auf jeden Wert der ersten
Messung dieselbe Zahl addiert, verändert sich der Zusammenhang
zwischen den beiden Messungen aber nicht. Die Person, die bei der
ersten Messung am besten abgeschnitten hat, steht auch bei der zweiten
Messung auf Platz 1. Man spricht von relativer Stabilität.
Bei der Paralleltest-Korrelation werden nacheinander zwei parallele Paralleltest-Korrelation
Tests einer Gruppe von Personen vorgegeben. Parallele Tests messen
174 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

das gleiche Konstrukt mit derselben Schwierigkeit gleich genau. Sie ver-
wenden sogenannte „Itemzwillinge“, z.B. „2 4 6 8 10 ?“ und „3 6 9 12 ?“.
In beiden Fällen handelt es sich um eine Zahlenreihe, bei der entweder
die Regel +2 oder +3 angewandt wird.
Split-Half-Korrelation In vielen Fällen ist es schwer, parallele Tests herzustellen, weil bei-
spielsweise das Aufgabenmaterial einzigartig ist oder aber auch für
Items eines Fragebogens keine genauen parallelen Messungen vor-
handen sind. Für die Reliabilitätsanalyse kann man dann aus einem
Test künstlich zwei parallele Testhälften bilden und den korrigier-
ten Zusammenhang beider Testhälften als Reliabilität interpretieren
5 (Split-Half-Korrelation).
Konsistenzmaße Es gibt sehr viele Koeffizienten zur Bestimmung der Konsistenz als
Schätzung der Reliabilität. Das bekannteste Maß ist Cronbachs Alpha
(Cronbach, 1951). Weniger bekannt, aber geeigneter, ist der Koeffizient
Omega. Es sei hier auch angemerkt, dass es viele weitere Reliabilitäts-
schätzungen gibt (Shavelson, Webb & Rowley, 1989). Die Bestimmung
der Konsistenz ist nach DIN (2016, S. 29) keine angemessene Art der
Zuverlässigkeitsbestimmung für Verfahren mit heterogenem Inhalten.
Damit ist gemeint, dass die Reliabilität nur für Verfahren mit reflekti-
vem Modell (siehe oben) unter der Annahme statistischer Eindimen-
sionalität sinnvoll ist. Für formative Messungen ergibt die Angabe von
Reliabilitäten anhand der internen Konsistenz keinen Sinn. Welcher
Reliabilitätskoeffizient angegeben werden muss, richtet sich nach den
Modellen der Klassischen Testtheorie. Für Item-Response-Modelle
können diese direkt in Logit-Einheiten für jeden Personenparameter
angegeben werden.
Einflussgrößen auf die Die Höhe der meisten Reliabilitätsschätzungen hängt von zwei
Reliabilitätsschätzung Größen ab: von der Testlänge und der mittleren Korrelationshöhe der
Items. Ein Fragebogen oder Test kann daher aus nur sehr wenigen, hoch
korrelierten Items bestehen und gleichzeitig eine hohe Reliabilität auf-
weisen. Ein solcher Test muss einen engen Verhaltensausschnitt messen
(z.B. „Ich gehe abends gerne aus“ und „Mir macht es Spaß, abends weg-
zugehen“). Ein Messwert kann aber auch messgenau sein, wenn der
Verhaltensausschnitt breit ist, indem er aus vielen Items besteht. Das
heißt, die Breite und Enge des Verhaltensausschnitts und die Iteman-
zahl bestimmen maßgeblich die Höhe der Reliabilitätsschätzung. Auch
der Kontext, in dem die Testung durchgeführt wurde, kann sich auf die
Reliabilität auswirken, beispielsweise Verfälschung (Ziegler & Bühner,
2009). Daher muss man die Umstände der Testung kennen, um die
Reliabilitätsschätzung beurteilen zu können. Aus diesem Grund wird
in der DIN (2016, S. 28) formuliert, dass in den Verfahrenshinweisen
Angaben getroffen werden, mit welchem Ziel der Fragebogen oder Test
im Rahmen der Reliabilitätsuntersuchung von den Teilnehmerinnen/
Teilnehmern bearbeitet wurde.
Stichprobenabhängigkeit von Nehmen wir an, wir vergleichen die Intelligenz von verschiedenen
Reliabilitätsschätzungen Auszubildenden. Eine renommierte Organisation würde entschei-
den, nur solche Kandidatinnen und Kandidaten für die Ausbildung
zu akzeptieren, die über ein Abitur verfügen. Zur Vorauswahl wird ein
5.4 · Gütekriterien
175 5
Intelligenztest eingesetzt. In diesem Fall müsste man die Reliabilität des
Intelligenztests eigentlich anhand einer Stichprobe von Abiturientin-
nen und Abiturienten schätzen. Wird die Reliabilitätsschätzung hin-
gegen mit einer Stichprobe aus Schülerinnen und Schülern aller Schul-
typen (Haupt-, Realschule und Gymnasium) vorgenommen, wird die
Reliabilität überschätzt. Grund dafür ist, dass Intelligenz und schulische
Leistung zusammenhängen. Die Intelligenz-Messwerte zwischen Gym-
nasiastinnen und Gymnasiasten (die Gruppe, die bei unserer fiktiven
Organisation an der Vorauswahl teilnimmt) werden sich weniger stark
unterscheiden (weisen eine geringere Varianz auf) als die Messwerte
zwischen Schülerinnen und Schülern aller Schularten.
Die Auswirkung der Varianz auf die Reliabilität verdeutlicht das Bei- Varianzerhöhung als Grund für die
spiel eines Intelligenztests mit 20 Items. Die Reliabilität wird anhand der Überschätzung
Split-Half-Korrelation geschätzt. Die Reliabilität wurde anhand einer
Stichprobe von jeweils 100 Schülerinnen und Schülern aus Haupt-,
Realschule und Gymnasium angegeben. In . Abb. 5.3 sehen wir das
Ergebnis. Für jede Person ist die Summe der gelösten Items (0 Punkte
pro Item, wenn Item nicht gelöst, ein Punkt pro Item, wenn Item gelöst)
in der ersten und zweiten Testhälfte dargestellt. Für jede der Punktwol-
ken in unterschiedlichen Farben ist eine Gerade angegeben. Man kann
zeigen, dass je steiler die Gerade bzw. Regressionsgerade ist, desto höher
ist der Zusammenhang zwischen beiden Testhälften. Innerhalb jeder
Schulart beträgt die Korrelation 0.50 zwischen beiden Testhälften. In
der Gesamtstichprobe liegt jedoch eine höhere Korrelation als in den
Einzelstichproben vor. Sie beträgt 0.93. Ähnlich kann sich eine derartige
künstliche Varianzerhöhung auch auf andere Korrelationsberechnun-
gen auswirken. Diese dienen wiederum als Grundlage zur Berechnung
der Zuverlässigkeit und Gültigkeit (siehe unten).
Die Zuverlässigkeit sollte für jede interessierende Stichprobe Größe der Teilstichproben
(z.B. für die Schüler/-innen unterschiedlicher Schulformen) getrennt
geschätzt werden. Zur Größe der Stichproben trifft die DIN keine

Hauptschule
Realschule
Gymnasium
Summe Items 11 bis 20

Summe Items 1 bis 10

. Abb. 5.3  Hypothetisches Beispiel zur Verdeutlichung der Auswirkung einer


künstlichen Varianzerhöhung bei der Reliabilitätsschätzung
176 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Aussagen. Huber (1973) gibt an, dass die Stichprobe im Idealfall 400
Personen umfassen sollte. Das heißt nicht, dass Zuverlässigkeitsschät-
zungen aus Stichproben, die kleiner sind, abzulehnen sind, sie sind nur
nicht so präzise.
Keine schematische Bewertung Wann sind die in Reliabilitätsschätzungen ermittelten Werte „gut“?
der Reliabilität Die DIN gibt hierzu keine Grenzwerte an, denn die bloße numerische
Höhe der Zuverlässigkeit ohne Berücksichtigung anderer wichtiger
Gütekriterien sowie ohne Berücksichtigung der Qualität der zugrunde
liegenden empirischen Untersuchung ist nicht aussagekräftig. Für die
Betrachtung von einzelnen Kandidatinnen und Kandidaten gilt jedoch:
5 Je höher die Zuverlässigkeit, desto besser. Sehr gute Werte liegen über
0.90. Aber auch eine solche Höhe kann je nach diagnostischer Frage-
stellung zu wenig sein.

Praxistipp

Unser Praxistipp ist es, die Zuverlässigkeit in einen Standard-


messfehler umzurechnen:

VAR ( X ) ⋅ 1− REL = Standardmessfehler


Nehmen wir an, die Varianz für einen Intelligenztest betrage
225 und Reliabilitätsschätzungen für verschiedene Tests jeweils
0.70, 0.80 und.90 und.95, welche Standardmessfehler resultieren
daraus?

225 ⋅ 1− .70 = 8.2

225 ⋅ 1− .80 = 6.7

225 ⋅ 1− .90 = 4.8

225 ⋅ 1− .95 = 3.4

Es wird deutlich, wie stark sich die unterschiedliche


Zuverlässigkeit der Messwerte auf den Messfehler auswirkt. Jeder
Anwender muss in Abhängigkeit der Fragestellung entscheiden,
welchen Messfehler er für die Auswahlentscheidung tolerieren
möchte. Dieses Beispiel zeigt auch auf, dass bei einer hohen
Zuverlässigkeit immer noch ein Messfehler von 3.4 IQ-Punkten
resultiert. Das bedeutet: Wird eine Person heute getestet, kann
sie einen Wert von 110 erzielen und morgen von 113 und
übermorgen von 107, und diese Werte wären alleine mit dem
Fehler bei der Messung zu erklären.

Klassifikation und deren Häufig findet man in der Eignungsdiagnostik Verfahren, mit deren Hilfe
Gütemaßstäbe man Kandidatinnen und Kandidaten in verschiedene Klassen einteilen
kann, z.B. sogenannte „Typentests“. Dies ist prinzipiell möglich, aller-
dings muss die Anzahl der aus einem Test resultierenden Typen oder
Klassen empirisch, also anhand von Daten und geeigneten Analysen,
5.4 · Gütekriterien
177 5
nachgewiesen werden. Geeignete Methoden sind hierfür beispielsweise
die Clusteranalyse oder Mixed-Rasch-Modelle. So ist bei einem Typen-
test darauf zu achten, dass solche Analysen zwingend in den Verfah-
renshinweisen aufgeführt werden. Selbst diese Analysen liefern in der
Praxis nie eine eindeutige exakte Zuordnung zu einem Typ, sondern
eine Zuordnung, die am plausibelsten ist.
Zu einem Typentest sollten Kennwerte vorliegen, die die Stabilität Stabilität von Typen
der Typen nachweisen (vgl. Retest-Korrelation), beispielsweise Cohens
Kappa. Die häufig angegebene prozentuale Übereinstimmung zwischen
zwei Messzeitpunkten ist nicht ausreichend, da bei dieser Berechnung
nicht für zufällige Übereinstimmungen korrigiert wird. Nehmen wir an,
100 Personen werden am Tag X mit einem Typentest untersucht, der
in zwei Typen einteilt, und dann ein Jahr später erneut. Dabei würde
sich herausstellen, dass die Stabilität des Typs 50% beträgt. Das heißt, in
50% der Fälle ist eine Person, die zu Zeitpunkt X getestet wurde, wieder
derselbe Typ und in 50% der Fälle ein anderer Typ. Ein solches Ergeb-
nis würde man auch erzielen, wenn man eine Münze geworfen hätte.

5.4.2 Konfidenzintervalle und der Vergleich der


Ergebnisse verschiedener Kandidatinnen und
Kandidaten

Wenn man den im Beispiel oben (7 Praxistipp) ermittelten Wert des Konfidenzintervall
Standardmessfehlers von 3.4 IQ-Punkten mit 1.96 multipliziert, erhält
man ein sogenanntes „Konfidenzintervall“ (auch Vertrauensintervall“
genannt). Der Wert 1.96 steht für eine Sicherheitswahrscheinlichkeit
von 95%. Es handelt sich um einen sogenannten „z-Wert“ aus der Stan-
dardnormalverteilung, mit dessen Hilfe eine beliebige Sicherheitswahr-
scheinlichkeit angeben werden kann, z.B. 1.64 für 90% oder 1.24 für
80%. Bleiben wir bei dem Denkmodell, eine Person unendlich oft hin-
tereinander zu testen. Wir würden dann für jede Messung einen Beob-
achtungswert und auch andere Grenzen des Vertrauensintervalls erhal-
ten. Die Sicherheitswahrscheinlichkeit von 95%, die wir gewählt haben,
würde für diese unendlich vielen Vertrauensintervalle einer einzelnen
Person bedeuten, dass 95% von diesen unendlich vielen Vertrauens-
intervallen den wahren Wert der Person enthalten. Hier ist die entspre-
chende Formel dargestellt.

KonfidenzintervallGrenzeoben, unten =

x ± VAR ( X ) ⋅ (1− REL) ⋅1.96

Anzumerken ist, dass die hier verwendete Sicherheitswahrscheinlich-


keit von 95% in vielen Fällen nicht zwingend die beste Wahl ist. Die
Wahl der Sicherheitswahrscheinlichkeit sollte am besten immer einer
Abwägung von Kosten und Nutzen der auf dem Konfidenzintervall
basierenden Entscheidung folgen (Ziegler & Bühner, 2012).
178 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Vergleich der Ergebnisse zweier In der Eignungsdiagnostik sind häufig Vergleiche zwischen Perso-
Personen nen relevant. Auch hier muss berücksichtigt werden, dass Messwerte
zweier Kandidatinnen und Kandidaten sich auch aufgrund von Mess-
fehlern zufällig unterscheiden können. Mithilfe einer sogenannten „kri-
tischen Differenz“ kann entschieden werden, in welchem Ausmaß Unter-
schiede zwischen beispielsweise zwei Kandidatinnen und Kandidaten
durch Messfehler bedingt sein können. Dabei ist zu beachten, dass in
beiden Messungen ein Fehler unterläuft und sich damit der Messfehler
beim Vergleich der beiden Personen zweifach bemerkbar macht (daher
multiplizieren wir unter der Wurzel mit 2). Nehmen wir an, wir haben
5 mehrere Kandidatinnen und Kandidaten. Der beste Kandidat sei Herr
Sokrates, er erzielt einen IQ-Wert von 125 (die Varianz betrage, wie oben,
225 und die Reliabilität .95). Wir wollen nun abschätzen, ab welcher
Differenz sich eine andere Kandidatin/ein anderer Kandidat von Herrn
Sokrates unterscheidet, ohne dass wir davon ausgehen müssen, dass der
Messfehler für die Unterschiede verantwortlich ist. Die Formel für den
Messfehler mit den entsprechenden Werten lautet:

225 ⋅ 2 ⋅ (1 − .95) = 4.7

Das heißt, unter Berücksichtigung des Messfehlers müssen wir davon


ausgehen, dass eine Person mit einem IQ von 122 ebenso intelligent sein
kann wie eine Person mit einem IQ von 125. Würde man den Wert mit
1.96 multiplizieren, erhielte man die kritische Differenz mit einer Sicher-
heitswahrscheinlichkeit von 95%, also 9.4 Punkten. Das heißt, wir gehen
erst ab einer Differenz von 9.4 Punkten davon aus, dass wirklich ein über-
zufälliger Unterschied zwischen zwei Personen in der Intelligenzmes-
sung mit der gewählten Sicherheitswahrscheinlichkeit von 95% besteht.

5.4.3 Gültigkeit bzw. Validität

Theoretische Fundierung Die DIN (2016) positioniert – in Anlehnung an das Testbeurteilungssys-


tem des Diagnostik- und Testkuratoriums (TK, 2010) – die theoretische
Fundierung als eines der zentralen Gütemerkmale von messtheoretisch
fundierten Fragebogen und Tests (7 Abschn. 4.2). Dies kann man so
interpretieren, dass aus den Verfahrenshinweisen klar abgeleitet werden
muss, in welchem Ausmaß der Fragebogen oder der Test theoriegeleitet
entwickelt wurde, in welchem Ausmaß die Theorie mithilfe der Items
umgesetzt wurde und wie aus der Theorie das Itemmaterial abgeleitet
wurde. Dies bedeutet nichts anderes als dass dargelegt wird, wie sich
Unterschiede in der latenten Variable in den Items manifestieren, also
das sogenannte „nomologische Netz“ (siehe unten) des zu messenden
Konstrukts definiert werden muss (Cronbach & Meehl, 1955; Kemper,
Ziegler, Krumm, Heene & Bühner, 2015). Die Gültigkeit der Theorie
ist mit Literatur und/oder empirischen Untersuchungen zu belegen.
Validität bzw. Gültigkeit Unter Validität bzw. Gültigkeit wird in der DIN (2016, S. 7) Fol-
gendes verstanden: Das „Ausmaß, in dem Interpretationen von
5.4 · Gütekriterien
179 5
eignungsdiagnostischen Informationen zutreffend sind. Bei der Über-
prüfung der Gültigkeit wird mittels verschiedener Methoden beurteilt,
wie angemessen die Interpretationen der Informationen sind, die mit
einem Verfahren erhoben werden.“ Dabei müssen laut DIN (2016, S. 30)
in den Verfahrenshinweisen Angaben zur Gültigkeit mithilfe empiri-
scher Studien abgeleitet werden. Denn erst die Gültigkeit eines Mess-
werts, der für eine bestimmte Anforderung nachgewiesen ist, recht-
fertigt dessen Einsatz bzw. dessen Verwendung. Es wird in der DIN
(DIN, 2016, S. 30) darüber hinaus Folgendes gefordert: „Aus den Ver-
fahrenshinweisen muss deutlich werden, welche empirischen Nach-
weise der Inhalts- und/oder Kriteriums- und/oder Konstruktgültigkeit
eine Anwendung des Verfahrens bzw. der Verfahrensklasse für den laut
Verfahrenshinweise intendierten Anwendungszweck des Verfahrens
rechtfertigen.“ Wir besprechen die verschiedenen Validierungsstrate-
gien im Folgenden.
Zur Sicherung der Inhaltsgültigkeit bzw. Inhaltsvalidität muss nach- Inhaltsgültigkeit
vollziehbar angegeben werden, warum die Items für die Messung eines
Konstrukts herangezogen werden. Dazu ist der Gegenstandsbereich des
Fragebogens/Tests genau zu definieren und die Ableitung der Items aus
dem theoretischen Modell darzustellen. Jedes Item muss sich aus seinem
Inhalt heraus für die Messung des Konstrukts rechtfertigen. Die Anzahl
der Items richtet sich u.a. nach der Breite des abzubildenden Gegen-
standsbereichs sowie nach der gewünschten Zuverlässigkeit.
Es ist kritisch, wenn Items nur auf Basis von statistischen Analysen Problematisch: Elimination
aus einem nach dem Prinzip der Inhaltsvalidität konstruierten Frage- von Items aufgrund niedriger
bogen/Test entfernt werden. Das Eliminieren von Items aufgrund des Trennschärfen
Vorliegens niedriger Trennschärfen (z.B. < 0.30) ist nicht sinnvoll. Das
Item wurde zuvor aus theoretischen Erwägungen heraus ausgewählt,
daher bedeutet der Verlust eines Items einen Verlust an Inhaltsgültig-
keit. In vielen Fällen ist ein Umformulieren eines solchen Items eher
angebracht.
Fügt man aufgrund niedriger Reliabilitätsschätzungen gleichlau- Problematisch: Auffüllen der
tende Items zu einem Fragebogen/Test hinzu, wird ebenfalls die Inhalts- Items eines Fragebogen/Tests mit
gültigkeit deutlich reduziert. Diese Items führen dann zwangsweise gleichlautend formulierten Items
durch ihre hohe Korrelation mit anderen identisch formulierten Items
zu hohen Trennschärfen und damit auch zu hohen Reliabilitätsschät-
zungen. Mit diesem Vorgehen werden die Inhaltsgültigkeit und zusätz-
lich die Eindimensionalität gefährdet. Ein guter Hinweis auf die Inhalt-
gültigkeit eines Fragebogen/Tests ist ein entsprechendes Kapitel in den
Verfahrenshinweisen und darüber hinaus.
Wird ein Test entwickelt, ist es wichtig, das nomologische Netz des Konstruktgültigkeit
Tests darzulegen und an das zu messende Konstrukt angrenzende oder
überlappende Konstrukte zu untersuchen. Wenn wir beispielsweise
einen Test zur Messung fluider Intelligenz für die Eignungsbeurteilung
entwickeln wollen, sollten in den Studien zur Konstruktgültigkeit nicht
nur die fluide Intelligenz, sondern mithilfe anderer Tests auch Wissen,
Gedächtnis und Konzentration erfasst werden, denn diese Konzepte sind
nach gängigen Intelligenzmodellen angrenzende Konzepte zur fluiden
180 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Intelligenz (z.B. CHC-Modell der Intelligenz; McGrew, 2009). Gleich-


zeitig könnten wir den IST 2000 R (Liepmann, Beauducel, Brocke &
Amthauer, 2007) mitlaufen lassen, da es sich bei diesem Test um einen
etablierten Test zur Messung fluider Intelligenz handelt. Man bezeichnet
Tests, die denselben Messanspruch haben, als konvergente Verfahren.
Durch das Berechnen der Korrelation zwischen den beiden Testverfah-
ren wird die konvergente Gültigkeit geprüft. Wir würden wahrschein-
lich als Konzentrationstest den Test d2 (Brickenkamp, Schmidt-Atzert &
Liepmann, 2010) und als Merkfähigkeitstest und Wissenstest die ent-
sprechenden Tests aus dem IST 2000 R heranziehen. Es handelt sich bei
5 den Tests, die einen anderen Messanspruch besitzen als unser konst-
ruiertes Verfahren, um divergente bzw. diskriminante Verfahren zur
Prüfung der divergenten bzw. diskriminanten Gültigkeit.
Konstruktgültigkeit als Summe Die Gültigkeitsprüfung bezieht sich nicht auf einzelne Daten der
von Validierungsstrategien Prüfung, sondern auf die Gesamtheit der Aussagen. Das heißt, die Test-
autorinnen und -autoren stellen vor der Untersuchung Hypothesen auf,
der zufolge beispielsweise die Korrelationen mit den konvergenten Tests
höher ausfallen sollten als mit diskriminanten Tests. Dieses Hypothesen-
paket sollte dann durch empirische Untersuchungen im Gesamten vorlie-
gen, damit von Konstruktgültigkeit gesprochen werden kann (Campbell &
Fiske, 1959). Die Autorinnen und Autoren der DIN (2016, S. 31) fordern,
dass die Testautorinnen und -autoren „inhaltliche Überlegungen“ anstel-
len und darlegen sollen, wie die konvergente und diskriminante Vali-
dierung vorgenommen werden kann. Die entsprechenden empirischen
Ergebnisse sind laut DIN (ebd.) in den Verfahrenshinweisen festzuhalten.
Kriteriumsgültigkeit Unter Kriteriumsgültigkeit versteht man den Nachweis, dass das
aus einem eignungsdiagnostischen Verfahren abgeleiteten Ergebnis mit
einem relevanten Kriterium „aus dem wirklichen Leben“ in substanziel-
ler Beziehung steht. Dabei muss das Kriterium nachweislich dem Ein-
satzbereich des Verfahrens entsprechen. Mögliche Kriterien werden in
7 Kap. 6 ausführlich beschrieben. In der DIN (2016, S. 31) wird gefor-
dert, dass in den Verfahrenshinweisen beschrieben wird, warum das
in der Analyse jeweils verwendete Kriterium angemessen ist und, wie
es seinerseits valide erfasst wird. Auch bei der Prüfung der Kriteriums-
gültigkeit sollten explizite Hypothesen über die vermuteten Zusam-
menhänge vorliegen.
Generelle Anmerkungen zur Für die Gültigkeit (und übrigens auch für die Reliabilität) sollte der
Gültigkeit aktuellste Nachweis für den intendierten Anwendungsbereich jünger als
acht Jahre sein (DIN, 2016, S. 30). Aus den Verfahrenshinweisen muss
ersichtlich sein, ob die Gültigkeit für alle Messwerte eines Verfahrens
gelten oder nur für Teile (z.B. in einem Konzentrationstest die relative
Fehlerhäufigkeit oder die Anzahl korrekt bearbeiteter Items).
Kontext bei der Bei der Beurteilung von Gültigkeitsnachweisen ist, wie bei Relia-
Gültigkeitsprüfung beachten bilitätsschätzungen, auf den Kontext zu achten. So ist beispielsweise
zu fragen, ob die Gültigkeit der aus einem Test abgeleiteten Aussagen
gleichermaßen gültig (valide) ist, wenn der Fragebogen/Test unter Aus-
wahlbedingungen durchgeführt wurde oder wenn er anonym und „nur
zum Spaß“ bearbeitet wurde. Es gibt Hinweise in der Literatur, dass
5.4 · Gütekriterien
181 5
sich beispielsweise sozial erwünschte Antworten bei Persönlichkeits-
fragebogen auf die Konstruktgültigkeit auswirken können (vgl. Ziegler
& Bühner, 2009). Weiterhin sind bei der Gültigkeitsbewertung unbe-
dingt Grund- und Selektionsquote zu berücksichtigen. Dies wird in
7 Kap. 6 genau erläutert.
In vielen Fällen werden die Korrelationen zwischen einem Messwert Korrekturen bei der Interpretation
eines Tests und einem Kriterium statistisch aufgewertet oder korrigiert. beachten
Die beiden häufigsten Korrekturen sind die sogenannten „Minderungs-
korrektur“ sowie die Korrektur aufgrund eingeschränkter Varianz.
Stellen wir uns vor, eine Organisation führt eine Studie zur Krite-
riumsgültigkeit durch. Die unter Gesichtspunkten der Kriteriumsgültig-
keit zu prüfende Personalauswahl sieht wie folgt aus: Zu Beginn werden
viele Kandidatinnen und Kandidaten getestet. Durch das Abgleichen mit
bestimmten Grenzwerten wird die Anzahl der ursprünglichen Kandida-
tinnen und Kandidaten reduziert. Nur Personen aus der Gruppe von Per-
sonen, die einen bestimmten Grenzwert erreichen, werden eingestellt.
Lediglich von den eingestellten Kandidatinnen und Kandidaten liegen
bei der Studie zur Kriteriumsgültigkeit die Messwerte der Tests und der
Kriterien (z.B. einer Vorgesetztenbeurteilung) vor. Nur für diese Gruppe
können wir die Zusammenhänge zwischen Testergebnis (z.B. Eignungs-
aussage) und Kriterium (Vorgesetztenbeurteilung) bestimmten.
Korrelationen sind abhängig von der betrachteten Stichprobe.
Durch die getroffene Auswahl (nur ein Teil aller Kandidatinnen und
Kandidaten wird betrachtet) reduziert sich die Varianz der Messwerte
in der verbliebenen Stichprobe gegenüber der Ausgangsstichprobe mit
allen Kandidatinnen und Kandidaten. Man spricht von einer Varianz-
einschränkung. Diese Varianzeinschränkung reduziert potenziell auch
die Korrelation zwischen den Messwerten und dem Kriterium und
damit die Kriteriumsgültigkeit.
Die Kriteriumsgültigkeit würde so unterschätzt. Um dies zu berück- Varianzeinschränkung
sichtigen, stehen Korrekturformeln zur Verfügung. Diese kommen
zumeist auch bei der metaanalytisch bestimmten Kriteriumsgültigkeit
zum Einsatz, wie in 7 Kap. 6 dargestellt wird. In den Verfahrenshinweisen
müssen laut DIN 2016 (S. 30) sowohl unkorrigierte als auch korrigierte
Werte angegeben werden, falls eine Korrektur vorgenommen wurde.
Eine perfekt genaue Messung gibt es in der Eignungsdiagnostik nicht. Minderungskorrektur
Daher sind alle Zusammenhänge, die wir empirisch finden können,
kleiner oder geringer als unter Bedingungen, in denen eine perfekte
Messung möglich wäre. Ist man an den sogenannten „wahren“ bzw.
„fehlerfreien“ Zusammenhängen der Konstrukte interessiert, können
diese mithilfe von Minderungskorrekturen geschätzt werden (Loevin-
ger, 1954). Dabei unterscheidet man einfache und doppelte Minde-
rungskorrekturen. Korreliert man beispielsweise die Ergebnisse in einem
Eignungstest (als Prädiktor) mit Vorgesetztenbeurteilungen (als Krite-
rium), die auf Basis statistisch eindimensionaler Skalen ermittelt wurden,
können Zuverlässigkeitsschätzungen sowohl für den Prädiktor als auch
für das Kriterium vorgenommen werden. So kann man bei der Schät-
zung des „wahren“ Zusammenhangs beide Zuverlässigkeitsschätzungen
182 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

berücksichtigen (doppelte Minderungskorrektur). Korreliert man hin-


gegen die Messwerte eines Eignungstests mit den Stückzahlen im Verkauf,
sind Stückzahlen bereits perfekt genau gemessen, und man wird bei der
Schätzung des wahren Zusammenhangs nur die Reliabilität des Messwer-
tes im Eignungstest berücksichtigen (einfache Minderungskorrektur).
Auch hier müssen laut DIN 2016 (S. 30) immer die einfachen Korrela-
tionen und die minderungskorrigierten Korrelationen unter Hinweis auf
die verwendete Methode der Minderungskorrektur angegeben werden.
Gültigkeitsgeneralisierung Die Übertragbarkeit oder Generalisierung von Gültigkeitsuntersu-
chungen aus Untersuchungen anderer Autorinnen und Autoren oder
5 aus Metaanalysen sollte laut DIN (2016, S. 30 f.) begründet werden.
Metaanalysen fassen viele Untersuchungen zusammen. Sie schätzen
beispielsweise Zusammenhänge zwischen beruflichem Erfolg und Intel-
ligenz auf Basis einer Vielzahl empirischer Studien (vgl. Schmidt &
Hunter, 1998; 7 Kap. 6).

5.4.4 Objektivität

Durchführungsobjektivität In der DIN (2016, S. 8) wird Objektivität definiert als „Grad, in dem
die mit einem Verfahren zur Eignungsbeurteilung erzielten Ergebnisse
unabhängig vom (verantwortlichen) Eignungsdiagnostiker und/oder
seinen Beobachtern sowie von weiteren irrelevanten Einflüssen sind“.
Dabei werden Durchführungs-, Auswertungs- und Interpretationsob-
jektivität unterschieden. Die Durchführungsobjektivität für den Fall,
dass Verfahren durch Personen durchgeführt werden, wurde bereits
in 7 Kap. 1 thematisiert. Auf die Besonderheiten der Durchführungs-
objektivität bei der Durchführung der Verfahren am Computer wurde
in 7 Abschn. 4.2 eingegangen. Dabei wurde insbesondere das Ausmaß
Kontrolle über die Testung thematisiert.
Auswertungsobjektivität Unter Auswertungsobjektivität versteht man, dass jede Person, die
mit der Auswertung beauftragt ist, bei ein und derselben teilnehmen-
den Person dasselbe Ergebnis feststellt. Dazu ist es notwendig, dass die
Auswertungsregeln im Vorhinein festgelegt werden.
Interpretationsobjektivität Nachdem ein Verfahren sachgerecht durchgeführt und ausgewer-
tet wurde, liegen personenbezogene Messwerte für das Verfahren vor.
Diese müssen noch interpretiert werden. Beispieltexte in den Handha-
bungs- oder Verfahrenshinweisen können zur Sicherung der Interpre-
tationsobjektivität beitragen.

5.4.5 Norm- und kriteriumsorientierte Messungen


und Ergebnisrückmeldung

Normorientierung Die Normierung eines messtheoretisch fundierten Fragebogens oder


Tests ist immer dann nötig, wenn bei der Interpretation der Ergebnisse
eine Gegenüberstellung mit einer Vergleichsstichprobe angestrebt wird.
Die Normwerte erleichtern die Interpretierbarkeit von Testergebnissen.
5.4 · Gütekriterien
183 5
In der DIN (2016, S. 29) werden Anforderungen an eine norm- Anforderungen an eine
orientierte Diagnostik formuliert. Die Normwerte sollten nicht älter Normstichprobe
als acht Jahre sein und spätestens dann auf ihre Aktualität hin über-
prüft werden. Normstichproben sollten möglichst repräsentativ für die
Gruppe sein, für die das Verfahren laut Verfahrenshinweisen einge-
setzt werden soll. In den Verfahrenshinweisen muss die Zusammen-
setzung der Gruppe, an der die Normdaten gewonnen wurden, nach
Alter, Bildung und anderen für die Ausbildung oder den Beruf relevan-
ten Variablen beschrieben sein.
Normen sind jedoch nicht bei allen eignungsdiagnostischen Ent- Kriteriumsorientierung
scheidungen sinnvoll anwendbar. Nehmen wir die Prüfung der Kennt-
nisse von Pilotinnen und Piloten als Beispiel. Diese müssen alle „Knöpfe“
im Cockpit kennen. Wir können hier nicht normorientiert vorgehen
und berichten, ob sie/er verglichen mit anderen eher mehr oder weniger
Knöpfe kennt. Stattdessen ist ein kriteriumsorientiertes Vorgehen not-
wendig. Bei einer kriteriumsorientierten Testung werden vorab Werte
festgelegt, ab wann eine bestimmte Anforderung als erfüllt gilt. Diese
Festlegungen können Expertinnen und Experten treffen, oder die Kri-
teriumswerte werden durch geeignete empirische Analysen ermittelt.
Die meisten Eignungsmerkmale werden als normalverteilt ange- Normalverteilung als
nommen. Eine Normalverteilung ist eine symmetrische Verteilung. Sie Normierungsgrundlage
kann mithilfe ihres Mittelwerts und ihrer Standardabweichung voll-
ständig beschrieben werden. Innerhalb von zwei Standardabweichun-
gen links und rechts vom Mittelwert liegen etwa 95% der Personen mit
ihren Messwerten. Innerhalb von einer Standardabweichung links und
rechts um den Mittelwert liegen etwa 68% der Personen mit ihren Mess-
werten. Letztere Eigenschaft wird als Definition des Durchschnitts her-
angezogen. In . Abb. 5.4 sind gebräuchliche Normen mit Mittelwerten
und Standardabweichungen angegeben.
Liegt das Konfidenzintervall des Messwerts einer Person innerhalb Kategorien bei der
einer Standardabweichung um den Mittelwert, wird die Leistung oder Ergebnisrückmeldung

unter-
durchschnittlich überdurchschnittlich
/auffällig Durchschnitt
/auffällig

2% 34% 34% 2%
14% 14%

-3s -2s -1s X +1s +2s +3s Rohwerte


-3 -2 -1 0 +1 +2 +3 z-Werte
20 30 40 50 60 70 80 T-Werte
55 70 85 100 115 130 145 IQ-Werte
70 80 90 100 110 120 130 SW- Werte
-1 0 -1 2 3 4 5 6 7 8 9 10 11 C-Werte
1 2 3 4 5 6 7 8 9 Stanine-Werte

. Abb. 5.4  Gebräuchliche Normwerte (aus Bühner, 2011, S. 190)


184 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Eignungsmerkmalsausprägung dieser Person als „durchschnittlich“


beurteilt. Dabei gehören die Grenzen des Intervalls zum Durchschnitts-
bereich dazu. In dem Text der DIN (2016) finden sich keine Vorgaben
zu den Bezeichnungen oder Grenzbereichen einzelner Wertebereiche.
In der Praxis hat sich aber die folgende Konvention etabliert: Liegt das
Konfidenzintervall über einer Standardabweichung über dem Mittel-
wert, wird die Leistung als überdurchschnittlich bezeichnet. Liegt das
Konfidenzintervall eine Standardabweichung unter dem Mittelwert,
wird die Leistung als unterdurchschnittlich bezeichnet. Überschnei-
det sich das Konfidenzintervall mit dem Durchschnittsbereich, werden
5 die Bezeichnungen „unterdurchschnittlich bis durchschnittlich“ oder
„durchschnittlich bis überdurchschnittlich“ verwendet. Sollte, unab-
hängig von den gerade genannten Regeln, der Mittelwert des jeweili-
gen Normwerts in das Konfidenzintervall fallen, ist die Fähigkeits- oder
Eignungsmerkmalsausprägung als durchschnittlich zu klassifizieren.
Diese Kategorien sind in der . Abb. 5.5 veranschaulicht.
Keine Pseudogenauigkeit Viele Praktikerinnen und Praktiker wenden angesichts dieser Kon-
vention ein, dass diese Art der Rückmeldung für einen Messwert enttäu-
schend sei, wenn man doch den konkreten Messwert ebenfalls angeben
könne. Aus dem Abschnitt über Konfidenzintervalle geht jedoch hervor,
dass selbst bei einer hohen Reliabilität von 0.95 ein Konfidenzintervall

85 100 115

85 100 115

85 100 115

85 100 115

85 100 115

. Abb. 5.5  Klassifikation von Normwerten am Beispiel von IQ-Normwerten in


fünf Kategorien (aus Bühner, 2011, S. 187)
5.4 · Gütekriterien
185 5
resultiert, das 6.7 IQ-Punkte (bei einer Sicherheitswahrscheinlichkeit
von 95%) um den beobachteten Wert liegen kann. Daraus wird deutlich,
dass eine Rückmeldung des vermeintlich „exakten“ Einzelwertes pseu-
dogenau ist und wenig sinnvoll erscheint. Es ist möglich, zusätzlich zu
dem Bereich (z.B. „unterdurchschnittlich“) auch den exakten Wert zu
benennen und die obere und untere Intervallgrenze anzuführen. Von
zentraler Bedeutung ist jedenfalls die in der DIN (2016, S. 20) in Bezug
auf messtheoretisch fundierte Verfahren aufgestellte Forderung, bei
der Interpretation von Verfahrensergebnissen wie auch bei der Inter-
pretation von Messwertdifferenzen den jeweiligen Messfehler und die
entsprechenden Konfidenzintervalle zu berücksichtigen.

Praxistipp

Nehmen wir an, eine Person (24 Jahre alt) hätte einen IQ von Beispiel einer
110 im Modul „Schlussfolgerndes Denken“ des Intelligenz-Struk- Ergebnisrückmeldung
tur-Test 2000 R erzielt. Die Grenzen des Konfidenzintervalls bei
einer Reliabilität von 0.94 und einer Sicherheitswahrschein-
lichkeit von 95% reichen dann von 103.8 bis 118.2. Die Ergebnis-
rückmeldung würde wie folgt vorgenommen werden: „Herr Müller
erzielte im Intelligenz-Struktur-Test 2000 R (Liepmann, Beauducel,
Brocke & Amthauer, 2007) im Modul ‚Schlussfolgerndes Denken‘
im Vergleich zu 21- bis 25-jährigen Gymnasiastinnen und
Gymnasiasten ein durchschnittliches bis überdurchschnittliches
Ergebnis.“

5.4.6 Fairness

In der DIN (2016, S. 18) findet sich folgende Forderung: „Die Anwen- Fairness
dung der Verfahren zur Eignungsbeurteilung darf nicht zu einer
Benachteiligung oder Bevorzugung einzelner Kandidaten oder Gruppen
führen. Insbesondere ist darauf zu achten, dass keine Eigenschaften,
Kenntnisse, Fertigkeiten oder Fähigkeiten das Ergebnis beeinflussen, die
nicht zum zu erfassenden Eignungsmerkmal gehören und zugleich bei
der Zielgruppe des Verfahrens unterschiedlich ausgeprägt sein können
(z.B. Sprachkenntnisse, sofern diese nicht mit dem Verfahren erfasst
werden sollen.)“ In diesem Kontext wird in der DIN (ebd.) auch der
Umgang mit Kandidatinnen und Kandidaten behandelt, die besonderer
Hilfen bedürfen (z.B. Personen mit Behinderungen, z.B. einem einge-
schränktem Seh- oder Hörvermögen). Einerseits müssen diese Personen
nach ihren spezifischen Bedürfnissen in Bezug auf die Eignungsuntersu-
chung befragt werden. Das ursprünglich geplante Verfahren sollte dann
entsprechend angepasst werden – falls das fachlich vertretbar und ohne
Ergebnisverfälschung möglich ist –, oder es sollten alternative Verfah-
ren zur Eignungsbeurteilung verwendet werden. Andererseits betonen
die Autorinnen und Autoren der DIN (2016, S. 19), dass nur solche
186 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Einschränkungen Berücksichtigung finden, die sich negativ auf die Ver-


fahrensbearbeitung auswirken und gleichzeitig irrelevant für das mit
dem Verfahren erfasste Eignungsmerkmal sind. Hierzu findet sich in
der DIN (2016, S. 19) das Beispiel, dass man bei einer Eignungsuntersu-
chung eine Einschränkung in der Sehkraft berücksichtigen kann, wenn
es darum geht, die Beherrschung der Grundrechenarten zu prüfen. In
diesem Fall könnte man z.B. die Aufgaben auditiv vorgeben. Wenn aller-
dings die infrage stehende Tätigkeit selbst die Sehtüchtigkeit erfordert,
z.B. die Tätigkeit einer Fahrzeugführerin/eines Fahrzeugführers, darf
dem Wunsch nach einem Verzicht auf Verfahren, die Anforderungen
5 an die Sehkraft stellen, nicht entsprochen werden.

5.5 Fazit

Eignungsdiagnostiker/-innen wählen Verfahren aus oder konstruie-


ren Verfahren, sie wenden Verfahren an, werten diese aus und inter-
pretieren die Ergebnisse. Sie geben (ggf. schriftliche) Rückmeldungen
zu Verfahrensergebnissen und evaluieren das eigene Vorgehen – all das
gelingt nicht ohne methodisches Rüstzeug. Eignungsdiagnostiker/-in-
nen müssen mit methodischen Grundbegriffen wie dem Messfehler,
dem Konfidenzintervall oder den Gütekriterien sowie mit Testtheo-
rien wie der Klassischen Testtheorie und der Item-Response-Theorie
vertraut sein. Die theoretischen Annahmen und die Zuschreibung von
Eignungsurteilen müssen in Form von empirischen Untersuchungen an
der Wirklichkeit überprüft werden. Deshalb sind auch Kenntnisse der
deskriptiven Statistik, die sich in die Maße der zentralen Tendenz und
die Streuungsmaße unterteilen lässt, von hoher Bedeutung. Der Zusam-
menhang zwischen einem Verfahrensergebnis und einem Kriterium
(z.B. Berufserfolg) wird zumeist in Form von Zusammenhangsmaßen
ausgedrückt, sodass es notwendig ist, diese Zusammenhangsmaße und
Methoden wie die multiple lineare Korrelation zu kennen. Bezüglich der
Ergebnisrückmeldung sollte man zwischen der kriteriumsorientierten
und der normorientierten Messung unterscheiden können.

? Kontrollfragen
1. Was ist der Unterschied zwischen Messen und Zählen?
2. Aus welchen Gründen können Korrelationen zwischen
Messwerten von Eignungstests und Kriterien zu hoch oder zu
niedrig ausfallen?
3. In welchen Fällen im Rahmen der Eignungsdiagnostik sind
formative latente Variablen reflektiven latenten Variablen
vorzuziehen?
4. Beschreiben Sie jeweils einen Vor- und einen Nachteil einer
minderungskorrigierten Kriteriumskorrelation.
5. Warum muss die Zuverlässigkeit eines Tests bei der
Interpretation eines Testwerts unbedingt berücksichtigt
werden?
Literatur
187 5
Weiterführende Literatur

Bühner, M. (2011). Einführung in die Test-und Fragebogenkonstruktion (3. Aufl.). Mün-


chen: Pearson Deutschland.
Bühner, M., & Ziegler, M. (2009). Statistik für Psychologen und Sozialwissenschaftler.
München: Pearson.
Ziegler, M., & Bühner, M. (2012). Grundlagen der psychologischen Diagnostik. Düssel-
dorf: VS Verlag für Sozialwissenschaften.

Literatur

Brickenkamp, R., Schmidt-Atzert, L., & Liepmann, D. (2010). Test d2–Revision.


­Aufmerksamkeits-und Konzentrationstest: Manual. Göttingen: Hogrefe.
Bühner, M. (2011). Einführung in die Test-und Fragebogenkonstruktion (3. Aufl.).
­München: Pearson.
Campbell, D. T., & Fiske, D. W. (1959). Convergent and Discriminant Validation by the
Multitrait-Multimethod Matrix. Psychological Bulletin, 56, 81–105.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests.
­Psychometrika, 16, 297–334.
Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests.
­Psychological Bulletin, 52, 281–302.
DIN (2016). DIN 33430: Anforderungen an berufsbezogene Eignungsdiagnostik. Berlin:
Beuth.
Heene, M., Draxler, C., Ziegler, M., & Bühner, M. (2011). Performance of the bootstrap
Rasch model test under violations of non-intersecting item response functions.
Psychological Test and Assessment Modeling, 53, 283–294.
Huber, H. P. (1973). Psychometrische Einzelfalldiagnostik. Weinheim: Beltz.
Kemper, C., Ziegler, M., Krumm, S., Heene, M., & Bühner, M. (2015). Testkonstruktion.
In G. Stemmler & J. Markraf-Stiksrud (Hrsg.), Lehrbuch Psychologische Diagnostik
(S. 157–221). Bern: Huber.
Kubinger, K. D., & Proyer, R. (2004). Gütekriterien. In K. Westhoff, L. J., Helfritsch, L.
F. Hornke, K. D. Kubinger, F. Lang, H., Moosbrugger, A. Puschel & G. Reimann
­( Testkuratorium) (Hrsg.), Grundwissen für die berufsbezogene Eignungsdiagnostik
nach DIN 33430 (S. 186–194). Lengerich: Pabst.
Liepmann, D., Beauducel, A., Brocke, B., & Amthauer, R. (2007). Intelligenz-Struktur-
Test 2000 R (extended edition). Göttingen: Hogrefe.
Loevinger, J. (1954). The attenuation paradox in test theory. Psychological Bulletin, 51,
493–504.
McDonald, R. P. (1970). The theoretical foundations of principal factor analysis,
­canonical factor analysis, and alpha factor analysis. British Journal of Mathemati-
cal and Statistical Psychology, 23(1), 1–21.
McGrew, K. (2009). CHC theory and the human cognitive abilities project: Standing
on the shoulders of the giants of psychometric intelligence research. Intelligen-
ce, 37, 1–10.
Rost, J. (1999). Was ist aus dem Rasch-Modell geworden. Psychologische Rundschau,
50(3), 140–156.
Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods
in personnel psychology: Practical and theoretical implications of 85 years of
research findings. Psychological Bulletin, 124, 262–274.
Schmidt-Atzert, L., & Deter, B. (1993). Intelligenz und Ausbildungserfolg: Eine Unter-
suchung zur prognostischen Validität des IST 70. Zeitschrift für Arbeits-und Orga-
nisationspsychologie 37(2), 52–63.
Shavelson, R. J., Webb, N. M., & Rowley, G. L. (1989). Generalizability Theory. American
Psychologist, 44, 922–932.
188 Kapitel 5 · Statistisch-methodische Grundlagen der Eignungsbeurteilung

Testkuratorium der Föderation Deutscher Psychologenvereinigungen (2010). TBS-


TK. Testbeurteilungssystem des Testkuratoriums der Föderation Deutscher
Psychologenvereinigungen. Revidierte Fassung vom 09. September 2009.
­Psychologische Rundschau, 61, 52–56.
Ziegler, M., & Bühner, M. (2009). Modeling Socially Desirable Responding and Its
Effects. Educational and Psychological Measurement, 69, 548–565.
Ziegler, M., & Bühner, M. (2012). Grundlagen der psychologischen Diagnostik. Düssel-
dorf: VS Verlag für Sozialwissenschaften.

5
189 6

Evaluation der
Eignungsbeurteilung
Lothar Schmidt-Atzert, Stefan Krumm und Martin Kersting

6.1 Was ist Evaluation? – 190

6.2 Wie wird evaluiert? – 191


6.2.1 Vergleichsmaßstäbe – 191
6.2.2 Erfolgskriterien – 193

6.3 Diagnostische Urteilsbildung – 195


6.3.1 Formen der Urteilsbildung – 196
6.3.2 Strategien der regelgeleiteten Urteilsbildung – 199

6.4 Ergebnisse einschlägiger Evaluationsstudien – 200


6.4.1 Kriteriumsgültigkeit von verfahrensbasierten
Eignungsbeurteilungen – 200

6.5 Rahmenbedingungen für treffsicher Prognosen: Grund-


und Auswahlquote – 210

6.6 Monetäre Nutzenschätzung – 215

6.7 Evaluation/Ableitung von Verbesserungsmaßnahmen


im Einzelfall – 217

6.8 Fazit – 219

Literatur – 220

© Springer-Verlag GmbH Deutschland 2018


Diagnostik- und Testkuratorium (Hrsg.), Personalauswahl kompetent gestalten,
DOI 10.1007/978-3-662-53772-5_6
190 Kapitel 6 · Evaluation der Eignungsbeurteilung

Übersicht
In diesem Kapitel geht es um das Thema Evaluation im
Allgemeinen und die Evaluation der Eignungsdiagnostik
im Besonderen. Was bedeutet „Evaluation“? Welche Formen
der Evaluation kann man unterscheiden? Nach der Klärung
dieser allgemeinen Eingangsfragen beschäftigt sich das
Kapitel damit, welche Erfolgskriterien zur Beurteilung des
Nutzens von Vorgehensweisen und Verfahren der Eignungs-
beurteilung herangezogen werden und wie Informationen
aus verschiedenen Quellen zu einem Gesamturteil integriert
werden können. Forschungsergebnisse zur Kriteriumsgültigkeit
der aus gängigen Auswahlverfahren (z.B. Assessment Centern,
6 Eignungsinterviews, Persönlichkeitsfragebogen und Schulnoten)
abgeleiteten Eignungsbeurteilungen werden vorgestellt und
erläutert. In einem weiteren Abschnitt gehen wir darauf ein,
welche Randbedingungen (Grundquote und Selektionsquote)
zu günstigen bzw. ungünstigen Trefferquoten führen. Schließlich
zeigen wir, wie der monetäre Nutzen von Vorgehensweisen und
Verfahren der Eignungsbeurteilungen geschätzt werden kann.

6.1 Was ist Evaluation?

Für die fachgerechte Nutzung von Verfahren sind nach DIN (2016,
S. 23) Kenntnisse über „Evaluationsmethoden einschließlich Kos-
ten-Nutzen-Aspekten“ notwendig. Evaluation bedeutet allgemein
Bewertung. Das Wort leitet sich von dem lateinischen Begriff „valuere“
(= bewerten) her (Gollwitzer & Jäger, 2014, S. 13). Der Begriff „Evalua-
tion“ findet in der Alltagssprache oft in dem Sinne Verwendung, dass
etwas „in irgendeiner Weise geprüft, bewertet oder beurteilt“ wird. Eine
professionelle Evaluation zeichnet sich in Abgrenzung zum Alltags-
gebrauch dadurch aus, dass ein Gegenstand nachvollziehbar bewer-
tet wird, sodass Güte und Nutzen möglichst genau bestimmt werden
können (Gesellschaft für Evaluation, 2008, S. 15).

Definition
Systematische Untersuchung
des Nutzens oder Wertes eines „Evaluation ist die systematische Untersuchung des Nutzens oder
Gegenstandes Wertes eines Gegenstandes. Solche Evaluationsgegenstände
können z.B. Programme, Projekte, Produkte, Maßnahmen,
Leistungen, Organisationen, Politik, Technologie oder
Forschung sein. Die erzielten Ergebnisse, Schlussfolgerungen
oder Empfehlungen müssen nachvollziehbar auf empirisch
gewonnenen qualitativen und/oder quantitativen Daten
beruhen“ (Gesellschaft für Evaluation, 2008, S. 15).
6.2 · Wie wird evaluiert?
191 6
In der Definition ist von „der“ Evaluation die Rede. Bei einer differen-
zierteren Betrachtung stellt man fest, dass Fragen nach dem „Wer?“,
„Wann?“ und „Was?“ zu beachten sind:
Wer evaluiert? Grundsätzlich ist zu unterscheiden, ob eine Institu- „Selbstevaluation“ vs.
tion selbst ihre Maßnahmen evaluiert oder ob sie dafür eine (neutrale) „Fremdevaluation“
andere Institution beauftragt. In der DIN (2016, S. 21) wird formuliert:
„Auftraggeber und Dienstleister müssen gemeinsam zu geeigneten Zeit-
punkten eine kritische Würdigung des Vorgehens und der Verfahren
vornehmen.“ Es gibt aber auch gute Gründe, sich von einer unabhän-
gigen Instanz evaluieren zu lassen (Fremdevaluation).
Wann wird evaluiert? Die Evaluation kann einmalig oder kontinu- Regeln spätestens alle drei Jahre
ierlich stattfinden. Für die Evaluation der Kriteriumsgültigkeit von Ver- überprüfen
fahren benötigt man eine umfangreiche Datenmenge. Voraussetzung für
eine Evaluation ist daher die Dokumentation, entsprechend wird in der
DIN (2016) viel Wert auf die Dokumentation gelegt. In einem Abschnitt
ist speziell geregelt, was alles zu dokumentieren ist (z.B. die wesentlichen
Ergebnisse der Anforderungsanalyse, die Verfahren und deren Abfolge,
die Regeln zur Integration aller über eine Kandidatin/einen Kandidaten
erhobenen Informationen zu einem Eignungsurteil und das Ergebnis
der Eignungsbeurteilung). Sofern Eignungsbeurteilungen in gleicher
Art und Weise über einen längeren Zeitraum wiederholt durchgeführt
werden, ist nach DIN (2016, S. 11) spätestens alle drei Jahre zu begrün-
den, ob sich die Regeln zur Durchführung und Auswertung und zum
Erstellen des abschließenden Eignungsurteils bewährt haben.
Was wird evaluiert? Der Text der DIN (2016, S. 21) nennt konkrete Beispiele für Evaluationsthemen:
Beispiele, die Antwort auf die Frage „Was wird evaluiert“ geben, etwa Kosten-Nutzen und Akzeptanz
die Kosten-/Nutzenrelation oder die Akzeptanz des Vorgehens und der
Verfahren sowohl seitens der Kandidatinnen und Kandidaten als auch
seitens der Auftrag gebenden Institution. Sofern eine große Anzahl von
Kandidatinnen und Kandidaten untersucht wurde, sollten zur Quali-
tätssicherung und -optimierung für diesen konkreten Fall die Zuver-
lässigkeit der einzelnen Verfahren sowie die Gültigkeit der aus dem
gesamten Vorgehen abgeleiteten Eignungsaussagen bestimmt werden.
Auszubildende mit hohen Werten in dem zu ihrer Auswahl verwen-
deten Verfahren sollten beispielsweise die Ausbildung mit deutlich
besseren Noten abschließen als solche mit niedrigen Werten. Bei der
Evaluation von Verfahren werden in der Regel jedoch nicht Gruppen
verglichen, sondern es wird der Zusammenhang (die Korrelation) zwi-
schen z.B. den Testwerten und den Abschlussnoten ermittelt.

6.2 Wie wird evaluiert?

6.2.1 Vergleichsmaßstäbe

Jedes Verhalten, jedes Vorgehen und jedes Verfahren kann aus ver-
schiedenen Perspektiven beurteilt werden: Ist es so, wie es sein sollte?
Ist es anders (besser oder schlechter) als vorher? Ist es im Vergleich zu
192 Kapitel 6 · Evaluation der Eignungsbeurteilung

anderen (Verhaltensweisen, Vorgehensweisen, Verfahren) besser oder


schlechter?
Normativer Ansatz: Prüfen, ob 55 Normativer Ansatz: Hier wird geprüft, ob bestimmte Vorgaben
Vorgaben eingehalten wurden erfüllt werden bzw. in welchem Ausmaß. Beispielsweise dürfen
nach DIN (2016, S. 12) nur Verfahren eingesetzt werden, für die
Handhabungshinweise vorliegen. Nun kann man prüfen, ob für
alle eingesetzten Verfahren Handhabungshinweise vorliegen.
Eine andere Art von Vorgaben sind Ziele. Beispielsweise könnte
eine Auftraggeberin/ein Auftraggeber verlangen, dass das
Eignungsinterview maximal 30 Minuten dauert. In diesem Fall
könnte man prüfen, ob das Ziel erreicht wurde. Hinweis: Der
normative Ansatz der Evaluation darf nicht verwechselt werden
mit der „normorientierten Diagnostik“, die wir in 7 Abschn. 5.4.5
6 behandeln. Dabei geht es darum, die Verfahrensergebnisse einer
Person mit den Werten einer Vergleichsgruppe (der Norm) in
Bezug zu setzen.
Intraindividueller Vergleich: 55 Intraindividueller Vergleich (Vergleich innerhalb einer Person
Prüfen, ob Veränderungen oder Sache): Insbesondere, wenn Maßnahmen zur Verbes-
eingetreten sind serung einer Vorgehensweise unternommen oder Verfahren
ausgetauscht wurden, stellt sich die Frage der Wirksamkeit.
Beispielsweise könnte man sich fragen: Ist die Akzeptanz der
Verfahren seitens der Kandidatinnen und Kandidaten gestiegen,
nachdem das Verfahren überarbeitet wurde? Vorher-Nachher-
Vergleiche sind in der Regel problematisch, weil ein beobachteter
Unterschied zwischen den beiden Messungen nicht zwingend
auf die Maßnahme zurückzuführen ist. Vielleicht ist die höhere
Akzeptanz auf das neue Hotel zurückzuführen, in dem die
Auswahlverfahren nun stattfinden. Deshalb sind die Ergebnisse
einer Evaluation im Vor-Nachher-Vergleich mit größter Vorsicht
zu interpretieren.
Vergleich mit anderen: 55 Vergleich mit anderen: Für die meisten Eignungsdiagnostiker/-
Benchmarks heranziehen innen ist es schwer, das Ergebnis einer Verfahrensevaluation
richtig einzuordnen. Ist eine Beobachter/-innenüberein-
stimmung von Kappa = .70 hoch? Wie ist die Kriteriumsgültigkeit
einer aus Arbeitsproben abgeleiteten Eignungsbeurteilung
von r = .30 zu bewerten? („r“ steht hier für die „Korrelation“;
7 Kap. 5). Und ist die gleiche Kriteriumsgültigkeit (r = .30) bei
einem Fragebogen zur Teamorientierung genauso zu beurteilen?
Der einzig sinnvolle Weg zur Beurteilung solcher Werte besteht
darin, für jede Gruppe von Verfahren Vergleichswerte aus der
wissenschaftlichen Fachliteratur heranzuziehen (7 Abschn. 6.4.1).
Solche Benchmarks erlauben die fachgerechte Beurteilung der
Kennwerte von aus bestimmten Verfahren abgeleiteten Eignungs-
beurteilungen. Allerdings ist auch dieser Vergleich nur statthaft,
wenn die Rahmenbedingungen vergleichbar sind. Beispielsweise
ist zu berücksichtigen, ob die Untersuchungsgruppen hinsichtlich
Merkmalen wie Alter, Geschlecht und Bildungsstand vergleichbar
sind und die Erhebungen unter vergleichbaren Bedingungen
6.2 · Wie wird evaluiert?
193 6
durchgeführt wurden. Insbesondere die Varianz der Merkmale in
der Untersuchungsgruppe wirkt sich auf die Kennwerte aus (siehe
dazu das Beispiel der Auswirkung der Varianz auf die Reliabili-
tätshöhe im 7 Abschn. 5.4.1).

6.2.2 Erfolgskriterien

Die Eignungsbeurteilung soll vor allen Dingen gültig (valide) sein (zur Berufliche Leistungen,
Gültigkeit 7 Abschn. 5.4.3). Gültigkeit wird in der DIN (2016, S. 7) Arbeitszufriedenheit
definiert als das Ausmaß, in dem Interpretationen von eignungsdia-
gnostischen Informationen zutreffen. Woran aber soll man die Gül-
tigkeit festmachen? Ein wesentlicher Aspekt bei der Beurteilung des
Erfolgs einer Eignungsbeurteilung ist die Kriteriumsgültigkeit, also
der Zusammenhang zwischen den Ergebnissen des Auswahlverfahrens
und späteren beruflichen Leistungen. Dabei ist keineswegs trivial, was
unter beruflichen Leistungen zu verstehen ist. Neben Leistungen, die
die Kernauf­gaben betreffen (z.B. der Jahresumsatz einer Vertriebsmit-
arbeiterin/eines Vertriebsmitarbeiters), können weitere Aspekte als Teil
des Erfolgs/der Leistung von Mitarbeiter/-innen verstanden werden,
wie z.B. freiwilliges zusätzliches Engagement oder die Arbeitszufrie-
denheit. Die Arbeitszufriedenheit ist sowohl für die zufriedene oder
unzufriedene Person wichtig als auch für die Organisation: Eine geringe
Arbeitszufriedenheit kann zu einer geringen Arbeitsmotivation, zu
einem hohen Krankenstand und zu einer hohen Fluktuation beitragen.
Im Folgenden werden in der Praxis gängige Maßnahmen zur
Beurteilung der Leistung in Beruf und Ausbildung aufgeführt und
kurz diskutiert:
55 Vorgesetztenbeurteilung: In einigen Organisationen beurteilen Beurteilung durch Vorgesetzte,
Führungskräfte die Leistungen ihrer Mitarbeiter/-innen im Mitarbeiter/-innen oder
Rahmen von formalen (regelmäßigen) Beurteilungen. Genauso Kolleginnen und Kollegen
können die Leistungen von Führungskräften durch deren
Vorgesetze und/oder auch durch deren Mitarbeiter/-innen
und/oder Kolleginnen und Kollegen beurteilt werden. Werden
mehrere Perspektiven gleichzeitig beachtet, spricht man auch
vom Multi-Rater-Feedback oder (bei einer vollständigen
Betrachtung) vom 360-Grad-Feedback. Die Beurteilungen sind
in freier Form möglich (Gespräch oder Fließtext). Günstiger
für die Messung von Berufserfolg ist die Beurteilung mithilfe
von Skalen (siehe dazu Schmidt-Atzert & Amelang, 2012, S. 473
ff.). So sind die Urteile über mehrere Personen gut vergleichbar.
Vorgesetztenbeurteilungen haben den Vorteil, dass die Beurtei-
ler/-innen in der Regel das Verhalten und die Leistungen ihrer
Mitarbeiter/-innen kennen und dass sie Vergleiche mit anderen
Mitarbeiterinnen und Mitarbeitern anstellen können. Der
Aufwand für die Durchführung ist gering. Als Nachteil muss
gesehen werden, dass menschliche Urteile anfällig für Urteils-
fehler sind.
194 Kapitel 6 · Evaluation der Eignungsbeurteilung

Umsatz, Stückzahlen, 55 Objektive Leistungsmaße: In einigen Branchen, insbesondere


Ausschussquoten im Verkauf, kann die Leistung einer Mitarbeiterin/eines
Mitarbeiters über den Umsatz beurteilt werden, für den sie/er
verantwortlich ist. In der Produktion bieten sich Stückzahlen
und Ausschussquoten an. Von Vorteil ist, dass solche Maße den
Beitrag, den jemand zum Unternehmenserfolg leistet, direkt
und (nahezu) fehlerfrei abbilden. Als Nachteil ist zu erwähnen,
dass die Umstände, unter denen beispielsweise der Umsatz
zustande kommt, häufig ignoriert werden. So wird der Umsatz,
den eine Autoverkäuferin/ein Autoverkäufer erzielt, nicht nur
von Einsatz und Kompetenzen abhängen, sondern auch davon,
ob die Filiale ein großes Einzugsgebiet hat, verkehrsgünstig
liegt etc.
6 Entlohnung nicht immer 55 Leistungsbezogene Entlohnung: In manchen Unternehmen
leistungsabhängig wird ein Teil des Gehalts erfolgsabhängig ausgezahlt. Der
Schlüssel für die Berechnung kann Vorgesetztenbeurteilungen
und/oder objektive Leistungsmaße einschließen. Es kommen
daher die dort genannten Vor- und Nachteile zum Tragen.
Für die Evaluation eines Verfahrens ist die leistungsabhängige
Entlohnung ein Glücksfall, weil dieser Kennwert leicht zu
erheben ist. Voraussetzung ist, dass alle Mitarbeiter/-innen
oder Führungskräfte nach dem gleichen System entlohnt
werden. Und selbstverständlich müssen die Zulagen
ausschließlich an die erbrachten Leistungen gebunden sein
und nicht etwa an die Länge von „Wartezeiten“ für einen
Aufstieg in eine höhere Stufe. So ist die Höhe der Leistungs-
zulagen im öffentlichen Dienst oftmals kein Indikator für
beruflichen Erfolg, wenn für die einzelnen Leistungsstufen
feste Quoten existieren und diese bereits erschöpft sind.
Eine Höhergruppierung ist manchmal nicht möglich, weil
die nächst höhere Stufe (dauerhaft) „besetzt“ ist. In der DIN
33430 wird daher konsequenterweise verlangt, dass Eignungs-
diagnostikerinnen und -diagnostiker auch über Grundkennt-
nisse der Organisationsstrukturen von Auftraggeberinnen und
-gebern verfügen (DIN, 2016, S. 24).
Noten in Ausbildung und Studium 55 Noten: Um den Erfolg in einer Berufsausbildung oder in einem
Studium zu operationalisieren, werden häufig Noten heran-
gezogen. In Deutschland wird der Erfolg einer Berufsausbildung
in der Regel durch Prüfungen der Industrie- und Handels-
kammern festgestellt. Eignungsbeurteilungen können an den
Noten evaluiert werden, die die ausgewählten Personen in der
Ausbildung oder im Studium erzielen. Der Vorteil von Noten als
Erfolgskriterium liegt auf der Hand: Sie sind verfügbar, müssen
also nicht eigens erhoben werden. Sie sollten genau das abbilden,
was in einer Ausbildung oder einem Studium gelernt wird; sie
sollten also inhaltsvalide sein (zur Inhaltsvalidität oder -gültigkeit
7 Abschn. 5.4.3).
6.3 · Diagnostische Urteilsbildung
195 6
Es soll nochmals betont werden, dass die genannten Kriterien jeweils
bestimmte Aspekte des Erfolgs abbilden. Sie sind also nicht austausch-
bar. Mitarbeiter/-innen, die von Vorgesetzten sehr gut beurteilt werden,
sind vielleicht mit ihrer Arbeit ziemlich unzufrieden.
Deshalb kann die aus einem Verfahren der Eignungsbeurteilung Kriterien nicht austauschbar
abgeleitete Entscheidung, bezogen auf ein bestimmtes Kriterium, sehr
gut sein, also diesbezüglich eine gute Prognosegültigkeit haben. Würde
man seine Prognosegültigkeit an einem anderen Kriterium überprüfen,
könnte das Ergebnis niederschmetternd sein. Daher ist es unerlässlich,
sich bei der Evaluation vorab gut zu überlegen, was genau ein Verfah-
ren leisten soll – und danach das Kriterium festlegen, an dem das Ver-
fahren zu prüfen ist.
Wichtig ist auch, dass nicht nur die Eignungsbeurteilung eine hohe Qualität der Erfolgskriterien
oder niedrige Qualität aufweisen kann, sondern auch die Beurteilung, beachten
die als Kriterium herangezogen wird. Stellen wir uns vor, dass eine Eig-
nungsbeurteilung nicht mit den Jahre später formulierten Beurteilun-
gen der Vorgesetzten zusammenhängt. Man kann daraus schließen,
dass die Eignungsbeurteilung eine geringe Qualität aufweist – oder
dass die Beurteilung durch die Vorgesetzten eine geringe Qualität auf-
weist. Die geringe Qualität kann sich aus einer Voreingenommenheit
oder Unfähigkeit der Vorgesetzten ergeben, sie kann aber auch statis-
tisch bedingt sein. Stellen wir uns beispielsweise vor, dass alle Auszubil-
denden von ihren Vorgesetzten die gleiche Note als Leistungsbeurtei-
lung erhalten (z.B. weil diese alle sehr milde urteilen). Dann fehlt dem
Kriterium „Note“ die Streuung (Varianz). Während im Eignungstest
die Leistungsunterschiede zwischen den Personen treffend abgebildet
wurden, gelingt im Kriterium die Differenzierung nicht. In diesem Fall
kann man aus der ausbleibenden Korrelation keinen Qualitätsman-
gel des Verfahrens der Eignungsbeurteilung ableiten. (Häufig werden
aus diesem Grund bei der Berechnung von Gütekriterien Korrekturen
gegen Streuungseinschränkungen vorgenommen; 7 Kap. 5 sowie weiter
unten 7 Abschn. 6.4.1).
Neben der Gültigkeit (Validität) von Eignungsbeurteilung gibt es
weitere Gesichtspunkte, nach denen Verfahren zur Eignungsbeurtei-
lung evaluiert werden sollten. Die DIN 33430 nennt hierzu beispielhaft
den Grad der Erreichung vorher festgelegter Ziele, Akzeptanz bei den
Kandidatinnen und Kandidaten, Akzeptanz bei den an der Eignungs-
beurteilung beteiligten Personen oder Verständlichkeit der Eignungs-
aussage (DIN, 2016, S. 21).

6.3 Diagnostische Urteilsbildung

Wenn von den Kandidatinnen und Kandidaten die erforderlichen eig-


nungsrelevanten Informationen vorliegen, ist eine Entscheidung zu treffen:
Wer ist geeignet und wer nicht? Oder: Wer ist am besten, am zweitbesten
etc. geeignet? Diesen Vorgang nennt man „diagnostische Urteilsbildung“.
196 Kapitel 6 · Evaluation der Eignungsbeurteilung

Integration von bereits


Definition
vorliegenden diagnostischen Unter diagnostischer Urteilsbildung versteht man die
Informationen zu einem Integration von bereits vorliegenden diagnostischen
Gesamturteil Informationen zu einem Gesamturteil. Die einzelnen
Informationen können dabei auf unterschiedliche Weise
verrechnet werden. In der Eignungsdiagnostik wird das Urteil
„abschließendes Eignungsurteil“ genannt. Das Urteil kann etwa
„geeignet“, „nicht geeignet“ oder „bedingt geeignet“ lauten.
Ebenso ist es möglich, mehrere Personen nach dem Grad ihrer
Eignung in eine Rangreihe zu bringen oder für jede Person ein
Maß für ihre Eignung zu bestimmen.

6
6.3.1 Formen der Urteilsbildung

Für die Integration der Ergebnisse verschiedener Verfahren stehen im


Wesentlichen zwei Vorgehensweisen zur Verfügung:

Keine vorab festgelegten Regeln Freie Einzelfallbeurteilung  Diese Art von Urteilsbildung wird in der
Wissenschaft auch klinische Urteilsbildung genannt. Bei dieser Form
der Urteilsbildung steht es der Urteilerin/dem Urteiler frei, wie sie/
er die einzelnen Informationen verwendet. Das Urteil kann „aus dem
Bauch heraus“ getroffen werden, also ohne eine bewusste Reflexion über
den Urteilsprozess. Es kann aber auch das Ergebnis einer sorgfältigen
Abwägung von Stärken und Schwächen der beurteilten Person sein.
Wichtig ist, dass bei dieser Art von Urteilsbildung keine vorab festge-
legten Regeln zur Anwendung kommen. Die Urteiler/-innen sind frei in
ihrer Entscheidung, wie sie jeweils die einzelnen Informationen verwer-
ten. Es muss betont werden, dass diese Form der Urteilsbildung nicht
der DIN 33430 entspricht. Dafür gibt es gute Gründe (siehe unten).

Alle nach dem gleichen Schema Regelgeleitetes Vorgehen  Dieses Vorgehen wird in der Wissenschaft
beurteilen auch mechanische oder statistische Urteilsbildung genannt. Alle zu
beurteilenden Personen werden exakt nach dem gleichen Schema
beurteilt. Beispielsweise könnte festgelegt worden sein, dass jemand
nur dann für den Außendienst als geeignet gilt, wenn sie/er über eine
mindestens durchschnittliche Intelligenz verfügt, mindestens durch-
schnittlich extravertiert ist und über wenigstens zwei Jahre einschlä-
gige Berufserfahrung verfügt. Erfüllen mehr Kandidatinnen und Kan-
didaten diese Anforderungen als Stellen zu besetzen sind, werden die
Standardwerte für Intelligenz und für Extraversion gemittelt. Je höher
dieser Durchschnittswert ist, desto geeigneter ist die Person.
Wie findet man die Regeln? Wie findet man die Regeln? Hier gibt es zwei Ansätze, die weiter
unten dargestellte statistische Urteilsbildung und die mechanische
Urteilsbildung. Bei der mechanischen Urteilsbildung bleibt offen, wie
die Regeln gefunden werden. Beispielsweise kann man sich an der
Anforderungsanalyse orientieren und die Kompetenzen nach deren
6.3 · Diagnostische Urteilsbildung
197 6
vermuteten Bedeutsamkeit gewichten. Die Regeln können einen
Konsens zwischen verschiedenen Beteiligten (verantwortliche/-r Eig-
nungsdiagnostiker/-in, Unternehmensleitung, Betriebsrätin/-rat) dar-
stellen. Hilfreich ist es, sich bei der Gewichtung an Ergebnissen von
Metaanalysen zu orientieren (7 Abschn. 6.4.1).

> Die DIN (2016, S. 11) betont, dass die „Regeln (…) zur Regeln vor der
Integration der Ergebnisse der verschiedenen Verfahren zu Eignungsbeurteilung festlegen
einem abschließenden Eignungsurteil“ in der Planungsphase,
also in jedem Fall vor Beginn der Eignungsbeurteilung
festzulegen sind. Es wird also ein regelgeleitetes Vorgehen
(„mechanische Urteilsbildung“) verlangt, wobei die Regeln
vorab festzulegen sind. Würde man die Regeln nach der
Verfahrensdurchführung festlegen, bestände die Gefahr, dass
die Regeln so gewählt würden, dass bestimmte Personen
entweder keine Chance oder einen Vorteil vor anderen
Kandidatinnen und Kandidaten hätten.
Wenn ähnliche gelagerte Eignungsbeurteilungen über einen
längeren Zeitraum wiederholt durchgeführt werden, so „ist
spätestens alle drei Jahre zu begründen, ob sich die Regeln (…)
zum Erstellen des abschließenden Eignungsurteils bewährt
haben“ (DIN 33430, 2016, S. 11; 7 Abschn. 3.3).

Wie die „Bewährung“ der Regeln evaluiert werden soll, wird in der „Bewährung“ der Regeln
DIN-Norm nicht spezifiziert. Die härteste Form der Bewährung besteht überprüfen
darin, dass sich die Regeln mit denen einer statistischen Urteilsbildung
(s.u.) decken. Diese Art der Überprüfung wird aber nur in Ausnahme-
fällen möglich sein. Voraussetzung sind große Fallzahlen. Häufig ist aber
eine andere Überprüfung möglich: Liegen neue empirische Befunde
vor, die eine andere Gewichtung oder generell Verrechnung nahele-
gen? Haben sich die Anforderungen an die Stelle so stark geändert, dass
Indikatoren für bestimmte Eignungsmerkmale stärker oder schwächer
zu gewichten sind oder Mindestwerte zu verschieben sind? Lautet die
Antwort „Nein“, kann die Verrechnungsregel als bewährt gelten.
Eine spezielle Variante der oben dargestellten mechanischen Ergebnisse empirischer
Urteilsbildung ist die statistische Urteilsbildung: Das Urteilsmodell, also Untersuchungen als Grundlage
die Verrechnungsregel, basiert in diesem Fall ausschließlich auf empiri-
schen Untersuchungen. Eine allgemein gültige Verrechnungsregel gibt
es nicht. Die Übertragung eines Urteilsmodells aus einer anderen Insti-
tution auf die eigene oder von einem Ausbildungsberuf in der eigenen
Firma auf einen anderen ist stets problematisch. Grundsätzlich sind
Zweifel an der Generalisierbarkeit angebracht. Die eigene Überprüfung
kommt für Organisationen infrage, die jährlich mindestens etwa 50 Per-
sonen auswählen. Auf der einen Seite stehen die Ergebnisse der Ver-
fahren der Eignungsbeurteilung („Prädiktoren“) und auf der anderen
die Kriterien für den Erfolg in Ausbildung oder Beruf („Kriterium“).
Mit statistischen Verfahren, häufig einer linearen multiplen Regres-
sion, wird die optimale Gewichtung der Prädiktoren ermittelt. Eine
198 Kapitel 6 · Evaluation der Eignungsbeurteilung

multiple Regression (7 Abschn. 5.2.5, multiple lineare Korrelation) liefert


als Ergebnisse Gewichte für die einzelnen Prädiktoren.

Welche Form der Urteilsbildung ist die beste?  Diese Frage hat die For-
schung schon lange beschäftigt. Ein typisches Studiendesign sieht so
aus: Eignungsdiagnostiker/-innen erhalten die Testergebnisse von
vielen Personen. Beispielsweise werden die Ergebnisse in zwei mess-
theoretisch fundierten Leistungstests und einem messtheoretisch fun-
dierten mehrdimensionalen Persönlichkeitsfragebogen in Profilform
dargestellt. Sie sollen jeweils beurteilen, wie gut die Person für eine
näher beschriebene Stelle geeignet ist. Sie sind völlig frei darin, wie
sie die einzelnen Testwerte nutzen. Auf diese Art und Weise kommen
Urteile nach der Methode der klinischen Urteilsbildung zustande.
6 Für das statistische Urteil hat man in einer anderen Studie die Ergeb-
nisse dieser Tests in einer multiplen Regression als Prädiktoren für
Berufserfolg, operationalisiert über Vorgesetztenbeurteilungen, ver-
wendet. Die so ermittelten Gewichte der einzelnen Tests werden nun
auf die gleichen Personen angewandt, über die ein „klinisches Urteil“
vorliegt. Dazu werden die einzelnen Testwerte aller Personen einheit-
lich so gewichtet, wie es der multiplen Regression zufolge optimal ist.
Das statistische Modell liefert für jede Person eine Vorhersage der Vor-
gesetztenbeurteilung. Nun kommt der Vergleich. Die freien (klinischen)
Beurteilungen der Eignungsdiagnostiker/-innen und die statistischen
Urteile, die automatisch aufgrund der Gewichtungen nach der mul-
tiplen Regression gebildet wurden, werden mit Vorgesetztenbeurtei-
lungen (als Erfolgskriterium) korreliert, die man von den Personen
erhoben hat. Die „klinischen“ Urteile korrelieren vielleicht r = .30 mit
dem so operationalisierten Berufserfolg und die „statistischen“ Urteile
r = .35. In diesem Fall hätte man eine leichte Überlegenheit der stati-
schen Urteilsbildung festgestellt.
Metaanalysen: Statistische Genau das zeigen auch die Ergebnisse vieler Studien, die in drei
Urteilsbildung ist der klinischen Metaanalysen (Ægisdottir et al., 2006; Grove, Zald, Lebow, Snitz &
überlegen Nelson, 2000; Kuncel, Klieger, Connelly & Ones, 2013) zusammenge-
fasst wurden. Allerdings fassen die beiden zuerst genannten Metaana-
lysen einzelne Studien aus vielen Bereichen zusammen, und nur ein
kleiner Teil betrifft die berufliche Eignungsbeurteilung. Als mittlere
Effektstärke (Cohens d) berichteten die beiden zuerst genannten Meta-
analysen d = .12 bzw. .09 zugunsten der statistischen/mechanischen
Urteilsbildung. (Nur Ægisdottir et al. 2006 nahmen eine explizite Unter-
scheidung zwischen statistischer und mechanischer Urteilsbildung vor;
die meisten Studien nutzten ein statistisches Urteilsmodell, etwa eine
lineare Regression). Die Effektstärke d gibt an, wie viele Standardab-
weichungen die beiden Mittelwerte voneinander entfernt liegen. Viele
Testergebnisse werden zur Interpretation in Standardwerte transfor-
miert (Mittelwert = 100, Standardabweichung = 10). Eine Effektstärke
von d = .10 entspricht also 0,1 Standardabweichungen und damit einem
Standardwertpunkt. Die Effektstärke von d = .12 bei Ægisdottir et al.
entspricht einer Korrelation von r = .06. Man kann den Vergleich der
6.3 · Diagnostische Urteilsbildung
199 6
klinischen mit der statistischen/mechanischen Urteilsbildung auch
anders vornehmen. Eine Effektstärke von -.10 bis +.10 gilt als „unent-
schieden“, weil die Differenz nicht groß genug ist. Werte darunter oder
darüber sprechen entweder für das eine oder das andere Modell. Bei
dieser Auszählung sprechen 52 bzw. 47% für die statistische/mecha-
nische und 5 bzw. 6% für die klinische Urteilsbildung. Die Studie von
Kuncel et al. bezieht sich ausschließlich auf die Vorhersage von Berufs-
und (akademischen) Ausbildungserfolg. Auch in dieser Metastudie
erwies sich die mechanische Form der Urteilsbildung als überlegen –
der Unterschied war hier sogar noch deutlicher (r = .44 für mechani-
sche und r = .28 für klinische Urteilsbildung).
Fazit ist, dass die statistische/mechanische Urteilsbildung zu einem Klinische Urteilsbildung ist nicht
valideren Urteil führt als die klinische. Der Vorteil ist jedoch in zwei der DIN-konform
drei beschriebenen Metaanalysen gering. Stärker wiegt vermutlich das
Argument, dass statistische/mechanische Urteilsbildung angemessener
ist, weil alle Personen nach dem gleichen Schema beurteilt werden und
damit auch keine Anfälligkeit für Urteilsfehler gegeben ist. Die DIN
33430 verlangt explizit ein regelgeleitetes Vorgehen bei der Urteilsbil-
dung. Eine auf jeden Einzelfall angepasste freie Urteilsbildung („klini-
sche Urteilsbildung“) ist also nicht DIN-konform.

6.3.2 Strategien der regelgeleiteten Urteilsbildung

Regelgeleitete Urteilsbildung braucht Regeln. Die häufig angewandten


Regeln werden nun vorgestellt. Im Wesentlichen sind drei Strategien
oder Modelle zu unterschieden (ausführlicher dargestellt bei Schmidt-
Atzert & Amelang, 2012):

Kompensatorisches Modell  Bei dieser Strategie werden alle Eig- Kompensatorisches Modell:
nungsmerkmale vollständig in ein Urteil integriert. Wenn die Beurtei- Alle Eignungsmerkmale werden
lung der Ausprägung der Eignungsmerkmale in einer einheitlichen verrechnet und können sich
Metrik vorliegt (z.B. in Standardwerten, Schulnoten oder etwa in eine ausgleichen
siebenstufige Ratingskala transformiert wurden), kann ein Mittelwert
berechnet werden. Die Eignung ergibt sich aus der durchschnittli-
chen Beurteilung über alle Eignungsmerkmale. Eine Gleichgewich-
tung aller Merkmale ist dabei nicht zwingend; eine unterschiedliche
Gewichtung der einzelnen Merkmale kann sinnvoll sein. Beispiels-
weise kann die Gewichtung nach der (vermuteten) Kriteriumsgültig-
keit (7 Abschn. 5.4.3) der verfahrensspezifischen Interpretation erfol-
gen. Bei Anwendung dieser Strategie nimmt man bewusst in Kauf,
dass Schwächen in einem Bereich durch Stärken in einem anderen
kompensiert werden können. Es ist in jedem Fall auf der Grundlage
der Ergebnisse der Anforderungsanalyse zu prüfen, ob ein solches
Kompensationsmodell sinnvoll ist. Es sollte nicht vorkommen, dass
eine Stellwerkleiterin/ein Stellwerksleiter bei der Bahn seine niedrige
Konzentrationsfähigkeit durch eine besonders gute Allgemeinbildung
kompensieren kann.
200 Kapitel 6 · Evaluation der Eignungsbeurteilung

“Multiple-cutoff”-Modell: Mehrere Und-Strategie  Bei diesem Urteilsmodell wird verlangt, dass mehrere
Mindestanforderungen müssen Mindestanforderungen erfüllt sein müssen – daher wird manchmal
erfüllt sein auch von einem „multiple-cutoff “-Modell gesprochen. Beispielsweise
wird festgelegt, dass ein/-e Chemielaborant/-in eine gute Farbtüchtig-
keit benötigt (diese kann über einen Testwert näher spezifiziert werden)
und mindestens durchschnittlich intelligent ist (Intelligenztestergebnis
von mindestens 100 auf der IQ-Normwert-Skala). Die Und-Strategie ist
angebracht, wenn Ausprägungen von bestimmte Eignungsmerkmalen
unbedingt erforderlich sind und eine niedrige Merkmalsausprägung
nachträglich nicht oder nur mit unangemessen großem Aufwand in
ein akzeptables Ausmaß verändert werden kann.

Oder-Strategie: Wenigstens eine Oder-Strategie  Nach der Oder-Strategie wird eine Kandidatin/ein
6 Anforderung sollte gut erfüllt Kandidat als geeignet beurteilt, wenn sie/er in einem oder in einem
werden anderen Eignungsmerkmal eine bestimmte Ausprägung aufweist.
Die Platzierung oder Verwendung richtet sich nach den individuel-
len Stärken. Beispielsweise könnten bei der Auswahl für den Beruf der
Lehrerin/des Lehrers in einem von zwei Unterrichtsfächern besonders
gute Studienleistungen verlangt werden. Wenn sowohl für Mathematik
als auch für Sport ein großer Unterrichtsbedarf besteht, werden sowohl
Kandidatinnen und Kandidaten mit guten Sport- als auch solche mit
guten Mathematiknoten als geeignet beurteilt. Die einen geben dann
hauptsächlich Sportunterricht, die anderen Mathematikunterricht.
Die drei Urteilsmodelle sind Die drei Urteilsmodelle können miteinander kombiniert werden.
kombinierbar So ist es denkbar, dass zuerst das Und-Modell angewandt wird und Per-
sonen vorausgewählt werden (eventuell in einem mehrstufigen Aus-
wahlprozess), die bestimmte Mindestanforderungen erfüllen. Danach
findet vielleicht ein kompensatorisches Urteilsmodell Anwendung, in
dem alle Eignungsmerkmale (eventuell auch die, für welche eine Min-
destanforderung bestand) nach einer angemessenen Gewichtung zu
einem Gesamtwert verrechnet werden.

6.4 Ergebnisse einschlägiger Evaluationsstudien

6.4.1 Kriteriumsgültigkeit von verfahrensbasierten


Eignungsbeurteilungen

Auswahl und Zusammenstellung Ein Hinweis vorab  Die Auswahl und Zusammenstellung von Verfahren
von Verfahren sollte sollte nach DIN (2016, S. 11) soweit wie möglich evidenzbasiert erfol-
evidenzbasiert erfolgen gen. Das bedeutet laut DIN (ebd.) „ … beispielsweise, dass Erkenntnisse
aus belastbaren empirischen Untersuchungen/Metaanalysen zur Vor-
hersage von Berufs- und Ausbildungserfolg und andere empirisch gut
bestätigte und zur konkreten Anwendungssituation passende Evidenz
bei der Auswahl und Zusammenstellung von Verfahren berücksichtigt
werden“. Die im Folgenden dargestellten Ergebnisse von Metaanalysen
zur Kriteriumsgültigkeit (7 Abschn. 5.4.3) von verfahrensbasierten Eig-
nungsbeurteilungen liefern eine solide Grundlage für die Auswahl und
6.4 · Ergebnisse einschlägiger Evaluationsstudien
201 6
Zusammenstellung von Verfahren. Die Befunde zur Kriteriumsgül-
tigkeit sind auch als Benchmark bei der Bewertung eigener Verfahren
wertvoll. Dabei sind jedoch drei wichtige Punkte zu beachten:
Erstens werden in diesen Studien auch sogenannte „korrigierte“ „Korrigierte“
Gültigkeitskoeffizienten berichtet (7 Kap. 5 sowie weiter unten). Diese Gültigkeitskoeffizienten
fallen in der Regel deutlich höher aus als die unkorrigierten Korrela-
tionskoeffizienten, die man beispielsweise für den Zusammenhang zwi-
schen durchgeführten Tests und im eigenen Unternehmen vorliegen-
den Vorgesetztenbeurteilungen selbst ermitteln kann. Die in Studien
vorgenommenen Korrekturen sind angebracht und können auch auf
eigene Befunde angewandt werden. Erst dann ist ein direkter Vergleich
möglich.
Zweitens bedeutet ein Durchschnittswert nicht, dass er unbedingt „Moderatorvariablen“ beachten
für alle Verfahren einer Verfahrensgruppe (z.B. messtheoretisch fundier-
ter Fragebogen zu Gewissenhaftigkeit) oder für alle Arten von Berufen
gilt. Metaanalysen verallgemeinern oft, und nur manchmal wird erfolg-
reich nach sogenannten „Moderatorvariablen“ gesucht: Gilt diese Kri-
teriumsgültigkeit für alle Berufsgruppen? Weisen „breite“ und „enge“
bzw. spezifische Verfahren die gleiche Kriteriumsgültigkeit auf? So ist
beispielsweise bekannt, dass Intelligenztests je nach Beruf unterschied-
lich gut zur Vorhersage von Berufserfolg geeignet sind. Je anspruchs-
voller oder komplexer ein Beruf ist, desto bedeutsamer ist die Intelli-
genz zur Vorhersage von Berufserfolg (Lang, Kersting, Hülsheger &
Lang, 2010, S. 625; Schmidt & Hunter, 1998, S. 264). Der in . Tab. 6.1
aufgeführte Koeffizient betrifft Berufe mittlerer Komplexität. Für kom-
plexe Berufe wie Manager/-innen und anspruchsvolle technische Berufe
ist die Kriteriumsgültigkeit nach Schmidt und Hunter (ebd.) mit r = .58
bzw. .56 höher. Bei weniger komplexen Berufen ist sie dagegen nied-
riger und beträgt für angelernte Arbeiter/-innen („semi-skilled jobs“)
und Hilfsarbeiter/-innen („completely unskilled jobs“) r = .40 bzw. .23.
Drittens liegt es in der Natur von Metaanalysen, dass Studienergeb- Problematik kleiner Stichproben
nisse gemittelt werden. Hinter jedem Mittelwert verbirgt sich eine Streu-
ung: Manche Einzelwerte sind höher, andere niedriger. So können auch
für die eigenen Verfahren ermittelten Korrelationen (nach Korrektu-
ren) höher oder niedriger ausfallen als die Durchschnittswerte. Bei eher
kleinen Personenstichproben (N < 50) sind solche Abweichungen zu
erwarten. Deshalb sollten ohne Replikation keine voreiligen Schlüsse
aus eigenen Befunden mit kleinen Stichproben gezogen werden.

Eine umfassende Übersicht  Zur Evaluation einzelner Verfahren liegen „Super-Metaanalyse“ – Ergebnisse
sehr viele einzelne Forschungsergebnisse vor, die in mehreren Metaana- zur Gültigkeit der aus häufig
lysen zusammengefasst wurden. In einer viel beachteten „Super-Meta- angewandte Verfahren
analyse“ haben Schmidt und Hunter (1998) die bis dahin vorliegen- abgeleiteten Eignungsaussagen
den Metanalysen noch einmal zusammengeführt. Die Autoren stellen
zunächst die Befunde zur Kriteriumsgültigkeit der einzelnen Verfahren
dar – und zwar getrennt für Ausbildungs- und Berufserfolg. Die Ergeb-
nisse sind in . Tab. 6.1 für ausgewählte Verfahren dargestellt. Für die
Auswahl maßgebend war die Verwendungshäufigkeit der Verfahren
202 Kapitel 6 · Evaluation der Eignungsbeurteilung

. Tab. 6.1  Zusammenfassung metaanalytischer Ergebnisse bei Schmidt und Hunter (1998)

Verfahren Vorhersage von Berufserfolg Vorhersage von Ausbildungserfolg

r R mit Intelligenztests2 r R mit Intelligenztests2

Intelligenztests .51 .56


Arbeitsproben .54 .63 k. A.
Wissenstests1 .48 .58 k. A.
Interview, strukturiert .51 .63 .35 .59
Interview, unstrukturiert .38 .55
Assessment Center .37 .53 k. A.

6 Fragebogen zu Gewissenhaftig-
keit
.31 .60 .30 .65

Referenzen .26 .57 .23 .61

Anmerkungen: Auszug aus Tabelle 1 und 2 von Schmidt und Hunter (1998). Auswahlkriterium für die Verfahren:
durchschnittliche Verwendungshäufigkeit in Deutschland mindestens 10% (nach Schuler et al., 2007); Fragebogen
zur Gewissenhaftigkeit kamen in der Befragung von Schuler et al. nicht explizit vor, sondern nur allgemeine
messtheoretisch fundierte Persönlichkeitsfragebogen. Bezüglich der Vorhersage des Ausbildungserfolgs bestand nur
ein sehr kleiner Unterschied (r = .02) zwischen den Werten für strukturierte und unstrukturierte Interviews; daher wird
nur ein Mittelwert berichtet.
1Test zu berufsrelevantem Wissen (bei Schuler et al. entspricht dies „Leistungstest, z.B. Bürotest“).
2Die multiple Korrelation R wurde aus den Korrelationen von Intelligenztests und jeweils einem anderen Verfahren

mit dem Kriterium Berufs- bzw. Ausbildungserfolg sowie der Korrelation zwischen den beiden Prädiktoren geschätzt
(diese ohne Korrektur für Messfehler).

im Kontext der externen Personalauswahl in Deutschland, wie sie von


Schuler, Hell, Trapmann, Schaar und Boramir (2007) in einer Befragung
von 125 überwiegend großen Unternehmen ermittelt wurde.
Korrekturen gegen Bei der Interpretation der Koeffizienten in . Tab. 6.1 ist zu beachten,
Varianzeinschränkung und dass diese, wie oben bereits erwähnt, in den zugrundeliegenden Meta-
Messungenauigkeit beim analysen korrigiert wurden. Mit einer ersten Korrektur, der Korrektur
Kriterium gegen Varianzeinschränkungen (7 Kap. 5), wird der Tatsache Rechnung
getragen, dass die Berechnung sich nur auf eine Teilgruppe von Kandi-
datinnen und Kandidaten bezieht. Für die Kandidatinnen und Kandi-
daten, die aufgrund ihrer schlechten Ergebnisse im Prädiktor (z.B. Eig-
nungstest) nicht eingestellt wurden, liegen auch keine Kriteriumswerte
(z.B. Vorgesetztenurteile) vor. Die Streuung (Varianz) der Werte in der
Evaluationsstudie ist daher kleiner als in der ursprünglichen Gruppe
aller Kandidatinnen und Kandidaten. Eine weitere Korrektur betrifft die
Messgenauigkeit für das Kriterium Berufserfolg (Minderungskorrektur;
7 Kap. 5). Dieses kann mit hoher Messgenauigkeit erfasst werden (Bei-
spiel: von Mitarbeiter/-innen generierter Umsatz in einem Jahr) oder
mit einer eher niedrigen (Beispiel: Vorgesetztenbeurteilung). Deshalb
wird in Metanalysen üblicherweise eine Minderungskorrektur für
mangelnde Messgenauigkeit beim Kriterium durchgeführt (7 Exkurs
„Achtung bei Korrekturen und statistischer Optimierung!“).
6.4 · Ergebnisse einschlägiger Evaluationsstudien
203 6
Die Ausführungen zur Korrektur von Korrelationskoeffizienten
haben zwei wichtige Implikationen:
55 Die in Metanalysen berichteten Kriteriumsgültigkeiten
(. Tab. 6.1) erlauben einen direkten Vergleich der Verfahren.
So kann man sagen, dass ein strukturiertes Interview wesentlich
besser zur Vorhersage von Berufserfolg geeignet ist als ein
Assessment Center (r = .51 im Vergleich zu .37), wenn man den
Berufserfolg vor allem über Vorgesetztenurteile operationalisiert.
55 Wenn man die Kriteriumsgültigkeit eines Verfahrens selbst
ermittelt, so lässt sich die ermittele Korrelation nur dann mit den
in der Literatur berichteten Ergebnissen vergleichen, wenn die
Untersuchungsgruppen vergleichbar sind und wenn man die
gleichen Korrekturen vornimmt.

Die wichtigste Erkenntnis ist, dass sich mithilfe bestimmter Verfahren Verfahren mit hoher
Eignungsurteile vornehmen lassen, die eine sehr hohe Kriteriumsgültig- Kriteriumsgültigkeit kombinieren
keit für Berufserfolg haben, nämlich mit Intelligenztests, Arbeitsproben,
strukturierten Interviews und Tests zur Erfassung von berufsrelevantem
Wissen (r = .48 bis .54). Die Suche nach Verfahren, die Intelligenztests
am besten ergänzen, führt zu Arbeitsproben, messtheoretisch fundier-
ten Fragebogen zu Gewissenhaftigkeit und strukturierten Interviews
(R mind .60; „R“ steht hier für die „gemeinsame“ Korrelation mehre-
rer Auswahlverfahren mit Berufserfolg). Die in Metaanalysen aufge-
zeigte Kriteriumsvalidität von Arbeitsproben bezieht sich im Wesentli-
chen auf motorische Aufgaben, die eine physikalische Manipulation von
Gegenständen erfordern, nicht aber auf Assessment-Center-Übungen.
Zur Vorhersage von Ausbildungserfolg wurden deutlich weniger Ver-
fahren evaluiert. Intelligenztests kommt hier eine überragende Bedeu-
tung zu. Deren Kombination mit Gewissenhaftigkeit bringt den größten
Zuwachs bezüglich der Treffsicherheit der aus den Verfahren abgelei-
teten Eignungsurteile.
In der Folge werden ausgewählte eignungsdiagnostische Verfahren
in der Reihenfolge ihrer Nennung in der DIN (2016, S. 12) besprochen.

Schulnoten als Bestandteil der Dokumentenanalyse  Schulnoten sind


trotz ihrer eingeschränkten Vergleichbarkeit (7 Merktext unten)
bei Auswahlentscheidungen ein beliebtes Kriterium. Sie können im
Rahmen der Dokumentenanalyse sehr leicht und zuverlässig ermit-
telt werden.
Eine schon ältere Metaanalyse (Baron-Boldt, Schuler & Funke,
1988) ging der Frage nach, wie gut Schulnoten Studien- und Ausbil-
dungserfolg vorhersagen können. Dazu werteten die Autoren nur
Untersuchungen aus dem deutschen Sprachraum aus. Nach Korrektu-
ren für mangelnde Messgenauigkeit beim Kriterium und für Varianz-
einschränkung betrug der Zusammenhang zwischen Schulnoten und
dem späteren Studienerfolg r = .46 und r = .37 für Ausbildungser-
folg. Besonders zu erwähnen ist, dass keine einzelne Fachnote (z.B.
die Mathematiknote) ähnlich hohe Vorhersagewerte erreichte wie die
204 Kapitel 6 · Evaluation der Eignungsbeurteilung

Gesamtnote. Die Befunde zum Studienerfolg werden im Wesentlichen


durch eine aktuellere Metaanalyse von Trapmann, Hell, Weigand und
Schuler (2007) bestätigt.
Zur Vorhersage von Ausbildungserfolg auf der Basis von Schul-
noten liegt eine neuere deutsche Studie vor, in der Daten aus mehre-
ren Betrieben mit unterschiedlichen Ausbildungsberufen aggregiert
wurden (Velten & Schnitzler, 2011). Die Gesamtnote korrelierte r = .44
mit der Note in der Abschlussprüfung. Von den Einzelnoten ragte die
Mathematiknote mit r = .37 heraus. Da hier keinerlei Korrekturen vor-
genommen wurden, sind die Werte als besonders hoch einzuschätzen.
Schulnoten leisten einen Damit kann festgehalten werden, dass Schulnoten grundsätzlich
wichtigen Beitrag zur Vorhersage einen wichtigen Beitrag zur Vorhersage von Ausbildungs- und Studien-
von Ausbildungs- und erfolg leisten können. Die Kriteriumsgültigkeit von Eignungsurteilen
6 Studienerfolg auf der Basis von Schulnoten liegt im gleichen Bereich wie die von intel-
ligenztestbasierten Urteilen. Dies ist nicht verwunderlich, denn Schul-
noten sind ein Indikator für Intelligenz. Roth, Becker, Romeyke, Schäfer,
Domnick und Spinath (2015) schätzen den Zusammenhang zwischen
Schulnoten und Intelligenz anhand einer Metastudie mit Daten von ins-
gesamt rund 100.000 Personen auf r = .54. Die höchsten Zusammenhänge
zeigten sich dabei zwischen Intelligenztestleistungen und Schulleistungen
in Mathematik und Naturwissenschaften. Die Gesamtschulnote erwies
sich in allen Studien zur Vorhersage des Ausbildungs- und Berufserfolgs
als den Einzelnoten überlegen. Das gute Abschneiden der Gesamtnote
überrascht vielleicht, da die Herkunft der Noten nicht kontrolliert wurde
und Noten in vielerlei Hinsicht problematisch sind (siehe unten).

> Zur Vergleichbarkeit von Schul- und Examensnoten


Eignungsdiagnostiker/-innen benötigen nach DIN (2016, S. 24)
Grundkenntnisse über „Schul-, Hochschul- und Ausbildungsab-
schlüsse und relevante Veränderungen“. Sie sollten wissen, dass
Schulnoten innerhalb Deutschlands nicht gut vergleichbar sind.
Eine Note von 2,0 an Schule X bescheinigt nicht den gleichen
Bildungstand wie die gleiche Note an Schule Y. Das Gleiche gilt
auch für die einzelnen Bundesländer. Im Jahr 2013 variierten
die durchschnittlichen Abiturnoten in Deutschland zwischen
2,17 (Thüringen) und 2,61 (Niedersachsen) (Müller-Benedict,
2010). Die Vergabe von Noten dient nicht nur der Leistungs-
bewertung, sondern erfüllt verschiedene Funktionen (siehe
Kersting, 2015).
Solche Zahlen bedeuten aber nicht zwangsläufig, dass die
Schülerinnen und Schüler in Thüringen leistungsfähiger sind
als die in Niedersachsen. In einzelnen Schulfächern wurde
der Leistungsstand im Rahmen der PISA-Studie bundesweit
mit dem gleichen Test erfasst. Wenn die Schulnoten den
Leistungsstand beispielsweise im Fach Mathematik gut
abbilden, sollten die Schulnoten und die PISA-Test-Ergebnisse
hoch negativ korrelieren (negativ, weil im PISA-Test hohe
Werte für eine gute und auf der Notenskala niedrige Werte
6.4 · Ergebnisse einschlägiger Evaluationsstudien
205 6
für eine gute Leistung sprechen). Tatsächlich korrelierte die
mittlere Mathematiknote in der neunten Klasse r = .23 mit
dem PISA-Test. Je schlechter die mit dem PISA-Test erfassten
Mathematikleistungen in einem Bundesland waren, desto
besser (!) fielen die Schulnoten aus (Neumann, Nagy, Trautwein
& Lüdtke, 2009). Neumann et al. (ebd.) stellten einen direkten
Vergleich zwischen Hamburg und Baden-Württemberg an.
In beiden Ländern ist der Anteil der Schüler/-innen, die ein
allgemeinbildendes Gymnasium besuchen, sehr ähnlich.
Mithilfe von standardisierten Leistungstests wurde bei
rund 3.000 Schülerinnen und Schülern der Lernstand in den
Fächern Mathematik und Englisch im 13. Schuljahr erfasst
und mit den Fachnoten in Beziehung gesetzt. Während sich
im Fach Englisch nur kleine Unterschiede zeigten, waren die
Ergebnisse im Fach Mathematik deutlich verschieden: Obwohl
in Baden-Württemberg die Mathematiknote nur minimal besser
war als in Hamburg (8,2 versus 7,9 auf der 15-Punkte-Skala),
fielen die Mathematiktestleistungen in Baden-Württemberg
deutlich besser aus. Bei gleicher Testleistung erhielten die
Hamburger Schüler/-innen durchschnittlich 2,16 bzw. 1,57
(Grund- bzw. Leistungskurs) Notenpunkte mehr als die
Schüler/-innen in Baden-Württemberg.
Auch die Examensnoten sind schwer vergleichbar.
Müller-Benedict und Tsarouha (2011) berichten für die
Zeitspanne Wintersemester 1995/96 bis Sommersemester 2007
große Unterschiede zwischen den Fächern (die besten Noten im
Fach Biologie, die schlechtesten in den Rechtswissenschaften).
Die Durchschnittsnoten in einem Studienfach variieren zudem
zwischen den Universitäten. Besonders ausgeprägt war dies
für Germanistik für Lehramt. Einer Durchschnittsnote von
1,12 in Kiel stand eine Durchschnittsnote von 2,5 in Augsburg,
Bamberg und Regensburg gegenüber. Schließlich schwanken
die Noten an einer Universität in einem bestimmten Fach über
die Zeit.

Eignungsinterviews/direkte mündliche Befragungen  In 7 Abschn. 3.1


wurde bereits thematisiert, inwieweit und unter welchen Bedingun-
gen es möglich ist, aus Interviews zuverlässige und treffsichere Eig-
nungsbeurteilungen abzuleiten. In diesem Zusammenhang wurde auf
die Studie von Huffcutt, Culbertson und Weyhrauch (2013) hingewie-
sen, der zufolge die Übereinstimmung zwischen zwei Interviewerinnen/
Interviewern mit dem Grad der Strukturiertheit der Interviews (zur
Strukturierung 7 Abschn. 3.1) ansteigt, allerdings schon vor der höchst­
möglichen Strukturierungsstufe das Maximum erreicht.
Die Strukturiertheit schützt auch gegen Beurteilungsfehler. In der
in 7 Abschn. 3.1 ebenfalls bereits gen