Lohnerhofstraße 2,
78467 Konstanz
Seminararbeit
5. Semester
Vorgelegt von:
Cynthia Hubsch
cynthia.hubsch@jak.de
Matrikelnummer: 20110102
Abstract
Finding and recruiting the right employees is essential for the future
competitiveness and success of international companies. In this context, it is
analyzed and substantiated how promising psychometric test procedures are in
the recruiting system, whether they can measure the candidates' characteristics
and where their limits are.
I
Inhaltsverzeichnis
Abbildungsverzeichnis ......................................................................................... II
Tabellenverzeichnis ............................................................................................. II
1 Einleitung .......................................................................................................... 1
4 Fazit................................................................................................................ 21
Literaturverzeichnis............................................................................................. III
Anhang .............................................................................................................VIII
Abbildungsverzeichnis
Tabellenverzeichnis
Abkürzungsverzeichnis
FFM
Fünf-Faktoren-Modell ....................................................................................... 9
NEO-PI-R
NEO-Persönlichkeitsinventar............................................................................ 9
BFI
Big Five Inventar .................................................................................................. 9
1
1 Einleitung
Problemstellung
Fragestellung
Forschungsstand
Lorber und Kummer (2020) meinen, es sollte eher ein Kennenlerngespräch als
ein klassisches Bewerbungsgespräch geführt werden. Die Bewerber sind keine
Bittsteller mehr, die die Recruiter und Führungskräfte davon überzeugen müssen,
dass sie qualifiziert genug sind. Somit soll vorher bereits eine gute Vorauswahl
stattfinden, sodass nur geeignete Bewerber ins Vorstellungsgespräch kommen.12
Die Persönlichkeit der Mitarbeiter spielt in Unternehmen eine wichtige Rolle und
vor allem in der Personalauswahl macht es Sinn, die persönlichen Eigenschaften
eines Kandidaten vor der Einstellung zu analysieren, weil die Persönlichkeit im
Vergleich zum Fachwissen sich generell nur wenig über die Jahre hinweg
verändert.19,20 Ausserdem haben bereits diverse Validierungsstudien und
Metaanalysen, angefangen mit den Studien von Schmidt und Hunter (1980)
bewiesen, dass es Korrelationen zwischen bestimmten
Persönlichkeitsmerkmalen und beruflicher Zufriedenheit sowie beruflichem Erfolg
gibt. Bei Führungsrollen sind beispielsweise die Eigenschaften
Gewissenhaftigkeit und Extraversion für den Führungserfolg von Bedeutung.21
Einzelnen.23,24 In dieser Arbeit stehen die Soft Skills im Mittelpunkt, weil diese
auch im Recruiting immer bedeutsamer werden. Dies wird in der Abbildung 1
durch die hohen Prozentsätze bei den Soft Skills verdeutlicht.25
Immer mehr Unternehmen setzen neben dem Lebenslauf und dem Interview auf
Einstellungstests, um beurteilen zu können, inwiefern ein Bewerber die Hard
Skills und Soft Skills erfüllt. Diese Tests können kognitive Merkmale,
fachspezifisches Wissen oder Persönlichkeitsmerkmale abfragen. 32 Dadurch,
dass es so viele Test-Arten gibt, werden im Folgenden nur psychologische
Testverfahren genauer analysiert.
Dimension
Messgegenstand Wichtigstes Kriterium: welches Merkmal wird gemessen
Bsp.: Intelligenz, Aufmerksamkeit, Leistung, Persönlichkeit,
Einstellungen, Motivation
Art und Form des Test-Art Bsp.: Leistungstest, Persönlichkeitstest,
Tests Urteilstest, Deutungstest, Interessenstet,
verhaltensbasierter Test, psychometrischer Test
Test-Form Bsp.: Freies Antwortformat, Multiple-Choice-
Format, Power-Test (adaptiver Steigerungstest), Speed-
and-Power-Test (auf Zeit), Gruppentest, Papier-Bleistift-
Tests, Online-Test, Paralleltests, Testbatterie
➢ Die Fragen oder Aussagen werden Items genannt
Für welche Bsp.: Einstellungstest für Berufseinsteiger, Eignungstest
Fragestellungen für zukünftige Studierende, Fahrtauglichkeit, Identifikation
ist der Test von psychischen Störungen, Schultest
einsetzbar
Tabelle 1: Einteilung von psychologischen Testverfahren in 3 Dimensionen, in eigener Darstellung,
in Anlehnung an Schmidt-Atzert und Amelang et al.42,43,44
die Durchführung kann Einzeln oder in Gruppen erfolgen und die Bearbeitung
sowie die Auswertung kann manuell mit Durchsehblatt oder computergestützt
erfolgen.54,55
Die Tabelle 2 beinhaltet zudem einige Beispiele der 240 Items des NEO-PI-R.
Die Items können positiv als auch negativ sein und werden mithilfe der
Likertskala, welche in Abbildung 2 dargestellt ist, bewertet. Dabei gibt es bei den
Antwortmöglichkeiten kein richtig oder falsch.60,61 In der Buchhaltung kommt es
beispielsweise auf Eigenschaften wie Sorgfalt und Ordentlichkeit an, wobei im
Verkauf eher nach extrovertierten Personen gesucht wird.62 Zu beachten ist nur,
dass der Test ungültig ist, sobald der Proband mehr als 25 Items nicht
beantwortet.63
Abbildung 2: Eigene Darstellung der Likertskala, in Anlehnung an Tandon, Ein Ultimativer Leitfaden
Für Psychometrische Tests (2021).
Für ein besseres Verständnis zur Interpretation des NEO-PI-R sind im Anhang B
die Ergebnisse je Domäne dargestellt. Hervorzuheben ist, dass die Domäne
Offenheit den kreativen Motivationsfaktor erfasst.64
Dadurch, dass das NEO-PI-R ein beliebtes Verfahren ist, um die Persönlichkeit
eines Probanden zu messen, wird im Folgenden untersucht, wie messbar das
NEO-PI-R tatsächlich ist.
Zur Analyse der Gütekriterien der S-Form des NEO-PI-R wurden über mehrere
Jahre hinweg in mehr als 50 Studien 12.885 Probanden getestet (N=12.885).
Diese wurde schlussendlich mithilfe von festgelegten Ausschlusskriterien und
anhand einer zweiten Stichprobenziehung, die zur Zeit der Ziehung repräsentativ
für die Bevölkerung der Bundesrepublik war, auf eine Quotenstichprobe von
N=871 Personen reduziert. Bei der F-Form wurden N=1.627 Probanden getestet,
von denen N=1.547 in die finale Stichprobe aufgenommen wurden. Diese beiden
Stichproben bilden die Basis für die Analysen.71
3.3.1 Objektivität
Ein Test erfüllt das Kriterium Objektivität, wenn das Forschungsergebnis
unabhängig vom Testleiter und Testauswerter ausgewertet und interpretiert wird
und festgelegt ist, wie die Daten zu erheben sind.72,73 Durchführung, Auswertung
und Interpretation müssten demnach im Idealfall bei derselben Testperson immer
das gleiche Ergebnis aufzeigen, egal welcher Prüfer den Test interpretiert und
auswertet und egal unter welchen Umständen, wie Ort und Zeit, der Test
geschrieben wird.74,75 Die Objektivität kann in Durchführungs-, Auswertungs- und
Interpretationsobjektivität unterteilt werden, diese werden kurz in Anhang C
erläutert.
Tests wie der NEO-PI-R sind standardisiert, das heißt, sie werden unter
vergleichbaren Bedingungen durchgeführt und die Antwortmöglichkeiten sind in
einem Fragebogen vorgegeben, damit ein Vergleich der Ergebnisse möglich ist.76
Zudem werden die meisten Tests seit der Digitalisierung online durchgeführt und
die Antworten werden automatisch in den damit verbundenen Testwert
Für die Bestimmung des genauen Ausmaßes der Reliabilität wurden im Rahmen
der Klassischen Testtheorie die folgenden vier Vorgehensweisen entwickelt: die
Retest-Reliabilität, die Paralleltest-Reliabilität, die Testhalbierungs-Reliabilität und
die Innere Konsistenzanalyse.85,86 Meistens wird die Reliabilität der Domänen-
und Facettenwerte über Cronbachs α und die Retest-Reliabilität (ru) geschätzt.
Dabei ist Cronbachs α der gebräuchlichste Reliabilitätsschätzer und die Retest-
Reliabilität sorgt für die Homogenität der Skalen, indem in diesem Verfahren der
gleiche Test zu zwei verschiedenen Zeitpunkten vorgelegt wird, um dann beide
Ergebnisse miteinander zu korrelieren.87,88
Dimensionen α ru Facetten α ru
Neurotizismus (N) .92 .91 Ängstlichkeit .82 .86
Reizbarkeit .73 .73
Depression .85 .86
Soziale Befangenheit .62 .75
Impulsivität .64 .79
Verletzlichkeit .79 .88
Extraversion (E) .89 .91 Herzlichkeit .71 .83
Geselligkeit .80 .90
Durchsetzungsfähigkeit .80 .86
Aktivität .70 .75
Erlebnishunger .60 .91
Frohsinn .80 .86
Offenheit für .89 .89 Offenheit für Phantasie . .81 .87
Erfahrungen (O) Offenheit für Ästhetik .78 .88
Offenheit für Gefühle .76 .72
Offenheit für Handlungen .67 .77
Offenheit für Ideen .77 .88
Offenheit des Werte- und .53 .88
Normensystems
Verträglichkeit (A) .87 .88 Vertrauen .76 .85
Freimütigkeit .64 .48
Altruismus .70 .78
Entgegenkommen .64 .83
Bescheidenheit .74 .79
Gutherzigkeit .60 .83
Gewissenhaftigkeit .90 91 Kompetenz .65 .72
(C) Ordnungsliebe .70 .88
Pflichtbewusstsein .67 .75
Leistungsstreben .70 .81
Selbstdisziplin .81 .88
Besonnenheit .74 .80
Tabelle 3: Dimensionen und Facetten des NEO-PI-R, Reliabilität Form S (Cronbachs Alpha, N =
11.724), Retestreliabilität Form S (N = 70 Angehörige und Bekannte von Studierenden der
Universitäten Landau und Bielefeld, Intervall 1 Monat) (nach TM S. 104–106), in eigener
Darstellung, in Anlehnung an Berth und Goldschmidt.89
Am Beispiel des NEO-PI-R ist in der Tabelle 6 zu erkennen, dass die Werte der
S-Fom mithilfe von Cronbachs α und der Retest-Reliabilität (ru) ermittelt wurden.
Dabei liegen die Werte der Domänen nach Cronbachs α zwischen .87 - .92 und
die der Facetten bei .53–.85. Wegen der Kulturunterschiede zwischen den USA
und Deutschland fällt die Untersuchung mittels Cronbachs α etwas niedrig aus.
Die Retest-Reliabilität wurde mit einem Intervall von einem Monat und dann noch
einmal mit einem Intervall von fünf Jahren bemessen. Nach einem Monat lagen
die Werte der Domänen bei .88–.91 und die der 30 Facetten bei .48–.91. Nach
fünf Jahren lagen die der Hauptskalen innerhalb .74–.78 und die der Facetten bei
.53–.78. Dies deutet insgesamt auf eine gute bis sehr gute Reliabilität hin.
Bei der F-Form liegt die Interne Konsistenz der Hauptskalen bei .89–.95 und die
der Facetten bei .49–.84. Weitere Werte zur Retest-Reliabilität in
unterschiedlichen Intervallen, Stabilitätskoeffizienten und Profilreliabilität sind im
Testmanual des NEO-PI-R enthalten. Auch diese unterstreichen die insgesamt
zufriedenstellende Reliabilität des NEO-PI-R, was eine gute Messgenauigkeit
impliziert.93,94,95,96
Nur einige Facetten, bei denen der Reliabilitätswert unter .70 liegt, wie unter
anderem bei der Facette „Offenheit des Werte- und Normensystems“ = .53, sind
als kritisch zu werten. Diese Werte sind so niedrig, weil es 8 Items pro Facette
gibt.97 Allgemein haben FFM einen Medianwert der Domänen von .9 bei der
Langfassung und einen Mittelwert von .8 bei der Kurzfassung. Dieses hohe
Niveau an Reliabilität ist besonders in der Geschäftswelt interessant.98
Kontrolle auf.107 Variationen in der Validität gibt es vor allem durch die vielen
Übersetzungen und die damit verbundene Variation der Items des NEO-PI-R.108
Laut diversen Studien liegt die Validität der FFM meistens bei 0,4-0,67, wobei die
Dimension Offenheit oft am schlechtesten ausfällt und die Gewissenhaftigkeit am
meisten Validität aufweist.109,110,111 Die Validität von Persönlichkeitstests ist im
Vergleich zu anderen Recruiting-Maßnahmen wie Leistungstests und Arbeitstests
relativ hoch, dennoch liegt sie immer noch deutlich unter der Validität von einem
Interview.112
3.3.4 Kritik
Insgesamt sind die Ergebnisse in Bezug auf Objektivität, Reliabilität und Validität
der deutschen Übersetzung des amerikanischen NEO-PI-R durch die relativ
hohen Werte zufriedenstellend. Die Items laden am höchsten auf den
Hauptskalen auf, denen sie zugeordnet sind. Dennoch weisen sie auch
Nebenladungen auf andere Hauptskalen auf. Beispielsweise lädt das Item „Ich
bin voller Energie und Tatendrang“ zwar am höchsten auf der ihr zugeordneten
Domäne Extraversion auf, zeigt aber auch Nebenladungen auf Neurotizismus auf.
Dies passiert auch bei den Facetten. Es ist schwer, die Domänen komplett
voneinander abzugrenzen, da auch die persönlichen Merkmale Hand in Hand
gehen.113
Eine weitere Kritik ist, dass der NEO-PI-R überwiegend an Studenten getestet
wurde und sich so die Frage stellt, ob die Stichprobe überhaupt repräsentativ für
die deutsche Population stehen kann.116
Aber auch der Bewerber hat gewisse Vorteile bei solchen Tests. Schlechte Noten
oder ein schwacher Lebenslauf können dadurch kompensiert werden. Auch fällt
dem Bewerber die zu erfüllende Arbeit leichter und er kann den Erwartungen des
Unternehmens eher gerecht werden, wenn sein Ist-Profil nahe am Soll-Profil
liegt. Wenn der Kandidat den Test jedoch manipuliert, kann das nicht nur dem
Unternehmen, sondern auch ihm selbst schaden. Bei Persönlichkeitstests ist es
durch die hohe Augenscheinvalidität möglich, dass der Proband das Messprinzip
durchschaut und das Ergebnis in eine gewisse Richtung lenkt. Die Konsequenz
ist, dass die Validität des Tests dadurch verfälscht wird und der Kandidat
eventuell negative Merkmale aufzeigt, die er nicht hat oder eine Stelle bekommt,
für die er nicht geeignet ist. Dies kann mit Demotivation, Überforderung oder
Burn-out enden und das Unternehmen muss sich einen neuen Mitarbeiter
suchen und den ganzen Prozess wiederholen. Verhindert werden sollen diese
Manipulationstendenzen mithilfe von Kontrollfragen, der Klassischen Testtheorie
und der Likertskala.123,124,125
Ein weiteres Problem von Persönlichkeitstests im Recruiting ist, dass es über 300
Anbieter mit deutlich über 1000 Testverfahren gibt. Die Übersicht auf dem Markt
ist stark begrenzt und nicht alle Testverfahren sind vertrauenswürdig, wurden
wissenschaftlich auf ihre Gütekriterien geprüft und messen das Merkmal, was sie
messen sollen. Zudem haben nicht alle Personaler das Fachwissen diese Tests
richtig anzuwenden und zu werten.126,127 Bei der Interpretation ist zu bedenken,
dass bestimmte Persönlichkeitsmerkmale keine Garantie dafür sind, dass eine
Person effektiv gute berufliche Leistungen aufzeigen wird. Manche Personen
lassen sich sogar durch Tests in eine Schublade stecken, weil sie zu sehr auf
das Ergebnis vertrauen.128
Perfekt ist die Messbarkeit des Tests nicht, auch an der Akzeptanz der Tests und
den Manipulationsversuchen müsste sich etwas verändern. Persönlichkeitstests
mit FFM genügen jedoch, um im Recruiting eine Vorauswahl zu treffen oder das
Bewerber-Profil abzurunden. Das Testverfahren hilft als Ergänzung des
Prozesses und ersetzt nicht andere Recruiting-Methoden. Bei Testverfahren
muss vor allem darauf geachtet werden, dass sie wissenschaftlich fundiert sind,
die Gütekriterien weitestgehend erfüllt werden und sich an die gesetzlichen
Rahmenbedingungen gehalten wird. Wenn dann noch beide Seiten alle
Vorschriften halten und ehrlich sind, kann ein Persönlichkeitstest mit FFM für
Bewerber und Unternehmen insgesamt positive Wirkungen mit sich bringen.
4 Fazit
Die Persönlichkeit ist ein sehr komplexes Konstrukt und im Recruiting gibt es
diverse Eigenschaften, die nicht klar voneinander zu trennen sind, die der
perfekte Bewerber jedoch alle haben soll. Es ist aber nicht möglich, dass er alle
besitzen kann. Deshalb ist es wichtig, im Recruiting zuerst die Muss-
Eigenschaften des Kandidaten zu definieren, die für die gesuchte Position
fundamental sind.
Formen des BFI die zur Verfügung stehen und sich in ihren Gütekriterien und
Aufbau unterscheiden.
Literaturverzeichnis
Amelang, M., Hornke, L., & Kersting, M. (2011). Leistungs-, Intelligenz- und
Verhaltensdiagnostik (Bd. Psychologische Diagnostik 3). Göttingen:
Hogrefe Verlag.
Armoneit, C., Schuler, H., & Hell, B. (2020). Nutzung, Validität, Praktikabilität und
Akzeptanz psychologischer Personalauswahlverfahren in Deutschland
1985, 1993, 2007, 2020. Zeitschrift für Arbeits- und
Organisationspsychologie, 1 - 16.
Bregas, J., Heberle, K., & Nagels, F. (2022). Digitale Formate in der
Personalentwicklung. Wiesbaden: Springer.
IV
Guide, C. J. (20. 01 2020). LAB & Company beruft Heike Schoon-Pernkopf in die
Geschäftsführung. Abgerufen am 04 2022 von Crosswater-job-guide.com:
https://crosswater-job-guide.com/archives/73878/die-groessten-recruiting-
risiken-in-den-naechstens-fuenf-jahren/l.
idw- Infomationsdienst Wissenschaft . (27. 04 2017). Studie der IUBH zeigt: Zwei
Drittel der Führungskräfte sind in Unternehmen falsch eingesetzt.
Abgerufen am 05 2022 von Idw-online.de: https://idw-
online.de/de/news673615.
Rammstedt, B., Kemper, C., Klein, M., Beierlein, C., & Kovaleva, A. (2012). Eine
kurze Skala zur Messung der fünf Dimensionen der Persönlichkeit: BFI-
10. GESIS.
Anhang
Interpretation
Domäne Sehr ausgeprägt Nicht ausgeprägt
Extraversion gesprächig, gesellig, zurückhaltend, ruhig, gern
dominant, zupackend, allein, ernst, unabhängig,
spontan, herzlich, gehemmt, in sich gekehrt
optimistisch, heiter
Verträglichkeit ordentlich, überlegt, unvorsichtig, spontan, eher
arbeitsam, pünktlich, willensschwach,
verantwortlich, planend, unachtsam, ungenau,
sorgfältig, zuverlässig nachlässig
Gewissenhaftigkeit harmoniebedürftig, egozentrisch, stur,
friedlich, kooperativ, aggressiv, misstrauisch,
mitfühlend, nett, hilfsbereit, hart, sehr skeptisch,
nachgiebig wettbewerbsorientiert
Negative entspannt, zufrieden, gestresst, ängstlich,
Emotionalität ausgeglichen, selbstsicher, sorgenvoll, angespannt,
ungezwungen, unsicher, verlegen,
stressresistent pessimistisch, traurig
Offenheit vielseitig, neugierig, traditionell, bewahrend,
philosophisch, kreativ, eher wenig offen, engstirnig,
unkonventionell, reflektiv, konservativ, eher
fantasievoll konventionell
Eidesstattliche Erklärung
Ich versichere, dass ich diese wissenschaftliche Arbeit selbstständig und ohne
Benutzung anderer als der angegebenen Hilfsmittel angefertigt, nur die
angegebenen Quellen benutzt und die den benutzten Quellen wörtlich oder
inhaltlich entnommenen Stellen als solche kenntlich gemacht habe. Die Arbeit hat
in gleicher oder ähnlicher Form noch keiner anderen Prüfungsbehörde
vorgelegen. Mit meiner Unterschrift bestätige ich, dahingehend aufgeklärt worden
zu sein, Nachdruckgenehmigungen bezüglich Worten in Form von Zitaten oder
Abbildungen jeglicher medialer Präsentation und GEMA Nutzungsrechte von
Tonzitaten sowie von Youtube für kombinierte Wort und Bildrechte einholen zu
müssen, sollte ich meine Arbeit, in der ich Nachweise geführt habe, weiter
vermarkten wollen.