Beruflich Dokumente
Kultur Dokumente
Dieser Text ist mit Microsoft Winword geschrieben. Er beinhaltet die Lösungen als „ausgeblendeter Text“ formatiert.
Winword 2003: Sofern im Menü unter „Extras – Optionen“ „ausgeblendeter Text“ angekreuzt ist, sind die richtigen
Antworten sichtbar, wenn ausgeschaltet, nicht.
Winword 2003, 2007, 2010, 2013 etc: Ausgeblendeter Text lässt sich im Menü unter „Absatz“ mit Klick auf das Symbol für
Absatzmarken ein- und ausschalten.
Beim Ausdruck ist der versteckte Text übrigens standardmäßig ausgeschaltet. Wenn Du das mit diesem Text ausdrucken
möchtest, dann bei Winword 2007, 2010, etc. im Menü unter "Datei > Optionen > Anzeige > Druckoptionen". Dort findest
du den Punkt "Ausgeblendeten Text drucken".
Modul 6a Quizfragen WS19/20
Frage 1 Grundbegriffe Während sich die Klassischen Testtheorie mit den Komponenten beschäftigt,
aus denen sich der beobachtete Testwert zusammensetzt, untersucht die Probabilistische
Testtheorie...
A. ... den funktionellen Zusammenhang zwischen der Itembeantwortung einer Person und der
Personenfähigkeit der Peson. Dabei spielt Itemschwierigkeit eine Rolle.
B. ... den mathematischen Zusammenhang zwischen Testfehler und wahrem Wert
C. ... den funktionellen Zusammenhang zwischen der Itembeantwortung einer Person und der
Personenfähigkeit der Person. Dabei spielt Itemschwierigkeit keine Rolle
D. ... den zufälligen Zusammenhang zwischen dem Testwert und einer Itemlösung
E. ... den statistischen Zusammenhang zwischen dem latenten Merkmal und der Itemschwierigkeit
Antworten:
Frage 2 Welcher spezifische Vorteil ergibt sich aus der Anwendung des Verfahrens der Paralleltest-
Reliabilität?
A. ... Die ermittelte Korrelation ist nicht von Merkmalsveränderungen im Zeitverlauf abhängig.
B. ... Die Spezifität der Test-Situation kann explizit identifiziert und berücksichtigt werden.
C. ... Die hierfür erforderliche Konstruktion von sog. Itemzwillingen ist besonders einfach.
D. ... Damit lässt sich zeigen, dass ein Test das zu messende Merkmal misst und nicht irgendein
anderes.
E. ... Etliche reliabilitätsverändernde Einflüsse können eliminiert bzw. kontrolliert werden, wenn die
Reliabilität nach dem Paralleltest-Verfahren bestimmt wird
Antworten:
Frage 3 In welchen Fällen könnte die Fairness eines Tests verletzt sein?
A. ... Ein Teil der Personen, die an einem Test teilnimmt, bewertet diesen als nicht glaubwürdig.
B. ... Im Zuge eines Bewerbungsverfahrens müssen die Bewerberinnen und Bewerber einen
kognitiven Leistungstest bearbeiten. Dabei gibt es einige Personen, die sehr viel Erfahrung mit
Testsituationen haben, und es gibt Personen, für die es der erste Test ist.
C. ... Eine Grundschulklasse bearbeitet einen Schulreifetest. Ein Schüler hat seine Brille vergessen
und bearbeitet den Test so gut wie möglich.
D. ... An einem Test nehmen sowohl Personen mit IT-Kenntnissen als auch Personen ohne jegliche
Computererfahrung teil. Der Test wird von den Personen mit Papier & Bleistift bearbeitet. Der
Test wird automatisch durch einen Computer ausgewertet.
E. ... Die Testanweisungen werden nur vorgelesen. Auch Menschen mit einer Hörbehinderung
nehmen am Test teil. Über den Grad der Hörbehinderung gibt es keine Informationen.
Antworten:
Stand: 25.2.2020 Seite 2 von 19
Frage 7. Ordnen Sie den dargestellten Skalen die richtigen Bezeichnungen zu! (Ziehen Sie bitte die
richtigen Begriffe in die entsprechenden Felder im Bild!)
Frage 8. Ordnen Sie den verschiedenen Testarten die passenden Beschreibungen zu!
A. ... Projektive Verfahren
B. ... Persönlichkeitstests
C. ... Leistungstests
D. ... Objektive Persönlichkeitstests
E. ... Apparative Tests
1 Bei dieser Testart wird in der Regel ein qualitativer Ansatz bei der Erfassung verwendet
2 Probandinnen und Probanden müssen typischerweise Wissen reproduzieren. Aufgaben oder
Probleme lösen und/oder andere kognitive Leistungen erbringen
3 Bei dieser Testart ist nur das sogenannte „faking good“ möglich
4 Bei dieser Testart ist mit unterschiedlichen motivationalen Lagen bei den Probandinnen und
Probanden zu rechnen
5 Bei dieser Testart wird bspw. Motivation gemessen, indem das Verhalten in einer
standardisierten Testsituation erfasst wird
6 Mit dieser Gruppe von Test werden insbesondere sensorische und motorische Merkmale
erfasst
Antworten:
Frage 9. Der Test zur Messung des Gefühls der persönlichen Verantwortung zielt darauf ab, die generelle
Tendenz eines Individuums zum selbstverantwortlichen Handeln zu messen. Das Gefühl der persönlichen
Verantwortung stellt dabei ein komplexes Bündel personaler Ressourcen dar, das sowohl emotionale als auch
motivationale Aspekte beinhaltet. Die Messung des Merkmals erscheint nützlich bei Entscheidungen zur
Personalauswahl für Berufseinsteiger/innen.
Der Fragebogen besteht aus 40 Items. Die Items wurden auf Basis der Theorie "Das Gefühl der persönlichen
Verantwortung im Arbeitsleben" formuliert. Die Antworten werden auf einer sechsstufigen Skala erhoben,
wobei höhere Werte einer größeren Zustimmung entsprechen. Die verbalen Endpunkte der Skala werden mit
"sehr falsch" und "sehr richtig" gekennzeichnet. Die Antworten auf die 40 Items werden zu einem
Gesamtmittelwert zusammengefasst.
Auf Basis zweier Stichproben (n = 510 und n = 210) wurde mithilfe der Faktorenanalyse eine zweifaktorielle
Struktur des Fragebogens nahegelegt.
Aufgrund der Anzahl der Dimensionen lässt sich das Merkmal als ………(A)…….… bezeichnen. Es handelt
sich nicht um einen projektiven Test, sondern um einen ………(B)…….. Die dabei angewandte
Konstruktionsstrategie lässt sich als ……(C)……… bezeichnen. Die verwendete Antwortskala kann man am
treffendsten als ……(D)……. beschreiben.
Antworten:
Frage 12. In welchem Fall ist eine Anwendung der so genannten Ratekorrektur innerhalb der
deskriptivstatistischen Evaluation denkbar?
A. ... Bei Items eines Persönlichkeitstests.
B. ... Zur Korrektur der Itemvarianz bei Leistungstests.
C. ... Zur Korrektur der Itemschwierigkeit bei Auswahlaufgaben eines Leistungstests.
D. ... Zur Korrektur der Trennschärfe bei Leistungstests
E. ... Zur Korrektur der Itemschwierigkeit bei Leistungstest-Items, die nicht beantwortet wurden.
Antworten:
Frage 13. In der unten dargestellten Tabelle finden Sie die Statistiken zu einzelnen Items. Alle Items
gehören zur selben Skala. Die Items messen verschiedene Facetten der Arbeitszufriedenheit mit der
Skala: „gar nicht zufrieden“ (5), „eher nicht zufrieden" (4), "unentschieden" (3), „überwiegend
zufrieden“ (2) und „sehr zufrieden“ (1). Sämtliche Items sind so formuliert, dass ein hoher Wert für
Unzufriedenheit steht.
Frage 14. Ein Test zur Messung von "Zustandsangst" (Angst als State) besteht aus fünf (5) Items.
Für die Items aus dem Test sind folgende Kennwerte bekannt. Für die Messung der Items wurden 5-
stufige Ratingskalen verwendet: von 1 (stimme überhaupt nicht zu) bis 5 (stimme voll zu).
Frage 15. Ordnen Sie bitte den einzelnen Axiomen der KTT (Klassische Testtheorie) die richtige
Bedeutung zu!
A. ... Verknüpfungsaxiom
B. ... Unabhängigkeitsaxiom
C. ... Existenzaxiom
1 Jede Messung setzt sich aus dem wahren Wert einer Person und einem zufälligen Messfehler
zusammen
2 Die Korrelation zwischen den Messfehlern und den wahren Werten ist null. Das gilt bei
beliebigen Personen und beliebigen Items
3 Der wahre Wert (einer Person) entspricht dem Erwartungswert der Messungen eines
Probanden bei dem betreffenden Item.
4 Der Zusammenhang zwischen den wahren Werten zweier Messungen an beliebigen Personen
mit demselben Item ist Null
5 Die Fehlerwerte zweier Messungen mit beliebigen Items i und j bei derselben Person sind
unkorreliert
6 Die KTT ist im Wesentlichen eine „Messfehler-Theorie“
Antworten:
Stand: 25.2.2020 Seite 6 von 19
Frage 16. Eine alternative Beschreibung für den Messfehler (E) einer Person innerhalb der KTT
(Klassische Testtheorie) ist:
A. ... das Produkt aus Standardabweichung und Fehlertoleranz bei einer Person
B. ... die systematische Abweichung zwischen dem Testwert und dem wahren Wert bei einer Person
C. ... die Standardabweichung des Testwertes bei einer Person
D. ... die Differenz zwischen dem Testwert und dem konstanten wahren Wert einer Person
Antworten:
Frage 17. Aus der Verknüpfung von Existenzaxiom und Verknüpfungsaxiom folgt, dass der
Zufallsfehler den Erwartungswert Null hat.
Welche praktische Bedeutung lässt sich daraus ableiten?
A. ... Man könnte eine Person mehrmals einen Test wiederholen lassen. Daraus ließe sich der wahre
Wert als Mittelwert der Testwerte bestimmen.
B. ... Für die Bestimmung von wahren Werten in Persönlichkeitstests sind Testwiederholungen ein
probates Mittel, um den wahren Wert zu ermitteln.
C. ... Über mehrere Testdurchläufe hinweg sollte der wahre Wert mit gleicher Wahrscheinlichkeit
über- oder unterschätzt werden. In der Praxis kommt es jedoch zu systematischen Fehlern bei
Testwiederholungen, so dass diese Annahme auf diesem Weg nicht erreicht werden kann.
D. ... Theoretisch sollte eine Mittelwertbildung von mehreren Testläufen ermöglichen, den wahren
Wert zu bestimmen. Allerdings sind die dann entstandenen Fehler zufällig, da bei der Person
Erinnerungsffekte nicht ausgeschlossen werden können.
Antworten:
Frage 18. In einem Intelligenztest mit einem arithmetischen Mittelwert x = 50 und einer
Standardabweichung SD(x) = 15,7 erzielte ein Proband einen Testwert von 70.
Die Testreliabilität beträgt 0,84. Berechnen Sie den Standardmessfehler (bitte geben Sie zwei
Nachkommastellen an)!
Antwort:
Frage 19. In welchem theoretischen Bereich bewegt sich der Wert der Reliabilität?
A. ... Von minus unendlich bis plus unendlich
B. ... Von 0 bis 100
C. ... Von 0 bis 1
D. ... Von -1 bis +1
E. ... Von -3 bis +3
Antworten:
Frage 20. Welche Methode wird als so genannter "Königsweg" für die Bestimmung der Reliabilität
betrachtet?
A. ... Interrater-Reliabilität
B. ... Cronbachs Alpha
C. ... Testhalbierung
D. ... Retest-Reliabilität
E. ... Paralleltest-Reliabilität
Antworten:
Stand: 25.2.2020 Seite 7 von 19
Frage 21. Bei einem Test beträgt der prozentuale Anteil der wahren Varianz an der Varianz der
Testwerte 81%. Wie hoch ist der entsprechende Reliabilitätskoeffizient des Tests?
Antwort:
Frage 22. Die Testlänge eines Tests wird um einen parallelen Testteil verdoppelt. Welche Auswir-
kungen hat dies auf die Fehlervarianz und der Varianz der wahren Werte für den neuen Gesamttest?
A. ... Die Varianz der wahren Werte und die Fehlervarianz werden verdoppelt.
B. ... Die Varianz der wahren Werte wird vervierfacht und die Fehlervarianz wird verdoppelt.
C. ... Die Varianz der wahren Werte wird verdoppelt, die Fehlervarianz erhöht sich nicht.
D. ... Es gibt keine Auswirkungen auf die Varianz der wahren Werte, die Fehlervarianz wird hingegen
halbiert.
E. ... Es gibt keine Auswirkungen auf die Fehlervarianz. Die Varianz der wahren Werte wird
vervierfacht.
Antworten:
Frage 24. Ordnen Sie bitte den unterschiedlichen Konzepten der Validität die korrekten
Beschreibungen zu!
1 Inhaltsvalidität
2 Konstruktvalidität
3 Faktorielle Validität
A. ... Stützt die Zuverlässigkeit der Interpretation von Testergebnissen im Sinne erklärender Konzepte
B. ... Betrifft die Zusammenhänge zwischen einem Testwert und einem praktisch relevanten Kriterium
außerhalb der Testsituation
C. ... Betrifft die Beziehung zwischen Merkmal und Testinhalt
D. ... Betrifft die angenommene Dimensionsstruktur eines Tests
Antworten:
Frage 25. Worin unterscheidet sich der Aspekt der Inhaltsvalidität grundsätzlich von anderen
Aspekten der Konstruktvalidität?
A. ... Inhaltsvalidität lässt sich nur theoretisch herleiten, aber nicht empirisch prüfen.
B. ... Inhaltsvalidität bezieht sich auf einen frühen Schritt im Prozess der Testkonstruktion.
C. ... Zur Bestimmung der Inhaltsvalidität können Expertenurteile hinzugezogen werden.
Antworten:
Frage 26. Welche Aussage zur Definition von Validität und deren Implikationen lässt sich mit den
Inhalten der Vorlesung, des Tutoriums und/oder der Literatur (Moosbrugger et al.) vereinbaren?
A. ... Eine Aussage wie „Dieser Test ist valide“ kann für ein Testverfahren allgemeingültig getroffen
werden.
B. ... Validität sagt aus, wie genau ein Test das misst, das er messen soll.
C. ... Die Validierung eines Tests ist ein Routineverfahren.
D. ... Einzelne Validitätsaspekte können in Abhängigkeit vom Einsatzzweck eines Tests mehr oder
minder wichtig sein.
E. ... Validität lässt sich nicht aufgrund einer einzelnen Kennziffer, sondern nur durch akkumulierte
Hinweise beurteilen.
F. ... Validität ist eine Eigenschaft eines Testverfahrens.
G. ... Validität lässt sich nur für spezifizierte Interpretationen des Testergebnisses beurteilen.
Antworten:
Frage 27. Welche der folgenden Aussagen zur Validität ist in allen Teilen richtig?
A. ... Wenn ein Test mit konstruktfernen anderen Tests niedrig korreliert, indiziert dies eine hohe
Kriteriumsvalidität.
B. ... Es ist ein erwünschtes Ziel, wenn ein Test mit konstruktfernen anderen Tests niedrig korreliert,
weil dies ein Hinweis auf gegebene diskriminante Validität ist.
C. ... Es ist erwünscht, dass ein Test mit konstruktnahen anderen Tests hoch korreliert, weil dies für
hohe Kriteriumsvalidität spricht.
D. ... Es ist erstrebenswert, wenn ein Test mit konstruktfernen anderen Tests hoch korreliert, weil dies
für hohe konvergente Validität spricht.
E. ... Wenn ein Test mit konstruktfernen anderen Tests niedrig korreliert, spricht dies für geringe
diskriminante Validität.
Antworten:
Stand: 25.2.2020 Seite 9 von 19
Frage 28. In der Beschreibung eines Kreativitätstests finden sich folgende Angaben zur Testgültigkeit:
"Die Konstruktvalidität wurde anhand von konvergenten und diskriminanten Zusammenhängen mit
anderen Kreativitätstests, Persönlichkeits- und Leistungstests belegt. Die konvergenten
Zusammenhänge belaufen sich auf r = .65 mit der Skala Ideenreichtum, r = .60 mit dem Test für
Innovatives Denken und r = .68 mit der Skala Kreatives Potential. Aus den Big Five Faktoren besteht
nur zum Faktor »Offenheit für Erfahrungen« eine mittelhohe Korrelation von r = .34."
Welche Aussagen sind aufgrund dieser Beschreibung korrekt?
A. ... Eine hohe Korrelation zwischen einem Intelligenztest und dem Kreativitätstest wäre zum
Nachweis der diskriminanten Validität wünschenswert.
B. ... Die mittelhohe Korrelation mit einem Intelligenztest könnte als Beleg für die konvergente
Validität interpretiert werden.
C. ... Es werden keine Aussagen über strukturprüfende Ansätze der Konstruktvalidität getätigt.
D. ... Die niedrigen Korrelationen mit den anderen Big Five Faktoren lassen sich als Hinweise für die
divergente Validität des Kreativitätstests interpretieren.
E. ... Aufgrund der Beschreibung kann man ausgehen, dass prognostische Validität gegeben ist.
Antworten:
Frage 30. Bei der Faktorenanalyse stehen Ihnen zwei Klassen von Methoden zur Auswahl:
Explorative Faktorenanalyse und Konfirmatorische Faktorenanalyse. Welcher Aspekt spricht aus
heutiger Sicht nicht für die Anwendung der Explorativen Faktorenanalyse?
A. ... Man möchte die Ladungen der Faktoren auf einzelne Items betrachten.
B. ... Man möchte die Anzahl der Faktoren herausfinden, welche die betreffenden Items beeinflussen.
C. ... Man möchte Kennwerte für die Itemanalyse gewinnen.
D. ... Es gibt keine Annahmen über die dimensionale Struktur eines Itempools.
E. ... Es gibt eine klare Hypothese über die Anzahl der Faktoren, die annahmegemäß nicht
miteinander korrelieren sollen.
Antworten:
Frage 31. Welches Abbruchkriterium für die Anzahl der Faktoren in der explorativen Faktorenanalyse
verlangt, dass die Faktoren Eigenwerte von größer als eins aufweisen sollten, wenn sie als relevant
betrachtet werden sollen?
A. ... Varimax-Kriterium
B. ... Parallelanalyse
C. ... Scree-Test
D. ... Kaiser-Kriterium
E. ... Oblimin-Kriterium
Antworten:
Stand: 25.2.2020 Seite 10 von 19
Frage 32. Was ist der wesentliche Zweck der Rotation im Rahmen der explorativen Faktorenanalyse?
A. ... Die Zahl der extrahierten Faktoren soll überprüft werden.
B. ... Die Faktoren sollen durch Annäherung an die Einfachstruktur inhaltlich einfacher zu
interpretieren sein.
C. ... Es soll geprüft werden, ob die extrahierten Faktoren korreliert sind oder nicht.
D. ... Die theoretische Sparsamkeit der gefundenen Faktoren soll maximiert werden.
E. ... Datenreduktion.
Antworten:
Frage 33. Im Rahmen einer Explorativen Faktorenanalyse können verschiedene Kennwerte bestimmt
werden. Den Wert, der die Position einer spezifischen Person auf einem bestimmten Faktor anzeigt,
nennt man....
A. ... Eigenwert.
B. ... Kommunalität.
C. ... Faktorrang.
D. ... Faktorwert.
E. ... Faktorladung.
Antworten:
Frage 34. Die CFA ist innerhalb einer größeren Verfahrensgruppe eingebettet. Welche Aussagen sind
in diesem Zusammenhang zutreffend?
A. ... Die CFA kann als Teil der Explorativen Faktorenanalyse betrachtet werden.
B. ... Die CFA ist in die Verfahrensgruppe der Strukturgleichungsmodelle eingebettet.
C. ... Die CFA gehört zur Gruppe der Chi-Quadrat-basierten Hauptkomponentenanalysen.
D. ... Die CFA ist mit datenreduzierenden Verfahren der Faktorenanalyse gleichzusetzen.
E. ... In der CFA wird nur das Strukturmodell der latenten Variablen betrachtet.
Antworten:
Frage 35. Was sind die typischen Ablaufschritte einer CFA (Konfirmatorische Faktorenanalyse)?
A. ... Theorientwicklung - Itemgenerierung - Hypothesenprüfung
B. ... Modellspezifikation - Parameterschätzung - Modellevaluation
C. ... Externe Kriterien für die Konstrukte entwickeln - Korrelation zwischen Items und externen
Kriterien bestimmen - Korrelation zwischen Faktoren und externen Kriterien bestimmen
D. ... Itementwicklung - Faktorenanalyse durchführen - Faktorenrotation
Antworten:
Frage 36. Einer der wichtigsten Kennwerte für die Modellevaluation ist die Χ²-Statistik. Was ist ein
spezifischer Vorteil dieser Größe?
A. ... Sie ist unabhängig von der Stichprobengröße.
B. ... Sie basiert auf andere Kennwerte wie bspw. SRMR.
C. ... Sie erlaubt eine inferenzstatistische Prüfung des Modell-Fits.
D. ... Höhere Korrelationen führen zu größeren Chi-Quadrat-Werten.
E. ... Die Statistik vergleicht das postulierte Modell mit einem so genannten Null-Modell.
Antworten:
Stand: 25.2.2020 Seite 11 von 19
Frage 37. Worin liegt eine Gemeinsamkeit der exploratorischen Faktorenanalyse (EFA) und der
konfirmatorischen Faktorenanalyse (CFA)?
A. ... Beide Verfahren gehen von latenten Konstrukten aus.
B. ... Die inhaltliche Interpretation der Faktoren erfolgt bei beiden Verfahren vor Beginn der
Datenanalyse.
C. ... In beiden Verfahren laden Faktoren auf Items.
D. ... Beide Verfahren bieten für die Festlegung der Anzahl der Faktoren so genannte
Abbruchkriterien an.
E. ... In beiden Verfahren ist es möglich, dass die latenten Faktoren miteinander korrelieren.
Antworten:
Frage 38. Im Zuge der Modellidentifikation müssen mehrere Aspekte beachtet werden. Welche
Aussagen sind diesbezüglich zutreffend?
A. ... Ein Modell kann identifiziert sein, wenn die Anzahl der zu schätzenden Parameter kleiner ist als
die Anzahl der empirischen Varianzen und Kovarianzen.
B. ... Ein Modell kann identifiziert sein, wenn die Anzahl der Freiheitsgrade größer als die Anzahl der
latenten Faktoren im Modell ist.
C. ... Ein Modell kann identifiziert sein, wenn man die Varianz der latenten Variablen auf den Wert 1
fixiert.
D. ... Das Modell gilt als identifiziert, wenn alle Items positiv miteinander korrelieren.
E. ... Ein Modell kann identifiziert sein, wenn die Anzahl der Freiheitsgrade größer als Null ist.
Antworten:
Frage 39. Was ist charakteristisch für normorientierte Tests?
A. ... Die Bildung von z-Normen ist verpflichtend.
B. ... Die individuelle Testleistung wird mit einer Idealnorm verglichen
C. ... Die individuelle Testleistung wird mit einer Bezugsgruppe verglichen.
D. ... Sie sind adaptiv.
E. ... Sie werden ohne Zeitbeschränkung durchgeführt.
Antworten:
Frage 40. Eine Testperson hat in einem Intelligenzwert einen Testwert (Summenscore) von 50. Der
Mittelwert des Tests beträgt 60, die Standardabweichung beträgt 20. Welchem Intelligenz-Quotienten
entspricht der Testwert? (Gehen Sie davon aus, dass Normalverteilung der Testwerte gegeben ist.)
Antwort:
Stand: 25.2.2020 Seite 12 von 19
Frage 41. Welche Forderung ergibt sich aufgrund des beobachteten sog. Flynn-Effekts für die
Normierung von Testverfahren?
A. ... Die Normen sollten regelmäßig aktualisiert werden.
B. ... Die Normen sollten in einem der Fragestellung entsprechenden Kontext erhoben worden sein.
C. ... Die Normstichprobe sollte ausreichend groß sein.
D. ... Die Normstichprobe sollte für die Population repräsentativ sein.
E. ... Die Bildung von z-Normen sollte gegenüber der Bildung von Prozenträngen nach Möglichkeit
das Verfahren der Wahl sein.
F. ... Die Normen sollten für relevante Untergruppen differenziert berichtet werden.
Antworten:
Frage 43. Eine Person hat einen z-Normwert von 1,7. Welchem T-Wert entspricht diese Angabe?
Antwort:
Frage 44. Auf welche Bereiche beziehen sich Standards für psychologisches Testen nicht?
A. ... Entwicklung von Tests
B. ... Durchführung, Auswertung und Interpretation von Tests
C. ... Übersetzung von Testmanuals
D. ... Übersetzung und Anpassung von Tests
E. ... Entwicklung von Schätzalgorithmen
F. ... Evaluation von Tests
Antworten:
Frage 45. Was gilt allgemein für Testanwender während der Testphase (wenn man die gängigen
Teststandards beachtet)?
A. ... Sie sollten die Zustimmung der Probanden zum Test einholen.
B. ... Testanwender sollten mit ihrem Verhalten zur Verbesserung der Motivation des Probanden
beitragen
C. ... Sie sollten für ausreichende Aufklärung und Information des Probanden sorgen.
D. ... Testanwender sollten mit ihrem Verhalten zur Reduktion der Testängstlichkeit beitragen.
Antworten:
Stand: 25.2.2020 Seite 13 von 19
Frage .46 Welche der folgenden Aussagen trifft auf die Norm DIN 33430 zu?
A. ... Die Norm ist eine Richtlinie zur Zertifizierung von Testverfahren.
B. ... Die DIN 33430 wurde von der International Testing Commission (ITC) entwickelt.
C. ... Die Norm bildet die Grundlage zur Personenlizenzierung.
D. ... Die Norm bildet die Grundlage für die Ausbildung von Diplom-Psychologen / Psychologinnen.
E. ... Die DIN 33430 legt fest, wie PR-Werte zu berechnen sind.
F. ... Die DIN 33430 ist eine spezielle Richtlinie für internetbasiertes Testen.
Antworten:
Frage 47. Welche Auswirkungen hat das so genannte Reliabilitäts-Validitäts-Dilemma?
A. ... Bei gegebenen Itemvaliditäten sinkt die Kriteriumsvalidität mit steigenden Itemtrennschärfen
B. ... Die Verminderung der Reliabilität führt stets auch zur Verminderung der Validität.
C. ... Die Erhöhung der Reliabilität führt stets zur Verminderung der Validität
D. ... Die Reliabilität eines Items ist nicht gleich der Trennschärfe, da jedes Item und der
Gesamtscore mit ungleicher Genauigkeit messen.
E. ... Die Erhöhung der Validität kann zur Verminderung der Reliabilität führen, wenn ein Teil der
Validität auf unsystematische Messfehler zurückzuführen ist.
Antworten:
Frage 48. Was sind bekannte Probleme der Klassischen Testtheorie (KTT)?
A. ... Die Reliabilität eines nach der KTT konstruierten Tests kann von Sub-Population zu Sub-
Population schwanken.
B. ... Die Homogenität der Items kann mit Cronbachs Alpha evaluiert werden, was jedoch bei
längeren Skalen zu einer Überschätzung der Homogenität führt.
C. ... Die Validität eines nach der KTT konstruierten Tests kann von Sub-Population zu Sub-
Population schwanken.
D. ... Die wahren Werte sind nicht beobachtbar, jedoch können die Fehleranteile identifiziert werden.
E. ... Die Modellgültigkeit kann nur mit inferenzstatistischen Verfahren der KTT geprüft werden.
F. ... Das Intervallskalenniveau der Testwerte wird ungeprüft angenommen.
Antworten:
Frage 49. Ein neu entwickelter Leistungstest (ABZ-IST) wurde bei Schülerinnen und Schülern drei
Jahre vor Erreichung des Abiturs angewendet. Die gemessen Reliabilität des Tests auf Basis von
Cronbachs Alpha betrug .81. Drei Jahre später wurde die durchschnittliche Abiturnote (in Form der
durchschnittlich erzielten Gesamtpunktzahl) bei derselben Stichprobe erhoben.
Die unkorrigierte Korrelation zw. dem zurückliegenden Testergebnis und der Abiturnote betrug r=.46.
Welche Aussagen sind aufgrund dieser Beschreibung korrekt?
A. ... Da das Kriterium auch messfehlerbehaftet ist, würde die Korrelation höher ausfallen, wenn man
die Ungenauigkeit des Kriteriums statistisch in Betracht zieht.
B. ... Eine Anwendung der Verdünnungsformel in diesem Fall würde eine Kriteriumsvalidität von >1
ergeben.
C. ... Wäre die Reliabilität des Tests (ABZ-IST) niedriger als r = .81 und würde man die
Messungenauigkeit des Prädiktors korrigieren, dann wäre die korrigierte Kriteriumsvalidität noch
höher als bei der berechneten Reliabilität von r = .81.
D. ... Würde man die Messungenauigkeit des Prädiktors korrigieren, dann betrüge die korrigierte
Kriteriumsvalidität r = .51.
E. ... Die maximale theoretisch erreichbare Kriteriumsvalidität für den ABZ-IST beträgt unter diesen
Bedingungen .90.
Antworten:
Frage 50. Welchen Vorzug hat die Probabilistische Testtheorie (PTT) im Vergleich zur Klassischen
Testtheorie (KTT)?
Stand: 25.2.2020 Seite 14 von 19
A. ... Die PTT ist mathematisch weniger komplex als die KTT.
B. ... Die Itemhomogenität ist innerhalb der PTT prüfbar.
C. ... Die PTT erlaubt die Berechnung individueller Konfidenzintervalle.
D. ... In der PTT kann das Vorliegen des Intervallskalenniveaus überprüft werden.
E. ... Die Konstruktion von Tests nach der PTT ist einfacher, da die Voraussetzungen weniger
restriktiv als bei der KTT sind.
F. ... Wenn die Modellgültigkeit bestätigt wurde, dann sind die Modellparameter in der PTT
stichprobenunabhängig.
Antworten:
Frage 51. Welche Beschreibung der folgenden Latent-Trait-Modelle mit dichotomen Antwortformat
(Rasch-Modell, Zweiparameter-Logistisches Modell-Modell, Dreiparameter-Logistisches) ist
zutreffend?
A. ... Im Dreiparameter-Logistischen-Modell müssen die Itemschwierigkeit, die Itemtrennschärfe und
die Fremdtrennschärfe der Items geschätzt werden.
B. ... Im Einparameter-Logistischen-Modell muss nur der Itemdiskriminationsparameter geschätzt
werden.
C. ... Die Lösungswahrscheinlichkeit eines Items im Einparameter-Logistischen-Modell hängt nur vom
Personen- und Itemparameter ab.
D. ... Im Einparameter-Logistischen-Modell ist die Steigung der Item-Characteristic-Kurven (ICC) aller
Items dieselbe.
E. ... Im Einparameter-Logistischen-Modell muss nur der Rateparameter geschätzt werden.
Antworten:
Frage 52. Worauf kann das schlechte Abschneiden eines Bewerbers bei einem Intelligenztest, für den
das Rasch-Modell Gültigkeit hat, zurückgeführt werden?
A. ... Intelligenz, wenn sich der Bewerber„modellkonform“ verhalten hat.
B. ... Missverständliche Itemformulierungen, wenn sich der Bewerber„modellkonform“ verhalten hat.
C. ... Testangst, wenn sich der Bewerber„modellkonform“ verhalten hat
D. ... Sozial erwünschtes Antwortverhalten, wenn sich der Bewerber„modellkonform“ verhalten hat.
Antworten:
Frage 53. Was trifft in Bezug auf das Adaptive Testen zu?
A. ... Die Voraussetzung für IRT-basiertes adaptiertes Testen ist idealerweise ein Rasch homogener
Itempool mit kalibrierten Items.
B. ... Die Grundlage beim adaptiven Testen ist, dass Items ausgewählt werden, deren Schwierigkeit
mit der Fähigkeit des Probanden hinreichend übereinstimmen.
C. ... Die Grundlage beim adaptiven Testen ist, dass Items ausgewählt werden, deren
Itemtrennschärfe mit der Fähigkeit des Probanden hinreichend übereinstimmen.
D. ... Die Grundlage beim adaptiven Testen ist, dass Items ausgewählt werden, deren Rateparameter
mit der Fähigkeit des Probanden hinreichend übereinstimmen.
E. ... Im Vergleich zur klassischen Testbearbeitung erlaubt das adaptive Teste, dass weniger Items
verwendet werden, ohne dass die Messgenauigkeit darunter leider.
F. ... Die Grundlage beim adaptiven Testen ist, dass Items ausgewählt werden, deren
Lösungswahrscheinlichkeit mit der Fähigkeit des Probanden hinreichend übereinstimmen.
Antworten:
Stand: 25.2.2020 Seite 15 von 19
Frage 54. Welche Aussagen zu den Adaptiven Strategien beim adaptiven Testen sind korrekt?
A. ... Beim so genannten "branched testing" wird das nächst zu lösenden Testitem in Abhängigkeit
vom hochgerechneten Personenparameter ausgewählt.
B. ... Beim so genannten "branched testing" wird nach jeder Itembeantwortung die nächste zu
wählende Itemschwierigkeit berechnet.
C. ... Beim so genannten "tailored testing" wird vor Testbeginn festgelegt, welches Item bei Antwort
auf ein bestimmtes Item folgt.
D. ... Das so genannte "branched testing" ist in einem Paper&Pencil-Format realisierbar.
E. ... Das so genannte "tailored testing" erfolgt computerbasiert.
Antworten:
Frage 55. Ein IRT-Modell, bei dem lediglich Item-, Person- und Diskriminationsparameter berechnet
werden, heißt auch…
A. ... 2-PL-Modell.
B. ... 3-PL-Modell.
C. ... Ordinales Raschmodell.
D. ... Polytomes Latent-Trait-Modell.
E. ... Latent-State-Trait-Modell.
Antworten:
Frage 57. Welche Methoden bzw. Techniken kommen für den Einsatz im Rahmen der Erprobung der
vorläufigen Testversion in Frage?
A. ... Durchführung von Interviews im Anschluss an den Test.
B. ... Lautes Denken
C. ... Prognostische Befragung
D. ... Itemanalyse
E. ... Introspektive Revision
Antworten:
Frage 58. Welche Aussage in Bezug auf die Interne Konsistenz (Cronbachs Alpha) als eine Methode
zur Bestimmung der Reliabilität ist korrekt
A. ... Essentielle τ-Äquivalenz der Items ist ausreichend für die Berechnung von Cronbachs Alpha.
B. ... Die Berechnung von Cronbachs Alpha erfordert nicht, dass alle Items die gleichen Fehlervarianzen
aufweisen.
C. ... Es ist die häufigste Methode zur Schätzung der Reliabilität
D. ... Die Testhalbierungsmethode ist ein Spezialfall der Berechnung der Internen Konsistenz mittels
Cronbachs Alpha.
E. ... Jedes Item wird als eigenständige Messung des gleichen Merkmals aufgefasst
Antworten:
Stand: 25.2.2020 Seite 16 von 19
Frage 59. Ordnen Sie folgenden Zwecken der Faktorenanalyse bitte die jeweils am besten passende
Variante dieser Methode zu:
(1) Prüfung theoretischer Modellannahmen
(2) Entwicklung von Hypothesen über die interne Struktur psychologischer Konstrukte
(3) Datenreduktion
A. ... (1) Hauptkomponentenanalyse; (2) Hauptachsenanalyse; (3) Konfirmatorische Faktorenanalyse
B. ... (2) Hauptkomponentenanalyse; (1) Hauptachsenanalyse; (3) Konfirmatorische Faktorenanalyse
C. ... (3) Hauptkomponentenanalyse; (2) Hauptachsenanalyse; (1) Konfirmatorische Faktorenanalyse
D. ... (1) Hauptkomponentenanalyse; (3) Hauptachsenanalyse; (2) Konfirmatorische Faktorenanalyse
E. ... (3) Hauptkomponentenanalyse; (1) Hauptachsenanalyse; (2) Konfirmatorische Faktorenanalyse
Antworten:
Frage 60. Die konfirmatorische Faktorenanalyse (CFA) unterscheidet sich von der explorativen
Faktorenanalyse (EFA) durch folgende(s) Kennzeichen…
A. ... Bei der EFA können unterschiedliche Modelle inferenzstatistisch miteinander verglichen werden
B. ... Die CFA kann nur auf der Grundlage von Kovarianzmatrizen berechnet werden
C. ... Die Anzahl der Ladungen bei der CFA ist in der Regel kleiner als die Anzahl der Ladungen bei der EFA,
wenn die Anzahl der Faktoren identisch ist.
D. ... Bei der CFA werden latente und manifeste Variablen unterschieden
E. ... Die CFA erlaubt die Evaluation von hierarchisch geschachtelten Modellen
Antworten:
Frage 61. Sie möchten ein Testverfahren mit zwei Skalen konstruieren, die jeweils positive und
negative Emotionen erfassen sollen. Sie haben folgende Regel bei der Itemanalyse des neuen Tests
angewandt: „Eliminiere alle Items mit Trennschärfen < 0.30 und Schwierigkeiten < 0.25 und > 0.75.“
Nach der Eliminierung der übrigen Items bleiben zwei Skalen mit jeweils fünf Items übrig:
1- Skala zur Erfassung von positiven Emotionen mit den Items p1, p2, p3, p4 und p5.
2- Skala zur Erfassung von negativen Emotionen mit den Items n1, n2, n3, n4, und n5.
Welche der folgenden Aussagen sind richtig?
A. ... Der Test differenziert nicht unbedingt erfolgreich zwischen Menschen mit stark positiv und extrem positiv
ausgeprägten Emotionen
B. ... Die Trennschärfen der Items zur eigenen Skala werden durch die angewandte Regel eher verringert.
C. ... Durch die angewandte Selektionsstrategie bei den Items wurde die Varianz der Testwerte artifiziell
erweitert.
D. ... Bei der Konstruktion sollte beachtet werden, dass die Trennschärfe eines Items höher ist als die
Korrelation des Items zur anderen Skala.
E. ... Bei der Konstruktion sollte darauf geachtet werden, dass alle zehn Items möglichst hoch miteinander
korrelieren sollten
Antworten:
Stand: 25.2.2020 Seite 17 von 19
Frage 62. Im Folgenden sehen Sie einen Ausschnitt des Ergebnisses einer Konfirmatorischen
Faktorenanalyse (CFA).
Frage 63. In der Zeitschrift Diagnostica berichten Moshagen et al. 2014 u.a. über “psychometrische
Eigenschaften” der deutschsprachigen Version des 60-Item HEXACO Persönlichkeitsinventars auf
der Basis einer Stichprobe von N=3240. Ausgewählte Kennzahlen für die Skala Emotionalität werden
in der folgenden Tabelle den Ergebnissen der Eingangsbefragung der Studierenden des
Studiengangs B.Sc.Psy. im WS 16/17 der FernUni in Hagen (N=410) gegenübergestellt.
[Die Antworten auf die Items waren kodiert wie folgt : 1 (starke Ablehnung) , 2 (Ablehnung), 3
(neutral), 4 (Zustimmung), 5 (starke Zustimmung)].
Frage 64. Im Zusammenhang der Methoden der Reliabilitätsbestimmung werden in der Pflichtliteratur
die folgenden vier Situationen exemplarisch demonstriert.
Welche der folgenden Aussagen sind bezogen auf diese Abbildungen richtig?
A. ... In allen Abbildungen soll eine Situation mit 5 Versuchspersonen und zwei Testzeitpunkten dargestellt
werden.
B. ... In der Abbildung rechts unten wird die Split-Half-Reliabilität demonstriert.
C. ... Die Abbildung links oben zeigt einen Fall, wo jede Versuchsperson in der zweiten Testung den gleichen
Wert erzielt wie bei der ersten Testung.
D. ... Die Abbildungen rechts oben und links unten zeigen Fälle, wo jede Versuchsperson in der zweiten
Testung einen höheren Wert erzielt wie bei der ersten Testung.
E. ... In der Abbildung rechts oben wird die Paralleltest-Reliabilität gezeigt
Antworten:
Frage 65. Eine Testentwicklerin möchte die Reliabilität eines von ihr entwickelten Testverfahrens
schätzen und führt hierzu das Testverfahren an der gleichen Stichprobe zweimal durch und
berechnet die Korrelation der Testwerte.
Welche Methode zur Reliabilitätsschätzung hat die Testentwicklerin verwendet?
Tragen Sie Ihre Antwort auf der Linie ein. Tragen Sie nur eine Antwort ein. Diese kann aus mehreren
Worten bestehen. Wenn Sie mehrere Antworten eintragen, wird die erste Antwort gewertet.
Antwort: