Beruflich Dokumente
Kultur Dokumente
WS 2019/20
Reliabilitätsanalyse
1
Statistik II Fragenkatalog
WS 2019/20
Aus den Axiomen folgt, dass kein Zusammenhang zwischen Messfehler (E) und
wahrem Wert (T) besteht
Unabhängigkeitsaxiom: r (E,T) = 0
Zusätzliche Annahmen gehen von keinen Zusammenhängen zwischen
Messfehlern verschiedener Tests bzw. zwischen Messfehler und wahren Werten
aus anderen Tests aus r (EA, EB) = 0; r (EA, TB) = 0)
2
Statistik II Fragenkatalog
WS 2019/20
Wie kann die Reliabilität einer Messung bzw. Skala statistisch bestimmt
werden? Erläutern Sie einzelne Verfahren der Reliabilitätsberechnung!
Mehrere Berechnungsmethoden:
Re-Test Reliabilität: Korrelation zwischen aufeinanderfolgenden Messungen
Bei einfacher Messung Split-Half Methode, Paralleltestmethode bzw. Prüfung der
internen Konsistenz
Interne Konsistenzschätzung liefert beste Ergebnisse (Cronbach alpha), bei
Retest- und Paralleltestkoeffizienten häufig Unterschätzung der Reliabilität
-
Berechnung Cronbach alpha:
Verhältnis der Varianz zwischen Testpersonen (wahre Varianz) und der Varianz
zwischen Items
Je höher Testvarianz im Vergleich zu Itemvarianz, desto höher ist Reliabilität der
Messung
Mit zunehmender Anzahl der Items erhöht sich Reliabilität, weil sich Messfehler
gegenseitig eliminieren
Cronbach alpha
kann auch als Funktion der mittleren Item-Interkorrelation und der Anzahl an
Items beschrieben werden
Mittlere Item-Korrelation (MIC) als grobes Homogenitätsmaß der Skala
Formel setzt die MIC mit Anzahl der Items in Verbindung
Cronbach alpha kann Werte zwischen 0 und 1 annehmen
Werte > 0,7 (ausreichend), Werte > 0,8 (gute Reliabilität der Skala)
Bei vielen Items kann auch eine geringere Homogenität zu einer erhöhten
Reliabilität führen
Zusätzlich bewirkt hohe Homogenität immer hohe Reliabilität (Konstrukte werden
oft mit geringer inhaltlicher Breite gemessen)
Faktorenanalyse
3
Statistik II Fragenkatalog
WS 2019/20
Jeder beliebige Korrelationskoeffizient zwischen zwei Variablen lässt sich durch
zwei Vektoren mit einem genau definierten Winkel zueinander darstellen
o Diese beiden Items (Vektoren) stehen in einem Winkel von 60°
zueinander.
o Der Zusammenhang lässt sich im geometrischen Raum durch den Cosinus
des Winkels erfassen.
o Der cosinus von 60° beträgt 0,5, dies bedeutet, dass die beiden Items mit
0,5 miteinander korrelieren.
o In der Faktorenanalyse wird nun ein Faktor (C) hineingelegt, der die beiden
Items am besten repräsentiert
o Der Winkel zwischen dem Faktor und dem Item entspricht im Endeffekt der
Faktorladung (also cos 30°= 0,87)
o Die Ladung beschreibt die Korrelation des Items mit dem Faktor
o Bei einer Hauptkomponentenanalyse versucht der erste Faktor die meiste
Varianz aus allen Items zu erklären; der zweite Fraktor wird im 90° Winkel
zum zweiten Faktor gebildet, weil bei der PCA-Analyse von unabhängigen
Dimensionen ausgegangen wird
Orthogonale Rotation
Um die Interpretierbarkeit zu erleichtern und Faktorladungen zu maximieren, wird
Koordinatensystem bei Varimax-Rotation in seinem Ursprung gedreht
o Dabei wird Erklärungskraft der Faktoren verändert (Eigenwert und erklärte
Varianz des Faktors), jedoch nicht Kommunalität und Korrelation der Items
keine Datenmanipulation
o Anfängliche Faktorlösung wird solange rotiert, bis Items ideal Faktoren
zugeordnet werden können!
4
Statistik II Fragenkatalog
WS 2019/20
Lineare Regression
5
Statistik II Fragenkatalog
WS 2019/20
Nimmt Werte zwischen 0 und 1 an (0= keine, 1= perfekte Erklärungskraft), erklärt
standardisierte Koeffizienten
In welchen Situationen könnte das Bestimmtheitsmaß r² verfälscht sein?
Beschreiben Sie die problematische Rolle des Determinationskoeffizienten!
Auf ersten Blick erscheint r² als überzeugende Maßzahl (in der Praxis: Jagd nach
hohem R²) je mehr Variablen, desto anfälliger für Verzerrungen in der
Schlussfolgerung
Eine undifferenzierte Operationalisierung führt zu oberflächlicher Messung des
Merkmals, wodurch eine geringere „Erklärungskraft“ resultieren könnte
Wenn in multipler Regression wesentliche UVs unberücksichtigt bleiben, ist die
unerklärte Varianz i.d.R. hoch
Auch das Regressionsmodell könnte für einzelne Fragestellungen nicht geeignet
sein (Verletzung Linearität, Ausreißer in Daten)
Lässt indirekte Einflüsse von Drittvariablen unberücksichtigt
Trifft keine Aussage über Multikollinearität der UV
Multiple Regression
6
Statistik II Fragenkatalog
WS 2019/20
Wie funktioniert das Auspartialisieren von Drittvariablen in der multiplen
Regression?
Man rechnet bei beiden Variablen X und Y den Einfluss von Z heraus
Zusammenhang der Kontrollvariable auf X und Y wird berechnet mittels einer
linearen Regression
Der partielle Korrelationskoeffizient wird aus der unerklärten Streuung (Residuen)
dieser beiden Regressionsschätzungen berechnet
Der partielle Korrelationskoeffizient zeigt uns den bereinigten Einfluss der
angenommenen UV auf die AV unter Berücksichtigung der eingegebenen
Kotrollvariablen (nullter Ordnung)
Diagnose des Einflusses wird interpretativ durchgeführt, indem man die Situation
vor der Auspartialisierung mit dem Partialkorrelationskoeffizienten vergleicht
Wie lässt sich mit Regressionsmodellen prüfen, ob der Effekt des Geschlechts
auf das Einkommen (Gender Gap) in Österreich deutlicher ausgeprägt ist als in
Schweden?
Das Geschlecht wird zunächst gesplittet. Danach rechnet man zwei Regressionen.
Einmal für Österreich und ein weiteres Regressionsmodell für Schweden. Dann muss
man jeweils die standardisierten Koeffizienten vergleichen und somit kann man den
unterschiedlichen Effekt des Geschlechts auf das Einkommen vergleichen.
8
Statistik II Fragenkatalog
WS 2019/20
Prinzip der „OLS-Schätzung“: Abstände zwischen geschätzten und tatsächlichen
Werten werden quadriert Ausreißer bewirken eine deutliche Verzerrung. Bei
kleiner Stichprobe kann eine Regressionsschätzung mit Ausreißern zu
drastischen Verzerrungen führen. Problematik findet sich beispielsweise auf
höheren Abstraktionsebenen z.B. Länderebene
Man kann Ausreißer visuell analysieren mittels Streudiagramm oder partiellen
Regressionsdiagrammen. Lösung des Problems erfolgt durch Ausschluss von
Fällen oder durch Erstellung von Dummy-Variablen, mit welchen man den
Einfluss von Ausreißern messen kann.
Homoskedastizität Heteroskedastizität
9
Statistik II Fragenkatalog
WS 2019/20
Heteroskedastizität beeinflusst nicht Koeffizienten aber deren Standardfehler.
Varianzen bzw. Signifikanztest können Verzerrungen unterliegen, da die OLS-
Schätzung nicht mehr effizient ist.
In der linearen Regression leicht durch Streudiagramme aufzudecken
In der multiplen Regression partielle Regressionsdiagramme erstellen
Differenzierte Analysen durch Gestaltung von Schwellenwerten und
Varianzhomogenitätstests z.B. Levene`s Test
Logistische Regression
11
Statistik II Fragenkatalog
WS 2019/20
Linearität
Zwischen Logit- Werten und X-Variablen sollte eine lineare Beziehung bestehen
Residuen- Unabhängigkeit
Werte einer X- Variablen sollten über Beobachtungszeiträume nicht korrelieren
Autokorrelation
Ausreißer:
Unterschied zwischen y- Wert und prognostiziertem p- Wert
Unbeachtete Heterogenität
Spezifikationsfehler, wenn wichtige, mit anderen Prädiktoren unkorrelierte X-
Variablen nicht berücksichtigt werden
Koeffizienten in log. Regression immer unterschätzt
12