You are on page 1of 64

Korrelationsanalysen

Taylan Zimmermann, Elissa Thomas & Milena Gloyer


Korrelationen, Korrelationskoeffizienten und partielle Korrelation
1. Korrelationen
2. Korrelationskoeffizienten
2.1 Spearmans Rho

2.2 Pearsons Rho

2.3 Kendalls Tau

2.4 Cramers V und Phi

3. Vergleich Odds Ratio mit relativem Risiko


4. Partielle Korrelation
4.1 Semipartielle Korrelation

5. Erstellung von Diagrammen in SPSS


6. Literatur 2
1. Korrelationen
Korrelation

4
Korrelation

5
1. Korrelationen

Korrelationsanalysen sollen Zusammenhnge und die Strke deren Ausprgungen zwischen


zwei oder mehreren Variablen untersuchen.
besteht aus einem Korrelationskoeffizienten und einem p-Wert.
Korrelationskoeffizient gibt Strke und Richtung des Zusammenhangs an.
Er liegt zwischen -1 (stark negativer) und +1 (stark positiver Zusammenhang).
Kein Zusammenhang besteht, wenn der Wert nahe 0 liegt.
Der p-Wert sagt aus, ob der Korrelationskoeffizient sich signifikant von 0 unterscheidet, ob
es also einen signifikanten Zusammenhang gibt.
Meistens werden p-Werte kleiner als 0,05 als statistisch signifikant bezeichnet.

6
1. Korrelationen
Voraussetzungen:
Zwei stetige und voneinander unabhngigen Variablen.
Merkmal gilt als stetig, wenn zwischen zwei Werten immer noch ein weiterer existiert und
dazwischen auch usw.
Bivariate Normalverteilung und Kardinalskalierung (Intervall-, Verhltnisskala) beider
Variablen
Linearer Zusammenhang oder nicht linearer Zusammenhang

7
1. Korrelationen

8
2.1 Pearsons Rho (r)
2.1 Pearsons Rho (r)

Korrelation nach Bravais-Pearson auch Produkt-Moment-Korrelation


Der Pearson-Korrelationskoeffizient r wird verwendet:
wenn die Daten normalverteilt sind, metrisch skaliert

und es einen linearen Zusammenhang zwischen beiden Variablen gibt.

linearen Zusammenhang berprft man am besten durch ein Streudiagramm.


Einzeichnung der Variablen auf x-Achse und y-Achse. Im Bild sieht man, ob es einen linearen
Zusammenhang zu geben scheint. Durch bildliche Darstellung wird ein mglicher linearer
Zusammenhang und dessen Richtung (positiv oder negativ) erkennbar.

Das Ergebnis ist ein r- Wert aber was damit anfangen?


2.1 Pearsons Rho (r)

r =.30 besteht ein geringer Zusammenhang


r =.50 besteht ein mittlere Zusammenhang
r =.70 besteht ein starker Zusammenhang
durch das Quadrieren von erhlt man das Effektstrkema 2
(Ma an aufgeklrter Varianz)
Ein gefundenes r=.30 wrde damit nur 2 =.09= 9% Varianz aufklren. Die restlichen 91%
verbleiben damit als ungeklrte Schwankungen zwischen und

11
Das ganze in SPSS

Datensatz Exam Anxiety.sav


12
Das ganze in SPSS

13
Das ganze in SPSS

Je grer die Angst, desto schlechter


die Note
Je mehr Lernzeit, desto besser die
Leistung
Je mehr gelernt, desto weniger Angst
ABER: Korrelation nicht gleich
Kausalitt, daher: Varianzaufklrung
durch R2. Dazu ein Beispiel:
Die Varianz der Prfungsleistung
kann zu (-.4410)2 = 0.0194 -> 19,4%
durch Prfungsangst erklrt werden.

14
Syntax

15
2.2 Spearmans Rangkorrelationskoeffizient
2.2 Spearmans Rangkorrelationskoeffizient

Derivat von Pearsons Rho (r)


errechnet sich nicht direkt aus Messungen, sondern aus den Rngen der Daten.
Dadurch knnen auch nicht-lineare Zusammenhnge erkannt werden

ist nicht auf normalverteilte Daten beschrnkt

Ordinale Skalierung

Ebenfalls wird ein r Wert ermittelt, dessen Effektstrke durch dessen Quadrat ermittelt
werden kann.

17
Das Ganze in SPSS

1. Rechenschritt

18
Das Ganze in SPSS

19
Das Ganze in SPSS

20
Das Ganze in SPSS

Die Korrelation zwischen Selbst- und


Fremdeinschtzung betrgt .643. Das bedeutet,
dass ein starker positiver Effekt vorliegt. Der Wert
.024 zeigt eine zweiseitige Signifikanz auf dem
0,05 Niveau.

21
Syntax

22
2.3 Kendall`s Tau
2.3 Kendall`s Tau

Ein Rangkorrelationskoeffizient (-1 bis +1).


Ordinal skalierte Variablen
Weniger verbreitet als der Spearman Rangkorrelationskoeffizient, jedoch weitaus mchtiger.

Im Gegensatz zu anderen Korrelationskoeffizienten werden alle Wertepaare untereinander


verglichen, nicht nur je die 2 Werte eines Paars
Auerdem ist die Anwendung von Kendalls Tau nicht auf Wertepaar-Reihen beschrnkt,
sondern kann auf beliebige Gre K x L Kontingenztafeln angewendet werden
Im Gegensatz zum Spearman Rangkorrelationskoeffizienten wird anstatt der quadrierten
Rangdifferenzen die Fehlordnung der Paare untereinander ausgewertet.
Deswegen ist Kendalls Tau unempfindlicher gegenber Ausreiern.
2.3 Kendall`s Tau

Die Logik dieser Koeffizienten basiert nicht darauf, dass Objektpaare in Bezug auf ihre
Rangpltze (und deren Differenzen) untersucht werden, sondern im Hinblick auf
konkordante und diskordante Objektpaare.
Es gibt 3 Varianten von Kendalls Tau

25
2.3 Kendall`s Tau

Das Schlerpaar A und B hat bei beiden


Schler X: Mathematiknote Y: Physiknote Variablen die gleichen Ausprgungen.
A 5 5
Es besteht somit dieselbe Rangordnung
B 4 4 zwischen beiden Schlern; das Schlerpaar
ist konkordant

26
2.3 Kendall`s Tau

Hier handelt es sich um eine inverse


Beziehung im Hinblick auf die Rangordnung:
Schler X: Mathematiknote Y: Physiknote Whrend C in Mathe besser ist als D, ist D in
Physik besser als C.
C 1 3
Das Paar ist diskordant (auch: inkonsistent,
negativ oder gegenseitig)
D 2 2

27
2.3 Kendall`s Tau
2.3 Kendall`s Tau

Was sind Ties?


Schler X: Y: Physiknote
Mathematiknote
Zwei Objekte sind verknpft (engl.: tied),
wenn sie bezglich einer oder beider
E 3 2
Variablen denselben Wert haben.

F 3 4 In diesem Beispiel ist das Paar bezglich der


X-Variablen verknpft; es ist tied on x
tau-b bercksichtigt ties:

29
2.3 Kendall`s Tau

30
2.3 Kendall`s Tau

Zur Interpretation:
Tau-a und tau-b knnen Werte annehmen zwischen 1 (perfekt negative Beziehung; nur
diskordante Paare) und +1 (perfekt positive Beziehung; nur konkordante Paare)

Merke:
Treten keine ties auf, wird tau-a verwendet, ansonsten tau-b
Tau-b kann den maximalen Wert von +1 oder 1 nur erreichen, wenn beide Variablen die
gleiche Zahl von Ausprgungen aufweisen
Tau-b nur wenn es quadratische Kontingenztafeln -> sind sonst Tau-c

31
Das Ganze in SPSS

32
Das Ganze in SPSS

33
Das Ganze in SPSS

Die Korrelation zwischen Selbst- und


Fremdeinschtzung betrgt .485. Das bedeutet, dass
ein mittleren Effekt vorliegt. Der Wert .028 zeigt eine
zweiseitige Signifikanz auf dem 0,05 Niveau.

34
Syntax

35
2.4 Cramers V und Phi

36
Cramers V

37
Phi

38
Das Ganze in SPSS

ber Kreuztabellen, Statistiken -> Phi und Cramers V anklicken


Auf Zellen anzeigen bei Hufigkeitswerte und Prozentwerte alles auswhlen
Anzahl in Zellen runden
Weiter
OK

39
3. Odds Ratio vs. Relatives Risiko
Odds Ratio vs. Relatives Risiko

Abhngigkeitsfaktor
Wird genutzt um die Abhngigkeit von einer oder veschiedenen Variablen herauszufinden

Gesucht wird ein (Wahrscheinlichkeits-) Faktor, mit welchem ein gleiches Ergebnis unter zwei
Bedingungen hufiger eintritt

Dieder Faktor knnte ein Risikofaktor oder ein begnstigender Faktor sein oder sich garnicht
auswirken

Es gibt zwei Mglichkeiten der Betrachtung -> Risk Ratio vs. Odds Ratio

41
Odds Ratio vs. Relatives Risiko
Relatives Risiko:
Berechnet die Wahrscheinlichkeit zu erkranken, wenn man einer Exposition ausgesetzt ist im
Vergleich zu denen die der Exposition nicht ausgesetzt sind und trotzdem erkranken.

Odds Ratio:
Berechnet die Wahrscheinlichkeit zu erkranken, wenn man einer Exposition ausgesetzt ist im
Vergleich zu denen die der Exposition nicht ausgesetzt sind und trotzdem erkranken.

Ergebnissinterpretation
Ist das Ergebnis 1 oder nahezu 1 gibt es keinen Unterschied in den beiden Gruppen, d.h. der Faktor
wre kein Risiko bzw. ein Vorteil

Ist der Wert > 1 wiegt der Risikofaktor entsprechend, je grer desto deutlicher der Einfluss

Ist der Wert < 1 wrde der Risikofaktor sich mglicherweise als Vorteil herausstellen

42
4. Partielle Korrelationen
4. Partielle Korrelationen

Korrelation zweier Variablen, nachdem der Einfluss weiterer Variablen herausgerechnet


(herauspartialisiert) wurde
Alle Nonsenskorrelationen (z.B. Strche und Babys) entstehen dadurch, dass man
vergessen hat, mindestens eine dritte, "vermittelnde Variable" herauszurechnen
Es sind daher vollstndige Korrelationen, bei denen das Weglassen der
Herauspartialisierung zu scheinbaren Sachverhalten fhrt.

44
4. Partielle Korrelationen

Der Korrelationskoeffizient zwischen den Variablen A und B, nach Herauspartialisierung der


Variablen C, berechnet sich durch:

45
4. Partielle Korrelationen

Die Ermittlung des Signifikanzniveaus des partiellen Korrelationskoeffizienten erfolgt in


folgenden Schritten:
Transformation des Partialkorrelationskoeffizienten (folgend mit x bezeichnet) in einen
Fisher Z-Wert.

46
4. Partielle Korrelationen

Berechnung der folgenden Gre:

n: Anzahl Wertepaare
k: Anzahl aller an der Korrelation beteiligter Variablen.
u ist standardnormalverteilt.
Ablesen des Signifikanzniveaus aus der Standardnormalverteilung.

47
4. Partielle Korrelationen

Anmerkung:
Da keine explizite Methode zur partiellen Rangkorrelation bekannt ist, wird bei
Ordinaldaten nherungsweise mit der partiellen Korrelation gerechnet.
Dabei werden die Rnge als natrliche Zahlen aufgefasst.

Der Fehler besteht darin, dass die partielle Korrelation die Abstnde der Zahlen (ehemals
Rnge) mit auswertet. Diese Information ist aber in den Rangreihen (nun Zahlenreihen)
nicht enthalten. Die Nherung ist also liberal.
Ein Test ist liberal, wenn er allzu "bereitwillig" signifikante Ergebnisse hervorbringt, also
dazu neigt, "Sachverhalte" anzudeuten, die in Wahrheit nicht vorhanden sind.

48
4. Partielle Korrelationen

Die Partialkorrelation ist gleich der Korrelation nullter Ordnung, wenn die Drittvariable Z
mit den beiden Variablen X und Y unkorreliert ist.
Die Partialkorrelation ist bspw. dann kleiner als die Korrelation nullter Ordnung, wenn alle
drei Variablen X, Y und Z positiv korreliert sind und die Drittvariable Z somit einen Teil des
positiven Zusammenhangs zwischen zwei Variablen X und Y, nicht aber den gesamten
Zusammenhang erklren kann.
Eine Partialkorrelation ist grer als die Korrelation nullter Ordnung, wenn die
Drittvariable mit einer der beiden anderen Variablen zu 0 korreliert ist.

49
Semipartielle Korrelation

50
Semipartielle Korrelation

Beeinflusst eine dritte Variable (z) ursachlich" beide Variablen x und y


Partialkorrelation
Wird der Zusammenhang zwischen den Variablen x und y durch die dritte Variable z
vermittelt" (z ist mit y korreliert und beeinflusst x) Semipartialkorrelation

51
Das Prinzip der partiellen Korrelation

52
Partielle Korrelation in SPSS

Datensatz Exam Anxiety.sav


53
Partielle Korrelation in SPSS

54
Partielle Korrelation in SPSS Untersuchung von Prfungsleistung
und Prfungsangst unter der Kontrolle
von Prfungsvorbereitung
Die partielle Korrelation zwischen
Prfungsergebnis und Prfungsangst
betrgt -.247. Dies zeigt eine
Verringerung im Vergleich zu dem
Ergebnis, wenn die
Prfungsvorbereitung nicht
kontrolliert wird(r=-.441).
Da der p-Wert .006 betrgt, zeigt dies
eine eine einseitige Signifikanz, die
Prfungsangst ist unter der Kontrolle
der Vorbereitungszeit signifikant
geringer.
Unter Kontrolle der
Prfungsvorbereitung kann
Prfungsangst 6% der Prfungs-
leistung beeinflussen, unter nicht-
Kontrolle sogar 19,4%

55
Syntax

56
5. Erstellung von Diagrammen in SPSS
Erstellung von Diagrammen in SPSS

58
Erstellung von Diagrammen in SPSS

59
Erstellung von Diagrammen in SPSS

-> Doppelklick auf Bild

60
Erstellung von Diagrammen in SPSS

61
6. Literatur
Literatur

Bortz, J. & Schuster, C. (2008). Statistikfr Human- und Sozialwissenschaftler (7. Aufl.).
Heidelberg: Springer.
Field, A. (2009). Discovering Statistics using SPSS. 3. Auflage. Thousand Oaks: SAGE
Publication
Universitat Zrich (2016). Datenanalyse. Zugriff am 28.11.2016. Verfgbar unter
http://www.methodenberatung.uzh.ch/de/datenanalyse/zusammenhaenge.html

63
Vielen Dank fr Eure Aufmerksamkeit!