Sie sind auf Seite 1von 24

M2

Tutorium
Wintersemester 20/21
10. Sitzung
einfaktorielle Varianzanalyse (=ANOVA)

●  UV wird auch Faktor genannt


●  Ausprägungen der UV werden als Faktorstufen bezeichnet
●  kategoriale (nominale oder ordinale) UV → metrische AV
●  UV kann 2 Faktorstufen haben oder auch mehrere Gruppen
umfassen
Grundprinzip der ANOVA (=ANalysis Of VAriance)
●  Ziel: Gruppenvergleich bzw. Feststellung von
Gruppeneffekten
→ beispielsweise ob sich Ost- und Westdeutsche hinsichtlich
einer Ausländerfeindlichkeitsskala unterscheiden
●  dafür werden die Y-Mittelwerte der Gruppen miteinander
verglichen
Variationszerlegungslogik bei 2 Gruppen
Variationszerlegungslogik
Gesamtvariation = erklärte Variation + nicht erklärte Variation
Gesamtvariation = Variation zwischen den Gruppen + Variation innerhalb der Gruppen

Gesamtvariation als Summe der quadrierten Abweichungen aller Personen in den


Gruppen vom Gesamtmittelwert

Variation zwischen den Gruppen als Summe der quadrierten Abweichungen der
Gruppenmittelwerte vom Gesamtmittelwert

Variation innerhalb der Gruppen als Summe der quadrierten Abweichungen aller
Personen vom Gesamtmittelwert
Variationszerlegungslogik

Gesamtvariation = nicht erklärte Variation + erklärte Variation



i-Person; j-Gruppe → i-te Person der j-ten Gruppe
Eta-Quadrat
●  als Anteil der erklärten Varianz an der Gesamtvarianz→ Interpretation: n% der
Varianz von Y kann durch X erklärt werden
●  als PRE-Maß → Interpretation: bei Kenntnis von X verbessert sich die Vorhersage
von Y um n%
●  wenn der Einfluss einer X-Variable mit zwei Ausprägungen auf eine metrische Y-
Variable untersucht wird, folgt: R-Quadrat = Eta-Quadrat
●  Wertebereich von 0 bis +1


Eta
●  asymmetrisches Zusammenhangsmaß
●  Keine Richtung, da Eta aus Eta-Quadrat berechnet wird →
●  Wertebereich von 0 bis +1
●  Vorteil gegenüber Pearson Korrelation r: Eta kann für nichtlineare
Zusammenhänge berechnet werden
●  Nachteil: steigt mit Kategorienzahl von X
ANOVA mit mehreren Gruppen
●  polytome UV
●  z.B. drei Unter-
richtsmethoden
Voraussetzung einfache ANOVA

●  Unabhängige Stichproben
○  D.h. jede Untersuchungseinheit/Person darf nur einmal

enthalten sein
○  Zufallsauswahl notwendig
ANOVA vs. Regression

●  Je stärker die nichtlineare Komponente eines Zusammenhangs, desto kleiner


R² im Vergleich zu η²
○  Bei perfekt linearem Zusammenhang stimmen sie überein
●  Fazit: bei sichtbar nichtlinearen Zusammenhängen zwischen metrischen
Variablen kann es sinnvoll sein, dass der Pearson-Korrelation r über eine
ANOVA das Assoziationsmaß η zu berechnen
○  Vorraussetzung dafür: UV hat nicht zu viele Gruppen, da sonst im Extremfall einzelne
Gruppen nur durch eine Person repräsentiert werden (within-Variation=0!)
Aufgabe
Eine Gesundheitsforscherin interessiert sich dafür, inwieweit sich der BMI eines
Befragten mithilfe der Ernährungsweise erklären lässt. Zur Untersuchung der
Fragestellung stellt sie zwei Gruppen gegenüber: Personen die sich überwiegend
vegetarisch ernähren (X=0) und Personen, die regelmäßig Fleisch essen (X=1).
Für 10 Personen erhält die Forscherin folgende Werte:


Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

a) Ihr möchtet die Fragestellung nicht im Rahmen einer Dummyregression


bearbeiten. Welche Alternative hierzu kennt ihr, um die Fragestellung zu
untersuchen? Begründet eure Wahl.
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

a)  Zusammenhangsmaß = einfaktorielle Varianzanalyse, weil:


●  Nominale UV (Ernährungsweise) à metrische AV (BMI)
●  Asymmetrischer Zusammenhang
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

b) Zusammenhangsmaß?


Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

b) Zusammenhangsmaß:
Eta, Eta-Quadrat
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

E0 = Gesamtvariation = 76
E1 = Fehlervariation = 66
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

Eta-Quadrat = 0,1316
Eta = 0,363

Interpretation?
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

Interpretation:
Eta2 beträgt 0,132.
PRE: Durch Kenntnis der Ernährungsweise lässt sich die
Vorhersage des BMI um 13,2% verbessern.

Eta beträgt 0,363.


Es besteht ein mittlerer Einfluss der Ernährungsweise auf
den BMI.
Aufgabe

c) Stellt euch vor, ihr hättet anstelle des gewählten Verfahrens eine Dummyregression
durchgeführt.
Welchen Wert würden Regressionskonstante und Regressionsgewicht annehmen?

Zur Erinnerung:
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).
Aufgabe

Zur Erinnerung:
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

Regressionskonstante b0 = 21 à durchschnittlicher BMI der Referenzkategorie (Veg.)


Regressionsgewicht b1 = +2 à Veränderung des BMI bei Wechsel der Kategorie von
Veg. auf Fleischessende

Y = b0 + b1 * D + E à Y = 21 + 2 * D + E
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

d) Welchen Wert würden R2 und Pearson 𝑟𝑋𝑌 annehmen, wenn ihr die Aufgabe
mithilfe einer Dummyregression gelöst hättet?
Aufgabe
Personen die sich überwiegend vegetarisch ernähren (X=0)
Personen, die regelmäßig Fleisch essen (X=1).

d) Welchen Wert würden R2 und Pearson 𝑟𝑋𝑌 annehmen, wenn ihr die Aufgabe
mithilfe einer Dummyregression gelöst hättet?
à  R2 würde denselben Wert annehmen wie Eta2
à  rXY würde denselben Wert annehmen wie Eta