Stat 5 Anova1

Statistik fr Psychologen
5
Einfaktorielle Varianzanalyse
Hans-Rdiger Pfister, Gerd Meier
Experimentelles Design
AV: Fehler
Randomisierung
UV: Musik-Typ
Control
Pop
leise /
laut
UV: Lautstrke
Rock
leise /
laut
Jazz
leise /
laut
Classic
leise /
laut
t1
UV: Zeitpunkt
t2
Fragestellungen
Beeinflusst die UV (Unabhngige Variable, Faktor, Treatment, Bedingung)

die AV (Abhngige Variable, Response) kausal?
Welche Faktorstufen (treatment levels) sind kausal wirksam?
Existiert ein Trend? (Ordnung ber geordnete Faktorstufen)
Interaktion: Gibt es eine spezifische Wechselwirkung zwischen zwei (oder
mehreren) Faktoren hinsichtlich ihres Effekts auf die AV?
Wie stark ist der kausale Effekt?
Wie gro ist die Wahrscheinlichkeit eines Fehlers 1. Art und 2. Art?
Beispiel
7
6
error rate
5
4
3
2
1
0
Kontrolle
Popmusik
Klassik
Schlager
Music
error rate
5
4
normal
leise
2
1
0
Kontrolle
mit Musik
Music
Das Grundmodell der Varianzanalyse

(ANOVA: Analysis Of Variance)
AV: Abhngige Variable

e
AV
UV1
UV2
UV: Unabhngige Variable

e: Fehler (Stichprobenfehler,
Messfehler, andere
interindividuelle Unterschiede,
weitere unbekannte Faktoren)
Das Grundmodell
X ij = + ( j ) + eij = + j + eij
Xij:
Beobachtung: Messwert einer Person i in Bedingung j
Populationsmittelwert (grand mean) ber alle Bedingungen
j:
Populationsmittelwert in Bedingung j
eij:
Fehler: Abweichung der Person i in Bedingung j vom Mittelwert der

Bedingung j (Xij- j)
j:
Effekt (treatment effect): Abweichung des Mittelwerts in Bedingung j

vom grand mean (j- )
Visualisierung
eij
(eij)
(Xij)
Xij
Dekomponierung der Quadratsummen

X ij = + j + eij
X ij = x + ( x j x ) + ( xij x j )
X ij x = ( x j x ) + ( xij x j )
( X ij x ) 2 = (( x j x ) + ( xij x j )) 2
( X
i
x ) 2 = ( x j x ) 2 + ( xij x j ) 2
( X
i
ij
i
ij
x ) 2 =n ( x j x ) 2 + ( xij x j ) 2
SStotal
df = N-1
SStreat
df = k-1
SSerror
df = k(n-1)
Fehler
Fehler e:
der konkrete Messwert auf der abhngigen Variable einer Person wird durch eine
Vielzahl von Faktoren ko-determiniert, die zusammengefasst den Fehlerterm e
bilden.
die Fehlervarianz (d.h. die Unterschiede zwischen Personen, die nicht durch die
systematischen experimentellen Faktoren erklrt werden knnen =
Zufallsfluktuationen) in der Population wird bezeichnet durch 2e.
die Fehlervarianz in der Stichprobe in Bedingung j wird als Differenz zwischen dem
Bedingungsmittelwert und den Beobachtungen berechnet werden: eij = xij - j, und
dient als Schtzer der Populationsvarianz.
Annahmen fr Inferenzstatistische Tests:
Varianzhomogenitt: 21 = 22 = ... 2j = ... 2e
Normalverteilung: N(0, 2e)
Unabhngigkeit: Fehler sind ber die Bedingung nicht korreliert (->
Randomisierung)
Treatment
Treatment :
Falls ein Treatment j einen kausalen Effekt auf die AV hat,
wird der Wert der AV um eine Konstante j erhht oder
vermindert (treatment effect, causal effect).
Der Treatment Effekt bezeichnet die relative Abweichung in
Bedingung j vom grand mean: j = j - .
Der Treatment Effekt ist mit dem Fehler e unkorreliert.
In einem balancierten Design sind die Treatments
untereinander unabhngig (nicht korreliert).
Ein Gedankenexperiment
Gleiche Population,
kein Fehler
Gleiche Population,
mit Fehler
4 Treatments
X-Wert
Unterschiedliche Populationen,
kein Fehler
Unterschiedliche
Populationen, mit Fehler
aus Oestermeyer, Barquero, Pltzner (in Vorb.). Anschauliche Varianzanalyse.
Beispiel: Howell (p. 321, Table 11.1)
number words recalled
20
15
10
counting
rhyming
adjective
imagery
intentional
experimental condition
Statistische Hypothesen
Nullhypothese H0:
Die Stichproben unter allen k Treatments stammen aus der gleichen Population: die
Populationsmittelwerte sind fr alle Stichproben identisch
H0: 1 = 2 = ... = j ... = k

Alternativhypothese H1:
Die Stichproben unter allen K Treatments stammen nicht alle aus der gleichen
Population: Es existiert mindestens ein Stichprobenpaar mit unterschiedlichen
Populationsmittelwerten
H1: ij: i j
Mean Squares (MS)

Die Mean Squares (MS, Varianzschtzung) erhlt man, indem man die Sum of Squares
(SS, Summe der Abweichungsquadrate) durch die jeweiligen Freiheitsgrade df
dividiert (N = kn: Gesamtstichprobe; n: Stichprobengre einer Bedingung; K: Anzahl
Bedingungen):
SStotal
N 1
SS error
MS error =
K (n 1)
SS
MStreatment = treatment
K 1
MStotal =
Whrend sich die Quadratsummen (SS) additiv verhalten (Total = Treatment + Error),
verhalten sich die Mean Squares (MS) nicht additiv!
Die Logik des Signifikanztest in der ANOVA

(A) Schtzung der Populationsvarianz durch MSerror (Mean
Square Error, MSwithin):
Da die Varianz innerhalb jeder Bedingung (treatment) durch den
Treatment Effekt nicht verndert wird (j ist konstant), kann die
Populationsvarianz durch die gepoolte (gemittelte) Varianz der K
Stichproben geschtzt werden. Diese Schtzung ist unabhngig
von der Wahrheit bzw. Falschheit von H0 oder H1.
s 2j
j =1
=
2
e
= MS error
(B) Schtzung der Populationsvarianz durch MStreatment

(Mean Square Treatment, MSbetween):
Angenommen H0 sei wahr. Dann folgt, dass alle Stichproben
(Treatment level) aus der gleichen Population stammen, und dass
deshalb ihre Mittelwerte nach dem zentralen Grenzwerttheorem
normal verteilt sind mit Varianz /n (vgl. Standardfehler des
Mittelwerts).
Dies gilt aber nur unter der H0!!
s =
2
x
e2
n
e2 = n sx2 = MStreat
MStreatment und MSerror

MSerror ist ein erwartungstreuer Schtzer fr die Fehlervarianz (d.h. die Populationsvarianz),
unabhngig von der Wahrheit von H0 oder H1:
E ( MS error ) = e2
MS error =
SS error
= e2
df error
MStreat ist ein erwartungstreuer Schtzer fr die Fehlervarianz nur dann, wenn H0 wahr ist. Andernfalls
(H0 ist falsch) ist 2 > 0, und dann schtzt MStreat die Summe aus Fehler- und Treatmentvarianz:
E ( MS treat ) = e2 + n 2
MStreat =
SStreat
e2
df treat
F-Verteilung und F-Test

(i)
Angenommen H0 sei wahr: Dann ist E(MSerror) = E(MStreat), da beide Terme unabhngige und
erwartungstreue Schtzer von 2e sind. Das Verhltnis beider Schtzer hat dann einen
Erwartungswert = 1.
(ii) Angenommen H1 sei wahr: Dann ist E(MSerror) < E(MStreat), da MStreat ein Schtzer fr die
Fehlervarianz plus Treatmentvarianz ist. Das Verhltnis der beiden Schtzer hat dann einen
Erwartungswert > 1.
Die F-Verteilung: Das Verhltnis zweier unabhngiger Schtzungen der Populationsvarianz folgt der
sogenannten F-Verteilung mit K-1 (Zhler) und K(n-1) (Nenner) Freiheitsgraden:
density(F)
0.7
Fdftreat =k 1; df error =k ( n 1)
MStreat
=
MSerror
0.6
0.5
0.4
0.3
0.2
0.1
1
Die F-Verteilung
Dichtefunktion
Verteilungsfunktion
df = 6,50
1.0
0.7
0.6
0.8
Probability F < x (df:3,16)
Density (df:3,16)
0.5
0.4
0.3
0.6
0.4
0.2
0.2
0.1
0.0
0.0
0
F-value
F-value
Beispiel: F=5%;df=3,16 = 3.239
Beispiel: Howell (p. 321, Table 11.1)

> how11.1.aov <- aov(RECALL ~ CONDITIO, data=how11.1)
> summary(how11.1.aov)
Df Sum Sq Mean Sq F value
CONDITIO
4 351.52
87.88
Residuals
45 435.30
9.67
Pr(>F)
9.0848 0.00001815 ***
number words recalled
20
15
10
counting
rhyming
adjective
imagery
intentional
experimental condition
10

Stat 5 Anova1

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Stat 5 Anova1

Hochgeladen von

Copyright:

Verfügbare Formate

Statistik fr Psychologen

Hans-Rdiger Pfister, Gerd Meier

Hans-Rdiger Pfister, Gerd Meier

Beeinflusst die UV (Unabhngige Variable, Faktor, Treatment, Bedingung)

Hans-Rdiger Pfister, Gerd Meier

Hans-Rdiger Pfister, Gerd Meier

Das Grundmodell der Varianzanalyse

AV: Abhngige Variable

UV: Unabhngige Variable

Hans-Rdiger Pfister, Gerd Meier

Beobachtung: Messwert einer Person i in Bedingung j

Populationsmittelwert (grand mean) ber alle Bedingungen

Fehler: Abweichung der Person i in Bedingung j vom Mittelwert der

Effekt (treatment effect): Abweichung des Mittelwerts in Bedingung j

Hans-Rdiger Pfister, Gerd Meier

Hans-Rdiger Pfister, Gerd Meier

Dekomponierung der Quadratsummen

Hans-Rdiger Pfister, Gerd Meier

Hans-Rdiger Pfister, Gerd Meier

Hans-Rdiger Pfister, Gerd Meier

aus Oestermeyer, Barquero, Pltzner (in Vorb.). Anschauliche Varianzanalyse.

Hans-Rdiger Pfister, Gerd Meier

Beispiel: Howell (p. 321, Table 11.1)

number words recalled

Hans-Rdiger Pfister, Gerd Meier

H0: 1 = 2 = ... = j ... = k

Hans-Rdiger Pfister, Gerd Meier

Mean Squares (MS)

Hans-Rdiger Pfister, Gerd Meier

Die Logik des Signifikanztest in der ANOVA

(B) Schtzung der Populationsvarianz durch MStreatment

Hans-Rdiger Pfister, Gerd Meier

MStreatment und MSerror

Hans-Rdiger Pfister, Gerd Meier

F-Verteilung und F-Test

Hans-Rdiger Pfister, Gerd Meier

Probability F < x (df:3,16)

Beispiel: F=5%;df=3,16 = 3.239

Hans-Rdiger Pfister, Gerd Meier

Beispiel: Howell (p. 321, Table 11.1)

9.0848 0.00001815 ***

number words recalled

Hans-Rdiger Pfister, Gerd Meier

Das könnte Ihnen auch gefallen