8
Varianzanalyse mit Messwiederholung
Within-Subjects
Design /
Messwiederholung /
Repeated
Measurement:
Die selbe Stichprobe
wird mehrfach unter
mehreren
Bedingungen
gemessen
Typische Anwendungsflle
Messung einer abhngigen Variable unter unterschiedlichen Treatments
Erinnerungsleistung unter verschiedenen Instruktionen
Reaktionszeit unter verschiedenen Beleuchtungsbedingungen
Messung mehrerer Items (z.B. eines Fragebogens oder Tests) auf einer
identischen Response-Skala
Persnlichkeitstest (ja/nein Antworten)
Produktrating (Ratingskalen 1 ... 7)
Messung einer abhngigen Variablen ber mehrere Zeitpunkte
(Longitudinalstudie)
Aktivittsindex ber 5-Minuten-Intervalle
IQ ber mehrere Jahre
Probleme
natrliche Entwicklungsprozesse
Alterungsprozesse
Ermdungsprozesse
technische Probleme
Belastung der Probanden
experimentelle Mortalitt
Konstanz der Bedingungen zwischen Treatments
Statistisches Modell
Fehlerterm fr den
Messwiederholungsfaktor
Individueller
Fehler von
Person i in
Stufe m
X im = + i + m + ( im + im )
Grand Mean
Effekt der
Person i:
Unterschiede
zwischen den
Personen
Interaktion von
Person i und
Stufe m
Visualisierung
Bei unabhngigen Stichproben gibt es nur den Treatment-Effekt und die FehlerKomponente, die alle individuellen Unterschiede, Messfehler, usw. enthlt.
Bei abhngigen Stichproben kann zwischen dem Fehleranteil, der auf interindividuellen
Unterschieden beruht, und dem Fehleranteil, der auf anderen Faktoren beruht,
unterschieden werden.
Die Personen (also die interindividuellen Unterschiede) knnen als ein weiterer Faktor
betrachtet werden (ein sogenannter random factor/Zufallsfaktor). Der dann noch
verbleibende Fehler ist die Interaktion zwischen Person und Treatment-Stufe.
Daraus folgt: die Fehlervarianz bei abhngigen Stichproben (Messwiederholungen) ist
stets kleiner als bei unabhngigen Stichproben (c.p.).
eim + im
Xim
SStot = ( xim x ) 2
SStotal
SSwithin Ss
SSbetween Ss
SSbetweenSs = m ( xi x ) 2
i
SStreat
SSerror(treat X Ss)
SStreat = n ( xm x )
Person i
Bedingung m
Hans-Rdiger Pfister, Gerd Meier
F-Test
2
E ( MStreat ) ( err
+ 2 ) + n 2
=
2
E ( MSerror )
( err
+ 2 )
MStreat
MSerror
V2
V3
22.333 22.000
V4
9.333
V5
5.778
6.778
20 19 10
17 15
25 30 13 12 17
30 27 13
19 27
26 16
17 18
26 24 14
15
Headaches
10
21 22
20
V1 V2 V3 V4 V5 subj
V1
V2
V3
V4
V5
Week
Beispiel
W1
21
20
17
25
30
19
26
17
26
22,33
W2
22
19
15
30
27
27
16
18
24
W3
8
10
5
13
13
8
5
8
14
22,00
Ipsativierung:
W4
6
4
4
12
8
7
2
1
8
9,33
W1
8.40
8.60
7.80
5.60
13.20
6.00
15.20
7.20
9.80
9.09
W5
6
4
5
17
6
4
5
5
9
5,78
W2
9.40
7.60
5.80
10.60
10.20
14.00
5.20
8.20
7.80
8.76
12,60
11,40
9,20
19,40
16,80
13,00
10,80
9,80
16,20
6,78
W3
-4.60
-1.40
-4.20
-6.40
-3.80
-5.00
-5.80
-1.80
-2.20
-3.91
Unterschiede
zwischen den
Personen
interessieren
nicht!
13,24
W4
-6.60
-7.40
-5.20
-7.40
-8.80
-6.00
-8.80
-8.80
-8.20
-7.47
W5
-6.60
-7.40
-4.20
-2.40
-10.80
-9.00
-5.80
-4.80
-7.20
-6.47
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
i
m
sum((weeks - matrix(rep(rowMeans(weeks),
each=5), nrow=9, byrow=TRUE))^2) = 2679.6
SStot = ( xim x ) 2
i
m
sum((weeks-mean(mean(weeks)))^2) = 3166.31
SSbetweenSs = m ( xi x ) 2
i
SSwithin Ss
SSbetween Ss
sum((matrix(rep(rowMeans(weeks), each=5), nrow=9,
byrow=TRUE) - mean(mean(weeks)))^2) = 486.71
SStreat
SSerror(treat X Ss)
SStreat = n ( xm x )
sum((matrix(rep(colMeans(weeks),
Hans-Rdiger Pfister, Gerd Meier each=9), nrow=9) - mean(mean(weeks)))^2) = 2449.2
486.71
60.84
Week
4 2449.20
612.30
subj:Week
32 230.40
7.20
SS(total) = SS(between) + SS(Week) + SS(between X Week)
summary(aov(Headache ~ Week + Error(subj/Week), data=week.long))
Error: subj
Df Sum Sq Mean Sq F value Pr(>F)
Residuals
8 486.71
60.84
Error: subj:Week
Df Sum Sq Mean Sq F value
Week
4 2449.2
Residuals 32
612.3
230.4
Pr(>F)
V1
21
V1
20
V1
17
V1
25
V1
30
V1
19
V1
26
V1
17
V1
26
V2
22
V2
19
V2
15
V2
30
V2
27
V2
27
V2
16
V2
18
V2
24
V3
7.2
..........
350
same
different
control
300
Abhngige Variable:
motorische Aktivitt
250
Activity
Faktor 1:
- Kontrolle
- gleicher Kontext
- verschiedener Kontext
200
150
Faktor 2 (Messwiederholung):
- Zeitinterall (6 Messungen im
Abstand von 5 min)
100
Hypothese:
Konditionierte Toleranz:
verschiedener Kontext =
Kontrollgruppe
50
Int1
Int2
Int3
Int4
Int5
Int6
Interval
SStotal
SStot = ( xikm x ) 2
i
df = knm - 1
SSwithin Ss
SSM
SSMxB
SS b t = m ( xik x ) 2
k
df = kn 1
= (k-1) + k(n-1)
SSerror(M)
SSbetween Ss
SSB
SSerror(B)
df = (m-1)(k-1)
SS M = nK ( xm x ) 2
SS err ( M ) = SS withinSs SS M SS M B
df = m - 1
df = k(m-1)(n-1)
SS M B = SS cell SS M SS B
SS cell = n ( xkm x ) 2
m
SS B = mn ( xk x ) 2
k
df = k - 1
SS err ( B ) = m ( xik xk ) 2
k
df = k(n-1)
ANOVA mit R
SS.Group
Error: subj
2 285815
142908
Residuals 21 384722
18320
Pr(>F)
7.8006 0.002928 **
---
Error: subj:Interval
Df Sum Sq Mean Sq F value
Interval
Group:Interval
Residuals
5 399737
10
Pr(>F)
80820
8082
3.0178
105 281199
2678
0.002164 **
761755.8 =
SS.within = SS.total SS.between
SS.Intervals
INTERVAL * GROUP
Fehler(INTERVAL)
Sphrizitt angenommen
Greenhouse-Geisser
Huynh-Feldt
Untergrenze
Sphrizitt angenommen
Greenhouse-Geisser
Huynh-Feldt
Untergrenze
Sphrizitt angenommen
Greenhouse-Geisser
Huynh-Feldt
Untergrenze
Quadratsum
me vom Typ III
399736,562
399736,562
399736,562
399736,562
80819,958
80819,958
80819,958
80819,958
281199,313
281199,313
281199,313
281199,313
df
5
3,285
4,337
1,000
10
6,569
8,674
2,000
105
68,979
91,080
21,000
Mittel der
Quadrate
79947,312
121695,64
92166,251
399736,56
8081,996
12302,398
9317,227
40409,979
2678,089
4076,581
3087,401
13390,443
Quadratsum
me vom Typ III
4113798,063
285815,042
384722,063
df
1
2
21
Mittel der
Quadrate
4113798,1
142907,52
18320,098
F
224,551
7,801
Signifikanz
,000
,003
F
29,852
29,852
29,852
29,852
3,018
3,018
3,018
3,018
Signifikanz
,000
,000
,000
,000
,002
,009
,004
,070