Sie sind auf Seite 1von 2

06 Emp Wiss Arb

- Auswertung wenn man mehrere VP (Participant 10,11,12) hat (in R):

- Daten einlesen: File -> Import Dataset -> From Text (readr)

- Unten kommt dann rote Schrift: das ist nichts schlimmes, das ist standardmäßig so eingestellt

- Beim Reiter „Daten“ kann man sich auch hier die verschiedenen Variablen ansehen
(Reaktionszeiten, Versuchspersonen-Nummern, Testbedingung dunkles oder helles Licht,…)

- Wenn noch nicht alle Variablen angezeigt werden: ggf. Oben auf Pfeil bei „Columns“ klicken,
dann werden alle weitere Spalten angezeigt

- In diesem Datensatz sind viele Daten, die uns nicht interessieren: raus ltern

- daten <- subset(daten, !is.na(trials.thisN),select=c(Helligkeit, bloecke.thisN, trials.thisN, Taste.rt,


participant))

- Select… bedeutet: nur diese Variablen behalten wir, wir wählen also die Spalten, die wir
behalten wollen

- !is.na bedeutet: diese Zeilen behalten wir (z.B. Ergebnisse von Demotrials brauchen wir nicht,
wir brauchen nur die Ergebnisse des echten trial-loops)

- is.na ohne Ausrufezeichen bedeutet praktisch das Gegenteil: Ausrufezeichen in R kehrt einen
Befehl also praktisch um

- Enter: dann kommt unten ganz viel TRUE und FALSE… wichtig: die Zeilen, die wir behalten
wollen, brauchen ein TRUE, die die wir raus ltern wollen, bekommen ein False

- Also: wir bilden ein Subset, in dem wir alle Zeilen behalten, in denen bei den angegebenen
Variablen kein N/A drin steht, also wir behalten die Zeilen, in denen Werte drin stehen // und
außerdem behalten wir nur die relevanten Spalten

- Wenn man das ausführt, ist der Datensatz viel übersichtlicher geworden, sehr schön! (:

- RT umwandeln in ms (kennen wir schon)

- Mittlere Reaktionszeit ausgeben lassen (mean etc… kennen wir schon)

- Mittelwerte der Reaktionszeiten in Abhängigkeit von der Helligkeit, vom Block und von der VP:

- Trimmed Means pro Blick und VP und Helligkeit, gemittel über Replikationen:

mw.pro.vp.block.helligkeit <- aggregate(RT - Helligkeit + bloecke.thisN + participant, data-
daten, mean, trim-0.25)

- Mittelwert pro Block und Vp gemittelt über Helligkeit:



mw.pro.vp.block<-aggregate(RT-bloecke.thisN + participant,data-mw.pro.vp.block.helligkeit,
mean)

- Beim zweiten mal nicht erneut getrimmten Mittelwert, weil der ja schon getrimmt wurde beim
ersten mal

- Abbildung für eine VP (z.B. Vp10)



plot(RT - bloecke.thisN, data - subset (mw.pro.vp.block, participant -- 10), type-‚b‘, xlin-c(0,1)

- Xlin bedeutet: x-Achse soll zwischen 0 und 1 liegen

- Type b bedeutet: was für eine Art von Plot gemacht werden soll (p bedeutet „Point“, r bedeutet
Linie, b bedeutet „both“ für Punkt + Linie)


- Abbildung für alle 3 Vpn auf einmal: 



ähnlich: ... , type-‚b‘, xlin-c(0,1), ylin-c(200,600), ann-F, axes-F)

- ylin-c(200,600) stellen, damit Skalierung für alle Vpn tre end ist

- ann-F, axes-F bedeutet: Beschriftung und Achsen werden ausgeblendet (F steht für „False“)

- Block 0 soll weggelassen werden, weil Übungsblock

- kann man auch über die Vpn hinweg Mitteln (also durchschnittliche Zeit für DarkGrey und
durchschnittliche Zeit für White)

- Man braucht auf der x-Achse eine numerische Variable: statt darkgrey und White also in
numerisch umwandeln: umkodieren in 1 und 2 (code ist etwas komplizierter)

Befehl: ifelse (falls das eine gilt, tu das eine, falls das andere gilt, tu das andere)

- Achsen ausschalten, danach selbst erstellen

- lwd=0 meint Line-withd

- las=1 meint, dass Zahlen an y-Achse horizontal geschrieben sind

- das war jetzt deskriptive Statistik

- Wir wollen jedoch auch Inferenzstatistik machen

fi
ff
fi
- z.B. bezogen auf unser Bsp.: unterscheiden sich die beiden Lichtbedingungen voneinander
hinsichtlich der Reaktionszeit signi kant voneinander?

- 2 Zufallsvariablen: Xhell und Xdunkel

- H0: MüHell=MüDunkel

- H1: MüHell ≠ MüDunkel

- Einfacher in eine Variable umwandeln: D (Di erenz) = Xhell-Xdunkel

- Also H0: MüD = 0 // H1 ≠ 0

- Grundannahme: Reaktionszeiten normalverteilt

- Aus dieser Verteilung ziehen wir eine Stichprobe, z.B. n=6 Beobachtungen

- Für diese Stichprobe berechnen wir Mittelwert (kann man in R machen)



mue<-0

sigma<-1

sample.size<-6 --> Anzahl der Werte, die gezogen werden sollen

Stichprobe<-rnorm (sample-size, mue, sigma) --> rnorm meint Zufallszahlen aus einer
Normalverteilung ziehen

d.quer<-mean(Stichprobe)

- Wenn wir das ganz oft machen (z.B. 1000x) dann haben wir super viele Mittelwerte: die können
wir in einer Kennwerteverteilung zusammenfassen

- Aus diesen vielen Mittelwerten kann man wiederum einen Mittelwert (Erwartungswert) und eine
Standardabweichung (Standardfehler) berechnen

- Wenn unsere Beobachtungen unabhängig sind und von einer Normalverteilung stammen, dann
lt für die Stichprobenmittelwerte ebenfalls eine Normalverteilung, aber kleinere
Standardabweichung (Sigma/(Wurzel aus n))

- Wenn Ausgangsverteilung, aus der wir die Stichprobe ziehen jedoch nicht normalverteilt ist:
solange unabhängige Beobachtungen und Erwartungswert und Varianz bekannt, dann gilt für
Mittelwerte approximativ normalverteilt, sofern n groß genug ist (ab n>30)

- Wenn wir also aus Normalverteilung ziehen, wissen wir wie die Mittelwerte aussehen werden

- Wenn wir aus großer Stichprobe einer beliebigen Verteilung ziehen, wissen wir dass Mittelwerte
approximativ normalverteilt aussehen werden


- Bsp.: gegeben Normalverteilung, Erwartungswert 0, Standardabweichung 1/16

- Wie wahrscheinlich ist es, dass man einen Mittelwert zieht, der kleiner als -1 ist?

> pnorm (-1, mean=0, sd-sqrt (1/16))

- 3,16285e-15 bedeutet 3,16285*10^-5 (Komma wird also um 5 Stellen nach links gerückt)

- Wie wahrscheinlich ist es, dass man Mittelwert zieht, der größer ist als 0,75?

1-pnorm(0.75, mean=0, sd=sqrt(1/16))

- Rückschlüsse auf Grundgesamtheit ziehen:

- Wir brauchen eine Stichprobe und wir brauchen Annahmen vorher

- Annahmen: Beobachtungen, die wir ziehen sind unabhängig voneinander // Ausgangsverteilung


sei normalverteilt // Varianz der Ausgangsverteilung sei uns bekannt

- 5% Irrtumswahrscheinlichkeit üblich: beidseitig Kon denzintervall für Populations-Mittelwert


ausrechnen

- Dafür muss man Mittelwerte z-transformieren

- Probleme der Annahmen: Unabhängigkeit: die Testungen sind durchaus immer ein bisschen
abhängig voneinander (z.B. Klassenclown beein usst die Ergebnisse der ganzen Klasse) //
Normalverteilung nie ganz gegeben: aber dafür zentraler Grenzwertsatz und approximative
Annäherung an Normalverteilung // bekannte Varianz unplausibel --> daher Varianz der
Ausgangsverteilung aus der Varianz der Stichprobe schätzen

- Wenn Varianz geschätzt werden muss, wird t-Verteilung benutzt


fi
fi
ff
fl
fi