gesucht: Leistung bei Test, Reaktionszeit gegeben, vom Experimentator teilweise varriert: Geschwisterzahl willkrliche Manipulation der UV nur bei Experiment sind Kausalschlsse mglich Lose-Ziehen zufllige Zuordnung der VPersonen zu den UV-Stufen willkrliche Manipulierbarkeit der UV Verflschung durch Bndelung verschiedener Einflussfaktoren zB Generationsunterschiede (heute alle weniger Kinder) alle VP haben was gleiches gemeinsam kategorisch, was?, in Gruppen: Augenfarbe, Geschlecht verschieden bezeichnetes ist verschieden: Beruf, Konfession nur zwei Ausprgungen: mask/fem, bestanden/durchgefallen Rangfolge gut besser, Schulnoten, Gefahrenstufen wieviel?, Geschwindigkeit, Gewicht Zahlen gleiche Abstnde, willkrlicher Nullpunkt: a-b=c-d, Celsius wohldefinierter Nullpunkt, a/b=c/d, Zeit, Gewicht
Korellation:
hufigster Wert, nicht automatisch der reprsentativste aber: {1,2,3} alle sind Modalwert der Wert in der Mitte, robust {1,2,3}2 {1,2,3,4}=2+3/2 informativ, am meisten anwendbar Ausreieranfllig, muss in den Daten nicht vorkommen: {1,3}2
Verteilungen:
Interquartil:
Range: Varianz:
Spannweite: Abstand zwischen grtem und kleinstem Wert s2 = 1/n-1 i=0 (xi x) Euro
__________ n __
MW = 2 MW = 2+5 = 7
MW = 2 MW = 25 = 10
__
Stichprobe Population
x s2
^
^ = geschtzt
Messwiederholung
Tore schieen, einmal mit links, dann derselbe Mensch mit rechts
stetig: Normalverteilung; fr alle Zwischenrume als Mittelwerte. Es gibt unendliche viele Normalverteilungen. Fr einen einzelnen Wert (z.B. 49,0123) geht die Wahrscheinlichkeit gegen null, weshalb man Intervalle berechnet. =Mitte, =Breite; Standardnormalverteilung: =0, =1 Sie schlieen die Flche 1 ein Mittelwert =np Erwartungswert 2=np(1-p)
2 = 95% 1 = 68%
Konfidenzintervalle n=Anzahl der Versuchspersonen Konfidenzintervalle fr Anteile: (zu 95% in diesem Bereich:)
Mnze 100mal werfen, p=55%: w= 0,55(1 0,55) / 100 0,05 0,55-20,55 < p < 0,55+20,05 Die wahre Wahrscheinlichkeit fr Kopf liegt mit 95% im Intervall [0,45; 0,68]
Konfidenzintervalle fr Mittelwerte: (triviales Intervall = uninformativ, z.B. Krpergre [164, 174]) Bei wenigen VP:
x tn1
< < x + t n1
x 2
Hypothesentesten
< < x + 2
Teststatistik = Entscheidungshilfe fr oder gegen h0 Nullhypothese stimmt, wenn B innerhalb der 95% liegt = Annahmebereich der h0.
Unabhngige Stichproben ja nein M 100 150 250 W 110 140 250 210 290 500 h0: p(ja|M)=p(ja|F)=p(ja) h1: p(ja|M)p(ja|F) gestestet wird immer h0, dazu bentigt man p(ja)=0,42 erwartete Hufigkeiten eij: ja nein M e11=n1.p=105 e12=n1.(1-p)=145 n1.=250 W e21=n2.p=105 e12=n2.(1-p)=145 n2.=250 n.1= n.2=290 n..=500
Vierfelder:
Wenn 1 Wert im Innern feststeht, sind alle anderen durch die Randhufigkeiten ableitbar. sagt: es gibt (k)einen Unterschied, mehr nicht (wo er ist) nur kausal, wenn UV randomisiert t-Test fr unabhngige Stichproben
UV: angezogen (ja oder nein) AV: Gewicht N=6 (3 angezogen, 3 ausgezogen) s2i na 65 85 112 s2z a 64 86 110
s2i=500 s2u=1 s2i >> s2z Varianz innerhalb Gruppe gro abhngiges Design
r=
cov( x, y ) sx sy
UV: Geschlecht (nominal binr)..., (k)ein Kaffee AV: Lautstrke (quantitativ) 100 Mnner + 100 Frauen unabh 100 Paare abh verschiedenartige Zwillinge: haben was mitnander zu tun abh keine Interaktion unabhngig ja/neinchi Inferenzstatistik=Schlussfolgerung Teststatistik: braucht N>20