Beruflich Dokumente
Kultur Dokumente
Antworten Auf Die Übungsaufgabe Analyse Biologischer Daten".
Antworten Auf Die Übungsaufgabe Analyse Biologischer Daten".
Chapter 2
1. (a) 25 % (b) 33 % (c) 33 %
symmetrisch verzerrt bimodal
4.
5. Kontingenztabelle.
Quelle der Jungfische
Brüterei Wild Gesa
Die Analyse biologischer Daten – Whitlock und Schluter mt
78
Lösungen für Übungsprobleme..........................................................................................................1
Chapter 1.............................................................................................................................................1
Chapter 2.............................................................................................................................................2
Chapter 3.............................................................................................................................................9
Chapter 4...........................................................................................................................................10
Chapter 5...........................................................................................................................................11
Chapter 6...........................................................................................................................................16
Chapter 7...........................................................................................................................................17
p ′ ( 1 - p ′ )..........................................................................................................................................17
⎞............................................................................................................................................................19
⎠............................................................................................................................................................19
P = 2 { Pr [ 19 ] + Pr [ 20 ] + Pr [ 21 ] + Pr [ 22 ] + Pr [ 23 ] + Pr [ 24 ] }..........................................19
⎛12⎞ ⎝ 3⎠..............................................................................................................................................21
Kapitel 8...........................................................................................................................................21
X = 103 ( 0 ) + 72 ( 1 ) + 44 ( 2 ) + 14 ( 3 ) + 3 ( 4 ) + 1 ( 5 ) + 1 ( 6 ) = 0,94538...............................22
⎞............................................................................................................................................................24
⎠............................................................................................................................................................24
Kapitel 9...........................................................................................................................................28
Kapitel 10.........................................................................................................................................32
Chapter 11.........................................................................................................................................33
Chapter 12.........................................................................................................................................35
4(55) + 10(58) + 41(61) + 75(64) + 40(67) + 3(70).............................................................................38
Chapter 13.........................................................................................................................................38
⎛14⎞......................................................................................................................................................40
⎝ x ⎠......................................................................................................................................................40
A ⎞ ⎟ ⎠...................................................................................................................................................40
Kapitel 14.........................................................................................................................................43
Kapitel 15.........................................................................................................................................44
Kapitel 16.........................................................................................................................................51
Kapitel 17.........................................................................................................................................55
Chapter 18.........................................................................................................................................60
Chapter 19.........................................................................................................................................62
Kapitel 20.........................................................................................................................................65
⎜⎛ 4 7⎟⎞⎥⎤
12 .................................................................................................................................................65
⎝ ⎠⎦.......................................................................................................................................................65
⎝⎠..........................................................................................................................................................66
⎛185⎞⎤..................................................................................................................................................66
72 ⎟⎞ ⎠...................................................................................................................................................66
⎝113⎠⎦..................................................................................................................................................66
Kapitel 21.........................................................................................................................................67
6. (a) Die folgende Tabelle ordnet die Taxa von denen mit den am stärksten gefährdeten Arten zu
denen mit den am wenigsten gefährdeten Arten. (Andere Reihenfolgen könnten sinnvoll sein, z.
B. nach Stamm)
Taxon Anzahl der Arten
Pflanzen 745
Fisch 115
Vögel 92
Säugetiere 74
Muscheln 70
Insekten 44
Reptilien 36
Schnecken 32
Amphibien 22
Krebstiere 21
Spinnentiere 12
(b) Häufigkeitstabelle.
(c) Balkendiagramm, da die Daten kategorisch sind.
Gruppe
(d) Die Grundlinie sollte 0 sein, damit Balkenhöhe und -fläche der Frequenz entsprechen.
7. (a) Die Variablen sind Jahr (oder Hungersnotstadium) und Inzidenz von Schizophrenie. (b) Jahr
(und Hungersnotstadium) ist kategorial – ordinal. Die Inzidenz von Schizophrenie ist kategorisch
– nominell. (c) Kontingenztabelle.
(d) Proportionen: 1956: 0,0082, 1960: 0,0140, 1965: 0,0083. Andere Variationen des
Liniendiagramms unten sind gültig (z. B. könnte der Hungersnotzustand anstelle des Jahres die
erklärende Variable sein)
Es zeigte sich ein Muster: Die Häufigkeit von Schizophrenie war im Jahr 1960, dem Jahr der
Hungersnot, am höchsten.
8. (a) Gruppierte Histogramme. (b) Gruppen sind Krankheitstypen (Krankheiten, die direkt von
einem Individuum auf ein anderes übertragen werden, und Krankheiten, die durch
Insektenüberträger übertragen werden). (c) Die Variable ist die Virulenz der Krankheit. Es
handelt sich um eine kontinuierliche numerische Variable. (d) Relative Häufigkeit, der Anteil der
Krankheiten, die in jedem Virulenzintervall auftreten. (e) Direkt übertragbare Krankheiten sind
tendenziell weniger virulent als durch Insekten übertragene Krankheiten. Direkt übertragene
menschliche Krankheiten weisen häufiger eine geringe Virulenz und seltener eine hohe Virulenz
auf als durch Insekten übertragene Krankheiten.
9. (a) Karte. (b) Datum des ersten Auftretens der Tollwut (gemessen an der Anzahl der Monate nach
dem 1. März 1991). (c) Geografischer Standort – die Gemeinde.
10. (a) Die Starttemperatur ist die erklärende Variable, die Anzahl der O-Ring-Ausfälle ist die
Reaktionsvariable. Weil wir Ausfälle anhand der Temperatur vorhersagen möchten.
(b) Es besteht eine negative Assoziation. (c) Es wird vorhergesagt, dass niedrige Temperaturen
das O-Risiko erhöhen Ringfehler.
(b) 0.
(c) Asymmetrisch. Die Bandbreite der Geschwindigkeitsänderungen ist oberhalb des
Medians viel größer als unterhalb des Medians. Dies gilt unabhängig davon, ob wir das 3. Quartil
oder den gesamten Bereich betrachten. (d) Die Spanne der Box gibt an, wo die mittleren 50 %
der Messungen stattfinden (erstes Quartil bis drittes Quartil). (e) Der Mittelwert beträgt 1,19 cm/s
und ist damit größer als der Median (0,94). Die Verteilung ist rechtsschief und die großen Werte
beeinflussen den Mittelwert stärker als den Median. (f) 1,15 (cm/s) 2 (g) Das Intervall von
Y - s und Y + s beträgt 0,11 bis 2,26. Darin sind 11 der 16 Beobachtungen bzw. 69 % enthalten.
7. (a) Erhöhen Sie den Mittelwert um k . (b) Keine Auswirkung.
8. (a) Erhöhen Sie Y um das Zehnfache (11,9 mm/s) (b) Erhöhen Sie s um das Zehnfache (10,7
mm/s) (c) Erhöhen Sie den Median um das Zehnfache (9,4 mm/s) (d) Erhöhen Sie den
Interquartilabstand um das Zehnfache Zeiten (16,8 mm/s) (e) Keine Auswirkung. (f) Erhöhen Sie
s 2 um das Hundertfache (115,3 (mm/s) 2
9. (a) 5,7 Stunden. (b) 2,4 Stunden. (c) 83/114 = 0,73 (73 %). (d) Median = 5 Stunden, was weniger
als der Mittelwert ist. Die Verteilung ist rechtsschief und die großen Werte beeinflussen den
Mittelwert stärker als den Median.
Chapter 4
1. (a) 0,22 Stunden. (b) Die Stichprobenverteilung der Schätzungen der mittleren Zeit bis zur
Totenstarre. (c) Zufallsstichprobe aus der Leichenpopulation.
2. Der Median wird wahrscheinlich kleiner sein als der Mittelwert. Die Verteilung ist rechtsschief.
Extremwerte wirken sich stärker auf den Mittelwert aus und ziehen ihn nach oben als auf den
Median.
3. Probengröße.
4. (a) Falsch ( p ˆ ist nur eine Schätzung basierend auf einer Stichprobe). (b) Richtig (c) Richtig (d)
Falsch, dieser Bruch ist eine Konstante. (Abgesehen von der Möglichkeit einer Variation der
Genkopienanzahl zwischen Menschen) (e) Stimmt
5. (a) Der Anteil aller Kanadier, die der Aussage zustimmen. (b) Die Stichprobenschätzung beträgt
73 %. (c) Die Stichprobengröße beträgt 1641 Personen. (d) Das 95 %-Konfidenzintervall für den
Bevölkerungsanteil.
6. (a) 95,9 ms. Die Grundgesamtheit bedeutet Blitzdauer. (b) Nein, da die Berechnung auf einer
Stichprobe und nicht auf der Gesamtbevölkerung basierte. Zufällig weicht der
Stichprobenmittelwert vom Populationsmittelwert ab. (c) 1,9 ms. (d) Die Streuung der
Stichprobenverteilung des Stichprobenmittelwerts. (e) Unter Verwendung der 2SE-Regel ergibt
95,9 + 1,9 ms 92,2 < µ < 99,7. (f) Das Intervall stellt die plausibelsten Werte für den
Grundgesamtheitsmittelwert µ dar. Bei etwa 95 % der Zufallsstichproben aus der
Grundgesamtheit enthält das Intervall bei der Berechnung des 95 %-Konfidenzintervalls den
wahren Mittelwert der Grundgesamtheit.
7. Der Grundgesamtheitsmittelwert dürfte klein oder null sein.
Chapter 5
1. (a) 5/8 (b) 1/4 (c) 7/8 (entweder bedeutet in diesem Fall Peperoni oder Sardellen oder beides) (d)
Nein. (einige Scheiben enthalten sowohl Peperoni als auch Sardellen) (e) Ja. Oliven und Pilze
schließen sich gegenseitig aus (f) Nein. Pr[Pilze] = 3/8; Pr[Sardellen] = 1/2; wenn unabhängig,
Pr[Pilze & Sardellen] = Pr[Pilze] × Pr[Sardellen] = 3/16. Tatsächliche Wahrscheinlichkeit = 1/8.
Nicht unabhängig. (g) Pr[Sardellen | Oliven] = 1/2 (zwei Scheiben haben Oliven: eine dieser
beiden hat Sardellen) (h) Pr[Oliven | Sardellen] = 1/4 (vier Scheiben haben Sardellen, eine davon
hat Oliven) (i) Pr[letzte Scheibe hat Oliven] = 1/4 (zwei Scheiben der acht haben Oliven; Sie
erhalten immer noch eine Scheibe – das tut es nicht) Es spielt keine Rolle, ob deine Freunde vor
dir oder nach dir wählen). (j) Pr[zwei Scheiben mit Oliven] = Pr[erste Scheibe hat Oliven] ×
Pr[zweite Scheibe hat Oliven | erste Scheibe enthält Oliven] = 2/8 × 1/7 = 1/28. (k) Pr[Scheibe
ohne Peperoni] = 1 - Pr[Scheibe mit Peperoni] = 3/8 (l) Jedes Stück hat entweder einen oder
keinen Belag.
2. Pr[erfolgreiche Jagd) = Pr[Beute finden] × Pr[beute fängt | findet Beute] = 0,8 × 0,1 = 0,08.
3. 45 von 273 Bäumen haben Hohlräume, daher beträgt die Wahrscheinlichkeit, einen Baum mit
Hohlräumen auszuwählen, 45/273 = 0,165.
4. (a) Pr[Vokal] = Pr[A] + Pr[E] + Pr[I] + Pr[O] + Pr[U] = 8,2 % + 12,7 % + 7,0 % + 7,5 % + 2,8 %
= 38,2 % . (b) Pr[fünf zufällig ausgewählte Buchstaben aus einem englischen Text würden
„STATS“ ergeben] = Pr[S] × Pr[T] × Pr[A] × Pr[T] × Pr[S] = 0,063 × 0,091 × 0,082 × 0,091 × 0,063 =
2,7 × 10 –6 . (Jede Ziehung ist unabhängig, aber alle müssen erfolgreich sein, um die Bedingungen
zu erfüllen, daher müssen wir die Wahrscheinlichkeit jedes unabhängigen Ereignisses
multiplizieren.) (c) Pr[2 Buchstaben aus einem englischen Text = „e“] = 0,127 × 0,127 = 0,016 .
5. (a) Pr[A 1 oder A 4 ] = Pr[A 1 ] + Pr[A 4 ] = 0,1 + 0,05 = 0,15 (b) Pr[A 1 A 1 ) = Pr[A 1 ] × Pr[A 1 ]
= 0,1 × 0,1 = 0,01. (Dies ist nur wahr, weil sich die Individuen zufällig paaren. Wenn wir das
nicht wüssten, könnten wir die Wahrscheinlichkeit nicht berechnen. (c) Pr[nicht A 1 A 1 ] = 1 -
Pr[A 1 A 1 ] = 1 - 0,01 = 0,99 (d) Pr[zwei Personen nicht A 1 A 1 ] = Pr[nicht A 1 A 1 ] × Pr[nicht
A 1 A 1 ] = 0,99 × 0,99 = 0,9801. (e) Pr[mindestens eine von zwei zufällig ausgewählten Personen
hat den Genotyp A 1 A 1 ] = 1 - Pr[keine Person ist A 1 A 1 ] = 1 - 0,9801 = 0,0199. (f) Pr[drei
zufällig ausgewählte Individuen haben keine A 2- oder A 3- Allele] = Pr[sechs zufällig
ausgewählte Allele sind weder A 2 noch A 3 ] = Pr[ein Allel ist weder A 2 noch A 3 ] 6 ;
Pr[ein Allel ist weder A 2 noch A 3 ] = 1 – Pr[Individuum hat entweder A 2 oder A 3 ] = 1 – [Pr[A
·6
2 ) + Pr[A 3 )] = 1 – (0,15 + 0,6) = 0,25. Pr[allen drei fehlen diese Allele] = 0,25 = 0,00024.
6.
Pr[Summe zu 7] =
1/6Hand] × Pr[nicht giftig in der
7. (a) Pr[keine giftigen Schlangen] = Pr[nicht giftig in der linken
rechten Hand]= 3/8 × 2/7 = 6/56 = 0,107
(b) Pr[bite]= Pr[bite| 0 Giftschlangen] Pr[0 Giftschlangen] +
Pr[bite| 1 Giftschlangen] Pr[1 Giftschlangen] + Pr[Biss| 2 Giftschlangen] Pr[2
Giftschlangen] Pr[0 Giftschlangen] = 0,107 (aus Teil a)
Pr[1 Giftschlange] = (5/8 × 3/7) + (3/8 × 5/7) = 0,536
Pr[ 2 Giftschlangen] = 5/8 × 4/7 = 0,357
Pr[bite| 0 Giftschlangen] = 0
Pr[bite| 1 Giftschlange] = 0,8
Pr[bite| 2 Giftschlangen] = 1 – (1–0,8) 2 = 0,96
Alles zusammengenommen:
Pr[Biss]= (0 × 0,107) + (0,8 × 0,536) + (0,96 × 0,357) = 0,772
(c) Pr defanged | kein Biss = Pr [ kein Biss | verunstaltet ] Pr [ verunstaltet ]
Pr [ kein Biss ]
Pr[kein Biss | entschärft] = 1; Pr[defanged] = 3/8;
Pr[no bite] = Pr[defanged] Pr[no bite |defanged] + Pr[venomous] Pr[no bite | giftig]
= (3/8 × 1)+ (5/8 × (1– 0.8)) = 0.5
Also, [entschärft | eine Schlange hat nicht gebissen] = (1,0 × 3/8) / (0,5) = 0,75.
8. (a) Pr[alle fünf Forscher berechnen 95 %-KI mit dem wahren Wert]? Jede hat eine
Wahrscheinlichkeit von 95 %, alle Stichproben sind unabhängig, also Pr = 0,95 · 5 = 0,774 (b)
Pr[mindestens einer enthält keinen wahren Parameter] = 1 - Pr[alle enthalten wahren Parameter]
= 1 - 0,774 = 0,226 .
9. (a) Pr[Katze überlebt sieben Tage] = Pr[Katze wurde einen Tag nicht vergiftet] 7 = 0,99 7 = 0,932
(b) Pr[Katze überlebt ein Jahr] = Pr[Katze wurde einen Tag nicht vergiftet] 365 = 0,99 365 = 0,026
(c) Pr[Katze stirbt innerhalb eines Jahres] = 1 – Pr[Katze überlebt ein Jahr] = 1 – 0,26 = 0,974
10. (a) Pr[einzelner Samen landet in geeignetem Lebensraum] = 0,3 (b) Pr[zwei unabhängige Samen
landen in geeignetem Lebensraum] = 0,3 2 = 0,09. (c) Pr[zwei von drei unabhängigen Samen
landen als Lebensraum geeignet] = 3 × (0,7 × 0,3 × 0,3) = 0,189
11 (a) Falsch-Positiv-Rate = Pr[positiver Test | kein HIV] = 8 von 4000 = 0,002 (b) Falsch-negativ-
Rate = Pr[negativer Test | HIV] = 20 von 1000 = 0,02 (c) 988 positiv getestet, davon 980 HIV-
positiv; 980/988= 0,9919;
12. Jeder Gewinn hat eine Wahrscheinlichkeit von 0,09, jeder Verlust eine Wahrscheinlichkeit von
0,91.
(a) Pr[WWLWWW] = 0,09 5 × 0,91 = 5,4 × 10 -6 (b) Pr[WWWWWL] = 0,09 5 × 0,91 = 5,4 × 10 -6
(c) Pr[LWWWWW] = 0,09 · 5 · 0,91 = 5,4 · 10 -6 (d) Pr[WLWLWL] = 0,09 · 3 · 0,91 · 3 = 5,5 ·
-4
10
(e) Pr[WWWLLL] = 0,09 3 × 0,91 3 = 5,5 × 10 –4 (f) Pr[WWWWWW] = 0,09 6 = 5,3 × 10 –7
13. (a)
Zweiter Satz Dritter Satz Anzahl von Spielen Wahrscheinli
chkeit
2 1/4
1/2 W , Kein Spiel
3 1/8
- - ------, I/2
1/2 L - L 3 1/8
1/2
1/2 — W 3 1/8
1 fZ VV
L 3 1/8
■—-----— 1/2
1/2 L ________________ —■ Kein Spiel 2 1/4
Die Wahrscheinlichkeit, dass das Spiel zwei Sätze dauert, beträgt 1/4 + 1/4 = 1/2. Die
Wahrscheinlichkeit, dass es drei Spiele dauert, beträgt 1/8+1/8+1/8+1/8=1/2.
15. (B)
Zweiter Satz Dritter Satz Gewinner des Spiels Wahrscheinlich
keit
, Kein Spiel Stärker 0.552
0.55 W ---_
0.55 W Stärker 0,552 x 0,45
0.45 *L —
0.45 „L Schwächer 0,452 x 0,55
Kan
n
nicht
Kan
n
nicht
1/9 Gesamtwahrscheinlichkeit: 4/36 = 1/9 = 0,11
16. (a) Pr[eine Person blinzelt nicht] = 1 – Pr[Person blinzelt] = 1 -0,04 = 0,96 (b) Pr[mindestens ein
Blinzeln von 10 Personen] = 1 – Pr[niemand blinzelt] = 1 - 0,96 · 10 = 0,335
Chapter 6
1. (a) Stimmt. (b) Falsch.
2. (a) H 0 : Die Rate richtiger Schätzungen beträgt 1/6. (b) H A : Die Rate richtiger Schätzungen
beträgt nicht 1/6. (Wir würden argumentieren, dass ein zweiseitiger Test angemessener ist als ein
einseitiger Test – wer kann sagen, dass ESP so funktionieren würde, wie wir es wollen?).
3. (a) Alternativhypothese. (b) Alternativhypothese. (c) Nullhypothese. (d) Alternativhypothese (e)
Nullhypothese.
4. (a) Verringert die Wahrscheinlichkeit, einen Fehler vom Typ I zu begehen. (b) Erhöht die
Wahrscheinlichkeit, einen Fehler vom Typ II zu begehen. (c) Verringert die Aussagekraft eines
Tests. (d) Keine Auswirkung.
5. (a) Keine Auswirkung. (b) Verringert die Wahrscheinlichkeit, einen Fehler vom Typ II zu
begehen. (c) Erhöht die Aussagekraft eines Tests. (d) Keine Auswirkung.
6. (a) P = 2 × (Pr[15] + Pr[16] + Pr[17]+Pr[18]) = 0,0075. (b) P = 2 × (Pr[13] + Pr[14] + …. +
Pr[18]) = 0,096. (c) P = 2 × (Pr[10] + Pr[11] + Pr[12] + … + Pr[18]) = 0,815. (d) P = 2 × (Pr[1] +
Pr[2] + Pr[3] + … + Pr[7]) = 0,481.
7. FALSCH. Die Hypothesen sind keine Variablen, die dem Zufall unterliegen. Der P -Wert misst
vielmehr, wie ungewöhnlich die Daten sind, wenn die Nullhypothese wahr ist.
8. Das Versäumnis, H 0 abzulehnen, bedeutet nicht, dass H 0 korrekt ist, da die Aussagekraft des
Tests möglicherweise begrenzt ist. Die Nullhypothese ist die Standardhypothese und wird
entweder abgelehnt oder nicht abgelehnt.
9. Beginnen Sie mit der Aufstellung der Hypothesen. H 0 : Die Größe auf Inseln unterscheidet sich
bei asiatischen Großsäugetieren nicht in einer einheitlichen Richtung von der Größe auf dem
Festland (d. h. p = 0,5); H A : Die Größe auf Inseln unterscheidet sich in einer konsistenten
≠
Richtung von der Größe auf dem Festland bei asiatischen Großsäugetieren (d. h. p 0,5), wobei
p der tatsächliche Anteil der Großsäugetierarten ist, die auf Inseln kleiner sind als auf dem
Festland. Beachten Sie, dass es sich hierbei um einen zweiseitigen Test handelt. Die Teststatistik
ist die beobachtete Anzahl von Säugetierarten, deren Größe auf Inseln kleiner ist als auf dem
Festland: 16. Der P -Wert ist die Wahrscheinlichkeit eines so ungewöhnlichen Ergebnisses wie
16 von 18, wenn H 0 wahr ist: P = 2 × (Pr[16] + Pr[17] + Pr[18]) = 0,00135. Da P < 0,05, lehnen
Sie H 0 ab. Daraus lässt sich schließen, dass die Größe asiatischer Großsäugetiere auf Inseln
normalerweise kleiner ist als auf dem Festland.
10. (a) Nicht korrekt. Der P -Wert gibt keinen Aufschluss über die Größe des Effekts. (b) Richtig. H
0 wurde abgelehnt, daher schließen wir daraus, dass es tatsächlich einen Effekt gibt. (c) Nicht
korrekt. Die Wahrscheinlichkeit, einen Fehler vom Typ I zu begehen, wird durch das zuvor
festgelegte Signifikanzniveau 0,05 festgelegt. (d) Nicht korrekt. Die Wahrscheinlichkeit, einen
Fehler vom Typ II zu begehen, hing von der Effektgröße ab, die nicht bekannt war. (e) Richtig.
Chapter 7
1. (a) 91/220 hatten Krebs, daher beträgt die geschätzte Wahrscheinlichkeit, dass ein Darsteller oder
Crewmitglied an Krebs erkrankt, 0,414. (b) Der Standardfehler des Anteils beträgt 0,033. [Die
Quadratwurzel von (0,414)(1 - 0,414)/(220-1). Diese Größe misst die Standardabweichung der
Stichprobenverteilung des Anteils. (c) Mithilfe der Agresti-Coull-Methode zur Generierung von
Konfidenzintervallen berechnen wir zunächst p ' = ( x +2)/( n +4) = (91 +pp 2) / (220 + 4 ) = 0,415.
Die Untergrenze für das 95 %-Konfidenzintervall liegt bei 0,415 – 1,96 = 0,351 n + 4
′
p (1-p ) ′
Die Obergrenze beträgt 0,415 + 1,96 + = 0.480. Die Konfidenzintervalle klammern das
nicht ein
typische Krebsrate von 14 % für diese Altersgruppe. Es ist unwahrscheinlich, dass die
tatsächliche Krebsrate für diese Gruppe bei 14 % liegt.
2. (a) 46/50 Scheine enthielten Kokain, der geschätzte Anteil beträgt also 0,92. (b) Das 99 %-
Konfidenzintervall, berechnet mit der Agresti-Coull-Methode: p' = 48 / 54 = 0,89. Z für 99 % =
2,58. Die Grenzen von
3. Das Konfidenzintervall beträgt 0,779 und 0,999. (c) Wir sind zu 99 % davon überzeugt, dass der
tatsächliche Anteil der US-Ein-Dollar-Scheine mit messbarem Kokaingehalt zwischen 0,779 und
0,999 liegt.
4. (a) Nein; Die Wahrscheinlichkeit, eine rote Karte zu ziehen, ändert sich je nachdem, welche
Karten gezogen wurden. (b) Ja: Da die Probenahme mit Ersatz erfolgt, bleibt die
Erfolgswahrscheinlichkeit konstant. (c) Nein, die Wahrscheinlichkeit, eine rote Kugel zu ziehen,
ändert sich mit jedem Ziehen.
(d) Nein, die Anzahl der Prozesse ist nicht bekannt. (e) Ja, die Anzahl rotäugiger Fliegen in einer
Stichprobe aus einer großen Population kann mithilfe der Binomialverteilung beschrieben
werden. (Da die Stichprobe groß ist, gehen wir davon aus, dass die Stichprobe jedes Einzelnen
einen vernachlässigbaren Einfluss auf die Wahrscheinlichkeit hat, bei der nächsten Ziehung eine
rote Fliege zu ziehen.) (f) Nein, die Wahrscheinlichkeit, rote Augen zu haben, kann bei den
Individuen verschiedener Familien aufgrund gemeinsamer genetischer Unterschiede
unterschiedlich sein.
5. (a) Diese Schätzung fasst Zahlen aus zwei verschiedenen Gruppen zusammen. Frauen mit
Rosacea sind keine Zufallsstichprobe der Bevölkerung. (b) Wenn es sich bei den Frauen der
Kontrollgruppe um eine Zufallsstichprobe handelt, haben 15/16 Milben, 0,938. (c) p'= 17 / 20 =
0,85. Das 95 %-Konfidenzintervall beträgt 0,69 bis 1,00. (Anteile können nicht größer als 1 sein,
daher wird das Konfidenzintervall auf 1 gekürzt). (d) Für die Frauen mit Rosacea, p' = 18/20 =
0,90. Das 95 %-Konfidenzintervall beträgt: 0,769 < p < 1,0.
6. (a) Pr[männlich wird gefressen] = 21/52 = 0,404. p'=23/56 = 0,411. Das 95 %-Konfidenzintervall
liegt zwischen 0,282 und 0,540. (b) Diese Schätzung stimmt mit einem 50-prozentigen Fang
männlicher Tiere überein, nicht jedoch mit einem 10-prozentigen Fang männlicher Tiere. (c) Die
größere Stichprobe würde die Schätzung des Anteils nicht verändern (der Bruch ist genau
derselbe), würde aber die Breite des Konfidenzintervalls verringern. (Die Stichprobengröße steht
6. Die geschätzte Wahrscheinlichkeit, nach Norden zu ziehen, beträgt 22/24 = 0,917. Um die
Hypothese zu testen, dass Norden und
Pr[22] = 24
2⎞
Wahrscheinlichkeit
2 mit zwei.
⎟⎞ 0.522(1-0.5)2 = 1.6 × 10-
⎝ 5
Wenn wir das Gleiche für 23 und 24 tun, alle drei summieren und mit zwei multiplizieren,
erhalten wir P = 3,6 × 10 -5 . Wir können die Nullhypothese getrost ablehnen.
7. (a) Die erste Studie mit dem engeren Konfidenzintervall hatte wahrscheinlich die größere
Stichprobengröße. (b) Die Schätzung mit dem kleineren Konfidenzintervall ist in dem Sinne
glaubwürdiger, dass der wahre Wert wahrscheinlich irgendwo in der Nähe der Schätzung liegt. (c)
Die Unterschiede sind das, was wir aufgrund der Zufallsstichprobe erwarten könnten: Das zweite
Konfidenzintervall überlappt die Schätzung der ersten Studie.
8. (a) Dies ist ein Beweis dafür, dass die Entscheidungen der Männer durch die weibliche
Positionierung der Frauen beeinflusst werden können: Die Wahrscheinlichkeit, dass 19 von 24 die
M0-Frau wählen, mit der Nullhypothese, dass es keine Präferenz gibt ( p = 0,5). Mit einem
Binomialtest
P = 2 { Pr [ 19 ] + Pr [ 20 ] + Pr [ 21 ] + Pr [ 22 ] + Pr [ 23 ] + Pr [ 24 ] }
= 2{0.00253 + 0.0006 + 0.0001 +...}
= 0.0066.
Daher ist P < 0,05, und wir können die Nullhypothese zurückweisen, dass die Männer keine
Präferenz haben.
(b) Allerdings könnten die Männchen aus mehreren Gründen ein Weibchen dem anderen
vorgezogen haben. Wenn die Weibchen Schwestern wären, würde dies die Anzahl der
genetischen und mütterlichen Unterschiede verringern
Umgebung und würde daher eher die Position des Fötus testen. Idealerweise würde dies mit 24
Gruppen von Schwestern durchgeführt werden, sodass jeder Versuch unabhängig ist.
9. (a) In 20 Proben beträgt der durchschnittliche Anteil von A 30 %. (b) Wir würden erwarten, dass
die Anzahl der A-Stamm-Bakterien in den Proben der Binomialverteilung entspricht . (c) Die
Standardabweichung
des Anteils der A-Zellen ist der Standardfehler: σ p ˆ = .
- . = 0,118. (d) 95 % der
Techniker sollten ein Konfidenzintervall für den Anteil der A-Zellen erstellen, das 0,3 umfasst.
10. (a) 1/6 der 12 Würfel sollten „3“ oder 2 Würfel haben. (b) Pr[keine drei von 12 Würfen] = (1
- Pr[3 an
eine Rolle]) 12 = 12 = 0,112. (c) Pr[3 Dreier von 12] = Pr[3] =
⎛12
5/6
⎞ 0.1673(1-0.167)9= 0.197.
⎝
(d) Jeder Würfel hat sechs Seiten, jede mit einer Wahrscheinlichkeit von 1/6, dass sie sichtbar
sind. Der Durchschnittswert für den Würfel ist die Summe jedes Wertes mal seiner
Wahrscheinlichkeit, oder (1 × 1/6) + (2 × 1/6) + . . . (6 × 1/6) oder 1/6
× 21 = 3.5. Bei zwölf Würfeln beträgt die durchschnittliche Summe der angezeigten Zahlen 12 ×
3,5 = 42. (e) Pr[alle Würfel zeigen 1 oder 6] = (Pr[1]+Pr[6]) 12 = 1,88 × 10 -6 .
11. (a) 6052 von 12028 Todesfällen ereigneten sich in der Woche vor Weihnachten, also 0,503. (b)
Unter Verwendung der Agresti-Coull-Konfidenzintervallnäherung für Proportionen ist p' = (X +
2) / ( n + 4), wobei X die Anzahl der Erfolge (= „vor Weihnachten gestorben“) und n die
Gesamtzahl ist der Verhandlungen (= „innerhalb einer Woche nach Weihnachten gestorben“) =
6054 / 12032 = 0,503. Dann beträgt das Konfidenzintervall 0,494 bis 0,512. (c) Dieses Intervall
umfasst 50 %, was dem Zufall entspricht. Es gibt keine statistische Unterstützung für die
Annahme, dass die Lebenden bis zu diesem besonderen Tag durchhalten.
12. (a) Wir können den P -Wert berechnen, indem wir die
Wahrscheinlichkeiten von 13, 14, 15 oder 16 Harzgruppen ⎜⎞
⎛ ⎟⎞
summieren
1 0.513 (1 - 0.5) 3 = 0.0085.
mehr Arten haben, dann mit zwei multiplizieren. Pr[13] 6 Summieren
1 3
=
die Wahrscheinlichkeiten für 13 bis 16, dann multipliziert mit zwei, P = 0,021. (b) Dies ist eine
Beobachtungsstudie, keine experimentelle Studie. Wir haben den Stämmen nicht zufällig
Latex/Harz zugeteilt. Es ist möglich, dass Gruppen mit Harz eine höhere Diversität aufweisen,
nicht aufgrund des Harzes, sondern aufgrund eines dritten Faktors, der sowohl das Harz als auch
die Artenzahl beeinflusst.
Kapitel 8
1. (a) Es gäbe sechs Kategorien, eine für jedes Ergebnis, und somit fünf Freiheitsgrade, da keine
Parameter geschätzt werden. (b) Es gibt 11 Kategorien (von 0 Köpfen bis 10 Köpfen) und zehn
Freiheitsgrade, da keine Parameter geschätzt werden. (c) Es gibt nun neun Freiheitsgrade, da p
aus den Daten geschätzt werden muss. (d) Es gäbe fünf Kategorien (0 bis 4 Insektenköpfe pro
Probe) und drei Freiheitsgrade, da die mittlere Anzahl der Köpfe pro Probe aus den Daten
geschätzt werden müsste.
2. Nein, die an einem bestimmten Tag gekauften Tickets sind nicht alle unabhängig voneinander;
Beispielsweise könnte eine einzelne Person bei einem Kauf mehrere Tickets kaufen. Es handelt
sich daher nicht wie dargestellt um eine Zufallsstichprobe.
3. Um zu testen, ob Nematoden zufällig unter den Fischen verteilt sind, können wir sehen, ob die
Daten zur Poisson-Verteilung passen. Die durchschnittliche Anzahl der Parasiten pro Fisch
beträgt
X = 103 ( 0 ) + 72 ( 1 ) + 44 ( 2 ) + 14 ( 3 ) + 3 ( 4 ) + 1 ( 5 ) + 1 ( 6 ) = 0,94538.
Die erwarteten Werte einer Poisson-Verteilung mit diesem Mittelwert sind unten angegeben
Anteil, der aus der Poisson-Verteilung erwartet wird, Stichprobengröße,
Anzahl der Beobachtet Erwartet
Parasiten
0 103 92.47
1 72 87.42
2 44 41.32
3 14 13.02
4 3 3.08
5 1 0.58
6 1 0.09
Die erwarteten Werte für 5 und 6 liegen unter eins, daher werden wir 4 bis 6 in einer Kategorie
zusammenfassen.
Anzahl der Beobachtet Erwartet
Parasiten
( Beobachtet – Erwartet )
2
Erwartet
0 103 92.47 1.20
1 72 87.42 2.72
2 44 41.32 0.17
3 14 13.02 0.07
≥4 5 3.75 0.42
χ χ
= 4.58. Es gibt fünf Kategorien, ein geschätzter Parameter, also df = 3. 0 2 .05,3 = 7,81. 4,58 <
2
7,81, daher können wir die zufällige Verteilung von Parasiten auf Fischen nicht ablehnen.
4. (a) Wenn Kiefernsämlinge zufällig verteilt sind, sollten die Häufigkeiten der Poisson-Verteilung
entsprechen. (b) Die durchschnittliche Anzahl der Sämlinge pro Quadrat betrug 1,325.
Anzahl der beobachteten erwarteten
Sämlinge
0 47 21.26
1 6 28.18
2 5 18.67
3 8 8.24
14 3.65
≥ 4
Die erwarteten Zählungen für 5–7 lagen unter 1, daher wurden 4–7 zusammengefasst. χ 2
=
88,03, mit df = 3 (fünf Kategorien, minus eine, minus ein geschätzter Parameter). χ 0
2
.001,3 =
χ
16,27 und 2 ist größer als dieser kritische Wert, also P < 0,001. (c) Sämlinge werden nicht
zufällig verteilt. (Die Varianz, 3,49, ist hier viel größer als der Mittelwert, was darauf hindeutet,
dass einige Quadrate viel wahrscheinlicher als andere Setzlinge haben: Setzlinge sind verklumpt.)
5. (a) Die durchschnittliche Anzahl der Tore pro Mannschaft beträgt 1,26. (b) Wenn wir dies an
einen Poisson-Wert anpassen und mit einem Anpassungstest testen, müssen wir erneut die vier
Ziele und die oben genannten Kategorien kombinieren, um erwartete Werte von weniger als eins
zu vermeiden.
Anzahl Beobacht Erwartet
et
Ziele
0 37 36.3
1 47 45.7
2 27 28.8
3 13 12.1
4 5.0
≥4
χ 2
= 0,44, was kleiner ist als der kritische Wert χ 0
2
.05,1 = 3,84, daher können wir die
6. (a) Pr[8] =
⎜
⎝⎞ ⎛
8 ⎟ ⎞ 0,5
1 5
(1 - 0,5) 7 =
8
0,19638. (B)
Nullhypothese einer Poisson-Verteilung der Tore pro Seite und Spiel nicht ablehnen.
Die erwarteten Werte für 0 und 8 sind kleiner als 5, daher haben wir (0 und 1) und (7 und 8)
kombiniert, um Folgendes zu erhalten:
Zahlenk ( Beobachtet – Erwartet ) 2
χ 2
= 0,48 und df = 1. 0,48 < 3,84, der kritische Wert für P = 0,05, daher lehnen wir die
Hypothese einer zufälligen Verteilung der Krebstodesfälle um Weihnachten herum nicht ab.
9.
( Beobachtet – Erwartet ) 2
χ
df = 1 ; 2 =136,82 >> 10,83, der kritische Wert für P = 0,001, daher können wir die Hypothese
zurückweisen, dass die Besetzung und das Team unter der bevölkerungsweiten
Krebssterblichkeitsrate P < 0,001 litten.
10. Der durchschnittliche Eintrittspreis beträgt 20 pro Nacht. Wie groß ist die Wahrscheinlichkeit
von fünf oder weniger Zulassungen? Gehen Sie davon aus, dass jeder Einlass unabhängig ist
(bitte keine Unruhen). Dann sollten sie Poisson-verteilt sein. Um die Wahrscheinlichkeit einer
ruhigen Nacht zu ermitteln, addieren wir die Wahrscheinlichkeiten von 0 bis 5 Eintritten.
Zulassungswahrscheinlichkeit
0 2.06E-09
1 4.12E-08
2 4.12E-07
3 2,75E-06
4 1,37E-05
5 5.50E-05
Gesamtwahrscheinlichkeit = 7,2 × 10 -5 . Am besten lassen Sie den Kaffee kochen: Sie müssen
durchschnittlich 58 Jahre arbeiten, bevor Sie eine ruhige Nacht haben!
Kapitel 9
1. (A)
( Beobachtet – Erwartet ) 2
-Kontingenztests verletzt. In diesem Fall ist es wahrscheinlich, dass eine Zelle weniger als fünf
Zellen hat, daher müsste in diesem Fall der exakte Fisher-Test verwendet werden.
4.
( Beobachtet – Erwartet ) 2
(b) Kontingenztabelle zum Test der Unabhängigkeit vom Fernsehen und späterer
Gewalterfahrung. ( Beobachtet – Erwartet ) 2
erwartet
beobachtet nein nein Erwartet nein
Klasse aufzeichne aufzeic gesamt Klasse aufzeichn aufzeic gesam Klasse aufzeichn aufzeichn gesa
1 Std n 83 hnen 5 88 1 Std en68.21 19.79
hnen t 881 Std en3.21 en 11.05 mt
1-3
Std 299 87 386 1-3 Std 299.2 86.81 386 1-3 Std 0.0001 0.0004
3+ Std 166 67 233 3+ Std 180.6 52.4 233 3+ Std 1.18 4.068
548 159 707 548 159 707 19.5
χ 2
= 19,5, für 2 df , (da es drei Zeilen und zwei Spalten gibt, also (3-1)(2-1) = 2 df . 35,0>13,82,
der kritische Wert für P = 0,001 für 2 df , also P < 0,001. Es besteht ein Zusammenhang
zwischen dem Fernsehen und zukünftiger Gewalt: Bei denjenigen, die weniger als eine Stunde
fernsahen, war die Wahrscheinlichkeit geringer, dass sie eine Aufzeichnung hatten, während bei
denen, die drei oder mehr Stunden fernsahen, die Wahrscheinlichkeit höher war, dass sie eine
Aufzeichnung hatten.
(c) Nein, das beweist nicht, dass Fernsehen bei Kindern Aggression hervorruft. Da es sich hierbei
um eine Beobachtungsstudie und nicht um eine experimentelle Studie handelte, wissen wir nicht,
ob Kinder, die mehr fernsehen, andere gemeinsame Faktoren haben (z. B. geringere elterliche
Aufsicht usw.).
7.
( Beobachtet – Erwartet ) 2
Kaiserschni 48 341 389 Kaiserschnit 38.17 350.83 389 Kaiserschn 2.53 0.28
tt t itt
gesamt 1073 9861 10934 gesamt 1073 9861 203 gesamt 2.91
χ 2
= 2,91 für 1 df , was weniger als 3,84 (kritischer Wert für P = 0,05) ist, daher können wir das
nicht ablehnen
Nullhypothese, dass es keinen Unterschied im Depressionsrisiko für verschiedene
Geburtsmethoden gibt.
9. (a) Die Wahrscheinlichkeit, dass ein Migränepatient einen kardialen Shunt hat, beträgt 44:49 oder
0,90, während die Wahrscheinlichkeit für einen Nichtkranken 16:77 oder 0,21 beträgt. Das
Quotenverhältnis beträgt 4,32. (b) Um das Konfidenzintervall zu finden, nehmen wir zunächst
den Logarithmus des Odds -Verhältnisses, ln(4,32) = 1,46, und berechnen den SE des Odds-
Verhältnisses, v1/ 44 + 1 / 49 + 1 / 16 +1/ 77 = 0,34. Das Konfidenzintervall für das Log-Odds-
Ratio beträgt 1,46 – 1,96 (0,34) bis 1,46 + 1,96 (0,34) oder 0,79 bis 2,14. Wenn wir die
Exponentialfunktion davon verwenden, um das Konfidenzintervall des Quotenverhältnisses zu
ermitteln, erhalten wir exp(0,79) = 2,2 und exp(2,14) = 8,5. 2,2 < ODER < 8,5.
10.(a) Der Anteil der mit Fingerdefekten geborenen Babys beträgt 6522 von 6.839.854 oder 0,001.
Das 95 %-Konfidenzintervall (unter Verwendung der Agresti-Coull-Methode) liegt zwischen
0,00093 und 0,00097. Es ist sehr wahrscheinlich, dass der Anteil der mit Fingerfehlern geborenen
Babys zwischen 0,00093 und 0,00097 liegt.
(B)
( Beobachtet – Erwartet ) 2
beobachtet erwartet Erwartet gesam
Defekt normal gesamt Defekt normalgesamt Defekt normal t
Rauch 805 1280 2085 Rauch 695.00 1390.00 2085 Rauch 17.41 8.71
NEIN NEIN NEIN
Rauch 4366 9062 13428 Rauch 4476.00 8952.00 13428 Rauch 2.70 1.35
5171 10342 15513 gesamt 5171 10342 203 gesamt 30.17
Für 1 df überschreitet die Teststatistik den kritischen Wert für P = 0,001, also P < 0,001. Es
besteht ein Zusammenhang zwischen Fingerdefekten und Rauchen während der Schwangerschaft.
(c) Die Wahrscheinlichkeit, dass eine rauchende Mutter ein Kind mit einem Fingerdefekt
bekommt, beträgt 0,62, während die Wahrscheinlichkeit, dass eine nicht rauchende Mutter ein
Kind mit einem Fingerdefekt bekommt, 0,48 beträgt. Das Odds Ratio liegt bei 1,3 (rauchende
Mütter haben ein 1,3-mal höheres Risiko, ein Kind mit einem Fingerdefekt zu bekommen). Für
das Konfidenzintervall berechnen wir zunächst das ln-Odds-Ratio = 0,27. Anschließend
berechnen wir die SE des ln-Quotenverhältnisses, die Quadratwurzel der Summe der Kehrwerte
der Häufigkeiten, oder 0,05. Das Konfidenzintervall für das Log-Odds-Ratio beträgt + 1,96 × 0,05,
also von 0,172 bis 0,362. Wenn wir den Exponenten des Konfidenzintervalls für das ln-Odds-
Ratio nehmen, finden wir, dass das 95 %-Konfidenzintervall für das Odds-Ratio zwischen 1,19
und 1,44 liegt.
Kapitel 10
1. Aus statistischer Tabelle B. (a) 0,09012 (b) 0,09012 (c) Pr[Z > -2,15] = 1 - Pr[Z < -2,15] = 1 -
Pr[Z > 2,15] = 1-0,01578 = 0,9842. (d) Pr[Z < 1,2] = 1 – Pr[z > 1,2] = 1 – 0,11507 = 0,8849 (e)
Pr[0,52 < Z < 2,34] = Pr[0,52 < Z] – Pr[2,34 < Z], denn der erste Wert ist die Fläche unter der
Kurve von 0,52 bis unendlich und der zweite Wert ist die Fläche unter der Kurve von 2,34 bis
unendlich. Der Unterschied ist die Fläche unter der Kurve von 0,52 bis 2,34. 0,30153 - 0,00964 =
0,29189. (f) Pr[-2,34 < Z < -0,52] = 0,29189: Die Kurve ist auf beiden Seiten von 0 symmetrisch.
(g) Pr[Z <-0,93] = Pr[z > 0,93] = 0,17619 (h) Pr[ -1,57 < Z < 0,32] = (1 - Pr[Z > 1,57]) - Pr[Z >
0,32] = (1 - 0,05821) - 0,37448 = 0,56731
2. (a) Um den Anteil der ausgeschlossenen Männer zu bestimmen, wandeln wir die
Größenbeschränkung in Standardabweichungen um. (180,3 - 177,0) / 7,1 = 0,46. Pr[Z > 0,46] =
0,32276 – etwa ein Drittel der britischen Männer ist von der Bewerbung ausgeschlossen. (b)
(172,7 - 163,3) / 6,4 = 1,47. Pr[Z > 1,47] = 0,07078 – das ist der Anteil der ausgeschlossenen
britischen Frauen. 1 – 0,0708 = 0,9292 Anteil der britischen Frauen, die für den MI5 akzeptabel
sind. (c) (183,4 – 180,3) / 7,1 = 0,44 Standardabweichungseinheiten über der Höhengrenze.
3. (a) B ähnelt am ehesten der Normalverteilung. A ist bimodal, während C schief ist. (b) Alle drei
würden aufgrund des zentralen Grenzwertsatzes annähernd Normalverteilungen der
Stichprobenmittelwerte erzeugen.
4. (a) Pr[Gewicht > 5 kg]? Transformation zur Standardnormalabweichung: (5 - 3,339) / 0,573 =
2,90. Pr[2,90 < Z] = 0,00187.
(b) Pr[3 < Geburtsgewicht < 4]? Transformieren Sie beide in Standardnormalabweichungen und
subtrahieren Sie die Wahrscheinlichkeiten der Z-Werte. (3 - 3,339)/0,573 = -0,59.
(4-3,339)/0,573 = 1,15. Pr[-0,59 < Z] = 1 - Pr[0,59 < Z] = 1 - 0,2776 = 0,7224. Pr[1,15 < Z] =
0,12507. 0,7224 - 0,12507 = 0,59733.
(c) 0,06681 Babys weisen mehr als 1,5 Standardabweichungen nach oben auf, mit dem gleichen
Bruchteil nach unten, sodass 0,13362 Babys mehr als 1,5 Standardabweichungen in beide
Richtungen aufweisen.
(d) Wandeln Sie zunächst 1,5 kg in normale Standardabweichungen um: 1,5 / 0,573 = 2,62
Standardabweichungen. Pr[2,62 < Z] = 0,0044. Da die Verteilung symmetrisch ist, multiplizieren
wir dies mit zwei, um die Wahrscheinlichkeit widerzuspiegeln, 2,62 Standardabweichungen über
oder unter dem Mittelwert zu liegen: 0,0044 * 2 = 0,0088.
(e) Der Standardfehler entspricht der Standardabweichung des Mittelwerts. Sie entspricht der
Standardabweichung dividiert durch die Quadratwurzel von n oder 0,573 / 10 = 0,18 kg. Um die
Wahrscheinlichkeit zu ermitteln, dass der Mittelwert einer Stichprobe von 10 Babys mehr als 3,5
kg beträgt, wandeln wir diesen Mittelwert in einen Z-Score um. (3,5 - 3,339) / 0,18 = 0,89
Standardabweichungen vom Mittelwert = 0,18673.
5. (a) Das rechte Diagramm hat den höheren Mittelwert (ca. 20 vs. 10), das linke Diagramm hat die
höhere Standardabweichung (ca. 2 vs. 1). (b) Die rechte Grafik hat den höheren Mittelwert (ca.
15 vs. 10) und die höhere Standardabweichung (ca. 5 vs. 2,5).
6. Die Standardabweichung beträgt ungefähr 10, da der Bereich innerhalb einer
Standardabweichung vom Mittelwert ungefähr 2/3 der Datenpunkte enthält.
7. (a) In einer Normalverteilung liegt der Modalwert im Mittelwert vor, sodass der Modus 35 mm
beträgt. (b) Eine Normalverteilung ist symmetrisch, daher ist der mittlere Datenpunkt der
Mittelwert, 35 mm. (c) Zwanzig Prozent der Verteilung sind kleiner als 20 mm. (Warum?
Normalverteilungen sind symmetrisch. Wenn also 20 % der Verteilung 15 mm oder größer als
der Mittelwert sind, müssen 20 % 15 mm oder kleiner als der Mittelwert sein.)
8. (a) Die rechte Verteilung (II.) hätte eher Stichprobenmittelwerte, die eine normalere
Verteilung hätten, da die anfängliche Verteilung näher an der Normalverteilung liegt. Beide
Verteilungen würden zu einer Normalverteilung konvergieren, wenn die Stichprobengröße
ausreichend groß wäre. (b) Die Verteilung der Stichprobensummen einer Verteilung wird
normalverteilt sein, vorausgesetzt, es gibt eine ausreichend große Anzahl von Stichproben.
9. (a) Die Wahrscheinlichkeit, Haplotyp A zu beproben, beträgt p = 0,3. Wir gehen davon aus,
dass eine Stichprobe von 400 Fischen durchschnittlich 0,3 × 400 A - Individuen aufweist, also
120. Die Standardabweichung beträgt ungefähr V np ( 1 - p ) =
V 400 ( 0,3 )( 0,7 ) = 9,17. Um die Wahrscheinlichkeit für die Probenahme
von 130 oder mehr Haplotypen A zu ermitteln, wandeln wir diese in eine
Standardnormalabweichung um: (130 – 120) / 9,17 = 1,09; Pr[1,09 < Z] = 0,13786. (b)
Pr[mindestens 300 B-Haplotyp von 400]? Durchschnittliche Anzahl der B-Proben = (1-p) ×
400 = 280. In Standardnormal umrechnen: (300 - 280) / 9,17 = 2,18; Pr[2,18 < Z] = 0,01463.
(c) Pr[115 < Freq A < 125]? Konvertieren Sie in Standardnormalabweichungen, ermitteln Sie
die Wahrscheinlichkeiten und berechnen Sie die Differenz. (115-120)/9,17 = -0,55. (125 -
120)/ 9,17 = 0,55. Pr[-0,55 < Z] = 1 - Pr[0,55 < Z] = 1 - 0,29116 = 0,70884. Pr[0,55 < Z] =
0,29116. 0,70884 - 0,29116 = 0,41768.
10. Eine durchschnittliche erwartete Anzahl von Krebsopfern = 0,14 × 220 = 30,8.
Standardabweichung =
vnp ( 1 - p ) =
V 220 ( 0,14 )( 0,86 ) = 5,15 . Konvertieren Sie die tatsächliche Anzahl der
Opfer, 91, in die Standardnormalabweichung: (91 - 30,8) / 5,15 = 11,7. Das ist außerhalb des
Diagramms: P < 0,00002.
j
Bedeut SD SE 10 Z 10 Pr(Y > y ) SE 30 Z 30 Pr(Y > y )
en
14 5 15 1.58 0.63 0.26435 0.91 1.10 0.13567
15 3 15.5 0.95 0.53 0.29806 0.54 0.91 0.18141
-23 4 -22 1.26 0.79 0.21476 0.73 1.37 0.08534
72 50 45 15.81 -1.71 0.95637 9.18 -2.96 0.99846
IV n . Z = ( y – Mittelwert) / SE.
11. SE = s
Chapter 11
1. Das 99 %-Konfidenzintervall muss größer als das 95 %-Konfidenzintervall sein, um eine
höhere Wahrscheinlichkeit für die Erfassung des wahren Mittelwerts zu haben.
2. (a) Der Stichprobenmittelwert beträgt 10,32 cm und der Standardfehler des Mittelwerts
beträgt 0,056 cm. Wenn wir diese Wolfspopulation wiederholt beproben würden, lägen 68 %
der Schätzungen des Mittelwerts zwischen 10,32 ± 0,056. (b) Das 95 %-Konfidenzintervall
für den Mittelwert beträgt 10,32 ± (0,056 t 0,05(2),34 ). t = 2,03, also ist das 95 %-
Konfidenzintervall: 10,21 < µ < 10,44 cm. (c) Die Varianz beträgt 0,11005. Es gibt 35
Individuen, also 34 df . Die kritischen χ 2
-Werte sind in der statistischen Tabelle A für α=
0,01 / 2 und α = 1 - (0,01 / 2) nachgeschlagen und betragen 58,96 und 16,50. Wir berechnen
nun die Untergrenze des Konfidenzintervalls: 34 (0,11005) / 58,96 = 0,063. Die Obergrenze
beträgt 34 (0,11005) / 16,5 = 0,227. 0,063 < 2
σ
< 0,227. (d) Das 99 %-Konfidenzintervall
der Standardabweichung der Stichprobe wird ermittelt, indem die Quadratwurzel des
Varianz-Konfidenzintervalls gezogen wird: 0,252 < σ< 0,476, etwa um die geschätzte
Standardabweichung von 0,332.
3. Nein, bei Verwendung von n = 70 würde man davon ausgehen, dass der rechte Abstand
unabhängig vom linken Abstand ist. Dies ist unwahrscheinlich, da die meisten Tiere
symmetrisch sind und wir daher ähnliche Abstände auf beiden Seiten des Mauls erwarten
würden.
4. (a) Um zu testen, ob sich die mittlere Fitness verändert hat, testen wir, ob die mittlere Fitness
nach 100 Generationen signifikant von 0 abweicht. Dazu verwenden wir einen t -Test. Wir
benötigen den Stichprobenmittelwert, den Stichprobenstandardfehler und die
Stichprobengröße. Unser hypothetischer Wert aus der Nullhypothese, dass sich die Fitness
nicht ändert, µ 0 , ist 0. Der Mittelwert beträgt 0,2724, die Standardabweichung beträgt 0,600
und die Stichprobengröße beträgt 5. Daraus berechnen wir SE = s / n = 0,6 / 5 = 0,268 und
die t -Statistik: t = (Mittelwert - µ 0 ) / SE = (0,2724 - 0) / 0,268 = 1,02. Da es sich um einen
zweiseitigen Test handelt, suchen wir nach dem kritischen Wert von α
(2) = 0,05 für 4 df ,
2,78. t < t krit = 2,78, daher lehnen wir die Nullhypothese, dass sich die Fitness nicht ändert,
nicht ab. (b) Das 95 %-Konfidenzintervall für die mittlere Fitnessänderung beträgt 0,2724 +
2,78 (0,268): -0,47 < µ < 1,02. (c) Wir gehen davon aus, dass die Fitness normalverteilt ist
und dass die fünf Abstammungslinien zufällig und unabhängig sind.
5. (a) Die mittlere Hodenfläche für monogame Linien beträgt 0,848, während die mittlere
Fläche für polyandrische Linien 0,950 beträgt. Die Standardabweichung betrug für die
beiden Sätze 0,031 und 0,034. (b) Der Standardfehler des Mittelwerts beträgt 0,015 für die
monogamen Linien und 0,017 für die polyandrischen Linien. (c) Das 95 %-
Konfidenzintervall für den Mittelwert in der polyandrischen Linie beträgt 0,95 ± 0,017 t
0,05(2),3 = 0,95 ± 3,18 (0,017) oder 0,90 < µ < 1,00. (d) Das 99 %-KI für die
Standardabweichung der Hodenfläche zwischen monogamen Linien erfordert die
Stichprobenvarianz (0,001), die Freiheitsgrade (3) und die kritischen Werte der χ 2
-
α (2) = 0,05 für 6 df . 2,45. Dann beträgt das KI 0,18 ± (0,051 * 2,45) oder 0,058 < µ <
0,308. (b) Um zu testen, ob der mittlere Kontinuitätswert der Stichprobe von 0,183 mit dem
vorhergesagten Mittelwert µ 0 = 0 übereinstimmt, verwenden wir den t -Test. t = (Mittelwert
– µ 0 ) / SE = (0,183 – 0) / 0,051 = 3,6. Der kritische Wert für α (2) = 0,05 für 6 df beträgt
2,45. t > t krit , daher lehnen wir die Nullhypothese ab, dass der mittlere Diskontinuitätswert
Null ist.
7. In diesem Fall möchten wir sehen, ob die Leistung der Ratten über dem Zufallsniveau liegt,
also vergleichen wir ihre Werte mit µ 0 = 0,5. Der Mittelwert liegt bei 0,684, die
Standardabweichung bei 0,071. Es gab sieben Ratten, also SE = 0,071 / 7= 0,027. t = (0,684 -
0,5) / 0,027 = 6,82. Für α (2) = 0,05, t krit für sechs df = 2,45; t > t krit, daher lehnen wir die
Nullhypothese ab, dass sich Ratten zufällig wie erwartet verhalten haben. (Außerdem können
wir zeigen, dass P < 0,002.) (Dazu gingen wir davon aus, dass es sich bei den sieben Ratten
um zufällige, unabhängige Stichproben handelte und dass ihre Leistungswerte normalverteilt
waren.)
8. Das mittlere Kokosnussgewicht beträgt 3,2 kg, die obere 95 %-KI-Grenze beträgt 3,5 kg.
Das Konfidenzintervall für den Mittelwert ist symmetrisch, daher muss die Untergrenze 0,3
kg unter dem Mittelwert liegen, also bei 2,9 kg.
9. Das Konfidenzintervall der Varianz ist das Quadrat der Grenzen für die
Standardabweichung.
Standardabweichung Varianz
2.22 < σ < 4.78 σ
4.93< 2 <22.85
20.6< σ <26.1 σ
425.4 < 2 < 678.8
36.4 < σ < 59.6 σ
1325.0< 2 <3552.2
13.63< σ <16.70 185.8 < σ2
< 279.0
10.In diesem Fall möchten wir testen, ob die relative Schwimmgeschwindigkeit im Sirupbecken
von µ 0 = 1 abweicht. Wir berechnen t aus dem Mittelwert (1,0117) und dem Standardfehler
Chapter 12
1. (a) Gepaarter t -Test; (b) Gepaarter t -Test; (c) t -Test bei zwei Stichproben; (d) Gepaarter t -
Test; (e) t -Test bei zwei Stichproben; (f) Gepaarter t -Test; (g) t -Test bei zwei Stichproben;
(h) Gepaarter t -Test.
2. (a) Im Durchschnitt gibt es am Nichtrauchertag 25 Verletzungen mehr als am Mittwoch
davor. (b) Das 99 %-Konfidenzintervall wird als mittlere Differenz (25) + SE der
Differenzzeiten t 0,01(2),9 df berechnet. t = 3,25, SE = 10,22, daher ist das Konfidenzintervall: -
8,2 < µ < 58,2. (c) Wenn wir Daten von 100 verschiedenen Proben hätten und jeweils die
d
mittlere Differenz für einen Nichtrauchertag und einen normalen Tag berechnen würden,
würden wir erwarten, dass 99 dieser Proben die wahre mittlere Differenz enthalten würden.
(d) Wir können testen, ob die Differenz von 0 abweicht, indem wir den gepaarten t-Test
verwenden: t = (25 - 0) / 10,22 = 2,45, für 9 df . t > 2,26, der kritische Wert für α
(2) = 0,05.
Daraus schließen wir, dass sich die Unfallrate zwischen Nichtrauchertagen und einem
normalen Tag unterscheidet (und an Nichtrauchertagen höher ist). P < 0,05.
3. Die Änderung der mittleren Länge beträgt -5,81 mm, die Standardabweichung beträgt 19,5
mm und die Stichprobengröße beträgt 64. Der SE beträgt 19,5 / 64 = 2,44. Das
Konfidenzintervall für die Differenz ist die mittlere Differenz + 2,44 * t, wobei t 0,05(2),63 =
2,0 ist, also ist das Konfidenzintervall: -9,69 mm < µ < -1,935 mm. Dies setzt voraus, dass
d
die Verteilung der Längenänderung eine Normalverteilung ist und dass es sich bei den
Leguanen um eine Zufallsstichprobe aus der Population handelt. (b) Das 95 %-
Konfidenzintervall für die Standardabweichung der Längenänderung wird mithilfe der
Formel für das Konfidenzintervall der Varianz in Kapitel 11 abgeleitet. Die Varianz der
Differenz beträgt 380,25. Wir benötigen df (63) und das entsprechende 2
χ
für 0,025 und
0,9725, also 86,83 und 42,95. Dann beträgt das untere Konfidenzintervall (380,25 * 63) /
86,83 = 275,9 mm 2 und das hohe (380,25 * 63) / 42,95 = 557,8 mm 2 . Das 95 %-
Konfidenzintervall der Standardabweichung wird ermittelt, indem die Quadratwurzel des
Varianz-Konfidenzintervalls gezogen wird, oder 16,6 mm < σ
< 23,6 mm. (c) Keine
Längenänderung impliziert eine Differenz von Null, die aus dem Konfidenzintervall in Teil
(a) ausgeschlossen ist. Dies impliziert, dass ein Hypothesentest, der diese Daten verwendet,
die Nullhypothese ablehnen würde. keinen Unterschied. (d) t = -2,38, für 63 df . Wir lehnen
die Nullhypothese ab, dass es keine Mittelwertdifferenz mit P < 0,05 gibt, da t > 2,0 der
Grenzwert für α (2) = 0,05 für 63 df ist.
4. (a) Um die 95 %-Konfidenzintervalle für die mittlere Anzahl gefangener Mistkäfer zu
berechnen, müssen wir davon ausgehen, dass die Anzahl gefangener Tiere normalverteilt ist.
Für die Mistzusatzbehandlung beträgt das Konfidenzintervall also 4,8 + (2,26 × 1,03): 2,47 <
µ < 7,13. Für die Kontrolle beträgt das Konfidenzintervall 0,51 + (2,26 × 0,28) oder -0,13 <
µ < 1,15. (b) Der Zwei-Stichproben -t -Test kann nicht zum Testen von Unterschieden in
den Mittelwerten verwendet werden, da die Standardabweichungen zwischen den beiden
Gruppen mehr als dreifach unterschiedlich sind. Stattdessen ist ein ungefährer t -Test nach
Welch geeignet.
5. Da es sich nicht um gepaarte Stichproben handelt, analysieren wir die Differenz der
Mittelwerte und nicht den Mittelwert der Differenzen. Die monogamen Fliegen hatten eine
mittlere Hodengröße von 0,8475 mm 2 , die polyandrischen 0,95 mm 2 , was einem
Unterschied von 0,1025 mm 2 entspricht. Das 95 %-Konfidenzintervall für diese Differenz
√
erfordert die Ermittlung von SE Y1bar - Y2bar ,= (s p 2 (1/n 1 + 1/n 2 ), wobei n 1 und n 2 = 4
und sp 2 = ( df 1 s 1 2 + df 2 s 2 2 )/ ( df 1 + df 2 ), wobei df 1 = df 2 = 3 und s 1 2 und s 2 2 = 0,0010
bzw. 0,0011. Dann ist SE Y1bar - Y2bar = 0,023. Das Konfidenzintervall für die Differenz ist die
Standardfehlerzeit t 0,05(2),6 = 2,45, also 0,1025 + 2,45 × 0,23 oder 0,046 bis 0,159. (b) Die
Nullhypothese besagt, dass es keinen Unterschied zwischen der monogamen und
polyandrischen Behandlung in der Hodengröße gibt, also ( µ 1 - µ 2 ) 0 = 0. t = die Differenz
der Mittelwerte, 0,1025, über dem SE der Differenz, 0,23. t = 4,48, für 6 df . t krit = 3,71 für P
= 0,01, also P < 0,01. Die mittleren Hodengrößen unterscheiden sich deutlich.
6. (a) Im Durchschnitt waren 33 % mehr männliche Körper bedeckt, wenn sie Pheromone
ausstießen. sp = 26,5 %; SE Y - = 6,02 %. df 1 = 48 und df 2 = 31, also df = 79. t 0,05(2), 79 df =
Y
1,99, also ist das Konfidenzintervall: 21 % < µ 1 - µ 2 < 45 %. (b) Unter Verwendung eines t
-Tests bei zwei Stichproben gehen wir davon aus, dass die prozentuale Abdeckung
normalverteilt ist, dass jede Schlange unabhängig ist und dass die Standardabweichungen
nicht unterschiedlich sind (sie sind nicht mehr als dreifach unterschiedlich). Die
Nullhypothese besagt, dass es keinen Unterschied zwischen den Männchen, die Pheromone
aussenden, und denen, die keine Pheromone aussenden, gibt, also ( µ 1 - µ 2 ) 0 = 0. t = 0,33 /
= 63.5
(b) Für den einfachsten Test gehen wir davon aus, dass die Verteilungen normal sind. Dann
können wir den F -Test verwenden, um die Varianzen zu vergleichen. 42,4 / 8,6 = 4,93; 443,
172 df . Wenn wir dies (grob) nachschlagen, stellen wir fest, dass der kritische Wert 1,21 (für
1000.200) und 1,31 (für 200.100) für α (1) = 0,05 beträgt. Daraus schließen wir, dass die
Varianz für F 2 deutlich größer ist als die Varianz für die F 1 .
12. Gepaarter t-Test: Die mittlere Differenz beträgt 22,3, was sich deutlich von 0 unterscheidet (
P <0,01, t = 4,5, df =7).
13. (a) Wir würden für diesen Vergleich den ungefähren t-Test von Welch verwenden, da sich
die Standardabweichungen zwischen Pteronotus und den Vampiren um mehr als das
Dreifache unterscheiden. (b) Die durchschnittliche Stärke war für Pteronotus höher , was in
die entgegengesetzte Richtung geht, wie vom Modell vorhergesagt.
14. (a) Wir können in diesem Fall einen gepaarten t -Test verwenden, da die
Körpertemperaturmessungen bei denselben Personen durchgeführt werden wie die
Gehirntemperaturmessungen. Dazu berechnen wir den Temperaturunterschied zwischen
Gehirn und Körper für jeden Strauß, ermitteln den mittleren Unterschied (0,648 Grad C) und
den Standardfehler des Unterschieds (0,116 Grad C). µ 0 = 0: Die Nullhypothese besagt, dass
sich die Gehirntemperatur nicht von der Körpertemperatur unterscheidet. t = 0,648 / 0,116 =
5,6, mit 5 df , was größer als der kritische Wert fürα(2) = 0,01, 4,03 ist, also P < 0,01. Wir
lehnen die Nullhypothese ab, dass es keinen Unterschied zwischen Gehirn- und
Körpertemperatur gibt. (b) Obwohl unser Test signifikant ist, ist die Abweichung das
Gegenteil, was aus Beobachtungen von Säugetieren in ähnlichen Umgebungen vorhergesagt
wurde: Gehirne sind heißer als Körper bei Straußen, nicht kühler.
15. (a) B. (b) B. (c) Aus B können wir immer noch ziemlich sicher sein, dass die Gruppen
unterschiedlich sind, aber wir müssen die Größe der Fehlerbalken gedanklich verdoppeln,
um diese Entscheidung treffen zu können. (d) Bei Stichprobengrößen von 100 sind die
Standardfehler ein Zehntel so groß wie die Standardabweichungen. Die Diagramme A, B und
C werden erheblich unterschiedlich sein.
Chapter 13
1. (A) Der Punkt liegt auf einer Kurve und nicht auf einer Linie, daher ist es unwahrscheinlich,
dass die Verteilung normal ist. (B) Diese Verteilung weist eine gewisse Krümmung auf,
mehr als bei einer Normalverteilung zu erwarten wäre. (C) Dies kommt der geradlinigen
Verteilung sehr nahe, wobei die Punkte in der Mitte dichter gruppiert sind, als man es von
einer Normalverteilung erwarten würde. (D) Dieses Quantildiagramm weist zwei
unterschiedliche Kurven auf. In der Mitte des Diagramms gibt es relativ wenige Punkte und
nicht die höchste Dichte, die man bei einer Normalverteilung erwarten würde.
2. (a) I. Nein, das ist eine Gleichverteilung, keine Normalverteilung.
11. Nein, diese Handlung ist bimodal, nicht normal.
111. Nein, diese Handlung ist rechtsschief. Es sieht eher logarithmisch als normal aus.
112. Ja, das ist eine Normalverteilung.
(b) I. Der Vorzeichentest wäre für diese Daten am besten geeignet, da es unwahrscheinlich
ist, dass sie sich in etwas annähernd Normales umwandeln.
II. Der Vorzeichentest wäre wahrscheinlich auch für diese Verteilung am besten geeignet.
Bimodale Verteilungen lassen sich nur schwer in etwas anderes umwandeln.
III. Diese Daten könnten nach der Transformation wahrscheinlich durch einen t-Test bei
einer Stichprobe getestet werden (wahrscheinlich eine logarithmische Transformation, da sie
rechtsschief ist).
IV. Diese Daten könnten so, wie sie sind, durch einen T-Test bei einer Stichprobe getestet
werden.
(c) I: B (das erklärt, warum es in den Quantildiagrammen eine so konstante Punktdichte
gibt).
II. D. (Die beiden Spitzen entsprechen den beiden Kurven in den Quantildiagrammen; dies
sind auch die Bereiche mit der höchsten Dichte in den Quantildiagrammen).
III. A. (Die Dichte ist links am höchsten, mit einigen wenigen Punkten auf der rechten
Seite, die über einen großen Bereich auf der x-Achse verstreut sind.)
IV. C. (Spärliche Punkte an den Extremen des Bereichs; Punkte, die entlang einer geraden
Linie fallen, wie es für eine Normalverteilung erwartet wird).
3. (a) Mittelwert 2,75; 95 % KI: -3,28 < µ log[x] < 8,78. (b) Mittelwert 1,86; 95 % KI: -0,02 < µ
log[x] < 3,74. (c) Nicht möglich: Die ln-Transformation kann nicht für negative Werte
verwendet werden. (d) Mittelwert 4,23; 95 % KI: -2,04 < µ log[x] < 10,5. (e) Hier müssen wir
Y' = ln(Y + 1) verwenden. Mittelwert: 0,98; 95 % KI: -0,23 < µ log[x] < 2,2.
4. Nach Anwendung des Arkussinus auf die Quadratwurzel der Rohdaten beträgt der
Mittelwert 1,39 und die SD 0,09.
5. Die einfachste Analyse ist ein Vorzeichentest. Wir bewerten jeden Hummer mit „+“,
wenn er mehrHeimat
Richtung zeigt als Auswärts (also -90 bis 90) und „-“, wenn mehr weg als nach Hause zeigt
als 90
(mehr).oder weniger als -90). Hummer genau bei 90 oder -90 werden nicht gewertet. Von
den 14 erzielten A
Hummer, 11 waren „+“ und 3 ⎛ 14
⎛ ⎞
-". P = 2 14 = 0.057 . Mit dem
waren ⎜⎟ Üblichen
⎜ ∑ mit diesen⎞Daten nicht ablehnen.
⎝ 0,5 14 x
-
x=
Standard von α = 0,05 können wir die Nullhypothese
6. Mann-Whitney-U-Test: U 1 = 39. U 2 =6, also U = 39. Der kritische Wert für n 1 = 5 und n 2 = 9
beträgt 38. U ist größer, daher lehnen wir die Nullhypothese ab, dass es keinen Unterschied in der
Zeit bis zur Fortpflanzung aufgrund von Unfalltod oder Kindsmord gibt.
7. Ein nichtparametrischer Ansatz für dieses Problem ist der Mann-Whitney-U-Test. Dabei wird
darauf hingewiesen, dass es viele Bindungen geben wird, sodass unser Test weniger
aussagekräftig sein wird, als er sein könnte. Wir weisen den Nullen einen Rang von „3“ zu
(Durchschnitt von 1–5), den Einsen einen Rang von 11,5 (Durchschnitt von 6–17), den Zweien
einen Rang von 19,5 (Durchschnitt von 18–21). und einen Rang von 23 bis 3 (Durchschnitt 22-
24). Dann summieren wir die Ränge für die Blindgruppe: R1 = 140,5. Wir haben dann U 1 = n 1 n
2 + n 1 (n 1 +1)/2 – R 1 = 81,5 berechnet. U 2 = n 1 n 2 - U 1 = 144 - 81,5 = 62,5. U = 81,5. Der
kritische Wert für n 1 = 12 und n 2 = 12 beträgt 107. U ist kleiner, daher lehnen wir die
Nullhypothese nicht ab, dass es keinen Unterschied in der Anzahl der von blinden und sehenden
Menschen verwendeten Gesten gibt.
8. (a) Benton: Mittelwert 0,67, Varianz 0,075; Warrenton: Mittelwert: 0,24, Varianz 0,007. Die
Standardabweichungen unterscheiden sich um mehr als das Dreifache, daher ist ein t -Test bei
zwei Stichproben ungeeignet. (b) (1) Versuchen Sie eine logarithmische Transformation, gefolgt
von einem t -Test bei zwei Stichproben. (2) Welchs t -Test für die nicht transformierten Daten,
der keine gleichen Varianzen erfordert. (3) Mann-Whitney-U-Test. (c) Eine logarithmische
Transformation könnte angemessen sein, da die Grundgesamtheit mit dem größeren Mittelwert
die größere Varianz aufweist. Der t- Test bei zwei Stichproben für die transformierten Daten
weist die Nullhypothese zurück: t = 0,961 / 0,249 = 3,87,
9. mit 10 df . P < 0,01. (d) Für Benton County: -0,94 < µ log[x] < -0,04. Für Warrenton County: -
1,84 < µ log[x] < -1,06. (e) Das transformierte Konfidenzintervall für Benton County beträgt 0,39
bis 0,96; für Warrenton County beträgt das Intervall 0,16 bis 0,35. Wenn wir die Mittelwerte aus
vielen Stichproben ermitteln würden, würden 95 % der Konfidenzintervalle dieser Stichproben
den wahren Mittelwert enthalten.
10.T-Tests und Konfidenzintervalle bei zwei Stichproben sind robust gegenüber Verletzungen
gleicher Standardabweichungen, solange die Stichprobengrößen der beiden Gruppen ungefähr
gleich sind und die Standardabweichungen nicht mehr als das Dreifache voneinander entfernt
sind.
11. (A) t- Test bei zwei Stichproben (B) Diese Verteilungen sind rechtsschief, sodass eine
logarithmische Transformation versucht werden könnte. (C) Dies ist schwierig: Keine der
Verteilungen ist normal, aber sie weichen auf unterschiedliche Weise ab, sodass eine
Transformation, die die Anpassung für die eine verbessern würde, für die andere nicht hilfreich
wäre. Außerdem werden die Standardabweichungen sehr unterschiedlich sein. Aufgrund der
Formunterschiede ist der Rangsummentest ungeeignet. Am besten ist ein Randomisierungstest
(Kapitel 19). (D) t -Test bei zwei Stichproben. (E) t -Test bei zwei Stichproben.
12. (a) Die Nullhypothese besagte, dass sich die Spermatiden von Männern und Hermaphroditen in
ihrer mittleren Größe nicht unterschieden, während die Alternativhypothese besagt, dass sie sich
in der Größe unterscheiden. (b) U = 35910, n 1 = 211, n 2 = 700. Verwenden Sie die
Normalnäherung: Z = U
-n1n2 = -11.32. Das ist hoch
V n 1 n 2 ( n 1 + n 2 + 1 ) /3
signifikant ( P < 0,00002). (c) Es ist nicht klar, ob die Variablen bei Hermaphroditen und
Männern gleich verteilt sind. Wenn nicht, ist der Mann-Whitney-U-Test möglicherweise
ungenau.
13. Mann-Whitney-U-Tests reagieren unempfindlich auf Ausreißer und können in diesem Fall
sinnvoll eingesetzt werden.
14. Die Unterschiede sind nicht normalverteilt, sondern rechtsschief. Wir brauchen einen
Gebärdentest. Es gibt 6
„-“ und 22 „+“, wobei ein „+“ mehr Arten in der zweihäusigen Gruppe
⎛ ⎛ ⎞⎟
28
0,5 28
-
bedeutet.
= 0,0037, daher lehnen wir die Nullhypothese ab.
⎞ ⎜
28 P = 2 x
0,5⎟x
⎝ x
15. Zuerst transformieren wir die Daten, indem wir den natürlichen
Logarithmus jedes Gewichts nehmen. Die mittleren ln-transformierten Gewichte betragen -1,37
mg für Frauen und -1,76 mg für Männer. Da die transformierten Gewichte normalverteilt sind,
können wir den T-Test mit zwei Stichproben verwenden. t = 3,51, mit df = 18. Der kritische Wert
fürα (2) = 0,01 für 18 df beträgt 2,88, also P < 0,01, und wir lehnen die Nullhypothese ab.
Weibliche Mücken wiegen mehr als männliche.
16. Nein, die Unterschiede sind wahrscheinlich nicht normalverteilt: Zwei Werte unter 500, drei
Werte über 24.000 wären bei einer Normalverteilung nicht zu erwarten. (b) Wir können einen
Vorzeichentest verwenden: Wir haben fünf Paare, bei denen sich mehr Arten von Angiospermen
als von Gymnospermen ernähren. Die Wahrscheinlichkeit von fünf von fünf in der
Binomialverteilung beträgt 0,5^5 oder 0,031, wenn man davon ausgeht, dass beide Ergebnisse
gleich wahrscheinlich sind. Für einen zweiseitigen Test müssen wir diesen Wert jedoch
verdoppeln, sodass P = 0,062 ist. Wir sind nicht in der Lage, die Nullhypothese mit dem üblichen
Signifikanzniveau abzulehnen. (c) Die Zahl der Arten, die sich von Angiospermen ernähren, war
oft um zwei Größenordnungen größer, und alle Paare hatten eine höhere Artenzahl in der
Angiospermengruppe. Es ist unmöglich, mit nur 5 Datenpunkten in einem Vorzeichentest einen
P -Wert unter 5 % zu erreichen, selbst wenn alle Daten in eine konsistente Richtung weisen.
Kapitel 14
1. (a) Begrenzen Sie den Stichprobenfehler. (b) Reduzieren Sie die Voreingenommenheit. (c)
Reduzieren Sie den Stichprobenfehler. (d) Reduziert Voreingenommenheit. (e) Reduzieren Sie
die Voreingenommenheit.
2. (a) [Antworten können variieren] T, H, H, H, H, T, T, H (b) [Antworten können variieren] Nein
(c) 1 – Pr[genau 4
⎛⎞ 8
Kopf und 4 Zahl in 8 Würfen] = 1 -
⎜⎟ 0,5 8 = 0,727. (d) [Antworten können variieren]
Weisen Sie eine zufällige Antwort zu
Geben Sie jeder Einheit eine Zahl zwischen 0 und 1 an. Ordnen Sie die erste Behandlung den
Einheiten mit den 4 kleinsten Zufallszahlen und die zweite Behandlung den verbleibenden
Einheiten zu.
3. Verwenden Sie ein zufälliges Blockdesign, bei dem jeder Block eine Position entlang des
Feuchtigkeitsgradienten darstellt. Platzieren Sie drei Parzellen in jedem Block, eine für jede der
drei Düngemittelbehandlungen (nennen Sie die Düngemittel A, B und C). Weisen Sie innerhalb
jedes Blocks die drei Düngemittelparzellen nach dem Zufallsprinzip zu. Die folgende Abbildung
zeigt den Entwurf für 6 Blöcke.
4. Die Forscher planten ihre Stichprobengröße unter der Annahme eines Signifikanzniveaus von
0,05 und einer 80-prozentigen Wahrscheinlichkeit, eine falsche Nullhypothese abzulehnen (für
einen bestimmten Unterschied zwischen den Behandlungsmitteln).
5. Beobachtungsstudie. Die Behandlungen sowie das Vorhandensein und Nichtvorhandensein von
Bachforellen wurden den Einheiten (Bächen) nicht zufällig zugeordnet – die Forellen waren
bereits vor der Studie in den Bächen vorhanden. Potenzielle Störfaktoren (Wassertemperatur,
Bachtiefe, Nahrungsangebot) können zwischen Bächen mit und ohne Bachforellen
unterschiedlich sein, und es wurde keine Randomisierung verwendet, um ihren Zusammenhang
mit der Behandlungsvariablen aufzubrechen.
6. (a) Verzerrung verringern (reduziert die Auswirkungen von Störvariablen); Stichprobenfehler
verringern (durch Gruppierung ähnlicher Einheiten in Paare) (b) Keine Auswirkung auf die
Verzerrung; Stichprobenfehler reduzieren. (c) Verzerrung verringern (korrigiert Auswirkungen
des Alters, einer möglichen Störvariablen); Keine Auswirkung auf den Stichprobenfehler. (d)
Keine Auswirkung auf die Voreingenommenheit; Stichprobenfehler reduzieren.
7. (a) Nein. In einer experimentellen Studie weist der Experimentator den Probanden zwei oder
mehr Behandlungen zu. Hier gab es nur eine Behandlung. (b) Nehmen Sie zwei Behandlungen
vor: die Salzinfusion und eine Placebo-Kontrolle (z. B. Infusionen mit destilliertem Wasser).
Weisen Sie Behandlungen nach dem Zufallsprinzip einer Stichprobe von Patienten mit schwerer
Lungenentzündung zu. Stellen Sie sicher, dass bei jeder Behandlung die gleiche Patientenzahl
vorliegt. Halten Sie die Patienten darüber im Unklaren, welche Behandlung sie erhalten. Ein
Arzt, der nicht weiß, welcher Patient welche Behandlung erhalten hat, sollte seinen weiteren
Zustand protokollieren.
8. (a) Beobachtungsstudie: Krebsbehandlungen wurden den Probanden nicht zufällig zugewiesen.
(b) Ja: Es wird der Marihuanakonsum von Krebspatienten und Nichtkrebspatienten
(Kontrollpatienten) verglichen. (c) Verringerung der Voreingenommenheit.
Alter und Geschlecht könnten verwirrende Variablen sein, die sowohl den Marihuanakonsum als
auch die Krebsinzidenz beeinflussen. Wenn nur Probanden mit ähnlichem Alter und Geschlecht
verwendet werden, verringert sich die Auswirkung dieser Störvariablen auf den Zusammenhang
zwischen Marihuanakonsum und Krebs. (d) Erstens ist es nicht ratsam, die Nullhypothese zu
„akzeptieren“, da die Studie möglicherweise nicht ausreichend aussagekräftig war, um einen
Effekt festzustellen. Das 95 %-Konfidenzintervall für das Odds Ratio lag zwischen 0,6 und 1,3,
was immer noch die Möglichkeit eines moderaten Effekts beinhaltet. Zweitens können
Beobachtungsstudien wie diese aufgrund verwirrender Variablen nicht über die Ursache
entscheiden. Möglicherweise erhöht Marihuanakonsum tatsächlich das Krebsrisiko, aber
Marihuanakonsumenten haben Unterschiede im Lebensstil, die das Krebsrisiko verringern und
die Wirkung von Marihuana ausgleichen.
9. (a) Die Stiche wurden an zwei Freiwilligen angebracht, was bedeutet, dass die Reaktionen auf die
40 Stiche wahrscheinlich nicht unabhängig voneinander waren. Bei einer Stichprobengröße von
40 handelt es sich um eine Pseudoreplikation. (b) Konservativer und angemessener sollte diese
Studie als gepaartes Design mit zwei Stichproben behandelt werden. Der mittlere Unterschied in
der Schwellung würde für jede Versuchsperson ermittelt und dann würde der Durchschnitt der
beiden Versuchspersonen getestet, um festzustellen, ob er signifikant von Null abweicht. (c) Da
jedes Subjekt nur einen Datenpunkt hinzufügt, besteht keine Notwendigkeit, jedem Subjekt 20
Stiche zuzufügen. Weniger Stiche pro Subjekt wären weniger grausam und mehr Subjekte
würden mehr Replikationen und damit mehr Macht ermöglichen.
10. Extreme Dosen steigern die Wirkung und erhöhen so die Wahrscheinlichkeit, einen Effekt zu
erkennen. Wenn ein Effekt festgestellt wird, wären Studien über die Auswirkungen
realistischerer Dosen der nächste Schritt.
11. (a) 13 Parzellen pro Behandlung. Die „Unsicherheit“ beträgt 0,4/2 = 0,2, also n = 8 (0,25 / 0,2) 2
= 12,5, aufgerundet auf 13. (b) 50 Parzellen pro Behandlung. Die „Unsicherheit“ beträgt 0,2/2 =
0,1, also n = 8 (0,25 / 0,1) 2 = 50. (c) Eine größere Gesamtstichprobengröße wäre erforderlich,
wenn das Design nicht ausgewogen wäre. Bei einer gegebenen Gesamtstichprobengröße nimmt
die erwartete Breite eines Konfidenzintervalls für die Differenz zwischen zwei Mittelwerten zu,
je unausgewogener das Design ist (da die Präzision des Behandlungsmittelwerts mit der
geringeren Stichprobengröße stark abnimmt). Um die gleiche Konfidenzintervallbreite wie bei
einem ausgewogenen Design zu erreichen, ist daher eine größere Gesamtstichprobengröße
erforderlich. (d) Weil Umweltunterschiede zwischen der Parzelle mit normalem Mais und der
Parzelle mit Bt-Mais verwirrende Variablen wären. Tatsächlich würde es einem solchen Design
an Replikation mangeln, da die Pflanzen in derselben Parzelle nicht unabhängig sind.
12. 16 Parzellen pro Behandlung. n = 16 (0,25 / 0,25) 2 = 16.
Kapitel 15
1. (a) Isolation der Bevölkerung. (b) Experimentelle Studie: Den Pflanzen wurden von den
Experimentatoren Behandlungen zugewiesen. (c) Wir gehen davon aus, dass die Variable eine
Normalverteilung mit gleichen Varianzen in jeder Grundgesamtheit aufweist. (Wir gehen auch
von Zufallsstichproben aus.)
Behandlung Bedeute 95 % KI
Isoliert 9.3 5,3 < µ < 13,2
Mittel 14.5 11,5 < µ <
Lang 10.8 17,5
8,0 < µ < 13,5
Kontinuierlich 12.8 8,2 < µ < 17,3
(d) (Antworten können variieren). In der Abbildung unten stellen offene Kreise die Daten dar
(bei Bedarf versetzt, um Überlappungen zu minimieren). Mittelwerte sind ausgefüllte Kreise.
Vertikale Linien zeigen 95 %-Konfidenzintervalle an.
(c) F -Verteilung mit 3 und 12 Freiheitsgraden. (d) Die Wahrscheinlichkeit, eine F- Verhältnis-
Statistik zu erhalten, die genauso groß oder größer ist als der Wert, der beobachtet wird, wenn die
Nullhypothese wahr ist. (e) Die Gesamtsumme der Quadrate ist die Summe der quadrierten
Abweichungen zwischen jeder Beobachtung und dem Gesamtmittelwert. Die
Fehlerquadratsumme ist die Summe der quadrierten Abweichungen zwischen jeder Beobachtung
und ihrem Gruppenmittelwert. Die Gruppensumme der Quadrate ist die Summe der quadrierten
Abweichungen zwischen dem Gruppenmittelwert für jedes Individuum und dem
Gesamtmittelwert. (f) Verwenden Sie R 2 , das Verhältnis der Gruppensumme der Quadrate und
der Gesamtsumme der Quadrate. (g) R 2 = 63,188 / 126,438 = 0,50.
3. (a) H 0 : Der Mittelwert der Gruppe i entspricht dem Mittelwert der Gruppe j , H A : Der
Mittelwert der Gruppe i entspricht nicht dem Mittelwert der Gruppe j für alle Mittelwertpaare i
und j . (b) Hierbei handelt es sich um ungeplante Vergleiche, da mit ihnen nach Unterschieden
zwischen allen Mittelwertpaaren gesucht werden soll. Geplante Vergleiche müssen weniger
zahlreich sein und vor der Datenerhebung und -analyse als entscheidend identifiziert werden. (c)
Das Versäumnis, eine Nullhypothese abzulehnen, dass die Differenz zwischen einem gegebenen
Paar von Mittelwerten Null ist, bedeutet nicht, dass die Mittelwerte gleich sind, da die
Trennschärfe nicht unbedingt hoch ist, insbesondere wenn die Unterschiede gering sind. Wenn
sich die Mittelwerte der Behandlungen „Mittel“ und „Isoliert“ voneinander unterscheiden,
müssen sich eine oder beide von den Mittelwerten der anderen beiden Gruppen unterscheiden,
aber wir wissen nicht, welche.
(D)
Der kritische Wert ist F 0,05(1),2,29 = 3,33. Da F > 3,33, P < 0,05, verwerfen Sie H 0 .
Schlussfolgerung: Es gibt Unterschiede zwischen den Behandlungen hinsichtlich der mittleren
Triebzahl. (c) Die Variable ist normalverteilt mit gleicher Varianz in den drei
Behandlungspopulationen. (d) Feste Effekte. Die gewählten Werte wurden vom Forscher
festgelegt und sind wiederholbar; sie wurden nicht zufällig aus einer Behandlungspopulation
ausgewählt.
6. (a) Y 1 – Y 2 = – 0,004 – – 0,195 = 0,191. MS- Fehler = 0,0345, df = 42, SE = 0,0679, t 0,05(2),42 =
2,01, 0,054 < µ 1 - µ 2 < 0,328. (b) Ja, da die Studie hauptsächlich dazu gedacht war, die PLP1-
Genexpression bei Personen mit Schizophrenie mit der von Kontrollpersonen zu vergleichen. Es
handelte sich um einen einzelnen, fokussierten Vergleich und nicht um eine umfassende Suche
nach Unterschieden zwischen Gruppen. (c) Die Expressionsmessungen sind in den Populationen
mit gleichen Varianzen normalverteilt. (Wir gehen auch von Zufallsstichproben aus.)
7. (a) H 0 : Die mittlere PLP1-Genexpression ist in den drei Gruppen gleich ( µ 1 = µ 2 = µ 3 ).
H A : Mindestens einer aus der Gruppe bedeutet, dass µ i unterschiedlich ist.
Der kritische Wert ist F 0,05(1),3.178 = 2,66. Da F > 2,66, P < 0,05, verwerfen Sie H 0 . Daraus lässt
sich schließen, dass die mittlere Carotinoid-Plasmakonzentration an den Standorten variiert. (c)
Wir gehen davon aus, dass die Carotinoid-Plasmakonzentration in jeder Population eine
Normalverteilung mit gleichen Varianzen aufweist. Wir gehen außerdem davon aus, dass die
Standorte zufällig ausgewählt wurden und dass die Standortmittel eine Normalverteilung
aufweisen. (Wir gehen auch von Zufallsstichproben aus.)
9. (a) H 0 : Das mittlere Testgewicht ist in den vier Behandlungen gleich ( µ 1 = µ 2 = µ 3 = µ 4 ). H
A : Mindestens eines der Behandlungsmittel µ i ist unterschiedlich.
Der kritische Wert ist F 0,05(1),3,68 = 2,74. Da F > 2,74, P < 0,05, verwerfen Sie H 0 . Fazit: Das
mittlere Hodengewicht variiert je nach Behandlung. (b) Das Hodengewicht ist normal in den vier
Populationen mit gleicher Varianz verteilt. (Wir gehen auch von Zufallsstichproben aus). (c) Ja,
dies war eine experimentelle Studie, da die Behandlungen von den Forschern (zufällig) den
Probanden (Mäusen) zugewiesen wurden. (d) R 2 = 19057,5/149107,5 = 0,13.
χ
10. Es muss ein 2- Kontingenztest verwendet werden (Kapitel 9). Beobachtete und erwartete
Häufigkeiten (in Klammern) sind in der nachstehenden Kontingenztabelle aufgeführt.
H0 : Der Anteil der imprägnierten Weibchen ist bei allen vier Behandlungen gleich
H A : Der Anteil der geschwängerten Weibchen ist bei den vier Behandlungen nicht gleich
Anzahl Weibchen
Behandlung imprägniert nicht imprägniert Zeilensumme
Öl 14 (12.75) 4 (5.75) 18
THC 13 (12.75) 5 (5.75) 18
Cannabinol 11 (12.75) 7 (5.75) 18
Cannabidiol 13 (12.75) 5 (5.75) 18
Spaltensumme 51 21 72
χ 2
χ
= 1,28, df = 3. Der kritische Wert ist 0 2 .05(1),3 = 7,81. Da 2 nicht größer als 7,81 ist, χ
lehnen Sie H 0 nicht ab. ( P = 0,73). Wir können die Nullhypothese nicht ablehnen, dass der
Anteil der geschwängerten Frauen zwischen den Behandlungen gleich ist.
11. Zufällige Effekte: Die Männchen wurden zufällig aus der Population ausgewählt. Ein bestimmter
Mann ist keine spezifische, wiederholbare Behandlung. Ziel ist eine Verallgemeinerung auf die
männliche Population (die Hypothesenaussagen sollten dies widerspiegeln). (b) H 0 : Der mittlere
Zustand der Nachkommen ist für alle Männchen in der Population gleich. H A : Der
durchschnittliche Zustand der Nachkommen unterscheidet sich zwischen den Männchen in der
Population.
Variationsquelle Summe der Quadrate df Mittlere Quadrate F -Verhältnis P
Gruppen (Männer) 9.9401 11 0.9036 4.630.0008
Fehler 4.682 24 0.1951
Gesamt 14.622 35
Der kritische Wert F 0,05(1),11,24 = 2,21 (zwischen 2,18 und 2,25). Da F > 2,21, P < 0,05,
verwerfen Sie H 0 . Schlussfolgerung: Die mittleren Bedingungen für die Nachkommen
unterscheiden sich zwischen den Männchen in der Käferpopulation.
(c) s 2 A = (0,904 - 0,195) / 3 = 0,236. Wiederholbarkeit = 0,236 / (0,236 + 0,195) = 0,548.
Kapitel 16
1. r = - 0,5; r = - 0,8; r = 0,5; r = 0.
2. (a) 95 %: 0,22 < ρ < 0,63. 99 %: 0,14 < ρ < 0,68. (b) 95 %: - 0,95 < ρ < - 0,76. 99 %: - 0,96
< ρ < - 0,70. (c) 95 %: - 0,17 < ρ < 0,25. 99 %: - 0,24 < ρ < 0,31
3. (a) Streudiagramm:
60- .
Ö
8 50- .
g•
6
o 40-
C
2
••
30-
30 40 50 60 70
Ankunftsdatum der Frau
(b) Die Beziehung ist linear, positiv und stark. (c) r = 0,93. SE = 0,13. (d) Der Standardfehler ist
die Standardabweichung der Stichprobenverteilung von r . (e) 0,72 < ρ < 0,98
4 (a) Keine Änderung des Korrelationskoeffizienten ( r = 0,93). Das Hinzufügen einer Konstante zu
einer der Variablen ändert den Korrelationskoeffizienten nicht. (b) Keine Änderung des
Korrelationskoeffizienten ( r = 0,93). Die Division einer der Variablen durch eine Konstante
ändert den Korrelationskoeffizienten nicht.
5. Wir können einen gepaarten t -Test verwenden (Kapitel 12).
H 0 : Das mittlere Ankunftsdatum männlicher und weiblicher Partner ist gleich ( µ d = 0)
H A : Das mittlere Ankunftsdatum männlicher und weiblicher Partner ist unterschiedlich ( µ d ≠
0)
d = 0,3 Tage (Männchen sind im Durchschnitt etwas früher), SE = 1,667, t = 0,18, df = 9, P =
0,86. t 0,05(2),9 = 2,26; Da die beobachtete t kleiner als t 0,05(2),9 ist, P > 0,05, lehnen Sie H 0 nicht
ab. Wir kommen zu dem Schluss, dass wir die Nullhypothese gleicher mittlerer Ankunftszeiten
von Männern und Frauen nicht ablehnen können. Gehen Sie von einer Normalverteilung der
Unterschiede zwischen den Ankunftsraten von Männern und Frauen aus.
6. Wenn bei einer oder beiden Variablen X und Y ein Messfehler vorliegt.
7. Ein engerer Wertebereich für den Inzuchtkoeffizienten sollte die Korrelation mit der Anzahl
überlebender Jungtiere im Vergleich zu einem größeren Bereich von Inzuchtkoeffizienten
verringern.
8. Verwenden Sie die Spearman-Rangkorrelation:
H 0 : Die Populationsrangkorrelation ist Null ( ρ S = 0)
E^
2 0.0-
C •• • • • • •
8-0.02- . .
g*
6 -0.04 -
E
o -0,06
0 •
-0.08 -_____________________________
1 2 3
Leistungsbewertung
(b) r = 0,82 (c) H 0 : Es gibt keine Korrelation zwischen Zweitsprachenkenntnissen und Dichte
der grauen Substanz ( ρ = 0). H A : Es besteht ein Zusammenhang zwischen der Beherrschung
der zweiten Sprache und der Dichte der grauen Substanz ( 0). ρ≠
r = 0,82, SE = 0,13, t = 6,37, df = 20, P = 0,000003
t 0,05(2),20 = 2,09. Da t größer als t 0,05(2),20 ist, ist P > 0,05. H 0 ablehnen.
Kommen Sie zu dem Schluss, dass die Zweitsprachenkompetenz und die Dichte der grauen
Substanz korrelieren.
(d) Zufallsstichprobe und eine bivariate Verteilung der Dichte der grauen Substanz und der
Sprachkenntnisse in der Bevölkerung. (e) Nein, denn es scheint zwei abweichende
Beobachtungen zu geben, was gegen die Annahme der bivariaten Normalität verstößt. (f) Nein,
Korrelation allein impliziert keine Kausalität. Möglicherweise sind Personen mit einer hohen
Dichte an grauer Substanz in der Lage, eine zweite Sprache gut zu beherrschen. Es wäre ein
Experiment erforderlich, um zu testen, ob sich die Leistungsfähigkeit auf die graue Substanz
auswirkt.
Kapitel 17
1. (a) y = 0,5x + 1 (b) y = x – 1 (c) y = - 0,5 x + 2 (d) y = x – 5
2. (A)
Größe des Blockhausbereichs
Die prozentuale Säuglingssterblichkeit steigt ungefähr linear mit der logarithmischen Größe des
Reviers. (b) Sterblichkeit = 16,37 + 10,26 (Blockhausgebiet) (c) H 0 : Die Größe des
Heimatgebiets sagt nicht die Kindersterblichkeit voraus ( β = 0). H A : Die Größe des Reviers
4. (a)
β
9. (a) b = 11,68, SE = 4,85. (b) - 4,08 < < 27,43 (c) Der Bereich der plausibelsten Werte für den
Parameter. In 99 % der Zufallsstichproben klammert das Konfidenzintervall den
Grundgesamtheitswert für die Steigung ein. (d) Messfehler in der X- Variablen (Bisskraft) führen
tendenziell zu einer Unterschätzung der Populationssteigung. (e) Messfehler in der Y- Variablen
(Territoriumsbereich) beeinflussen die Schätzung der Steigung nicht (allerdings erhöhen sie
deren Unsicherheit).
10. (A)
Variationsquelle Summe der Quadrate df Mittlere Quadrate F -Verhältnis
Rückschritt 194.3739 1 194.3739 5.8012
Restwert 301.5516 9 33.5057
Gesamt 495.9255 10
(b) H 0 : Die Steigung der Regression der Revierfläche in Abhängigkeit von der Bisskraft ist
Null ( β = 0). H A : Die Steigung der Regression der Revierfläche in Abhängigkeit von der
Bisskraft ist nicht Null ( β≠0).
F = 5,8012, df = 1,9, P = 0,039. F 0,05(1),1,9 = 5,12. Da F > 5,12, P < 0,05. H 0 ablehnen. Schließen
Sie daraus, dass die Steigung nicht Null ist (sie ist positiv).
(c) Dass die Beziehung zwischen X und Y linear ist; Für jedes X gibt es eine Normalverteilung
der Y- Werte in der Grundgesamtheit, von der wir eine Zufallsstichprobe haben. die Varianz von
Y ist bei allen Werten von X gleich. (d) Die Varianz der Residuen. (e) R 2 = 0,392. Es misst den
Anteil der Variation in Y , der durch X erklärt wird.
11. (a) Führen Sie die Analyse mit und ohne den im Datensatz enthaltenen Ausreißer durch, um
festzustellen, ob dieser einen Einfluss auf das Ergebnis hat. Wenn es einen großen Einfluss hat,
ist es wahrscheinlich ratsam, es wegzulassen und die Vorhersagen auf den Bereich der X- Werte
zwischen 0 und etwa 200 zu beschränken (und sie zu drängen, mehr Daten bei den höheren X-
Werten zu erhalten). (b) Konfidenzbänder Geben Sie das Konfidenzintervall für die
vorhergesagte mittlere Zeit seit dem Tod für eine bestimmte Hypoxanthinkonzentration an. (c)
Konfidenzbänder. (d) Das Vorhersageintervall, da es die Unsicherheit bei der Vorhersage des
Todeszeitpunkts einer einzelnen Person misst.
12. (A)
Chapter 18
1. (a) STUNDEN = KONSTANTE + MUTANT.
HOURS sind Stunden des Ausruhens. CONSTANT ist der große Mittelwert. MUTANT ist die
Wirkung jeder Linie mutierter Fliegen. (b) STUNDEN = KONSTANTE (c) Die lange
horizontale Linie zeigt den Gesamtmittelwert an, der der vorhergesagte Wert für den Mittelwert
jeder Gruppe unter der Nullhypothese ist. Die kurzen horizontalen Linien geben die
Gruppenmittelwerte an, bei denen es sich um die vorhergesagten Werte unter dem
„vollständigen“ allgemeinen linearen Modell einschließlich des MUTANT-Terms handelt.
a1 a2
Faktor A
6. (a) SPEICHER = KONSTANTE + LÄSION. MEMORY ist der räumliche Gedächtniswert einer
Ratte, CONSTANT ist eine Konstante, die den Wert von MEMORY angibt, wenn LESION Null
ist ( Y -Achsenabschnitt), und LESION ist das Ausmaß der Läsion. (b) SPEICHER =
KONSTANTE (c) Die Linie mit negativer Steigung im folgenden Diagramm stellt die
vorhergesagten Werte aus dem „vollständigen“ allgemeinen linearen Modell dar. Die flache
(horizontale) Linie stellt die vorhergesagten Werte unter dem Nullmodell dar.
7. (a)
Chapter 19
1. (a) Zum Beispiel: Singleton: 3,5, 3,5, 2,6, 4,4 Zwilling: 3,4, 4,2, 3,4 (b) Singleton: 3,5, 4,2, 4,4,
3,4
Zwilling: 2,7, 2,6, 1,7 (c) In einem Bootstrap-Replikat sind die Daten für jede Gruppe
eine Stichprobe der Daten derselben Gruppe. Die Probenahme erfolgt mit Ersatz (einige Punkte
treten möglicherweise nicht auf und
andere könnten mehr als einmal vorkommen.) In einem Randomisierungsreplikat werden die
Daten für jede Gruppe aus allen Daten ohne Rücksicht auf die ursprüngliche Gruppe ausgewählt.
Die Stichprobe ist ersatzlos (jeder Datenpunkt kommt genau einmal vor) (d) Nein
2 (a) Ja – zufällig werden die Daten durch die Randomisierung möglicherweise den richtigen
Gruppen zugewiesen. (b) Ja (c) Nein – Die Stichprobengrößen der Gruppen müssen in jeder
Randomisierung mit denen in den Daten übereinstimmen . (d) Nein – Jeder Datenpunkt kann nur
vorkommen einmal in einer Randomisierung (e) Nein – 3 8 ist nicht in den Daten (f) Nein –
Jeder Datenpunkt kann nur einmal in einer Randomisierung vorkommen
3 (a) Ja – Bootstrap-Stichproben können zufällig dieselben Beobachtungen wie die Daten enthalten.
(b) Nein – Die Bootstrap-Stichprobe für eine Gruppe kann nur Daten aus dieser Gruppe enthalten
. (c) Nein – Die Stichprobengrößen der Gruppen müssen in jeder Gruppe gleich sein
Randomisierung wie in den Daten (d) Ja (e) Nein – 3 8 ist nicht in den Daten (f) Ja
4 10 20 < µ < 10 40
5 B sind die realen Daten. In A besteht kaum oder keine Beziehung zwischen den beiden Variablen,
während B eine starke Beziehung zeigt. Da die Randomisierung dazu neigt, Assoziationen
aufzulösen, ist es wahrscheinlicher, dass B die Daten und A eine Randomisierung ist
6 (a) A stammt aus der Randomisierung und B stammt aus dem Bootstrap. (b) Ungefähr 10
Einheiten. Der Bereich von X = 10 bis X = 50 sollte ungefähr 4 Standardabweichungen der
Verteilung umfassen, sodass 1 Standardabweichung ungefähr 10 Einheiten betragen sollte
7 (a) Die Nullverteilung für das Verhältnis (b) H 0 : Das mittlere Verhältnis der Reichweitengröße
entspricht dem, das von einem zufällig gebrochenen Stab erwartet wird. H A : Das mittlere
Verhältnis der Reichweitengröße weicht von dem ab, das von einem zufällig gebrochenen Stab
erwartet wird. P beträgt ungefähr 2 × (42/10.000) = 0,0084 Da P < 0,05, verwerfen Sie H 0.
Schließen Sie daraus, dass das mittlere Verhältnis bei Vögeln das von einem zufällig
gebrochenen Stock erwartete übersteigt
8 (a) 98 (b) 100 (c) „Riesenpandas sind am engsten mit Bären verwandt“
9 (a) Zum Beispiel:
G Gru A Gruppe B
78 4ppe
5 21 12 4 8 9 8 9
78 78 45 12 4 12 4 12 4
45 21 78 8 9 8 9 12 4
78 21 45 10 8 12 4 10 8
78 21 45 12 4 8 9 10 8
78 45 78 8 9 10 8 10 8
45 45 78 10 8 12 4 89
21 78 45 8 9 8 9 10 8
45 78 45 10 8 10 8 12 4
21 78 78 8 9 12 4 12 4
(b) Differenz im Median (B minus A) für diese 10 Bootstrap-Replikate:
3 0, 4 4, 4 4, 4 4, 4 6, 4 6, 6 3, 6 3, 6 3, 6 3
4 4 < Unterschied zwischen Bevölkerungsmedianen < 6 3
10 (a) Zum Beispiel:
Gruppe AI Gruppe B
8.9 2.1 4.5 10.8 7.8 12.4
4.5 8.9 2.1 7.8 10.8 12.4
4.5 12.4 2.1 7.8 8.9 10.8
4.5 8.9 2.1 10.8 12.4 7.8
10.8 4.5 2.1 8.9 12.4 7.8
4.5 10.8 2.1 12.4 8.9 7.8
8.9 12.4 4.5 2.1 7.8 10.8
12.4 10.8 2.1 7.8 4.5 8.9
2.1 10.8 7.8 8.9 12.4 4.5
7.8 4.5 10.8 12.4 2.1 8.9
(b) H 0 : Die beiden Gruppen haben den gleichen Median. H A : Die beiden Gruppen haben nicht
den gleichen Median. Teststatistik: beobachtete Differenz zwischen Medianen (B minus A) = 6,3
Nullverteilung: - 3,0, - 1,1, 1,1, 1,1, 4,4, 4,4, 4,4, 6,3, 6,3, 6,3
3 von 10 Ergebnissen sind größer oder gleich dem beobachteten Wert, 6,3
P beträgt ungefähr 2 × 3/10 = 0,6. Da P > 0,20, lehnen Sie H 0 nicht ab.
Kommen Sie zu dem Schluss, dass die Nullhypothese, dass es keinen Unterschied zwischen den
Medianen gibt, nicht abgelehnt wird.
11. Ja.
12. Ja.
13. 10,4 Sekunden.
14. Ungefährer t -Test nach Welch.
15. (a) Ein Randomisierungstest. Die Variable „Hüllenvolumen“ wurde festgehalten und die Werte
der zweiten Variablen sind alle enthalten, jedoch in zufälliger Reihenfolge. (b) Eine Bootstrap-
Schätzung. Jede Zeile des Datensatzes stellt eine andere Person dar, die aus der ursprünglichen
Stichprobe von Personen entnommen wurde. Die Probenahme erfolgt mit Ersatz, da dieselbe
Person manchmal mehr als einmal vorkommt. (c) Der lineare Korrelationskoeffizient r .
Kapitel 20
⎞
⎜⎛ 4
1
1. (a) Binomialverteilung mit n = 47. (b) L [ p | 12 Heterozygoten ] 27 35
= ⎟
S. 12 ( 1 - S. ) . Es
⎝
die Wahrscheinlichkeit, 12 Heterozygoten zu bekommen (die Daten), wenn man den wahren
Wert des Anteils berücksichtigt ⎜⎛ 4 7⎟
der Heterozygoten ist p . (c) ln L [ p ] ⎞⎥⎤1 2 + 12ln[ p ] + 35ln[1 - p ]. (d) –
= ln ⎢
2. (a) 0,26 (b) 0,14 < p < 0,40
⎝ 7,90
3. (a) Das Protokoll der Wahrscheinlichkeit der DNA-Daten bei unterschiedlichen möglichen
Zeitpunkten seit der Trennung zwischen Neandertalern und modernen Menschen. (b) 710.000
Jahre (c) 470 < Zeit seit der Teilung < 1000 (in Tausend Jahren) (d) Dieses Intervall ähnelt einem
95 %-Konfidenzintervall. Es beschreibt die plausibelsten Werte der Zeit seit der Trennung
zwischen Mensch und Neandertaler.
χ χ
4. (a) –4400 (b) –4396,5 (c) G = 2(–4396,5 – (–4400)) = 7. (d) 2 mit df = 1. (e) 0 2 .05,1 = 3,84 .
Da G größer als 3,84 ist, ist P < 0,05 (genaues P = 0,008). H 0 ablehnen. Kommen Sie zu dem
Schluss, dass die Heterogenität nicht Null ist.
5. (a) Pr[Ja] = 1/2 + s /2 = (1 + s )/2
Münzwurf-Antwort P
(b) L [ s | 113 ja ] =
⎛ 185 ⎞⎛ ⎞ ⎛ 1 ⎟
113 72
1+s ⎞
113 ⎜ 2
⎛ 185
⎠
+ 113ln[(1 + s )/2] + 72ln[(1 -
(c) ln L [ s | 113 ja ] = ln
⎝113 s )/2]
⎢ - 7,39
(d)
6. (a) Die Maximum-Likelihood-Schätzung beträgt s ˆ= 0,22. (b) 0,07 < s < 0,36. (c) H 0 : Der
Diebesanteil s ist Null. H A : Der Anteil der Diebe s ist nicht Null.
χ
G = 2 ( -2,81- ( -7,39 )) = 9,16. 0 2 .05,1 = 3,84. Da G > 3,84, P < 0,05 (genaues P = 0,002).
Ablehnen
H 0 . Kommen Sie zu dem Schluss, dass es unter uns Diebe gibt.
7. (A)
Kapitel 21
1. Ergebnisse werden als interessanter oder aufregender angesehen; Es ist wahrscheinlicher, dass
Ergebnisse zur Veröffentlichung angenommen werden. Ergebnisse werden eher in einer
besseren Zeitschrift akzeptiert.
2. (a) Ja: Die durchschnittliche Erblichkeit nimmt mit zunehmender Stichprobengröße ab. (b) Es
ist unwahrscheinlich, dass Studien mit kleinen Stichproben, die niedrige
Erblichkeitsschätzungen ergeben, zur Veröffentlichung eingereicht (Forscher) oder zur
Veröffentlichung angenommen (Herausgeber) werden.
3. Der Wert der Einbeziehung dieser Art von Studie ist gering, da wir davon ausgehen müssen,
dass Erfolg im Tennis ein Maß für Aggression ist. Dies einzubeziehen, könnte ein Akt der
Verzweiflung sein, der auf den Mangel an Humanstudien zurückzuführen ist, die Aggression
direkt messen.
4.
5. ( Die Antworten variieren .)
6. Die geringere Effektstärke bei größeren Studien deutet darauf hin, dass ein Publikationsbias
vorliegt, der sich auf die Schätzungen auswirkt: Kleine Studien mit geringen Effektstärken
erscheinen mit geringerer Wahrscheinlichkeit in der veröffentlichten Literatur.
7. Selbst wenn H 0 wahr ist, könnte es in einigen Studien zufällig abgelehnt werden. Wenn dies die
einzigen verfügbaren Studien sind
Für eine Überprüfung (aufgrund des Publikationsbias) würde die Metaanalyse zu dem Schluss
kommen, dass H 0 falsch ist.