Sie sind auf Seite 1von 12

20

15

Frequency

10

5

0

¨

6. Ubung(sserie) Statistik fur¨

1. Aufgabe:

Ingenieure WiSe 17/18

In dieser Aufgabe wurden mit R Stichproben vom Umfang n = 100 erzeugt.

Die vorliegenden Daten entstammen dabei einer a) gleichverteilten, b) exponential- verteilten, c) normalverteilten bzw. d) weibullverteilten Grundgesamtheit, d.h. die vorliegenden Stichproben sind Realisierungen von unabh¨angig und identisch gleich- verteilten, exponentialverteilten, normalverteilten und weibullverteilten Zufalls- variablen.

Was k¨onnen Sie aus den einzelen Grafiken ablesen. Bei welchen Grafiken kann man auf das Vorliegen oder Nichtvorliegen einer Normalverteilung und bei welcher auf das Vorliegen einer speziellen Verteilung schließen.

a) Stetige Gleichverteilung

>x1=runif(100,0,30)

>par(mfcol=c(2,2))

>hist(x1)

>boxplot(x1,horizontal

>qqnorm(x1);

>stripchart(x1,method="stack")

=T)

qqline(x1)

Histogram of x1

Normal Q−Q Plot Sample Quantiles 0 5 10 15 20 25 30
Normal Q−Q Plot
Sample Quantiles
0
5
10
15
20
25
30

0

5

10

15

20

25

30

−2

−1

0

1

2

 

x1

Theoretical Quantiles

 
 
 

0

5

10

15

20

25

30

0

5

10

15

20

25

30

>shapiro.test(x1)

Shapiro-Wilk

data:

=

W

x1

0.9529,

p-value

=

normality

0.001288

1

test

1.4

40

1.2

1.0

Sample Quantiles

30

Frequency

0.8

20

0.6

0.4

10

0.2

0.0

0

b) Exponentialverteilung

>x2=rexp(100,rate=3)

>par(mfcol=c(2,2))

>hist(x2)

>boxplot(x2,horizontal

>qqnorm(x2);

>stripchart(x2,method="stack")

=T)

qqline(x2)

Histogram of x2

=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

x2

=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0
=T) qqline(x2) Histogram of x2 0.0 0.5 1.0 1.5 x2 0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

>shapiro.test(x2)

Shapiro-Wilk

normality

data:

W

x2

=

0.8626,

p-value

=

3.557e-08

2

test

Normal Q−Q Plot −2 −1 0 1 2
Normal Q−Q Plot
−2
−1
0
1
2

Theoretical Quantiles

p-value = 3.557e-08 2 test Normal Q−Q Plot −2 −1 0 1 2 Theoretical Quantiles 0.0
p-value = 3.557e-08 2 test Normal Q−Q Plot −2 −1 0 1 2 Theoretical Quantiles 0.0
p-value = 3.557e-08 2 test Normal Q−Q Plot −2 −1 0 1 2 Theoretical Quantiles 0.0

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

c) Normalverteilung

x3=rnorm(100,mean=250,sd=5)

>par(mfcol=c(2,2))

>hist(x3)

>boxplot(x3,horizontal

>qqnorm(x3);

>stripchart(x3,method="stack")

=T)

qqline(x3)

Histogram of x3 Normal Q−Q Plot 235 240 245 250 255 260 265 −2 −1
Histogram of x3
Normal Q−Q Plot
235
240
245
250
255
260
265
−2
−1
0
1
2
x3
Theoretical Quantiles
235
240
245
250
255
260
235
240
245
250
255
260
Frequency
0
10
20
30
40
Sample Quantiles
235
240
245
250
255
260

>shapiro.test(x3)

Shapiro-Wilk

normality

data:

=

W

x3

0.9888,

p-value

=

0.5687

3

test

35

30

1000

25

Sample Quantiles

800

Frequency

20

600

15

400

10

200

5

0

0

d) Weibullverteilung

x4=rweibull(100,shape=2,scale=500)

>par(mfcol=c(2,2))

>hist(x4)

>boxplot(x4,horizontal

>qqnorm(x4);

>stripchart(x4,method="stack")

=T)

qqline(x4)

Histogram of x4

=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
=T) qqline(x4) Histogram of x4 0 200 600 1000 1400 x4 0 200 400 600 800
0 200 600 1000 1400 x4 0 200 400 600 800 1200
0
200
600
1000
1400
x4
0
200
400
600
800
1200

>shapiro.test(x4)

Shapiro-Wilk

normality

data:

=

W

x4

0.9738,

p-value

=

0.04339

4

test

Normal Q−Q Plot −2 −1 0 1 2
Normal Q−Q Plot
−2
−1
0
1
2

Theoretical Quantiles

W x4 0.9738, p-value = 0.04339 4 test Normal Q−Q Plot −2 −1 0 1 2
W x4 0.9738, p-value = 0.04339 4 test Normal Q−Q Plot −2 −1 0 1 2
W x4 0.9738, p-value = 0.04339 4 test Normal Q−Q Plot −2 −1 0 1 2
W x4 0.9738, p-value = 0.04339 4 test Normal Q−Q Plot −2 −1 0 1 2

0

200

400

600

800

1200

2. Aufgabe: Ein Versuch mit einem Schlafmittel In einem klinischen Versuch sollte die Wirksamkeit eines Schlafmittels getestet werden. Dazu wurden von den Patienten, die in einer Klinik fur¨ Schlafst¨orungen eingewiesen waren, zuf¨allig 10 Patienten ausgew¨ahlt, die ein neuartiges Schlafmit- tel erhielten (Behandlungsgruppe), und 10 weitere Patienten, denen nur eine wie das Schlafmittel aussehende und schmeckende, wirkungslose Pille verabreicht wur- de (Kontrollgruppe). Um die Wirksamkeit zu bestimmen, wurden jeweils zun¨achst die Schlafdauer in der Nacht vor der ersten Einnahme bestimmt. Vor der zweiten Nacht wurde den Patienten dann das Schlafmittel bzw. das Placebo gegeben. Die Schlafdauer der zweiten Nacht wurde ebenfalls ermittelt.

Als Daten liegen (u.a.) die Informationen vor, welches Mittel der Patient erhalten

hat (Behandlung =ˆ Schlafmittel, Kontrolle =ˆ wirkungsloses Placebo), und wie viel l¨anger die Patienten in der zweiten Nacht geschlafen haben (in Stunden). Ziel der Untersuchung ist es nachzuweisen, dass das Schlafmittel bei den in der Klinik be- handelten Schlafst¨orungen wirkt. Jedoch k¨onnte dieser Nachweis erst mit weiteren,

in dieser Serie noch nicht verwendeten Methoden gefuhrt¨

MehrSchlaf

Gruppe

1

0.7

Kontrolle

2

-1.6

Kontrolle

3

-0.2

Kontrolle

4

-1.2

Kontrolle

5

-0.1

Kontrolle

6

3.4

Kontrolle

7

3.7

Kontrolle

8

0.8

Kontrolle

9

0.0

Kontrolle

10

2.0

Kontrolle

11

1.9

Behandlung

12

0.8

Behandlung

13

1.1

Behandlung

14

0.1

Behandlung

15

-0.1

Behandlung

16

4.4

Behandlung

17

5.5

Behandlung

18

1.6

Behandlung

19

4.6

Behandlung

20

3.4

Behandlung

a)

i. Wie liegen die Daten vor?

werden.

ii. Welche Variablen gibt es und was bedeuten Sie?

iii. Welche Skala haben die einzelnen Variablen?

iv. Welche Annahme mussen¨

wir uber¨

die Datenerhebung treffen, damit die

Daten dafur¨

repr¨asentativ sind?

v. Wofur¨

k¨onnten diese Daten repr¨asentativ sein?

5

b) Grafiken

i. Welche Grafik eignet sich zur Darstellung der H¨aufigkeiten der Auswahl von Schlafmittel und Placebo? ii. Fur¨ die in der Originalpublikation verwendeten Verfahren ben¨otigt man eine Normalverteilung der Daten in der Behandlungsgruppe. Welche stati- stische Grafik wurde¨ sich eignen zu erkennen, ob diese Daten einigermaßen normalverteilt sind? iii. Um die Behandlungserfolge mit und ohne Medikament zu vergleichen und eventuelle Ausreißer zu erkennen wurden mit Statgraphics folgende paral- lele Box-Plots gezeichnet.

erkennen wurden mit Statgraphics folgende paral- lele Box-Plots gezeichnet. Was k¨onnen Sie aus dieser Grafik ablesen?

Was k¨onnen Sie aus dieser Grafik ablesen?

6

3. Aufgabe: Aquifer

Fur¨ die Untersuchung von Grundwasserleitern bezuglich¨ Tiefe (bergm¨annisch Teu- fe – von der Oberfl¨ache nach unten gemessen) und Schichteigenschaften liegt der folgende Aquifer-Datensatz vor:

> aqui<-read.table("D:/Aqui.txt",header=T)

> aqui

Teufe

Type

Transmissivitaet

1 78.64

Poren

0.028

2 49.00

Poren

0.073

3 47.00

Poren

0.110

4 43.67

Poren

0.144

5 37.00

Poren

0.170

6 23.50

Poren

0.440

7 9.00

Poren

1.600

8 80.50

Kluft

1.800

9 21.25

Kluft

4.300

10 43.50

Kluft

6.170

11 29.50

Kluft

13.200

12 16.50

Kluft

32.000

13 11.00

Kluft

66.000

Wir begutachten einige Grafiken:

(Generierungsbefehle der Statistiksofware R)

> attach(aqui)

7

70

Sample Quantiles

50

30

10

4

2

0

−2

> par(mfrow=c(2,2))

> qqnorm(Teufe,main="Teufe");qqline(Teufe)

> qqnorm(Transmissivitaet,main="Transmissivit¨at");qqline(Transmissivitaet)

> qqnorm(log(Teufe),main="log(Teufe)");qqline(log(Teufe))

> qqnorm(log(Transmissivitaet),main="log(Transmissivit¨at)")

> qqline(log(Transmissivitaet))

Teufe Transmissivität −1.5 −0.5 0.5 1.0 1.5 −1.5 −0.5 0.5 1.0 1.5 Sample Quantiles 0
Teufe
Transmissivität
−1.5
−0.5
0.5
1.0
1.5
−1.5
−0.5
0.5
1.0
1.5
Sample Quantiles
0
10
20
30
40
50
60

Theoretical Quantiles

log(Teufe)

−1.5 −0.5 0.5 1.0 1.5 Sample Quantiles 2.5 3.0 3.5 4.0 Sample Quantiles
−1.5
−0.5
0.5
1.0
1.5
Sample Quantiles
2.5
3.0
3.5
4.0
Sample Quantiles

Theoretical Quantiles

8

Theoretical Quantiles

log(Transmissivität)

−1.5 −0.5 0.5 1.0 1.5
−1.5
−0.5
0.5
1.0
1.5

Theoretical Quantiles

10

4

8

3

Frequency

Frequency

6

2

4

1

2

0

0

4

3

2

1

0

> par(mfrow=c(2,2))

> hist(Teufe)

> hist(Transmissivitaet)

> hist(log(Teufe))

> hist(log(Transmissivitaet))

Histogram of Teufe

> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
> hist(log(Transmissivitaet)) Histogram of Teufe 0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0
0 20 40 60 80 100 Teufe Histogram of log(Teufe) 2.0 2.5 3.0 3.5 4.0
0
20
40
60
80
100
Teufe
Histogram of log(Teufe)
2.0
2.5
3.0
3.5
4.0
4.5
Frequency
0
1
2
3
4
5
Frequency

log(Teufe)

9

Histogram of Transmissivitaet

4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60
4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60
4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60
4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60
4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60
4 5 Frequency log(Teufe) 9 Histogram of Transmissivitaet 0 10 20 30 40 50 Transmissivitaet 60

0

10

20

30

40

50

Transmissivitaet

60

70

Histogram of log(Transmissivitaet)

0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2
0 10 20 30 40 50 Transmissivitaet 60 70 Histogram of log(Transmissivitaet) −4 −2 0 2

−4

−2

0

2

4

log(Transmissivitaet)

6

70

70

50

50

30

30

10

10

60

60

40

40

20

20

0

0

4

4

2

2

0

0

−2

−2

> par(mfrow=c(3,2))

> boxplot(Teufe,main="Teufe")

> boxplot(Teufe~Type,main="Teufe")

> boxplot(Transmissivitaet,main="Transmissivit¨at")

> boxplot(Transmissivitaet~Type,

> boxplot(log(Transmissivitaet),main="log(Transmissivit¨at)")

> boxplot(log(Transmissivitaet)~Type,main="log(Transmissivit¨at)")

main="Transmissivit¨at")

Teufe

main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren
main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren
main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren
main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren
main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren

Transmissivität

main="Transmissivit¨at") Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität

log(Transmissivität)

Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren
Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren
Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren
Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren
Teufe Transmissivität log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren

Teufe

Kluft Poren
Kluft
Poren

Transmissivität

Kluft Poren
Kluft
Poren

log(Transmissivität)

log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10
log(Transmissivität) Teufe Kluft Poren Transmissivität Kluft Poren log(Transmissivität) Kluft Poren 10

Kluft

Poren

10

4

2

0

−2

4

2

0

−2

> par(mfrow=c(2,2))

> plot(Teufe,

> plot(Teufe,log(Transmissivitaet))

> plot(Teufe,

> plot(Teufe,log(Transmissivitaet),col=Type)

Transmissivitaet)

Transmissivitaet,col=Type)

Transmissivitaet 0 10 20 30 40 50 60 log(Transmissivitaet)
Transmissivitaet
0
10
20
30
40
50
60
log(Transmissivitaet)
10 20 30 40 50 60 70 80 Teufe 10 20 30 40 50 60
10
20
30
40
50
60
70
80
Teufe
10
20
30
40
50
60
70
80
Transmissivitaet
0
10
20
30
40
50
60
log(Transmissivitaet)

Teufe

a) Welche Skala haben die Merkmale?

b) Wie sind die Daten verteilt?

Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60
Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60
Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60
Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60
Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60
Skala haben die Merkmale? b) Wie sind die Daten verteilt? 10 20 30 40 50 60

10

20

30

40

50

60

70

80

Teufe

Wie sind die Daten verteilt? 10 20 30 40 50 60 70 80 Teufe 10 20
Wie sind die Daten verteilt? 10 20 30 40 50 60 70 80 Teufe 10 20
Wie sind die Daten verteilt? 10 20 30 40 50 60 70 80 Teufe 10 20
Wie sind die Daten verteilt? 10 20 30 40 50 60 70 80 Teufe 10 20

10

20

30

40

50

60

70

80

Teufe

c) Welche Abh¨angigkeiten sind erkennbar? Sind die Abh¨angigkeiten stark oder schwach, linear oder nichtlinear, zunehmend oder abnehmend?

11

FrankreichDeutschland

4. Aufgabe: In der Weinabteilung eines englischen Supermarktes, der sowohl deutsche als auch franz¨osische Weine feilbot, wurde an aufeinander folgenden Tagen entweder deutsche oder franz¨osische Musik gespielt. In der ersten Woche waren die deutschen Weine auf der linken Seite des Regals, die franz¨osischen rechts, in der zweiten Woche war es umgekehrt. Nationalfahnen an den Regalen machten den Herkunftsort der Weine unmissverst¨andlich klar. Die Musik der ersten Woche war franz¨osische (im Wesentlichen Akkordeon-Musik) und in der zweiten Woche deutsche (im Wesentli- chen Blaskapellen-Musik).

 

Musik

Herkunft des Weins

franz¨osische

deutsche

Frankreich

39

12

Deutschland

8

22

(nach M. Spitzer: Musik, Wein und Bahnungseffekte, Geist & Gehirn, dabei ist die Studie aus: North A, Hargreaves D, McKendrick J. The influence of in-store music on wine selections. Journal of Applied Psychology 1999; 84: 271-6. )

> Tabelle

<-

matrix(c(39,12,8,22),

2,

2,

byrow=TRUE)

> rownames(Tabelle)

<-

c("Frankreich","Deutschland")

> colnames(Tabelle)

<-

c("franz¨osische","deutsche")

> Tabelle

#

Counts

franz¨osische

deutsche

8

Was k¨onnen Sie aus folgender Grafik ablesen?

> mosaicplot(t(Tabelle),main="Mosaikplot",color=c(2,4))

Frankreich

39

12

Deutschland

Mosaikplot

französiche

Frankreich 39 12 Deutschland Mosaikplot französiche deutsche 12 22
Frankreich 39 12 Deutschland Mosaikplot französiche deutsche 12 22

deutsche

Frankreich 39 12 Deutschland Mosaikplot französiche deutsche 12 22

12

22