Sie sind auf Seite 1von 7

Prof. Dr. W.

Assenmacher
Dipl.-Kauffrau E. Plinta
Dipl.-Volkswirt S. Popp

Universit
at Duisburg-Essen

Statistik und Okonometrie

Deskriptive Statistik

L
osungen zum Ubungsblatt
4
1.
(xk1 , xk ]

nk

hk

Hk

(50, 60]
(60, 70]
(70, 80]
(80, 90]
(90, 100]
(100, 110]
(110, 120]

8
10
16
14
10
5
2

0,12
0,15
0,25
0,22
0,15
0,08
0,03

0,12
0,27
0,52
0,74
0,89
0,97
1

65

a) xp =xk 1 + k [p H(xk 1 )]
h
k

10
x0,25 =60+ 0,15
(0,25-0,12)=68,
6
10
x0,5 =70+ 0,25 (0,5-0,27)=79,2
10
x0,75 =90+ 0,15
(0,75-0,74)=90,
6

x0,1 =58,93; x0,1 =58,33 (unter Verwendung der gerundeten Werte); x0,2 =65,33; x0,3 =71,2; x0,4 =75,2;
x0,5 =79,2; x0,6 =83,64; x0,7 =88,18; x0,8 =94;
x0,9 =101,25.
b) x0,35 =73,2; x0,6 =83,64;

c) Die Quartile z.B. sind nach F


allen eines Lotes, ausgehend von dem Punkt, dessen Ordinatenwert z.B. bei dem ersten Quartil 0,25 betr
agt, auf der Abzisse abzulesen (vgl. nachfolgende
Abbildung).
H(x) 6
-

xk1

xk

2. H
aufigkeitsverteilung der m
annlichen Hamster (weibliche Hamster analog):

3.

(xk1 , xk ]

nk

hk

Hk

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
(70,80]
(80,90]
(90,100]
(100,110]
(110,120]
(120,130]
(130,140]

196
37
46
34
46
71
123
119
139
113
68
35
12
1

0,189
0,036
0,044
0,033
0,044
0,068
0,118
0,114
0,134
0,109
0,065
0,034
0,012
0,001

0,189
0,225
0,269
0,302
0,346
0,414
0,532
0,646
0,78
0,889
0,954
0,988
1
1,001

1040

a) x
=

1
n

b) x
=

1
148 (10

xj = 13 (10 + 12 + 8) = 10

a) Modalklasse: - m: (0,10] k=1


- w: (50,60] k=6

b) Arithmetisches Mittel: x
=

K
P

mk hk

k=1

- m: x
= m1 h1 + m2 h2 + ... + m14 h14
= 5 0, 189 + 15 0, 036 + ... + 135 0, 001
= 59, 9

- w: x
= 46, 1
10
c) Median: - m: x0,5 = 60 + 0,118
(0, 5 0, 414) = 67, 29
- w: x0,5 = 50, 74

d) Quartile: - m: x0,25 = 25, 68 ; x0,75 = 87, 76


- w: x0,25 = 30, 82 ; x0,75 = 61, 34

 EUR 
h

40 + 12 48 + 8 60) = 9, 84

.
 EUR 
h

 Stk 
c) Die Durchschnittsproduktivit
at ist definiert als Output
Input
h . Als Daten sind die durchInput  h 
schnittliche Arbeitszeit pro Werkst
uck= Output Stk der drei Besch
aftigten gegeben. Die
Haufigkeiten liegen als geleistete Arbeitsstunden vor. M
oglich sind nun zwei Vorgehensweisen:
1. Man berechnet den Kehrwert der durchschnittlichen Arbeitszeit pro Werkst
uck und
erh
alt die St
uckzahlen, die A, B und C pro Stunde herstellen. Multipliziert mit der
jeweiligen Arbeitszeit ergibt die Gesamtst
uckzahl, deren Division durch die gesamte
Arbeitszeit von 148 Stunden die Durchschnittsproduktivit
at liefert.




1
1
1
1
150
Stk
x
=
40 +
48 +
60 =
= 1, 0135
148 1
0, 8
1, 2
148
h
2. Man berechnet die durchschnittliche Arbeitszeit pro Werkst
uck u
aftigber alle Besch
te A,B und C mit dem harmonischen Mittel:


148
148
h
=
x
H = 
= 0, 9867
.
40
48
60
150
Stk
+
+
1
0,8
1,2
Der Kehrwert dieses Mittels ergibt die Durchschnittsproduktivit
at aller Besch
aftigten:


1
150
Stk
=
= 1, 0135
.
x
H
148
h
2

Der Zusammenhang zwischen Vorgehensweise 1 und 2 zeigt sich an folgender Formel:


m

X
1
=
x
H
i=1

1
xi

hi .

d) Die gr
ote Durchschnittsproduktivit
at hat B mit 1,25 Werkst
ucken pro Arbeitsstunde.
4.

a) Bev
olkerungsstatistik eines Landes:
k

Alter in Jahren

Bev
olkerung in %

hk

hk

Hk

1
2
3
4
5

(0,15]
(15,25]
(25,45]
(45,65]
(65,75]

30
12
32
20
6

0,3
0,12
0,32
0,2
0,06

0,02
0,012
0,016
0,01
0,006

0,3
0,42
0,74
0,94
1

100

b) Graphische Darstellung:
hk

Hk
6

0,02

1
0,94

0,016

0,74

0,012
0,01

0,42

0,006

0,3
-

15 25

45

65 75

15 25

45

65 75

c) Modus: Klassenmitte der Klasse mit maximaler H


aufigkeitsdichte: hk xM = 7, 5;
20
Median: xMed = 25 + 0,32
(0, 5 0, 42) = 30;
gesch
atztes Arithmetisches Mittel (approximiert u
ber die Klassenmitten mk ):
K
P

x
=
mk hk
k=1

= (7, 5 0, 3 + 20 0, 12 + 35 0, 32 + 55 0, 2 + 70 0, 06) = 31, 05.

5. Einkommensverteilung:

6.

(xk1 , xk ]

nk

hk

Hk

1
2
3
4
5
6
7

(0,500]
(500,1000]
(1000,1500]
(1500,2000]
(2000,2500]
(2500,80000]
(80000,100000]

6
20
48
20
5
0
1

0,06
0,2
0,48
0,2
0,05
0
0,01

0,06
0,26
0,74
0,94
0,99
0,99
1

100

a) N (X 1750)=?
0,2
H(X 1750) = 1 [H(1500) + 500
(1750 1500)]
= 1 [0, 74 + 0, 1] = 0, 16 =
16%
0, 16 100 = 16 Einkommensbezieher;
b) x0,25 = 500 + 500
0,2 (0, 25 0, 06)=975
500
(0, 5 0, 26)=1250;
x0,5 = 1000 + 0,48

c) Arithmetisches Mittel: x
=

K
P

mk hk

k=1

x
= 2500, 06+ 7500, 2+ ...+ 90000 0, 01 = 2127, 5
durchschn. Jahreseinkommen = 12 2127, 5 =
25530.

a) Da die 4 weiteren Merkmalsauspr


agungen verschieden sind und nicht mit dem Modalwert
u
andert, sofern die gesamte Verteilung unimodal
bereinstimmen, bleibt der Modus unver
(es existiert nur ein Modus) ist.
b) Der Median bleibt gleich, da 2 Werte kleiner und 2 Werte gr
oer als 2900 sind; d.h. 2900
liegt auch weiterhin in der Mitte und teilt den Datensatz in zwei H
alften!

130
P
c) x
1 = 3200 mit n1 = 130
= 130 3200 = 416000,
x
gesamt =

7.

1
134 (3200

i=1

130 + 1000 + 1800 + 5000 + 6072) = 3208.

a) Haufigkeitsverteilung
Klasse

Gewicht in g

nk

hk

nk

I
II
III

(35,45]
(45,60]
(60,70]

63
73
27

0,39
0,45
0,17

6,3
4,87
2,7

163

b) i) xM = 47, da 47 am h
aufigsten im Datensatz vertreten ist.
ii) xM = 40, da 40 die Klassenmitte der Klasse mit der maximalen Dichte nk ist.
1
c) x
1 = 63
(18 38 + 33 45 + 12 36) = 41, 28
x
2 = 51, 71 x
3 = 63, 3333
1
x
gesamt = 163 (41, 28 63 + 51, 71 73 + 63, 3333 27) = 49, 6.

8. H
aufigkeitstabelle
Geschwindigkeit
xi [ km
h ]

ni
[km]

Harmonisches Mittel, da die Dimension der H


aufigkeiten derjenigen des Z
ahlers bei den Merkmalsauspr
agungen entspricht:

150
156,25
125
187,5

150
150
150
150

n
x
H = P
=
n
ni
i=1

xi

150
150

600
+ 150
125 +

150
156,25

150
187,5

= 151, 5152 [ km
h ].

600
9. Wachstumsfaktor xj =

yj
yj1

; Wachstumsrate wy = xj 1 =

yj
yj1

1.

Jahr
j

Papier A
yA,j

Wachstumsfaktor
xA,j

Jahr
j

Papier B
yB,j

Wachstumsfaktor
xB,j

1
2
3
4

120
180
720
960

1,5
4
1,3333

1
2
3
4

200
240
120
200

1,2
0,5
1,6667

Papier A: w
y = x
G 1 = 3 1, 5 4 1, 333 1 = 1 durchschnittliche Wachstumsrate von
100%;

Papier B: w
y = x
G 1 = 3 1, 2 0, 5 1, 6667 1 = 0 durchschnittlich keine Ver
anderung.
10. F
ur Hin- und R
uckfahrt soll die durchschnittliche Geschwindigkeit 100 [ km
h ] betragen.
H
aufigkeit: n=2 Fahrten (A B, B A) jeweils angegeben in km!
Harmonisches Mittel, da die Dimension der H
aufigkeit derjenigen des Z
ahlers bei den
Merkmalsauspr
agungen entspricht:
x
H = 100 =

1
90

2
+

1
x

x = 112, 5 [ km
h ].

11.

a)
i

xi

ni

hi

Hi

xi hi

x2i hi

1
2
3
4
5
6
7
8

155
160
170
175
180
190
200
935

3
3
3
3
3
11
2
1

0,1034
0,1034
0,1034
0,1034
0,1034
0,3793
0,0690
0,0345

0,1034
0,2069
0,3103
0,4138
0,5172
0,8966
0,9655
1,0000

16,0345
16,5517
17,5862
18,1034
18,6207
72,0690
13,7931
32,2414

2485,3448
2648,2759
2989,6552
3168,1034
3351,7241
13693,1035
2758,6207
30145,6897

29

205

61240,5172

|xi xMed |hi


2,5862
2,0690
1,0345
0,5172
0
3,7931
1,3793
26,0345
37,4138

Es ist wegen des statistischen Ausreiers sinnvoller statt des arithmetischen Mittels den
Median zu berechnen!
H(175) = 0, 4286 < p und H(180) = 0, 5357 > p i = 5
= 178, 93 (Zum Vergleich mit Ausreier: xMed = 180 und
xMed = xi = 180, x
x
= 205).
b) Rmit = 935 155 = 780; Rohne = 200 155 = 45
Quartilsabstand: x0,25 = 170 ; x0,75 = 190 ; Q = x0,75 x0,25 = 20
1
c) M AD(x) = |xi xMed |ni = |xi xMed |hi ,
n
1
M AD(x)mit = 29
(|155 180| 3 + . . . + |935 180| 1)
= |155 180| 0, 1034 + . . . + |935 180| 0, 0345 = 37, 4138,
1
M AD(x)ohne = 28
(|155 180| 3 + . . . + |200 180| 2)
= |155 180| 0, 1071 + . . . + |200 180| 0, 0714 = 11, 7857
n
n
P
1 P 2
d) s2 =
xi ni x
2 =
x2i hi x
2 (spezieller Verschiebungssatz)
n i=1
i=1
mit Ausreier: s2 = 61240, 5172 2052 = 19215, 5172 s = 138, 62
1
ohne Ausreier: s2 = 28
(1552 3 + . . . + 2002 2) 178, 92862
= (1552 0, 1071 + . . . + 2002 0, 0714) 178, 92862 = 191, 7383 s = 13, 8470
e) Der Ausreier wird weg gelassen. Box-Plot ohne Ausreier:
x(1)
x0,25
xMed
x0,75

155

170

180

190

x(n)

200

12.

a)
j

Schwimmen

x2j

Radfahren

yj2

Laufen

zj2

1
2
3
4
5
6

20,6
22,0
19,8
20,1
21,5
20,5

424,36
484
392,04
404,01
462,25
420,25

45,3
44,7
40,5
49,0
46,2
47,2

2052,09
1998,09
1640,25
2401
2134,44
2227,84

68,1
66,2
69,3
74,4
61,2
67,3

4637,61
4382,44
4802,49
5535,36
3745,44
4529,29

124,5

2586,91

272,9

12453,71

406,5

27632,63

s2
s
v

20,75
0,5892
0,7676
0,0370

431,1517

45,4833
6,8847
2,6239
0,0577

2075,6183

67,75
15,3758
3,9212
0,0579

4605,4383

Der Athlet w
ahlt die Sportart mit der geringsten relativen Streuung (Variationskoeffizient).
P
P 2
Notwendige Formeln: x
= n1
2 und v = xs .
xj , s2 = n1
xj x
Die Leistungen im Schwimmen weisen die geringste relative Streuung auf (v = 0, 0370).
Der Athlet w
urde sich deshalb f
ur das Schwimmen entscheiden! Da der Niveauunterschied der Datens
atze f
ur die drei Sportarten nicht sehr gro ist, resultiert dieselbe
Entscheidung auch mit der Standardabweichung bzw. Varianz als Auswahlkriterium.
b)

i) R = 22, 0 19, 8 = 2, 2

ii) Der Median minimiert die durchschnittliche absolute Abweichung:


xMed = ? np = 6 0, 5 = 3 ganzzahlig
xMed = x3 = 20, 5 oder : xMed = 12 (x3 + x4 ) = 12 (20, 5 + 20, 6) = 20, 55;
M AD(x) = n1 |xj 20, 55| = 16 3, 7 = 0, 6167.

iii) x0,2 = 20, 1 ; x0,8 = 21, 5.