Sie sind auf Seite 1von 15

Eindimensionale Hufigkeitsverteilung Seite 1

Gliederung des Kurses:


I
II

Allgemeine Grundlagen
Statistische Analyse eines einzelnen Merkmals
Analyse/Beschreibung eines einzelnen Merkmals
Ziel: Verdichtung (Komprimierung) einer
unberschaubaren Datenmenge

Komprimierende Beschreibung mittels:


1. Hufigkeitsverteilung (Tabellen und Grafen)
2. Termin
2. Lageparameter
3. Termin
3. Streuungsmae bzw. -parameter
4. Termin
4. Konzentration der Verteilung
5. Termin

Gliederung Termin II:


II. Statistische Analyse eines einzelnen Merkmals
1.

Eindimensionale HK-Verteilung & ihre


Darstellung (S.37 bis S. 53)
1.1 Nominalskalierte Merkmale
1.2 Metrisch skalierte, diskrete Merkmale
1.3 Metrisch skalierte, stetige Merkmale

Eindimensionale Hufigkeitsverteilung Seite 2

Eindimensionale HK-Verteilungen und


ihre Darstellung
Darstellung der HK eines
Merkmals: Tabellen und Grafen

einzelnen

Man unterscheidet 3 Arten von Merkmalen


1. Nominalskalierte Merkmale
Merkmalsausprgungen sind
gleichberechtigt nebeneinander
Bsp.: Studiengang
2. Metrisch skalierte, diskrete Merkmale
Bsp.: Studienjahr
3. Metrisch skalierte, stetige Merkmale
Bsp.: Quadratmeterzahl
Anmerkung: ORDINALSKALA
Verwendung der Methodik fr metrisch skalierte,
diskrete Merkmale

Eindimensionale Hufigkeitsverteilung Seite 3

1.1

HK-Verteilung nominalskalierter
Merkmale

Nominalskala: Merkmalsausprgungen sind


gleichberechtigt nebeneinander

1. Tabellarische Darstellung
Beispiel Wohnungsumfrage WS 07/08
Merkmal: Studiengang (A)
Merkmalsausprgung
(Ai)
BWL (A1)
UWi (A2)
WiSo (A3)
Sonstiges (A4)

absolute
Hufigkeit
(ni)
88
37
27
12

relative
Hufigkeit
(hi=ni/n)
88/164 = 0,537
37/164 = 0,226
27/164 = 0,165
12/164 = 0,073

Summe

n = n i = 164

1,000

i =1

Schreibweise:
ni = n(Ai)
hi = h(Ai)
HK-Verteilung (Def.): Gesamtheit aller rel. HK

h i = h(A i )

Eindimensionale Hufigkeitsverteilung Seite 4

2. Grafische Darstellung (Auswahl)


a) Kreisdiagramm ('pie-chart'):
Die Kreisflche wird in entsprechende Anteile
aufgeteilt.
Sonstige
7,3%
WiSo
16,5%

BWL
53,7%

UWi
22,6%

Hinweis zur Berechnung der Anteile an der


k

Kreisflche:

h ( A ) = 100 % = 360 .
i =1

Beispiel BWL: Winkel = 0,537 * 360 = 193

Eindimensionale Hufigkeitsverteilung Seite 5

b) Balkendiagramme (bar-chart)
HK-Verteilung
Relative Hufigkeiten (in %)
60

40

20

BWL

UWi

WiSo

Sonstige

53,7

22,6

16,5

7,3

Auch mglich: Darstellung der abs. Hufigkeiten


Absolute Hufigkeiten
100
80
60
40
20
0

BWL

UWi

WiSo

Sonstige

88

37

27

12

c) Andere Grafen
Beispiele (vgl. Skript, Excel)

Eindimensionale Hufigkeitsverteilung Seite 6

Exkurs:
Verbale Hufigkeitsdarstellung:
"Wenn wir fr eine Minute schweigen sollten fr
jeden Menschen, der 1982 an Hunger starb, wren
wir nicht in der Lage, den Beginn des 21.
Jahrhunderts zu feiern, weil wir dann immer noch
still sein mssten."
Kubas Staatsprsident Fidel Castro, 1983

Eindimensionale Hufigkeitsverteilung Seite 7

1.2

HK-Verteilung metrisch skalierter,


diskreter Merkmale
Metrisch: Abstnde zwischen MMA messbar
Diskret: Abzhlbare MMA
Alle absolut skalierten Merkmale
(Anzahl von ..)

1. Tabellarische Darstellung
Beispiel Wohnungsumfrage WS 07/08
Merkmal: Studienjahr (x)
Merkmals- absolute relative Kumulierte Kumulierte
ausprgung
HK
HK
absolute HK relative HK
(xi)
n(xi)
h(xi)
n(x xi)
h(x xi)
1 (x1)
65
65
0,396
0,396
2 (x2)
94
159
0,970
0,574
3 (x3)
5
164
1,000
0,030
Summe n = 164 1,000

HK-Funktion (Def.): Gesamtheit aller rel. HK

h(x i )
Verteilungsfunktion (Def.): Gesamtheit aller
kumulierten rel. HK

F(x i ) = h(x x i )

Eindimensionale Hufigkeitsverteilung Seite 8

2. Grafische Darstellung
a) Darstellung der Hufigkeitsfunktion h(xi)
Stabdiagramm

b) Darstellung der Verteilungsfunktion F(xi)


Treppenfunktion

Eindimensionale Hufigkeitsverteilung Seite 9

1.3

Hufigkeitsverteilung metrisch
skalierter, stetiger Merkmale
Metrisch: Abstnde zwischen MMA messbar
Stetig: berabzhlbare MMA

Da jeder Merkmalswert in der Regel nur einmal


beobachtet wird (bei beliebig genauer Messung)
ist zur Darstellung erst eine Klassenbildung
notwendig.

Klasseneinteilung Regeln
Mglichst gleiche Klassenbreiten, bei groem
Variationsbereich der Daten auch unterschiedliche Klassenbreiten verwenden
Anzahl der Klassen (k) nicht zu gro:
3
n ,..., 2 n
( Bsp.: n = 100 5 10 Klassen )

Der hufigste Wert der Urliste sollte die Klassenmitte der Klasse mit der grten Hufigkeit
bilden.
Fr einen Vergleich mit anderen Verteilungen:
gleiche Klassen bilden

Generelles Ziel: Struktur des Ausgangsmaterials


klar und mglichst unverflscht herausarbeiten!

Eindimensionale Hufigkeitsverteilung Seite 10

1. Tabellarische Darstellung
Beispiel Skript
Merkmal: Jahreslohn fr 1980 (in 1.000 DM) (x)
Klasse Lohnklasse
[1000 DM]
i
1
2
3
4

xiu < x xio


0 - 25
25 - u.50
50 - u. 75
75 - u. 100
Insgesamt

Klassenbreite

Relative Verteilungs- DichteAbsolute


funktion
funktion
Hufigkeit Hufigkeit

x i

ni

hi=ni/n

25
25
25
25

12163
11383
1730
298
25574

0,4756
0,4451
0,0676
0,0117
1,000

F ( xio )

f ( xi )

0,4756
0,9207
0,9883
1,000

0,0190
0,0178
0,0027
0,0005

Quelle: Statistisches Bundesamt, Fachserie 14, Reihe 7.3, 1980

Eindimensionale Hufigkeitsverteilung Seite 11

2. Grafische Darstellung
a) Darstellung der HK-Funktion: Histogramm
Problem bei Klassenbildung:
Relative Hufigkeiten werden verzerrt durch
unterschiedlich groe Klassen
Lsung:
Normierung der relativen Hufigkeiten durch
Klassenbreite ( Dichtefunktion)

h(x i )
f ( xi ) =
x i
Beispiel:
Klasse h(xi) (xi) f(xi)
0 1 0,2
1 0,2
1 9 0,8
8 0,1
Histogramm: Darstellung der Dichtefunktion f(xi)
0,25

Rote Linie:
HK-Polygon

0,2
0,15

0,1

0,05

0
0

10

Eindimensionale Hufigkeitsverteilung Seite 12

Beispiel Skript
Merkmal x: Jahreslohn fr 1980 (in 1000 DM)

50 %

Hufigkeitspolygon

25

50

75

25 %

100

b) Darstellung der Verteilungsfunktion

1,0

0,6

0,2
0

Schritte:

25

50

75

100

1. Punkte der Tabelle abtragen


Obergrenze und F-Werte
2. Punkte verbinden
Annahme der Gleichverteilung
innerhalb einer Klasse

Eindimensionale Hufigkeitsverteilung Seite 13

3. Interpolation
Gesucht: Wert von F(x) fr ein gegebenes x
Annahme: Gleichverteilung in der Klasse

Es gilt:

F ( x ) F ( xiu )
h ( xi )

x xiu
=
xi

Daraus folgt:
1)
2)

x xiu
F ( x) = F ( x ) +
h ( xi )
xi
u
i

x = xiu +

F ( x ) F ( xiu )
h ( xi )

xi

Eindimensionale Hufigkeitsverteilung Seite 14

Mgliche Fragestellungen:
1) Wie viel Prozent der statistischen Einheiten
besitzen einen Merkmalswert kleiner als x?
gegeben: x
gesucht: F(x)

2) Unterhalb welchen Wertes liegen F(x) aller


Merkmalsausprgungen?
gegeben: F(x)
gesucht: x

Eindimensionale Hufigkeitsverteilung Seite 15

Beispiel:
1) Wie viel Prozent der Personen haben einen
Lohn, der kleiner als 40.000 DM ist?
gegeben: x = 40
gesucht: F(x)
Formel 1 Klasse 2
x xiu
F ( x) = F ( x ) +
h ( xi )
xi
u
i

= 0, 4756 +

40 25
0, 4451 = 0, 74266
25

2) ber welchen Lohn verfgen 50% der


Personen mit dem geringsten Lohn? (ODER:
Lohngrenze, unterhalb derer 50% aller Personen liegen)
gegeben: F(x) = 0,5
gesucht: x
Formel 2 Klasse 2
x = xiu +
= 25 +

F ( x ) F ( xiu )
h ( xi )

xi

0,5 0, 4756
25 = 26,37
0, 4451