Allgemeine Grundlagen
Statistische Analyse eines einzelnen Merkmals
Spannweite
Quartilsabweichung und p-Quantile
Mittlere absolute Abweichung
Varianz und Standardabweichung
Variationskoeffizient
Schiefe und Exze
Streuungsparameter Seite 2
3 Streuungsparameter
Arten von Parametern:
1. Lageparameter (Mittelwerte)
2. Streuungsparameter
messen die Gre der Abweichungen der
einzelnen Merkmalswerte vom Mittelwert
X
X
Streuungsparameter Seite 3
3.1
Spannweite R
Spannweite (Range) R
= Differenz zwischen dem grten und dem
kleinsten Merkmalswert
Berechnung:
ohne Klassen: R = x max x min = x ( n ) x (1)
mit Klassen: Verwendung der
Klassengrenzen (!) der Randklassen
Nachteil:
- Verwendung der extremen Werte
mgliche Verzerrung durch Ausreier
- nur 2 Werte werden bercksichtigt
Beispiele:
a) Krpergren:
172, 178, 164, 167, 171 [cm]
xmax = x( 5) = x2 = 178
xmin = x(1) = x3 = 164
R = xmax xmin = 178 164 = 14 cm
Streuungsparameter Seite 4
Meter
x iu < x x io
0 10
10 15
15 20
20 30
30 50
Insgesamt
1
2
3
4
5
Abs.
HK
ni
Rel.
HK
hi
39
210
213
132
100
694
0,0562
0,3026
0,3069
0,1902
0,1441
1,0000
R = 50 0 = 50
Streuungsparameter Seite 5
3.2
Quartilsabweichung und
p-Quantile
Streuungsparameter Seite 6
xp =
1
2 x( K) + x( K+1)
x = x iu +
F ( x ) F ( x iu )
x p = x iu +
h ( xi )
p F ( x iu )
h ( xi )
x i
x i
Streuungsparameter Seite 7
Beispiele:
a) ohne Klassen:
Monatsgehlter in der Fa. DALLES & Co.
Mnner: geordnete Werte
1520, 1650, 1670, 1840, 2030 (n = 5)
Streuungsparameter Seite 8
(n = 4)
x 0,25 : n p = 4 0,25 = 1
ganze Zahl: K = 1
x 0,25 =
1
1
x (1) + x ( 2) = (1490 + 1710 ) = 1600 DM
2
2
x 0,75 : n p = 4 0,75 = 3
ganze Zahl: K = 3
x 0,75 = 2 ( x (3) + x ( 4) ) = 2 (1960 + 2570 ) = 2265 DM
1
Quartilsabweichung:
1
1
QA = ( x0,75 x0,25 ) = ( 2265 1600) = 332,5
2
2
In einem Intervall von (durchschnittlich)
332,50 DM um den Median befinden sich
50% der Gehlter.
Streuungsparameter Seite 9
x0,75: Klasse 4
x 0,75 = x iu +
= 20 +
0, 25 F ( x iu )
h ( xi )
x i
0, 25 0, 0562
5 = 13, 20
0,3026
0, 75 F ( x iu )
h ( xi )
x i
0, 75 0, 6657
10 = 24, 43
0,1902
Quartilsabweichung:
QA =
1
1
x
x
=
( 24,34 13, 20 ) = 5,57
(
0,75
0,25 )
2
2
Streuungsparameter Seite 10
3.3
Grundlage fr Berechnung:
Abweichung der Merkmalswerte zu
x : (x x)
i
Mgliche Kennzahlen:
1 n
(1) ( x i x )
n i =1
= 0 (Schwerpunkt-ES)
Ungeeignet!
1 n
(2) d = x i x Mittlere absolute
n i=1
Abweichung d
1 n
2
2
(3) s = ( x i x ) Mittlere quadratische
n i=1
Abweichung s
Varianz
Streuungsparameter Seite 11
b) Gruppiertes Datenmaterial
(1) Ohne Klassen
k
k
1 k
ni
d = xi x ni = xi x = xi x hi ,
n i=1
n i=1
i =1
Beispiele:
(a) Temperaturen:
1
27
6
18
12
3
+
+
+
=
= 6,75C
(
)
4
4
1 n
1
d = xi x = { 6 6,75 + 18 6,75 + 12 6,75 + 3 6,75 }
n i=1
4
1
1
= (12,75 +11,25 + 5,25 + 3,75) = ( 33) = 8,25
4
4
x=
Streuungsparameter Seite 12
Meter
x = 19,95
n
d = x *i x h i
i =1
Streuungsparameter Seite 13
ODER
a) Ungruppiertes Datenmaterial
siehe Allgemeine Formel
b) Gruppiertes Datenmaterial
1 k *
s = (x i x) 2 n i
n i=1
2
1 k * 2
s = ( xi ) ni x 2
n i=1
2
(2) Standardabweichung
s = s2
ODER
Streuungsparameter Seite 14
Anmerkungen
- Interpretation:
Varianz: nicht interpretierbar
Standardabweichung:
Nicht eindeutig interpretierbar. Am besten
sagt man: Die Werte streuen mit einer
Standardabweichung von XXX um das
arithmetische Mittel.
- Standardabweichung ist gebruchlicher, da sie
die gleiche Dimension wie die Merkmalswerte
aufweist.
- Bei der Varianz werden grere Abweichungen
strker gewichtet als kleinere Abweichungen
Grund: Quadrierung
Streuungsparameter Seite 15
Beweis, dass
1 n
2
s = ( xi x )
n i =1
2
s =
2
=
=
=
=
1 n 2
s = xi x 2
n i =1
2
1 n
1 n
2
( x i x ) = ( x i2 2x i x + x 2 )
n i =1
n i =1
n
1 n 2 1
1 n 2
x i 2x x i + x
n i =1
n i =1
n i =1
1 n 2 1
1 2
+
x
2x
nx
nx
i
n i =1
n
n
1 n 2
x i 2x 2 + x 2
n i =1
1 n 2
xi x 2
n i =1
Streuungsparameter Seite 16
Beispiele:
(a) Temperaturen:
i
1
2
3
4
Summe
xi
-6
18
12
3
27
( xi x )
-12,75
11,25
5,25
-3,75
0,00
( xi x )
162,5625
126,5625
27,5625
14,0625
330,7500
xi2
36
324
144
9
513
x = 6, 75
Formel I:
1 n
2
s = ( xi x )
n i =1
1
= 330, 75 = 82, 6875
4
s = 82, 6875 = 9, 09
2
Streuungsparameter Seite 17
Klasse Meter
u
o x* n
i
xi x < xi i
i
1
2
3
4
5
0 10
10 15
15 20
20 30
30 50
Insgesamt
5
12,5
17,5
25
40
39
210
213
132
100
hi
0,0562
0,3026
0,3069
0,1902
0,1441
694 1,0000
(x *i x) 2 n i
( 5-19,9532) *39 = 8720,33
(12,5-19,9532)*210 = 11665,54
(17,5-19,9532)*213 = 1281,87
(25-19,9532) *132 = 3362,07
(40-19,9532) *100 = 40187,42
65217,23
(x *i ) 2 n i
25*39
=
975
156,25*210= 32812,5
306,25*213= 65231,25
625*132 = 82500
1600*100 =160000
341518,75
x = 19,9532
Formel I:
1 k *
s = (x i x) 2 n i
n i =1
1
=
65217, 23 = 93,97
694
s = 93,97 = 9, 69
1 k * 2
s = ( xi ) ni x 2
n i =1
1
=
341518, 75 19,95322 = 93,97
694
s = 93,97 = 9, 69
Streuungsparameter Seite 18
3.5
Variationskoeffizient
Anwendung:
Vergleich der Standardabweichungenen
verschiedener Merkmale
Beispiel
Monatseinkommen Jahreseinkommen
(in )
(in )
1000
12000
2000
24000
3000
36000
4000
48000
1118,03
13416,41
2500
30000
V= s
0,447
0,447
x
Relative Streuung ist bei beiden Merkmalen
gleich!
Formel:
s Standardabweichung
V= =
x
Mittelwert
Streuungsparameter Seite 19
3.6
Definition Momente :
- Verallgemeinerungen des
Varianzkonzeptes
- Durchschnittliche potenzierte
Abweichungen der Merkmalswerte
von einem Bezugspunkt (a)
Bezugspunkte:
(1) Null: Momente um Null
Momente um das arithm.Mittel
(2) x :
Formeln :
Zentrale Momente (Grundformel)
1
m =
n
a
r
(x
i =1
a)
Streuungsparameter Seite 20
( ungruppierte Daten )
0
r
r
r
1 k
1 k
*
m = ( xi 0 ) ni = ( xi* ) ni
n i =1
n i =1
0
r
( gruppierte Daten )
Es gilt:
fr r = 1: Arithmetisches Mittel
Das r-te Moment um das arithmetische
Mittel x
1 n
r
mr = ( xi x )
n i =1
r
1 K *
mr = ( xi x ) ni
n i =1
Es gilt:
fr r = 1:
fr r = 2:
fr r = 3:
fr r = 4:
( ungruppierte Daten )
( gruppierte Daten )
m1 = 0 (Schwerpunkteigenschaft)
Varianz
Schiefe (Skewness)
Exze (Kurtosis, Wlbung)
Streuungsparameter Seite 21
Schiefe
Def.:
Interpretation:
Ist m3 negativ: rechtssteil (linksschief)
Ist m3 positiv: linkssteil (rechtsschief)
Standardisierte Schiefe:
Anwendung: Vergleich der Schiefe zweier
Merkmale
m3
sm
=
3
Formel:
s3
Interpretation:
je strker negativ, desto rechtssteiler (linksschiefer)
je strker positiv, desto linkssteiler (rechtsschiefer)
Streuungsparameter Seite 22
m4
s4
Formel:
Interpretation:
je grer, desto gewlbter die Verteilung
Vergleich mit der Normalverteilungskurve:
sm*4 =
m4
3
s4
Streuungsparameter Seite 23
Box:
Darstellung der drei Quartile
Whiskers: Minimaler bzw. maximaler Wert
Ausnahme: Es gibt Werte jenseits der Grenzen:
x 0,25 1,5 IQA bzw.
x 0,75 + 1,5 IQA
Streuungsparameter Seite 24
Stem &
0
1
1
2
2
3
3
4
4
5
5
6
Leaf
.
.
.
.
.
.
.
.
.
.
.
.
799
00222233333334444444444444
5555555556666666666777777888889
000000000000111222234444
5555666899
00000000000122234
5555555555555555589
000004
58
000
55777
00002
10
1 case(s)