Beruflich Dokumente
Kultur Dokumente
Statistische Datenanalyse: Wozu Statistik?
Statistische Datenanalyse: Wozu Statistik?
Wozu Statistik?
Definition von Statistik
60
60
40
40
20
20
Rendite [%]
Rendite [%]
0
0
−20
−20
−40
−40
1970 1980 1990 2000 2010 2017 1970 1980 1990 2000 2010 2017
Jahr Jahr
.0003
.0002
.0001
0
3
Statistisches Bundesamt, Fachserie 15, Heft 1, Einkommens- und Verbrauchsstichprobe (EVS) 2013, S.11.
4 Z−score der Kinder Z−score der Kinder nach Bildungsgrad der Mutter
4
z−Score (Index fuer Unterernaehrung)
2
0
0
−2
−2
−4
−4
−6
−6
keine primaer sekundaer hoehere
1.0
1
0.8
0.6
GP
0.4
3
0.2
4
5
0.0
1 2 3 4
PS
Statistiksoftware
Deskriptive Statistik
• Skalenniveau
• Nominalskala (Farbe (rot, grün, blau), Religion
(katholisch, evangelisch, konfessionslos, andere))
• Ordinalskala (Schulnoten, Likertskala)
• Kardinalskala bzw. metrisches Merkmal
• Intervallskala (Temperatur in Grad Celsius, IQ)
• Verhältnisskala (Einkommen, Alter, Körpergröße)
• Lagemaße
• Arithmetisches Mittel: Schwerpunkteigenschaft,
ausreißerempfindlich
• Median: Robust gegenüber Ausreißern
• Quartile, Perzentile, Quantile
• Streuungsmaße
• Spannweite
• Empirische Standardabweichung: Ausreißersensitiv
• Interquartilsabstand: Robust gegenüber Ausreißern
400
600
300
Haeufigkeit
Haeufigkeit
400
200
200
100
0
R> par(mfrow=c(1,2))
R> boxplot(mietspiegel$mieteqm, main="Miete pro qm")
R> plot(mieteqm ~ lage, data = mietspiegel,
+ main="Miete pro qm")
15
mieteqm
10
10
5
5
0
0
normale Lage gute Lage beste Lage
lage
normale Lage
beste Lage
gute Lage