Beruflich Dokumente
Kultur Dokumente
Grundbegri¤e
Menge der Ereignisse. Die Elemente ! der Menge heiß en Elementarereignisse und
sind unzerlegbare Ereignisse.
Das Ereignis A tritt ein, wenn ein ! 2 A eintritt.
ist auch das sichere Ereignis, ; das unmögliche Ereignis.
(8) P (A) = P (A \ B) + P (A \ B)
1
B Vierfeldertafel:
B B
A P (A \ B) P (A \ B) P (A)
A P (A \ B) P (A \ B) P (A)
P (B) P (B) 1
m
Wahrscheinlichkeit: P (A) =
n
Anzahl der günstigen Fälle
P (A) =
Anzahl der möglichen Fälle
P (A \ B)
P (A j B) =
P (B)
Formeln:
P (A j C) = 1 P (A j C)
P (A j C) = P (A \ B j C) + P (A \ B j C)
P (A \ B) = P (A)P (B):
2
Die Bayessche Formel
P (A j B)P (B)
P (B j A) =
P (A)
X
n
P (A) = P (A j Bi )P (Bi )
i=1
Bayessche Formel
P (A j Bi )P (Bi ) P (A j Bi )P (Bi )
P (Bi j A) = = n
P (A) X
P (A j Bj )P (Bj )
j=1
3
2. Zufallsgröß
en
Diskrete Zufallsgröß
en
Verteilungstabelle:
Wert x1 x2 ::: xr
evtl. unendlich viele Werte
Wahrscheinlichkeit p1 p2 pr
pi = P (X = xi )
Bedingungen:
X
0 < pi < 1; pi = 1
i
B Wahrscheinlichkeiten im Fall xi = i:
X
P (m X n) = pi
i:m xi n
Diskrete Verteilungen
1
pi = (i = 1; : : : ; n):
n
n i
pi = p (1 p)n i
(i = 0; : : : ; n)
i
Kenngröß
en diskreter Verteilungen
Erwartungswert:
X
r
E (X) = xi pi
i=1
Varianz (Streuung):
X
r X
r
Var (X) = (xi E (X))2 pi = x2i pi (E (X))2
i=1 i=1
4
p
Standardabweichung: (X) = Var (X)
Kenngröß
en spezieller diskreter Verteilungen
Gleichverteilung
n+1 1 1
E (X) = ; Var (X) = n2
2 12 12
Binomialverteilung
E (X) = np; Var (X) = np(1 p)
Poissonverteilung
E (X) = ; Var (X) =
Stetige Zufallsgröß
en
B Verteilungsfunktion:
F (x) = P (X x)
f (x) = F 0 (x)
Stetige Verteilungen
2 2
Normalverteilung mit Parameter ; , Symbol N ( ; )
1 1 (x )2
f (x) = p exp 2
2 2
x
F (x) =
5
N (0; 1) ist die standardisierte Normalverteilung
(x) ist Verteilungsfunktion der standardisierten Normalverteilung
Beachte: ( x) = 1 (x); (0) = 0:5
b a
P (X b) = ; P (X a) = 1 ;
b a
P (a X b) = ;
2
Satz: Ist X N( ; ), dann Y = aX + b N (a + b; a2 2
):
Kenngröß
en stetiger Verteilungen
Z 1
Erwartungswert: E(X) = xf (x) dx
1
6
Varianz : Z 1
Var(X) = (x E(X))2 f (x) dx
1
Z 1
= x2 f (x) dx (E(X))2
1
sZ
Standardabweichung: 1
(X) = (x E(X))2 f (x) dx
1
Z 1
Schiefe: (x E(X))3 f (x) dx
1
(X) = p
(Var (X))3
Modalwert: Maximalstelle von f (x), Symbol mod(X)
(X) > 0 bedeutet rechtsschiefe Verteilung, Modalwert liegt links neben E(X)
(X) < 0 bedeutet linksschiefe Verteilung, Modalwert liegt rechts neben E(X)
(X) = 0 symmetrische Verteilung
Kenngröß
en spezieller stetiger Verteilungen
2
Normalverteilung N ( ; )
2
E(X) = ; Var(X) = ; (X) = ; (X) = 0
Exponentialverteilung Exp( )
1 1 1
E(X) = ; Var (X) = 2; (X) = ; (X) = 2
a+b (b a)2 b a
E(X) = ; Var(X) = ; (X) = p ; (X) = 0
2 12 12
Definition: Eine Zahl q heiß t Quantil der Ordnung der stetigen Zufallsgröß
eX
mit der Verteilungsfunktion F , falls
F (q ) = :
Dies bedeutet: Z q
P (X q )= f (x) dx = :
1
7
1
Das Quantil m der Ordnung 2
heiß
t Median:
1
F (m) = :
2
Unabhängige Zufallsgröß
en
P (X 2 A; Y 2 B) = P (X 2 A) P (Y 2 B)
Satz: Die Summe von unabhängigen normalverteilten Zufallsgrößen ist wieder nor-
malverteilt.
X N (a; 21 ); Y N (b; 22 ) unabhängig =) X + Y N (a + b; 21 + 22 );
rX N (ra; r2 21 )
Diskrete Zufallsvektoren
Zufallsvektor (X; Y ),
X nimmt Werte x1 ; : : : ; xr an
Y nimmt Werte y1 ; : : : ; ys an
Darstellung als Verteilungstabelle (Kreuztabelle):
..
X .Y y1 ys
x1 p11 p1s p1:
.. .. .. ..
. . . .
xr pr1 prs pr:
p:1 p:s 1
pij = P (X = xi ; Y = yj );
pi: = P (X = xi ); p:j = P (Y = yj )
p1: ; : : : ; pr: nennt man die Randverteilung von X, p:1 ; : : : ; p:s die Randverteilung von Y .
8
Es gilt:
X
r X
s
pij = 1
i=1 j=1
B Abhängigkeitsmaßzweier Zufallsgröß
en X und Y : Korrelationskoe¢ zient
cov(X; Y )
= corr(X; Y ) = p
Var(X) Var(Y )
X
r X
s
cov(X; Y ) = xi yj pij E(X)E(Y )
i=1 j=1
9
3. Einführung in die Statistik
B verschiedene Datentypen:
10
4. Deskriptive Statistik
Vorgegeben Daten X1 ; : : : ; Xn
Variationsreihe (Ordnungsstatistik) X(1) ; X(2) ; : : : ; X(n) mit
1
Fn (x) = Anzahl der Xi mit Xi x
n
B Histogramm
Wir teilen den Grundbereich G des Merkmals in mehrere disjunkte Intervalle ein
S
(möglichst gleiche Breite): I1 ; I2 ; : : : ; Ik ; kj=1 Ij = G.
Hj Anzahl der Stichprobenelemente im Intervall Ij mit Breite
Über jedem Intervall I1 ; : : : ; Ik werden Balken der Breite in das Diagramm eingetragen.
Die Höhe dieser Balken beträgt:
a) die absolute Häu…gkeit Hj oder
H
b) die relative Häu…gkeit hj = nj oder
c) relative Häu…gkeit hj Hj
= =
Intervallbreite n
Empirische Kenngröß
en
B Stichprobenmittel (Mittelwert)
1X
n
X= Xi
n i=1
Empirischer Median
(
X(N ) mit N = n+1
2
, falls n ungerade,
m
^X = 1
X + 12 X(L+1) mit L = n2 , falls n gerade.
2 (L)
Geometrisches Mittel
p
~=
X n
X1 X2 : : : Xn
11
Stichprobenvarianz
!
1 X
n
2 1 X
n
2
SX = Xi X = Xi2 nX 2
n 1 i=1
n 1 i=1
Empirische Standardabweichung
v
u
u 1 X
n
SX = t
2
Xi X
n 1 i=1
X
n
3
Empirische Schiefe: 1
Xi X
n
i=1
dX = 3
SX
empirisches -Quantil:
N ergibt sich durch Aufrunden von n auf die nächstgröß
ere ganze Zahl.
(
X(N ) , wenn n keine ganze Zahl ist,
q^ = 1
X
2 ( n)
+ 21 X( n+1) , wenn n eine ganze Zahl ist.
Box-Whisker-Plot
Whisker links: X(1) , Whisker rechts: X(n)
linker Rand Box: q^0:25 , rechter Rand Box: q^0:75 ,
Strich in der Mitte: m^ = q^0:5
Plus-Zeichen: X
Konzentrationskurve - Lorenzkurve
Werte: a1 ; : : : ; aN . Die Werte des Merkmalsträgers werden sortiert: a(1) a(2) a(3)
:::
X
N
A= ai
i=1
sortierte Anteilswerte: v0 = 0;
1X
i
vi = a(j) für i = 1; : : : ; N
A j=1
12
kumulierte Gleichanteile: ui = Ni (i = 1 : : : N )
Lorenzkurve: Verbinden der Punkte (ui ; vi )
Konzentrationsmaßnach Gini/Lorenz-Münzner
X1
N
2 vi
i=1
=1
N 1
Zeitreihe X1 ; X2 ; : : : ; Xn
B Durchschnittliche Steigerungsrate pro Zeitabschnitt:
1=(n 1)
Xn
Index = , Rate r = 1
X1
( 1) 100% ist die jährliche Steigerungsrate für Zeitraum vom Jahr 1 bis Jahr n, d.h.
in n 1 Jahren.
Prognose für Xn+m : X ^ n+m = Xn m
13
5. Punktschätzungen
2
-Verteilung mit n Freiheitsgraden:
(
1 x
2n=2 (n=2)
xn=2 1 exp( 2
) für x 0
f (x) =
0 für x < 0:
2 n 1 2 2
Satz: Xi N( ; ) =) 2 SX besitzt eine n 1 -Verteilung.
2
Normalverteilung N ( ; )
1X 1 X
n n
^=X= Xi ; ^ 2 = SX
2
= (Xi X)2
n i=1 n 1 i=1
^= 1 = n
X Xn
Xi
i=1
X n
^=X= 1 Xi
n i=1
1 X
n
p^ = Xi
nN i=1
14
6. Kon…denzbereiche
2 X
Z n; X e Y = q besitzt dann
N (0; 1), X und Z unabhängig. Die Zufallsgröß
Z
n
eine t-Verteilung mit n Freiheitsgraden (n 1, Symbol: Y tn ).
X N ( ; 2)
2
Kon…denzintervall für den Erwartungswert bei bekannter Varianz
J = Xn z(1 =2) p ; Xn + z(1 =2) p
n n
P ( 2 J) = 1
2
Kon…denzintervall für den Erwartungswert bei unbekannter Varianz
SX SX
J = Xn tn 1 (1 =2) p ; Xn + tn 1 (1 =2) p
n n
P ( 2 J) = 1
2
P( 2 J) = 1
P (p 2 J) 1
15
7. Statistische Testverfahren
Wahrer Sachverhalt
Entscheidung H0 richtig und H1 falsch H0 falsch und H1 richtig
H0 wird nicht richtige Fehler 2. Art
abgelehnt, T 2
=K Entscheidung
H0 wird abgelehnt Fehler 1. Art richtige
T 2K Entscheidung
P (T 2 K ) für 2 0
16
einfache Nullhypothese:
P 0 (T 2 K ) =
im Folgenden Xi N ( ; 2 ).
2
X Mittelwert, SX Stichprobenvarianz
Gauß -Test
2
bekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröße:
X 0p
T = n
t-Test
2
unbekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröß e: X 0p
T = n
SX
Testentscheidung: H0 wird also abgelehnt, falls:
a) jT j > tn 1 (1 =2), b) T > tn 1 (1 ), c) T < tn 1 (1 ):
Varianz-Test
2
0 vorgegeben
Hypothese: a) H0 : 2 = 2
0, H1 : 2
6= 2
0
b) H0 : 2 2
0 , H1 :
2
> 20
c) H0 : 2 2
0 , H1 :
2
< 20
Testgröße: 2
SX
T = (n 1) 2
0
17
Zwei verbundene Stichproben: Vorher-Nachher-Vergleiche
1. Stichprobe: X1 ; X2 ; : : : ; Xn , 2. Stichprobe: Y1 ; Y2 ; : : : ; Yn ,
Di¤erenzen: di = Yi Xi N ( ; 2 ), Mittelwert d, Stichprobenvarianz Sd2
doppelter t-Test
2 2 2 2
X und Y unbekannt, X = Y
Hypothese: a) H0 : X = Y , H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X
Testgröße: r
n m Y X
T =
s m+n S
2
mit (n 1)SX + (m 1)SY2
S=
n+m 2
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:
a) jT j > tn+m 2 (1 =2), b) T > tn+m 2 (1 ), c) T < tn+m 2 (1 ).
B Bei 2
X 6= 2
Y ist der sogenannte Welch-Test zu verwenden.
Welch-Test
2 2
X und Y unbekannt
Hypothese: a) H0 : X = Y, H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X
18
Testgröß
e:
Y X
T =q
1 2 1 2
S
n X
+ S
m Y
F-Test
Hypothese: a) H0 : 2X = 2
Y , H1 : 2
X 6= 2
Y
b) H0 : 2Y 2
X , H1 :
2
Y >
2
X
2 2 2 2
c) H0 : Y X , H1 : Y < X
Testgröße:
2
SX
T =
SY2
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:
a) T > Fn 1;m 1 (1 =2) oder T < 1=Fm 1;n 1 (1 =2),
b) T < 1=Fm 1;n 1 (1 ), c) T > Fn 1;m 1 (1 ).
Tests zu Wahrscheinlichkeiten
19
Gegeben Ereignisse A und B, P (A) = p, P (B) = q
Hn (A) absolute Häu…gkeit des Auftretens von A in der ersten Stichprobe der Länge n,
Hm (B) absolute Häu…gkeit des Auftretens von B in der zweiten Stichprobe der Länge m.
beide Stichproben seien unabhängig.
Empfehlung: n 50; m 50; (n + m)P^ > 5; (n + m)(1 P^ ) > 5
2
Der -Anpassungstest
S
A1 ; A2 ; : : : ; Ak unvereinbare Ereignisse mit ki=1 Ai = , d.h. es tritt immer genau ein
Ereignis Ai ein. pi = P (Ai ) > 0.
n1 ; : : : ; nk aus der Stichprobe ermittelte absolute Häu…gkeiten zu A1 ; : : : ; Ak .
20
Pk
p01 ; p02 ; : : : ; p0k vorgegebene hypothetische Wahrscheinlichkeiten mit p0i > 0; i=1 p0i =
1, Signi…kanzniveau
Wahl der Ai so, dass np0i 5. Ist np0i < 5 mindestens für ein i, dann sind Ereignisse
zusammenzufassen.
2
-Anpassungstest bei vorgegebenen Einzelwahrscheinlichkeiten
Hypothese: H0 : p1 = p01 , ... , pk = p0k
H1 : pi 6= p0i für ein i
Testgröße:
Xk
(ni np0i )2 1 X n2i
k
T = = n
i=1
np 0i n i=1
p 0i
2
Testentscheidung: Ist T > k 1 (1 ), so wird H0 abgelehnt, anderenfalls nicht abgelehnt.
8. Regressionsanalyse
P
n
Xi X (Yi Y )
Rn = r ni=1 rn
P 2
P
(Xi X) (Yi Y )2
i=1 i=1
Yi = 1 + 2 xi + "i (i = 1 : : : n);
21
B Schätzung der Regressionskoe¢ zienten
P
n P
n P
n P
n P
n P
n P
n
x2i Yi xi x i Yi n x i Yi xi Yi
^ = i=1 i=1 i=1 i=1
; ^ = i=1 i=1 i=1
1 2 2 2
P
n P
n P
n P
n
n x2i xi n x2i xi
i=1 i=1 i=1 i=1
1 X
n
2
2
^ = Yi ^ 1 + ^ 2 xi
n 2 i=1
B geschätzte Regressionsfunktion:
f^(x) = ^ 1 + ^ 2 x
Y^i = ^ 1 + ^ 2 xi (i = 1 : : : n)
n 1
v^2 = ^ 2 2 = ^2 P
n
P
n P
n
(xi x)2
n x2i xi
i=1 i=1 i=1
1
P
n
mit x = n
xi .
i=1
Korrelationskoe¢ zient
P
n
(xi x) (Yi Y )
i=1
R= r rn
P
n
2
P
(xi x) (Yi Y )2
i=1 i=1
R nahe bei 0 bedeutet das Vorliegen eines schwachen oder keines Zusammenhanges
R nahe bei 1 bzw. 1 bedeutet das Vorliegen eines starken Zusammenhanges
R = 1 deutet auf einen proportionalen Zusammenhang hin (steigende Regressionsgerade).
R = 1 deutet auf einen negativ proportionalen Zusammenhang hin (fallende
22
Regressionsgerade).
Bestimmtheitsmaß P
n
^"2i
i=1
B = R2 = 1 P
n
(Yi Y )2
i=1
Signi…kanztests
2
Voraussetzung, dass "i im Modell normalverteilt: "i N (0; )
Kon…denzintervalle
Kon…denzniveau " = 1
Kon…denzintervall für Parameter j
h p p i
J = ^j v^j tn 2 (1 =2); ^ j + v^j tn 2 (1 =2) für j = 1; 2
23
9. Indexzahlen
B Preisindizes
Wir betrachten einen Warenkorb, der aus N verschiedenen Gütern besteht. Zum Zeitpunkt
0 bzw. in der Basisperiode betragen die Preise p01 ; p02 ; : : : ; p0N ,
zum Zeitpunkt t bzw. in der Berichtsperiode betragen die Preise pt1 ; pt2 ; : : : ; ptN :
nachgefragte/verkaufte Menge der Güter zum Zeitpunkt 0/Basisperiode
q01 ; q02 ; : : : ; q0N ;
(b) Paasche-Preisindex : X
N
pti qti
(P ) i=1
Pt =
XN
p0i qti
i=1
B Mengenindizes
(a) Laspeyres-Mengenindex :
X
N
qti p0i
(L) i=1
Qt =
X
N
q0i p0i
i=1
(b) Paasche-Mengenindex : X
N
qti pti
(P ) i=1
Qt =
X
N
q0i pti
i=1
24