Kurzskript

1.
Grundbegri¤e
Menge der Ereignisse. Die Elemente ! der Menge heiß en Elementarereignisse und
sind unzerlegbare Ereignisse.
Das Ereignis A tritt ein, wenn ein ! 2 A eintritt.
ist auch das sichere Ereignis, ; das unmögliche Ereignis.
B Operationen mit Ereignissen A; B; A1 ; A2 ; : : :

A [ B Ereignis A oder B tritt ein
A \ B Ereignisse A und B treten ein
AnB Ereignis A tritt ein, nicht aber B
Sn
Ai = A1 [ A2 [ : : : [ An mindestens eines der Ereignisse Ai tritt ein
Ti=1
n
i=1 Ai = A1 \ A2 \ : : : \ An alle Ai treten ein
nA = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.
A \ B = ; bedeutet, dass die Ereignisse A und B unvereinbar sind.
Axiome nach Kolmogorov: P (A) heiß t Wahrscheinlichkeit des zufälligen

Ereignisses, falls
(1) für alle Ereignisse A gilt: 0 P (A) 1.
Wahrscheinlichkeiten liegen zwischen 0 und 1.
(2) P ( ) = 1:
(3) Für unvereinbare Ereignisse A1 ; A2 ; : : : ; An , d.h. Ai \ Aj = ; für i 6= j, gilt:
!
[
n X
n
P Ai = P (Ai ).
i=1 i=1
Dies gilt auch für unendlich viele Ereignisse n = 1.
B Daraus lassen sich weitere Formeln ableiten:

(4) P (;) = 0
(5) Falls A \ B = ; erfüllt ist, =) P (A [ B) = P (A) + P (B)
(6) P (A) = 1 P (A)
(7)
P (A [ B) = P (A) + P (B) P (A \ B)
= P (A \ B) + P (A \ B) + P (A \ B)
(8) P (A) = P (A \ B) + P (A \ B)
1
B Vierfeldertafel:
B B
A P (A \ B) P (A \ B) P (A)
A P (A \ B) P (A \ B) P (A)
P (B) P (B) 1
Zeilensummen bzw. Spaltensummen nach (8),

unterste Zeile und letzte Spalte nach (6)
Modell gleichwahrscheinlicher Elementarereignisse (Laplace-Modell)

bestehe aus den Elementarereignissen ! 1 ; : : : ; ! n mit P (! i ) = n1 :
Die Menge A enthalte m verschiedene Elementarereignisse !
m
Wahrscheinlichkeit: P (A) =
n
Anzahl der günstigen Fälle
P (A) =
Anzahl der möglichen Fälle
Definition: Es seien A; B Ereignisse mit P (B) > 0. Dann heiß

t
P (A \ B)
P (A j B) =
P (B)
die bedingte Wahrscheinlichkeit von A unter der Bedingung B.
Formeln:
P (A j C) = 1 P (A j C)
P (A j C) = P (A \ B j C) + P (A \ B j C)
Definition: Die Ereignisse A und B heiß

en unabhängig, wenn
P (A \ B) = P (A)P (B):
B Die Ereignisse A und B sind genau dann unabhängig, wenn P (A j B) = P (A):
2
Die Bayessche Formel
Gegeben seien Ereignisse A; B; P (A) > 0; P (B) > 0.

Formel der totalen Wahrscheinlichkeit
P (A) = P (A j B) P (B) + P (A j B) P (B)
P (A j B)P (B)
P (B j A) =
P (A)
B Gegeben seien Ereignisse A; B1 ; : : : ; Bn , P (A) > 0; P (Bi ) > 0.

S
Die Bi bilden ein vollständiges System von Ereignissen: = ni=1 Bi , Bi \ Bj = ; für
i 6= j, d.h. die Bi sind unvereinbar und schöpfen alle Möglichkeiten in aus. Das
bedeutet, dass immer genau ein Bi eintritt.
Formel der totalen Wahrscheinlichkeit
X
n
P (A) = P (A j Bi )P (Bi )
i=1
Bayessche Formel
P (A j Bi )P (Bi ) P (A j Bi )P (Bi )
P (Bi j A) = = n
P (A) X
P (A j Bj )P (Bj )
j=1
3
2. Zufallsgröß
en
Diskrete Zufallsgröß
en
Verteilungstabelle:
Wert x1 x2 ::: xr
evtl. unendlich viele Werte
Wahrscheinlichkeit p1 p2 pr
pi = P (X = xi )
Bedingungen:
X
0 < pi < 1; pi = 1
i
B Wahrscheinlichkeiten im Fall xi = i:
X
P (m X n) = pi
i:m xi n
Diskrete Verteilungen
Gleichverteilung auf f1; 2; : : : ; ng
1
pi = (i = 1; : : : ; n):
n
Poisson-Verteilung mit Parameter

i
pi = e (i = 0; 1; : : :)
i!
Binomialverteilung mit Parameter n; p
n i
pi = p (1 p)n i
(i = 0; : : : ; n)
i
Kenngröß
en diskreter Verteilungen
Erwartungswert:
X
r
E (X) = xi pi
i=1
Varianz (Streuung):
X
r X
r
Var (X) = (xi E (X))2 pi = x2i pi (E (X))2
i=1 i=1
4
p
Standardabweichung: (X) = Var (X)
Kenngröß
en spezieller diskreter Verteilungen
Gleichverteilung
n+1 1 1
E (X) = ; Var (X) = n2
2 12 12
Binomialverteilung
E (X) = np; Var (X) = np(1 p)
Poissonverteilung
E (X) = ; Var (X) =
Stetige Zufallsgröß
en
B Verteilungsfunktion:
F (x) = P (X x)
f (x) = F 0 (x)
Die Funktion f (x) heiß

t Wahrscheinlichkeitsdichte (Dichtefunktion) der Zufallsgröß
e.=)
Z b
P (a X b) = f (x) dx = F (b) F (a)
a
Z a
P (X a) = f (x) dx = F (a)
1
Z 1
P (X b) = f (x) dx = 1 F (b)
b
B Eine Funktion f (x) ist Dichte einer Zufallsgröß

e, falls
Z 1
1) f (x) 0, 2) f (x) dx = 1:
1
Stetige Verteilungen
2 2
Normalverteilung mit Parameter ; , Symbol N ( ; )
1 1 (x )2
f (x) = p exp 2
2 2
x
F (x) =
5
N (0; 1) ist die standardisierte Normalverteilung
(x) ist Verteilungsfunktion der standardisierten Normalverteilung
Beachte: ( x) = 1 (x); (0) = 0:5
B Wahrscheinlichkeiten der Normalverteilung: X N( ; 2

)
b a
P (X b) = ; P (X a) = 1 ;
b a
P (a X b) = ;
2
Satz: Ist X N( ; ), dann Y = aX + b N (a + b; a2 2
):
stetige Gleichverteilung auf [a; b]

(
1
b a
für a x b
f (x) =
0 für x < a oder x > b:
8
>
< 0 für x < a
x a
F (x) = für a x b
>
:
b a
1 für x > b:
Exponentialverteilung mit Parameter

(
x
e für x 0
f (x) =
0 für x < 0:
(
1 e x für x 0
F (x) =
0 für x < 0:
Berechnung von Wahrscheinlichkeiten der Binomialverteilung mit Hilfe der Nor-

malverteilung:
X bin(n; p)
! !
l np + 0:5 k np 0:5
P (k X l) p p
np(1 p) np(1 p)
Kenngröß
en stetiger Verteilungen
Z 1
Erwartungswert: E(X) = xf (x) dx
1
6
Varianz : Z 1
Var(X) = (x E(X))2 f (x) dx
1
Z 1
= x2 f (x) dx (E(X))2
1
sZ
Standardabweichung: 1
(X) = (x E(X))2 f (x) dx
1
Z 1
Schiefe: (x E(X))3 f (x) dx
1
(X) = p
(Var (X))3
Modalwert: Maximalstelle von f (x), Symbol mod(X)
(X) > 0 bedeutet rechtsschiefe Verteilung, Modalwert liegt links neben E(X)
(X) < 0 bedeutet linksschiefe Verteilung, Modalwert liegt rechts neben E(X)
(X) = 0 symmetrische Verteilung
Kenngröß
en spezieller stetiger Verteilungen
2
Normalverteilung N ( ; )
2
E(X) = ; Var(X) = ; (X) = ; (X) = 0
Exponentialverteilung Exp( )
1 1 1
E(X) = ; Var (X) = 2; (X) = ; (X) = 2
stetige Gleichverteilung auf [a; b]
a+b (b a)2 b a
E(X) = ; Var(X) = ; (X) = p ; (X) = 0
2 12 12
Definition: Eine Zahl q heiß t Quantil der Ordnung der stetigen Zufallsgröß
eX
mit der Verteilungsfunktion F , falls
F (q ) = :
Dies bedeutet: Z q
P (X q )= f (x) dx = :
1
7
1
Das Quantil m der Ordnung 2
heiß
t Median:
1
F (m) = :
2
Quantile der Standard-Normalverteilung werden mit z( ) bezeichnet: (z( )) = :

Quantile der N ( ; 2 )-Verteilung: q = + z( )
Unabhängige Zufallsgröß
en
Definition: Zwei Zufallsgröß

en X und Y heiß
en unabhängig, falls gilt:
P (X 2 A; Y 2 B) = P (X 2 A) P (Y 2 B)
für alle geeigneten Mengen A; B R.
Satz: Die Summe von unabhängigen normalverteilten Zufallsgrößen ist wieder nor-
malverteilt.
X N (a; 21 ); Y N (b; 22 ) unabhängig =) X + Y N (a + b; 21 + 22 );
rX N (ra; r2 21 )
Diskrete Zufallsvektoren
Zufallsvektor (X; Y ),
X nimmt Werte x1 ; : : : ; xr an
Y nimmt Werte y1 ; : : : ; ys an
Darstellung als Verteilungstabelle (Kreuztabelle):
..
X .Y y1 ys
x1 p11 p1s p1:
.. .. .. ..
. . . .
xr pr1 prs pr:
p:1 p:s 1
pij = P (X = xi ; Y = yj );
pi: = P (X = xi ); p:j = P (Y = yj )
p1: ; : : : ; pr: nennt man die Randverteilung von X, p:1 ; : : : ; p:s die Randverteilung von Y .
8
Es gilt:
pi: = pi1 + : : : + pis (Zeilensumme)

p:j = p1j + : : : + prj (Spaltensumme)
X
r X
s
pij = 1
i=1 j=1
Unabhängigkeit von X und Y bedeutet:
pij = pi: p:j für alle i; j
X und Y sind abhängig, falls
pij 6= pi: p:j für ein Paar i; j
B Abhängigkeitsmaßzweier Zufallsgröß
en X und Y : Korrelationskoe¢ zient
cov(X; Y )
= corr(X; Y ) = p
Var(X) Var(Y )
Kovarianz für diskrete Zufallsgröß

en:
X
r X
s
cov(X; Y ) = xi yj pij E(X)E(Y )
i=1 j=1
xi ; yj ; pij aus Tabelle oben

1 1
Interpretation:
unkorreliert (praktisch unabhängig): = 0
schwache Abhängigkeit: j j 0:5
mittlere Abhängigkeit: 0:5 < j j 0:8
starke Abhängigkeit: j j > 0:8
9
3. Einführung in die Statistik
Grundlegendes Modell zu Daten: in den Anwendungen:

unabhängige Zufallsgröß en X1 ; : : : ; Xn konkrete reale Ausprägungen X1 ; : : : ; Xn
mit Verteilungsfunktion F bzw. Zahlenwerte, Werte von Vektoren,
Einzelwahrscheinlichkeiten p1 ; : : : ; pr qualitative Größen
B verschiedene Datentypen:
diskret (kategorial) stetig

Nominaldaten Ordinaldaten reelle
Operationen =6= =6=<> =6=<> + =
rein qualitativ quantitativ quantitativ
ohne Ordnung der Werte Werte geordnet Werte geordnet
metrische Skala
Beispiele Farbe,Geschlecht, Noten, Temperatur,
Namen Fehleranzahl Gewicht,Umsatz
B Ablauf einer statistischen Untersuchung:

1) Planung der Untersuchung
- Versuchsplanung
- Suche nach geeigneten Datenquellen
2) Erhebung (Sammeln) von Daten
- zufällige Auswahl der Stichprobe, Datenerfassung
- Abwägen zwischen Kosten für Daten und gewünschter Präzision
3) Aufbereitung der Daten (explorative Analyse) - deskriptive Statistik
- Erkennen von Strukturen in den Daten
- Maß zahlen, Tabellen, Gra…ken
4) Inferenzstatistik
- Schätzung von Modellparametern/Modellfunktionen
- Kon…denzintervalle, Tests
5) Interpretation
- die Ergebnisse in 4) sind zu interpretieren,
Schlussfolgerungen zu ziehen
- gra…sche Darstellung der Ergebnisse in 4)
- Abschlussbericht
10
4. Deskriptive Statistik
Vorgegeben Daten X1 ; : : : ; Xn
Variationsreihe (Ordnungsstatistik) X(1) ; X(2) ; : : : ; X(n) mit
X(1) X(2) ::: X(n) :
Definition: Die relative Häu…gkeit des Ereignisses Xi x ergibt die empirische

Verteilungsfunktion an der Stelle x:
1
Fn (x) = Anzahl der Xi mit Xi x
n
monoton wachsende Treppenfunktion mit Sprüngen in Xi
B Histogramm
Wir teilen den Grundbereich G des Merkmals in mehrere disjunkte Intervalle ein
S
(möglichst gleiche Breite): I1 ; I2 ; : : : ; Ik ; kj=1 Ij = G.
Hj Anzahl der Stichprobenelemente im Intervall Ij mit Breite
Über jedem Intervall I1 ; : : : ; Ik werden Balken der Breite in das Diagramm eingetragen.
Die Höhe dieser Balken beträgt:
a) die absolute Häu…gkeit Hj oder
H
b) die relative Häu…gkeit hj = nj oder
c) relative Häu…gkeit hj Hj
= =
Intervallbreite n
Empirische Kenngröß
en
B Stichprobenmittel (Mittelwert)
1X
n
X= Xi
n i=1
Empirischer Median
(
X(N ) mit N = n+1
2
, falls n ungerade,
m
^X = 1
X + 12 X(L+1) mit L = n2 , falls n gerade.
2 (L)
Geometrisches Mittel
p
~=
X n
X1 X2 : : : Xn
11
Stichprobenvarianz
!
1 X
n
2 1 X
n
2
SX = Xi X = Xi2 nX 2
n 1 i=1
n 1 i=1
Empirische Standardabweichung
v
u
u 1 X
n
SX = t
2
Xi X
n 1 i=1
X
n
3
Empirische Schiefe: 1
Xi X
n
i=1
dX = 3
SX
empirisches -Quantil:
N ergibt sich durch Aufrunden von n auf die nächstgröß
ere ganze Zahl.
(
X(N ) , wenn n keine ganze Zahl ist,
q^ = 1
X
2 ( n)
+ 21 X( n+1) , wenn n eine ganze Zahl ist.
q^ ist Schätzer für das -Quantil der Verteilung.

Quartilsabstand: q^0:75 q^0:25 ,
Box-Whisker-Plot
Whisker links: X(1) , Whisker rechts: X(n)
linker Rand Box: q^0:25 , rechter Rand Box: q^0:75 ,
Strich in der Mitte: m^ = q^0:5
Plus-Zeichen: X
Konzentrationskurve - Lorenzkurve
Werte: a1 ; : : : ; aN . Die Werte des Merkmalsträgers werden sortiert: a(1) a(2) a(3)
:::
X
N
A= ai
i=1
sortierte Anteilswerte: v0 = 0;
1X
i
vi = a(j) für i = 1; : : : ; N
A j=1
12
kumulierte Gleichanteile: ui = Ni (i = 1 : : : N )
Lorenzkurve: Verbinden der Punkte (ui ; vi )
Konzentrationsmaßnach Gini/Lorenz-Münzner
X1
N
2 vi
i=1
=1
N 1
Lorenz‡äche: Fläche zwischen Diagonale und Lorenzkurve. Dieses Konzentrationsmaß

tmöglichen Lorenz‡äche N2N1 an.
gibt das Verhältnis von der Lorenz‡äche und der größ
0 1.
Einfache Analysen von Zeitreihen
Zeitreihe X1 ; X2 ; : : : ; Xn
B Durchschnittliche Steigerungsrate pro Zeitabschnitt:
1=(n 1)
Xn
Index = , Rate r = 1
X1
( 1) 100% ist die jährliche Steigerungsrate für Zeitraum vom Jahr 1 bis Jahr n, d.h.
in n 1 Jahren.
Prognose für Xn+m : X ^ n+m = Xn m
13
5. Punktschätzungen
Stichprobe X1 ; : : : ; Xn unabhängiger Zufallsgröß

en
Xi hat Verteilungsfunktion F (x).
E(Xi ) = ; Var(Xi ) = 2
Satz: Bei Xi N ( ; 2 ) besitzt Xn eine N ( ; 2 =n)-Verteilung. Ist Xi nicht nor-

malverteilt, dann nähert sich asymptotisch (n ! 1) die Verteilung von Xn einer
N ( ; 2 =n)-Verteilung.
2
-Verteilung mit n Freiheitsgraden:
(
1 x
2n=2 (n=2)
xn=2 1 exp( 2
) für x 0
f (x) =
0 für x < 0:
Gammafunktion, (m) = (m 1)! für m 2 N, ansonsten Tabelle/Computer
2 n 1 2 2
Satz: Xi N( ; ) =) 2 SX besitzt eine n 1 -Verteilung.
Schätzer für spezielle Verteilungen
2
Normalverteilung N ( ; )
1X 1 X
n n
^=X= Xi ; ^ 2 = SX
2
= (Xi X)2
n i=1 n 1 i=1
Exponentialverteilung mit Parameter
^= 1 = n
X Xn
Xi
i=1
Poissonverteilung mit Parameter
X n
^=X= 1 Xi
n i=1
Binomialverteilung mit Parameter p und vorgegebenem Parameter N
1 X
n
p^ = Xi
nN i=1
14
6. Kon…denzbereiche
Gegeben Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß

en,
2
Xn Mittelwert, SX Stichprobenvarianz
Kon…denzniveau " = 1
2 X
Z n; X e Y = q besitzt dann
N (0; 1), X und Z unabhängig. Die Zufallsgröß
Z
n
eine t-Verteilung mit n Freiheitsgraden (n 1, Symbol: Y tn ).
X N ( ; 2)
2
Kon…denzintervall für den Erwartungswert bei bekannter Varianz
J = Xn z(1 =2) p ; Xn + z(1 =2) p
n n
P ( 2 J) = 1
2
Kon…denzintervall für den Erwartungswert bei unbekannter Varianz
SX SX
J = Xn tn 1 (1 =2) p ; Xn + tn 1 (1 =2) p
n n
P ( 2 J) = 1
Kon…denzintervalle für die Varianz 2

2 2 2
(n 1)SX (n 1)SX (n 1)SX
zweiseitig: J = 2
; 2
einseitig: J = 0; 2
n 1 (1 =2) n 1 ( =2) n 1( )
2
P( 2 J) = 1
Gegeben Ereignis A, P (A) = p,

Hn absolute Häu…gkeit des Auftretens von A in der Stichprobe der Länge n.
Asymptotisches Kon…denzintervall für p

1 q2 1 q2
J= H n + qW ; H n + + qW
n + q2 2 n + q2 2
r
Hn (n Hn ) q 2
mit W := + ; q = z(1 =2);
n 4
P (p 2 J) 1
15
7. Statistische Testverfahren
Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß

en
Verteilung mit Parameter ,
Parametermenge, 2
Definition: Eine statistische Hypothese ist eine Annahme H : 2 0 , 0 6=

;; .
Die Hypothese H heiß t einfach, falls 0 einelementig, anderenfalls zusammengesetzt.
Die zu prüfende Haupthypothese nennt man Nullhypothese H0 : 2 0 . H1 : 2 1
n 0 heiß t Alternativhypothese.
Ein statistischer Test ist eine Entscheidungsregel über Ablehnung oder Annahme der
Nullhypothese bzw. der Alternativhypothese unter Verwendung der Daten.
T Testgröße, K heiß t kritischer Bereich der Testgröß

e.
B Entscheidungsregel:
Ist T 2 K , dann wird H0 abgelehnt und H1 angenommen. Ist T 2
= K , dann wird H0
angenommen und H1 abgelehnt.
B Schritte beim statistischen Test:

1) Nullhypothese H0 , Alternativhypothese H1 ,
Voraussetzungen, Signi…kanzniveau
2) Auswahl des Tests, Berechnung der Testgröß eT
3) Entscheidung zur Ablehnung/Nichtablehnung der Nullhypothese
Wahrer Sachverhalt
Entscheidung H0 richtig und H1 falsch H0 falsch und H1 richtig
H0 wird nicht richtige Fehler 2. Art
abgelehnt, T 2
=K Entscheidung
H0 wird abgelehnt Fehler 1. Art richtige
T 2K Entscheidung
K kritischer Bereich der Testgröß

e
B Signi…kanztest: Wkt. für den Fehler 1. Art
P (T 2 K ) für 2 0
16
einfache Nullhypothese:
P 0 (T 2 K ) =
Tests für normalverteilte Grundgesamtheiten
im Folgenden Xi N ( ; 2 ).
2
X Mittelwert, SX Stichprobenvarianz
Gauß -Test
2
bekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröße:
X 0p
T = n
Testentscheidung: H0 wird also abgelehnt, falls:

a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).
t-Test
2
unbekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröß e: X 0p
T = n
SX
a) jT j > tn 1 (1 =2), b) T > tn 1 (1 ), c) T < tn 1 (1 ):
Varianz-Test
2
0 vorgegeben
Hypothese: a) H0 : 2 = 2
0, H1 : 2
6= 2
0
b) H0 : 2 2
0 , H1 :
2
> 20
c) H0 : 2 2
0 , H1 :
2
< 20
Testgröße: 2
SX
T = (n 1) 2
0

a) T > 2n 1 (1 =2) oder T < 2n 1 ( =2), b) T > 2
n 1 (1 ), c) T < 2
n 1( ).
17
Zwei verbundene Stichproben: Vorher-Nachher-Vergleiche
1. Stichprobe: X1 ; X2 ; : : : ; Xn , 2. Stichprobe: Y1 ; Y2 ; : : : ; Yn ,
Di¤erenzen: di = Yi Xi N ( ; 2 ), Mittelwert d, Stichprobenvarianz Sd2
t-Test zum Vorher-Nachher-Vergleich

Hypothese: H0 : = 0, H1 : 6= 0, Signi…kanzniveau
Testgröß e:
dp
T = n
Sd
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls jT j > tn (1 =2).
Nun zwei unabhängige Stichproben

1. Stichprobe: X1 ; X2 ; : : : ; Xn , Xi N ( X ; 2X )
2
Mittelwert X, Stichprobenvarianz SX
2. Stichprobe: Y1 ; Y2 ; : : : ; Ym , Yi N ( Y ; 2Y )
Mittelwert Y , Stichprobenvarianz SY2
doppelter t-Test
2 2 2 2
X und Y unbekannt, X = Y
Hypothese: a) H0 : X = Y , H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X
Testgröße: r
n m Y X
T =
s m+n S
2
mit (n 1)SX + (m 1)SY2
S=
n+m 2
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:
a) jT j > tn+m 2 (1 =2), b) T > tn+m 2 (1 ), c) T < tn+m 2 (1 ).
B Bei 2
X 6= 2
Y ist der sogenannte Welch-Test zu verwenden.
Welch-Test
2 2
X und Y unbekannt
Hypothese: a) H0 : X = Y, H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X
18
Testgröß
e:
Y X
T =q
1 2 1 2
S
n X
+ S
m Y

a) jT j > tf (1 =2), b) T > tf (1 ), c) T < tf (1 ),
2
Anzahl der Freiheitsgrade: 1 2
S + m1 SY2
n X
f= 1 1 ;
S 4 + m2 (m
n2 (n 1) X
S4
1) Y
alternativ für große n:

a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).
F-Test
Hypothese: a) H0 : 2X = 2
Y , H1 : 2
X 6= 2
Y
b) H0 : 2Y 2
X , H1 :
2
Y >
2
X
2 2 2 2
c) H0 : Y X , H1 : Y < X
Testgröße:
2
SX
T =
SY2
a) T > Fn 1;m 1 (1 =2) oder T < 1=Fm 1;n 1 (1 =2),
b) T < 1=Fm 1;n 1 (1 ), c) T > Fn 1;m 1 (1 ).
Tests zu Wahrscheinlichkeiten
Gegeben Ereignis A, P (A) = p,

Hn (A) absolute Häu…gkeit des Auftretens von A in der Stichprobe der Länge n.
Binomialtest - Test auf Vorliegen einer Wahrscheinlichkeit

p0 vorgegeben, , Empfehlung: np0 (1 p0 ) > 9 und n 50
Hypothese: a) H0 : p = p0 , H1 : p 6= p0
b) H0 : p p0 , H1 : p > p0
c) H0 : p p0 , H1 : p < p0
Testgröß e
Hn (A) np0
T =p
np0 (1 p0 )
Unter H0 besitzt T asymptotisch eine N (0; 1)-Verteilung.
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls
a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).
19
Gegeben Ereignisse A und B, P (A) = p, P (B) = q
Hn (A) absolute Häu…gkeit des Auftretens von A in der ersten Stichprobe der Länge n,
Hm (B) absolute Häu…gkeit des Auftretens von B in der zweiten Stichprobe der Länge m.
beide Stichproben seien unabhängig.
Empfehlung: n 50; m 50; (n + m)P^ > 5; (n + m)(1 P^ ) > 5
Test auf Gleichheit zweier Wahrscheinlichkeiten

Hypothese: H0 : p = q, H1 : p 6= q
Testgröß e 1 r
H (A) m1 Hm (B)
n n nm
T = q
n+m
P^ (1 P^ )
wobei Hn (A) + Hm (B)
P^ =
n+m
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls jT j > z(1 =2).
asymptotischer Test.
Gegeben Ereignisse A und B, P (A) = p, P (B) = q

Vierfeldertafel:
B B Summe
A n11 n12 n1:
A n21 n22 n2:
Summe n:1 n:2 n
n11 absolute Häu…gkeit für A und B in der Stichprobe der Länge n, : : : usw.
Test auf Unabhängigkeit

Hypothese: H0 : Ereignisse A und B sind unabhängig, H1 :Ereignisse A und B sind
abhängig
Testgröße:
n (n11 n22 n12 n21 )2
T =
n1: n2: n:1 n:2
2
Testentscheidung: Falls T > 1 (1 ) wird die Hypothese der Unabhängigkeit abgelehnt
2
Der -Anpassungstest
S
A1 ; A2 ; : : : ; Ak unvereinbare Ereignisse mit ki=1 Ai = , d.h. es tritt immer genau ein
Ereignis Ai ein. pi = P (Ai ) > 0.
n1 ; : : : ; nk aus der Stichprobe ermittelte absolute Häu…gkeiten zu A1 ; : : : ; Ak .
20
Pk
p01 ; p02 ; : : : ; p0k vorgegebene hypothetische Wahrscheinlichkeiten mit p0i > 0; i=1 p0i =
1, Signi…kanzniveau
Wahl der Ai so, dass np0i 5. Ist np0i < 5 mindestens für ein i, dann sind Ereignisse
zusammenzufassen.
2
-Anpassungstest bei vorgegebenen Einzelwahrscheinlichkeiten
Hypothese: H0 : p1 = p01 , ... , pk = p0k
H1 : pi 6= p0i für ein i
Testgröße:
Xk
(ni np0i )2 1 X n2i
k
T = = n
i=1
np 0i n i=1
p 0i
2
Testentscheidung: Ist T > k 1 (1 ), so wird H0 abgelehnt, anderenfalls nicht abgelehnt.
8. Regressionsanalyse
Beschreibung der Abhängigkeit zweier Merkmale
Gegeben eine Stichprobe (X1 ; Y1 ) : : : (Xn ; Yn ) zur Grundgesamtheit (X; Y ), =

corr(X; Y ) Korrelationskoe¢ zient,
Rn empirischer Korrelationskoe¢ zient als Schätzer von :
P
n
Xi X (Yi Y )
Rn = r ni=1 rn
P 2
P
(Xi X) (Yi Y )2
i=1 i=1
Y Zielgröße, Response, beobachtet an Stellen Y1 ; : : : ; Yn

x Regressorvariable, gemessen an Stellen x1 ; : : : ; xn
Modell der linearen Einfachregression:
Yi = 1 + 2 xi + "i (i = 1 : : : n);
"1 ; : : : ; "n unabhängige Zufallsgröß

en, Fehler, Residuen
1 ; 2 wahre Parameterwerte
Zusatzbedingungen: E("i ) = 0, Var("i ) = 2
21
B Schätzung der Regressionskoe¢ zienten
P
n P
n P
n P
n P
n P
n P
n
x2i Yi xi x i Yi n x i Yi xi Yi
^ = i=1 i=1 i=1 i=1
; ^ = i=1 i=1 i=1
1 2 2 2
P
n P
n P
n P
n
n x2i xi n x2i xi
i=1 i=1 i=1 i=1
B Schätzung der Modellvarianz 2

:
1 X
n
2
2
^ = Yi ^ 1 + ^ 2 xi
n 2 i=1
B geschätzte Regressionsfunktion:
f^(x) = ^ 1 + ^ 2 x
Prognose - geschätzte Funktionswerte an den Messstellen:
Y^i = ^ 1 + ^ 2 xi (i = 1 : : : n)
(geschätzte) Residuen: ^"i = Yi Y^i

Schätzer für die Varianzen von ^ 1 und ^ 2 :
0 1
P
n
x2i B1 C
x2
v^1 = ^ 2 i=1
2 = ^2 B +
@n P n
C
A
P
n P
n
(xi x)2
n x2i xi
i=1 i=1 i=1
n 1
v^2 = ^ 2 2 = ^2 P
n
P
n P
n
(xi x)2
n x2i xi
i=1 i=1 i=1
1
P
n
mit x = n
xi .
i=1
Korrelationskoe¢ zient
P
n
(xi x) (Yi Y )
i=1
R= r rn
P
n
2
P
(xi x) (Yi Y )2
i=1 i=1
R nahe bei 0 bedeutet das Vorliegen eines schwachen oder keines Zusammenhanges
R nahe bei 1 bzw. 1 bedeutet das Vorliegen eines starken Zusammenhanges
R = 1 deutet auf einen proportionalen Zusammenhang hin (steigende Regressionsgerade).
R = 1 deutet auf einen negativ proportionalen Zusammenhang hin (fallende
22
Regressionsgerade).
Bestimmtheitsmaß P
n
^"2i
i=1
B = R2 = 1 P
n
(Yi Y )2
i=1
Signi…kanztests
2
Voraussetzung, dass "i im Modell normalverteilt: "i N (0; )
(1) Test auf Nichtvorhandensein einer Konstanten

Hypothese H0 : 1 = 0, H1 : 1 6= 0
Testgröße: ^
T = p1
v^1
Testentscheidung: H0 wird abgelehnt, falls jT j > tn 2 (1 =2), anderenfalls wird H0
nicht abgelehnt.
(2) Test auf Unabhängigkeit von Regressor x und Zielgröß

eY
Hypothesen H0 : 2 = 0, H1 : 2 6= 0
Testgröße: ^
T = p2
v^2
Testentscheidung: H0 wird abgelehnt, falls jT j > tn 2 (1 =2), anderenfalls wird H0
nicht abgelehnt.
I Realisierung der Testentscheidung auf dem Computer:

^ geschätztes Signi…kanzniveau bzw. p-Wert
Ist ^ < , dann wird H0 abgelehnt.
Ist ^ , dann wird H0 nicht abgelehnt.
Kon…denzintervalle
Kon…denzniveau " = 1
Kon…denzintervall für Parameter j
h p p i
J = ^j v^j tn 2 (1 =2); ^ j + v^j tn 2 (1 =2) für j = 1; 2
Interpretation Kon…denzintervall: P ( j 2 J) = "
23
9. Indexzahlen
B Preisindizes
Wir betrachten einen Warenkorb, der aus N verschiedenen Gütern besteht. Zum Zeitpunkt
0 bzw. in der Basisperiode betragen die Preise p01 ; p02 ; : : : ; p0N ,
zum Zeitpunkt t bzw. in der Berichtsperiode betragen die Preise pt1 ; pt2 ; : : : ; ptN :
nachgefragte/verkaufte Menge der Güter zum Zeitpunkt 0/Basisperiode
q01 ; q02 ; : : : ; q0N ;
zum Zeitpunkt t/Berichtsperiode qt1 ; qt2 ; : : : ; qtN :

(a) Laspeyres-Preisindex : X N
pti q0i
(L) i=1
Pt =
XN
p0i q0i
i=1
(b) Paasche-Preisindex : X
N
pti qti
(P ) i=1
Pt =
XN
p0i qti
i=1
B Mengenindizes
(a) Laspeyres-Mengenindex :
X
N
qti p0i
(L) i=1
Qt =
X
N
q0i p0i
i=1
(b) Paasche-Mengenindex : X
N
qti pti
(P ) i=1
Qt =
X
N
q0i pti
i=1
24

Kurzskript

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Kurzskript

Hochgeladen von

Copyright:

Verfügbare Formate

1.

B Operationen mit Ereignissen A; B; A1 ; A2 ; : : :

A \ B = ; bedeutet, dass die Ereignisse A und B unvereinbar sind.

Axiome nach Kolmogorov: P (A) heiß t Wahrscheinlichkeit des zufälligen

Dies gilt auch für unendlich viele Ereignisse n = 1.

B Daraus lassen sich weitere Formeln ableiten:

Zeilensummen bzw. Spaltensummen nach (8),

Modell gleichwahrscheinlicher Elementarereignisse (Laplace-Modell)

Definition: Es seien A; B Ereignisse mit P (B) > 0. Dann heiß

die bedingte Wahrscheinlichkeit von A unter der Bedingung B.

Definition: Die Ereignisse A und B heiß

B Die Ereignisse A und B sind genau dann unabhängig, wenn P (A j B) = P (A):

Gegeben seien Ereignisse A; B; P (A) > 0; P (B) > 0.

P (A) = P (A j B) P (B) + P (A j B) P (B)

B Gegeben seien Ereignisse A; B1 ; : : : ; Bn , P (A) > 0; P (Bi ) > 0.

Gleichverteilung auf f1; 2; : : : ; ng

Poisson-Verteilung mit Parameter

Binomialverteilung mit Parameter n; p

Die Funktion f (x) heiß

B Eine Funktion f (x) ist Dichte einer Zufallsgröß

B Wahrscheinlichkeiten der Normalverteilung: X N( ; 2

stetige Gleichverteilung auf [a; b]

Exponentialverteilung mit Parameter

Berechnung von Wahrscheinlichkeiten der Binomialverteilung mit Hilfe der Nor-

stetige Gleichverteilung auf [a; b]

Quantile der Standard-Normalverteilung werden mit z( ) bezeichnet: (z( )) = :

Definition: Zwei Zufallsgröß

für alle geeigneten Mengen A; B R.

pi: = pi1 + : : : + pis (Zeilensumme)

Unabhängigkeit von X und Y bedeutet:

pij = pi: p:j für alle i; j

X und Y sind abhängig, falls

pij 6= pi: p:j für ein Paar i; j

Kovarianz für diskrete Zufallsgröß

xi ; yj ; pij aus Tabelle oben

Grundlegendes Modell zu Daten: in den Anwendungen:

diskret (kategorial) stetig

B Ablauf einer statistischen Untersuchung:

X(1) X(2) ::: X(n) :

Definition: Die relative Häu…gkeit des Ereignisses Xi x ergibt die empirische

monoton wachsende Treppenfunktion mit Sprüngen in Xi

q^ ist Schätzer für das -Quantil der Verteilung.

Lorenz‡äche: Fläche zwischen Diagonale und Lorenzkurve. Dieses Konzentrationsmaß

Einfache Analysen von Zeitreihen

Stichprobe X1 ; : : : ; Xn unabhängiger Zufallsgröß

Satz: Bei Xi N ( ; 2 ) besitzt Xn eine N ( ; 2 =n)-Verteilung. Ist Xi nicht nor-

Gammafunktion, (m) = (m 1)! für m 2 N, ansonsten Tabelle/Computer

Schätzer für spezielle Verteilungen

Exponentialverteilung mit Parameter

Poissonverteilung mit Parameter

Binomialverteilung mit Parameter p und vorgegebenem Parameter N

Gegeben Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß

Kon…denzintervalle für die Varianz 2

Gegeben Ereignis A, P (A) = p,

Asymptotisches Kon…denzintervall für p

Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß

Definition: Eine statistische Hypothese ist eine Annahme H : 2 0 , 0 6=

T Testgröße, K heiß t kritischer Bereich der Testgröß

B Schritte beim statistischen Test:

K kritischer Bereich der Testgröß

Tests für normalverteilte Grundgesamtheiten

Testentscheidung: H0 wird also abgelehnt, falls:

Testentscheidung: H0 wird also abgelehnt, falls:

t-Test zum Vorher-Nachher-Vergleich