Sie sind auf Seite 1von 24

1.

Grundbegri¤e

Menge der Ereignisse. Die Elemente ! der Menge heiß en Elementarereignisse und
sind unzerlegbare Ereignisse.
Das Ereignis A tritt ein, wenn ein ! 2 A eintritt.
ist auch das sichere Ereignis, ; das unmögliche Ereignis.

B Operationen mit Ereignissen A; B; A1 ; A2 ; : : :


A [ B Ereignis A oder B tritt ein
A \ B Ereignisse A und B treten ein
AnB Ereignis A tritt ein, nicht aber B
Sn
Ai = A1 [ A2 [ : : : [ An mindestens eines der Ereignisse Ai tritt ein
Ti=1
n
i=1 Ai = A1 \ A2 \ : : : \ An alle Ai treten ein
nA = A das zu A komplementäre Ereignis; tritt ein, wenn A nicht eintritt.

A \ B = ; bedeutet, dass die Ereignisse A und B unvereinbar sind.

Axiome nach Kolmogorov: P (A) heiß t Wahrscheinlichkeit des zufälligen


Ereignisses, falls
(1) für alle Ereignisse A gilt: 0 P (A) 1.
Wahrscheinlichkeiten liegen zwischen 0 und 1.
(2) P ( ) = 1:
(3) Für unvereinbare Ereignisse A1 ; A2 ; : : : ; An , d.h. Ai \ Aj = ; für i 6= j, gilt:
!
[
n X
n
P Ai = P (Ai ).
i=1 i=1

Dies gilt auch für unendlich viele Ereignisse n = 1.

B Daraus lassen sich weitere Formeln ableiten:


(4) P (;) = 0
(5) Falls A \ B = ; erfüllt ist, =) P (A [ B) = P (A) + P (B)
(6) P (A) = 1 P (A)
(7)
P (A [ B) = P (A) + P (B) P (A \ B)
= P (A \ B) + P (A \ B) + P (A \ B)

(8) P (A) = P (A \ B) + P (A \ B)

1
B Vierfeldertafel:

B B
A P (A \ B) P (A \ B) P (A)
A P (A \ B) P (A \ B) P (A)
P (B) P (B) 1

Zeilensummen bzw. Spaltensummen nach (8),


unterste Zeile und letzte Spalte nach (6)

Modell gleichwahrscheinlicher Elementarereignisse (Laplace-Modell)


bestehe aus den Elementarereignissen ! 1 ; : : : ; ! n mit P (! i ) = n1 :
Die Menge A enthalte m verschiedene Elementarereignisse !

m
Wahrscheinlichkeit: P (A) =
n
Anzahl der günstigen Fälle
P (A) =
Anzahl der möglichen Fälle

Definition: Es seien A; B Ereignisse mit P (B) > 0. Dann heiß


t

P (A \ B)
P (A j B) =
P (B)

die bedingte Wahrscheinlichkeit von A unter der Bedingung B.

Formeln:
P (A j C) = 1 P (A j C)
P (A j C) = P (A \ B j C) + P (A \ B j C)

Definition: Die Ereignisse A und B heiß


en unabhängig, wenn

P (A \ B) = P (A)P (B):

B Die Ereignisse A und B sind genau dann unabhängig, wenn P (A j B) = P (A):

2
Die Bayessche Formel

Gegeben seien Ereignisse A; B; P (A) > 0; P (B) > 0.


Formel der totalen Wahrscheinlichkeit

P (A) = P (A j B) P (B) + P (A j B) P (B)

P (A j B)P (B)
P (B j A) =
P (A)

B Gegeben seien Ereignisse A; B1 ; : : : ; Bn , P (A) > 0; P (Bi ) > 0.


S
Die Bi bilden ein vollständiges System von Ereignissen: = ni=1 Bi , Bi \ Bj = ; für
i 6= j, d.h. die Bi sind unvereinbar und schöpfen alle Möglichkeiten in aus. Das
bedeutet, dass immer genau ein Bi eintritt.
Formel der totalen Wahrscheinlichkeit

X
n
P (A) = P (A j Bi )P (Bi )
i=1

Bayessche Formel

P (A j Bi )P (Bi ) P (A j Bi )P (Bi )
P (Bi j A) = = n
P (A) X
P (A j Bj )P (Bj )
j=1

3
2. Zufallsgröß
en

Diskrete Zufallsgröß
en

Verteilungstabelle:

Wert x1 x2 ::: xr
evtl. unendlich viele Werte
Wahrscheinlichkeit p1 p2 pr

pi = P (X = xi )

Bedingungen:
X
0 < pi < 1; pi = 1
i

B Wahrscheinlichkeiten im Fall xi = i:
X
P (m X n) = pi
i:m xi n

Diskrete Verteilungen

Gleichverteilung auf f1; 2; : : : ; ng

1
pi = (i = 1; : : : ; n):
n

Poisson-Verteilung mit Parameter


i
pi = e (i = 0; 1; : : :)
i!

Binomialverteilung mit Parameter n; p

n i
pi = p (1 p)n i
(i = 0; : : : ; n)
i

Kenngröß
en diskreter Verteilungen

Erwartungswert:
X
r
E (X) = xi pi
i=1

Varianz (Streuung):

X
r X
r
Var (X) = (xi E (X))2 pi = x2i pi (E (X))2
i=1 i=1

4
p
Standardabweichung: (X) = Var (X)

Kenngröß
en spezieller diskreter Verteilungen

Gleichverteilung
n+1 1 1
E (X) = ; Var (X) = n2
2 12 12
Binomialverteilung
E (X) = np; Var (X) = np(1 p)

Poissonverteilung
E (X) = ; Var (X) =

Stetige Zufallsgröß
en

B Verteilungsfunktion:
F (x) = P (X x)

f (x) = F 0 (x)

Die Funktion f (x) heiß


t Wahrscheinlichkeitsdichte (Dichtefunktion) der Zufallsgröß
e.=)
Z b
P (a X b) = f (x) dx = F (b) F (a)
a
Z a
P (X a) = f (x) dx = F (a)
1
Z 1
P (X b) = f (x) dx = 1 F (b)
b

B Eine Funktion f (x) ist Dichte einer Zufallsgröß


e, falls
Z 1
1) f (x) 0, 2) f (x) dx = 1:
1

Stetige Verteilungen

2 2
Normalverteilung mit Parameter ; , Symbol N ( ; )

1 1 (x )2
f (x) = p exp 2
2 2
x
F (x) =

5
N (0; 1) ist die standardisierte Normalverteilung
(x) ist Verteilungsfunktion der standardisierten Normalverteilung
Beachte: ( x) = 1 (x); (0) = 0:5

B Wahrscheinlichkeiten der Normalverteilung: X N( ; 2


)

b a
P (X b) = ; P (X a) = 1 ;

b a
P (a X b) = ;

2
Satz: Ist X N( ; ), dann Y = aX + b N (a + b; a2 2
):

stetige Gleichverteilung auf [a; b]


(
1
b a
für a x b
f (x) =
0 für x < a oder x > b:
8
>
< 0 für x < a
x a
F (x) = für a x b
>
:
b a
1 für x > b:

Exponentialverteilung mit Parameter


(
x
e für x 0
f (x) =
0 für x < 0:
(
1 e x für x 0
F (x) =
0 für x < 0:

Berechnung von Wahrscheinlichkeiten der Binomialverteilung mit Hilfe der Nor-


malverteilung:
X bin(n; p)
! !
l np + 0:5 k np 0:5
P (k X l) p p
np(1 p) np(1 p)

Kenngröß
en stetiger Verteilungen
Z 1
Erwartungswert: E(X) = xf (x) dx
1

6
Varianz : Z 1
Var(X) = (x E(X))2 f (x) dx
1
Z 1
= x2 f (x) dx (E(X))2
1
sZ
Standardabweichung: 1
(X) = (x E(X))2 f (x) dx
1
Z 1
Schiefe: (x E(X))3 f (x) dx
1
(X) = p
(Var (X))3
Modalwert: Maximalstelle von f (x), Symbol mod(X)
(X) > 0 bedeutet rechtsschiefe Verteilung, Modalwert liegt links neben E(X)
(X) < 0 bedeutet linksschiefe Verteilung, Modalwert liegt rechts neben E(X)
(X) = 0 symmetrische Verteilung

Kenngröß
en spezieller stetiger Verteilungen

2
Normalverteilung N ( ; )

2
E(X) = ; Var(X) = ; (X) = ; (X) = 0

Exponentialverteilung Exp( )

1 1 1
E(X) = ; Var (X) = 2; (X) = ; (X) = 2

stetige Gleichverteilung auf [a; b]

a+b (b a)2 b a
E(X) = ; Var(X) = ; (X) = p ; (X) = 0
2 12 12

Definition: Eine Zahl q heiß t Quantil der Ordnung der stetigen Zufallsgröß
eX
mit der Verteilungsfunktion F , falls

F (q ) = :

Dies bedeutet: Z q
P (X q )= f (x) dx = :
1

7
1
Das Quantil m der Ordnung 2
heiß
t Median:

1
F (m) = :
2

Quantile der Standard-Normalverteilung werden mit z( ) bezeichnet: (z( )) = :


Quantile der N ( ; 2 )-Verteilung: q = + z( )

Unabhängige Zufallsgröß
en

Definition: Zwei Zufallsgröß


en X und Y heiß
en unabhängig, falls gilt:

P (X 2 A; Y 2 B) = P (X 2 A) P (Y 2 B)

für alle geeigneten Mengen A; B R.

Satz: Die Summe von unabhängigen normalverteilten Zufallsgrößen ist wieder nor-
malverteilt.
X N (a; 21 ); Y N (b; 22 ) unabhängig =) X + Y N (a + b; 21 + 22 );
rX N (ra; r2 21 )

Diskrete Zufallsvektoren

Zufallsvektor (X; Y ),
X nimmt Werte x1 ; : : : ; xr an
Y nimmt Werte y1 ; : : : ; ys an
Darstellung als Verteilungstabelle (Kreuztabelle):

..
X .Y y1 ys
x1 p11 p1s p1:
.. .. .. ..
. . . .
xr pr1 prs pr:
p:1 p:s 1

pij = P (X = xi ; Y = yj );
pi: = P (X = xi ); p:j = P (Y = yj )

p1: ; : : : ; pr: nennt man die Randverteilung von X, p:1 ; : : : ; p:s die Randverteilung von Y .

8
Es gilt:

pi: = pi1 + : : : + pis (Zeilensumme)


p:j = p1j + : : : + prj (Spaltensumme)

X
r X
s
pij = 1
i=1 j=1

Unabhängigkeit von X und Y bedeutet:

pij = pi: p:j für alle i; j

X und Y sind abhängig, falls

pij 6= pi: p:j für ein Paar i; j

B Abhängigkeitsmaßzweier Zufallsgröß
en X und Y : Korrelationskoe¢ zient

cov(X; Y )
= corr(X; Y ) = p
Var(X) Var(Y )

Kovarianz für diskrete Zufallsgröß


en:

X
r X
s
cov(X; Y ) = xi yj pij E(X)E(Y )
i=1 j=1

xi ; yj ; pij aus Tabelle oben


1 1
Interpretation:
unkorreliert (praktisch unabhängig): = 0
schwache Abhängigkeit: j j 0:5
mittlere Abhängigkeit: 0:5 < j j 0:8
starke Abhängigkeit: j j > 0:8

9
3. Einführung in die Statistik

Grundlegendes Modell zu Daten: in den Anwendungen:


unabhängige Zufallsgröß en X1 ; : : : ; Xn konkrete reale Ausprägungen X1 ; : : : ; Xn
mit Verteilungsfunktion F bzw. Zahlenwerte, Werte von Vektoren,
Einzelwahrscheinlichkeiten p1 ; : : : ; pr qualitative Größen

B verschiedene Datentypen:

diskret (kategorial) stetig


Nominaldaten Ordinaldaten reelle
Operationen =6= =6=<> =6=<> + =
rein qualitativ quantitativ quantitativ
ohne Ordnung der Werte Werte geordnet Werte geordnet
metrische Skala
Beispiele Farbe,Geschlecht, Noten, Temperatur,
Namen Fehleranzahl Gewicht,Umsatz

B Ablauf einer statistischen Untersuchung:


1) Planung der Untersuchung
- Versuchsplanung
- Suche nach geeigneten Datenquellen
2) Erhebung (Sammeln) von Daten
- zufällige Auswahl der Stichprobe, Datenerfassung
- Abwägen zwischen Kosten für Daten und gewünschter Präzision
3) Aufbereitung der Daten (explorative Analyse) - deskriptive Statistik
- Erkennen von Strukturen in den Daten
- Maß zahlen, Tabellen, Gra…ken
4) Inferenzstatistik
- Schätzung von Modellparametern/Modellfunktionen
- Kon…denzintervalle, Tests
5) Interpretation
- die Ergebnisse in 4) sind zu interpretieren,
Schlussfolgerungen zu ziehen
- gra…sche Darstellung der Ergebnisse in 4)
- Abschlussbericht

10
4. Deskriptive Statistik

Vorgegeben Daten X1 ; : : : ; Xn
Variationsreihe (Ordnungsstatistik) X(1) ; X(2) ; : : : ; X(n) mit

X(1) X(2) ::: X(n) :

Definition: Die relative Häu…gkeit des Ereignisses Xi x ergibt die empirische


Verteilungsfunktion an der Stelle x:

1
Fn (x) = Anzahl der Xi mit Xi x
n

monoton wachsende Treppenfunktion mit Sprüngen in Xi

B Histogramm
Wir teilen den Grundbereich G des Merkmals in mehrere disjunkte Intervalle ein
S
(möglichst gleiche Breite): I1 ; I2 ; : : : ; Ik ; kj=1 Ij = G.
Hj Anzahl der Stichprobenelemente im Intervall Ij mit Breite
Über jedem Intervall I1 ; : : : ; Ik werden Balken der Breite in das Diagramm eingetragen.
Die Höhe dieser Balken beträgt:
a) die absolute Häu…gkeit Hj oder
H
b) die relative Häu…gkeit hj = nj oder
c) relative Häu…gkeit hj Hj
= =
Intervallbreite n

Empirische Kenngröß
en

B Stichprobenmittel (Mittelwert)
1X
n
X= Xi
n i=1

Empirischer Median
(
X(N ) mit N = n+1
2
, falls n ungerade,
m
^X = 1
X + 12 X(L+1) mit L = n2 , falls n gerade.
2 (L)

Geometrisches Mittel
p
~=
X n
X1 X2 : : : Xn

11
Stichprobenvarianz
!
1 X
n
2 1 X
n
2
SX = Xi X = Xi2 nX 2
n 1 i=1
n 1 i=1

Empirische Standardabweichung
v
u
u 1 X
n
SX = t
2
Xi X
n 1 i=1

X
n
3
Empirische Schiefe: 1
Xi X
n
i=1
dX = 3
SX

empirisches -Quantil:
N ergibt sich durch Aufrunden von n auf die nächstgröß
ere ganze Zahl.
(
X(N ) , wenn n keine ganze Zahl ist,
q^ = 1
X
2 ( n)
+ 21 X( n+1) , wenn n eine ganze Zahl ist.

q^ ist Schätzer für das -Quantil der Verteilung.


Quartilsabstand: q^0:75 q^0:25 ,

Box-Whisker-Plot
Whisker links: X(1) , Whisker rechts: X(n)
linker Rand Box: q^0:25 , rechter Rand Box: q^0:75 ,
Strich in der Mitte: m^ = q^0:5
Plus-Zeichen: X

Konzentrationskurve - Lorenzkurve

Werte: a1 ; : : : ; aN . Die Werte des Merkmalsträgers werden sortiert: a(1) a(2) a(3)
:::

X
N
A= ai
i=1

sortierte Anteilswerte: v0 = 0;

1X
i
vi = a(j) für i = 1; : : : ; N
A j=1

12
kumulierte Gleichanteile: ui = Ni (i = 1 : : : N )
Lorenzkurve: Verbinden der Punkte (ui ; vi )

Konzentrationsmaßnach Gini/Lorenz-Münzner

X1
N
2 vi
i=1
=1
N 1

Lorenz‡äche: Fläche zwischen Diagonale und Lorenzkurve. Dieses Konzentrationsmaß


tmöglichen Lorenz‡äche N2N1 an.
gibt das Verhältnis von der Lorenz‡äche und der größ
0 1.

Einfache Analysen von Zeitreihen

Zeitreihe X1 ; X2 ; : : : ; Xn
B Durchschnittliche Steigerungsrate pro Zeitabschnitt:

1=(n 1)
Xn
Index = , Rate r = 1
X1

( 1) 100% ist die jährliche Steigerungsrate für Zeitraum vom Jahr 1 bis Jahr n, d.h.
in n 1 Jahren.
Prognose für Xn+m : X ^ n+m = Xn m

13
5. Punktschätzungen

Stichprobe X1 ; : : : ; Xn unabhängiger Zufallsgröß


en
Xi hat Verteilungsfunktion F (x).
E(Xi ) = ; Var(Xi ) = 2

Satz: Bei Xi N ( ; 2 ) besitzt Xn eine N ( ; 2 =n)-Verteilung. Ist Xi nicht nor-


malverteilt, dann nähert sich asymptotisch (n ! 1) die Verteilung von Xn einer
N ( ; 2 =n)-Verteilung.

2
-Verteilung mit n Freiheitsgraden:
(
1 x
2n=2 (n=2)
xn=2 1 exp( 2
) für x 0
f (x) =
0 für x < 0:

Gammafunktion, (m) = (m 1)! für m 2 N, ansonsten Tabelle/Computer

2 n 1 2 2
Satz: Xi N( ; ) =) 2 SX besitzt eine n 1 -Verteilung.

Schätzer für spezielle Verteilungen

2
Normalverteilung N ( ; )

1X 1 X
n n
^=X= Xi ; ^ 2 = SX
2
= (Xi X)2
n i=1 n 1 i=1

Exponentialverteilung mit Parameter

^= 1 = n
X Xn
Xi
i=1

Poissonverteilung mit Parameter

X n
^=X= 1 Xi
n i=1

Binomialverteilung mit Parameter p und vorgegebenem Parameter N

1 X
n
p^ = Xi
nN i=1

14
6. Kon…denzbereiche

Gegeben Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß


en,
2
Xn Mittelwert, SX Stichprobenvarianz
Kon…denzniveau " = 1

2 X
Z n; X e Y = q besitzt dann
N (0; 1), X und Z unabhängig. Die Zufallsgröß
Z
n
eine t-Verteilung mit n Freiheitsgraden (n 1, Symbol: Y tn ).

X N ( ; 2)
2
Kon…denzintervall für den Erwartungswert bei bekannter Varianz
J = Xn z(1 =2) p ; Xn + z(1 =2) p
n n

P ( 2 J) = 1

2
Kon…denzintervall für den Erwartungswert bei unbekannter Varianz
SX SX
J = Xn tn 1 (1 =2) p ; Xn + tn 1 (1 =2) p
n n

P ( 2 J) = 1

Kon…denzintervalle für die Varianz 2


2 2 2
(n 1)SX (n 1)SX (n 1)SX
zweiseitig: J = 2
; 2
einseitig: J = 0; 2
n 1 (1 =2) n 1 ( =2) n 1( )

2
P( 2 J) = 1

Gegeben Ereignis A, P (A) = p,


Hn absolute Häu…gkeit des Auftretens von A in der Stichprobe der Länge n.

Asymptotisches Kon…denzintervall für p


1 q2 1 q2
J= H n + qW ; H n + + qW
n + q2 2 n + q2 2
r
Hn (n Hn ) q 2
mit W := + ; q = z(1 =2);
n 4

P (p 2 J) 1

15
7. Statistische Testverfahren

Stichprobe X1 ; X2 ; : : : ; Xn unabhängiger Zufallsgröß


en
Verteilung mit Parameter ,
Parametermenge, 2

Definition: Eine statistische Hypothese ist eine Annahme H : 2 0 , 0 6=


;; .
Die Hypothese H heiß t einfach, falls 0 einelementig, anderenfalls zusammengesetzt.
Die zu prüfende Haupthypothese nennt man Nullhypothese H0 : 2 0 . H1 : 2 1
n 0 heiß t Alternativhypothese.
Ein statistischer Test ist eine Entscheidungsregel über Ablehnung oder Annahme der
Nullhypothese bzw. der Alternativhypothese unter Verwendung der Daten.

T Testgröße, K heiß t kritischer Bereich der Testgröß


e.
B Entscheidungsregel:
Ist T 2 K , dann wird H0 abgelehnt und H1 angenommen. Ist T 2
= K , dann wird H0
angenommen und H1 abgelehnt.

B Schritte beim statistischen Test:


1) Nullhypothese H0 , Alternativhypothese H1 ,
Voraussetzungen, Signi…kanzniveau
2) Auswahl des Tests, Berechnung der Testgröß eT
3) Entscheidung zur Ablehnung/Nichtablehnung der Nullhypothese

Wahrer Sachverhalt
Entscheidung H0 richtig und H1 falsch H0 falsch und H1 richtig
H0 wird nicht richtige Fehler 2. Art
abgelehnt, T 2
=K Entscheidung
H0 wird abgelehnt Fehler 1. Art richtige
T 2K Entscheidung

K kritischer Bereich der Testgröß


e
B Signi…kanztest: Wkt. für den Fehler 1. Art

P (T 2 K ) für 2 0

16
einfache Nullhypothese:
P 0 (T 2 K ) =

Tests für normalverteilte Grundgesamtheiten

im Folgenden Xi N ( ; 2 ).
2
X Mittelwert, SX Stichprobenvarianz

Gauß -Test
2
bekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröße:
X 0p
T = n

Testentscheidung: H0 wird also abgelehnt, falls:


a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).

t-Test
2
unbekannt, 0 vorgegeben
Hypothese: a) H0 : = 0 , H1 : 6= 0
b) H0 : 0 , H1 : > 0
c) H0 : 0 , H1 : < 0
Testgröß e: X 0p
T = n
SX
Testentscheidung: H0 wird also abgelehnt, falls:
a) jT j > tn 1 (1 =2), b) T > tn 1 (1 ), c) T < tn 1 (1 ):

Varianz-Test
2
0 vorgegeben
Hypothese: a) H0 : 2 = 2
0, H1 : 2
6= 2
0
b) H0 : 2 2
0 , H1 :
2
> 20
c) H0 : 2 2
0 , H1 :
2
< 20
Testgröße: 2
SX
T = (n 1) 2
0

Testentscheidung: H0 wird also abgelehnt, falls:


a) T > 2n 1 (1 =2) oder T < 2n 1 ( =2), b) T > 2
n 1 (1 ), c) T < 2
n 1( ).

17
Zwei verbundene Stichproben: Vorher-Nachher-Vergleiche
1. Stichprobe: X1 ; X2 ; : : : ; Xn , 2. Stichprobe: Y1 ; Y2 ; : : : ; Yn ,
Di¤erenzen: di = Yi Xi N ( ; 2 ), Mittelwert d, Stichprobenvarianz Sd2

t-Test zum Vorher-Nachher-Vergleich


Hypothese: H0 : = 0, H1 : 6= 0, Signi…kanzniveau
Testgröß e:
dp
T = n
Sd
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls jT j > tn (1 =2).

Nun zwei unabhängige Stichproben


1. Stichprobe: X1 ; X2 ; : : : ; Xn , Xi N ( X ; 2X )
2
Mittelwert X, Stichprobenvarianz SX
2. Stichprobe: Y1 ; Y2 ; : : : ; Ym , Yi N ( Y ; 2Y )
Mittelwert Y , Stichprobenvarianz SY2

doppelter t-Test
2 2 2 2
X und Y unbekannt, X = Y
Hypothese: a) H0 : X = Y , H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X
Testgröße: r
n m Y X
T =
s m+n S
2
mit (n 1)SX + (m 1)SY2
S=
n+m 2
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:
a) jT j > tn+m 2 (1 =2), b) T > tn+m 2 (1 ), c) T < tn+m 2 (1 ).

B Bei 2
X 6= 2
Y ist der sogenannte Welch-Test zu verwenden.

Welch-Test
2 2
X und Y unbekannt
Hypothese: a) H0 : X = Y, H1 : X 6= Y
b) H0 : Y X , H1 : Y > X
c) H0 : Y X , H1 : Y < X

18
Testgröß
e:
Y X
T =q
1 2 1 2
S
n X
+ S
m Y

Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:


a) jT j > tf (1 =2), b) T > tf (1 ), c) T < tf (1 ),
2
Anzahl der Freiheitsgrade: 1 2
S + m1 SY2
n X
f= 1 1 ;
S 4 + m2 (m
n2 (n 1) X
S4
1) Y

alternativ für große n:


a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).

F-Test
Hypothese: a) H0 : 2X = 2
Y , H1 : 2
X 6= 2
Y
b) H0 : 2Y 2
X , H1 :
2
Y >
2
X
2 2 2 2
c) H0 : Y X , H1 : Y < X
Testgröße:
2
SX
T =
SY2
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls:
a) T > Fn 1;m 1 (1 =2) oder T < 1=Fm 1;n 1 (1 =2),
b) T < 1=Fm 1;n 1 (1 ), c) T > Fn 1;m 1 (1 ).

Tests zu Wahrscheinlichkeiten

Gegeben Ereignis A, P (A) = p,


Hn (A) absolute Häu…gkeit des Auftretens von A in der Stichprobe der Länge n.

Binomialtest - Test auf Vorliegen einer Wahrscheinlichkeit


p0 vorgegeben, , Empfehlung: np0 (1 p0 ) > 9 und n 50
Hypothese: a) H0 : p = p0 , H1 : p 6= p0
b) H0 : p p0 , H1 : p > p0
c) H0 : p p0 , H1 : p < p0
Testgröß e
Hn (A) np0
T =p
np0 (1 p0 )
Unter H0 besitzt T asymptotisch eine N (0; 1)-Verteilung.
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls
a) jT j > z(1 =2), b) T > z(1 ), c) T < z(1 ).

19
Gegeben Ereignisse A und B, P (A) = p, P (B) = q
Hn (A) absolute Häu…gkeit des Auftretens von A in der ersten Stichprobe der Länge n,
Hm (B) absolute Häu…gkeit des Auftretens von B in der zweiten Stichprobe der Länge m.
beide Stichproben seien unabhängig.
Empfehlung: n 50; m 50; (n + m)P^ > 5; (n + m)(1 P^ ) > 5

Test auf Gleichheit zweier Wahrscheinlichkeiten


Hypothese: H0 : p = q, H1 : p 6= q
Testgröß e 1 r
H (A) m1 Hm (B)
n n nm
T = q
n+m
P^ (1 P^ )
wobei Hn (A) + Hm (B)
P^ =
n+m
Testentscheidung: Die Hypothese H0 wird abgelehnt, falls jT j > z(1 =2).
asymptotischer Test.

Gegeben Ereignisse A und B, P (A) = p, P (B) = q


Vierfeldertafel:
B B Summe
A n11 n12 n1:
A n21 n22 n2:
Summe n:1 n:2 n
n11 absolute Häu…gkeit für A und B in der Stichprobe der Länge n, : : : usw.

Test auf Unabhängigkeit


Hypothese: H0 : Ereignisse A und B sind unabhängig, H1 :Ereignisse A und B sind
abhängig
Testgröße:
n (n11 n22 n12 n21 )2
T =
n1: n2: n:1 n:2
2
Testentscheidung: Falls T > 1 (1 ) wird die Hypothese der Unabhängigkeit abgelehnt

2
Der -Anpassungstest
S
A1 ; A2 ; : : : ; Ak unvereinbare Ereignisse mit ki=1 Ai = , d.h. es tritt immer genau ein
Ereignis Ai ein. pi = P (Ai ) > 0.
n1 ; : : : ; nk aus der Stichprobe ermittelte absolute Häu…gkeiten zu A1 ; : : : ; Ak .

20
Pk
p01 ; p02 ; : : : ; p0k vorgegebene hypothetische Wahrscheinlichkeiten mit p0i > 0; i=1 p0i =
1, Signi…kanzniveau
Wahl der Ai so, dass np0i 5. Ist np0i < 5 mindestens für ein i, dann sind Ereignisse
zusammenzufassen.

2
-Anpassungstest bei vorgegebenen Einzelwahrscheinlichkeiten
Hypothese: H0 : p1 = p01 , ... , pk = p0k
H1 : pi 6= p0i für ein i
Testgröße:
Xk
(ni np0i )2 1 X n2i
k
T = = n
i=1
np 0i n i=1
p 0i

2
Testentscheidung: Ist T > k 1 (1 ), so wird H0 abgelehnt, anderenfalls nicht abgelehnt.

8. Regressionsanalyse

Beschreibung der Abhängigkeit zweier Merkmale

Gegeben eine Stichprobe (X1 ; Y1 ) : : : (Xn ; Yn ) zur Grundgesamtheit (X; Y ), =


corr(X; Y ) Korrelationskoe¢ zient,
Rn empirischer Korrelationskoe¢ zient als Schätzer von :

P
n
Xi X (Yi Y )
Rn = r ni=1 rn
P 2
P
(Xi X) (Yi Y )2
i=1 i=1

Y Zielgröße, Response, beobachtet an Stellen Y1 ; : : : ; Yn


x Regressorvariable, gemessen an Stellen x1 ; : : : ; xn

Modell der linearen Einfachregression:

Yi = 1 + 2 xi + "i (i = 1 : : : n);

"1 ; : : : ; "n unabhängige Zufallsgröß


en, Fehler, Residuen
1 ; 2 wahre Parameterwerte
Zusatzbedingungen: E("i ) = 0, Var("i ) = 2

21
B Schätzung der Regressionskoe¢ zienten

P
n P
n P
n P
n P
n P
n P
n
x2i Yi xi x i Yi n x i Yi xi Yi
^ = i=1 i=1 i=1 i=1
; ^ = i=1 i=1 i=1
1 2 2 2
P
n P
n P
n P
n
n x2i xi n x2i xi
i=1 i=1 i=1 i=1

B Schätzung der Modellvarianz 2


:

1 X
n
2
2
^ = Yi ^ 1 + ^ 2 xi
n 2 i=1

B geschätzte Regressionsfunktion:

f^(x) = ^ 1 + ^ 2 x

Prognose - geschätzte Funktionswerte an den Messstellen:

Y^i = ^ 1 + ^ 2 xi (i = 1 : : : n)

(geschätzte) Residuen: ^"i = Yi Y^i


Schätzer für die Varianzen von ^ 1 und ^ 2 :
0 1
P
n
x2i B1 C
x2
v^1 = ^ 2 i=1
2 = ^2 B +
@n P n
C
A
P
n P
n
(xi x)2
n x2i xi
i=1 i=1 i=1

n 1
v^2 = ^ 2 2 = ^2 P
n
P
n P
n
(xi x)2
n x2i xi
i=1 i=1 i=1

1
P
n
mit x = n
xi .
i=1
Korrelationskoe¢ zient
P
n
(xi x) (Yi Y )
i=1
R= r rn
P
n
2
P
(xi x) (Yi Y )2
i=1 i=1

R nahe bei 0 bedeutet das Vorliegen eines schwachen oder keines Zusammenhanges
R nahe bei 1 bzw. 1 bedeutet das Vorliegen eines starken Zusammenhanges
R = 1 deutet auf einen proportionalen Zusammenhang hin (steigende Regressionsgerade).
R = 1 deutet auf einen negativ proportionalen Zusammenhang hin (fallende

22
Regressionsgerade).
Bestimmtheitsmaß P
n
^"2i
i=1
B = R2 = 1 P
n
(Yi Y )2
i=1

Signi…kanztests
2
Voraussetzung, dass "i im Modell normalverteilt: "i N (0; )

(1) Test auf Nichtvorhandensein einer Konstanten


Hypothese H0 : 1 = 0, H1 : 1 6= 0
Testgröße: ^
T = p1
v^1
Testentscheidung: H0 wird abgelehnt, falls jT j > tn 2 (1 =2), anderenfalls wird H0
nicht abgelehnt.

(2) Test auf Unabhängigkeit von Regressor x und Zielgröß


eY
Hypothesen H0 : 2 = 0, H1 : 2 6= 0
Testgröße: ^
T = p2
v^2
Testentscheidung: H0 wird abgelehnt, falls jT j > tn 2 (1 =2), anderenfalls wird H0
nicht abgelehnt.

I Realisierung der Testentscheidung auf dem Computer:


^ geschätztes Signi…kanzniveau bzw. p-Wert
Ist ^ < , dann wird H0 abgelehnt.
Ist ^ , dann wird H0 nicht abgelehnt.

Kon…denzintervalle
Kon…denzniveau " = 1
Kon…denzintervall für Parameter j

h p p i
J = ^j v^j tn 2 (1 =2); ^ j + v^j tn 2 (1 =2) für j = 1; 2

Interpretation Kon…denzintervall: P ( j 2 J) = "

23
9. Indexzahlen

B Preisindizes
Wir betrachten einen Warenkorb, der aus N verschiedenen Gütern besteht. Zum Zeitpunkt
0 bzw. in der Basisperiode betragen die Preise p01 ; p02 ; : : : ; p0N ,
zum Zeitpunkt t bzw. in der Berichtsperiode betragen die Preise pt1 ; pt2 ; : : : ; ptN :
nachgefragte/verkaufte Menge der Güter zum Zeitpunkt 0/Basisperiode
q01 ; q02 ; : : : ; q0N ;

zum Zeitpunkt t/Berichtsperiode qt1 ; qt2 ; : : : ; qtN :


(a) Laspeyres-Preisindex : X N
pti q0i
(L) i=1
Pt =
XN
p0i q0i
i=1

(b) Paasche-Preisindex : X
N
pti qti
(P ) i=1
Pt =
XN
p0i qti
i=1

B Mengenindizes
(a) Laspeyres-Mengenindex :
X
N
qti p0i
(L) i=1
Qt =
X
N
q0i p0i
i=1

(b) Paasche-Mengenindex : X
N
qti pti
(P ) i=1
Qt =
X
N
q0i pti
i=1

24

Das könnte Ihnen auch gefallen