Sie sind auf Seite 1von 5

1/10

Lagemasse

Modus hufigster Wert einer Messreihe, mehrere Modi mglich

Wert in der Mitte einer geordneten Messreihe
( ) ( ) 1 /2 n
med x
+
=
Ungerade Anzahl Daten
Median
( ) ( ) ( ) /2 /2 1
1
2
n n
med x x
+
= +
Gerade Anzahl Daten

arithm.Mittel
( )
1 2
1
...
n
x x x x
n
= + + +


gewichtetes Mittel
1 1 2 2
...
g n n
x p x p x p x = + + +

geometrisches Mittel
1 2
...
n
m n
g x x x = Renditenberechnungen

Residuen Abweichung zum arithmetischen Mittel ( x x )

Streuungsmasse

1. Quartil 0.25 i n = aufrunden
( ) 1 i
q x =
(Wert an Position i in Messreihe)
3. Quartil
0.75 i n = aufrunden
( ) 3 i
q x = (Wert an Position i in Messreihe)
Quartilsabstand
3 1
q q q = Breite des Streubereichs der mittleren 50% der Daten
Ausreisser
1
3
2
q q
(nach unten)
3
3
2
q q +
(nach oben)

Spannweite Grsster Wert kleinster Wert einer Messreihe

Mitte Streubereich
( ) ( ) ( ) 1
1
2
n
x x +
Mitte des Streubereichs +/- halbe Spannweite

arithmetisches Mittel der
absoluten Abweichungen
1 2
...
n
x x x x x x
n
+ + +

Arithmetisches Mittel der
Absolutbetrge der Abweichung zum
arithmetischen Mittel

gewichtetes Mittel der
absoluten Abweichungen
1 1
...
n n
p x x p x x + +
gewichtetes Mittel der Absolutbetrge
der Abweichung zum gewichteten
Mittel

MAD Median der Absolutbetrge der Abweichungen zum ihrem Median
{ } 1 2
...
n
MAD med x med x med x med = + + +



Varianz
(Definition)
entspricht den durchschnittlichen, quadratischen Abweichungen der einzelnen
Daten zum arithmetischen Mittel.

Varianz
(Vollerhebung)
( ) ( ) ( ) ( )
2 2 2
1 2
1
var ...
n n
x x x x x x
n
= + + +


Varianz
(Stichprobe)
( ) ( ) ( ) ( )
2 2 2
1 2
1
var ...
1
n
x x x x x x
n
= + + +



var
n n
s =
Vollerhebung
var s = Stichprobe
1
1
n n
n n
s s s s
n n

= =


Standardabweichung


- ab 2 Standardabweichungen starke Abweichung!
- ein Ma fr die Streuung der Werte einer Zufallsvariable um
ihren Mittelwert
- wird auch mittlerer Fehler genannt
- sagt aus, wie stark die Prognosen vom Mittelwert
abweichen! aka misst das Risiko den Mittelwert zu verpassen!


2/10
2
( )
i
VAR x
H x x a
a



abs. Maximum der Werte ausserhalb
vom Mittel +/- a
2
( )
1
i
VAR x
H x x a
a
<


abs. Minimum der Werte innerhalb vom
Mittel +/- a
Tschebyschow
{ } 1,2,..., a n s =
vielfaches der Standardabweichung

2
( )
1 50%
VAR x
a


min. 50% der Daten innerhalb vom
Mittel +/- a


plus/minus 1 Standardabweichung min. 0 % der Daten im Bereich
plus/minus 2 Standardabweichungen min. 75 % der Daten im Bereich
plus/minus 3 Standardabweichungen min. 89 % der Werte im Bereich

Variationskoeffizient Beurteilung Grsse der Standardabweichung;
Abweichung einzelner Beobachtungen zum Mittelwert, die im Betrag kleiner
als
2 Standardabweichungen sind zufllig
Ansonsten systematisch

Vernderung
neuerWert alterWert
Verhltnis
alterWert




Sharpe Ratio
ndite der hung dardabweic S
Zinssatz er risikofrei ndite erwartete durchschn
Re tan
Re .
=


Unabhngigkeit

Kreuztabelle / Kontingenztafel
/ Vielfeldertafel
Geschlecht
Frauen



Mnner
120
(90)*
[30]

60


60



100


20



40


200



200


180 160 60 400

*

Prognose:
200*180
400
= 90



2

2
=
[Abweichung 1]
2
(Prognose 1)
+... +
[Abweichung n]
2
(Prognose n)


gibt an, in welchem Masse zwei Merkmale voneinander abhngen.
2
gross: Merkmale sind stark abhngig
2
klein: Merkmale sind unabhngig

Freiheitsgrad
(Normalwert)

= (Anzahl Zeilen - 1) * (Anzahl Spalten - 1)

Kritischer Wert

mit in TABELLE ABLESEN

2
< kritischer Wert: keine statistisch signifikante Abhngigkeit von X und Y

2
> kritischer Wert: statistisch signifikante Abhngigkeit von X und Y

2
= 0: keine Abhngigkeit der Merkmale

x
a x + a x
a x x
i
a x x
i
a x x
i
<

s
x
3/10

Regressionen
Prinzip der kleinsten
Quadrate


X Y
1 ) ( + = X a X f ) (X f Y =
0 1
1 0+ a ( ) 1 0 1 + a
1 2
1 1+ a ( ) 1 1 2 + a
3 2
1 3+ a ( ) 1 3 2 + a


( ) ( ) ( ) ( ) ( ) ( )
2 2 2
1 0 1 2 1 1 2 3 1 a a a + + + + + 2 8 10
2
+ a a
( )
2
10 8 2, d a a a + 8 20 a
( ) 20 8 0, solve a a =
5
2
= a
mit TR
2
2
10 8 2|
5
a a a + =
5
2
= SQR
Lineare Regression
X Y
b X a X f + = ) ( ) (X f Y =
0 1
b a + 0 ( ) b a + 0 1
1 2
b a + 1 ( ) b a + 1 2
3 2
b a + 3 ( ) b a + 3 2

( ) ( ) ( ) ( ) ( ) ( )
2 2 2
1 0 2 1 2 3 a b a b a b + + + + +
9 10 3 8 16 10
2 2
+ + + b b ab a a
( )
2 2
10 16 8 3 10 9, d a a ab b b a + + + 0 16 8 20 = + b a
( )
2 2
10 16 8 3 10 9, d a a ab b b b + + + 0 10 6 8 = + b a
mit TR
(20 8 16 0 8 6 10 0, ) solve a b and a b a + = + =

7
9

7
2
= = b a a: Steigung, b: Ordinatenabschnitt (y)
Regressionen mit TI

c1 = X-Wert
c2 = Y-Werte

Regression mit TI
F5 LinReg x:c1 y:c2 Store y1(x)

Koeffizienten
Interpretation
= pro zustzlicher Einheit X steigt/sinkt der prognostizierte Y-Wert um

^b = prognostizierter Y-Wert bei X = 0

ANOVA Tabelle


F5 OneVar x ... c5 Enter - x = SStot
x ... c6 Enter - x = SSReg
x ... c7 Enter - x = SSRes






c1 c2 c3=y1(c1) c4=c2-c3 c5=(c2-mean(c2))
2
c6=(c3-mean(c3))
2
c7=(c4-mean(c4))
2

X-Werte Y-Werte Prognose Residuen SStot SSReg SSRes
4/10

Source Sum of Squares Degree of Freedom Mean squares F-Qoutient

Regression
(Prognosewerte)


1
(beschr. Var.)
(Spalten)
/1 = /

Residual
(Abweichungsschw.)


= -1
(Zeilen)
/ =


Total



Anzahl Zeilen 1


kritischer Wert aus Tabelle: 1. Spalte und . Zeile

F-Quotient > kritischer Wert: Es gibt einen statistisch signifikanten Effekt von X auf Y
(Nullhypothese wird verworfen)

F-Quotient < kritischer Wert: Es gibt keinen statistisch signifikanten Effekt von X auf Y

Streudiagramm Funktion aktivieren F4 y1(x)
Plot aktivieren F4 Plot x:c1, y:c2, Scatter (Zoom Data)


[ ]
, corr X =
Plot x:c1 y:c4
Tukey Anscombe Plot:
(Antwort auf Frage ob man das Modell verbessern
kann, Voraussetzung fr Beurteilung viele
Datenpunkte)

, corr Y =



Plot x:c3 y:c4
Residuenanalyse

Abszisse: X-Achse
Ordinate: Y-Achse


Falls Ausreisser, Inhomogenitten, etc auftreten, ist das Modell nicht geeignet! Es darf aber auch
keine Struktur erkennbar sein.
Wenn keine Trends, ... erkennbar sind, dann ist das Modell grundstzlich fr das Erstellen von
Prognosen geeignet.
Kovarianz (cov) Beschreibt die Strke der gemeinsamen Schwankungen

Korrelation (corr) misst die Richtung und die Strke eines linearen Zusammenhangs

positive corr: ansteigender Trend
negative corr: abfallender Trend
corr = 0 keine Punkte auf Gerade
corr = 1 alle Punkte auf Gerade

2
R


R
2
=
SS
Re g
SS
Tot

R2 Koeffizient besagt, dass __% der totalen Schwankungen in den beobachteten
[Y-Wert Beschr.] aus den totalen Schwankungen der Prognosewerte fr die [Y-Wert Beschr.]
ergeben. Da sich die Prognose anhand des optimal angepassten Modells aus den beobachteten
[X-Wert Beschr.] berechnen, knnen __% der Schwankungen in den beobachteten [Y-Wert
Beschr.] auf die Schwankungen in den beobachteten [X-Wert Beschr.] zurckgefhrt und erklrt
werden.

je nher R
2
bei 1 desto besser ist das Modell um Prognosen zu stellen

X
Y a b =
Exponentieller Trend; Erklrende Variable
steht im Exponent
lg( ) lg( ) lg( ) Y a X b = + lg( ) lg( ) lg( ) Y b X a = +

0 0
V a X b = +

Lineare Regression durchfhren
F5 LinReg x:c1 y:c3 (c3 = log(c2))
0 0
b und a
Exponentielle
Regression

0
lg( ) a b =
0
10
a
b =
0
lg( ) b a =
0
10
b
a =

mit TR direkt


Data/Matrix Editor F5 ExpReg x:c1 y:c2
b und a
5/10

b
Y a X =
Erklrende Variable bildet
Basis

lg( ) lg( ) lg( ) Y a b X = + lg( ) lg( ) lg( ) Y X b a = +

0 0
V U a b = +

Lineare Regression durchfhren
F5 LinReg x:c3 (c3 = log(c1))
y:c4 (c4 = log(c2))
0 0
b und a
Regression mit
Ansatz einer
Potenzfunktion

0
a b =
0
lg( ) b a =
0
10
b
a =

mit TR direkt


Data/Matrix Editor F5 PowerReg x:c1 y:c2
b und a
Wahrscheinlichkeitsrechnung
Prvalenz Anteil an kranken Personen in der Gesamtbevlkerung.
Je grer die Prvalenz desto zuverlssiger ist ein positives Testresultat.
Sehr kleine Prvalenz positives Resultat meistens falsch
Sensitivitt Wie oft ist Test positiv, wenn Krankheit vorhanden ist?
korrekt positives Resultat (pos. Personen werden positiv getestet)
Spezifitt Wie oft ist Test negativ, wenn Krankheit nicht vorhanden?
korrekt negatives Resultat (neg. Personen werden neg. getestet)



gesund/krank? Test pos./neg.?
Allgemein

P tatschlich pos |Test pos

=
korrekt positiv
korrekt positiv + falsch positiv


ACHTUNG: darauf achten welche Wahrscheinlichkeit gefragt ist!!



P =
p Sensitivitt
p Sensitivitt + 1 p
( )
(1 Spezifitt)

Wahrscheinlichkeit







y8(x)










y9(x)
[ ]
1
p P alle Personen haben verschiedene Geburtstage =
( )
1
365 1 365 1 365 2 365 3
...
365 365 365 365
n
p

=

z.B. n= 35, Wert: 34;
Produktzeichen: 2nd-Math-B Calculus 5



p
2
= P min. 2Personen haben den selben Geburtstag


( )
2
365 1 365 1 365 2 365 3
1 ...
365 365 365 365
n
p

=


1
k
365.
, k,365 (n 1),365



Total
positiv
nicht positiv
korrekt positiv
falsch negativ
falsch positiv
korrekt negativ
Prval enz
Spezifi tt
Sensiti vit t
p
1-p

k
365.
, k,365 (n 1),365


6/10
Urnenmodell

Mglichkeiten gefragt:



n
k





Wahrscheinlichkeit
gefragt:


n
k

Gesamtmglichkeiten


Mit zurcklegen Ohne zurcklegen
Beachtung der
Reihenfolge
Passwrter:

k
n
Siegerpodest:

( )
!
!
n
n k

Keine Beachtung der
Reihenfolge
Theaterkarten:

1 n k
k
+



Lotto:

( )
!
! !
n n
k k n k

=





n: Mglichkeiten gesamt, k: Anzahl Ziehungen

(ENTWEDER) ODER + UND multiplizieren

Bsp









Ti: y10(x)
6 freie Stellen, min. 50% Frauen, Bewerbungen: 7 Frauen & 13 Mnner. Gesucht: Anzahl
verschiedene Mglichkeiten

7 13 7 13 7 13 7 13
3 3 4 2 5 1 6 0
Anz Mglichkeiten

= + + +




3 Frauen und (x) 3 Mnner oder (+) 4 Frauen und (x)


nCr(7, k) nCr(13,6 k), k,3,6
( )


Bsp #2













Ti: y11(x)
Table abscrollen bis
0.9 ... (bzw. Solver)
n = vorbereitete Aufgaben, 50-n unvorbereitete Aufgaben, 8 Aufgaben an der Prfung, min. 5
Aufgaben korrekt fr bestehen

[ ] Pr 90% P fung bei n vorbereiteten Aufgaben bestehen
50 50 50 50
5 3 6 2 7 1 8 0
50
8
n n n n n n n n
P

= + + +







nCr(x, k) nCr(50 x,8 k), k,5,8)
nCr(50,8)

_
,



Cox-Ross-Rubenstein Modell (PUT/CALL OPTIONEN)
( )
15
21 1000 1.02 0.97
x x
y x

=
Endkurs bei 15 Perioden
( ) ( )
15
22 15, 0.45 0.55
x x
y x ncr x

=
Wahrscheinlichkeit
( ) ( ) ( ) 23 max 800 21 ,0 y x y x =
Auszahlung bei Put Option
mit Strike = 800

y23 x ( ) = max y21 x ( ) 1100,0
( )

Auszahlung bei Call Option
mit Strike = 1100
( )
( )
( )
15
23
24
1.0025
y x
y x =

Diskontierte Auszahlung mit
Zins von 0.0025

y25 x ( ) = (y22(x) y24(x),x,0,15)


Fairer Preis der Option
(=Erwartungswert)

y26 x ( ) = (y22(x),x,7,15)


Wahrscheinlichkeit, dass die
Option im Geld endet
(Perioden mit Auszahlung)
HOME

y27 x ( ) = (y21(x) y22(x),x,0,15)


Erwartungswert vom
Endkurs der Aktie (Kursziel)
HOME

Binomialmodell

PUT-Option:
Recht die Aktie zum
Strike-Preis zu
verkaufen

CALL-Option:
Recht die Aktie zum
Strike-Preis zu kaufen.


STRANGLE:
P[Strangle] = P[PUT in
Geld] + P[CALL in
Geld]

y28 x ( ) = ((y21(x) y27(x))
2
* y22(x),x,0,15)


VAR des Endkurses HOME
7/10

y29 x ( ) = y28(x)
Standardabweichung des
Endkurses (Volatilitt)
HOME

y30 x ( ) =
(y21(x) 1000)
1000

Rendite der Aktie HOME

y31 x ( ) = (y30(x) y22(x),x,0,15)

Erwartungswert der
Rendite
HOME

y32 x ( ) = ((y30(x) y31(x))
2
y22(x),x,0,15)


VAR der Rendite HOME


y33 x ( ) = y32(x)
Standardabweichung der
Rendite HOME
Interpretationen
PUT:
Versicherung gegen das Risiko am Ende der Laufzeit weniger als Strike-Preis zu haben.
Im Sinne der Versicherungsprmie zahle ich heute einen faieren Preis von __ CHF.
Fairer Preis deckt zusammen mit Zinsen und Zinseszinsen die durchschnittlichen Auszahlungen.
Spekulation auf sinkende Kurse. Wetteinsatz ist der faire Preis (der Option). Die durchschnittlichen
Auszahlungen werden durch den fairen Preis plus Zinsen und Zinseszinsen gedeckt.
Interpretationen
CALL:
Versicherung beispielsweise einer Fluggesellschaft gegen stark steigende Kerosinpreise. Durch die
CALL-Option habe ich das Recht am Ende der Laufzeit Kerosin zum Strike-Preis zu kaufen. Dies
ermglich langfristige Kalkulationen, da das Verlustrisiko beschrnkt ist. Der Preis fr diese
Absicherung ist der faire Preis von __ CHF.
Spekulation auf steigende Kurse. Der Wetteinsatz ist der faire Preis. Die durchschnittlichen
Auszahlungen werden durch den fairen Preis plus Zinsen und Zinseszinsen gedeckt.
Testen von Hypothesen
Test im Sinne eines Widerspruchsbeweises; Gegenteil des zu beweisenden ist die Nullhypothese!
gewichtigere Fehler Fehler 1. Art
Bsp.:
n= 24, = 5%,
p = 40 %
berlebenschance
0
H : Arzt ist nicht besser als der Durchschnitt
A
H : Arzt ist besser als der Durchschnitt
X = Anzahl Personen die berleben
= tolerierte Fehleranteil (signifikant = 5 %, hochsignifikant = 1 %) = 5%
... auf Fragestellung achten
Fehler 1. Art: Arzt ist schlecht aber da durch Zufall viele Patienten berleben gilt er als gut.
Fehler 2. Art: Arzt ist gut aber da durch Zufall viele Patienten sterben gilt er als schlecht.
Entscheidungsregeln:

X k H
0
verworfen


X < k H
0
nicht verworfen

Ansatz:

P
H
0
Fehler 1.Art




X ~BIN(24,0.40)
Fehler 1. Art
(exakte Berechnung)

y12(x)


y12(x) = ncr 24,i
( )
0.4^i 0.6^24 i
( )
,i,x,24
( )

Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 5%) kritischer Wert = 15
(X-Wert in Tabelle)

Ein Arzt bei dem mindestens 15 von 24 Patienten die nchsten 5 Jahre berleben, kann man davon
ausgehen, dass der Arzt signifikant besser ist als der Durchschnitt.
Fehler 2. Art
(exakte Berechnung)


kritischer Wert = 15

Fehler 2. Art = H0 wird nicht verworfen, obwohl HA gilt (= Arzt ist lt. Stichprobe unterdurchschn.
obwohl er eigentlich eine bessere Heilungsquote hat als der Durchschnitt.)

P=[X < 15 | Arzt besser als Durchschn.] P[X 14 | Arzt besser als Durchschn.]
Heilungsqoute des Arztes betrgt tatschlich 45% (leicht besser als Durchschn. von 40%; Annahme
... im Ernstfall gegeben)


y(x) = ncr 24,i
( )
0.45^i 0.55^24 i
( )
,i,0,14
( )
= 93,5%
die Wahrscheinlichkeit, dass der Arzt als unterdurchschnittlich gilt obwohl er besser ist, wird kleiner
je besser die Heilungsquote tatschlich ist. (Wenn er bspielsweise eine HQ von 75% htte (75 von
100 Patienten geheilt) wre die Wahrscheinlichkeit nur noch bei 5%)
Bsp 2:
Geschlechterparitt
(zweiseitiger Test)
73 Personen,
47 M u. 26 W, = 5%
0
H : Geschlechterparitt ist nicht verletzt (Mnner- und Frauenanteil von 50 %)
A
H : Geschlechterparitt ist verletzt
Zweiseitiger Test, da entweder zuviel Frauen oder zu viel Mnner die Geschlechterparitt verletzen
knnten bzw. da die Anzahl Mnner/Frauen zu hoch bzw. zu niedrig sein knnte.
X = Anzahl Mnner in der Regierung
= 5% da zweiseitiger Test 5/2 = 2,5%
8/10


X k
u
ODER X k
o
H
0
verworfen


K
u
< X < K
o
H
0
nicht verworfen

p = 50% Mnner bzw. Frauen



y18(x)







y19(x)
KO:

P X k
o
|H
0



2
= 2,5%


X ~BIN(73,0.5)

y(x) = ncr 73,i
( )
0.5^i 0.5^ 73 i
( )
,i,x,73
( )

Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 2,5%) kritischer Wert = 46
(1. X-Wert in Tabelle unter 2,5%)
KU:

P X k
u
|H
0



2
= 2,5%


y(x) = ncr 73,i
( )
0.5^i 0.5^73 i
( )
,i,0,x
( )


Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 2,5%) kritischer Wert = 27
(1. X-Wert in Tabelle unter 2,5%)

Da die Anzahl der Mnner (47) die obere Grenze KO (46) berschritten hat, und da die Anzahl der
Frauen (26) die untere Grenze KU (27) unterschritten hat ist die Geschlechterparitt signifikant
verletzt.

Mehrere
Zufallsvariablen ber
gemeinsamen
Wahrscheinlichkeits-
raum
Y
Y0 Y1 Y2
X0 n0,0 n0,1 n0,2 (X0)
X1 n1,0 n1,1 n1,2 (X1) X
X2 n2,0 n2,1 n2,2 (X2)
(Y0) (Y1) (Y2) 100 %
E[X]: X0 * (X0) + X1 * (X1) + X2 * (X2)
E[Y]: Y0 * (Y0) + Y1 * (Y1) + Y2 * (Y2)
Var[X]: (X0E[X])
2
* (X0) + (X1E[X])
2
* (X1) +(X2E[X])
2
* (X2)
Var[Y]: (Y0E[Y])
2
* (Y0) + (Y1E[Y])
2
* (Y1) +(Y2E[Y])
2
* (Y2)
Cov[X,Y]: (X0E[X]) * (Y0E[Y]) * n0,0 + ... + (X2E[X]) * (Y2E[Y]) * n2,2

Corr [X,Y] =
Cov[X,Y]
[X] [Y]


Rechenregeln:



a = Konstante Zahl

X/Y = Zufallsvariablen

Erwartungswert: Wert Der Bei Oftmaligem Wiederholen Des Ereignisses Am Hufigsten Auftritt



E[X] = Ereignis (Anzahl)[X]Wahrscheinlichkeit[X]
Allgemeine Formel Fr E


E[X] = n p E Bei Binomialverteilung

Varianz: Risiko Den Mittelwert Zu Verpassen


VAR[X] = E[X
2
] (E[X])
2
Satz Von Steiner


VAR[X] = (Ereignis E[X])
2
P
Standardformel Der Varianz


VAR[X] = n p (1 p)
Varianz Bei Binomialverteilung

Standardabweichung: Mittlere Schwankungsstrke Zum Erwartungswert


[X] = VAR[X]
allgemeine Formel
9/10
Grenzwertsatz
von de Moivre
und Laplace
VORRAUSSETZUNG fr geeignete Approximation:

VAR[X] = n p (1 p) > 9 (fr n= gr.Werte)
NUR BEI BINOMIALVERTEILUNG!!


P[x
1
s X s x
2
] = P
x
1
n p
n p (1 p)
s
X
o
s
x
2
n p
n p (1 p)

1
]
1
1
- d(u
2
) d(u
1
)


einfaches
Beispiel:


X BIN(10,0.3)


[X] = 10 0,3 = 3


[X] = 2,1

exakte Berechnung:


P[1 < X 5] = (nCr(10, i) 0,3^i 0,7^(10 i), i,2,5)

= 0,803 = 80,3%


approximative Berechnung:

1)

VAR[X] = n p (1 p) = 10 0,3 (1 0,3) = 2,1 < 9 keine Garantie fr Approximation


2)

P[1 < X s 5] = P
1 3
2,1
<
X
o
s
5 3
2,1

1
]
1
1
= P 1,38 <
X
o
s 1,38

1
]
1




3)

(1,38) (1,38) Wert in Tabelle ablesen

4) = 0,9162 0,0838 = 0,8324 = 83,24% Vergleich mit exaktem Ergebnis

Merke

+z
( )
z
( )
(+z) (1 (+z) ) 2 +z
( )
1
Gegenteil

P[X exp] 1 P[X < exp] P[X exp] 1 P[X > exp]
P[X > exp] 1 P[X exp] P[X < exp] 1 P[X exp]
P[X > exp] a% P[X < exp] (100 a)%

Konfidenzintervall

P p A p p + A

= 1

Abstand zwischen p und

p kann hchstens A sein

E[ p] = E
X
n

=
1
n
E[X] =
1
n
(n p) = p

Der mittlere Wert des Schtzers
liefert pro Versuch auf lange Sicht das
richtige gesuchte Resultat

VAR[ p] =
1
n

2
(n p (1 p)) =
p (1 p)
n

VAR (Abweichung zum Mittelwert)
wird fr grosse n immer kleiner
Abweichung zum E=p wird kleiner.

X
p
n
=

Punktschtzer fr Wahrscheinlichkeit

= q
1

p (1 p)
n

Schtzung fr Toleranz A
A = Wie breit muss A sein, damit p mit einer
Wahrscheinlichkeit von 1- getroffen wird
(Fliegenklatsche).

n = q
1
o
2

p (1 p)

_
,

2

Ermittlung des Stichprobenumfanges je mehr
Daten desto sicherere Aussage
(Es mssen mindestens __ Personen befragt werden,
... Wie viel Personen mssen mindestens befragt
werden? p = 0,5 worst Case)




NICHT
standardisieren -
bereits in Herleitung









y16(x)



y15(x)


1
Konfidenzniveau ( = Toleranz, dass tatschliches p
nicht in Intervall liegt)

Niveau ENTWEDER n ODER A
n ENTWEDER KN ODER A
A ENTWEDER KN ODER n
Intervall

p , p +


Intervall (zu 99% bzw. 95% konfident/sicher, dass das
tatschliche p in diesem Bereich liegt)
hufige Quantile:

q
0,975
= 1,96 q
0,95
= 1,645
q
0,995
= 2,575 q
0,99
= 2,328


u1 u2
-1,38 1,38
IMMER (X ...)
10/10
Definition Das so bestimmte Konfidenzintervall ist somit gemss einem Verfahren bestimmt worden, welches in 99
von 100 Anwendungen (des Verfahrens) ein Intervall liefert, welches den gesuchten, unbekannten Wert
p enthlt, bzw. in 1 von 100 Anwendungen (des Verfahrens) ein Intervall liefert, welches den gesuchten,
unbekannten Wert nicht enthlt.
Definition #2 Die Werte aus dem Konfidenzintervall entsprechen den Werte fr die Prvalenz, denen die empirische
Beobachtung nicht signifikant widerspricht und welche somit mit der empirischen Beobachtung
vertrglich sind.
Definition #3 Auf dem Konfidenzniveau von __% schliessen wir darauf, dass die wahre aber unbekannte Prvalenz im
Bereich von [Werte p-A bis p+A] liegt.
Definition #4 H0 = Frauenanteil an der Hochschule betrgt p0 (=beliebiger Wert)
HA = Frauenanteil an der Hochschule betrgt nicht p0.
(Wert der im Intervall liegt ist vertrglich mit den Beobachtungen aus der Stichprobe und wird nicht
(hoch)signifikant verworfen; Wert der NICHT im Intervall liegt, ist mit den Beobachtungen aus der
Stichprobe nicht vertrglich und wird somit (hoch)signifikant verworfen.)
Zweiseitiger Test, da p0 Werte annehmen kann, die entweder ber oder unter dem Konfidenzintervall
sind.
Binomial-
verteilung
( ) , X BIN n p
n Anzahl Total
p Wahrscheinlichkeit
n p = Erwartungswert


VAR[X] = n p (1 p) Varianz


= VAR
Standardabweichung


P =
n
k

p
k
(1 p)
(nk)

Wahrscheinlichkeit
Binomialverteilung = iid (Merkmale sind unabhngig voneinander und gleich verteilt)

Annahmen die oft stillschweigend getroffen werden aber in der Praxis nicht immer korrekt sind.
Normalverteilung
( )
2
, X N




X BIN(n, p)
}
Grenzwertsatz X N (n p, n p (1 p))
Durch Approximation einer
Binomialverteilung (bei grossem n)
entsteht eine Normalverteilung.
Bernoulli-
verteilung

X BER p ( )
Merkmale sind unabhngig voneinander und treten mit der gleichen
Wahrscheinlichkeit auf. Mgliche Ausgnge 1 und 0 (Treffer KEIN Treffer)


VAR[X BER] = p (1 p) Varianz


E[X BER] = p Erwartungswert
LOGNORMAL-
verteilung
ln(1+ R) N(,
2
) 1+ R LOGN(,
2
)


X LOGN(,
2
)


P R s 10
( )
= P
ln(1+ R)
o
s
ln(1+10)
o

_
,


Standardverfahren


P R s q
0,10
( )
= 10% = P
ln(1+ R)
o
s
ln(1+ q
0,10
)
o

_
,

= d(...) = 0,10 = ... = 1,282


= ln(1+ q
0,10
) = 1,282 0,05 + 0,1 = ln(1+ q
0,10
) = 0,0359
= 1+ q
0,10
= e
0,0359
= q
0,10
= e
0,0359
1 = 3,66%

10% der kleinsten Renditen (links
vom 10% Quantil)


mit Rendite von 3,66% ist man
gerade noch unter den schlechtesten
10% der Fondmanager


P R > 18% ( ) = 1 P R s 18% ( ) = P
ln(1+ R)
o
s
ln(1+ 0,18) 0,1
0,05

_
,

P fr Rendite grsser als 18 %?


=0,1;
2
=0,05
2


P R 100%
( )
= 1 P R 100%
( )
...

eingesetztes Kapital mindestens
verdoppeln

P R 50%
( )

Wahrscheinlichkeit fr Wertverlust
von mehr als 50%

P R < 100%
( )
...

P dass mehr als das eingesetzte
Kapital verloren wird (-100%)

X N(,
2
)


kein (ln(1+R)
einsetzen da nur
Normalverteilung!!!


P R s q
0,90
( )
= 90% . P
R
o
s
q
0,90

o

_
,

= 90%
P R s q
0,05
( )
= 5% . P
R
o
s
q
0,05

o

_
,

= 5%

Bereich der 10% der grssten
Gewinne (rechts vom 10% Quantil)
bzw. 5% der grssten Verluste (links
vom 5% Quantil)
(Wahrscheinlichkeiten IM INNEREN
DER TABELLE)