Beruflich Dokumente
Kultur Dokumente
Lagemasse
Modus hufigster Wert einer Messreihe, mehrere Modi mglich
Wert in der Mitte einer geordneten Messreihe
( ) ( ) 1 /2 n
med x
+
=
Ungerade Anzahl Daten
Median
( ) ( ) ( ) /2 /2 1
1
2
n n
med x x
+
= +
Gerade Anzahl Daten
arithm.Mittel
( )
1 2
1
...
n
x x x x
n
= + + +
gewichtetes Mittel
1 1 2 2
...
g n n
x p x p x p x = + + +
geometrisches Mittel
1 2
...
n
m n
g x x x = Renditenberechnungen
Residuen Abweichung zum arithmetischen Mittel ( x x )
Streuungsmasse
1. Quartil 0.25 i n = aufrunden
( ) 1 i
q x =
(Wert an Position i in Messreihe)
3. Quartil
0.75 i n = aufrunden
( ) 3 i
q x = (Wert an Position i in Messreihe)
Quartilsabstand
3 1
q q q = Breite des Streubereichs der mittleren 50% der Daten
Ausreisser
1
3
2
q q
(nach unten)
3
3
2
q q +
(nach oben)
Spannweite Grsster Wert kleinster Wert einer Messreihe
Mitte Streubereich
( ) ( ) ( ) 1
1
2
n
x x +
Mitte des Streubereichs +/- halbe Spannweite
arithmetisches Mittel der
absoluten Abweichungen
1 2
...
n
x x x x x x
n
+ + +
Arithmetisches Mittel der
Absolutbetrge der Abweichung zum
arithmetischen Mittel
gewichtetes Mittel der
absoluten Abweichungen
1 1
...
n n
p x x p x x + +
gewichtetes Mittel der Absolutbetrge
der Abweichung zum gewichteten
Mittel
MAD Median der Absolutbetrge der Abweichungen zum ihrem Median
{ } 1 2
...
n
MAD med x med x med x med = + + +
Varianz
(Definition)
entspricht den durchschnittlichen, quadratischen Abweichungen der einzelnen
Daten zum arithmetischen Mittel.
Varianz
(Vollerhebung)
( ) ( ) ( ) ( )
2 2 2
1 2
1
var ...
n n
x x x x x x
n
= + + +
Varianz
(Stichprobe)
( ) ( ) ( ) ( )
2 2 2
1 2
1
var ...
1
n
x x x x x x
n
= + + +
var
n n
s =
Vollerhebung
var s = Stichprobe
1
1
n n
n n
s s s s
n n
= =
Standardabweichung
- ab 2 Standardabweichungen starke Abweichung!
- ein Ma fr die Streuung der Werte einer Zufallsvariable um
ihren Mittelwert
- wird auch mittlerer Fehler genannt
- sagt aus, wie stark die Prognosen vom Mittelwert
abweichen! aka misst das Risiko den Mittelwert zu verpassen!
2/10
2
( )
i
VAR x
H x x a
a
abs. Maximum der Werte ausserhalb
vom Mittel +/- a
2
( )
1
i
VAR x
H x x a
a
<
abs. Minimum der Werte innerhalb vom
Mittel +/- a
Tschebyschow
{ } 1,2,..., a n s =
vielfaches der Standardabweichung
2
( )
1 50%
VAR x
a
min. 50% der Daten innerhalb vom
Mittel +/- a
plus/minus 1 Standardabweichung min. 0 % der Daten im Bereich
plus/minus 2 Standardabweichungen min. 75 % der Daten im Bereich
plus/minus 3 Standardabweichungen min. 89 % der Werte im Bereich
Variationskoeffizient Beurteilung Grsse der Standardabweichung;
Abweichung einzelner Beobachtungen zum Mittelwert, die im Betrag kleiner
als
2 Standardabweichungen sind zufllig
Ansonsten systematisch
Vernderung
neuerWert alterWert
Verhltnis
alterWert
Sharpe Ratio
ndite der hung dardabweic S
Zinssatz er risikofrei ndite erwartete durchschn
Re tan
Re .
=
Unabhngigkeit
Kreuztabelle / Kontingenztafel
/ Vielfeldertafel
Geschlecht
Frauen
Mnner
120
(90)*
[30]
60
60
100
20
40
200
200
180 160 60 400
*
Prognose:
200*180
400
= 90
2
2
=
[Abweichung 1]
2
(Prognose 1)
+... +
[Abweichung n]
2
(Prognose n)
gibt an, in welchem Masse zwei Merkmale voneinander abhngen.
2
gross: Merkmale sind stark abhngig
2
klein: Merkmale sind unabhngig
Freiheitsgrad
(Normalwert)
= (Anzahl Zeilen - 1) * (Anzahl Spalten - 1)
Kritischer Wert
mit in TABELLE ABLESEN
2
< kritischer Wert: keine statistisch signifikante Abhngigkeit von X und Y
2
> kritischer Wert: statistisch signifikante Abhngigkeit von X und Y
2
= 0: keine Abhngigkeit der Merkmale
x
a x + a x
a x x
i
a x x
i
a x x
i
<
s
x
3/10
Regressionen
Prinzip der kleinsten
Quadrate
X Y
1 ) ( + = X a X f ) (X f Y =
0 1
1 0+ a ( ) 1 0 1 + a
1 2
1 1+ a ( ) 1 1 2 + a
3 2
1 3+ a ( ) 1 3 2 + a
( ) ( ) ( ) ( ) ( ) ( )
2 2 2
1 0 1 2 1 1 2 3 1 a a a + + + + + 2 8 10
2
+ a a
( )
2
10 8 2, d a a a + 8 20 a
( ) 20 8 0, solve a a =
5
2
= a
mit TR
2
2
10 8 2|
5
a a a + =
5
2
= SQR
Lineare Regression
X Y
b X a X f + = ) ( ) (X f Y =
0 1
b a + 0 ( ) b a + 0 1
1 2
b a + 1 ( ) b a + 1 2
3 2
b a + 3 ( ) b a + 3 2
( ) ( ) ( ) ( ) ( ) ( )
2 2 2
1 0 2 1 2 3 a b a b a b + + + + +
9 10 3 8 16 10
2 2
+ + + b b ab a a
( )
2 2
10 16 8 3 10 9, d a a ab b b a + + + 0 16 8 20 = + b a
( )
2 2
10 16 8 3 10 9, d a a ab b b b + + + 0 10 6 8 = + b a
mit TR
(20 8 16 0 8 6 10 0, ) solve a b and a b a + = + =
7
9
7
2
= = b a a: Steigung, b: Ordinatenabschnitt (y)
Regressionen mit TI
c1 = X-Wert
c2 = Y-Werte
Regression mit TI
F5 LinReg x:c1 y:c2 Store y1(x)
Koeffizienten
Interpretation
= pro zustzlicher Einheit X steigt/sinkt der prognostizierte Y-Wert um
^b = prognostizierter Y-Wert bei X = 0
ANOVA Tabelle
F5 OneVar x ... c5 Enter - x = SStot
x ... c6 Enter - x = SSReg
x ... c7 Enter - x = SSRes
c1 c2 c3=y1(c1) c4=c2-c3 c5=(c2-mean(c2))
2
c6=(c3-mean(c3))
2
c7=(c4-mean(c4))
2
X-Werte Y-Werte Prognose Residuen SStot SSReg SSRes
4/10
Source Sum of Squares Degree of Freedom Mean squares F-Qoutient
Regression
(Prognosewerte)
1
(beschr. Var.)
(Spalten)
/1 = /
Residual
(Abweichungsschw.)
= -1
(Zeilen)
/ =
Total
Anzahl Zeilen 1
kritischer Wert aus Tabelle: 1. Spalte und . Zeile
F-Quotient > kritischer Wert: Es gibt einen statistisch signifikanten Effekt von X auf Y
(Nullhypothese wird verworfen)
F-Quotient < kritischer Wert: Es gibt keinen statistisch signifikanten Effekt von X auf Y
Streudiagramm Funktion aktivieren F4 y1(x)
Plot aktivieren F4 Plot x:c1, y:c2, Scatter (Zoom Data)
[ ]
, corr X =
Plot x:c1 y:c4
Tukey Anscombe Plot:
(Antwort auf Frage ob man das Modell verbessern
kann, Voraussetzung fr Beurteilung viele
Datenpunkte)
, corr Y =
Plot x:c3 y:c4
Residuenanalyse
Abszisse: X-Achse
Ordinate: Y-Achse
Falls Ausreisser, Inhomogenitten, etc auftreten, ist das Modell nicht geeignet! Es darf aber auch
keine Struktur erkennbar sein.
Wenn keine Trends, ... erkennbar sind, dann ist das Modell grundstzlich fr das Erstellen von
Prognosen geeignet.
Kovarianz (cov) Beschreibt die Strke der gemeinsamen Schwankungen
Korrelation (corr) misst die Richtung und die Strke eines linearen Zusammenhangs
positive corr: ansteigender Trend
negative corr: abfallender Trend
corr = 0 keine Punkte auf Gerade
corr = 1 alle Punkte auf Gerade
2
R
R
2
=
SS
Re g
SS
Tot
R2 Koeffizient besagt, dass __% der totalen Schwankungen in den beobachteten
[Y-Wert Beschr.] aus den totalen Schwankungen der Prognosewerte fr die [Y-Wert Beschr.]
ergeben. Da sich die Prognose anhand des optimal angepassten Modells aus den beobachteten
[X-Wert Beschr.] berechnen, knnen __% der Schwankungen in den beobachteten [Y-Wert
Beschr.] auf die Schwankungen in den beobachteten [X-Wert Beschr.] zurckgefhrt und erklrt
werden.
je nher R
2
bei 1 desto besser ist das Modell um Prognosen zu stellen
X
Y a b =
Exponentieller Trend; Erklrende Variable
steht im Exponent
lg( ) lg( ) lg( ) Y a X b = + lg( ) lg( ) lg( ) Y b X a = +
0 0
V a X b = +
Lineare Regression durchfhren
F5 LinReg x:c1 y:c3 (c3 = log(c2))
0 0
b und a
Exponentielle
Regression
0
lg( ) a b =
0
10
a
b =
0
lg( ) b a =
0
10
b
a =
mit TR direkt
Data/Matrix Editor F5 ExpReg x:c1 y:c2
b und a
5/10
b
Y a X =
Erklrende Variable bildet
Basis
lg( ) lg( ) lg( ) Y a b X = + lg( ) lg( ) lg( ) Y X b a = +
0 0
V U a b = +
Lineare Regression durchfhren
F5 LinReg x:c3 (c3 = log(c1))
y:c4 (c4 = log(c2))
0 0
b und a
Regression mit
Ansatz einer
Potenzfunktion
0
a b =
0
lg( ) b a =
0
10
b
a =
mit TR direkt
Data/Matrix Editor F5 PowerReg x:c1 y:c2
b und a
Wahrscheinlichkeitsrechnung
Prvalenz Anteil an kranken Personen in der Gesamtbevlkerung.
Je grer die Prvalenz desto zuverlssiger ist ein positives Testresultat.
Sehr kleine Prvalenz positives Resultat meistens falsch
Sensitivitt Wie oft ist Test positiv, wenn Krankheit vorhanden ist?
korrekt positives Resultat (pos. Personen werden positiv getestet)
Spezifitt Wie oft ist Test negativ, wenn Krankheit nicht vorhanden?
korrekt negatives Resultat (neg. Personen werden neg. getestet)
gesund/krank? Test pos./neg.?
Allgemein
P tatschlich pos |Test pos
=
korrekt positiv
korrekt positiv + falsch positiv
ACHTUNG: darauf achten welche Wahrscheinlichkeit gefragt ist!!
P =
p Sensitivitt
p Sensitivitt + 1 p
( )
(1 Spezifitt)
Wahrscheinlichkeit
y8(x)
y9(x)
[ ]
1
p P alle Personen haben verschiedene Geburtstage =
( )
1
365 1 365 1 365 2 365 3
...
365 365 365 365
n
p
=
z.B. n= 35, Wert: 34;
Produktzeichen: 2nd-Math-B Calculus 5
p
2
= P min. 2Personen haben den selben Geburtstag
( )
2
365 1 365 1 365 2 365 3
1 ...
365 365 365 365
n
p
=
1
k
365.
, k,365 (n 1),365
Total
positiv
nicht positiv
korrekt positiv
falsch negativ
falsch positiv
korrekt negativ
Prval enz
Spezifi tt
Sensiti vit t
p
1-p
k
365.
, k,365 (n 1),365
6/10
Urnenmodell
Mglichkeiten gefragt:
n
k
Wahrscheinlichkeit
gefragt:
n
k
Gesamtmglichkeiten
Mit zurcklegen Ohne zurcklegen
Beachtung der
Reihenfolge
Passwrter:
k
n
Siegerpodest:
( )
!
!
n
n k
Keine Beachtung der
Reihenfolge
Theaterkarten:
1 n k
k
+
Lotto:
( )
!
! !
n n
k k n k
=
n: Mglichkeiten gesamt, k: Anzahl Ziehungen
(ENTWEDER) ODER + UND multiplizieren
Bsp
Ti: y10(x)
6 freie Stellen, min. 50% Frauen, Bewerbungen: 7 Frauen & 13 Mnner. Gesucht: Anzahl
verschiedene Mglichkeiten
7 13 7 13 7 13 7 13
3 3 4 2 5 1 6 0
Anz Mglichkeiten
= + + +
3 Frauen und (x) 3 Mnner oder (+) 4 Frauen und (x)
nCr(7, k) nCr(13,6 k), k,3,6
( )
Bsp #2
Ti: y11(x)
Table abscrollen bis
0.9 ... (bzw. Solver)
n = vorbereitete Aufgaben, 50-n unvorbereitete Aufgaben, 8 Aufgaben an der Prfung, min. 5
Aufgaben korrekt fr bestehen
[ ] Pr 90% P fung bei n vorbereiteten Aufgaben bestehen
50 50 50 50
5 3 6 2 7 1 8 0
50
8
n n n n n n n n
P
= + + +
nCr(x, k) nCr(50 x,8 k), k,5,8)
nCr(50,8)
_
,
Cox-Ross-Rubenstein Modell (PUT/CALL OPTIONEN)
( )
15
21 1000 1.02 0.97
x x
y x
=
Endkurs bei 15 Perioden
( ) ( )
15
22 15, 0.45 0.55
x x
y x ncr x
=
Wahrscheinlichkeit
( ) ( ) ( ) 23 max 800 21 ,0 y x y x =
Auszahlung bei Put Option
mit Strike = 800
y23 x ( ) = max y21 x ( ) 1100,0
( )
Auszahlung bei Call Option
mit Strike = 1100
( )
( )
( )
15
23
24
1.0025
y x
y x =
Diskontierte Auszahlung mit
Zins von 0.0025
y25 x ( ) = (y22(x) y24(x),x,0,15)
Fairer Preis der Option
(=Erwartungswert)
y26 x ( ) = (y22(x),x,7,15)
Wahrscheinlichkeit, dass die
Option im Geld endet
(Perioden mit Auszahlung)
HOME
y27 x ( ) = (y21(x) y22(x),x,0,15)
Erwartungswert vom
Endkurs der Aktie (Kursziel)
HOME
Binomialmodell
PUT-Option:
Recht die Aktie zum
Strike-Preis zu
verkaufen
CALL-Option:
Recht die Aktie zum
Strike-Preis zu kaufen.
STRANGLE:
P[Strangle] = P[PUT in
Geld] + P[CALL in
Geld]
y28 x ( ) = ((y21(x) y27(x))
2
* y22(x),x,0,15)
VAR des Endkurses HOME
7/10
y29 x ( ) = y28(x)
Standardabweichung des
Endkurses (Volatilitt)
HOME
y30 x ( ) =
(y21(x) 1000)
1000
Rendite der Aktie HOME
y31 x ( ) = (y30(x) y22(x),x,0,15)
Erwartungswert der
Rendite
HOME
y32 x ( ) = ((y30(x) y31(x))
2
y22(x),x,0,15)
VAR der Rendite HOME
y33 x ( ) = y32(x)
Standardabweichung der
Rendite HOME
Interpretationen
PUT:
Versicherung gegen das Risiko am Ende der Laufzeit weniger als Strike-Preis zu haben.
Im Sinne der Versicherungsprmie zahle ich heute einen faieren Preis von __ CHF.
Fairer Preis deckt zusammen mit Zinsen und Zinseszinsen die durchschnittlichen Auszahlungen.
Spekulation auf sinkende Kurse. Wetteinsatz ist der faire Preis (der Option). Die durchschnittlichen
Auszahlungen werden durch den fairen Preis plus Zinsen und Zinseszinsen gedeckt.
Interpretationen
CALL:
Versicherung beispielsweise einer Fluggesellschaft gegen stark steigende Kerosinpreise. Durch die
CALL-Option habe ich das Recht am Ende der Laufzeit Kerosin zum Strike-Preis zu kaufen. Dies
ermglich langfristige Kalkulationen, da das Verlustrisiko beschrnkt ist. Der Preis fr diese
Absicherung ist der faire Preis von __ CHF.
Spekulation auf steigende Kurse. Der Wetteinsatz ist der faire Preis. Die durchschnittlichen
Auszahlungen werden durch den fairen Preis plus Zinsen und Zinseszinsen gedeckt.
Testen von Hypothesen
Test im Sinne eines Widerspruchsbeweises; Gegenteil des zu beweisenden ist die Nullhypothese!
gewichtigere Fehler Fehler 1. Art
Bsp.:
n= 24, = 5%,
p = 40 %
berlebenschance
0
H : Arzt ist nicht besser als der Durchschnitt
A
H : Arzt ist besser als der Durchschnitt
X = Anzahl Personen die berleben
= tolerierte Fehleranteil (signifikant = 5 %, hochsignifikant = 1 %) = 5%
... auf Fragestellung achten
Fehler 1. Art: Arzt ist schlecht aber da durch Zufall viele Patienten berleben gilt er als gut.
Fehler 2. Art: Arzt ist gut aber da durch Zufall viele Patienten sterben gilt er als schlecht.
Entscheidungsregeln:
X k H
0
verworfen
X < k H
0
nicht verworfen
Ansatz:
P
H
0
Fehler 1.Art
X ~BIN(24,0.40)
Fehler 1. Art
(exakte Berechnung)
y12(x)
y12(x) = ncr 24,i
( )
0.4^i 0.6^24 i
( )
,i,x,24
( )
Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 5%) kritischer Wert = 15
(X-Wert in Tabelle)
Ein Arzt bei dem mindestens 15 von 24 Patienten die nchsten 5 Jahre berleben, kann man davon
ausgehen, dass der Arzt signifikant besser ist als der Durchschnitt.
Fehler 2. Art
(exakte Berechnung)
kritischer Wert = 15
Fehler 2. Art = H0 wird nicht verworfen, obwohl HA gilt (= Arzt ist lt. Stichprobe unterdurchschn.
obwohl er eigentlich eine bessere Heilungsquote hat als der Durchschnitt.)
P=[X < 15 | Arzt besser als Durchschn.] P[X 14 | Arzt besser als Durchschn.]
Heilungsqoute des Arztes betrgt tatschlich 45% (leicht besser als Durchschn. von 40%; Annahme
... im Ernstfall gegeben)
y(x) = ncr 24,i
( )
0.45^i 0.55^24 i
( )
,i,0,14
( )
= 93,5%
die Wahrscheinlichkeit, dass der Arzt als unterdurchschnittlich gilt obwohl er besser ist, wird kleiner
je besser die Heilungsquote tatschlich ist. (Wenn er bspielsweise eine HQ von 75% htte (75 von
100 Patienten geheilt) wre die Wahrscheinlichkeit nur noch bei 5%)
Bsp 2:
Geschlechterparitt
(zweiseitiger Test)
73 Personen,
47 M u. 26 W, = 5%
0
H : Geschlechterparitt ist nicht verletzt (Mnner- und Frauenanteil von 50 %)
A
H : Geschlechterparitt ist verletzt
Zweiseitiger Test, da entweder zuviel Frauen oder zu viel Mnner die Geschlechterparitt verletzen
knnten bzw. da die Anzahl Mnner/Frauen zu hoch bzw. zu niedrig sein knnte.
X = Anzahl Mnner in der Regierung
= 5% da zweiseitiger Test 5/2 = 2,5%
8/10
X k
u
ODER X k
o
H
0
verworfen
K
u
< X < K
o
H
0
nicht verworfen
p = 50% Mnner bzw. Frauen
y18(x)
y19(x)
KO:
P X k
o
|H
0
2
= 2,5%
X ~BIN(73,0.5)
y(x) = ncr 73,i
( )
0.5^i 0.5^ 73 i
( )
,i,x,73
( )
Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 2,5%) kritischer Wert = 46
(1. X-Wert in Tabelle unter 2,5%)
KU:
P X k
u
|H
0
2
= 2,5%
y(x) = ncr 73,i
( )
0.5^i 0.5^73 i
( )
,i,0,x
( )
Tabelle, kritischer Wert ablesen (Wahrscheinlichkeit unter 2,5%) kritischer Wert = 27
(1. X-Wert in Tabelle unter 2,5%)
Da die Anzahl der Mnner (47) die obere Grenze KO (46) berschritten hat, und da die Anzahl der
Frauen (26) die untere Grenze KU (27) unterschritten hat ist die Geschlechterparitt signifikant
verletzt.
Mehrere
Zufallsvariablen ber
gemeinsamen
Wahrscheinlichkeits-
raum
Y
Y0 Y1 Y2
X0 n0,0 n0,1 n0,2 (X0)
X1 n1,0 n1,1 n1,2 (X1) X
X2 n2,0 n2,1 n2,2 (X2)
(Y0) (Y1) (Y2) 100 %
E[X]: X0 * (X0) + X1 * (X1) + X2 * (X2)
E[Y]: Y0 * (Y0) + Y1 * (Y1) + Y2 * (Y2)
Var[X]: (X0E[X])
2
* (X0) + (X1E[X])
2
* (X1) +(X2E[X])
2
* (X2)
Var[Y]: (Y0E[Y])
2
* (Y0) + (Y1E[Y])
2
* (Y1) +(Y2E[Y])
2
* (Y2)
Cov[X,Y]: (X0E[X]) * (Y0E[Y]) * n0,0 + ... + (X2E[X]) * (Y2E[Y]) * n2,2
Corr [X,Y] =
Cov[X,Y]
[X] [Y]
Rechenregeln:
a = Konstante Zahl
X/Y = Zufallsvariablen
Erwartungswert: Wert Der Bei Oftmaligem Wiederholen Des Ereignisses Am Hufigsten Auftritt
E[X] = Ereignis (Anzahl)[X]Wahrscheinlichkeit[X]
Allgemeine Formel Fr E
E[X] = n p E Bei Binomialverteilung
Varianz: Risiko Den Mittelwert Zu Verpassen
VAR[X] = E[X
2
] (E[X])
2
Satz Von Steiner
VAR[X] = (Ereignis E[X])
2
P
Standardformel Der Varianz
VAR[X] = n p (1 p)
Varianz Bei Binomialverteilung
Standardabweichung: Mittlere Schwankungsstrke Zum Erwartungswert
[X] = VAR[X]
allgemeine Formel
9/10
Grenzwertsatz
von de Moivre
und Laplace
VORRAUSSETZUNG fr geeignete Approximation:
VAR[X] = n p (1 p) > 9 (fr n= gr.Werte)
NUR BEI BINOMIALVERTEILUNG!!
P[x
1
s X s x
2
] = P
x
1
n p
n p (1 p)
s
X
o
s
x
2
n p
n p (1 p)
1
]
1
1
- d(u
2
) d(u
1
)
einfaches
Beispiel:
X BIN(10,0.3)
[X] = 10 0,3 = 3
[X] = 2,1
exakte Berechnung:
P[1 < X 5] = (nCr(10, i) 0,3^i 0,7^(10 i), i,2,5)
= 0,803 = 80,3%
approximative Berechnung:
1)
VAR[X] = n p (1 p) = 10 0,3 (1 0,3) = 2,1 < 9 keine Garantie fr Approximation
2)
P[1 < X s 5] = P
1 3
2,1
<
X
o
s
5 3
2,1
1
]
1
1
= P 1,38 <
X
o
s 1,38
1
]
1
3)
(1,38) (1,38) Wert in Tabelle ablesen
4) = 0,9162 0,0838 = 0,8324 = 83,24% Vergleich mit exaktem Ergebnis
Merke
+z
( )
z
( )
(+z) (1 (+z) ) 2 +z
( )
1
Gegenteil
P[X exp] 1 P[X < exp] P[X exp] 1 P[X > exp]
P[X > exp] 1 P[X exp] P[X < exp] 1 P[X exp]
P[X > exp] a% P[X < exp] (100 a)%
Konfidenzintervall
P p A p p + A
= 1
Abstand zwischen p und
p kann hchstens A sein
E[ p] = E
X
n
=
1
n
E[X] =
1
n
(n p) = p
Der mittlere Wert des Schtzers
liefert pro Versuch auf lange Sicht das
richtige gesuchte Resultat
VAR[ p] =
1
n
2
(n p (1 p)) =
p (1 p)
n
VAR (Abweichung zum Mittelwert)
wird fr grosse n immer kleiner
Abweichung zum E=p wird kleiner.
X
p
n
=
Punktschtzer fr Wahrscheinlichkeit
= q
1
p (1 p)
n
Schtzung fr Toleranz A
A = Wie breit muss A sein, damit p mit einer
Wahrscheinlichkeit von 1- getroffen wird
(Fliegenklatsche).
n = q
1
o
2
p (1 p)
_
,
2
Ermittlung des Stichprobenumfanges je mehr
Daten desto sicherere Aussage
(Es mssen mindestens __ Personen befragt werden,
... Wie viel Personen mssen mindestens befragt
werden? p = 0,5 worst Case)
NICHT
standardisieren -
bereits in Herleitung
y16(x)
y15(x)
1
Konfidenzniveau ( = Toleranz, dass tatschliches p
nicht in Intervall liegt)
Niveau ENTWEDER n ODER A
n ENTWEDER KN ODER A
A ENTWEDER KN ODER n
Intervall
p , p +
Intervall (zu 99% bzw. 95% konfident/sicher, dass das
tatschliche p in diesem Bereich liegt)
hufige Quantile:
q
0,975
= 1,96 q
0,95
= 1,645
q
0,995
= 2,575 q
0,99
= 2,328
u1 u2
-1,38 1,38
IMMER (X ...)
10/10
Definition Das so bestimmte Konfidenzintervall ist somit gemss einem Verfahren bestimmt worden, welches in 99
von 100 Anwendungen (des Verfahrens) ein Intervall liefert, welches den gesuchten, unbekannten Wert
p enthlt, bzw. in 1 von 100 Anwendungen (des Verfahrens) ein Intervall liefert, welches den gesuchten,
unbekannten Wert nicht enthlt.
Definition #2 Die Werte aus dem Konfidenzintervall entsprechen den Werte fr die Prvalenz, denen die empirische
Beobachtung nicht signifikant widerspricht und welche somit mit der empirischen Beobachtung
vertrglich sind.
Definition #3 Auf dem Konfidenzniveau von __% schliessen wir darauf, dass die wahre aber unbekannte Prvalenz im
Bereich von [Werte p-A bis p+A] liegt.
Definition #4 H0 = Frauenanteil an der Hochschule betrgt p0 (=beliebiger Wert)
HA = Frauenanteil an der Hochschule betrgt nicht p0.
(Wert der im Intervall liegt ist vertrglich mit den Beobachtungen aus der Stichprobe und wird nicht
(hoch)signifikant verworfen; Wert der NICHT im Intervall liegt, ist mit den Beobachtungen aus der
Stichprobe nicht vertrglich und wird somit (hoch)signifikant verworfen.)
Zweiseitiger Test, da p0 Werte annehmen kann, die entweder ber oder unter dem Konfidenzintervall
sind.
Binomial-
verteilung
( ) , X BIN n p
n Anzahl Total
p Wahrscheinlichkeit
n p = Erwartungswert
VAR[X] = n p (1 p) Varianz
= VAR
Standardabweichung
P =
n
k
p
k
(1 p)
(nk)
Wahrscheinlichkeit
Binomialverteilung = iid (Merkmale sind unabhngig voneinander und gleich verteilt)
Annahmen die oft stillschweigend getroffen werden aber in der Praxis nicht immer korrekt sind.
Normalverteilung
( )
2
, X N
X BIN(n, p)
}
Grenzwertsatz X N (n p, n p (1 p))
Durch Approximation einer
Binomialverteilung (bei grossem n)
entsteht eine Normalverteilung.
Bernoulli-
verteilung
X BER p ( )
Merkmale sind unabhngig voneinander und treten mit der gleichen
Wahrscheinlichkeit auf. Mgliche Ausgnge 1 und 0 (Treffer KEIN Treffer)
VAR[X BER] = p (1 p) Varianz
E[X BER] = p Erwartungswert
LOGNORMAL-
verteilung
ln(1+ R) N(,
2
) 1+ R LOGN(,
2
)
X LOGN(,
2
)
P R s 10
( )
= P
ln(1+ R)
o
s
ln(1+10)
o
_
,
Standardverfahren
P R s q
0,10
( )
= 10% = P
ln(1+ R)
o
s
ln(1+ q
0,10
)
o
_
,
_
,
_
,
= 90%
P R s q
0,05
( )
= 5% . P
R
o
s
q
0,05
o
_
,
= 5%
Bereich der 10% der grssten
Gewinne (rechts vom 10% Quantil)
bzw. 5% der grssten Verluste (links
vom 5% Quantil)
(Wahrscheinlichkeiten IM INNEREN
DER TABELLE)