1) Lagemaße: geben Information darüber, wo die Werte der Stichprobe im Mittel liegen
am häufigstem Lagemaße sind:
3) Bei Regressionsanalysen untersucht man die Art der Zusammenhänge zwischen zwei
Merkmalen x und y. Dabei sind x und y nicht gleichrangig, sondern man betrachtet y als
abhängig von x. Man geht davon aus, dass x festgehalten und exakt messbar ist und nur die
y-werte streuen.
Bsp. X eine bestimmte Körpergröße und y sind die verschiedenen Gewichte von Personen mit
dieser Größe. Man interessiert sich dafür, wie sich y in Abhängigkeit von x ändert.
Dazu betrachtet man die Wertpaare (x1,y2),…,(xn,yn)
Gesucht ist eine Funktion, die die Abhängigkeit der yi-Werte von den xi-Werten möglichst gut
beschreibt.
Man kann versuchen, die Punkte (xi,yi) durch eine Gerade anzunähern lineare Regression
y=f(x)=kx+d
Die Gerade heißt Regressionsgerade.
Die Gerade f(x)=kx+d für die maximal wird, ist gegeben durch:
4) Ein Residuum bezeichnet den Fehler, den das Regressionsmodell nicht der Vorhersage für
diese Beobachtung gemacht hat.
5) Parameter k und d
Die Gerade f(x) = kx+d (k und d so zu wählen dass f(x) optimal ist)
minimal
Frage 2: Kombinatorik
1)Binomialkoeffizient
“n über k“ ist die Anzahl der Möglichkeiten, aus n Elementen k Elemente anzuordnen (ohne
zurücklegen, ohne Reihenfolge).
z.b bei einer Ziehung von k Kugeln aus einem Topf von n kugeln wie beim Lotto 6 aus 45. n=45, k=6
Für die erste Kugel gibt es 45 Möglichkeiten, für die zweite 44, für die dritte 43 usw. bis zur sechsten
mit 40 Möglichkeiten. Also insgesamt 45.44.43.44.45 …. 40 Möglichkeiten.
Mit unserem 6 Zahlen haben wir für die erste Kugel 6 Möglichkeiten für die zweite 5, usw.
Und k(k-1)(k-2)…2.1
Einfach die Gesamtmenge (Anzahl aller möglichen Ziehungen) durch die Teilmenge (Anzahl der
Möglichkeiten ,6 Richtige zu bekommen) teilen.
Also
Formel umformen
2)Binomische lehrsatz
Es fällt auf dem für jeden Summanden der Gesamtsumme der Summe der Exponenten von x und y
gleich 2 ist.
Wir nehmen nämlich wenn wir das Produkt (x+y)(x+y)ausmultiplizieren ,aus jedem der Term (x+y)
entweder ein x oder ein y (in jeden Summanden kommen insgesamt 2 Faktoren x oder y vor)
Die Summe der Exponenten beider Variablen muss also gleich 2 sein.
Es müssen nur noch die Koeffizienten der einzelnen Summanden bestimmt werden.
Allgemein: (x+y)n=(x+y)(x+y)….(x+y)
n-mal
Alle potenzen besitzen die Form xkyn-k wobei k<n eine natürliche Zahl ist
(x+y).(x+y)….(x+y)
Man erhält xn
Der Koeffizient von xn muss 1 sein. Analog ist auch der Koeffizient für yn 1.
Doch wie lautet allgemein der Koeffizient für den Term xayn-k ?
Dazu müssen wir aus den n Termen (x+y) k mal die variable x und (n-k) mal die Variable y wählen
Doch wie viele Möglichkeiten gibt es aus n Termen k-mal eine variable auswählen?
> Der Koeffizient von xkyn-k gleich -> aus Elementen k Elemente anzuordnen.
Mit zurücklegen mit Reihenfolge :nk Möglichkeiten BSP: Möglichkeiten 4 stellige Passwort zu
erstellen
->Da die kugeln zurückgelegt werden, kann k auch größer als n sein.
In zweiten Zug hat man da nicht zurückgelegt wird nur noch (n-1) Möglichkeiten
N*(n-1)*(n-2) Möglichkeiten
Das Urnen Modell ohne zurücklegen mit Reihenfolge nun betrachten wir noch das die
Reihenfolge keine Rolle spielt, indem wir uns überlegen ,wie wir k Elemente unterschiedlich
anordnen können
Permutation k! Möglichkeiten
1) Hypergeometrische Verteilung:
Man kann sich die hypergeom. Verteilung einfach als Urne vorstellen, bei der Kugeln ohne
zurücklegen entnommen werden. Die Urne enthält allerdings zwei verschiedene Sorten von
Kugeln, von denen nur eine für uns interessant ist.
Gegebn ist eine Grundgesamtheit aus N Elementn, von denen M eine bestimmte
Eigenschaft haben. Man entnimmt eine Stichprobe vom Umfang n (ohne zurücklegen). Dann
kann die Zufallsvariable X= Anzahl der Elemente in der Stichprobe mit der gewünschten
Eingenschaft höchstens die Werte x = 0,1,2,…n annehmen. Die Wahrscheinlichkeit genau x
Elemente mit der gewünschten Eigenschaft in der Stichprobe zu vorzufinden, ist:
(für x>M bzw n-x > N-M ist P(X=x) = 0 nach Definition des Binomialkoeffizienten, wir können
nicht mehr blaue bzw rote Kugeln ziehen als vorhanden sind)
Man nennt X hypergeometrisch verteilt und die zugehörige Wahrscheinlichkeitsverteilung
eine Hypergeometrische Verteilung mit den Parametern n,M und M. X~H(n;M;N)
2) Bsp: in Urne 20 Kugeln, davon sind 4 blau und 6 rot. Aus der Urne werden ohne Zurücklegen
5 kugeln zufällig entnommen.
a) Wahrscheinlichkeit, in dieser Stichprobe genau 2 blaue Kugeln vorzufinden?
Mögliche Stichproben vom Umfang 5:
Möglichkeiten ohne zurücklegen, ohne Reihenfolge
Frage 4: Binomialverteilung
1) Ein Bernoulli Experiment ist ein Zufallsexperiment, bei dem es nur zwei Ausgänge gibt:
Ereignis A tritt ein oder nicht. Bzw Erfolg oder Misserfolg.
Wird ein Bernoulli-Experiment n-mal hintereinander unter denselben Bedingungen
ausgeführt, so spricht man von einer Bernoulli-Kette der Länge n.
Bsp: Bernoulli-Experiment: Wurf eines Würfels, A = Wurf der Augenzahl „Eins“ mit P(A)=1/6
Bernoulli-Kette: n-maliger Wurf des Würfels und jeweils Beobachtung von A = Augenzahl
Eins. Die Wahrscheinlichkeit für A ist bei jedem Wurf = 1/6
2) Gegeben ist eine Bernoulli-Kette der Länge n. Bei jeder der n Durchführungen kann ein
bestimmtes Ereignis A mit der Wahrscheinlichkeit P eintreten (das gegenereignis A mit der
Wahrscheinlichkeit )
Man interessiert sich für X = Anzahl der Versuchsdurchführungen, bei denen A eintritt. X
kann die Werte x=0,…,n annehmen.
Die Wahrscheinlichkeit, dass A genau x-mal eintritt, ist:
Man nennt die Zufallsvariable X binomialverteilt und ihre Wahrscheinlichkeitsverteilung eine
Binomialverteilung mit den Parametern n,p X~Bi(n;p)
3) Eine Binomialverteilung entsteht, wenn wir uns für die Anzahl der Erfolge bei einer Bernoulli-
Kette interessieren
Bsp: Wie groß ist die Wahrscheinlichkeit, genau 3-mal die Augenzahl 1 zu werfen?
Wahrscheinlichkeit, bei einem Wurf 1 zu erhalten = 1/6
Man wirft nun 7 mal und möchte dabei 3 mal 1 werfen.
111 NNNN 1/6 * 1/6 * 1/6 * 5/6 * 5/6 * 5/6* 5/6 =
Genau 3 mal 1 werfen: es gibt Würfelfolgen mit drei Einsen:
4)
Wieso Binomialkoeffizient? Wegen des binomischen Lehrsatzes!
Die Wahrscheinlichkeiten P(X=x) sind gerade die Summanden des binomischen Lehrsatzes
Frage 5: Elementare
Wahrscheinlichkeitsrechnung
1) Ereignisraum: Ω Die Menge aller möglichen Ergebnisse des Zufallsexperiments Bsp: Würfelwurf Ω
={1,2,3,4,5,6}
2) Bei einem Laplace -Experiment mit n möglichen Ergebnissen hat jeder dieser Ergebnisse die wsl.
1/n
Wenn ein Ereignis A in k von diesen „Fällen“ eintritt, dann ist die Wahrscheinlichkeit, von A gleich:
B = {2,3,5}
Die ursprüngliche Ergebnismenge Ω reduziert sich also auf A, und von B sind nur jene
Ergebnisse zu zählen, die auch in A liegen.
Bsp: 2 faire Würfel werden geworfen. Wie groß ist die Wahrscheinlichkeit, die Augensumme
5 zu werfen unter der Bedingung, dass wenigstens ein Mal die Augenzahl 1 geworfen wird?
Insgesamt gibt es 36 mögliche Wurffolgen.
A= zumindest einmal 1 auftritt (1,1),(1,2),(1,3)(1,4),(1,5),(1,6),(2,1),(3,1),(4,1),(5,1),(6,1)
B= Augensumme 5 tritt bei den Wurffolgen (1,4),(3,2),(2,3) ,(4,1) ein
Gesucht ist P(B|A). Da A bei 11 Wurffolgen eintritt , ist P(A) = 11/36
Unter allen Wurffolgen, in denen B eingetreten ist, tritt zusätzlich auch A in zwei Wurffolgen
ein (1,4),(4,1)
2) Zwei Ereignisse A und B heißen unabhängig, wenn eine (und damit alle drei) der folgenden
Eigenschaften erfüllt ist:
Bsp: Ein Würfel wird zwei Mal geworfen. Wie groß ist die Wahrscheinlichkeit, beim ersten
Wurf 1 und beim zweiten Wurf 2 zu würfeln?
Gesucht ist , mit A = beim ersten Wurf 1, B = beim zweiten Wurf 2
Die Ergebnisse A und B sind unabhängig, da das Ergebnis des ersten Wurfes keinen Einfluss
auf das Ergebnis des zweiten Wertes hat.
3)
4) Für eine beliebige Partition E1,…,En und ein beliebiges Ereignis gilt:
Mithilfe dieses Satzes kann man die totale Wahrscheinlichkeit P(A) berechnen, wenn man die
Wahrscheinlichkeiten P(Ek) und die bedingten Wahrscheinlichkeiten P(A|Ek) kennt.
5) Formel von Bayes: Gegeben ist eine beliebige Partition E1,…,En und ein beliebiges Ereignis
Die Wahrscheinlichkeit, dass eines der Ereignisse Ej unter der Bedingung von A eintritt ist:
6) Der Satz von Bayes ist eine hilfreiche Regel, um bedingte Wahrscheinlichkeiten der From
P(A|B) auszurechnen, wenn nur andersherum bedingte Wahrscheinlichkeiten der Form
P(B|A) gegeben sind.
Bedingte Wahrscheinlichkeit:
Falls die gemeinsame Wahrscheinlichkeit nicht gegeben ist, kann man sie auch
durch den Multiplikationssatz bestimmen: (A und B mit Wahrscheinlichkeiten ungleich null)
1) Zufallsvariable: Eine Funktion x, die jedem Ergebnis w des Ergebnisraums Ω genau eine reelle
Zahl x zuordnet.
Bsp: ist beim Wurf von zwei Würfeln die Zufallsvariable x = Augensumme der Funktion, die
jedem Augenpaar seine Augensumme zuordnet: X(1,1) = 2
2) Verteilungsfunktion: Eine Funktion F die jedem x einer Zufallsvariablen X genau eine
Wahrscheinlichkeit zuordnet.
Rechtsseitig stetig
Extra:
3) Ein Quantil xp teilt die Fläche unter der Dichte in zwei Teile:
Eine Fläche p links vom xp und eine Fläche 1-p rechts davon
Quantile sind Werte, die eine Menge von n Datenpunkten in zwei Teile spalten, und zwar so,
dass mindestens ein Anteil p kleiner oder gleich dem p-Quantil ist und mind. Ein Anteil 1-p
größer oder gleich dem P-Quantil.
Bsp: Der Median ist nämlich nichts anderes als das 50% - Quantil
Bsp: 20% Quantil einer Datenreihe mit 5 Elementen.
Dann ist der untere p-Anteil also die unteren 20% durch das erste Element gegeben, und der
obere Anteil durch die restlichen, größten vier Elemente.
In diesem Fall kann das 0,2-Quantil jeden Wert zwischen dem ersten und zweiten Element
annehmen.
4) Erwartungswert: Sei X eine Zufallsvariable. Der Erwartungswert von X ist eine reelle Zahl, die
definiert ist durch
Mann kann sagen, der Erwartungswert festigt sich als Mittelwert der Ergebnisse bei
mehrmaligem Wiederholen eines Experiments.
Im diskreten Fall ist der Erwartungswert also die Summe über alle möglichen Werte
xi multipliziert mit den zugehörigen Wahrscheinlichkeiten pi
Im stetigen Fall, der Erwartungswert bezeichnet sich als Integral über das Produkt
der Ergebnisse und Dichtefunktion der Verteilung
Varianz:
Verschiebungssatz
Summe von Zufallsvariablen
Linearität
6) ?
7) Standardabweichung beschreibt die durchschnittliche Abweichung vom Mittelwert
Varianz
Standardabweichung
8) Wahrscheinlichkeitsdichte, Dichtefunktion
Seit X eine stetige Zufallsvariable mit (stückweise) differenzierbarer Verteilungsfunktion F.
DR Abteilung f(x)=F‘(x) wird Dichtefunktion genannt.
Umgekehrt erhält man die Verteilungsfunktion durch Integration der Dichtefunktion
Eigenschaften:
Sei X eine stetige Zufallsvariable mit zugehöriger Dichtefunktion f(x)
Dann gilt:
Die Dichtefunktion ist so normiert, dass die Gesamtfläche unter dem Graphen von f
gleich 1 ist d.h
Diese Fläche ist gleich der Wahrscheinlichkeit, dass X irgendeinen Wert annimmt.
9) Sei X eine Zufallsvariable mit dem Erwartungswert μ und der Standardabweichung σ
ungleich 0. Dann hat die zugehörige standardisierte Zufallsvariable
11) Kovarianz: ist ein Maß für den linearen Zusammenhang zwischen zwei Zufallsvariablen X und
Y.
Umgekehrt folgt aber aus cov(x,y) = 0 nicht die Unabhängigkeit von X und Y.
Korrealitionskoefizient:
Um ein normiertes Maß für die Abhängigkeit zu bekommen, definiert man die Kovarianz der
standartisierten Zufallsvariablen als Korrelationskoeffizienten
Wird ein Zufallsexperiment immer unter den selben Bedingungen durchgeführt so nähert sich die
Häufigkeit immer weiter der Wahrscheinlichkeit des Zufallsexperiments an.
Aber nach 100 mal werden werden Kopf und Zahl nicht genau jeweils 50 mal vorkommen.
> Also es beschreibt ,dann die relative Häufigkeit hn(A) eines Zufallsereignissen A an die
theoretische Wahrscheinlichkeit P(A) dieses Ereignissen annähert wenn das
zufallsexperiment nur oft genug durchgeführt wird
3) Zentralen Grenzwert:
Seien X1,……,Xn unabhängige und identisch verteilte Zufallsvariable (Sie brauchen nicht normalverteilt
zu sein)
Dann hat die Summe S = X1+…….+ Xn den Erwartungswert nμ und die Varianz nσ2.
Ein Zufallsvariable X heißt normalverteilt mit den Parametern μ und σ, wenn sie die
DichteFunktion
*Der Erwartungswert μ.Es legt fest ,an welche Stelle die Normalverteilung ihr Maximum haben wird
EIGENSCHAFTEN:
Die Gaußschen Glockekurve ist symmetrisch zu x= μ und hat hier ihr einziges Maximum.
-
-> kann nur nummerisch berechnet werden, da die Dichtefunktion f der normalverteilung keine
elementare Stammfunktion besitzt -> daher bestimmung f(x) durch tabelle
-> Eine Zufallsvariable Z heißt Standardnormalverteilt,wenn sie normalverteilt ist mit den parametern
μ = 0 und σ2 =1
Dichtefunktion :
Verteilungsfunktion:
5)Quantile :
Sei X nach N(μ, σ2) verteilt.Dann ist die zugehörige standardisierte Zufallsvariable
Frage 9: Punktschätzung
1) -> Um den Parameter zu schätzen ,wird aus den Werten einer Stichprobe ein Schätzwert
gebildet.
->Eine Funktion T(x1,….,xn) des Stichproben variablen heißt Stichprobefunktion.Sie ist selbst
wieder eine Zufallsvariable.Wenn sie zur Schätzung eines Parameters der
Grundgesamtheit verwendet wird ,so wird sie Schätzfunktion für genannt
->Die Schätzfunktion T ist also eine zufallsvariable ,denen Realisationen Schätzwerte sind ,
die von den zugrunde liegenden Stichproben abhängen.
*Sie heißt konsistent im quadratischen Mittel ,wenn die erwartete quadratische Abweichung
im Grenzwert verschwindet :
3) Die Schätzfunktionen
(aritmetisches mittel ) für μ ,
(empirischer Anteil) für p ,
(empirische Verteilungsfunktion) für F
4)
2) Einseitiges Konfidenzintervall