Beruflich Dokumente
Kultur Dokumente
• Punktschätzung
• Intervallschätzung
• Testen von statistischen Hypothesen
3.4 Schätzen und Testen von relativen Häufigkeiten
3.4.1 Schätzen
Aufgabe: Schätzung einer unbekannten relativen Häufigkeit in der
Grundgesamtheit
Punktschätzer für : Die relative Häufigkeit p in einer einfachen Zufalls-
stichprobe.
Intervallschätzung: Konstruktion eines Konfidenzintervalls, das den Para-
meter mit einer Wahrscheinlichkeit von 1− (zumeist 95 %) überdeckt
(= beinhaltet)
Relative Häufigkeit = A/N (A … Anzahl an Erhebungseinheiten mit einer
bestimmten Eigenschaft in der Grundgesamtheit)
Anzahlen (=Häufigkeiten) a in der Stichprobe sind hypergeometrisch ver-
teilt und mit denselben Wahrscheinlichkeiten natürlich dann auch die
relativen Häufigkeiten p = a/n:
A N − A
a n − a
Pr(x = a) = ➔
N
n
Relative Häufigkeiten in der Stichprobe p = a/n haben deshalb den Erwar-
tungswert und die theoretische Varianz
(1 − ) N − n
=
2
n N−1
(1 − ) N − n
In großen Grundgesamtheiten (N → ): 2
n N−1
Rolle der Größe der Grundgesamtheit für die Genauigkeit von p:
(1 − ) N − n (1 − ) N − n
=
2
n N−1 n N−1
Dichte f(x)
1− (= 0,95)
/2 (= 0,025)
pu po
pStichprobenergebnis
u p
x0 −
Standardisierungsformel (14): u0 =
In großen Grundgesamtheiten und ausreichend großen einfachen Zufalls-
stichproben gilt bei relativen Häufigkeiten p für die Berechnung der
Obergrenze po:
po −
u1− /2 =
(1 − )
n
(1 − )
po = + u1− /2 (15a)
n
(1 − )
pu = − u1− /2 (15b)
n
… Aussage über die Wahrscheinlichkeit von Stichprobenergebnissen p
Bei 1− = 0,95: Mit einer Wahrscheinlichkeit von 0,95 wird unter den
gegebenen Bedingungen (große Grundgesamtheit, ausreichend großer
Stichprobenumfang, einfache Zufallsstichprobe, Teilnahmebereitschaft, …)
bei gegebenem das Stichprobenergebnis p in diesem Intervall liegen
Anwendung beim Testen von statistischen Hypothesen
Die eigentliche Aufgabenstellung der Intervallschätzung ist aber:
p ist gegeben und eine Aussage über wird gesucht
po (1 − )
= u1− /2 (15a,b)
pu n
Von p statt ausgehend:
Dichte f(x)
pu
p p
po
Formale Darstellung:
o (1 − )
= p u1− /2
u n
Mit einer Wahrscheinlichkeit von 1− ist ein solches Intervall (unter den
gegebenen Bedingungen) eines jener Intervalle, die den Parameter
überdecken
Im Intervall
o (1 − )
= p u1− /2
u n
wird durch p ersetzt:
p (1 − p)
o = p + u1− /2
n
(16)
p (1 − p)
u = p − u1− /2
n
… Konfidenzintervall zur Sicherheit 1−
Der Parameter wird (unter den gegebenen Bedingungen) mit einer
Wahrscheinlichkeit 1− von einem solchen Intervall überdeckt
Bei 1− = 0,95: u1−/2 = ?
Beispiel 3.1: Konfidenzintervall für die relative Häufigkeit
23 % von 400 zufällig ausgewählten Befragten würden gegenwärtig an
einer Wahl nicht teilnehmen (Nichtwählende)
Der Punktschätzer für : p = 0,23.
Konfidenzintervall zur Überdeckungswahrscheinlichkeit 1− = 0,95 nach
(16):
p (1 − p) 0,23 (1 − 0,23)
o = p + u1− /2 = 0,23 + 1,96 = 0,271
n 400
p (1 − p) 0,23 (1 − 0,23)
u = p − u1− /2 = 0,23 − 1,96 = 0,189
n 400
Die relative Häufigkeit an Nichtwählenden in der Grundgesamtheit wird
mit einer Wahrscheinlichkeit von 0,95 vom Intervall [0,189; 0,271] über-
deckt
Beispiel 3.2: Konfidenzintervall für die relative Häufigkeit
23 % von 10.000 zufällig ausgewählten Befragten würden gegenwärtig an
einer Wahl nicht teilnehmen (Nichtwählende)
Der Punktschätzer für : p = 0,23.
Konfidenzintervall zur Überdeckungswahrscheinlichkeit 1− = 0,95 nach
(16)::
p (1 − p) 0,23 (1 − 0,23)
o = p + u1− /2 = 0,23 + 1,96 = 0,238
n 10.000
p (1 − p) 0,23 (1 − 0,23)
u = p − u1− /2 = 0,23 − 1,96 = 0,222
n 10.000
Erforderlicher Stichprobenumfang im Buch im Kap. 3.4 (Stoff des Kurses
Statistik II)