Sie sind auf Seite 1von 17

Aufgaben der schließenden Statistik (Zusammenfassung):

• Punktschätzung
• Intervallschätzung
• Testen von statistischen Hypothesen
3.4 Schätzen und Testen von relativen Häufigkeiten
3.4.1 Schätzen
Aufgabe: Schätzung einer unbekannten relativen Häufigkeit  in der
Grundgesamtheit
Punktschätzer für : Die relative Häufigkeit p in einer einfachen Zufalls-
stichprobe.
Intervallschätzung: Konstruktion eines Konfidenzintervalls, das den Para-
meter  mit einer Wahrscheinlichkeit von 1− (zumeist 95 %) überdeckt
(= beinhaltet)
Relative Häufigkeit  = A/N (A … Anzahl an Erhebungseinheiten mit einer
bestimmten Eigenschaft in der Grundgesamtheit)
Anzahlen (=Häufigkeiten) a in der Stichprobe sind hypergeometrisch ver-
teilt und mit denselben Wahrscheinlichkeiten natürlich dann auch die
relativen Häufigkeiten p = a/n:
 A  N − A 
 a  n − a 
Pr(x = a) =    ➔
N
n
 
Relative Häufigkeiten in der Stichprobe p = a/n haben deshalb den Erwar-
tungswert  und die theoretische Varianz
  (1 −  ) N − n
 =
2

n N−1
  (1 −  ) N − n
In großen Grundgesamtheiten (N → ):   2

n N−1
Rolle der Größe der Grundgesamtheit für die Genauigkeit von p:
  (1 −  ) N − n   (1 −  ) N − n
 =
2
  
n N−1 n N−1

China (2018): 1,4 Mrd. EW


Rolle der Größe der Grundgesamtheit für die Genauigkeit von p:
  (1 −  ) N − n   (1 −  ) N − n
 =
2
  
n N−1 n N−1

Österreich (2018): 8,8 Mio. EW


Rolle der Größe der Grundgesamtheit für die Genauigkeit von p:
  (1 −  ) N − n
 =
2

n N−1

St. Veit im Mühlkreis (Bezirk Rohrbach, 2018): 1206 EW


Zentraler Grenzwertsatz der Statistik:
In großen Grundgesamtheiten gilt, dass bei genügend großem n (Faustre-
gel: n  100) relative Häufigkeiten p in der Stichprobe annähernd normal-
verteilt mit dem Erwartungswert  und der theoretischen Varianz
  (1 − )
sind.
n
➔ Rechnen mit der Normalverteilung:
Gesucht wird jenes symmetrische Intervall [pu;po], in dem die möglichen
Stichprobenergebnisse p mit einer vorgegebenen Wahrscheinlichkeit 1−
liegen!
 ist gegeben, Aussage über p wird gesucht
Abbildung 3.4: Die (annähernde) Stichprobenverteilung relativer Häu-
figkeiten für große Stichproben und große Grundgesamtheiten

Dichte f(x)

1− (= 0,95)
/2 (= 0,025)

pu  po

pStichprobenergebnis
u p
x0 − 
Standardisierungsformel (14): u0 =

In großen Grundgesamtheiten und ausreichend großen einfachen Zufalls-
stichproben gilt bei relativen Häufigkeiten p für die Berechnung der
Obergrenze po:
po − 
u1− /2 =
  (1 − )
n
  (1 − )
po =  + u1− /2  (15a)
n

  (1 − )
pu =  − u1− /2  (15b)
n
… Aussage über die Wahrscheinlichkeit von Stichprobenergebnissen p
Bei 1− = 0,95: Mit einer Wahrscheinlichkeit von 0,95 wird unter den
gegebenen Bedingungen (große Grundgesamtheit, ausreichend großer
Stichprobenumfang, einfache Zufallsstichprobe, Teilnahmebereitschaft, …)
bei gegebenem  das Stichprobenergebnis p in diesem Intervall liegen
Anwendung beim Testen von statistischen Hypothesen
Die eigentliche Aufgabenstellung der Intervallschätzung ist aber:
p ist gegeben und eine Aussage über  wird gesucht
po   (1 − )
=   u1− /2  (15a,b)
pu n
Von p statt  ausgehend:

Dichte f(x)

pu
p  p
po
Formale Darstellung:
o  (1 − )
= p  u1− /2 
u n
Mit einer Wahrscheinlichkeit von 1− ist ein solches Intervall (unter den
gegebenen Bedingungen) eines jener Intervalle, die den Parameter 
überdecken
Im Intervall
o   (1 − )
= p  u1− /2 
u n
wird  durch p ersetzt:

p  (1 − p)
o = p + u1− /2 
n
(16)
p  (1 − p)
u = p − u1− /2 
n
… Konfidenzintervall zur Sicherheit 1−
Der Parameter  wird (unter den gegebenen Bedingungen) mit einer
Wahrscheinlichkeit 1− von einem solchen Intervall überdeckt
Bei 1− = 0,95: u1−/2 = ?
Beispiel 3.1: Konfidenzintervall für die relative Häufigkeit
23 % von 400 zufällig ausgewählten Befragten würden gegenwärtig an
einer Wahl nicht teilnehmen (Nichtwählende)
Der Punktschätzer für : p = 0,23.
Konfidenzintervall zur Überdeckungswahrscheinlichkeit 1− = 0,95 nach
(16):
p  (1 − p) 0,23  (1 − 0,23)
o = p + u1− /2  = 0,23 + 1,96  = 0,271
n 400
p  (1 − p) 0,23  (1 − 0,23)
u = p − u1− /2  = 0,23 − 1,96  = 0,189
n 400
Die relative Häufigkeit an Nichtwählenden in der Grundgesamtheit wird
mit einer Wahrscheinlichkeit von 0,95 vom Intervall [0,189; 0,271] über-
deckt
Beispiel 3.2: Konfidenzintervall für die relative Häufigkeit
23 % von 10.000 zufällig ausgewählten Befragten würden gegenwärtig an
einer Wahl nicht teilnehmen (Nichtwählende)
Der Punktschätzer für : p = 0,23.
Konfidenzintervall zur Überdeckungswahrscheinlichkeit 1− = 0,95 nach
(16)::
p  (1 − p) 0,23  (1 − 0,23)
o = p + u1− /2  = 0,23 + 1,96  = 0,238
n 10.000
p  (1 − p) 0,23  (1 − 0,23)
u = p − u1− /2  = 0,23 − 1,96  = 0,222
n 10.000
Erforderlicher Stichprobenumfang im Buch im Kap. 3.4 (Stoff des Kurses
Statistik II)

Das könnte Ihnen auch gefallen