Sie sind auf Seite 1von 4

Vorlesung 05

Stichprobentheorie
 In der Regel ist es nicht möglich, dass alle Elemente der Grundgesamtheit hinsichtlich
bestimmter Merkmalsausprägung untersucht werden
 Zieht man die Stichprobentheorie und die Stochastik hinzu, dann ist das auch gar nicht mehr
nötig.
 Genügen die Stichproben bestimmten Anforderungen, dann können aus ihnen valide
Schätzungen für die Population getroffen werden
 Argument aus der Stochastik: jedes theoretisch vorstellbare Ereignis hat eine
Auftretenswahrscheinlichkeit größer Null
 Die Wahrscheinlichkeit des Auftretens eines Ereignisses können wir berechnen
 Das Auftreten einiger Ereignisse ist wahrscheinlicher als Auftreten anderer Ereignisse
 Bsp. Würfelspiel „Craps“ es werden zwei Würfel geworfen und die Spieler wetten auf eine
bestimmte Kombination. Dabei ist das Auftreten bestimmter Kombinationen berechenbar:
 Angenommen wir ziehen aus einer Grundgesamtheit eine unendliche Zahl von Stichproben
und untersuchen diese auf ein bestimmtes Merkmal hin
 Wir erhalten dann für jede Stichprobe einen Mittelwert und eine Standardabweichung
 Die Mittelwerte aus der Stichprobe können in jeder Stichprobe unterschiedlich sein, streuen
aber um einen bestimmten Wert und auch diese Streuung ist normalverteilt das heißt die
Mittewerte sind sich sehr ähnlich und wir finden nur wenige Mittelwerte, die extrem
abweichen)
 Wenn wir nun von dem Stichprobenmittelwert auf den Populationsmittelwert schließen,
dann machen wir einen Fehler dies ist der Standardfehler
 Der Standardfehler ergibt sich aus der Standardabweichung der Schätzer also aus der
Standardabweichung des Stichprobenmittelwerts (der uns als Schätzer für den
Populationsmittelwert dient).

Auswahlverfahren
Stichprobenverfahren: Regeln, nach denen Erhebungseinheiten aus der Grundgesamtheit für die
Stichprobe ausgewählt werden.

Willkürliche Auswahl:

 Willkürliche Auswahl: ist niemals zufällig Bsp. hat ein Grund warum du am Anger bist daher
kein Anspruch auf Repräsentativität
 Wahlloses Ansprechen von Menschen „an der Straßenecke“
 Rekrutierung durch Zeitungsanzeigen, Flyer oder Banner auf Internetseiten

Klausurrelevant Repräsentativität: Die Stichprobe ist ein perfektes (verkleinertes) Abbild der
Grundgesamtheit

 Repräsentativität soll durch Zufallsauswahl und bewusste Auswahl erreicht werden


 Muss Repräsentativität immer angestrebt werden?
o Ja – bei Schätzungen von Populationsmerkmalen und bei Inferenzstatistischen
Verfahren
o Nein – bei experimentellen Überprüfungen eines Kausalzusammenhanges

Klausurrelevant Wahrscheinlichkeitsauswahl:
 Merkmale einer Zufallsauswahl:
o Alle Einheiten der Grundgesamtheit sind bekannt und (generell) verfügbar
o Die Chanche für jede einheit in die Grundgesamtheit in die Stichprobe zu gelangen ist
identisch, angebbar und größer Null
o Es kann sichergestellt werden, dass jede Einheit nur einmal in die Stichprobe
gelangen kann

Einfache Wahrscheinlichkeitsauswahl

 Listenauswahl:
o Es existiert eine vollständige Liste aller Einheiten der Grundgesamtheit
o Nach einer einfachen Auswahlregel („jede(r) 14te“) werden aus der Liste
Erhebungseinheiten gezogen
o Ist die Liste geordnet (Nachname, Telefonummern), dann kann dies zur Verzerrung
führen, wenn die Merkmale der Ordnung mit den Merkmalen, die untersucht
werden, korreliert ist
 Einfache Wahrscheinlichkeitsauswahl
o Lotterieauswahl / Urnenauswahl
o Random Digit Dialing (RDD) bei Telefoninterviews
 Vorteile dieser beiden Verfahren ist, dass etwaige Verzerrungen durch die
Systematik einer Liste verhindert werden?
o Gebietsauswahl (Random Route), besonders geeignet für face-to-face Interviews und
es wird keine Liste der Grundgesamtheit benötigt
 Es werden klare und praktikable Anweisungen für die Route benötigt
 Diese Anweisungen müssen unbedingt eingehalten werden, damit die
Auswahl zufällig erfolgt
 Erhebungseinheiten sind hier Wohnungen bzw. Haushalte-welche Personen
des Haushaltes soll aber nun befragt werden?
 Gebietsauswahl (Random Walk): falls in einem Haushalt mehrere Personen
leben, dann kann zur Auswahl der zu befragenden Person
der „Schwedenschlüssel" verwendet werden.
 Die Zahl in der unteren Zeile wurde dabei zufällig bestimmt

Mehrstufige Wahrscheinlichkeitsauswahl

 Beispiel: Stufe 1: aus allen Gemeinden in D werden 50 per los ausgewählt


 Stufe 2: mithilfe random route werden in jeder Gemeinde 40 Adressen ermittelt
 Stufe 3: per Schwedenschlüssel werden einzelnen Personen im (HH) Haushalt
ermittelt
 Problem: bei solchen Verfahren ist nicht immer die Voraussetzung erfüllt, dass
jedes Element der Grundgesamtheit die gleiche Chance hat, in die Stichprobe zu
gelangen.
 Bsp. Jemand, der alleine in einem ausgewählten HH lebt gelangt p=1 ins sample,
jemand der in einem 8 Personen HH lebt nur mit p=0.125
 Lösung: hier kann man reziprok zur HH-Größe gewichten, d.h. eine Person in
einem HH der Größe m erhält ein Gewicht m.
 Klumpenstichprobe: Zunächst wird zufällig eine definierte Gruppe von Individuen
ausgewählt (Erhebungseinheit) und dann werden alle Mitglieder in dieser
Gruppe untersucht
 Vorteil: realisiert einfach große Fallzahlen
 Nachteil: größere Fehlerintervalle als bei reinen Zufallsamples (die Varianz in den
Gruppen ist kleiner als die Varianz zwischen den Gruppen)
 Schichtung der Stichprobe: Ist die Varianz eines Merkmals in der
Grundgesamtheit sehr hoch, dann liefern reine Zufallsstichproben einen hohen
Fehlerintervall, weil „extreme“ Fälle unter- oder überrepräsentiert sein können
 Deswegen ist es hier sinnvoll eine Schichtung der Stichprobe durchzuführen
 Voraussetzung: die Merkmalsverteilung in der Grundgesamtheit ist (annährend)
bekannt und die Erhebungseinheiten können ex ante einer Schicht zugeordnet
werden
 Schichtung der Stichprobe: Die Erhebungseinheiten werden zunächst in
verschiedene Schichten eingeteilt und dann wird in jeder Schicht eine separate
Zufallsstichprobe gezogen
 Die Größe der Stichprobe pro Schicht kann proportional zur Größe der Schicht in
der Grundgesamtheit sein oder disproportional (die verschiedenen Stichproben
weisen die Identisch absolute Größe auf).
 Schichtung der Stichprobe: Der Vorteil disproportionaler Stichprobengrößen liegt
darin, dass die sehr hohe oder sehr geringe Merkmalsausprägungen, die nur
selten vorkommen. Trotzdem in die Gesamtstichprobe gelangen.
 Die Schätzungen von Populationswerten gelingen umso genauer, je homogener
die Merkmalsverteilungen in den einzelnen Schichten sind (geringe
Binnenvarianz in den einzelnen Schichten).

Bewusste Auswahl

 Quota Stichprobe: Es wird versucht, aufgrund bekannter Merkmalsverteilungen


in der Grundgesamtheit eine Stichprobe zu generieren, die im Bezug auf obige
Merkmale eine „perfekte Miniatur“ der jeweiligen Grundgesamtheit darstellt
 Bsp: die Stichprobe soll aus 64% Frauen bestehen, die nicht älter als 26 Jahre
sind und Abitur haben.
 Quota Stichprobe:
 Problem 1: die Auswahl der Erhebungseinheiten erfolgt nicht zufällig (Domino-
Prinzip)
 Problem 2: eine Quotierung ist nur dann sinnvoll, wenn angenommen werden
kann, dass die Quoren mit bestimmten Variablen von Interesse korreliert sind
(also zum Beispiel, dass Frauen per se eine andere Merkmalsausprägung
aufweisen als Männer)
 Schneeballverfahren: Eignet sich dann, wenn es keine Listen oder sonstige Infos
über die Zielpopulation gibt
 Ein Mitglied der Zielpopulation wird identifiziert und gebeten, ein weiteres
Mitglied der Zielpopulation einzuladen usw.
 Problem: es handelt sich nicht mehr um eine Zufallsauswahl!
 Fazit: falls die erhobenen Daten mit inferenzstatistischen Verfahren ausgewertet
werden sollen, ist eine „echte“ Zufallswahl unerlässlich
 Doch selbst wenn das sample zufällig gebildet wurde, entstehen Probleme falls
die Erhebungseinheiten nicht erhoben werden können:
o Zielpersonen werden nicht angetroffen (neutrale Ausfälle) reduziert
Samplegröße und erhöht damit den Stichproben-/Standardfehler
o Zielpersonen verweigern die Beantwortung der Frage komplett (unit-
nonresponse) oder teilweise (item-nonresponse); Verzerrung der
Ergebnisse möglich, wenn es ein Merkmal gibt, das allen VerweigerInnen
gemein ist.
 Fazit: für Web-Umfragen: momentan ist eine Stichprobenziehung für eine
allgemeine Bevölkerungsumfrage (noch) nicht möglich (es gibt keine
personalisierte Liste von Internetnutzern mit eindeutiger ID)
 Bei Spezialpopulationen wie (z.B. Studierenden) für die komplette Listen
vorliegen (Uni-E-Mailadressen) kann eine Zufallsauswahl nach Prinzip des Listen-
oder Urnenmodells erfolgen

Das könnte Ihnen auch gefallen