SHE Kap5

7a4 4 Konzeptspezifikation, operationatisierung und Messung
-
Messverfahren in den sozialwissenschaften werden sehr
häuflg von Vertretern 5 Forschungsdesign und Untersuchungsformen
,,qualitativersozialforschung"kritisiert,vgl.z.B.Bnncnn(1985),crCoUnU(1974),(vgl'
LoHAUS (1983). Bei der nereption der Ititiken werden die vorhandenen Repliken Das Ziel sozialwissenschaftlicher Arbeit besteht in der Erklärung bzw. Prognose von
z. B. Mensu L982253-59,StxignrSe-el) häufig

übersehen(2. B. von Bnnorn 1985:203)' sozialen Ereignissen. Das bedeutet, dass sich die empirische Arbeit des Wissenschaft-
Ein Teil dieser Kritiken (insbesondere bei Bnncnn)
beruht auf groben Missverständnis- lers im Wesentlichen auf die Überprüfung von Hypothesen bzw. Theorien konzentriert.
setzt eine fundierte Kenntnis Dieser Nachweis von theoretisch vermuteten Zusammenhängen erfolgt auf der Ebe-
sen: Die Kritik sozialwissenschaftlicher Messverfahren
der verfahren voraus, die nicht allein durch die
Lektüre allgemeiner Einftihrungswerke ne von beobachtbaren Indikatoren. Dabei müssen eine Reihe von Entscheidungen
erworben werden kann. darüber getroffen werden, wann, wo, wie und wie oft die empirischen Indikatoren
der Rasch-Modellierung an welchen Objekten erfasst werden sollen. Die Gesamtheit dieser Entscheidungen
Didaktisch gelungene Einführungen in modernevarianten
nnn Kaup (2008)' ROSr bezeichnet man als Untersuchungsanordnung oder ,,Forschungsdesign". Der (logische)
und die probabilistische Testtheorie bieten Dn GnutJtnn/vew
wie
(2004) und vor allem Ero/scHMIDr (2014). Die klassischen Skalierungsverfahren Aufbau des Forschungsdesigns ist entscheidend für den Grad an Gewissheit, mit dem
Lehrbüchern kaum beschrieben' die Frage nach dem Zusammenhang zwischen zwei Ereignissen (Ursache und Wirkung;
z. B. Guttman oder Thurstone werden in modernen
von DAwns (1977) und SHTL (1982) unabhängige und abhängige Variable) beantwortet werden kann.
Interessierte seien auf die hervorragenden Bücher
enthalten' Gele-
verwiesen, die eine korrekte Darstellung dieser skalierungsverfahren Bei der konkreten Ausarbeitung eines Untersuchungsdesigns besteht das Ziel dar-
eingesetzt um hochdi-
gentlich werden neben der Faktorenanalyse andere Verfahren in, möglichst viele alternative Erklärungen durch die Wahl des Designs auszuschließen.
Hierzu gehören die varian- Für jedes Phänomen, und ftir alle diesbezüglich gesammelten Daten, gibt es nicht nur
mensionale Daten auf wenige Dimensionen zu reduzieren.
ten der multidimensionalen Skalierung, vgl' hierzu Kapitel9'5'10' die vom Forschervermutete Erklärung, sondern darüber hinaus unendlich viele weitere
Implikationen und der Erklärungsmöglichkeiten. Mit der Realisierung der gewählten Untersuchungsanord-
Eine vorzügliche Darstellung wissenschaftstheoretischer
gibt EssER (1984a). nung werden jedoch bestimmte alternative Erklärungen geprüft und gegebenenfalls
statistischen Behandlung von ,,Messfehlern" bei der Datenerhebung
bei der untersuchung von
weitaus technischer in Bezug auf statistische verfahren ausgeschlossen,
Reliabilität und validität ist die Arbeit von Zrr-lnR/cnnivrtnrs (r9go) sowie Prose'- Beispielsweise verschreibt ein Arzt allen Patienten, die ihn innerhalb eines be-
(1991). Eine ausftihrliche Diskussion von Reliabilitätsschätzungen
für stimmten Zeitraums aufsuchen und über Müdigkeit und Niedergeschlagenheit klagen,
zun/Sclrunrxrn
(2007)'
Instrumente in Befragungen bietet AlwIt.t ohne nähere Untersuchung ein Vitaminpräparat. Bei einer nach vier Wochen erfolgten
Eine ausführliche und leicht verständliche Einführung
in die Konstruktion von Nachuntersuchung stellt er fest, dass sich die Patienten besser fühlen. Er folgert daraus,
zahlreiche existierende Skalen
skalen findet sich bei DnVrllls (2)L7),Hinweise auf dass die Vitamineinnahme einen positiven Effekt bei Müdigkeit und Niedergeschla-
von Mll'lnn/salxlrqo (2002)'
finden sich in dem eigentümlichen, aber hilfreichen Buch genheit hat. Es stellt sich die Frage, ob seine Vorgehensweise ihn zu diesem Schluss
und Epidemiologie finden
Entsprechende Skalen aus dem Bereich der Sozialmedizin berechtigt. Dies ist nicht der Fall, denn neben der Vitamineinnahme können auch an-
sich bei Aoav/ConNulrus (2006). dere Faktoren das Wohlbefinden gesteigert haben. Etwa: mehr Bewegung, andere Kost,
(1984c) diskutieren Frobleme des
Die Arbeiten von Blelocr (1982) und DuNCeu Wetterbesserung, der pure Glauben der Patienten an das Präparat, das fürsorgliche
Messens in den Sozialwissenschaften unter anderen
Gesichtspunkten als die axiomati Gespräch mit dem Arzt. Um die Glaubwürdigkeit dieser alternativen Erklärungen zu
sche Messtheorie. Die beiden genannten Arbeiten
stellen höchst wichtige Vorarbeiten entkräften, hätte der Arzt eine Reihe von Vorkehrungen treffen müssen, so z. B. einem
den Sozialwissenschaften dar'
für die notwendige Verbesserung der Messverfahren in Teil der Patienten ein Placebo verabreichen, Veränderungen im Essverhalten und in
Arbeiten bei einer Beschäfti'
Zusammen mit dem Buch von Mlcnnll (1999) sind diese den körperlichen Aktivitäten erfassen usw. Es wäre also ein Design zu entwickeln
gewesen, das den Ausschluss alternativer Erklärungen erlaubt.
gungmitFragendesMessensindenSozialwissenschaftenunverzichtbar.
Ganz allgemein kann man Untersuchungsanordnungen, die der Überprüfung von
Hypothesen dienen, Experimente nennen. Die Verwendung des Begriffs,,Experiment"
nimmt somit keinen Bezug auf den Ort (Labor oder Alltagsumgebung bzw. Feld) oder die
Art der Datenerhebung (2. B. Beobachtung, Intervieq Gruppendiskussion). Ein Experi
ment ist also keineswegs an ein ,,Labo{', an ,,Versuchspersonen" und ,,Versuchsleiter"
gebunden, sondern kann auch eine Umfrage mit 1500 Befragten sein. Die vorläufi-
--1r
186r 5 Forschungsdesign und Untersuchungsformen 5 Forschungsdesign und Untersuchungsformen 787
- -
bestimmter
ge weite Definition des Begriffs ,,Experiment" wird daher später anhand gemessenen Durchschnittswert der Neigung zu aggressivem Verhalten mit einem
Kriterien zu spezifizieren sein (vgl, Kapitel5'4'i)' unbekannten Vorherwert vergleichen. Da dieser Wert iedoch nicht für die Ver-
in unterschiedli-
An einem Beispiel soll im Folgenden gezeigtwerden' dass Designs suchspersonen vor der Einwirkung von X gemessen wurde, muss man sich einen
geeignet sind, Vermutet man zum Beispiel anderen Bezugspunkt für den Vergleich mit dem Nachherwert suchen. Ein solcher
chem Maße zur Beurteilung von Hypothesen
Filmen einer bestimmten Gattung kann günstigstenfalls aus einer anderen Untersuchung bekannt sein, häufig muss
einen Zusammenhang zwischen dem Konsum von
(z.B.Kriegs-,Kung.Fu-'pornographischeFilme)undderTendenzzuaggressivem jedoch auf zweifelhaftere Quellen zurückgegriffen werden; auf Alltagswissen, auf
so könnte man sich zur Prüfung der Hypothese verschiedener
untersu' ,,allgemein Bekanntes" (ClruperLL/STANLEy L963tL77), Wie die Verhältnisse in der
Verhalten,
chungsanordnungen bedienen:1 Praxis auch immer sein mögen: Liegt der gemessene Wert,,signifikant"x über dem
l.Mankannz.B.einerGruppevon(Versuchs.)Personen(Vpbzw.Vpn)Filmevorfiih. herangezogenen Vergleichswert, so könnte daraus der Schluss gezogen werden,
ren2 und danach die Neigung zu aggressivem Verhalten mit
Hilfe einer Reihe von dass X die Neigung zu aggressivem Verhalten erhöht.
so dargestellt 2. Es wäre auch möglich, zwei Gruppen von Personen zu bilden, die nach dem Zufalls-
Fragen messen.3 Eine solche Versuchsanordnung kann schematisch
werden: prinzip einer Experimentalgruppe und einer Kontrollgruppe zugeordnet werden.
Diese zufällige Zuweisung zu den Gruppen wird auch ,,Randomisierung" (R) ge-
nannt.
XO
tr tr
R:OXO Experi me ntatgrup pe
Abb.5.1: Design einer einmaligen Messung R:OO Kontrollgruppe
tr tz t3
(auch Treatment,
Dabei steht X für das Einwirken des experimentellen Stimulus Abb. 5.2: Design einerVorher-Nachher-Messung mit Kontroltgruppe
(von
Treatmentfaktor oder unabhängige Variable genannt) und O ,,Observation")
der möglichen Wirkung von X (die abhängige Variable)' Im Beispiel
für die Messung
Verhalten In beiden Gruppen wird vor der folgenden experimentellen Manipulation (Setzung
ist das Betrachten der Filme der Stimulus und beobachtetes aggressives
des Treatments) die Neigung zu aggressivem Verhalten gemessen. Diese erste
die abhängige Variable.
Vergleiche Messung wird allgemein als ,,Pretest" oder Vorhermessung bezeichnet. Danach
Zur Überprüfung der Hypothese müsste man nunmehr verschiedene
werden nur der Experimentalgruppe (Kriegs-, Kung-Fu- oder pornographische)
vornehmen. Bei dem Design mit einmaliger Messung müsste man im Prinzip
den
Filme gezeigt, worauf dann eine erneute aweite Messung der abhängigen Variable
(in beiden Gruppen) erfolgt. Diese wird zumeist ,,Posttest" oder Nachhermessung
r fir*ntspre"t endes Experiment wurde z. B. von Esnnln/Gnossuawn (197s) durchgeftihrt, eine ent' genannt.
(1981). Der Forschungsstand auf diesem Gebiet wird
sprechende wiederholungsbefiagung von Kruns Das Design der Vorher-Nachher-Messung mit Kontrollgruppe verbessert im Ver-
von FnncusoH/KTLBURN (2009) z;sammengefasst. In Hinsicht auf ähnliche Probleme mit Videospielen
gleich zur einmaligen Messung die Beurteilungssituation deutlich. Da sowohl ein
siehe Celvnnt u .a. (2017)'
gesehen" aus' Vorher- als auch ein Nachherwert existiert, ist ein direkter Vergleich fi.ir die Expe-
2 Wir gehen hier von einer (vereinfachenden) Dichotomie ,,Film gesehen/Film nicht
Erweiterungen ban Verfeinerungen dieser Vorgehensweise sind in der Fotschungspraxis die Regel' So rimentalgruppe möglich. Wenn das Treatment die vermutete Wirkung besitzt, so
Anzahl von
könnte man z. B. mehrere Experimentalgruppen bilden, die ieweils einer unterschiedlichen muss der zweite Messwert deutlich über dem ersten liegen. Zusätzliche Sicherheit
(z' B' sehr
Filmen ,,ausgesetzt" werden oder die ieweils Filmen unterschiedlicher Darstellungsintensität gewinnt dieser Vergleich durch die Messungen in der Kontrollgruppe, die während
Experimente' bei denen
brutale und weniger brutale) betrachten, Von besonderer Bedeutung sind des Experiments bis auf den Filmkonsum den gleichen Bedingungen ausgesetzt
Faktoren experimentell variiert
alle mathematisch möglichen Kombinationen der zu untersuchenden war wie die Experimentalgruppe. Wenn in der Experimentalgruppe eine klare
Die Literatur zum Design
werden. Solche Studien werden als ,,vollfaktotielle" Experimente bezeichnet'
oder ,,experimental design"'
von Experimenten ftndet man unter den stichworten ,yefsuchsplanung"
(2018)'
vgt. z. s. MASoN/HEss (2003), MoNrcounnv (2013) und Maxwrlr,/Drlenov/Ku.r.nv
3 Für die Aussagekraft einer solchen untersuchung sind die hier nicht weiter präzisiefte Definidon und I Der Vergleich solcher Durchschnittswerte wird üblicherweise mit Hilfe statistischer Signifikanz-
Operationalisierung der Aggressivität von zentlaler Bedeutung' Je nach den verwen!.etei,lf::::Tl tests (vgl. Kapitel 9.4,2) durchgeführt. Etwas vereinfachend gesagt, geben diese Verfahren Aufschluss
u' o'r
aggressive Handlungen dartiber, ob die Differenzen der
ieweiligen Stichprobenkennwerte (Statistiken) durch reinen Zufall
ken (ltembatterie, physiologische Erregungsmessung, direkt beobachtete
zustandegekommen
sind ggf. unterschiedliche Ergebnisse möglich. sein können oder nicht,
5.1 ProblemederÜberprüfungkausalerAussagen 189
188 5 Forschungsdesign und Untersuchungsformen
- -
Messwerterhöhung vorliegt, kann mit großer Sicherheit auf eine Wirkung von X
5.1 Probleme der Überprüfung kausaler Aussagen
geschlossen werden.
Wissenschaftler sind vor allem an Aussagen über Kausalbeziehungen interessiert, also
3. Man befragt eine (hinreichend) großeZahlzufällig ausgewählter Personen hinsicht'
an Beziehungen zwischen ,,Ursachen" und ihren ,JA/irkungen".1 In der Forschungspra-
lich ihres l(onsums von bestimmten Filmen und misst in der gleichen Befragung
xis wird eine Beziehung zwischen einer ,,Ursache" und ihrer ,,Wirkung" in der Regel
ihre Neigung zu aggressivem Verhalten und hofft, dass sich bei entsprechender
dann als ,,kausal" interpretiert, wenn eine Reihe von Kriterien erfüllt sind (Hn l 1965):
Analyse der Daten die Befragten dann nachträglich (ex post) in mindestens zwei
Gruppen einteilen lassen: Personen, die häuflg die entsprechenden Filme sehen, -
Der Zusammenhang sollte stark sein,
und Personen, die dies selten (oder nie) tun. Erstere könnten dann als Experimen' -
sich in unterschiedlichen Untersuchungskontexten an unterschiedlichen Popula-
tionen zeigen,
talgruppe und die letzteren als Kontrollgruppe dienen:
- die Ursache sollte zu einer spezifischen Wirkung führen,
- die Ursache sollte der Wirkung zeitlich vorausgehen,
XO Experi mentaIgruP Pe
- ein plausibler Mechanismus, der dem Kausalzusammenhang zugrunde liegt, sollte
o Kontrotlgruppe
angebbar sein,
tr tr
(gemeinsam zu t1 gemessen) - zwischen Ursache und Wirkung sollte im Regelfall eine monotone Funktion (,,je
mehr-desto") bestehen.
Abb. 5.3: Survey-Design
Der Nachweis kausaler Beziehungen ist keineswegs trivial.2
Bei einem einfachen Experiment wird ein Objekt einem besonderen Treatment
Das Symbol (X) steht auch hier für den Stimulus, der jedoch bei dieser Vorgehens- unterzogen, der vermuteten Ursache. Möglicherweise zeigt ein Obiekt die erwartete
weise nicht vom Forscher gezielt gesetzt wird und somit auch nicht kontrolliert Reaktion. Leider kann nun nicht daraus geschlossen werden, dass die vermutete Ur-
werden kann, sondern bereits ohne das Zutun des Forschers bei den Befragten sache tatsächlich die Ursache für das beobachtete Verhalten war: Die Reaktion hätte
und ihren Lebensgewohnheiten vorliegt. vielleicht auch dann stattgefunden, wenn die vermutete Ursache nicht vorhanden ge-
Bei dieser Versuchsanordnung liegen die Verhältnisse wiederum ungünstiger, wesen wäre.3 Das zentrale Problem der Prüfung kausaler Aussagen besteht darin, dass
als bei der Anordnung mit Vorher-Nachher-Messung plus Kontrollgruppe. Denn dasselbe Objekt nicht der vermuteten Ursache ausgesetzt und zugleich nicht ausgesetzt
auch hier fehlt (wie bei der einmaligen Messung) eine explizite erste Messung werden kann. So kann sich das Objekt allein durch den Test (oder auch durch den
vor der Manipulation durch X. Jedoch existiert hier eine Kontrollgruppe, deren Nicht-Test) verändern, es kann reifen etc. Dieses Problem ist nur durch die Akzeptanz
Durchschnittswert niedriger sein müsste als der der Experimentalgruppe' Dies nur teilweise prüfbarer theoretischer Annahmen lösbar.
gilt jedoch nur, wenn sich tatsächlich nachträglich zwei Gruppen bilden lassen' In der Folge der Arbeit der Statistiker Donald B. RUsIN und Paul W. Hor,lawn ist
Eine Schwäche dieses Designs liegt nun darin, dass sich die beiden nachträglich daher die Interpretation eines kausalen Effekts als Interventionseffekt üblich. Hierbei
gebildeten Gruppen auch schon vor einer ersten Messung unterschieden haben wird in einem randomisierten Experiment die Differenz zwischen den Mittelwerten einer
könnten. Dadurch ist auch hier (trotz einer vergleichsgruppe) der forschungsprak' gemessenen Variablen für Objekte, die der vermuteten Ursache ausgesetzt wurden,
tische Schluss auf die Wirksamkeit von X bei unterschiedlichen Mittelwertenz$tar und Objekten, die der vermuteten Ursache nicht ausgesetzt wurden, als kausaler Effekt
möglich, aber wie im Design der einmaligen Messung nicht sehr sicher. interpretiert. Verglichen wird also für eine interessierende Variable die Differenz des
beur'
Allen drei Designs ist das Bemühen gemeinsam, eine vorliegende Hypothese zu
Grund hierfiir
teilen. Sie erlauben ein Urteil jedoch nicht mit gleicher Sicherheit. Der I Auf MACKIE (1980:52) geht die Definition einer Ursache als lNUS-Bedingung zurück. Eine Ursache ist
Treat'
liegt in ihrer unterschiedlichen Anfälligkeit f](1r ,,Störfaktoren", die neben dem demnach eine ,,(...) Insufrcient but Non-redundant part of an Unnecessary but Sufrcient condition'
Variablen (Hervorhebungen
ment ebenfalls für eine Veränderung der Ausprägungen in der abhängigen durch die Autoren). Eine Ursache ist also einzeln nicht hinreichend, aber notwendiger
zu können' Tell einer nicht notwendigen,
verantwortlich sein können. Um die Effekte solcher Störfaktoren beurteilen aber hinreichenden Bedingung eines Ereignisses,
erläutert 2 Zur neueren Kausalitätsdiskussion in der philosophie vgl, pn,lnr, (2000) und SALMoN (1998).
müssen zuvor die prinzipiellen Probleme der Überprüfung kausaler Aussagen
3 Dieser Sachverhalt wird in
der Literatur als Problem ,,kontrafaktischer" Situationen (,,counterfac-
werden, tuals") bezeichnet.
Ohne zusätzliche Annahmen (siehe weiter unten im Text) können über kontrafakti-
sche Zustände
keine sinnvollen Aussagen gemacht werden.
190 5 Forschungsdesign und Untersuchungsformen 5.2 Störfaktoren 797
- -
dem weitgehend ausgeschlossen werden können. CeiupsrLL/STANLEy (1963) benennen in
Mittelwerts zwischen versuchs- und Kontrollgruppe. Diese Differenz entspricht
kausalen Effekt der vermuteten Ursache.l ihrer klassischen Übersicht unter anderem folgende Störfaktoren:
Diese Interpretation der Mittelwertdifferenz als die Größe des kausalen
Effekts ist - Zwßchenzeitliches Geschehen (,,history", Zeiteinflüsse): Hierunter sind alle Er-
nur dann gültig, wenn eine theoretische Annahme über die potentiellen Ergebnisse eignisse zu subsumieren, die zusätzlich zum Stimulus die abhängige Variable
Diese Annahme beeinflussen können. So wäre es im genannten Beispiel denkbar, dass zwischen
eines Experiments für alle Untersuchungsobiekte empirisch erfüllt ist'
wird als ,,SIJTVA" bezeichnet. SUTVA sieht für ,,stable unit treatment value assumption"' Pre- und Posttest (bzw. vor der einzigen Messung) die Versuchspersonen von ei-
zentralfür suTVA ist die Annahme, dass für jedes untersuchungsobjekt die potentielle nem besonders abscheulichen Verbrechen (2. B. Kindesmord) Kenntnis erlangen
Reaktion auf das Treatment bzw. die potentielle Reaktion auf das Nicht-Treatment und dieses Ereignis - und eben nicht die unabhängige Variable - die Tendenz zu
nicht davon abhängt, dass andere untersuchungsobjekte dem Treatment ausgesetzt aggressivem Handeln erhöht.
bzw. nicht ausgesetzt werden. Für Individuen bedeutet dies z' B', dass
das potentielle - Reifungsprozesse der Probanden (,,maturation" bzw.,,decay", biologisch-psycho-
Ergebnis eines Experiments fiir eine Person nicht davon abhängen darf, ob sie oder logische Veränderungen): Die Yafianz in der abhängigen Variablen wird durch
eine andere Person zur Versuchs' oder Kontrollgruppe gehört' ,,intrapersonale" Prozesse bedingt, also nicht durch die Einwirkung des Stimulus.
Durch die Zufallszuweisung (Randomisierung) von Untersuchungseinheiten zur So könnten die Versuchspersonen z. B. nicht nur aufgrund der Filme aggressiver
Treatment- und Nicht-Treatmentgruppe lassen sich Hypothesen über kausale Zusam' werden, sondern auch, weil sie während des Experiments hungrig oder müde
der Wis' werden und die entsprechenden Bedürfnisse nicht beftiedigen können. Oder aber
menhänge am einfachsten überprüfen. In nicht'experimentellen Bereichen
mangels Randomisierung selten es kann, wenn relativ lange Zeitabstände zwischen den Messungen liegen, durch
senschaft können die Annahmen echter Experimente
sind aber ,,normale" biologisch-psychologische Reifung eine Anderung der Messwerte er-
als gegeben angenommen werden. Ein Teil der Implikationen der Annahmen
zumeist empirisch prüfbar.2 folgen. Diese sind besonders bei Untersuchungen von Kindern und Jugendlichen
Eine derwichtigsten Aufgaben des Forschungsdesigns besteht darin' die Gültigkeit möglich, jedoch auch bei Erwachsenen keineswegs auszuschließen.
deTSUTVA-Annahme und dieAbwesenheitvon Störfaktoren entweder durch das
Design - Messeffekte (,,testing", Testen); Die Veränderungen werden als Auswirkung des
herzustellen oder soweit wie möglich zu überprüfen. Dazu gehört in der Forschungs' ersten Messvorgangs auf den zweiten erzeugt. In unserem Beispiel ist dieser Effekt
praxis vor allem die Identifikation und Kontrolle von Störfaktoren des Experiments. weniger wahrscheinlich, jedoch sind derartige Auswirkungen bei kognitiven Tests
häufig zu erwarten. Wird zum Beispiel in einem Experiment die Wirkung einer
Variablen auf den Intelligenzquotienten (lQ) von Versuchspersonen ermittelt und
5.2 Störfaktoren dabei die Intelligenz in Pretest und Posttest mit dem gleichen IQ-Test gemessen, so
können die Probanden aus dem ersten Messvorgang lernen. Sie denken über die
Die mit Hilfe der vorgestellten Designs gemessene (oder im Fall des Designs mit
einma' Richtigkeit der gegebenen Antworten nach, merken sich richtige Lösungen und
Iiger Messung eher erschlossene) Differenz der Messwerte muss nicht zwangsläufig verbessern so ihr Resultat bei der zweiten Messung - unabhängig vom Stimulus.
durch die unabhängige Variable verursacht worden sein. Es gibt eine Reihe von
Stör' - Hilfsmittel (,,instrumentation", Veränderung im Messinstrument): Durch die Ver-
bilden
faktoren, die u. U. ebenso für die Unterschiede verantwortlich sein können' Sie wendung von unterschiedlichen Messinstrumenten, z. B. geänderte Tests, anders
in diesem Sinne alternative Erklärungshypothesen für die Veränderung in der
Aus' formulierte Fragen, ungleiche Antwortvorgaben usw., sowie variierende,,Hilfsmit-
prägung der abhängigen Variablen. Die Güte eines Designs bemisst sich nun daran, tel", etwa verschiedene Versuchsleiter, Beobachter oder Interviewer, können Effek-
inwieweit solche Alternativerklärungen bzw. der Einfluss von Störfaktoren möglichst te auf die abhängige Variable möglich werden, die nicht durch die unabhängige
Variable bedingt sind. So könnte etwa das betont arrogante oder devote Verhalten
eines Versuchsleiters die Aggressivität der Versuchspersonen steigern oder mildern.
ru dieset Konzeption finden sich bei RosrxseuM (2017) und PEAtr/Glvrvroun/Jnwsl'l' In der sozialwissenschaftlichen Forschung sind eine Reihe solcher Effekte bekannt.
ffir"111.it"n
(2016). So haben Versuchsleiter, aber auch Interviewer, Vercoder, Beobachter etc. (vgl.
2 Der tatsächliche Beweis kausaler Beziehungen ist daher nahezu unmöglich' Dies bedeutet aber nicht' Kapitel7.1.1.5) bestimmte Erwartungen (2. B. Hypothesenbestätigung) bezüglich
mtissen: Das SUTVA-
dass Sozialwissenschaftler das Ziel der Gewinnung kausaler Aussagen aufgeben des Ergebnisses einer Untersuchung. Diese Erwartungen können dazu führen,
größere Bescheidenheit in Hinsicht
auf
Problem und mögliche Effekte von Störfaktoren legen aber eine
Verlässlichkeit interventionistischer
die Geltung von Hypothesen und insbesondere in Hinsicht auf die
sozialwissenschaften
Empfehlungen nahe, als es insbesondere in den angewandten Bereichen der
üblich ist.
5.2 Störfaktoren 193
- -
durch Gestik, Mimik oder Wortwahl die Die aufgezeigten Faktoren werden allgemein im Anschluss an CRupgrr,r./Srnxluv als
dass Versuchsleiter nicht willentlich z. B.
die unabhängige Variable beeinflussen.l Beeinflussungsfaktoren der ,,internenValidität" bezeichnet (auch interne Gültigkeit
Versuchspersonen in ihrer Reaktion auf
genannt).l lnterne Gi.iltigkeit ist dann gegeben, wenn das Treatment tatsächlich für
- Verzerrte Auswahlen',nd,Ausfätle (,,selection", ,,mortality"): Wenn sich die Experi-
die Variation der abhängigen Variable verantwortlich ist. Entsteht hingegen die Ver-
mental- und die Kontrollgruppe nicht nur hinsichtlich des Stimulus unterscheiden,
änderung der Messwerte durch einen oder mehrere Störfaktoren, dann ist die interne
sondern sich auch im Hinblick auf andere Merkmale, die ebenfalls Einfluss auf die
Gültigkeit verletzt. Sind sowohl Störfaktoren als auch der Stimulus verantwortlich, so
abhängige Variable ausüben, heterogen zusammensetzen, so sind hierdurch Diffe-
spricht man von einet ,,Konfundierung" der Effekte. Auch dann ist selbstverständlich
renzen zwischen Pre- und Posttest möglich. Sollten etwa in der Experimentalgrup'
pe deutlich mehr Männer vertreten sein, welche aggressives Verhalten als adäquate
die interne Gültigkeit nicht gegeben.2
An die Frage nach der internen Validität schließt sich die zweite Frage nach der
Reaktionsform während der Sozialisation erlernt haben, als in der Kontrollgrup-
pe, so könnte die Differenz zwischen beiden Gruppen auf die unterschiedliche ,dußeren Validittit" (auch externe oder ökologische Validität bzw. bei mangelnder
Erziehung zurückgeführt werden. Neben solchen ,,verzefrten" Auswahlen können
Gültigkeit auch externer Fehler genannt) an.3 Diese ist definiert als Möglichkeit der
Generalisierung der experimentellen Resultate auf andere Personen(-gruppen) und
Ausfälle die Resultate des Experiments beeinflussen. Solche Ausfälle entstehen
durch Personen, die nur am Pretest teilnehmen und danach für den Posttest nicht Situationen. Externe Validität liegt bei einem Design demzufolge vor, wenn die er-
mehr zur Verfügung stehen. Ausfalleffekte sind dann möglich, wenn die Ausfälle mittelten Ergebnisse auf andere Personen in anderen Kontexten übertragen werden
nicht zufällig zustande kommen, sondern systematisch.2 Dies wäre etwa dann der können.
Diese Möglichkeit der Generalisierung auf andere Personen und Kontexte kann
Fall, wenn Personen mit besonders geringer Neigung zu aggressivem Verhalten
von der Brutalität der gezeigten Filme so angewidert sind, dass sie den Versuch ebenfalls durch verschiedene Störfaktoren beeinträchtigt werden. Zwei dieser Störfak-
abbrechen und somit nicht mehr am Posttest teilnehmen.3 Daduich würde sich toren sollen hier genannt werden:
der Mittelwert der Experimentalgruppe erhöhen.
l. Reaktivitdt oder reaktive Effekte des Messens: Durch die Durchfiihrung des Pre-
tests kann die Empfänglichkeit der Versuchspersonen ftir den Stimulus angeregt
- ,,regtessionto the mean": Bei wiederholten Messungen können zufällige Messfehler
werden. Durch diese Sensibilisierung wird dann der Einfluss des Stimulus zusätz-
fälschlich den Eindruck tatsächlicher Veränderungen hervorrufen. Bei mit Messfeh'
lern behafteten Messungen liegen insbesondere Obiekte mit auffällig großen oder lich verstärkt oder verringert. Bei einer Anordnung mit Vorher-Nachher-Messung
kleinen Messwerten mathematisch notwendigerweise bei Messwiederholungen und Kontrollgruppe kann durch den Pretest die Intensität des Filmbetrachtens
gesteigert und damit die Auswirkung von X im Vergleich zu nicht-experirnentellen
eher näher am Mittelwert aller Messungen. Dieses Problem wird als ,,regression
to the mean" (RTM) bezeichnet.a Vor allem bei Studien, die nur bei der ersten Situationen erhöht werden. Die Ergebnisse wären dann nur aufGruppen übertrag-
Messung besonders auffällige Objekte wiederholt untersuchen, liegen falsche bar, die vorher an einem entsprechenden Pretest teilgenommen haben.
Schlussfolgerungen über scheinbare Veränderungen allein durch RTM nahe. Ent- 2, Reaktive Effekte der experimentellen Situation (,,effects of experimental arrange-
sprechend häufrg flnden sich solche Artefakte bei Interventionsstudien, bei denen
ments"): Die experimentelle Situation kann gravierend von ,,der" Alltagssituation
Maßnahmen aufgrund auffälliger Messungen ergriffen wurden (2. B. hoher Blut- abweichen, wodurch zwar intern gültige Effekte nachweisbar sind, die aber unter
druck, Verhaltensauffälligkeiten bei Jugendlichen, besonders gute oder schlechte Umständen im Alltagskontext ausbleiben. Wird etwa die Überprüfung der Film-
Aggressivitäts-Hypothese in einem Universitätsinstitut durchgeführt, so kann es
Klausuren etc.).
ffil vutoität (sowie die noch darzustellende externe validität) ist von der Konstrukt-, Inhalts- und
Kriteriumsvalidität (vgl, Kapitel 4) deutlich zu trennen. Letztere beziehen sich aufdie exakte Messung
einem bzw Operationalisierung der abhängigen und der unabhängigen Variablen.
ffi*l.t rige Bereich der experimentellen und nicht-experimentellen Fotschung ist zu
vgl. Kapitel 7'1'1'5- 2 Eine präzise Diskussion verschiedener Formen und Bedeutungen des Wortes ,,confounding" findet
eigenständigen Forschungsgebiet geworden, der sogenannten ,,Artefaktforschung",
der universi' sich bei cREENLauo/MoncnusrERN (2001).
2 In der Medizin nennt man diesen Effekt,,suwivor bias", Ein naheliegendes Beispiel aus
den Teilnehmern 3 Coox/Cnrunrnr,r, (1976) erweiterten die ursprtingliche Konzeption von interner und externer Validität,
tät: Die Vorlesungsteilnehmer am Ende eines Semesters sind keine Zufallsauswahl aus
indem sie zusätzlich die statistische Schlussfolgerungsvalidität und die Konstruktvalidität speztftzier-
der ersten Sitzung.
ten. Beide Fassungen sind nicht ohne Kritik geblieben (Geurl.Iwr 1976; Knuclausrr/Knov
1976); sie
3 Zur Auswahl von Versuchspersonen sowie zu Ausfällen vgl, ausftihrlich Kapitel 6.
Beurtei' tangieren
iedoch die Pragmatik der experimentellen Forschung kaum (Srnonnr 1978t24-i:6; BuNcARD
4 Siehe Banunrr/van lnn Por,s/DossoN (2005); Beispiele wie RTM-Effekte durch mangelnde 1984:220.
lerübereinstimmung bei det Veröffentlichung von Artikeln findet man bei Bland/Altman (1994)'
5 Forschungsdesign und Untersuchungsformen 5.3 Techniken der Kontrolte von Störfaktoren 795
7g4
- -
Tab. 5.1: Liste möglicher Störeffekte
fraglichsein,obdieErgebnisseaufdenAlltagskontextübertragbarsind.Denn
beimFernsehkonsumimheimischenWohnzimmerspielenmöglicherweiseeine Problem
Dritter, soziale Erläuterung
ganze Reihe weiterer Variablen (Aufmerksamkeit, Anwesenheit
etc.) eine Rolle, die in einem Labor vielleicht nicht berücksichtigt Unangemessene 0perationalisierung Unangemessene Messun g der Variabten
xmosphäre
einen,,Aufforderungs-
wurden. Häuflg spricht man det experimentellen situation Mono-Method-Bias
überlegen, Ursache und Wirkung auf die gteiche Art gemessen
(,,demand characteristic"; ORNE 1969): Versuchspersonen
charakter" zu
mag, welchen Zweck die Untersuchung
was der Versuchsleiter von ihnen erwarten Vpn erraten Hypothese Vpn vermuten erwartetes Verhalten
nur auf den stimulus,
hat usw.l Sie definieren die situation und reagieren nichi
eigenen Situationsde'
sondern handeln immer auch vor dem Hintergrund ihrer Sozlale Wünschbarkelt Vpn versuchen einen guten Eindruck zu
produziert (But'lcenn
finition, was u. u. einen Effekt auf die abhängige variable hinterlassen
Versuchsleiter-Erwartun gen VL Erwartungen kann Zuweisung zu Kontrollgruppe
L984zLr6-123).
oder Daten verändern
(2002) erwähnen weitere Konfundierung von Konstrukten und Keine Messung verschiedener Level von
camenrr,l/sraNr,rv (1963) sowie sHlolSn/coor/cnrrnpsrll Ausprägungen der Konstrukte Ursache-Wirkungs-Zusammenhän gen
die Möglichkeit, dass
störfaktoren als die bisher genannten. Dazu gehört insbesondere
und so zusätzliche, über die reine
verschiedene störeffekte zusammenwirken können lnteraktionseffekte verschiedener Treatments Vpn erfahren mehr als ein Treatment
(,,Interaktionseffekte")
Addition der einzelnen Störeffekte hinausgehende, neue Effekte
entstehen. Die Tabelle 5.1 enthätt eine Reihe dieser Interaktionseffekte'2 lnteraktionseffekte von Treatment und Tests Sensitivierung durch den Pretest
lnteraktlonseffekte von Auswahl und Treatment Generalisierung tiber die Auswahl hinaus nicht
mögtich
5.3 Techniken der Kontrolle von Störfaktoren lnteraktionseffekte des Settlngs und des Generalisierung tiber das gegebene Setting nicht
Treatments mögtich
soweit irgend mög'
Ziel eines jeden Experiments ist es, alle genannten störfaktoren
Hierzu bedient man sich verschiedener
lich auszuschließen bzw. ztkontrollieren. Zwischenzeitliches Geschehen Externe Ereignlsse zwischen Pretest und Posttest
Parallelisierung und Rando'
Techniken: Elimination, Konstanthaltung, Matching ba,v. beeinflussen das Ergebnis
lnteraktlonseffekte des zwischenzeitlichen Generalisierung über die Zeit nicht möglich
misierung.
Geschehens mit dem Treatment
Reifung Veränderung der Vpn zwischen Pretest und
Posttest
5.3.1 Etiminatlon lnstru me ntie ru n g Veränderung der Messinstrumente zwischen
Pretest und Posttest
bei der
unter ,,Elimi nation' versteht man die Ausschaltung denkbarer Störgrößen ,,Regression to the mean" Selektion von extremen Fällen führt zu
bzw' stimulation
Durchführung des Experiments. Alle Einflüsse, die auf die Messung Veränderun gsartefakten
könnten, werden nach
der unabhängigen und abhängigen variablen störend einwirken
für das Experi'
Möglichkeit eliminiert. Da die Eliminationsmöglichkeiten in speziell
*.it t.tg.rtellten örtlichkeiten (Labors) sehr gut sind, wurde das Laborexperiment
kann hier die Setzung
häufig als ideate Vorgehensweise betrachtet. Der Versuchsleiter
(2012)' z:udenBe'
i Literatur und Beispiele finden sich bei Mccannmucn/Bnuu.t/wtrrou
.
Zlzzo (2009) und
dingungen, unter denen diese Effekte auftreten und wie sie sich auswirken, Wl'
Snenpr/Wnnrrol (2016).
sind etwas weitetgehende statisdsche
2 Für das Verständnis einiger der in det Tabelle genannten Effekte
muss daher hier auf Sneorsn/Coor/Canapnrlt'
Kenntnisse erforderlich. Für eine vertiefte Diskussion
(2002) verwiesen werden.
T
5.3 Techniken der Kontrolle von Störfaktoren 797
- -
Tab. 5.t Liste möglich er Störeffekte (Fortsetzun g) des Stimulus und die Gesamtsituation weitgehend kontrollieren, störende Einfltisse
optimal ausschalten und die aus der Theorie bzw. Hypothese abgeleiteten Untersu-
Problem Er[äuterung chungsbedingungen realisieren. In unserem Beispiel ist es so möglich, geeignete Filme
Auswahl Ursprüngliche Unterschiede zwlschen Kontrol[- auszuwählen, die Dauer der Filmbetrachtung zu steuern, Störungen durch andere
und Versuchsgruppe Personen zu verhindern, Umgebungslärm zu minimieren usw., wodurch insgesamt
Mortalität Selektiver Ausfall von VPn die Aussagekraft der experimentellen Untersuchung steigt, weil Alternativerklärungen
unwahrscheinlicher werden. Dies bedeutet jedoch nicht, dass Experimente immer
lnteraktionseffekte mit der Selektion Unterschiede zwischen Kontroll- und
im Labor stattfinden sollten. Dieses Vorgehen hat auch Nachteile (vgl. Kapitel5.4.1).
Versuchsgruppe zusammen mit anderen Effekten
(2. B. Reifung) führt zu Artefakten
Darüber hinaus ist Kontrolle und Elimination auch in Alltagssituationen möglich (s,u.).
Keine eindeutige Kausalrichtung Unmöglichkeit der kausaten Reihung bel Festzuhalten bleibt daher, dass man sich bei der Durchführung von Experimenten um
Retrospektiv- und Querschnittsstudien eine maximale Kontrolle des Stimulus und seiner Variation bemühen muss.
Diffusion des Treatments Kontrollgruppe hat Zugang zum Treatment
Kompensation des Treatments Kontrollgruppe hat Zugang zum äquivalentem

5.3.2 Konstanthaltung
Treatment
Demoralisierung der Kontrollgruppe Kontrottgruppe reagiert negativ durch den
Nicht immer können alle möglichen Störeinflüsse eliminiert werden. So kann kaum
Vergleich mit der VersuchsgrupPe
ein Versuch durchgeführt werden, ohne dass man den Versuchspersonen bestimmte
Statistische ,,Power" Zu wenig Vpn
Verhaltensinstruktionen gibt: sei es durch anwesende Versuchsleiter, über Lautspre-
Falsche Anwendung statistischer Tests Verzerrte Schätzungen oder falsch positive Tests cher, Handzettel oder sei es per ComputermonitoJ. Somit werden aber auch bestimmte
,,Nebeneffekte" bei der Setzung der unabhängigen und der Messung der abhängigen
Retiabitität der Messungen Hohes Ausmaß von Messfehlern in den Variablen erzeugt - z. B. durch die Qualität der Sitzposition bei der Filmbetrachtung,
nstrumenten
I
die Form des Messinstrumentes (Fragebogen), das Anlegen von Elektroden oder die
Zuvertässigkeit der Treatmentimplementierun g z. B. Patienten kooperieren nlcht bei einerTherapie
Verabreichung von Medikamenten.,,Konstanthalfung" bedeutet nun, solche (mitunter
unvermeidlichen) Einflüsse in beiden Gruppen möglichst gleichartig wirken zu lassen,
Heterogenität der Vpn Unterschiedliches Ausmaß der Zufatlsvariabitität
derVpn kann Effekte Produzleren d. h. die Versuchsbedingungen ftir beide Gruppen bis auf das Treatment maximal anzu-
Unterschiedliches Ausmaß der Fehler anderer gleichen. Im Beispiel wird man also auch der Kontrollgruppe Filmevorftihren, iedoch
Zufallsstreuung anderer Variablen als die des
Treatments Variablen des Settings kann Effekte produzieren natürlich keine einschlägigen Kung-Fu-, Kriegs- oder pornographischen Filme, deren
Auswirkungen ja Gegenstand der Untersuchung sind.
5.3.3 Techniken zur Bildung von Kontrollgruppen
Die Bildung von Kontrollgruppen stellt eine weitere, entscheidende Forderung an iede
experimentelle Vorgehensweise dar. Nur der Vergleich zwischen den beiden Gruppen,
die bis auf den Treatmentfaktor weitestgehend ähnlichen Randbedingungen ausge'
setzt sein sollen, ermöglicht relativ sichere Schlüsse auf die Effekte der unabhängigen
Variable. Zur Rekrutierung vergleichbarer Gruppen dienen atei Techniken: Matching
und Randomisierung.l
I Hier wird zunächst nur Matching bei der Bildung von Kontroll- und Versuchsgruppen für echte
Experimente diskutiert. Der Begriff,,Matching" wird zunehmend ftir ähnliche Kontrolltechniken bei
der Analyse von
Quasi-Experimenten (vgl. Kapitel 5.4.2) verwendet.
5,4 Forschungsdesigns 199
- -
eine Eingrenzung der Parallelisierungsmerkmale schwierig ist. Darüber hinaus besteht
5.3.3.1 Matching
Beim ,,Matchrng,, (bzw. der ,,Parallelisierung") versucht man, bezüglich
bestimmter immer die Gefahr der Nicht-Berücksichtigung letztlich doch relevanter Variablen.l
Merkmalsausprägungen ,,gleiche" Personen der Experimental'und I(ontrollgruppe
Filmkonsum und
zuzuordnen. vermutet man beispielsweise, dass das verhältnis von 5,3,3.2 Randomisierung
sozialisation'
Aggressivität auch von ,,dritten" Variablen, wie ,,geschlechtsspezifische Als die Kontrolltechnik schlechthin wird die Randomisierung (,,Zufallszuweisung")
ist, so wird man die Gruppenzugehörigkeit so
und,,Bildung,, der Probanden, abhängig betrachtet. Das Prinzip der',,Randomisierung" besteht in der rein zufälligen Zuwei
(,,matched pairs") mit ieweils den gleichen
matchen, dass von den Personenpaaren sung der Versuchspersonen zur Versuchs- oder Ifuntrollgruppe. Oder anders gesagtl
Merkmalsausprägungen je eine Person zur Experimental- und eine zur
Kontrollgruppe
|ede Versuchsperson hat die gleiche Chance, einer der beiden Gruppen zugewiesen zu
gehört. In der Praxis wäre z. B. für jeden vetsuchsgruppenangehörigen ein hinsichtlich werden. Der Zuweisungsprozess wird also nicht von soziologischen, psychologischen
würde
Sozialisation und Bildung,,gleiches" Kontrollgruppenmitglied zu bestimmen. oder biologischen Kriterien, sondern mittels eines zufallsbedingten Verfahrens (per
überwiegend
dies nicht geschehen, so wäre es z. B. möglich, dass in der einen Gruppe Münzwurf, Losentscheid, Zufallszahlengenerator etc.) gesteuert. Stehen z. B. 200 Per-
mit hoher Bildung
Männer mit niedriger Bildung und in der anderen fast nur Frauen sonen für die Aufteilung in eine Versuchs- und eine Kontrollgruppe zur Verfügung und
nicht
vertreten sind, wodurch die Differenzen hinsichtlich des Merkmals ,,Aggressivität" lässt man jede Person ein Los aus einer Trommel mit 200 gut gemischten Losen ziehen,
mehr mit hoher sicherheit allein auf den Stimulus zurückgeführt werden
könnten,
von denen 100 den Buchstaben V (für Versuchsgruppe) und 100 den Buchstaben K (ftir
und,,Bildung" bedingt sein
sondern eben auch durch die Variablen ,,sozialisation" Kontrollgruppe) tragen, so fährt dieses Vorgehen dazu, dass ein systematischer Zusam-
könnten. menhang zwischen den personalen Merkmalen (Sozialisation, Bildung, Zufriedenheit
Die Bildung von gleichen Paaren ist in der Praxis iedoch mit
großen schwierig-
u.a.) der Versuchspersonen und ihrer Zugehörigkeit zu einer der beiden Gruppen
keiten verbunden - vor allem dann, wenn man die Paare nicht nur nach einem oder
praktisch ausgeschlossen werden kann. Daher sind systematische Unterschiede in der
zwei Merkmalen bildet, sondern mehrere Variablen berücksichtigen will. Solche aus
Gruppenzusammensetzung höchst unwahrscheinlich. Damit wirken dann aber auch
theoretischen Gründen beachtenswerte Variablen, die neben der unabhängigen Va-
alle Drittvariablen in beiden Gruppen gleichartig und die gegebenenfalls vorliegende
riable ebenfalls einen Einfluss auf die abhängige Variable haben könnten' nennt man Veränderung in der abhängigen Variablen ist mit großer Sicherheit auf den Stlmulus
konkurrieren-
allgemein ,,Drittvariablen". Inhaltlich sind auch sie als alternative oder zurückzufi.ihren.
Erklärungen zur Ausgangshypothese zu sehen. Denn es besteht zumindest hypo-
de
thetisch die Möglichkeit, dass auch sie neben der unabhängigen Variablen und den
Störfaktoren auf die abhängige Variable einwirken. Hält man z. B' neben der Sozia' 5.4 Forschungsdesigns
lisation und der Bildung auch noch die materielle Zufriedenheit und das Alter der
in der
Versuchspersonen für relevante Drittvariablen, so muss für iede Versuchsperson Die Ausführungen zu den möglichen Störvariablen und den Techniken der experimen'
Experimentalgruppe mit einer spezifischen Kombination von Merkmalsausprägungen tellen Kontrolle haben verdeutlicht, wie sehr die Interpretationsmöglichkeiten eines
gefun'
innerhalb dieser vier Variablen eine äquivalente Person für die Kontrollgruppe Experiments von der Beachtung der Störmöglichkeiten und ihrer Ausschaltung abhän-
werden
den werden.l Dies bedeutet, dass entsprechende Messungen durchgeführt gig sind. Nur echte Experimente erlauben die systematische Kontrolle von Störfaktoren
müssen und dass häufrg aus einer gtoßen Anzahl von bereitwilligen Versuchspersonen
und schalten damit eine Vielzahl möglicher Alternativerklärungen aus.
die
nur wenige vergleichbare Paare resultieren. Weiter ist es selten unproblematisch'
wenig
für das Matching relevanten Drittvariablen zu bestimmen. Vor allem auf noch
groß, so dass
erforschten Gebieten ist die Anzahl der möglichen Drittvariablen sehr
sich die weni'

ffir.r., Rrt der,,matched pairs " (auch Präzisionskontrolle genannt) unterscheidet
(,,matched groups"). Dabei wird lediglich verlangt'
ger strenge Technik der parallelisierten Gruppen
parallelisierten Merkmale in den Gruppen identisch 1 Vgl. Knnrtwcnr(1975t476f). Besondere Probleme werfen Studien auf, bei denen die Bildung der
dass die Häufigkeitsverteilungen bezüglich der
muss z'B' derPrczentsatz Paare für die Erklärung des interessierenden Ereignisses (2, B. psychische Erkrankung) nachträglich
sind. Es sind also keine gleichen Paare notwendig, aber in beiden Gruppen
gleich sein (ZltuUnn' erfolgen soll, Solche
,,retrospektiven Fall-Kontrollstudien" erlauben nur sehr begrenzt Aussagen über
von ,,iungen. Versuchspersonen, von Versuchspersonen mit hoher Bildung etc,
Kontrolle über die Störfaktoren als dle IGusalzusammenhäinge (Hor,r,atrto/Ruaru
1988) sowie RosENBAUM (2002), Allgemein zum Design und
rraaru 1972:69ff), Diese Art des Matchings erlaubt weit weniger
(1980:69alD' oer Analyse von Fall-Kontrollstudien
präzisionskontrolle, Zu diesen und anderen Formen des Matchings vgl, At.lnnnsoN u.a, siehe Knoc H Cox (20L4).
I
5.4 Forschungsdesigns 2Ol
- -
für den Störfaktor ,,Hilfsmittef' zu: Die möglichst weitreichende Standardisierung von
5.4.1 Echte experimentelle Designs
Messinstrumenten, Versuchsleiterverhalten etc. bedingt - wenn diese Hilfsmittel über-
haupt einen Einfluss haben sollten - nur eine gleichförmige Veränderung in beiden
Esist sinnvoll und üblich (Gnunxwooo L972:178),nut solche Untersuchungen als echte
Gruppen. Schließlich sind auch die denkbaren Probleme durch verzerrte Auswahlen
Experimente zu bezeichnen, die:
und selektive Ausftille zumindest partiell lösbar (vgl. Kapitel6.T).
- eine Hypothese prüfen,
- diesen Test durch eine kontrollierte Setzung des Treatments durchfähren
- und die Versuchsbedingungen mit Hilfe der Techniken der Elimination, Konstant' 5.4.1.7 Labor- und Feldexperimente
haltung und Randomisierung kontrollieren. Echte Experimente führen in der Regel durch ihre Möglichkeiten der Kontrolle von
Störfaktoren zu hoher interner Validität. Da in der Praxis der notwendige Einsatz
Von den bisher erörterten Designs wird lediglich die Vorher-Nachher-Messung mit der Kontrolltechniken zumeist mit einer Durchführung des Experiments im Labor
Kontrollgruppe den genannten Kriterien völlig gerecht. Aber selbst dieses Design kann einhergeht, kann aber die externe Validität leiden. Es können Störeffekte durch die
nicht alle möglichen Alternativerklärungen ausschließen. Je nach Inhalt der interessie' experimentelle (Labor-)Situation auftreten. Es ist somit möglich, dass die intern validen
renden Alternativhypothese muss das Design weitet verfeinert werden. Resultate eines Laborexperimentes nicht auf das Verhalten von Personen außerhalb
So ist es z. B. möglich, dass der Effekt nicht durch den Stimulus allein, sondern des experimentellen Kontextes generalisierbar sind. Hier knüpft dann auch die gängige
durch die Wechselwirkung des Stimulus mit einer vorherigen Messung entsteht. Will Kritik jeder Art von Forschung an, die im Labor betrieben wird, wobei - überspitzt
man diese Alternativhypothese ausschließen, so benötigt man zusätzlich zum Design formuliert - behauptet wird: Niemand verhält sich in einem Laborexperiment so wie
der Vorher-Nachher-Messung mit Kontrollgruppe zweiweitere Gruppen. Beide Grup- im,,richtigen" Leben.
pen werden keinem Pretest unterzogen und nur eine dieser zusätzlichen Gruppen Hingegenwird dem Feldexperiment, das in einerfürdieVersuchspersonen gewohn-
wird dem Treatment X ausgesetzt. Dieses experimentelle Design wird ,,SOLOMON- ten Umgebung stattfindet, eine tendenziell höhere externe Validität zugute gehalten,
Viergruppenversuchsplan" genannt: da die Versuchspersonen in ihrer Alltagsumgebung verbleiben und der Versuchsleiter
(inklusive aller zur Stimulussetzung und Messung der abhängigen Variablen erforderli
R:O x o Experimentalgruppe 1 chen Hilfsmittel) vor Ort erscheint. Die Versuchspersonen - so die gängige Vorstellung
R:O o Kontrollgruppe 1 - (re)agieren dann in ihrer,,natürlichen" Umgebung, wodurch Reaktivitätseffekte der
R: X o Experimentalgruppe 2 experimentellen Situation minimiert werden und zugleich generalisierbare, praxisrele-
R: o Kontro[[gruppe 2 vante Resultate gewonnen werden. Verbunden mit dieser Strategie ist im Allgemeinen
tt t: t3
ein gesteigerter praktischer Aufwand. Unter Umständen müssen die Versuchspersonen
anvielenverschiedenen Orten aufgesuchtwerden, es sind Hilfsmittel zu transportieren
Abb. 5.4: SOLOMON-Viergruppenversuchsplan
usw., d. h. es wird ein hoher personeller und materieller Aufwand nötig. Außerdem
sind die praktischen Möglichkeiten, Störeffekte zu eliminieren bzw. konstant zu halten,
Mit Hilfe von echten Experimenten lassen sich alle genannten Störfaktoren der internen ohne Eingriffe in die Lebensgewohnheiten der Versuchspersonen vorzunehmen, kaum
Validität kontrollieren.l gegeben und insofern werden Einbußen an interner Validität bei Feldexperimenten
sollte z. B. der störfaktor ,,Reifung" einen Einfluss auf die abhängige variable erwartbar.l
haben, so wirkt er in Kontroll- und Experimentalgruppen; (Mittelwert') Differenzen
zwischen Experimental- und Kontrollgruppen vermag er dann jedoch nicht (isoliert)
zu begründen. Das gleiche gilt für den Störfaktor ,,zwischenzeitliches Geschehen";
ffi pr"*irbedingte Dilemma (Burrlcenn l9}4tl9-2i)a,vlschen Feld- und Laborexperiment bzw.
denn je gleichartiger die Situation für Experimental- und Kontrollgruppen ist (Kon' intemer und externer Validität hat sich vor allem ln der Sozialpsychologie in der Debatte um ,,Labor-
stanthaltung), desto geringer ist die Chance, dass zwischenzeitliche Ereignisse (außer vs. Feldforschung" niedergeschlagen, Laborforschung steht dabei zumeist als Synonym ftir Laborexpe-
dem Stimulus) eine Differenz zwischen den Gruppen erzeugen können. Dies trifft auch rlment, Feldforschung hlngegen fit Untersuchungen im Alltagskontext. Obwohl diese Wortwahl weit
verbteitet ist, vermischt sie unzulässigerweise verschiedene Untersuchungskriterienl das Design und
den Ott der Durchftihrung. Zwischen beiden Merkmalen besteht
iedoch keine a,rrangsläufige Verbin-
dung. Eine neuere Diskussion um die Möglichkeiten und Grenzen von Feldexperimenten findet sich in
1 Neben den genannten echten experimentellen Designs gibt es zahlreiche weitere, die sich für
spezielle
dem von Tnu,B (2014) hetausgegebenen
Band.
Fragestellungen eignen. Vgl. hierzu einftihrend Sseolstt/Coor/CairapsBLL (2002).
T
5.4 Forschungsdesigns 2O3
2O2 5 Forschungsdesign und Untersuchungsformen
- -
so einsichtig die Kurzformel ,,Labor = künstlich und intern valide, Feld =
natürlich somit selbst zum Gegenstand theoretischer und empirischer Bearbeitung werden und
und extern valide" auch sein mag, sie kann doch nicht überzeugen' Die Artefakt- in eine allgemeine Theorie des Experiments bzw. der Datenerhebung integriert werden
Störeffekten
forschung, also jenes spezielle Forschungsgebiet, das die Relevanz von (vgl. Kapitel 7,t.t.5).
hat gezeigt, dass auch Laborex-
ieder Art in experimentellen studien thematisiert,
perimente keineswegs eine Gewähr für intern valide Resultate bieten' Messeffekte'
5.4.1.2 Abgrenzun g echter Experi m ente zu vorexperi mentellen Desl gns,
Versuchsleitereffekte und andere Einflüsse wurden trotz der gegebenen Kontrollmög- ex-post-facto-Designs und quasi-experimentetten Designs
lichkeiten auch für Laborexperimente nachgewiesen. Ebenso sind Feldexperimente Während in echten Experimenten die interne Validität weitgehend gesichert werden
(BUNCnno/
nicht schon deshalb extern valide, weil sie ,,im Feld" durchgeführtwerden kann, gilt dies nicht für Designs, die die Kriterien echter Experimente nicht erfüllen.
B/iy t982:192-194); denn auch hier greifen die Wissenschaftler aktiv - sofern keine
Dies gilt besonders für die Anordnung mit einmaliger Messung (vgl. Abb. 5.1):
nicht-reaktiven Messverfahren angewendet werden (vgl. Kapitel 7.4) - in die ,,natürli- Diese Untersuchungsform ist ein typischer Vertreter sogenannter ,,vorexperimenteller
che,, Lebenswelt ein und verändern sie zumindest situational, wodurch ,Verzerrungen" Designs". Solche Untersuchungen sind durch mangelhafte Kontrolle (keine Randomi
entstehen können. Es ist im Wesentlichen eine forschungspraktische Frage, ob die logi-
sierung, keine Kontrollgruppe, kein Pretest) gekennzeichnet, wodurch letztlich sowohl
schen Möglichkeiten einer experimentellen Anordnung auch
genutzt werden können
interne als auch externe Validität stark gefährdet sind. Somit taugen vorexperimentelle
(Bu1canp l984z21).lnterne und externe Validität sind somit nicht als quantifizierbare
Designs nicht als wissenschaftliche Strategien.
Konzepte zu begreifen, mit deren Hilfe bestimmten Experimenten eindeutig
bestimmte
Das Survey-Design (vgl. Abbildung 5.3) stellt kein echtes Experiment dar, da die
Prinzipien zur
,,Validitätskoeffizienten" zuzuschreiben sind, sondern als regulative Kontrolle des Stimulus nur bedingt möglich ist. Der Stimulus wird nicht vom Forscher
Fehlerminimierung in der empirischen sozialforschung. Die Idee der internen und
gesetzt, es flndet nur eine Ex-post-Randomisierung statt. Solche Anordnungen werden
externen Validität macht auf Schwachstellen von Forschungsdesigns aufmerksam
und
Diskussion von allgemein als Ex-post-facto-Designs oder auch Korrelationsanordnungen bezeichnet.
ist eine wertvolle Hilfe bei der Versuchsplanung und der kritischen
Sie sind im Gegensatz zu Experimenten Anordnungen, die Hypothesen prüfen, ohne
Forschungsergebnissen.
(und auch die unabhängige Variable manipulieren zu können (bzw. zuwollen) und ohne eine
Auch der Aspekt der Künstlichkeit bzw. Natürlichkeitvon Experimenten
Randomisierung der unabhängigen Variablen auf die Versuchspersonen vorzuneh'
von Ex-post-facto-Anordnungen) sollte nicht dichotom begriffen werden. Zunächst men. Ex-post-facto-Designs können daher deutlich weniger Störfaktoren und damit
kann gefragt werden, welcher Aspekt der experimentellen Gesamtsituation denn in alternative Erklärungen eliminieren. In der Forschungspraxis der empirischen Sozial-
welchem Grade ,,natürlich" ist (Tuwtnll1977; Parnv t979).lm Prinzip völlig unab- forschung sind Survey-Designs die am häufigsten verwendeten Designs und werden
hängig von der Frage, ob Feld- oder Laborexperimente vorzuziehen sind, kann die daher ausführlich behandelt (vgl. Kapitel 5.4.3).
oder
umgebung, in der das Experiment stattfindet (das sogenannte ,,setting"), mehr Als quasi-experimentelle Designs werden Designs bezeichnet, bei denen zwar
weniger natürlich sein. ,,Wohnzimmeratmosphäre" kann in einem Labor hergestellt Kontroll- und Versuchsgruppen existieren, die sich tatsächlich in der Stimulus-Setzung
werden, ebenso wie der Arbeitsplatz einer Versuchsperson durch die experimentellen unterscheiden, bei denen aber die Zuordnung zu Versuchs- und Kontrollgruppen nicht
Hilfsmittel einen ,,künstlichen" Charakter annehmen kann. Die Verhaltensweisen, die durch Randomisierung erfolgt. In der Regel rekrutieren sich die untersuchten Objek'
Repertoire
durch die unabhängige Variable gemessen werden, können zum alltäglichen te selbst zu Versuchs- oder Kontrollgruppen. Durch diese Selbstselektion sind alle
gehören (Medienkonsum, Sozialkontakte etc.) oder auch extrem au-
des Probanden quasi-experimentellen Designs besonders anfällig für Störfaktoren durch verzerrte
ßergewöhnlich sein (2. B. die Instruktion, andere Personen mit elektrischen Schlägen
Auswahlen und Ausfälle.
Hand'
zu malträtieren); das gilt auch für die durch die abhängige Variable erfassten Obwohl echte Experimente unter allen vorhandenen Möglichkeiten der Prüfung
sich
lungen bzw. Handlungstendenzen. Aus der Kombination dieser Aspekte ergeben von Hypothesen sicher die beste Vorgehensweise darstellen, sind sie in der Soziologie
bereits vielfältige Möglichkeiten, die nicht mehr eindeutig als natürlich oder
künstlich
und Politologie relativ selten anzutreffen. Dies hat mehrere Gründe.
charakterisiert werden können. Will man experimentelle Resultate auf größere Personengruppen (Grundgesamt-
anders
Letztlich stellt sich das Problem unter umständen für jede versuchspelson heiten) generalisieren, so sind spezielle Auswahlverfahren (insbesondere Zufallsaus'
als
dar. Ein Stahlarbeiter empfindet wahrscheinlich andere Settings und Variablen wahlen) zur Rekrutierung der Versuchspersonen unumgänglich. Sollen die Ergebnisse
PArRY
natürlicher als ein Student der Sozialwissenschaften (Cmno/BnrwER 1975:68f; eines Experiments z. B. für die gesamte Bevölkerung Deutschlands verallgemeinert
19S2:33f). Dies sind empirische Fragen, die nur empirisch beantwortbar
sind und bei
wetden, so ist es ratsam, eine entsprechende Auswahl (etwa eine Stichprobe mit viel-
Die subjek'
denen a priori-Klassifikationen wie ,,Feld vs. Laboi" wenig nützlich sind. leicht 1500 Personen) dem Experiment zugrunde zu legen (zu Auswahlverfahren vgl.
sollten
tiven Wahrnehmungen der Versuchspersonen in einer Forschungssituation
5.4 Forschungsdesigns 205
2O4 5 Forschungsdesign und Untersuchungsformen -
-
entweder die ausgewählten Innerhalb der ,,Evaluationsforschung", die inhaltlich auf die Überprüfung der
Kapitel 6). Dies wäre mit großem Aufwand verbunden, da Auswirkungen politisch-administrativer Maßnahmen ausgerichtet ist, besitzen Quasi-
die oft umfangreichen Hilfsmittel
Personen in ein Labor kommen müssten oder aber
Experimente eine große Bedeutung.l
ins Feld zu transPortieren wären.
die Tatsache, dass sich Ein Beispiel für ein solches Quasi-Experiment stellen die ,,New fersey Negative
schwerwiegender iedoch als dieses technische Problem ist
gezielt und kontrolliert in ihren Income Tax Experiments" dar. Dabei wurden die Auswirkungen eines garantierten
viele sozialwissenschaftlich relevante Merkmale nicht
ethische und moralische Mindesteinkommens bei ca. 4800 Familien auf das Arbeitsverhalten, Einstellungen
Ausprägungen verändern lassen, sofern selbstverständliche
Sollten z' B' Sozialisations' u. a. über einen Zeitraum von sechs Jahren untersucht.2 Die klassische Anwendung
Grundsätze von den wissenschaftlern akzeptiert wetden.
Grad solcher Designs in den Sozialwissenschaften sind Studien zum Effekt von Arbeits-
variablen, Intelligenz, schichtzugehörigkeit, Höhe des Bruttosozialproduktes,
andere Merkmale als un- marktmaßnahmen (Lncsnnn 2002): Verringert eine arbeitsmarktpolitische Maßnahme
der gesellschaftlichen Differenzierung, straff?illigkeit und (2. B, Zusatzausbildun g, Lohnergänzun gen) die Arbeitslosigkeit in einer Re gion oder
werden, so können diese nicht
abhängige variablen in einem Experiment eingesetzt
veränderung und zufäl' nicht?
zufällig den Versuchspersonen zugewiesen werden. Denn die Das zentrale Problem solcher Studien ist die Selbstselektion der Untersuchungs-
Einflussmöglichkeiten
lige Zuweisung dieser Merkmale entzieht sich weitgehend den
objekte. Dieses Problem stellt sich bei der Evaluation fast aller politischen Maßnah-
der Untersuchenden.
nicht-experimentelle men, sei es bei der Bewertung des Erfolgs von Psychotherapien, der Sterblichkeit in
sowohl aus praktischen als auch aus ethischen Gründen sind I
I i:. Krankenhäusern, der Bewertung der Lehre von Professoren, des Erfolgs von Mana-
Designs also unvermeidlich.
gementmaßnahmen oder der Strafuerschärfung bei Ladendiebstählen usw. Korrekte
Analysen solcher Maßnahmen müssen die Selektionseffekte berücksichtigen. Hierzu
sind mittlerweile elaborierte Datenanalyseverfahren verfügbar.
5.4.2 Quasi-experimentelte Designs und Propensity'Score'Matching Diese Verfahren werden allgemein als ,,propensity score matching" (PSM) bezeich-
bei denen die net. Ausgehend von den Arbeiten von RoSENSRUM/RUBIN (1983) wird beim PSM ver-
Als quasi-experimentelle Designs wurden oben Designs bezeichnet,
nicht dutch Randomisierung erfolgt' Zu sucht, die Wahrscheinlichkeit zu schätzen, dass eine Person Mitglied der Versuchs-
zuordnung zu versuchs- und Kontrollgruppen
auch gruppe wurde. Diese geschätzten Wahrscheinlichkeiten sind die ,,propensity scores".
diesen Designs werden sowohl ,,natürliche Experimente"
als ,ouasi'Experimente"
Teilnehmer der Versuchsgruppe werden mithilfe der Propensity-Scores den Nicht-
gezählt.
Verän- Teilnehmern zugeordnet. Es werden also Unterschiede zwischen denjenigen Personen
Gelegentlich ergeben sich situationen, z. B. politisch-administrative
in Kontroll- und Versuchsgruppe berechnet, die ähnliche Propensity-Scores besitzen
derungen (Einführung eines neuen schultyps, Erlass von Geschwindigkeitsbegren- (siehe Abbildung 5.5).3
oder soziale
zungen für Pkws, Implementierung zusätzlicher Fernsehprogramme
variable an- Durch dieses Matching hofft man, die unterschiedlichen Selbstselektionswahr-
Reformen im weitesten Sinne), die als Manipulation der unabhängigen
durch die scheinlichkeiten für Kontroll- und Versuchsgruppe kontrollieren zu können und so
gesehen werden können, auch wenn sie nicht wie im Experiment bewusst
mögliche Störeffekte auf die Unterschiede zwischen den Gruppen auszugleichen.
Wissenschaftler hervorgerufen werden. Solche Anderungen können
als ,,natürliches
Experimente dadurch Es gibt mehrere Varianten des Propensity-Score-Matchings. Die Grundidee aller
Experiment, genutzt werden. Typischerweise werden natürliche
dem Eintritt des Verfahren ist einfach. Alle Verfahren berechnen zunächst ein statistisches Modell zur
analysiert, dass man eine Zeitreihe von Messungen vor und nach Vorhersage der Zugehörigkeit zur Versuchsgruppe.a Dann werden die durch das Modell
Ereignisses miteinander vergleicht (,,interrupted time'series").
Ein solches Design
andere Ereignisse als vorhergesagten Wahrscheinlichkeiten zum Matchen verwendet.
weist zahlreiche mögliche störfaktolen auf, so z. B. zeitgleiche
selektionseffekte usw'l
die vermutete ursache, Veränderung der Messverfahren,
gesetzt, die Zuord-
Bei,,Quasi-Experimenten" wird ein experimenteller Stimulus
Obiekte
nung zu Kontroll- und Versuchsgrupppe erfolgi aber durch die untersuchten
selbst. ffiIono*ro/Roos (1973) und Coox/LrvrNror/Srmorsn (1985). Einzelheiten zum Design solcher
Studien finden sich bei Sselrss/Coox/CNrapsur.t(2002); zur praktischen Durchführung von Evaluati-
onsstudien vgl. Rossr/FnusÄ,reN/LrpsEy (2001).
2 Das Großproiekt kostete ca. 70 Millionen Dollar (vgl. FErcK 1980; HuNr 1991).
3 DieldeezudieserAbbildungbasiertaufeinerAbbildungbeiJossELrN/LEMAux(2017'1499).
4 Meist handelt es sich um eine Variante der ,,logistischen Regression", vgl. Kapitel 9.5,4,
(2oo2t17o-206)
ifr.-*urrur*tiche Darstellung frndet sich bei Snaorsu/Coor/CarvrpsnLr
- -
5.4.3 Ex-post-facto-Anordn un gen
U ntersuch un gsvariable
Paarweise zugeordnete
Behandlun o o
Häufig sind jedoch weder die Bedingungen für Experimente noch für Quasi'Experi-
o mente gegeben. Dann muss versucht werden, die soziale Realität mit Hilfe eines Ex-post-
e-1 o o facto-Designs nachträglich zu ordnen (Krnlwcrn t9792589), ohne dass irgendwelche
9iugötonet
experimentellen Kontrolltechniken eingesetztwerden können.lFür dieses Vorgehen
o ist das Suwey-Design typisch. In einem Datenerhebungsprozess - zumeist einer Befra-
Mlttelwert-
unterschied gung - werden unabhängige und abhängige Variablen gemessen.2 Dies ist zunächst
mit Vorteilen verbunden: Mit relativ geringem finanziellen und personellen Aufwand
Uiu-ge"ordnet können Daten für eine große Anzahl von Versuchspersonen erhoben werden, wodurch
a a bei Anwendung entsprechender Auswahlverfahren Generalisierungen möglich werden.
a
o a Paarweise zugeordnete
5.4,3.7 Method ische Problem e von Ex-post-facto-Anordn un gen
übersch Geschätzte Aus dem Survey-Design ergeben sich vor allem drei schwerwiegende, aber unvermeid-
Teilnahmewahrscheinlichkeit liche methodologische Probleme:
1. das Problem der Varianz der unabhängigen Variablen,
2. das Problem der kausalen Reihenfolge der Variablen,
3. das Problem der Kontrolle von Drittvariablen.
Abb. 5.5: Grundprlnzip des Propensity Matchin g.
5.4.3.7,7 Das Problem derVarianz der unabhängigen Variablen

Die einfachste Form ist das ,,nearest neighbor matching", bei dem für iede Person
tlaljianz auf der unabhängigen Variablen bedeutet, dass sich die Befragten in den
in der Versuchsgruppe dasienige Mitglied der Kontrollgruppe gesucht wird' das den
Ausprägungen dieser Variablen unterscheiden. Ein Problem bei der nachträglichen
ähnlichsten Propensity-Score besitzt.l
Klassifizierung der Daten in eine (Quasi-) Experimental- und Kontrollgruppe tritt vor
Die erfolgreiche Anwendung des Propensity-Score-Matchings basielt auf zwei
allem dann auf, wenn (mindestens) eine der interessierenden Merkmalsausprägungen
zentralen Annahmen:
nur relativ selten anzutreffen ist.
1. Berücksichtigt man die Variablen zur Vorhersage des Propensity-Scores' dann
Will man beispielsweise überprüfen, ob die Nichtsesshaftigkeit einen Einfluss auf
ist das Ergebnis des Treatments unabhängig davon, welches Treatment gewählt
das Gesundheitsverhalten hat oder ob Absolventen von Gesamtschulen einen größeren
wurde (,,conditional independence assumption").
beruflichen Erfolg haben als Gymnasiasten, dann muss man sicherstellen, dass in der
2. Die Propensity-Scores der beiden Gruppen überlappen sich weitgehend (,,overlap"
Befragtengruppe sowohl eine hinreichende Zahl von Nichtsesshaften wie auch von
oder,,common support assumption", vgl. Abbildung 5.5).
Sesshaften bzw. von ehemaligen Gesamtschülern als auch von Gymnasiasten vertreten
ist. Mit anderen Worten, bei dieser besonderen Designform muss die Varianz in den
Anders gesagt: Die Unterschiede zwischen den Gruppen müssen tatsächlich kontrolliert
unabhängigen Merkmalen nach Möglichkeit maximiert werden.
und die geschätzten Selektionswahrscheinlichkeiten der Gruppen miissen hinreichend
Würde man bei solchen Fragestellungen keine besonderen Vorkehrungen bei der
ähnlich sein. Die erste Annahme ist nicht direkt empirisch prüfbar, die zweite Annah'
Auswahl der Untersuchungspersonen treffen, dann wären in einer (einfachen) Zufalls-
me schon. Für die Korrektur der Selektionseffekte ist die Geltung beider Annahmen
unverzichtbar. Die Anwendung des Propensity'Score-Matchings ist also keineswegs
vollkommen unproblematisch. ffi.r.* Grund wird die eualifizierung dieser Vorgehensweise als Ex-post-facto-Expedment
häufrg abgelehnt, Stattdessen wird auf Bezeichnungen wie ,,Ex-post-facto-Anordnung", ,,Ex-post-facto-
Design", ,,Korrelationsanordnung" oder auch,,observational studies" zurückgegtiffen.
2 Es können natürlich auch andere Erhebungstechniken (2. B, Beobachtung) angewandt werden. Da
ffiAnaU.he Darstellungen und Anwendungen mehrerer Varianten finden sich zusammenfassend
derzel'
bei RuBrN (2001) und ausführlich bei Ksetornn/KoolweriSlrvran (2010) und KÄr z (201O)'Der ledoch die Befragung das am häufigsten verwendete Instrument ist, werden Ex-post-facto-Designs
gelegentlich mit
tige Stand der Diskussion findet sich bei SruARr (2010). der Umfrageforschung gleichgesetzt, Dies ist jedoch nicht korekt.
5.4 Forschungsdesigns 2O9
208 5 Forschungsdesign und Untersuchungsformen -
-
Solche retrospektiven Fragen (,,Wie war das als Kind ... ", ,,Als es solche Filme
auswahl aufgrund der relativen Seltenheit der Merkmalsausprägungen ,,Nichtsesshaf' noch nicht zu sehen gdb, ...") sind jedoch mit großen Problemen verbunden. Erinne'
tigkeit" oder ,,Gesamtschüler" (bzw. erschwerten Erreichbarkeit der entsprechenden rungstrübungen, nachträgliche Rationalisierung von Erfahrungen durch die Befragten
personen) nicht genügend Fälle (Nichtsesshafte bzw. Gesamtschüler) vertreten, um
bilden Fehlerquellen, die zu erheblichen Verzerrungen der Ergebnisse führen können.l
einen sinnvollen Vergleich der Gruppen durchzuführen'
Ausprägung der unabhängigen
fedes Experiment basiert auf der unterschiedlichen
lediglich eine sehr
Variablen in Kontroll- und versuchsgruppen. wenn bei einem survey 5.4,3.7,3 Das Problem der Kontrotle von Drittvariablen
geringe Anzahl von Personen mit einer bestimmten Merkmalsausprägung
vorhanden Auch die Kontrolle von Drittvariablen ist in Ex-post-facto-Anordnungen wesentlich
mit den
ist, kann man kaum überprüfen, ob die unabhängige variable systematisch schwieriger zu gewährleisten als in Experimenten. Da die Einwirkung der unabhängi
Ausptägungen der abhängigen Variablen korreliert' gen Variablen nicht nach dem Zufallsprinzip auf die Versuchspersonen verteilt werden
Vor der konkreten Auswahl der Personen muss daher festgelegt werden
wie durch kann, sondern ohne Zutun des Forschers bereits vorliegt (oder nicht), muss damit ge-
die erforderli'
ein entsprechendes (disproportional geschichtetes) Auswahlverfahren rechnet werden, dass nicht nur die unabhängige Variable, sondern auch Drittvariablen
che variation erreicht werden kann (vgl. dazu Kapitel 6.4.2),1um
ein angemessenes mit der abhängigen Variablen (stark) konelieren.
man Informationen über die Verteilung
untersuchungsdesign zu entwickeln, benötigt Somit kann folgende Situation eintreten: Diejenigen Befragten, die Filme einer
solche Kenntnis-
der unabhängigen variablen in der potentiellen Beftagtengruppe. bestimmten Gattung sehen, zeigen zugleich eine ausgeprägte Aggressivitätstendenz;
se können aus anderen sozialwissenschaftlichen Untersuchungen
oder auch aus der Befragte, die keine dieser Filme sehen, zeigen auch nur geringe Aggressivitätsten-
Statistik gewonnen werden. Helfen beide Quellen nicht weiter, dann sind denz. Dies würde sich in einer Korrelation zwischen Filmkonsum und Aggressivität
amtlichen
entsprechende Voruntersuchungen notwendig. niederschlagen. Nimmt man nun weiter an, dass die abhängige Variable nicht nur vom
Filmkonsum abhängig ist, sondern auch vom demokratischen oder repressiven elterli-
chen Erziehungsstil, dann könnte sich zeigen, dass tatsächlich diejenigen, bei denen
5.4.3.7.2 Das Probtem der kausalen Reihenfotge von Variablen
Konsum bestimmter Filme und Aggressivität sehr ausgeprägt sind, auch besonders
Das Problem der kausalen Reihenfolge ergibt sich aus der Tatsache der einmaligen,
repressiv erzogen wurden.
gleichzeitigen Erhebung aller Daten: Misst man in der gleichen Befragung den Konsum
Filmkonsum die In einem solchen Fall gibt es mehrere Möglichkeiten, das Verhältnis der drei Varia-
von bestimmten Filmen und die AggressMtät, so ist völlig offen, ob der
zu aggressivem blen zueinander aufzufassen (vgl. Lezensrslo t976; Zntsm ISTO:113142)22
Aggressivität bedingt oder ob eine (wie auch immer erworbene) Tendenz
1. Unterstellt man aus theoretischen Gründen, dass die Drittvariable ,,Erziehungsstil"
Verhalten den Konsum von bestimmten Filmarten nach sich zieht.
als kau- zeitlich sowohl ,,Filmkonsum" als auch ,,Aggressivität" vorangeht, so nennt man
Ein notwendiges Kriterium für die Kennzeichnung eines Zusammenhangs
sie,,anteze dierende Variable" .
sal liegt in der Zeitdifferenz von ursache und wirkung, die in Ex'post'facto-Designs
eben nicht nachgewiesen werden kann. Daher sind die auf solchen Anordnungen
basierenden Daten mit verschiedenen Hypothesen vereinbar' z
-) X
-) Y
erhoben
Häufig wird versucht, dieses Problem dadurch zu lösen, dass variablen tt tz tt
beziehen. Faktisch ist dies der Versuch'
werden, die sich auf einen früheren Zeitpunkt
Abb. 5.6: Antezedierende Variabte Z
nachträglich eine Vorhermessung vorzunehmen'
gestellt werden'
so könnten z. B. die Fragen, die Aggressivität messen, zweimal
Zusätzlich zu den Fragen, die Aggressivität zum Jetzt-Zeitpunkt erfassen
sollen' nimmt
In einem solchen Fall kann sich bei der Datenanalyse ergeben, dass ,,Erziehungs-
auf, die sich auf einen früheren
man äquivalente Fragen oder Items in den Fragebogen
stil" jeweils mit ,,Filmkonsum" und ,,Aggressivität" stark korreliert, aber die ur-
Variable noch nicht einwirken
Zeitpunkt beziehen, zu dem vermutlich die unabhängige sprünglich starke Beziehung zwischen ,,Filmkonsum" und,,Aggressivität" bei
konnte.
mit den unabhän' ffiiurru uusftihrlich Kapitel 7.1.1.5.

ffi,ur1on kann komplizierter werden, wenn zusätzlich relevante Drittvariablen 2 Damitwird deutlich,
die regionalen Arbeitsmarkt' dass die Bezeichnungen,,unabhängige Variable", ,,abhängige Variable", ,,Dritt-
gigen Variablen systematisch kovariieren. Vermutet man etwa, dass auch
vadable" sich lediglich aus der theoretischen Sichtr,veise einel Fragestellung ableiten. Wie die empiri-
(gemessen in der fubeitslosenquote) als Drittvariable Einfluss auf den beruflichen Erfolg
bedingungen sche Reihenfolge tatsächlich ist, wird nicht durch diese Bezeichnungen festgeschrieben.
haben, dann muss auch dieses Merkmal entsprechend variiert werden'
T 5.4 Forschungsdesigns
-
273

- (gemessen an fz) bestehen. umgekehrt ist es
den (vermutlich) abhängigen Variablen
SolassensichadhoceineganzeReihenennen:Schichtzugehörigkeit,Lebenszufrie. nichtmöglich,dassVariablen,diez.B.zumZeitpunktt2$emessenwurden,Einfluss
beruflicher Erfolg etc. Da die Anzahl haben, die bei der etsten welle gemessen wurden'
denheit, geschlechtsspeziische sozialisation, be- auf die variablenausprägungen
theoretisch kau* ,u U"än^n
i"' fotschungsökonomischen Gründen abernach io tunn das problem der kausalen Reihenfolge weit besser
bearbeitet werden als bei
""t
*"n iedoch nicht hoc Drittvariablen sammeln" - zwischen tr und fz eingetreten,
grenzt wetden muss' "ad einer Ex-post-facto-Anordnung. Sind Veränderungen
'ofi* Analysetechniken untersucht werden'1
demMotto,,siekönntenalleinteressantsein"-'wiediesleiderhäufiginderFor' so tönnen diese mit Hilfe multivariater
strategie liegt in der
Die einzig erfolgversprechende
schungspraxi, ,u u.ou".iä ist. Argumentation,
DamitgleichtdieseVorgöhensweisesehreinemExperiment,ohneiedochdie
überprüfung einer theoretischen (gezielte Manipulation der unabhängigen Variablen,
systematischen una to;-s"orr"",un entscheidenden Kriterien hierfür
Drittvariablen berücksichtigt, sondern ,,nur.. Randomisierung) zu erfüllen. In der Praxis
werden Panel-, Trend'und Kohortenanalyse
die bewusst euel., nicirt ,,atte denkbaren.
genannt und sind meist
Argumentation entspringen' ,u,"**.nr"ssend auch häufig ,,Ldngs schnittuntersuchungen,,
iene, die einer stringenten vom Zusammenhang zwischen gekoppelt. Prinzipiell sind iedoch auch alle
Als Beispiel t Jie hieianstehende Hypothese an die Befragung als Erhebungstechnik
"nn Erhebungstechniken (vgl' Kapitel 7) einsetzbar'
FilmkonsumundaggressivenHandlungstendenzenineineTheoriederlnformati. anderen
onsaufnahmeund-verarbeitungintegriertwerden.Auseinemsolchentheoretischen
Blickwinkelwirddieuui,aneis.VuriablealsReaktionaufeinebestimmteBedingungs.
(Dritt-) variablen nahelegt: Informationsquelle 5.4.3,2.7 Grundmodell des Panets
konstellation g...t Untersuchungsanordnungen' die an denselben Personen
"r,]äi.i".ii**,. Als ,,Panel"bezeichnet man
(personalerommu,,ixation,Film,Fernsehenetc.),Glaubwürdigkeitderlnformations. zu verschiedenen Zeitpunkten
äiur.6.n vutiablen (mit derselben operationalisierung)
quelle,Dauerderlnformationsaufnahmeetc.IndiesemKontextwirddieunabhängige zu aggressivem verhalten, den Konsum von
erheben.2 Z. B. würde man die Tendenz
VariablezueinerintegriertenVariableninnerhalbeinesTheoriegebildes,welcheszu. relevanten Drittvariabten (z' B' Konflikte
bestimmten Filmen und auch alle theoretisch
gleicheineReihespezifischerDrittvariablennahelegt.EineentsprechendeStudiegibt mindestens zweimal - im Abstandvon
das Verhältnis zwischen dem
Konsum von Filmen mit dem Partner, berufliche Zufriedenheit etc.)
dann nicht nu, Rurscituss über erheben'
vielleicht vier Monaten - an denselben Personen
einerbestimmtenGattungundderdarausresultierendenAggressivität,sondernauch Messungen lassen sich dann intraindividuelle und interin-
gesamten Theorie' Durch den Vergleich der
tiUer aie Leistungsfähigkeit der die Veränderung
dividuelle veränderungen festmachen. ,,Intraindividuelf'bezeichnet
DieQualitäteinerEx-post-facto.Untersuchunglässtsichsomitvorallemander
deren Anzahl ent-
Kontrolle von Drittvari"ui"r, erkennen, wobei keineswegs allein eineslndividuumsaufeinerVariablenzwischendenZeitpunktenderMessungen;
genannt' Die interindividu-
dieser Wandel wud ,,interne Fluktuation" odet "turnover"
scheidendist,,o'a",nuu.hihretheoretischelntegration.DietheorieloseSammlung in der Gesamtheit der Gruppe der
elle Veränderung bezieht sich auf die Anderung
vonDrittvariablenfi.ihrtnichtseltenzuschwerinterpretierbarenResultaten.Sokann Veränderung der Mittelwerte der
Bruttosozialprodukt eines
z' B' ergeben' dass das versuchspersonen. Diese wird z. B. ermittelt durch
eine ,,theorielose" Vorgehensweise Eine solche Veränderung einer
variablen zwischen den verschiedenen Zeitpunkten.
Bundeslandes,derZigarettenkonsumundauchderFilmkonsumineinemstatisti. mag man bzw"'net change" bezeichnet'
variablen stehen. Dieses Resultat ,,Aggregatstatistik" wird als ,,Nettoveränd'erung"
schen Zusam."rrt uri ,ur abhängigen sinnvolles Ein fiktives Beispiel aus der wahlforschung
(Mrvnn/HnnrvreuNs 1984:293) verdeut-
zwar interessant nnaei, aber es
dtirfte auch schwierig sein, ein theoretisch wurden 1000
zu entwickeln' licht die beiden Veränderungsarten: Im Juli und August eines ]ahres
Erklärungsmodell für diese Zusammenhänge Personen im Hinblick auf ihre wahlbeteiligung bei einer
anstehenden wahl beftagt'
5.4,3.2 Paneldesigns
DieAussagekraftvonEx-post.facto-Designswirddurchdieeinmalige,gleichzeitige
MessungallerrelevantenVariablengravierendeingeschränkt.DasmitdiesemDesign
kann iedoch durch wie'
verbundene promem ier t<ausalen neihenfoige deivadablen
man z' B' zwei oder I Auf diese Techniken wird in Kapitel 9'5'8 eingegangen'
Designs abgeschi,r,ächt werden. Führt werden Panels
derholte Anwendung dieses zu 2 Vgl. LAZARSFET,D (1962253) uniGar,ruuc (t907:85). In der ökonomeüischen Literatur
uon ,,Erhebungswellen.. oder ,,Wellen,,, (sogenann-
mehr Datenerhebungen, man spricht ",,.t, häuflg als,,cross sectional time series,, bezeichnet, Davon mtissen sorgfältig,,Trendstudien"
unterschiedlichen Zeitpunkten
(tr, t2, , . . , tn) auf der Grundlage des Survey'Designs te ,,pooled cross sectional time series,,, auch ,,pseudo-panels" odel ,,repeated cross sectional data"
und zweiten genannt) unterschieden werden. Dabei werden tiber die Zeit unabhängige stichproben aus einer
Popu-
derMesswerte aus der ersten
durch, so kannInrr, üi", den vergleich lation gezogen, vgl, Kapitel 5.4,3.3. Im Vergleich zu Panels sind solche Studien weniger aussagekräftig'
(bzw.n-ten)Messungfeststellen,obundwiesichdieVariablenveränderthabenund und
Variablen (gemessen an fr)
,*ir.h;i den da keine Aussagen über individuelle Veränderungen möglich sind'
welche statistischen Zusammenhä.rg.
- -
Tab. 5.2: Nettoveränderun g Wahlkampfphase in verschiedene Intervalle zerlegt werden, und die Versuchspersonen
(Befragten) sollten alle 14 Tage oder alle 4 Wochen befragt werden. Bei langfristigen
lutl August Prozessen - etwa der Auswirkung der schulischen Sozialisation auf berufliche Auf-
gehe zur Wahl 870 900 stiegsmöglichkeiten - können zwischen den Messzeitpunkten mehrere Jahre vergehen.
gehe nicht zur Wahl 130 100 Bei dem seit 1984 laufenden umfangreichsten bundesdeutschen Panel, dem soge'
Summe 1000 1000 nannten,,sozio-ökonomischen Panel" (SOEP), werden (in den Hauptstichproben A
und B) im Abstand von je einem Jahr alle über 16-iährigen Haushaltsangehörigen von
ca. 6000 Haushalten (über 12000 Personen) befragt.l Bei diesem Panel wechselt ein
Die Tabelle 5.2zeigtdie Nettoveränderung: Insgesamt hat sich die verteilung
zwischen Teil der Fragen von Welle zu Welle, um thematische Schwerpunkte setzen zu können.
Tabelle geht jedoch nicht hervor, Diese betreffen z. B. Erwerbsbiographie, Ehebiographie, soziale Herkunft usw. Die
fuli und August um 30 Personen verändert. Aus dieser
wieviele und welche Personen ihre Einstellung geändert haben. Dies zeigt
erst die Daten, die zur wissenschaftlichen Bearbeitung iedermann zur Verfägung gestellt wer'
interne Fluktuation (Tabelle 5.3). den, erlauben somit eine detaillierte Analyse von individuellen und gesellschaftlichen
Wandlungsprozessen zu einer Vielzahl sozio-ökonomischer Fragestellungen.
Tab. 5.3: lnterne Fluktuation

5,4.3.2.2 Methodische Probleme des Panels
August
Abgesehen von ihren Vorteilen besitzen Panel aber auch methodische Problemer
gehe gehe nicht
Wahl Summe lull
-
die Sicherstellung der Konstanz der Messinstrumente,
zurWahI zur
lutl - die Ausfallrate bzw. Panelmortalität,
gehe zur Wahl 850 (20) 870
130
- die Veränderung der Teilnehmer des Panels durch die Teilnahme (,,Paneleffekte")
gehe nicht zur WahI (50) 80
SummeAugust 900 100 1000
Konstanz der Messinstrumente

70 in' Die Konstanz der angewendeten Messinstrumente ist insofern problematisch, als sich
Dabei wird deutlich, dass der Nettoveränderung von 30 Personen insgesamt
liegen. 20 Personen, die im Iuli noch bei BefragUngen der semantische Gehalt von Begriffen (Frageformulierungen etc.)
dividuelle Einstellungsänderungen zugrunde
Personen, die im Juli infolge des allgemeinen sozio-kulturellen Wandels verändern kann. Repliziert man
wählen wollten, beabsichtigen dies im August nicht mehr; 50
Untersuchungen nach 10, 20 oder 30 Jahren, so ergeben sich u. U. gravierende Bedeu-
nicht wählen wollten, geben im August iedoch eine wahlabsicht bekannt.
indi' tungsverschiebungen von sprachlichen Ausdrücken. Zum anderen ergeben sich in
Panelstudien können im Gegensatz zu einzelnen Erhebungen zusätzlich
die kausale Rekonstruktion von so langen Zeiträumen auch Verbesserungen der sozialwissenschaftlichen Mess- und
viduelle Veränderungen anzeigen und erleichtern
Auswahlverfahren, die eine Entscheidung zwischen,,alten" und neuen Techniken
Ereignissen.
gilt das gleiche erfordern.2
Für die interne und externe Validität von Paneluntersuchungen
wie für Ex-post-facto-Designs: Insbesondere ergeben sich Probleme mit den
Faktoren
Vor allem dann, wenn die Abstände
,,zwischenzeitliches Geschehen" und,,Reifung",
vor allem bei
zwischen fr und fz (bzw. fn) relativ groß sind; Messeffekte hingegen sind
eher kürzeren Abständen zu erwarten (Dtsnxns 197713O)'
I Das Sozio-ökonomische Panel wurde von der DFG (Deutsche Forschungsgemeinschaft) gefördert
Bei der Planung und Durchführung von Panels ist die wahl der ,,richtigen" und wird vom DIW (Deutsches Institut für Wirtschaftsforschung) geleitet. Die Feldarbeiten werden
Zeitabstände von zentraler Bedeutung (LAzensrulo 1962:263165).
Hierfür kann
von INFRATEST (München) durchgeftihrt. Einzelheiten zum Design des Panels finden sich bei Ha-
allgemein gültigen Regeln angeben, sondetn hier muss nach inhaltlich' Ivtrrlo (t987), Beschreibungen weiterer Teilstichproben und konzeptuelle Entwicklungen fassen
man keine
werden'
theoretischen Gesichtspunkten und ausgiebigen vorüberlegungen entschieden We$.tnn/Fnrcr/ScHupp (2007) zusammen. Die Entwicklung der Teilnahme an der Befragung zeigen
(Versamm'
untersucht man z. B. den Einfluss der wählerwerbung durch die Parteien
Knon/KüHNn/Srncnns (2015).
die gesamte 2 Trotz des hohen Alters der Arbeit ist der verfügbare Überblick über die Probleme vergleichender
lungen, plakatierung etc.) auf die Wahlentscheidung J", Bürger, so sollte Studien tiber große Zeiüäume ManrrN (r9sa).
-
Sowohl die größeren Stichproben als auch die notwendigen Maßnahmen der Pa-
Panelmortalität nelpflege erhöhen natürlich die l(osten für Panelstudien, die deshalb seltener als Quer'
im verlauf des Panels
Die Ausfallrate bei Panels, also der Anteil der Teilnehmer, die
ist das schwerwie' schnittsstudien durchgeführt werden. Trotzdem wächst die Zahl bevölkerungsbasierter
als Befragte ausfallen (,,Panelmortalifäf" oder ,,panel attrition") Panelstudien langsam, aber stetig an.l
gendste praktische Problem. Häufig sind Personen, die von der ersten welle erfasst
teilzunehmen' Diese
wurden, nicht mehr bereit oder fähig, an weiteren Messungen
Umzug
Panelmortalität hat verschiedene Ursachen: Verlust der Teilnahmemotivation' Paneteffekte
(Adressänderung)1, Krankheit, Tod etc. Das Ausmaß der Panelmortalität
ist natür- lJnter ,,Paneleffekten" versteht man die Veränderung der Teilnehmer durch die wieder-
wellen sowie der Panelpflege (s'u')
lich stark vom Zeitabstand und der Anzahl der holte Befragung. Hierzu gehören Effekte wie die Ausbildung von vor der Befragung noch
stark: so werden für das
abhängig. Dementsprechend schwanken die Ausfallquoten nicht bestehenden Einstellungen, die Veränderung oder die Verfestigung bestehender
als 10% erreicht, bei
Sozio-ökonomische panel je nach Welle Ausfälle meist weniger Einstellungen und Verhaltensweisen durch die wiederholte Befragung. Weiterhin ge-
pro Welle berich- hören hierzu Veränderungen des Verhaltens der Befragten während der Interviews:
anderen nationalen Haushaltspanels wurden Ausfallquotenbis24%
problematisch, weil die Ausfälle häufig nicht Den Befragten ist der Ablauf und der Inhalt der Interviews bekannt; ihr Verhalten
tet.2 Panelmortalität ist vor allem deshalb
Personen unterscheiden in der Interviewsituation wird daher von demjenigen von Erstbefragten abweichen.
zufällig, sondern systematisch erfolgen. Die,,ausgefallenen"
verbleibenden Personen Gelegentlich bilden sich zwischen Interviewern und Befragten aufgrund wiederhol'
sich also in Hinsicht aufrelevante Variablen von den im Panel
(vgl. Kapitel6.T). ter Befragung freundschaftliche Beziehungen, die das Antwortverhalten ebenfalls
werden'
Bei der Planung eines Panels muss die hohe Mortalität berücksichtigt beeinflussen können.2
Einerseits ist ein höherer stichprobenumfang als bei entsprechenden Querschnitterhe- Die Probleme der Konstanz der Messinstrumente, der Panelmortalität und der
des Panels
bungen notwendig3, andererseits müssen die Ausfälle während der Laufzeit paneleffekte müssen bei der Datenanalyse berücksichtigt werden. Bei einigen Frage-
gering gehalten werden. stellungen werden bereits vor der Datenerhebung so erhebliche methodische Probleme
(LeunIn 2008 und
Dies geschieht in der Regel durch eine intensive Panelpflege erwartet, das spezielle Panel-Designs verwendet werden müssen.
Befragten zwischen den
Scntlrlr 2Ot2338143). Man versucht den Kontakt zu den
a. feststellen und ihnen
Messungen aufrecht zu erhalten, um so Adressänderungen u.
Dank- 5,4.3.2.3 Spezie[[e Paneldesigns
entgegenwirken zu können. Dies geschieht z. B. durch Ankündigungsschreiben,
versucht man einem potentiellen Zur Kontrolle des Einflusses von Panelmortalität und Paneleffekten auf die Ergebnisse
schreiben und Geburtstagsglückwünsche. Zusätzlich
(,,incentives") entgegenzu' des Panels sind mehrere Design-Varianten entwickelt worden (vgl. Dullca$Kalrow
Motivationsverlust dutch Geschenke oder Belohnungen
nach jeder 19871100).
wirken. Im Falle des sozio-ökonomischen Panels erhielten die Befragten
beigefügt war' Üblicher
Erhebung ein Dankschreiben, dem ein Jahreslos einer Lotterie
der Erhebung, wie z. B. Kaffeetassen'
sind mittlerweile Geschenke, meist mit dem Logo
Rucksäcke oder Zollstöcke (solche Details finden sich fast immer nur in den soge'
Studien wird
nannten ,,Methodenberichten" der Erhebungsinstitute). Bei neueren 1 Eine Liste größerer laufender Panelstudien findet sich bei Et t lorr/Hol,lelo/THoivrsoN (2008)' Eine
international als Belohnung zumeist direkt eine finanzielle Zuwendung verwendet Übersicht über die Panelstudien der amtlichen Statistik in Deutschland findet sich bei Gru'MLIcH u.a.
Beftagten
(Leunm/Lytm 2009). Selbstverständlich wird eine neue Erhebungswelle den (2010).
zuvor in einem Schreiben angekündigt. 2 Eine in der kommerziellen Marktforschung verbreitete besondere Form des Panels leidet unter den
genannten Problemen in besonderem Maße: Sogenannte ,,Access-Panels", Hierbei wird entweder über
eine ursprüngliche Zufallsstichprobe oder eine Stichprobe von Freiwilligen eine Ausgangsstichpro-
be zusammengestellt, deren Teilnehmer sich bereit erklären, an zahlreichen Nachfolgebefragungen
beträchtli- teilzunehmen. Die Teilnehmer werden in der Regel besonders belohnt (2, B. durch Warengutschei-
ffisunousrepublik zieht innerhalb eines Jahres ca.roVoder Bevölkerung um' Ein ne). Da durch die hohe Zahl von Nachfolgebefragungen Paneleffekte bedingt werden und durch die
auf Umzüge innerhalb einer Gemeinde, aber selbst bei Umzügen über die
cher Teil entfällt dabei eventuelle Selbstrekrutietung zu Beginn und vor allem durch selektive Ausfälle (und deren Ersatz
fast 5% (SfirNnu' 2012:334)'
Gemeindegrenzen hinweg liegt der Anteil im langiährigen Mittel bei durch zufällig ausgewählte neue Panelteilnehmer) im Verlauf solcher Studien unkontrollierbare er-
finden sich bei wersoN/wooprN
2 Hinweise auf weitere studien zum Ausmaß der Panelmortalität hebliche Panelselektions- und Panelmortalitätseffekte auftreten können, eignen sich Access-Panels
(2ooe). für wissenschaftliche Studien allenfalls als Pretest. Keinesfalls kann für wissenschaftliche Zwecke ein
gewährleistet die für eine sinnvolle
3 Diese Empfehlung löst zwar nicht das Ausfallproblem, aber es Access-Panel eine üaditionelle panelstudie ersetzen.
Ausfällen leiden kann'
Datenanalyse notwendige Fallzahl, die dann iedoch unter den selektiven
- -
(Gr, Gz ' ' ') wird durch eine nacherhobene neue Gruppe ersetzt (Dutlcr'N/KnlroN 1982103). Im Fal-
Bei einem ,,alternierendenPanel" wird die Stichprobe in Subgruppen
eingeteilt, die dann abwechselnd in den Panel-wellen (ty t2...) befragt werden le eines Fünf-Wellen-Panels würde dies (bei ftinf Subgruppen) bedeuten, dass nur eine
(Abbildune 5.s). Befragtengruppe alle fünf Wellen durchläuft, ie nruei Befragtengruppen durchlaufen
vier, drei, zwei und nur eine Welle (Abb. 5.9).
Neben einer vergleichsweise kleinen Panelkomponente bedingt dieses Design
tr t2 tr h t5
einen erheblichen Aufwand, da zu jeder Welle eine Neuerhebung stattfinden muss.
G1 X X X
Schließlich besteht die Gefahr, dass insbesondere die interessanteste Gruppe (die
G2 X X
Fünf-Wellen-Gruppe) unter hoher Panelmortalität leidet. Darüber hinaus werden die
Gruppen, die nur an einer Welle teilnehmen (Gs und Ge in Abb. 5.9) aus der Längs'
Abb. 5.8: Atternierendes Panel
schnittanalyse ausgeschlossen, wodurch sich erneut eine Verringerung des Samples
ergibt.
So wird z. B. eine Gruppe (Gr) in der ersten, dritten und fünften
welle und eine andere Eine weitere Design-Variante ist das ,,geteilte Panel" (,,split panel sureey", Dutlceu/
Gruppe (G2) inderzweitenundviertenwellebefragt. Damitwirdzum einenderGesamt' Kllror.l1987). Dieses Design impliziert die Bildung von zwei Gruppen; eine Gruppe
aufwand der Erhebungen verringert (ieweils weniger Befragte), zum anderen lassen durchläuft dabei eine ,,normale" Panel-Untersuchung (Gr in Abb. 5.10)' die zweite
(,,Warum Gruppe wird als rotierendes Panel oder auch nur als wiederholte Querschnittunter-
sich eventuell Ausfälle aufgrund von Belastungs- und Gewöhnungseffekten
fragen sie das denn schon zum dritten Mal?') verringern. weiterhin kann
durch die suchung (Qr-Qs in Abb. 5.10) in die Erhebung aufgenommen. Diese Variante bietet
längeren Zwischenräume zwischen zwei Befragungszeitpunkten die Gefahr von Pa' zrrtrar den Vorteil, für die Panelkomponente jeweils eine Kontrollgruppe in der Untersu-
ist dieses Design chung zu haben, ist allerdings mit dem Nachteil eines erheblich höheren Aufwands
neleffekten verringert werden. Bei einer geringen stichprobengröße
pro welle
allerdings nicht angebracht, da bei mehrwelligen Panels durch die Ausfälle bei der Auswahl (bei jeder Welle muss eine neue Gruppe gezogen werden) sowie einer
Analyse nicht mehr sinnvoll möglich erheblichen Reduzierung der Stichprobengröße in der Panelkomponente verbunden.
Gruppengrößen erreicht werden, mit denen eine
ist. Da aufgrund der unterschiedlichen Erhebungszeitpunkte für die verschiedenen
wer-
Gruppen von einer eingeschränkten Vergleichbarkeit der Ergebnisse ausgegangen tr tz t3 1a t5
den muss, ist eine erneute Zusammenfassung der geteilten Stichprobe
in den letzten
der letzten G1 X X X X X
Wellen nicht möglich; somit birgt dieses Verfahren die Gefahr des ,,Verlusts"
Q1 X
Wellen mit sich. Q2 X
Q3 X
Q4 X
tl tz tr h t5
Q5 X
G1 X X X x X
G2 x X X x Abb. 5.10: Geteiltes Panel

G3 X X x
G4 x x
G5 x
G6 X X X X 5.4,3,2.4 Kohortenstudien
X X X
G7 Eine weitere Art der Längsschnittuntersuchung ist die ,,Kohortenstudie". Kohorten
G8 X X
werden durch Personen gebildet, bei denen annähernd zum gleichen Zeitpunkt ein
G9 X
spezielles Ereignis in ihrem Lebenslauf eingetreten ist (Rvurn 1968:546). Am bekanntes-
ten sind Geburtskohorten (Jahrgänge), aber auch andere Ereignisse können Kohorten
Abb. 5.9: Rotierendes Panel
definieren: Scheidungskohorten, Pensionierungskohorten, Einschulungskohorten,
etc. Bei diesem Design rekrutieren sich die Versuchspersonen dann aus bestimmten
alle Befrag'
Eine andere Design-Variante bitdet das ,,rotierende Panel". Dabei sind nicht Kohorten. Dabei kann man prinzipiell zwei Vorgehensweisen unterscheiden (Glrur
(bei fünf Wellen
ten über alle Wellen im Panel; das Sample wird in Gruppen unterteilt 1977:91O): Vergleich zwischen verschiedenen Kohorten oder innerhalb einer Kohorte.
Gruppen aus und
z. B. fünf Gruppen), und bei jeder welle scheidet eine der bisherigen
-
-
zu ver- 5.4.3.3 Trendstudien
Beim Intra-Kohorten-Vergleich sind die untersuchten Versuchspersonen
z,B,werden Personen des Geburtsjahrgangs Als eine Abwandlung des Paneldesigns kann die ,,Trendstudie" (gelegentlich auch
schiedenen Messzeitpunkten dieselben,
1960, 1970 und unechtes Panel oder,,replikativer Survey" genannt) gesehen werden.l Auch hier werden
1g4O aufverschiedene variablen hin untersucht, etwa in den Jahren
Kohorten unter- Variablen durch dieselben Operationalisierungen zuverschiedenen Zeitpunkten gemes-
1gg0. Beim Inter-l(ohorten-Vergleich werden Mitglieder verschiedener
Abstand sen, jedoch an anderen Personen, die aber über dasselbe Auswahlverfahren ermittelt
sucht, die aber nsden ieweiligen Messzeitpunkten den gleichen zeitlichen
haben, z. B. Rentner verschiedener Alters- werden.2 Trendanalysen bzw. replikative Surveys sind sozusagen genaue ,,Nachbauten"
zu dem die Kohorte definierenden Ereignis
vormals durchgeführter Studien.
gruppen jeweils 5 Jahre nach der Pensionierung'
Vor' Gegenüber dem Panel entfällt jedoch die Möglichkeit, Veränderungen an einzelnen
Kohortenstudien sind echte Panelstudien und besitzen daher alle speziellen
aber ein zu' Individuen identifizieren zu können. Lediglich Veränderungen zwischen den beiden
und Nachteile von Panelstudien im Allgemeinen. Kohortenstudien weisen
Bei Kohortenstudien Gesamtheiten der Befragten, also Veränderungen der Aggregatstatistik, sind feststell-
sätzliches Problem auf, das sogenannte ,,Identifikationsproblem"'
bar.3 Weiterhin leiden alle Trendstudien an der großen Zahl möglicher Störfaktoren, die
lassen sich konzeptuell drei Effekte der ,,Zeit" unterscheiden:
den Vergleich der Ergebnisse der Erhebungen erschweren können. Dazu gehören ins-
l. Effekte des historischen Zeitpunkts (,,Periodeneffekte"), besondere die Veränderungen der Erhebungsbedingungen und der Messinstrumente
2. Effekte des Alters der Mitglieder der Kohorte zu einem bestimmten Zeitpunkt
(,,A1-
im Laufe der Zeit.a
terseffekte") und
Diesem Nachteil in der Aussagekraft stehen jedoch erhebliche forschungsökono-
3. Effekte der Zugehörigkeit zu einer Kohorte (,,Kohorteneffekte")'
mische Vorteile gegenüber, da der Aufwand zum Ausgleich der Panelmortalität durch
periodeneffekte können z. B. in besonderen historischen Ereignissen oder langftistigen Panelpflege entfällt. Trendanalysen sind also im Allgemeinen mit geringeren Kosten
Reifungsvor' verbunden als Panelstudien.
Trends wie Klimawechsel bestehen; Alterseffekte können z. B. körperliche
Vorlieben ftir bestimm' Ein Beispiel für eine Trendstudie ist eine Untersuchung des Instituts für Demo-
gänge sein und Kohorteneffekte können sich z. B. in bleibenden
wird, lassen sich skopie Allensbach, bei der eine Befragung aus dem Jahre 1953 im Iahre L979 repliziefi
te Musikrichtungen zeigen. Da nur eine Kohorte über die Zeit verfolgt
voneinander wurde. Dabei wurden 1953 ca.3000 Interviews und 1979 ca.2000 z,B. zu den Themen
diese drei Effekte ohne zusätzliche und schwer prüfbare Annahmen nicht
Politik, Freizeit und Religion durchgeführt (Nonlln-Nnuuenr/Ptrl1983:75ff). Die Stu-
trennen.l
die versucht, den Wandel von Einstellungen in der Bevölkerung über einen Zeitraum
Kohortenstudien gelten als das typische Design für entwicklungspsychologische
von 26 Jahren darzustellen. Zwarwurde dabei die Frageformulierungweitestgehend bei-
und generationssoziologische Fragestellungen'2
behalten, jedoch wurde das Auswahlverfahren geändert (vgl. Nonlln-NruueN$Ptnl
Ein idealtypisches Beispiel für eine Kohortenstudie stellt die ,,British National
vom 3. L9832224ft), was die direkte Vergleichbarkeit der beiden Erhebungen beeinträchtigen
Child Study., (NCDS) dar. Dabei wurden 11400 in Großbritannien im Zeitraum
Ausbildung, Einkommen kann.
bis 9. März 1958 geborene Kinder im Hinblick auf Gesundheit,
in neun Ein weiteres Beispiel ftir eine Trendstudie ist eine von AllnRsncr/Hoac (19S5a)
und verschiedene Einstellungen über eine Zeitspanne von 60 Jahren hinweg
1983replizierte Studie aus dem lahre L962. Dabei wurden mit einem nahezu identi-
Wellen untersucht.3
schen Fragebogen und nach den gleichen Auswahlprinzipien die Veränderungen von
politischen Einstellungen, Berufswünschen u. a. von Jugendlichen ermittelt. Besonders
interessant werden Trendstudien dann, wenn Veränderungen über lange Zeiträume mit
Eine klare I Gelegentlich werden auch Trend- und Panel-Untersuchungen kombiniert. Ein Beispiel geben Jnn-
Fli,.r.,u, ,ur Trennung dieser Effekie ist häufig verwirrend und teilweise schlicht falsch' ttlt'tcs/v.Dn'rn (1990). Bei dieser Studie zur politischen Partizipation wurden in drei Ländern in zwei
(2013) und O'BRIEN
Einftihrung gibt GLENN (2003), der Forschungsstand findet sich bei Yer'ic/Lal{p
Wellen Daten erhoben, wobei jeweils nur ein Teil der Befragten aus der ersten und zweiten Welle
(2015).
("cross' identisch war.
2 wurden zahlreiche Designvarianten für die Kombination mehreret Koholten vorgeschlagen
Es 2 Vgl, Gal.runc (tg6ltgS)iMnvun/Hnnrrar.nNs (t984:292-294) und Mlntrr,r (19832677-679).
2005)' Neue Literatur
sequential., ,,cohort-sequential",,,time-sequential", vgl. Pnrlzlu/ONGHENA 3 Die gemeinsame Analyse mehrerer replikativer Surveys lässt sich elegant mit Regressionsmodellen
findet sich bei SILSTRMiN u'a. (2015)' Das prinzipielle Problem der
und ein Anwendungsbeispiel durchfähren, vgl. hierzu FTREBAU e:r-(1997).
Designs nicht gelöst
untrennbarkeit der Effekte von periode, Alter und Kohorte wird auch durch diese 4 MenrrN (D83) behandelt erschöpfend methodische Probleme des Vergleichs der Erhebungen in
(Er,orn/Groncn 2016). Trendstudien.
3 Einzelheiten der Studie finden sich bei PowuR/Eluorr (2006)'
5.5 Untersuchungsformen 223
-
oder das Panel, dar. Es sind vielmehr spezielle Kombinationen von unterschiedlichen
vieleneinzelnenreplikativensuweysuntersuchtwerdenkönnen.lFürsolcheAnalysen Techniken bei der Operationalisierung, Bestimmung der Auswahlelemente oder der
benötigtmanzahlreicheDatensätzemitmöglichstvergleichbarenDatenerhebungen.2 Datenerhebung. Daher muss bei der Planung oder Beurteilung jeder sozialwissenschaft-
Die,,AllgemeineBevölkerungsumfragederSoäalwissenschaften"(ALLBUS)istein lichen Studie geprüft werden, welches Design im engeren Sinne Anwendung findet.1
häufigere und in kürzeren Abständen erfol-
Beispiel für eine rrunortoai., Ji. uui "in. von Nur durch die Analyse des Designs einer Studie kann die prinzipielle Aussagekraft
gende Datenerhebung ausgeiegt ist. Diese
Trendstudie wird seit 1980 im Abstand
einer Studie beurteilt werden. Dies gilt für alle Teilbereiche der Sozialwissenschaften,
ie zwei Jahren wiederholt. alle Erhebungsmethoden und alle Analyseverfahren.
Zu den wichtigsten speziellen Untersuchungsformen als Kombination der Grund-
,,seinerKonzeptionnachistderALLBUs(.'.)einForschungsprogrammzurErhebungundVet-
breitungaktuellerundrepräsentativerDateniiberEinstellungenundVerhaltensweisenderBevöI- techniken gehören Einzelfallstudien, Sekundäranalysen und Netzwerkanalysen. Die
Er soll vornehmlich dem Ziel dienen,
ftir Forschung und
kerung der Buna..rupuutit o.utschland.
fiuchtbare und methodisch ,,Einzelfallstudie" - auch Einzelfallanalyse, ,,case study" oder Fallstudie - nimmt ein be-
kontinuierliche' inhaltlich
Lehre in den Sozialwisäschaften eine stimmtes Objekt zum Untersuchungs- bzw. Analysegegenstand. Die,,Sekundäranalyse"
anspruchsvollernror*tionrg-ndlagezuschaffen,dieallgemeinzugänglichist"(Ponsr1983:37)' greift zur Deskription bzw. zum Hypothesentest auf bereits vorhandene Datensätze
zurück.2 Innerhalb des Forschungsprozesses entfäillt somit der Datenerhebungsprozess.
DerALLBUshateinenfestenKernvonFragestellungen'welcherinjederWelleanca.
genutzt werden'
l(ern kann für Trendstudien Bei der Netzwerkanalyse handelt es sich in erster Linie um ein Datenanalyseverfahren,
3000 Personen erneut erhoben wird. Dieser
das iedoch einer bestimmten Datenstruktur bedarf, die bereits bei der Planung der
DerALLBUSistalsMehrthemen-Befragungkonzipiert(d.h.,eswerdenverschiedene
Politik etc. thematisiert). Der ALLBUS Untersuchung berücksichtigt werden muss.
soziologische Bereiche, z. B. Umwelt' Arbeit,
als auch Studien zum sozialen Wandel'3
erlaubt sowohl aktuelleQuerschnittanalysen
5.5.1 Einzelfatlstudie
5.5 Untersuchungsformen Eine Einzelfallstudie als Betrachtung einer singulären Untersuchungseinheit muss
unter dem Label "Untersuch' sich nicht zwangsläufig auf die Analyse eines einzigen Individuums beziehen, sondern
üblicherweise firmieren in den Sozialwissenschaften sie kann auch mehrere Individuen, die zusammen einen Untersuchungsgegenstand
ungsformen..nebendenvorgängigdargestelltenForschungsdesignsweitereFor-
bezeich' bzw. eine Analyseeinheit bilden, umfassen.3 Häufig wird nach folgenden typischen
und vorgehensweisen
schungsstrategien, die spezielie untersuchungsformen Untersuchungseinheiten unterschieden: a
gekennzeichneten vorgehensweisen
nen.a Diese häufig als üntersuchungsformen
-
Eine einzelne Person ist Gegenstand der Analyse.
stellenjedochkeineeigenständigenForschungsstrategien,wieetwadasExperiment Dieser Fall ist z. B. im Bereich der Psychologie und Medizin häufig anzutreffen.
Untersuchungen einer bestimmten Krankheit oder psychischen Störung werden
an einem Patienten vorgenommen. Aber auch im Bereich der Sozialwissenschaf-
für eine solche Studie stellt die Arbeit von
ScHunll/Konlnn (1995) dar' Hier wurde
iEn-rcirpi.t ten können einzelne Personen Analysegegenstand sein, z. B. bei einer Analyse
sozio'demographischer variablen ftir
das
der theoretisch erwartete Rückgang der Erklärungskraft untersucht' der politischen Einflussmöglichkeiten des Bundespräsidenten oder der Rolle des
erhobenen vetgleichbaren surveys
wahlverhalten durch die Analyse von 37 unabhängig Vorsitzenden der Tarifkommission.s
DiemethodischeDiskussionindiesemArtikelundinderFolgediesesArtikelszeigteinigemethodische
ihrer Kontrolle'
Probleme von Trendstudien und Möglichkeiten suweys
schon die Vergleichbarkeit sehr ähnlicher
2 Zahlreiche erhebungstechnische Details können Probleme stellen 1 Häufig wird man bei der Beurteilung feststellen, dass es sich um fubeiten ohne explizites Design han'
(ugr. niurru Sqrrnlr,/KnrurER 2000)' Die
gleichen
zu einem Zeitpunkt erschJe-ren der Feldarbeit delt (scherzhaft: ,,no-design-study"), In diesen Fällen handelt es sich dann bestenfalls um prinzipiell
undokumentielte Details
sich bei Längsschnittuntrrti.iuigän noct et er, da in det Regel nicht verallgemeinerbare Einzelfallstudien.
die Ergebnisse erheblich beeinflussen können' und firr 2 Zur Sekundäranalyse gehören auch dieienigen sogenannten ,,komparativen Studien", bei denen
von Gesis (vgl' Anhang H) bezogen
3 Die Datensätze des ALLBUS können von Interessenten Kennziffern verschiedener Gesellschaften verglichen werden, vgl, Kapitel 5.5.2,1.2.
eigene AnalYsen genutzt werden' 3 Bei Einzelfallstudien gibt es eine Vielzahl möglicher Kombinationen von Design und Erhebungstech-
einer Vorgehensweise als Untelsuchungs'
4 Je nachdem, welche Kriterien man für die Kennzeichnung nik. Eine Einfühyung gibt yrN (2018).
und mit Namen benennen: z'B die "qualitA'
form anlegt, kann man weitere Stlategien charakterisieren Interviews 4 Vgl. PrrrnnreNN/HEHr (t929:3); Ar,rir,rax{Onrlrnn (1975167-169).
tiveSonalforsclrung", die zumeist auf de,
crunatage uoi Einzelfällen unstandardisierte 5 In
konzen' der Soziologie war es vor allem die Chicagoer Schule, die Einzelfallstudien unter dem Begriff,,life
verwendet, die ,,oral history,,die sich auf die nnurvr. *üinlu.i wiedergegebener Biographien histories" zu einer spezifischen Untersuchungsform enhvickelt hat (HAKru 1987r63f).
triert, und viele andere.
- -
daraus ein gravierender Mangel bezüglich der Generalisierungsfähigkeit der ermittelten
- Eine Personengruppe bildet die Analyseeinheit.
Forschungsresultate.
Häufig genannte Beispiele hierfür sind die Studien von FnSttncER/RIEcKEN/
Andererseits kann dieser Nachteil auch bewusst zugunsten einer differenzierteren
Sqr4cnrpn (1956) über eine Sekte, die den Weltuntergang voraussagte oder die
Datenerhebung und -analyse in Kauf genommen werden (BenroVLezARSFELD t979:72-
Gemeindestudie von Meywrz (tgSA) über die soziale Schichtung und den sozialen
77).So beschränkte sich z. B. die Untersuchung von MevNrz (195s) zwar bewusst auf
Wandel in einer Industriegemeinde.
eine Gemeinde, umfasste daftir jedoch eine Vielzahl von Aspekten der sozialen Schich-
- Eine Organisation ist Gegenstand der Untersuchung.
tung und Mobilität und hatte zudem ,,Pilotcharakter" für zahlreiche darauf aufbauende
So wird z. B. von WtNxlnn/IGRHAUsEN/MEIrn (1935) die Organisationsstruktur
Untersuchungen. Eine generelle Empfehlung für oder gegen solche Fallstudien kann es
und Funktion des Deutschen Sportbundes (DSB) und seiner Einzelverbände zum
nicht geben. Hier ist immer eine Abwägung zwischen der Vielschichtigkeit der interes-
Objekt einer Fallstudie.
sierenden theoretischen Aspekte, dem bisherigen Kenntnisstand in dem betreffenden
- Schließlich werden in Soziologie und Politologie (ganze) Gesellschaften oder Kul'
Forschungsgebiet und den Forschungsressourcen zu treffen. Schließlich können ethi
turen als Einzelfälle behandelt.
sche Kriterien eine Beschränkung auf eine Einzelfallstudie nahelegen. Etwa wenn ein
So kann z. B. die (klassische) Analyse von Gnrcnn (1967), welche die ,,soziale Schich-
Drogenabhängiger in eine neue, bisher nicht bewährte Therapie eintritt.l
tung des deutschen Volkes" untersucht, als Einzelfallstudie betrachtet werden.
Einzelfallanalysen werden in den Sozialwissenschaften unter zwei unterschied-
lichen Aspekten vorgenommen. Zum einen, wie bisher unterstellt, als Mittel der Be-
Einzelfallstudien können somit auf der Auswahlebene und auf der Analyseebene auf
schreibung und Erklärung bzw. des Hypothesentests. Dabei unterscheiden sich die
ein Individuum als Gegenstand zurückgreifen oder auf derAuswahlebene mehrere oder
gar sehr viele Individuen umfassen, die jedoch im Hinblick auf das Untersuchungsziel
einzelnen Schritte des Forschungsprozesses abgesehen von der Realisierung eines
Auswahlverfahrens nicht von anderen Forschungsstrategien. Zum anderen werden
als eine Einheit aufgefasst werden. Dies ist in der Regel der Fall bei Studien, die Erklä-
Fallstudien häufig in einer explorativen Absicht unternommen. Dabei verfolgt die
rungen von Gruppen-, Organisations- oder Gesamtgesellschaftsphänomenen geben
Einzelfallstudie nicht das Ziel einer Theorieprüfung, sondern dient der Hypothesenge-
wollen. Die entsprechenden Hypothesen beinhalten dann zumeist Aussagen über Ver'
nerierung. Unter dieser Zielsetzung wird die Einzelfallstudie zumeist in Verbindung
netzung, Arbeitsteilung, Informationsfluss, Entscheidungsprozesse u. a. zwischen und
mit weniger standardisierten Datenerhebungsverfahren (offenes Interview teilneh-
über Individuen hinweg. Auch wenn die Aussagen solcher Studien im Allgemeinen
mende Beobachtung) eingesetzt. Das so gewonnene Material liefert neben anderen
überindividuelle Sachverhalte betreffen, wird bei der Datenerhebung auf Individuen
als Merkmalsträger zurückgegriffen.l Quellen dann wichtige Informationen zur Theoriebildung und Konzeptspezifikation.
gibt verschiedene Gründe ftir die Festlegung auf eine Einzelfallstudie (Huenn Dafür können, wie für den gesamten Entdeckungszusammenhang von Hypothesen
Es
und Theorien, keine allgemein verbindlichen Regeln angegeben werden.
L9T3t38-43)z Zu erklärende soziale Ereignisse können raum'zeitlich und personell
Zusammenfassend muss beachtet werden, dass Einzelfallanalysen sich für die Hy-
sehr selten sein, so dass sich praktisch keine Alternative zu einer Einzelfallstudie
pothesengenerierung und die Plausibilisierung oder Entdeckung von Prozessabläufen
ergibt. Sowohl für Personen in bestimmten Positionen (Bundespräsident), Gruppen
(Verfassungsrichter, Fußballnationalmannschaft), Organisationen (Weltbank, UN, IBM) eignen, nicht hingegen für den endgültigen Test einer Theorie. Aufgrund der Probleme
gar der empirischen Gültigkeit von Basissätzen (vgl, hierzu Kapitel 3,1.4.2) sind solche
als auch für Gesamtgesellschaften kann dies zutreffen. In diesen Fällen stellt sich
(vgl' Kapitel6), da die Tests allenfalls nur durch wiederholte unabhängige Prüfungen an verschiedenen Un-
nicht erst die Frage nach einem möglichen Auswahlverfahren
tersuchungsobiekten durch verschiedene Untersuchungsgruppen möglich. Obwohl
Analyseeinheit zugleich die Gesamtheit der möglichen Auswahlelemente darstellt.
Einzelfallstudien häufig unverzichtbare erste Schritte eines Forschungsprogramms
In den Fällen, in denen es praktisch möglich wäre, mehrere vergleichbare Analyse'
sein können, sind sie keinesfalls zur Theorieprüfung geeignet.
einheiten (Gruppen, Gemeinden, Unternehmen) zu untersuchen, führt oft ein Mangel
aus
an ökonomischen Forschungsmitteln zu einer Beschränkung auf Einzelftille. Wenn
diesen Gründen auf den Einsatz von Auswahlverfahren verzichtet wird, so ergibt sich
be-
ffin-onutn einer solchen Fallstudie können aber auch Aussagen ftir die als Informationsüäger
mehr von einer ffirinr.rzbereich von Fallstudien, für den auch spezielle (experimentelle) Designs entwickelt
nutzten Individuen gemacht werden. In diesem Fall wäre dann korrekterweise nicht wurden, wird z. B. von PETERMANu (1989) detailliert dargestellt. Einzelheiten, vor allem in der Hinsicht
Aussagen
Einzelfallstudie zu sprechen. D. h, eine Studie kann ie nach den Einheiten, über welche auf Interventionsstudien, finden
einer Einzelfallstudie als auch den einet ,vielzahl"-srudie haben' sich in dem von Knnrocuwrlr,/LEvrN (2014) herausgegebenen Band.
erfolgen, sowohl den charakter
-
gen, Iftankenkassen u. a.).1 Im Rahmen der Tätigkeiten solcher Einrichtungen entste-
5.5.2 SekundäranalYse hen zwei zusätzliche Datenquellen: ,,Aggregatdaten" einerseits, ,,prozess-produzierte"
Bei der ,,selundäranalyse,, greift man zur

Überprüfung seiner Hypothesen auf bereits Daten andererseits.
dieser Vorgehensweise liegen in den
vorhandene DatenbeständJzurück. Die Vorteile
erheblichenEinsparungenanfinanziellenMittelnundpersönlicherLebenszeit,die 5.5.2.7 Studien auf der Basis von Aggregatdaten
wären.lDas Hauptproblem der Sekun-
ansonsten flir eine DatÄerhebung notvvendig lJnter ,,Aggegatdaten" (oder analytischen Merkmalen) versteht man solche Merkmale
zu beschaffen' Die Beschaffung der Daten
däranalyse besteht darin, adäquaie Daten von Mengen von Untersuchungseinheiten, die aus Merkmalen der einzelnen Untersu-
wenn die sekundäranalyse ,,lediglich"
kann sich vergleichsweise einiach gestalten, chungseinheiten abgeleitet sind. Beispiele sind ,,Scheidungsfälle pro Gemeinde und
Datensatzes unter Zugrundelegung der
eine zweite Auswertung eines vorhandenen ]ahr" oder ,,SPD-Stimmenanteil pro Stimmbezirk". Solche analytischen Merkmale wie
(1969) die Untersuchung
gleichen Theorie anstrlbt. So überprüften Huumrll lOpp Anteile oder Mittelwerte werden in bürokratischen Gesellschaften für eine Vielzahl
vonLtpsrru.a.(1956)zum,'ehernenGesetzderoligarchie..mitteilweiseanderen von Fragestellungen erstellt.
Analysemethoden.
DeutlichschwierigeristdieDatenbeschaffungfüreineSekundäranalyse,wenn
Daten getestet werden, die aus einem 5.5.2,7,7 Aggregatdatenanatyse zur Erklärung individueller Handlungen
bisher nicht geprüfte iheorien mit Hilfe von
einer anderen Theorie erhoben wur- Ein Problem bei der Verwendung von Aggregatdaten entsteht dann, wenn Zusam-
anderen theoretischen Blickwinkel b Tw. zumTest
aus vorhandenen Datenbeständen menhänge zwischen Aggregatdaten-Variablen so interpretiert werden, als ob diese
den. Es müssen dann Indikatoren bzw. Variablen
Konstrukte gefunden werden' Zugleich muss das Zusammenhänge auf der Ebene der Individuen zu beobachten seien. Beobachtet man
für die nunmehr interessierenden
benutzten Daten angewen- z. B, einen Zusammenhang zwischen der Anzahl der Ehescheidungen in den Gemein-
Auswahlverfahren, welches für die bei der Sekundäranalyse
Aussagebereich kompatibel sein' so den und der Anzahl der erwerbstätigen Frauen in den Gemeinden, dann folgt daraus
det wurde, auch mit dem nunmehr angestrebten I
I
rrichf, dass sich die erwerbstätigen Frauen zu einem besonders hohen Anteil scheiden
nützteswenig'wenngeeignetelndikatorenvorliegen,dieseiedochnuranmännlichen
I lassen. Ein solcher Fehlschluss von Zusammenhängen auf Aggregatebene auf Zusam-
JugendlichenerhobenwurdenunddieSekundäranalyseAussagenüberErwachsene
h. menhänge auf individueller Ebene wird als ökologischer Fehlschluss bezeichnet.2 Da
anstrebt.
Variablen und Auswahlverfahren keine Informationen über die Individuen vorliegen, sind verschiedene Erklärungen auf
Für eine erfolgreiche Datensuche hinsichtlich
sehr nützliche Dienste'2 Sie stellen der Individualebene mit den gleichen Zusammenhängen auf der Aggregatebene ver-
leisten die sozialwissenschaftlichen Datenarchive
einbar. So könnte der Zusammenhang zwischen dem Anteil erwerbstätiger Frauen und
gegeneingeringesEntgeltvorhandeneDatensätzezurwissenschaftlichenBearbei.
der Scheidungsquote dadurch entstehen, dass Ehen mit nicht-erwerbstätigen Frauen
tungzurVerfügung.nareisindzumindestdieneuerenDatenfastimmerbereitsin
die
gängigen Datenträgern zu erhalten' wodurch in Gebieten mit einem hohen Anteil erwerbstätiger Frauen eher geschieden werden.
maschinenlesbarer Form und auf den
Die Analyse von Aggregatdaten zur Erklärung individueller Handlungen ist aufgrund
Datenaufbereitung (vgl. Kapitel S) entfällt'
amt' des Problems des ökologischen Fehlschlusses eine nahezu vollständig ungeeignete
Daneben existierln vielfältige andere mögliche Datenquellen: Die
Bundesamt, statistische Landesämter und kommunale
Vorgehensweise.
liche statistik (statistisches
'eäoch
Einrichtungen (Bundesversi'
statistische Amter), andere staatliche oder halbstaatliche
organisationen (EU, UN, OECD
cherungsanstalt, sonstige Behörden), internationale 5,5,2,7.2 Makro-komparative Studien
(Banken, Kaufhauskonzerne, Versicherun'
u. a.) und auch kommeriielle lnstitutionen Eine besondere Form der Aggregatdatenalyse stellen ,,makto-komparative Studien"
dar.3 Hierbei werden Kennziffern verschiedener Gesellschaften miteinander verglichen.
1 Methodische Probleme werden bei Lenn (2010) diskutiert. Ein Überblick über die verschiedenen
Formen vorhandener Daten gevuinnt man durch die Lektüre der Beiträge in Band 2 des Gutachtens des
eher die Regel als die Ausnahme'
6ä?rina sekundäranalysen in akademischen Kontexten diese RArswD (2010).
für Sozialwissenschaften" in Köln
2 In Deutschland hat das von Gesis betriebene "Datenarchiv Zusatzin- 2 Vgl. RoBTNSoN (1950) und Hurunull (1972t71-92). Nur unter sehr speziellen Bedingungen ist ein
Datensätze inklusive der entsprechenden
Aufgabe übernommen. Dott sind derzeit über 5500 verftigbar' solcher Schluss möglich, vgl. hierzu LeucnulN/LrcHrMAw (1978) und KIr.rc (1997).
(Bericht über Anlage und Durchführung der untersuchung, codepläne etc')
formationen 3 Solche Studien werden leicht irreführend auch als ,,internationaler Vergleich" bezeichnet,
man in Anhang H'
Hinweise auf die wichtigsten Datenarchive findet
-'1

- l
Länder (meist willkürlich) 5,5,2.2 Analyse prozess-produzierter Daten

üblicherweise wird bei Studien dieses Typs eine Anzahl Neben Aggregatdaten werden innerhalb von Bürokratien weitere potentielle Daten-
internationalen statistischen
ausgewählt und deren in Datensammlungen wie z. B.
quellen produziert: Sogenannte ,,prozess-produzierte Daten" (RoxxAt.t t976t454),Dies
JahÄüchern veröffentlichte Aggregatdaten miteinander verglichen'l
prinzipiell kaum lösbare Probleme sind im weitesten Sinne Aufzeichnungen, die nicht zum Zwecke der wissenschaftlichen
Diese Forschungsstrategie weist zahlreiche,
Analyse, sondern im Rahmen der jeweiligen Arbeitsbereiche dieser Organisationen
auf: gesammelt werden (Btcx/MeuVMüllnn L9842123), Beispiele für die Nutzung solcher
Datensammlung (z' B'
- selektive stichproben durch systematische Effekte der
Daten sind vor allem im Bereich der Rechtssoziologie (Analyse von Akten aus Gerichts-
Ausfall der Datenerhebung durch historische Ereignisse)
verfahren) und in der historischen Sozialforschung (Analyse vielfältigster Dokumente)
-geringeFallzahlbeipotentiellunendlichvielenKontrollvariablen zu finden. Ein Beispiel, in dem inhaltlich beide Bereiche thematisiert werden, stellt die
über die
- Abhängigkeit der Beobachtungen der gleichen untersuchungseinheiten
Arbeit von Mawu (1987) dar. Dabei wird als Quelle für die Untersuchung von ,,Protest
Zeit(2.8. USA 1990 und USA 1991)
und Kontrolle im Dritten Reich" auf Gestapo-Akten, Gerichtsakten, Adressbücher u. a.
- Abhängigkeiten der Beobachtungen durch räumliche Nähe
(Märkte, Kriege) zurückgegriffen.
- Abhängigkeiten der Beobachtungen durch Austauschbeziehungen
über die Zeit Solche prozess-produzierten Daten sind nicht frei von Verzerrungen. Auch wenn
- unvergleichbarkeit der Datenerhebung zwischen den Beobachtungen
hiet z.B. keine Versuchsleiter- oder Interviewereffekte zu erwarten sind, so haben
(2. B. Anderung der Datenerhebungsverfahren)
der Datenerhebungs- doch auch diese Daten einen Entstehungsprozess, der sich aufdie Güte des Materials
- unvergleichbarkeit der Datenerhebung durch Veränderung
Reiches durch Kriege) auswirkt. So verfügen Behördenmitarbeiter als Aktenbearbeiter und damit Datenprodu-
einheiten (2. B. Gebietsstandsänderungen des Deutschen
unterschiede zwischen den Date' zenten z. B. über bestimmte Ermessensspielräume bei ihrer Dokumentation, Klienten
durch
- unvergleichbarkeit der Datenerhebungen
Deftnitionen oder Datenberei verfolgen mit ihren Angaben gewisse Ziele, die das Verschweigen oder Betonen von
nerhebungseinheiten (2. B. durch unterschiedliche
bestimmten Sachverhalten nahelegen u. a. (vgl. dazu Btcx/MÜlrrn 1984:130-147). Die
nigungsregeln)
genaue Kenntnis des Entstehungsprozesses der Daten, der Operationalisierung und
- ungeklärte Reliabilität und Vatidität der Indikatoren
(im sinne der Messung sowie die Bestimmung der Güte der Messung gehören somit selbstverständ-
- vernachlässigung des Nachweises, dass überhaupt ,,Messungen"
lich zu einer Sekundäranalyse (Iüncolt/Netsex 1985:52-62).
axiomatischen Messtheorie) vorgenommen wurden'
möglicher Alternativer-
Trotz der Bemühungen einiger Methodologen2 muss die Zahl 5.5.2.3 Record-linkage-Studien
als so hoch betrachtet werden' dass der
klärungen bei makro-komparativen Studien Die Möglichkeiten der Sekundäranalyse prozess-produzierter Daten können beträcht-
die Möglichkeit kausaler
langfristige Ertrag dieser untersuchungsform in Hinsicht auf lich erweitert werden, wenn mehrere Datensätze verknüpft werden, Man spricht in
Aussagen skeptisch beurteilt werden muss'3 diesem Fall von ,,record-linkage", So könnte man den Zusammenhang zwischen Lang-
zeitarbeitslosigkeit und Erkrankungen überprüfen, falls z. B. die Daten der Bundes-
agentur ftir Arbeit mit den Daten von Ikankenkassen verkntipft werden könnten.
dieser Forschungs- Um dabei auch Aussagen über einzelne Individuen machen zu können, benö-
ffi**", *eitschweifige, aber leicht verständliche Darstellung der Probleme
(2003).
tigt man mindestens eine gemeinsame Identifikationsvariable. In skandinavischen
richtung findet sich bei GEDDES
z'8. in diesem Zusammenhang Ländern existiert eine einheitliche Personenkennziffer, die in der Bundesrepublik
2 Hierzu gehören vor allem die Arbeiten von Gary KING, vgl'
Kruc/Knonarqt/Vnnsa (1994)'
rechtlich nicht zulässig ist. In der Bundesrepublik verwenden verschiedene büro-
finden sich zahlreiche weitere
3 In der derzeitigen Forschungspraxis makro-komparativet Forschung kratische Organisationen verschiedene Personenkennziffern (Matrikel-, Personalaus-
Form det Kontrolle von Störvariablen oder Fehlet
Probleme, so z. B. die Vernachlässigung iedweder weis-, Krankenversicherungs-, Sozialversicherungs-, Rentenversicherungsnummer
(2. B. Selektion nach den Ausprägungen der
durch fehlerhafte Auswahl der untersuchungseinheiten etc.). Dateien mit mehreren verschiedenen I(ennziffern für dieselbe Person in unter-
auf solche Da-
abhäingigen Variablen). Schließlich ist die Anwendbarkeit vieler Datenanalyseverfahren
(1993:321) schiedlichen Organisationen existieren selten. Unter solchen Umständen bleiben als
fassen Bollw/Et'trwlsLE/AlnnnsoN
ten prinzipiell fraglich (vgl. Kapitel9.4,3). Entsprechend
mögliche Identifikationsvariablen in der Regel nur der Name, das Geburtsdatum und
ihreÜbersicht über solche empirische Studien etwas resignativ zusammen:
die Adresse der Person. Name und Adresse können sich ändern; alle drei Merkmale sind
have explanation as a goal. A maior threat to
many studies
,,Nearly all the studies we investigate mit Erfassungsproblemen verbunden. Verknüpft man lediglich diejenigen Personen
wish to draw general conclusions'
(. . .) is the failure to apply any method of control. Most authors miteinander, bei denen alle Identiflkationsvariablen fehlerfrei übereinstimmen, erhält
ability to do so. Researchers agree that
but problems ofsampling raise questions about theit
irr,r.r rur.uiäiig *.urotut"nt are largely neglected"'
measurement is problematic, However,
zt0 5 Forschungsdesign und Untersuchungsformen 5.5 Untersuchungsformen 231
- -
man nahezu mit Sicherheit selektive Stichproben. Entsprechend sind fehlertolerante ursprünglichen Datenbeständen A und B erstellen die Datengeber Auszüge, die nur die
Verknüpfu ngsmethoden notwendig.l ursprünglichen Identifikationsvariablen (Name etc.) und die jeweilige neue Kennziffer
Die Nutzung von prozess-produzierten Daten für Sekundäranalysen ist stark von enthalten. Beide Auszüge werden einem Datentreuhänder übergeben, der nun zwar
den Zugangsbedingungen zu den Datenbeständen abhängig. Zentral ist dabei die die ursprünglichen Identifikationsvariablen und die neuen Identifikationsnummern
Behandlung der ldentifikationsvariablen: Die Weitergabe personenbezogener Daten kennt, aber nicht die Daten aus A und B. Der Datentreuhänder verknüpft die beiden
mit Identifikationsvariablen ist häufig heikel. Eine Möglichkeit zur Vermeidung des Auszüge über die ursprünglichen Identifikationsvariablen, flihrt also die Zuordnung
(vgl. Abb. 5'10' der Records aufgrund gleicher oder ähnlicher ldentifikationsvariablen durch. Danach
Problems ist die Verwendung einer Institution als ,,Datentreuhänder"
löscht der Treuhänder die ursprünglichen ldentifikationsvariablen und erstellt eine
neue Datei, die nur die Paare aus beiden neuen Kennziffern enthält. Diese Datei wird
Datengeber A Datengeber B dem Forschungsteam übermittelt. Mit dieser Datei können die Datenbestände A und B
zusammengeführt werden, ohne dass das Forschungsteam die Identität der Personen
NameA NameB NummerB Daten B
DatenA NummerA
kennt.
Welche Institution sich als Datentreuhänder eignet, hängt vom jeweiligen For.
schungsgegenstand ab.l Möchte man verhindern, dass der Treuhänder die Identifi-
katoren kennt, können die Datengeber die Identifikatoren verschlüsseln. Dies führt
Treuhänder aber zum Verlust aller Fälle, bei denen die Identifikatoren durch kleine Datenfehler
(2. B. vertauschte Buchstaben im Namen) nicht vollständig tibereinstimmen. Ein von
NummerA Name A Name B NummerB
ScHNeLL/BlcHrEtER/REIHnn (2009) entwickeltes Verfahren erlaubt aber auch fehler.
tolerantes Record-Linkage mit verschlüsselten ldentifikatoren. Dies sollte den Zugang
zu Datenbeständen für das Record-Linkage erleichtern.
Um prinzipiellZugmgzuDaten für das Record-Linkage zu erhalten, müssen selbst-
DatenB
verständlich alle Datenschutzgesetze strikt eingehalten werden. Nicht selten hängt der
Daten A NummerA NummerB
prinzipielle Zugang zu anonymisierten Daten davon ab, inwieweit man sein Anliegen
als sinnvoll und allgemein dienlich darstellen kann.
Gerade in sozialwissenschaftlichen Anwendungen von Record-Linkage wird dieses
lediglich verwendet, um Befragungsdaten mit individuellen administrativen Daten zu
verbinden. Abhängig von den rechtlichen Bedingungen im jeweiligen Untersuchungs-
Daten A Daten B
land und dem Verwendungszweck ist hierfür häufig die Einwilligung der Personen
erforderlich.2 Sollte für ein Record-Linkage-Projekt die Einwilligung der Befragten
Abb. 5.11 Record-Linkage mit einem Datentreuhänder
Im Falle zweierDatengeber mit den Datenbeständen Aund Bwerden die Datenbestände

unabhängig voneinander beliebig, aber eineindeutig mit ieweils einer neuen lGnnziffer
versehen. Die neuen Kennziffern werden jeweils den Datenbeständen zugefügt' Das I Insbesondere für die Sozialwissenschaften wurde ein entsprechendes Record-Linkage-Zentrum
Forschungsteam erhält die beiden Datensätze A und B mit ihrer ieweiligen neuen Iden' (GRIC) am Forschungsdatenzenftum des IAB gegründet (ANroNr/Scruru.2ol7);www.tecord-linkage.
tifikationsnummer, aber ohne die ursprünglichen ldentifikationsvariablen. Aus den
de
2 So kann z. B, für die Untersuchung, warum Personen die Teilnahme an Befragungen verweigern, es
dwchaus möglich sein, dass für Verweigerer demographische Angaben wie z, B. Alter, Geschlecht oder
ortsgrößenklasse verwendet werden können, ohne dass eine Einwilligung erforderlich ist. Im Detail
bei HER' sind die Klärungen, was im Rahmen des Datenschutzes möglich ist, zumeist Gegenstand langiähriger
1 Entsprechende Computerprogramme sind keineswegs trivial. Eine Einfihrung findet sich
und weitere Details finden sich bei Verhandlungsprozesse mit den zustlindigen Datenhaltem, Eine Einftihrung in die
zoclScsrunnN/WIHrLnn (2007), eine Programmbeschreibung ehvas unübersichtli-
(2005). Piogramm (MTB) ist tiber www'record' che rechtliche Situation
SOrurlr,/BacHrrlnn/BuNorn Ein leistungsftihiges des Datenschutzes im Rahmen der Forschung in Deutschland ftndet sich in
einer Handreichung des RATSWD (2017),
linkage.de verfügbar. Ein entsprechendes Paket ftir R ist die Bibliothek PPRL (Scsmlr,/Rux'lsz2178)'
-
te von Berufspolitikern und deren Konsequenzen ftir ihr Abstimmungsverhalten zum
erforderlich sein, dann sind selektive Ausfälle durch die Verweigerung der Zusammen-
Gegenstand der Analyse machen.
ftihrung zu erwarten.l
Unter einem Netz bzw. Netzwerkversteht man,,a specific set of linkage among a
Record-Linkage ist in einigen Forschungsfeldern (2. B. der medizinischen For'
defined set of persons . . . " (MItcHnn t96922) oder auch anderer sozialer Einheiten
schung) eine übliche Datenerhebungsmethode.2 In den Sozialwissenschaften wird
(wie etwa Firmen, Kommunen, Verbände oder Vereine etc.). Die Einheiten werden
Record-Linkage bislang eher selten eingesetzt; üblich ist hier lediglich die Verwendung
allgemein als l(noten bezeichnet und die Verbindungen zwischen den I(noten stehen
prozess-produzierter Daten zur Validierung oder Ergänzung der Angaben in Befragun'
für eine (oder mehrere) bestimmte Art(en) von sozialen Beziehungen bzw. Strukturen.
gen.3 Angesichts der Vorteile des Record-Linkage (Größe der Datenbestände, geringe
Netzwerke lassen sich als Graphen darstellen.l So können z. B. besonders zentrale oder
Kosten, relativ hohe Datenqualität bei vielen - aber nicht allen - Datenbeständen) wird
isolierte Akteure leicht identifi ziert werden.
die Nutzung vorhandener Datenbestände durch Record-Linkage für Forschungszwecke
auch in den Sozialwissenschaften sicherlich zunehmen.
5.5.3 Netzwerkanatyse
GUADAGNI
Wie die Einzelfallstudie und die Sekundäranalyse ist die Netzwerkanalyse keine beson' STROZZI
dere experimentelle oder quasi-experimentelle Untersuchungsanlage, sondern eine

bestimmte Forschungsstrategie, deren Anliegen in der Beschreibung und Erklärung
von sozialen Beziehungen und daraus resultierenden Handlungen besteht. Die Netz'
werkanalyse zielt auf die Erfassung aller ein Netzwerk bildenden Einheiten und deren
Relationen untereinander. Dabei geht dieser Ansatz davon aus, dass
RIOOLFI
,,(, . . ) the structure of relations among actors and the location of individual
actors in the network
have important behavioral, perceptual, and attitudinal consequences both for the individual units
and fot the system as a whole (. . (KIoxn/KUKLINSKI 1982:13).a
')"
Die Verflechtung der Untersuchungsobjekte in soziale Kontexte wird also explizit be'
rücksichtigt: So kann manz.B. die Freundschafts' oder Mobilisierungsbeziehungen
zwischen den Mitgliedern einer Bürgerinitiative untersuchen oder die privaten Kontak'
SALVIATI
ACCIAIUOL
Fi.r. ror* aer Nichtkooperation kann als Nonresponse wie bei Beftagungen (vgl. Kapitel 5.7) inter-
pretiert werden Scslull in der Einwilligungsrate schon
(2015), Entsprechend zeigen sich Unterschiede PUCCI
durch kleine Variationen der Form der Anftage. Eine knappe Übersicht über den Forschungsstand
findet sich bei Saxsnauc/Altotq (2017). 4bb.5.12: Beispiel eines Netzwerks: Florentinische Famitien lm frühen 15ten Jahrhundert
2 Es gibt eine eigene internationale Fachgesellschaft ftir die Forschung mit Record-Linkage
von Daten-
Landes enthalten: Intemadonal Population Data
sätzen, die im Idealfall die gesamte Population eines
Linkage Network (www.ipdln.org). Dieses Netzrrverk veröffentlicht öe Zeitschrift ,,International Journal
of Population Data Science" (https://ilpds.org), die z. B. Beiftäge aus del Demographie, Epidemiologie
und Soziologie veröffentlicht.
über
3 Methodische Details solcher Studien finden sich bei GRovES (1989t299104). Eine Übersicht
weitere Anwendungen und technische Möglichkeiten flndet sich bei ScrNnLL (20t5) und auf der
IDurch diese Art der Darstellung werden zahlreiche, deutlich anspruchsvollere Analysetechniken
Homepage des German Record Linkage Centers (GRLC, www.record-linkage.de).
möglich. Eine neuere Darstellung der Netzwerkanalyse und der Analysetechniken geben Tnanr-
4 Die Tatsache, dass die Netzwerkanalyse inhaltliche Annahmen besitzt, rechtfertigt die Benennung MANN/HUMMELI
(,,wenn-dann", ,,je'desto") existieren nur /Sonnun (2011). Ein nützliches Nachschlagewerk zur Netzwerkanalyse ist das von
,,Netzwerktheorie,. in keiner weise: Allgemeine Hypothesen Scorr/CARRrNGror,r (2011) herausgegebene
Buch.
bei speziellen Anwendungen der Analysemethode. Eine ,,Netzwerktheorie" existiefi nicht'
234 5 Forschungsdesign und Untersuchungsformen 5.5 Untersuchungsformen 235
- -
Ein Beispiel stellt die Abbildung 5,I2danL Dieses Netzwerk resultiert aus den Ver' den werden. Bei Gesamtnetzwerken werden von jeder Einheit Daten über alle anderen
flechtungen 16 florentinischer Familien im frühen l5ten Jahrhundert. Die Verbindun' Einheiten erhoben. Man hat also alle Verbindungen innerhalb des Netzwerkes, unab-
gen zwischen den Familien basieren hier entweder auf Heiraten odet wirtschaftlichen hängigvon der Perspektive einer einzelnen Person. Ego-zentrierte Netzwerke hingegen
Verflechtungen wie gemeinsame wirtschaftliche Unternehmungen oder vergebene Kre- erheben die Daten über das Netzwerk aus der Sicht einer bestimmten Person. Diese
dite.2 Die besondere Stellung der Familie Medici ist im Netzwerk deutlich zu erkennen. gibt gemäß ihrem subjektiven Kenntnisstand Auskunft über ihre Beziehungen zu an-
prinzipiell ist die Netzwerkanalyse an kein bestimmtes Datenerhebungsverfahren deren Personen und über die Beziehungen der anderen Personen untereinander. In
gebunden. Die Daten können sowohl durch Befragung oder Beobachtung als auch der Forschungspraxis werden fast ausschließlich uniplexe Netzwerke aus der Gesamt-
über sekundäre Quellen (Akten, Protokolle, Geschäftsunterlagen etc.) gewonnen wel' oder Ego-Perspektive erhoben.
den. So gewannen z. B. CRyp4NA/VARESE (2013) die Daten für ihre Netzwerkanalyse Den Vorteilen der Netzwerkanalyse bei der Erfassung und Analyse sozialer Bezie-
durch die Vercodung der Polizeiprotokolle abgehörter Telefonate von Mitgliedern der hungen stehen jedoch auch einige nicht unbedeutende Probleme gegenüber:
neapolitanischen Camorra und der russischen Mafia in Rom. 1. Netzwerke sind häufig nicht klar abgrenzbar, prinzipiell ist eine gesamte Gesell-
Die in einer Netzwerkanalyse erhobenen und analysierten Beziehungen können schaftvernetzt (Mnnsonn 199O:4390. ZurUntersuchungmüssen iedoch Netzwerke
nach unterschiedlichen formalen und inhaltlichen Eigenschaften charakterisiert wer- immer auf einen handhabbaren Umfang beschränkt werden, auch auf die Gefahr
den. Zwei der wichtigsten formalen Eigenschaften stellen die Symmetrie und die Be- hin, dass dadurch wichtige Einheiten ausgeschlossen werden.
wertung solcher Beziehungen dar.3 Eine symmetrische Beziehung liegt dann vor, wenn 2. Es existieren keine Zufallsauswahlverfahren, mit denen Netzwerke als solche zufäl-
eine eventuelle Richtung der Beziehung nicht beachtet wird. Es wird also nur eine lig ausgewählt werden können. Zuftillig ausgewählt werden können nur bestimmte
bestehende Verbindung A-B referiert, ohne Beachtung der zusätzlich möglichen Spezif,- Gruppen, von denen man annimmt, dass sie ein Netzwerk bilden. Damit ist die
kation, wer an wen z. B. eine Leistung erbringt, Informationen weitergibt' Geld leiht o.ä. Netzwerkanalyse vor allem ein strukturbeschreibender Ansatz.
Werden solche Richtungen hingegen berücksichtigt, spricht man von asymmetrischen 3. Nur wenn alle relevanten Einheiten eines Netzwerkes auch als Informanten zur
Beziehungen, die als gerichteter Graph dargestellt werden. Eine bewertete Beziehung
I
I
Verfügung stehen, ist eine sinnvolle Analyse möglich. Verweigern Personen ihre
liegt dann vor, wenn auch Angaben über die Stärke oder Intensität einer Beziehung
I
I
Mitarbeit, dann kann durch diese Ausfälle bzw. fehlenden Werte die Struktur des
erhoben und analysiert werden. ,,Restnetzwerkes" von der tatsächlichen stark abweichen.
Bezüglich der inhaltlichen Eigenschaften können prinzipiell beliebige Beziehun- I
gen Gegenstand der Analyse sein. Sie können privater, freundschaftlicher, geschäftli Die Erhebung und Analyse ego-zentrierter Netzwerke wirft andere Probleme auf. Ein
cher, rechtlicher oder anderer Art sein. Welche Beziehungsart erhoben und analysiert ego-zentriertes Netzwerk umfasst nur die Personen, mit denen ein Akteur in direkter
wird, ist von der theoretischen Fragestellung abhängig.a Verbindung steht und die vom Akteur wahrgenommenen Relationen ntrischen diesen
Netzwerke werden nach einer Reihe von Kriterien klassifiziert.5 So werden vor Personen. Die dem Akteur unbekannten Verbindungen zwischen den Personen, mit d€-
allem uniplexe und multiplexe Netzwerke unterschieden. In uniplexen Netzwerken nen er direkt verbunden ist, werden somit nicht durch ego-zentrierte Netzwerkstudien
wird ein Beziehungstyp, in multiplexen werden gleichzeitig mehrere untersucht. Be' erfasst. Damit entfällt aber auch die Möglichkeit, Effekte solcher objektiv vorhande-
trachtet man Netzwerke nach den Bezugspunkten bei der Datenerhebung, so können nen, aber subjektiv nicht wahrgenommenen Verbindungen auf die Handlungen der
Gesamtnetzwerke und ego-zentrierte Netzwerke (persönliche Netzwerke) unterschie' Auskunftsperson zu überprüfen.
Die Vorgehensweise bei der Erhebung und Erfassung von ego-zentrierten Netz-
werken entspricht weitgehend der üblichen Surveyforschung und wird auch in diese
1 Der Datensatz ist unter http://vlado.fmf,uni-lj.si/pub/networks/data/Ucinet/UciData.htm verfiigbar,
unter integriert. So wurden im ,,General Social Survey" (GSS) und im ALLBUS ego-zentrierte
die Visualisierung des Netzwerkes erfolgte mit dem Programm Pajek. Das Programm findet sich
http: i/paiek.imfm.si/doku.php?id=download.
Daten erhoben. Üblicherweise wird dabei in einen Fragebogen ein sogenannter ,,Netz-
2 Auf der Grundlage einer von KENr (1978) durchgeführten Recherche historischer Dokumente wurde werkgenerator" oder,,Namensgenerator" und eine Reihe von Folgefragen aufgenom-
durch paocnrr (1987) in einer unveröffentlichten Arbeit ein Datensatz erstellt. Der hier verwendete men. Der einfachste Generator besteht aus der Frage nach den ,,drei besten Freunden"
oder
Datensatz von Bnucun/PerrrnsoN (1986) enthält nur dieienigen Familien, die als Unterstützer einer Person, die z. B. mit A, B und C gekennzeichnet werden (Lauualvx 1973). Der
Gegner der Medici-Familie auftraten. Befragte beantwortet danach inhaltliche Fragen zu den jewelligen Eigenschaften von
weitergehenden Differenzierungen vgl. Scsnrvx (t984:42ff), Fncnn (1987: 204) und Peppr 957:15il'
(1
3 Zu
4 Zur Systematisierung der inhaltlichen Beziehungen wurden verschiedene Typologien entlvickelt'
Vgl. dazu KI.rorn/KuxltNsrt (1982r15f); BARNES (1972:16fr)i PAPPI (1987).
s Vgl. Sürwx (1984:30ff); PepPI (1987:12ff),
5.7 Weiterführende Literatur 237
2t6 5 Forschungsdesign und Untersuchungsformen
-
-
Vor diesem Hintergrund ist auf die ,,Triangulation" hinzuweisen.l Triangulation ist
A, B und C.1 So können dann, in Orientierung an den Forschungsfragen' Informatio-
weder ein eigenständiges Verfahren noch eine Methode, sondern lediglich ein Begriff
nen zu soziodemographischen Merkmalen, politischen Einstellungen, empfangenen
für den Versuch, durch den kombinierten Einsatz verschiedener Erhebungstechniken,
Hilfeleistungen, Kontakthäufigkeiten etc. gesammelt werden. Weiter lässt sich über
Auswahlverfahren, Versuchsanordnungen und Messtechniken die speziflschen Schwä-
entgprechende Fragen auch feststellen, ob A, B oder c aus der sicht des Befragten
pflegen oder chen der einen Strategie durch den Einsatz einer anderen, die dort ihre besondere
untereinander befreundet sind, bestimmte private Austauschbeziehungen
Stärke hat, zu kompensieren. Aus der Vielzahl der praktischen Triangulationsmög-
geschäftliche Kontakte unterhalten.
lichkeiten sei hier auf die ,,methodological-between-trtangulation" hingewiesen, die
Im Gegensatz zu herkömmlichen Vorgehensweisen in der Umfrageforschung, die
dieser unterschiedliche Untersuchungsanordnungen zur Überprüfung einer Theorie bei den
ebenfalls z. B. Kontakte zu Verwandten, Freunden oder Kollegen bzw. Merkmale
die relevanten gleichen Personen einsetzt (Dnwzrirr 1970:308). So könnte z. B. eine Korrelationsanord-
Personenkreise erheben, werden bei der ego-zentrierten Vorgehensweise
(Freunde, Verwand- nung mit ihren Vorteilen (große Anzahl untersuchter Personen, relativ ausgeprägte
Personen also nicht über festgelegte allgemeine soziale Kategorien
Personen spezifiziert, nach ihrer externe Validitäfl in einer Studie zusammen mit (einer Reihe von) Experimenten im
te etc.) vorgegeben, sondern sie werden von Ego als
Labor (relativ hohe interne Validitä$ Anwendung finden. Auf diese Weise ist es möglich,
Bedeutung ausgewählt und bei einigen Netzwerkgeneratolen in ihrer Anzahl bewusst
katego- eine Theorie einem Maximum an empirischen Tests auszusetzen und dabei verfahrens-
eingeschränkt. Danach können dann diese sozialen Beziehungen nach ihrer
Etwa danach, ob und wie viele der ,,besten spezifische Fehlerquellen zu minimieren.
rialen Zugehörigkeit untersucht werden:
Freunde" Arbeitskollegen oder Nachbarn sind (vgl' PAPPI 1987:2Of). Weitere
Analy-
semöglichkeiten für ego-zentrierte Daten liegen z. B. in der Berechnung der Dichte
dieses persönlichen Netzes, welche dann z. B. für das Ausmaß an sozialer
Unterstüt' 5.7 Weiterflihrende Literatur
zung von Relevanz ist.
Elementare Einführungen in das Forschungsdesign und verschiedene Untersuchungs-
Ego-zentrierte Netzwerke sind eine Ergänzung der üblichen Befragungstechniken,
und ana- formen in den Sozialwissenschaften geben BoRDENS/ABBorr (2018) und Tossrov
da mit ihrer Hilfe die Einschätzung der sozialen Umgebung detailliert erfasst
(2015) für die Politikwissenschaften. Eine grundlegende und leicht verständliche Ein-
lysiert werden kann.2 Zwar ist diese Technik problemlos in konventionelle Surveys zu
führung in die Logik und den Aufbau von Untersuchungsanordnungen (,,Forschungs'
integrieren, aber alternative Erklärungen für die Ergebnisse bleiben daher stets möglich.
wahrgenomme- design") ist das mittlerweile klassische Buch von Caulrnll/Srnlllrv (1963). Die immer
Es handelt sich bei ego-zentrierten Netzwerken immer um die subjektiv
des Ausmaßes noch lesenswerten drei klassischen Bücher zur Artefaktforschung von Robert RosrN-
ne soziale Umgebung. Weiterhin können kausale Aussagen über Effekte
rIrx. und Ralph L, RosNow (,,Artifact in Behavioral Research", ,,Experimenter Effects
der Homogenität der Netze zumindest außerhalb von Längsschnittuntersuchungen
In Behavioral Research" und ,,The Volunteer Subject") wurden gemeinsam in einem
kaum geprüft werden.
Band neu veröffentlicht (Rosnwtw/RosNow 2009). Das mit Abstand beste verfügbare
Lehrbuch zum Forschungsdesign und potentiellen Artefaktquellen ist das Buch von
Sneorsu/Coox/Ceiuenrll (2002).
5.6 Kombination von Untersuchungsformen
Um tatsächliche Studien auf dieser Grundlage beurteilen zu können, sollte die
Entwicklung plausibler alternativer Erklärungen anhand der zahlreichen Beispiele
Wichtiger als eine weitergehende Differenzierung der genannten Untersuchungsfor-
Unter- in dem einzigartigen Buch von Hucx/Slt'lolrn (1979) geübt werden. Das Buch von
men ist die Betonung der Wichtigkeit einer Entscheidung für ein bestimmtes
durch KIxc/Knouewn/Vsnea (1994) zlmethodologischen Problemen und deren Lösungen
suchungsdesign im Sinne der Logik des Experiments (vgl. Kapitel 5.2). Denn
ermöglicht, wird die für qualitative und quantitative Studien gehört nun auch zur unverzichtbaren metho-
die Kontrollmöglichkeiten, die die Untersuchungsanordnung
dologischen Literatur zum Forschungsdesign.
Aussagefähigkeit einer Studie wesentlich bestimmt'
Gründliche Darstellungen der Analyse und des Designs von Experimenten
finden sich z. B. bei Mason/Gulsr/Hnss (2003), Mowrcounnv (2013) und MAx-
ffif,Ai"r.n Namensgenerator wird die maximale Größe des Netzwerkes forschungstechnisch
bereits auf drei personen beschränkt. Ferner ist die Formulierung ,,beste Freunde" mit verschiedenen
problemen verbunden, da die Befragten ihn verschieden interpretieren. Deshalb wurden weitere
(vgl' Lauruai'rr 1973;
Namensgeneratoren vorgeschlagen, die diese Probleme zu umgehen versuchen 1 Zu den verschiedenen Triangulationsmöglichkeiten
(2011)' vgl, Dnwzru (1970:297313);FIELDINc/FIELDING
FrscHER 1982; BURr 1984; n.u.r. Lit t"tur findet sich bei BIDART/CHARBoNNEAU
(tgeo:zl-42).
2 Die so gewonnenen Daten sind mit standaldstatistikproglammen zu analysieren.

SHE Kap5

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

SHE Kap5

Hochgeladen von

Copyright:

Verfügbare Formate

7a4 4 Konzeptspezifikation, operationatisierung und Messung

z. B. Mensu L982253-59,StxignrSe-el) häufig

Kompensation des Treatments Kontrollgruppe hat Zugang zum äquivalentem

5.3.3 Techniken zur Bildung von Kontrollgruppen

sich die weni'

5.4.3.7,7 Das Problem derVarianz der unabhängigen Variablen

mit den unabhän' ffiiurru uusftihrlich Kapitel 7.1.1.5.

212 5 Forschungsdesign und Untersuchungsformen

Tab. 5.3: lnterne Fluktuation

SummeAugust 900 100 1000

Konstanz der Messinstrumente

G2 x X X x Abb. 5.10: Geteiltes Panel

Bei der ,,selundäranalyse,, greift man zur

5.5 Untersuchungsformen 229

Länder (meist willkürlich) 5,5,2.2 Analyse prozess-produzierter Daten

Im Falle zweierDatengeber mit den Datenbeständen Aund Bwerden die Datenbestände

dere experimentelle oder quasi-experimentelle Untersuchungsanlage, sondern eine

Das könnte Ihnen auch gefallen