Beruflich Dokumente
Kultur Dokumente
-
Messverfahren in den sozialwissenschaften werden sehr
häuflg von Vertretern 5 Forschungsdesign und Untersuchungsformen
,,qualitativersozialforschung"kritisiert,vgl.z.B.Bnncnn(1985),crCoUnU(1974),(vgl'
LoHAUS (1983). Bei der nereption der Ititiken werden die vorhandenen Repliken Das Ziel sozialwissenschaftlicher Arbeit besteht in der Erklärung bzw. Prognose von
Kriterien zu spezifizieren sein (vgl, Kapitel5'4'i)' unbekannten Vorherwert vergleichen. Da dieser Wert iedoch nicht für die Ver-
in unterschiedli-
An einem Beispiel soll im Folgenden gezeigtwerden' dass Designs suchspersonen vor der Einwirkung von X gemessen wurde, muss man sich einen
geeignet sind, Vermutet man zum Beispiel anderen Bezugspunkt für den Vergleich mit dem Nachherwert suchen. Ein solcher
chem Maße zur Beurteilung von Hypothesen
Filmen einer bestimmten Gattung kann günstigstenfalls aus einer anderen Untersuchung bekannt sein, häufig muss
einen Zusammenhang zwischen dem Konsum von
(z.B.Kriegs-,Kung.Fu-'pornographischeFilme)undderTendenzzuaggressivem jedoch auf zweifelhaftere Quellen zurückgegriffen werden; auf Alltagswissen, auf
so könnte man sich zur Prüfung der Hypothese verschiedener
untersu' ,,allgemein Bekanntes" (ClruperLL/STANLEy L963tL77), Wie die Verhältnisse in der
Verhalten,
chungsanordnungen bedienen:1 Praxis auch immer sein mögen: Liegt der gemessene Wert,,signifikant"x über dem
l.Mankannz.B.einerGruppevon(Versuchs.)Personen(Vpbzw.Vpn)Filmevorfiih. herangezogenen Vergleichswert, so könnte daraus der Schluss gezogen werden,
ren2 und danach die Neigung zu aggressivem Verhalten mit
Hilfe einer Reihe von dass X die Neigung zu aggressivem Verhalten erhöht.
so dargestellt 2. Es wäre auch möglich, zwei Gruppen von Personen zu bilden, die nach dem Zufalls-
Fragen messen.3 Eine solche Versuchsanordnung kann schematisch
werden: prinzip einer Experimentalgruppe und einer Kontrollgruppe zugeordnet werden.
Diese zufällige Zuweisung zu den Gruppen wird auch ,,Randomisierung" (R) ge-
nannt.
XO
tr tr
R:OXO Experi me ntatgrup pe
Abb.5.1: Design einer einmaligen Messung R:OO Kontrollgruppe
tr tz t3
(auch Treatment,
Dabei steht X für das Einwirken des experimentellen Stimulus Abb. 5.2: Design einerVorher-Nachher-Messung mit Kontroltgruppe
(von
Treatmentfaktor oder unabhängige Variable genannt) und O ,,Observation")
der möglichen Wirkung von X (die abhängige Variable)' Im Beispiel
für die Messung
Verhalten In beiden Gruppen wird vor der folgenden experimentellen Manipulation (Setzung
ist das Betrachten der Filme der Stimulus und beobachtetes aggressives
des Treatments) die Neigung zu aggressivem Verhalten gemessen. Diese erste
die abhängige Variable.
Vergleiche Messung wird allgemein als ,,Pretest" oder Vorhermessung bezeichnet. Danach
Zur Überprüfung der Hypothese müsste man nunmehr verschiedene
werden nur der Experimentalgruppe (Kriegs-, Kung-Fu- oder pornographische)
vornehmen. Bei dem Design mit einmaliger Messung müsste man im Prinzip
den
Filme gezeigt, worauf dann eine erneute aweite Messung der abhängigen Variable
(in beiden Gruppen) erfolgt. Diese wird zumeist ,,Posttest" oder Nachhermessung
r fir*ntspre"t endes Experiment wurde z. B. von Esnnln/Gnossuawn (197s) durchgeftihrt, eine ent' genannt.
(1981). Der Forschungsstand auf diesem Gebiet wird
sprechende wiederholungsbefiagung von Kruns Das Design der Vorher-Nachher-Messung mit Kontrollgruppe verbessert im Ver-
von FnncusoH/KTLBURN (2009) z;sammengefasst. In Hinsicht auf ähnliche Probleme mit Videospielen
gleich zur einmaligen Messung die Beurteilungssituation deutlich. Da sowohl ein
siehe Celvnnt u .a. (2017)'
gesehen" aus' Vorher- als auch ein Nachherwert existiert, ist ein direkter Vergleich fi.ir die Expe-
2 Wir gehen hier von einer (vereinfachenden) Dichotomie ,,Film gesehen/Film nicht
Erweiterungen ban Verfeinerungen dieser Vorgehensweise sind in der Fotschungspraxis die Regel' So rimentalgruppe möglich. Wenn das Treatment die vermutete Wirkung besitzt, so
Anzahl von
könnte man z. B. mehrere Experimentalgruppen bilden, die ieweils einer unterschiedlichen muss der zweite Messwert deutlich über dem ersten liegen. Zusätzliche Sicherheit
(z' B' sehr
Filmen ,,ausgesetzt" werden oder die ieweils Filmen unterschiedlicher Darstellungsintensität gewinnt dieser Vergleich durch die Messungen in der Kontrollgruppe, die während
Experimente' bei denen
brutale und weniger brutale) betrachten, Von besonderer Bedeutung sind des Experiments bis auf den Filmkonsum den gleichen Bedingungen ausgesetzt
Faktoren experimentell variiert
alle mathematisch möglichen Kombinationen der zu untersuchenden war wie die Experimentalgruppe. Wenn in der Experimentalgruppe eine klare
Die Literatur zum Design
werden. Solche Studien werden als ,,vollfaktotielle" Experimente bezeichnet'
oder ,,experimental design"'
von Experimenten ftndet man unter den stichworten ,yefsuchsplanung"
(2018)'
vgt. z. s. MASoN/HEss (2003), MoNrcounnv (2013) und Maxwrlr,/Drlenov/Ku.r.nv
3 Für die Aussagekraft einer solchen untersuchung sind die hier nicht weiter präzisiefte Definidon und I Der Vergleich solcher Durchschnittswerte wird üblicherweise mit Hilfe statistischer Signifikanz-
Operationalisierung der Aggressivität von zentlaler Bedeutung' Je nach den verwen!.etei,lf::::Tl tests (vgl. Kapitel 9.4,2) durchgeführt. Etwas vereinfachend gesagt, geben diese Verfahren Aufschluss
u' o'r
aggressive Handlungen dartiber, ob die Differenzen der
ieweiligen Stichprobenkennwerte (Statistiken) durch reinen Zufall
ken (ltembatterie, physiologische Erregungsmessung, direkt beobachtete
zustandegekommen
sind ggf. unterschiedliche Ergebnisse möglich. sein können oder nicht,
5.1 ProblemederÜberprüfungkausalerAussagen 189
188 5 Forschungsdesign und Untersuchungsformen
- -
Messwerterhöhung vorliegt, kann mit großer Sicherheit auf eine Wirkung von X
5.1 Probleme der Überprüfung kausaler Aussagen
geschlossen werden.
Wissenschaftler sind vor allem an Aussagen über Kausalbeziehungen interessiert, also
3. Man befragt eine (hinreichend) großeZahlzufällig ausgewählter Personen hinsicht'
an Beziehungen zwischen ,,Ursachen" und ihren ,JA/irkungen".1 In der Forschungspra-
lich ihres l(onsums von bestimmten Filmen und misst in der gleichen Befragung
xis wird eine Beziehung zwischen einer ,,Ursache" und ihrer ,,Wirkung" in der Regel
ihre Neigung zu aggressivem Verhalten und hofft, dass sich bei entsprechender
dann als ,,kausal" interpretiert, wenn eine Reihe von Kriterien erfüllt sind (Hn l 1965):
Analyse der Daten die Befragten dann nachträglich (ex post) in mindestens zwei
Gruppen einteilen lassen: Personen, die häuflg die entsprechenden Filme sehen, -
Der Zusammenhang sollte stark sein,
und Personen, die dies selten (oder nie) tun. Erstere könnten dann als Experimen' -
sich in unterschiedlichen Untersuchungskontexten an unterschiedlichen Popula-
tionen zeigen,
talgruppe und die letzteren als Kontrollgruppe dienen:
- die Ursache sollte zu einer spezifischen Wirkung führen,
- die Ursache sollte der Wirkung zeitlich vorausgehen,
XO Experi mentaIgruP Pe
- ein plausibler Mechanismus, der dem Kausalzusammenhang zugrunde liegt, sollte
o Kontrotlgruppe
angebbar sein,
tr tr
(gemeinsam zu t1 gemessen) - zwischen Ursache und Wirkung sollte im Regelfall eine monotone Funktion (,,je
mehr-desto") bestehen.
Abb. 5.3: Survey-Design
Der Nachweis kausaler Beziehungen ist keineswegs trivial.2
Bei einem einfachen Experiment wird ein Objekt einem besonderen Treatment
Das Symbol (X) steht auch hier für den Stimulus, der jedoch bei dieser Vorgehens- unterzogen, der vermuteten Ursache. Möglicherweise zeigt ein Obiekt die erwartete
weise nicht vom Forscher gezielt gesetzt wird und somit auch nicht kontrolliert Reaktion. Leider kann nun nicht daraus geschlossen werden, dass die vermutete Ur-
werden kann, sondern bereits ohne das Zutun des Forschers bei den Befragten sache tatsächlich die Ursache für das beobachtete Verhalten war: Die Reaktion hätte
und ihren Lebensgewohnheiten vorliegt. vielleicht auch dann stattgefunden, wenn die vermutete Ursache nicht vorhanden ge-
Bei dieser Versuchsanordnung liegen die Verhältnisse wiederum ungünstiger, wesen wäre.3 Das zentrale Problem der Prüfung kausaler Aussagen besteht darin, dass
als bei der Anordnung mit Vorher-Nachher-Messung plus Kontrollgruppe. Denn dasselbe Objekt nicht der vermuteten Ursache ausgesetzt und zugleich nicht ausgesetzt
auch hier fehlt (wie bei der einmaligen Messung) eine explizite erste Messung werden kann. So kann sich das Objekt allein durch den Test (oder auch durch den
vor der Manipulation durch X. Jedoch existiert hier eine Kontrollgruppe, deren Nicht-Test) verändern, es kann reifen etc. Dieses Problem ist nur durch die Akzeptanz
Durchschnittswert niedriger sein müsste als der der Experimentalgruppe' Dies nur teilweise prüfbarer theoretischer Annahmen lösbar.
gilt jedoch nur, wenn sich tatsächlich nachträglich zwei Gruppen bilden lassen' In der Folge der Arbeit der Statistiker Donald B. RUsIN und Paul W. Hor,lawn ist
Eine Schwäche dieses Designs liegt nun darin, dass sich die beiden nachträglich daher die Interpretation eines kausalen Effekts als Interventionseffekt üblich. Hierbei
gebildeten Gruppen auch schon vor einer ersten Messung unterschieden haben wird in einem randomisierten Experiment die Differenz zwischen den Mittelwerten einer
könnten. Dadurch ist auch hier (trotz einer vergleichsgruppe) der forschungsprak' gemessenen Variablen für Objekte, die der vermuteten Ursache ausgesetzt wurden,
tische Schluss auf die Wirksamkeit von X bei unterschiedlichen Mittelwertenz$tar und Objekten, die der vermuteten Ursache nicht ausgesetzt wurden, als kausaler Effekt
möglich, aber wie im Design der einmaligen Messung nicht sehr sicher. interpretiert. Verglichen wird also für eine interessierende Variable die Differenz des
beur'
Allen drei Designs ist das Bemühen gemeinsam, eine vorliegende Hypothese zu
Grund hierfiir
teilen. Sie erlauben ein Urteil jedoch nicht mit gleicher Sicherheit. Der I Auf MACKIE (1980:52) geht die Definition einer Ursache als lNUS-Bedingung zurück. Eine Ursache ist
Treat'
liegt in ihrer unterschiedlichen Anfälligkeit f](1r ,,Störfaktoren", die neben dem demnach eine ,,(...) Insufrcient but Non-redundant part of an Unnecessary but Sufrcient condition'
Variablen (Hervorhebungen
ment ebenfalls für eine Veränderung der Ausprägungen in der abhängigen durch die Autoren). Eine Ursache ist also einzeln nicht hinreichend, aber notwendiger
zu können' Tell einer nicht notwendigen,
verantwortlich sein können. Um die Effekte solcher Störfaktoren beurteilen aber hinreichenden Bedingung eines Ereignisses,
erläutert 2 Zur neueren Kausalitätsdiskussion in der philosophie vgl, pn,lnr, (2000) und SALMoN (1998).
müssen zuvor die prinzipiellen Probleme der Überprüfung kausaler Aussagen
3 Dieser Sachverhalt wird in
der Literatur als Problem ,,kontrafaktischer" Situationen (,,counterfac-
werden, tuals") bezeichnet.
Ohne zusätzliche Annahmen (siehe weiter unten im Text) können über kontrafakti-
sche Zustände
keine sinnvollen Aussagen gemacht werden.
190 5 Forschungsdesign und Untersuchungsformen 5.2 Störfaktoren 797
- -
dem weitgehend ausgeschlossen werden können. CeiupsrLL/STANLEy (1963) benennen in
Mittelwerts zwischen versuchs- und Kontrollgruppe. Diese Differenz entspricht
kausalen Effekt der vermuteten Ursache.l ihrer klassischen Übersicht unter anderem folgende Störfaktoren:
Diese Interpretation der Mittelwertdifferenz als die Größe des kausalen
Effekts ist - Zwßchenzeitliches Geschehen (,,history", Zeiteinflüsse): Hierunter sind alle Er-
nur dann gültig, wenn eine theoretische Annahme über die potentiellen Ergebnisse eignisse zu subsumieren, die zusätzlich zum Stimulus die abhängige Variable
Diese Annahme beeinflussen können. So wäre es im genannten Beispiel denkbar, dass zwischen
eines Experiments für alle Untersuchungsobiekte empirisch erfüllt ist'
wird als ,,SIJTVA" bezeichnet. SUTVA sieht für ,,stable unit treatment value assumption"' Pre- und Posttest (bzw. vor der einzigen Messung) die Versuchspersonen von ei-
zentralfür suTVA ist die Annahme, dass für jedes untersuchungsobjekt die potentielle nem besonders abscheulichen Verbrechen (2. B. Kindesmord) Kenntnis erlangen
Reaktion auf das Treatment bzw. die potentielle Reaktion auf das Nicht-Treatment und dieses Ereignis - und eben nicht die unabhängige Variable - die Tendenz zu
nicht davon abhängt, dass andere untersuchungsobjekte dem Treatment ausgesetzt aggressivem Handeln erhöht.
bzw. nicht ausgesetzt werden. Für Individuen bedeutet dies z' B', dass
das potentielle - Reifungsprozesse der Probanden (,,maturation" bzw.,,decay", biologisch-psycho-
Ergebnis eines Experiments fiir eine Person nicht davon abhängen darf, ob sie oder logische Veränderungen): Die Yafianz in der abhängigen Variablen wird durch
eine andere Person zur Versuchs' oder Kontrollgruppe gehört' ,,intrapersonale" Prozesse bedingt, also nicht durch die Einwirkung des Stimulus.
Durch die Zufallszuweisung (Randomisierung) von Untersuchungseinheiten zur So könnten die Versuchspersonen z. B. nicht nur aufgrund der Filme aggressiver
Treatment- und Nicht-Treatmentgruppe lassen sich Hypothesen über kausale Zusam' werden, sondern auch, weil sie während des Experiments hungrig oder müde
der Wis' werden und die entsprechenden Bedürfnisse nicht beftiedigen können. Oder aber
menhänge am einfachsten überprüfen. In nicht'experimentellen Bereichen
mangels Randomisierung selten es kann, wenn relativ lange Zeitabstände zwischen den Messungen liegen, durch
senschaft können die Annahmen echter Experimente
sind aber ,,normale" biologisch-psychologische Reifung eine Anderung der Messwerte er-
als gegeben angenommen werden. Ein Teil der Implikationen der Annahmen
zumeist empirisch prüfbar.2 folgen. Diese sind besonders bei Untersuchungen von Kindern und Jugendlichen
Eine derwichtigsten Aufgaben des Forschungsdesigns besteht darin' die Gültigkeit möglich, jedoch auch bei Erwachsenen keineswegs auszuschließen.
deTSUTVA-Annahme und dieAbwesenheitvon Störfaktoren entweder durch das
Design - Messeffekte (,,testing", Testen); Die Veränderungen werden als Auswirkung des
herzustellen oder soweit wie möglich zu überprüfen. Dazu gehört in der Forschungs' ersten Messvorgangs auf den zweiten erzeugt. In unserem Beispiel ist dieser Effekt
praxis vor allem die Identifikation und Kontrolle von Störfaktoren des Experiments. weniger wahrscheinlich, jedoch sind derartige Auswirkungen bei kognitiven Tests
häufig zu erwarten. Wird zum Beispiel in einem Experiment die Wirkung einer
Variablen auf den Intelligenzquotienten (lQ) von Versuchspersonen ermittelt und
5.2 Störfaktoren dabei die Intelligenz in Pretest und Posttest mit dem gleichen IQ-Test gemessen, so
können die Probanden aus dem ersten Messvorgang lernen. Sie denken über die
Die mit Hilfe der vorgestellten Designs gemessene (oder im Fall des Designs mit
einma' Richtigkeit der gegebenen Antworten nach, merken sich richtige Lösungen und
Iiger Messung eher erschlossene) Differenz der Messwerte muss nicht zwangsläufig verbessern so ihr Resultat bei der zweiten Messung - unabhängig vom Stimulus.
durch die unabhängige Variable verursacht worden sein. Es gibt eine Reihe von
Stör' - Hilfsmittel (,,instrumentation", Veränderung im Messinstrument): Durch die Ver-
bilden
faktoren, die u. U. ebenso für die Unterschiede verantwortlich sein können' Sie wendung von unterschiedlichen Messinstrumenten, z. B. geänderte Tests, anders
in diesem Sinne alternative Erklärungshypothesen für die Veränderung in der
Aus' formulierte Fragen, ungleiche Antwortvorgaben usw., sowie variierende,,Hilfsmit-
prägung der abhängigen Variablen. Die Güte eines Designs bemisst sich nun daran, tel", etwa verschiedene Versuchsleiter, Beobachter oder Interviewer, können Effek-
inwieweit solche Alternativerklärungen bzw. der Einfluss von Störfaktoren möglichst te auf die abhängige Variable möglich werden, die nicht durch die unabhängige
Variable bedingt sind. So könnte etwa das betont arrogante oder devote Verhalten
eines Versuchsleiters die Aggressivität der Versuchspersonen steigern oder mildern.
ru dieset Konzeption finden sich bei RosrxseuM (2017) und PEAtr/Glvrvroun/Jnwsl'l' In der sozialwissenschaftlichen Forschung sind eine Reihe solcher Effekte bekannt.
ffir"111.it"n
(2016). So haben Versuchsleiter, aber auch Interviewer, Vercoder, Beobachter etc. (vgl.
2 Der tatsächliche Beweis kausaler Beziehungen ist daher nahezu unmöglich' Dies bedeutet aber nicht' Kapitel7.1.1.5) bestimmte Erwartungen (2. B. Hypothesenbestätigung) bezüglich
mtissen: Das SUTVA-
dass Sozialwissenschaftler das Ziel der Gewinnung kausaler Aussagen aufgeben des Ergebnisses einer Untersuchung. Diese Erwartungen können dazu führen,
größere Bescheidenheit in Hinsicht
auf
Problem und mögliche Effekte von Störfaktoren legen aber eine
Verlässlichkeit interventionistischer
die Geltung von Hypothesen und insbesondere in Hinsicht auf die
sozialwissenschaften
Empfehlungen nahe, als es insbesondere in den angewandten Bereichen der
üblich ist.
5.2 Störfaktoren 193
792 5 Forschungsdesign und Untersuchungsformen
- -
durch Gestik, Mimik oder Wortwahl die Die aufgezeigten Faktoren werden allgemein im Anschluss an CRupgrr,r./Srnxluv als
dass Versuchsleiter nicht willentlich z. B.
die unabhängige Variable beeinflussen.l Beeinflussungsfaktoren der ,,internenValidität" bezeichnet (auch interne Gültigkeit
Versuchspersonen in ihrer Reaktion auf
genannt).l lnterne Gi.iltigkeit ist dann gegeben, wenn das Treatment tatsächlich für
- Verzerrte Auswahlen',nd,Ausfätle (,,selection", ,,mortality"): Wenn sich die Experi-
die Variation der abhängigen Variable verantwortlich ist. Entsteht hingegen die Ver-
mental- und die Kontrollgruppe nicht nur hinsichtlich des Stimulus unterscheiden,
änderung der Messwerte durch einen oder mehrere Störfaktoren, dann ist die interne
sondern sich auch im Hinblick auf andere Merkmale, die ebenfalls Einfluss auf die
Gültigkeit verletzt. Sind sowohl Störfaktoren als auch der Stimulus verantwortlich, so
abhängige Variable ausüben, heterogen zusammensetzen, so sind hierdurch Diffe-
spricht man von einet ,,Konfundierung" der Effekte. Auch dann ist selbstverständlich
renzen zwischen Pre- und Posttest möglich. Sollten etwa in der Experimentalgrup'
pe deutlich mehr Männer vertreten sein, welche aggressives Verhalten als adäquate
die interne Gültigkeit nicht gegeben.2
An die Frage nach der internen Validität schließt sich die zweite Frage nach der
Reaktionsform während der Sozialisation erlernt haben, als in der Kontrollgrup-
pe, so könnte die Differenz zwischen beiden Gruppen auf die unterschiedliche ,dußeren Validittit" (auch externe oder ökologische Validität bzw. bei mangelnder
Erziehung zurückgeführt werden. Neben solchen ,,verzefrten" Auswahlen können
Gültigkeit auch externer Fehler genannt) an.3 Diese ist definiert als Möglichkeit der
Generalisierung der experimentellen Resultate auf andere Personen(-gruppen) und
Ausfälle die Resultate des Experiments beeinflussen. Solche Ausfälle entstehen
durch Personen, die nur am Pretest teilnehmen und danach für den Posttest nicht Situationen. Externe Validität liegt bei einem Design demzufolge vor, wenn die er-
mehr zur Verfügung stehen. Ausfalleffekte sind dann möglich, wenn die Ausfälle mittelten Ergebnisse auf andere Personen in anderen Kontexten übertragen werden
nicht zufällig zustande kommen, sondern systematisch.2 Dies wäre etwa dann der können.
Diese Möglichkeit der Generalisierung auf andere Personen und Kontexte kann
Fall, wenn Personen mit besonders geringer Neigung zu aggressivem Verhalten
von der Brutalität der gezeigten Filme so angewidert sind, dass sie den Versuch ebenfalls durch verschiedene Störfaktoren beeinträchtigt werden. Zwei dieser Störfak-
abbrechen und somit nicht mehr am Posttest teilnehmen.3 Daduich würde sich toren sollen hier genannt werden:
der Mittelwert der Experimentalgruppe erhöhen.
l. Reaktivitdt oder reaktive Effekte des Messens: Durch die Durchfiihrung des Pre-
tests kann die Empfänglichkeit der Versuchspersonen ftir den Stimulus angeregt
- ,,regtessionto the mean": Bei wiederholten Messungen können zufällige Messfehler
werden. Durch diese Sensibilisierung wird dann der Einfluss des Stimulus zusätz-
fälschlich den Eindruck tatsächlicher Veränderungen hervorrufen. Bei mit Messfeh'
lern behafteten Messungen liegen insbesondere Obiekte mit auffällig großen oder lich verstärkt oder verringert. Bei einer Anordnung mit Vorher-Nachher-Messung
kleinen Messwerten mathematisch notwendigerweise bei Messwiederholungen und Kontrollgruppe kann durch den Pretest die Intensität des Filmbetrachtens
gesteigert und damit die Auswirkung von X im Vergleich zu nicht-experirnentellen
eher näher am Mittelwert aller Messungen. Dieses Problem wird als ,,regression
to the mean" (RTM) bezeichnet.a Vor allem bei Studien, die nur bei der ersten Situationen erhöht werden. Die Ergebnisse wären dann nur aufGruppen übertrag-
Messung besonders auffällige Objekte wiederholt untersuchen, liegen falsche bar, die vorher an einem entsprechenden Pretest teilgenommen haben.
Schlussfolgerungen über scheinbare Veränderungen allein durch RTM nahe. Ent- 2, Reaktive Effekte der experimentellen Situation (,,effects of experimental arrange-
sprechend häufrg flnden sich solche Artefakte bei Interventionsstudien, bei denen
ments"): Die experimentelle Situation kann gravierend von ,,der" Alltagssituation
Maßnahmen aufgrund auffälliger Messungen ergriffen wurden (2. B. hoher Blut- abweichen, wodurch zwar intern gültige Effekte nachweisbar sind, die aber unter
druck, Verhaltensauffälligkeiten bei Jugendlichen, besonders gute oder schlechte Umständen im Alltagskontext ausbleiben. Wird etwa die Überprüfung der Film-
Aggressivitäts-Hypothese in einem Universitätsinstitut durchgeführt, so kann es
Klausuren etc.).
ffil vutoität (sowie die noch darzustellende externe validität) ist von der Konstrukt-, Inhalts- und
Kriteriumsvalidität (vgl, Kapitel 4) deutlich zu trennen. Letztere beziehen sich aufdie exakte Messung
einem bzw Operationalisierung der abhängigen und der unabhängigen Variablen.
ffi*l.t rige Bereich der experimentellen und nicht-experimentellen Fotschung ist zu
vgl. Kapitel 7'1'1'5- 2 Eine präzise Diskussion verschiedener Formen und Bedeutungen des Wortes ,,confounding" findet
eigenständigen Forschungsgebiet geworden, der sogenannten ,,Artefaktforschung",
der universi' sich bei cREENLauo/MoncnusrERN (2001).
2 In der Medizin nennt man diesen Effekt,,suwivor bias", Ein naheliegendes Beispiel aus
den Teilnehmern 3 Coox/Cnrunrnr,r, (1976) erweiterten die ursprtingliche Konzeption von interner und externer Validität,
tät: Die Vorlesungsteilnehmer am Ende eines Semesters sind keine Zufallsauswahl aus
indem sie zusätzlich die statistische Schlussfolgerungsvalidität und die Konstruktvalidität speztftzier-
der ersten Sitzung.
ten. Beide Fassungen sind nicht ohne Kritik geblieben (Geurl.Iwr 1976; Knuclausrr/Knov
1976); sie
3 Zur Auswahl von Versuchspersonen sowie zu Ausfällen vgl, ausftihrlich Kapitel 6.
Beurtei' tangieren
iedoch die Pragmatik der experimentellen Forschung kaum (Srnonnr 1978t24-i:6; BuNcARD
4 Siehe Banunrr/van lnn Por,s/DossoN (2005); Beispiele wie RTM-Effekte durch mangelnde 1984:220.
lerübereinstimmung bei det Veröffentlichung von Artikeln findet man bei Bland/Altman (1994)'
5 Forschungsdesign und Untersuchungsformen 5.3 Techniken der Kontrolte von Störfaktoren 795
7g4
- -
Tab. 5.1: Liste möglicher Störeffekte
fraglichsein,obdieErgebnisseaufdenAlltagskontextübertragbarsind.Denn
beimFernsehkonsumimheimischenWohnzimmerspielenmöglicherweiseeine Problem
Dritter, soziale Erläuterung
ganze Reihe weiterer Variablen (Aufmerksamkeit, Anwesenheit
etc.) eine Rolle, die in einem Labor vielleicht nicht berücksichtigt Unangemessene 0perationalisierung Unangemessene Messun g der Variabten
xmosphäre
einen,,Aufforderungs-
wurden. Häuflg spricht man det experimentellen situation Mono-Method-Bias
überlegen, Ursache und Wirkung auf die gteiche Art gemessen
(,,demand characteristic"; ORNE 1969): Versuchspersonen
charakter" zu
mag, welchen Zweck die Untersuchung
was der Versuchsleiter von ihnen erwarten Vpn erraten Hypothese Vpn vermuten erwartetes Verhalten
nur auf den stimulus,
hat usw.l Sie definieren die situation und reagieren nichi
eigenen Situationsde'
sondern handeln immer auch vor dem Hintergrund ihrer Sozlale Wünschbarkelt Vpn versuchen einen guten Eindruck zu
produziert (But'lcenn
finition, was u. u. einen Effekt auf die abhängige variable hinterlassen
Versuchsleiter-Erwartun gen VL Erwartungen kann Zuweisung zu Kontrollgruppe
L984zLr6-123).
oder Daten verändern
(2002) erwähnen weitere Konfundierung von Konstrukten und Keine Messung verschiedener Level von
camenrr,l/sraNr,rv (1963) sowie sHlolSn/coor/cnrrnpsrll Ausprägungen der Konstrukte Ursache-Wirkungs-Zusammenhän gen
die Möglichkeit, dass
störfaktoren als die bisher genannten. Dazu gehört insbesondere
und so zusätzliche, über die reine
verschiedene störeffekte zusammenwirken können lnteraktionseffekte verschiedener Treatments Vpn erfahren mehr als ein Treatment
(,,Interaktionseffekte")
Addition der einzelnen Störeffekte hinausgehende, neue Effekte
entstehen. Die Tabelle 5.1 enthätt eine Reihe dieser Interaktionseffekte'2 lnteraktionseffekte von Treatment und Tests Sensitivierung durch den Pretest
lnteraktlonseffekte von Auswahl und Treatment Generalisierung tiber die Auswahl hinaus nicht
mögtich
5.3 Techniken der Kontrolle von Störfaktoren lnteraktionseffekte des Settlngs und des Generalisierung tiber das gegebene Setting nicht
Treatments mögtich
soweit irgend mög'
Ziel eines jeden Experiments ist es, alle genannten störfaktoren
Hierzu bedient man sich verschiedener
lich auszuschließen bzw. ztkontrollieren. Zwischenzeitliches Geschehen Externe Ereignlsse zwischen Pretest und Posttest
Parallelisierung und Rando'
Techniken: Elimination, Konstanthaltung, Matching ba,v. beeinflussen das Ergebnis
lnteraktlonseffekte des zwischenzeitlichen Generalisierung über die Zeit nicht möglich
misierung.
Geschehens mit dem Treatment
Reifung Veränderung der Vpn zwischen Pretest und
Posttest
5.3.1 Etiminatlon lnstru me ntie ru n g Veränderung der Messinstrumente zwischen
Pretest und Posttest
bei der
unter ,,Elimi nation' versteht man die Ausschaltung denkbarer Störgrößen ,,Regression to the mean" Selektion von extremen Fällen führt zu
bzw' stimulation
Durchführung des Experiments. Alle Einflüsse, die auf die Messung Veränderun gsartefakten
könnten, werden nach
der unabhängigen und abhängigen variablen störend einwirken
für das Experi'
Möglichkeit eliminiert. Da die Eliminationsmöglichkeiten in speziell
*.it t.tg.rtellten örtlichkeiten (Labors) sehr gut sind, wurde das Laborexperiment
kann hier die Setzung
häufig als ideate Vorgehensweise betrachtet. Der Versuchsleiter
(2012)' z:udenBe'
i Literatur und Beispiele finden sich bei Mccannmucn/Bnuu.t/wtrrou
.
Zlzzo (2009) und
dingungen, unter denen diese Effekte auftreten und wie sie sich auswirken, Wl'
Snenpr/Wnnrrol (2016).
sind etwas weitetgehende statisdsche
2 Für das Verständnis einiger der in det Tabelle genannten Effekte
muss daher hier auf Sneorsn/Coor/Canapnrlt'
Kenntnisse erforderlich. Für eine vertiefte Diskussion
(2002) verwiesen werden.
T
5.3 Techniken der Kontrolle von Störfaktoren 797
796 5 Forschungsdesign und Untersuchungsformen
- -
Tab. 5.t Liste möglich er Störeffekte (Fortsetzun g) des Stimulus und die Gesamtsituation weitgehend kontrollieren, störende Einfltisse
optimal ausschalten und die aus der Theorie bzw. Hypothese abgeleiteten Untersu-
Problem Er[äuterung chungsbedingungen realisieren. In unserem Beispiel ist es so möglich, geeignete Filme
Auswahl Ursprüngliche Unterschiede zwlschen Kontrol[- auszuwählen, die Dauer der Filmbetrachtung zu steuern, Störungen durch andere
und Versuchsgruppe Personen zu verhindern, Umgebungslärm zu minimieren usw., wodurch insgesamt
Mortalität Selektiver Ausfall von VPn die Aussagekraft der experimentellen Untersuchung steigt, weil Alternativerklärungen
unwahrscheinlicher werden. Dies bedeutet jedoch nicht, dass Experimente immer
lnteraktionseffekte mit der Selektion Unterschiede zwischen Kontroll- und
im Labor stattfinden sollten. Dieses Vorgehen hat auch Nachteile (vgl. Kapitel5.4.1).
Versuchsgruppe zusammen mit anderen Effekten
(2. B. Reifung) führt zu Artefakten
Darüber hinaus ist Kontrolle und Elimination auch in Alltagssituationen möglich (s,u.).
Keine eindeutige Kausalrichtung Unmöglichkeit der kausaten Reihung bel Festzuhalten bleibt daher, dass man sich bei der Durchführung von Experimenten um
Retrospektiv- und Querschnittsstudien eine maximale Kontrolle des Stimulus und seiner Variation bemühen muss.
Diffusion des Treatments Kontrollgruppe hat Zugang zum Treatment
Die Bildung von Kontrollgruppen stellt eine weitere, entscheidende Forderung an iede
experimentelle Vorgehensweise dar. Nur der Vergleich zwischen den beiden Gruppen,
die bis auf den Treatmentfaktor weitestgehend ähnlichen Randbedingungen ausge'
setzt sein sollen, ermöglicht relativ sichere Schlüsse auf die Effekte der unabhängigen
Variable. Zur Rekrutierung vergleichbarer Gruppen dienen atei Techniken: Matching
und Randomisierung.l
I Hier wird zunächst nur Matching bei der Bildung von Kontroll- und Versuchsgruppen für echte
Experimente diskutiert. Der Begriff,,Matching" wird zunehmend ftir ähnliche Kontrolltechniken bei
der Analyse von
Quasi-Experimenten (vgl. Kapitel 5.4.2) verwendet.
5,4 Forschungsdesigns 199
198 5 Forschungsdesign und Untersuchungsformen
- -
eine Eingrenzung der Parallelisierungsmerkmale schwierig ist. Darüber hinaus besteht
5.3.3.1 Matching
Beim ,,Matchrng,, (bzw. der ,,Parallelisierung") versucht man, bezüglich
bestimmter immer die Gefahr der Nicht-Berücksichtigung letztlich doch relevanter Variablen.l
Merkmalsausprägungen ,,gleiche" Personen der Experimental'und I(ontrollgruppe
Filmkonsum und
zuzuordnen. vermutet man beispielsweise, dass das verhältnis von 5,3,3.2 Randomisierung
sozialisation'
Aggressivität auch von ,,dritten" Variablen, wie ,,geschlechtsspezifische Als die Kontrolltechnik schlechthin wird die Randomisierung (,,Zufallszuweisung")
ist, so wird man die Gruppenzugehörigkeit so
und,,Bildung,, der Probanden, abhängig betrachtet. Das Prinzip der',,Randomisierung" besteht in der rein zufälligen Zuwei
(,,matched pairs") mit ieweils den gleichen
matchen, dass von den Personenpaaren sung der Versuchspersonen zur Versuchs- oder Ifuntrollgruppe. Oder anders gesagtl
Merkmalsausprägungen je eine Person zur Experimental- und eine zur
Kontrollgruppe
|ede Versuchsperson hat die gleiche Chance, einer der beiden Gruppen zugewiesen zu
gehört. In der Praxis wäre z. B. für jeden vetsuchsgruppenangehörigen ein hinsichtlich werden. Der Zuweisungsprozess wird also nicht von soziologischen, psychologischen
würde
Sozialisation und Bildung,,gleiches" Kontrollgruppenmitglied zu bestimmen. oder biologischen Kriterien, sondern mittels eines zufallsbedingten Verfahrens (per
überwiegend
dies nicht geschehen, so wäre es z. B. möglich, dass in der einen Gruppe Münzwurf, Losentscheid, Zufallszahlengenerator etc.) gesteuert. Stehen z. B. 200 Per-
mit hoher Bildung
Männer mit niedriger Bildung und in der anderen fast nur Frauen sonen für die Aufteilung in eine Versuchs- und eine Kontrollgruppe zur Verfügung und
nicht
vertreten sind, wodurch die Differenzen hinsichtlich des Merkmals ,,Aggressivität" lässt man jede Person ein Los aus einer Trommel mit 200 gut gemischten Losen ziehen,
mehr mit hoher sicherheit allein auf den Stimulus zurückgeführt werden
könnten,
von denen 100 den Buchstaben V (für Versuchsgruppe) und 100 den Buchstaben K (ftir
und,,Bildung" bedingt sein
sondern eben auch durch die Variablen ,,sozialisation" Kontrollgruppe) tragen, so fährt dieses Vorgehen dazu, dass ein systematischer Zusam-
könnten. menhang zwischen den personalen Merkmalen (Sozialisation, Bildung, Zufriedenheit
Die Bildung von gleichen Paaren ist in der Praxis iedoch mit
großen schwierig-
u.a.) der Versuchspersonen und ihrer Zugehörigkeit zu einer der beiden Gruppen
keiten verbunden - vor allem dann, wenn man die Paare nicht nur nach einem oder
praktisch ausgeschlossen werden kann. Daher sind systematische Unterschiede in der
zwei Merkmalen bildet, sondern mehrere Variablen berücksichtigen will. Solche aus
Gruppenzusammensetzung höchst unwahrscheinlich. Damit wirken dann aber auch
theoretischen Gründen beachtenswerte Variablen, die neben der unabhängigen Va-
alle Drittvariablen in beiden Gruppen gleichartig und die gegebenenfalls vorliegende
riable ebenfalls einen Einfluss auf die abhängige Variable haben könnten' nennt man Veränderung in der abhängigen Variablen ist mit großer Sicherheit auf den Stlmulus
konkurrieren-
allgemein ,,Drittvariablen". Inhaltlich sind auch sie als alternative oder zurückzufi.ihren.
Erklärungen zur Ausgangshypothese zu sehen. Denn es besteht zumindest hypo-
de
thetisch die Möglichkeit, dass auch sie neben der unabhängigen Variablen und den
Störfaktoren auf die abhängige Variable einwirken. Hält man z. B' neben der Sozia' 5.4 Forschungsdesigns
lisation und der Bildung auch noch die materielle Zufriedenheit und das Alter der
in der
Versuchspersonen für relevante Drittvariablen, so muss für iede Versuchsperson Die Ausführungen zu den möglichen Störvariablen und den Techniken der experimen'
Experimentalgruppe mit einer spezifischen Kombination von Merkmalsausprägungen tellen Kontrolle haben verdeutlicht, wie sehr die Interpretationsmöglichkeiten eines
gefun'
innerhalb dieser vier Variablen eine äquivalente Person für die Kontrollgruppe Experiments von der Beachtung der Störmöglichkeiten und ihrer Ausschaltung abhän-
werden
den werden.l Dies bedeutet, dass entsprechende Messungen durchgeführt gig sind. Nur echte Experimente erlauben die systematische Kontrolle von Störfaktoren
müssen und dass häufrg aus einer gtoßen Anzahl von bereitwilligen Versuchspersonen
und schalten damit eine Vielzahl möglicher Alternativerklärungen aus.
die
nur wenige vergleichbare Paare resultieren. Weiter ist es selten unproblematisch'
wenig
für das Matching relevanten Drittvariablen zu bestimmen. Vor allem auf noch
groß, so dass
erforschten Gebieten ist die Anzahl der möglichen Drittvariablen sehr
5.4,3.2 Paneldesigns
DieAussagekraftvonEx-post.facto-Designswirddurchdieeinmalige,gleichzeitige
MessungallerrelevantenVariablengravierendeingeschränkt.DasmitdiesemDesign
kann iedoch durch wie'
verbundene promem ier t<ausalen neihenfoige deivadablen
man z' B' zwei oder I Auf diese Techniken wird in Kapitel 9'5'8 eingegangen'
Designs abgeschi,r,ächt werden. Führt werden Panels
derholte Anwendung dieses zu 2 Vgl. LAZARSFET,D (1962253) uniGar,ruuc (t907:85). In der ökonomeüischen Literatur
uon ,,Erhebungswellen.. oder ,,Wellen,,, (sogenann-
mehr Datenerhebungen, man spricht ",,.t, häuflg als,,cross sectional time series,, bezeichnet, Davon mtissen sorgfältig,,Trendstudien"
unterschiedlichen Zeitpunkten
(tr, t2, , . . , tn) auf der Grundlage des Survey'Designs te ,,pooled cross sectional time series,,, auch ,,pseudo-panels" odel ,,repeated cross sectional data"
und zweiten genannt) unterschieden werden. Dabei werden tiber die Zeit unabhängige stichproben aus einer
Popu-
derMesswerte aus der ersten
durch, so kannInrr, üi", den vergleich lation gezogen, vgl, Kapitel 5.4,3.3. Im Vergleich zu Panels sind solche Studien weniger aussagekräftig'
(bzw.n-ten)Messungfeststellen,obundwiesichdieVariablenveränderthabenund und
Variablen (gemessen an fr)
,*ir.h;i den da keine Aussagen über individuelle Veränderungen möglich sind'
welche statistischen Zusammenhä.rg.
5.4 Forschungsdesigns 215
274 5 Forschungsdesign und Untersuchungsformen
- -
Tab. 5.2: Nettoveränderun g Wahlkampfphase in verschiedene Intervalle zerlegt werden, und die Versuchspersonen
(Befragten) sollten alle 14 Tage oder alle 4 Wochen befragt werden. Bei langfristigen
lutl August Prozessen - etwa der Auswirkung der schulischen Sozialisation auf berufliche Auf-
gehe zur Wahl 870 900 stiegsmöglichkeiten - können zwischen den Messzeitpunkten mehrere Jahre vergehen.
gehe nicht zur Wahl 130 100 Bei dem seit 1984 laufenden umfangreichsten bundesdeutschen Panel, dem soge'
Summe 1000 1000 nannten,,sozio-ökonomischen Panel" (SOEP), werden (in den Hauptstichproben A
und B) im Abstand von je einem Jahr alle über 16-iährigen Haushaltsangehörigen von
ca. 6000 Haushalten (über 12000 Personen) befragt.l Bei diesem Panel wechselt ein
Die Tabelle 5.2zeigtdie Nettoveränderung: Insgesamt hat sich die verteilung
zwischen Teil der Fragen von Welle zu Welle, um thematische Schwerpunkte setzen zu können.
Tabelle geht jedoch nicht hervor, Diese betreffen z. B. Erwerbsbiographie, Ehebiographie, soziale Herkunft usw. Die
fuli und August um 30 Personen verändert. Aus dieser
wieviele und welche Personen ihre Einstellung geändert haben. Dies zeigt
erst die Daten, die zur wissenschaftlichen Bearbeitung iedermann zur Verfägung gestellt wer'
interne Fluktuation (Tabelle 5.3). den, erlauben somit eine detaillierte Analyse von individuellen und gesellschaftlichen
Wandlungsprozessen zu einer Vielzahl sozio-ökonomischer Fragestellungen.
zuvor in einem Schreiben angekündigt. 2 Eine in der kommerziellen Marktforschung verbreitete besondere Form des Panels leidet unter den
genannten Problemen in besonderem Maße: Sogenannte ,,Access-Panels", Hierbei wird entweder über
eine ursprüngliche Zufallsstichprobe oder eine Stichprobe von Freiwilligen eine Ausgangsstichpro-
be zusammengestellt, deren Teilnehmer sich bereit erklären, an zahlreichen Nachfolgebefragungen
beträchtli- teilzunehmen. Die Teilnehmer werden in der Regel besonders belohnt (2, B. durch Warengutschei-
ffisunousrepublik zieht innerhalb eines Jahres ca.roVoder Bevölkerung um' Ein ne). Da durch die hohe Zahl von Nachfolgebefragungen Paneleffekte bedingt werden und durch die
auf Umzüge innerhalb einer Gemeinde, aber selbst bei Umzügen über die
cher Teil entfällt dabei eventuelle Selbstrekrutietung zu Beginn und vor allem durch selektive Ausfälle (und deren Ersatz
fast 5% (SfirNnu' 2012:334)'
Gemeindegrenzen hinweg liegt der Anteil im langiährigen Mittel bei durch zufällig ausgewählte neue Panelteilnehmer) im Verlauf solcher Studien unkontrollierbare er-
finden sich bei wersoN/wooprN
2 Hinweise auf weitere studien zum Ausmaß der Panelmortalität hebliche Panelselektions- und Panelmortalitätseffekte auftreten können, eignen sich Access-Panels
(2ooe). für wissenschaftliche Studien allenfalls als Pretest. Keinesfalls kann für wissenschaftliche Zwecke ein
gewährleistet die für eine sinnvolle
3 Diese Empfehlung löst zwar nicht das Ausfallproblem, aber es Access-Panel eine üaditionelle panelstudie ersetzen.
Ausfällen leiden kann'
Datenanalyse notwendige Fallzahl, die dann iedoch unter den selektiven
5.4 Forschungsdesigns 219
278 5 Forschungsdesign und Untersuchungsformen
- -
(Gr, Gz ' ' ') wird durch eine nacherhobene neue Gruppe ersetzt (Dutlcr'N/KnlroN 1982103). Im Fal-
Bei einem ,,alternierendenPanel" wird die Stichprobe in Subgruppen
eingeteilt, die dann abwechselnd in den Panel-wellen (ty t2...) befragt werden le eines Fünf-Wellen-Panels würde dies (bei ftinf Subgruppen) bedeuten, dass nur eine
(Abbildune 5.s). Befragtengruppe alle fünf Wellen durchläuft, ie nruei Befragtengruppen durchlaufen
vier, drei, zwei und nur eine Welle (Abb. 5.9).
Neben einer vergleichsweise kleinen Panelkomponente bedingt dieses Design
tr t2 tr h t5
einen erheblichen Aufwand, da zu jeder Welle eine Neuerhebung stattfinden muss.
G1 X X X
Schließlich besteht die Gefahr, dass insbesondere die interessanteste Gruppe (die
G2 X X
Fünf-Wellen-Gruppe) unter hoher Panelmortalität leidet. Darüber hinaus werden die
Gruppen, die nur an einer Welle teilnehmen (Gs und Ge in Abb. 5.9) aus der Längs'
Abb. 5.8: Atternierendes Panel
schnittanalyse ausgeschlossen, wodurch sich erneut eine Verringerung des Samples
ergibt.
So wird z. B. eine Gruppe (Gr) in der ersten, dritten und fünften
welle und eine andere Eine weitere Design-Variante ist das ,,geteilte Panel" (,,split panel sureey", Dutlceu/
Gruppe (G2) inderzweitenundviertenwellebefragt. Damitwirdzum einenderGesamt' Kllror.l1987). Dieses Design impliziert die Bildung von zwei Gruppen; eine Gruppe
aufwand der Erhebungen verringert (ieweils weniger Befragte), zum anderen lassen durchläuft dabei eine ,,normale" Panel-Untersuchung (Gr in Abb. 5.10)' die zweite
(,,Warum Gruppe wird als rotierendes Panel oder auch nur als wiederholte Querschnittunter-
sich eventuell Ausfälle aufgrund von Belastungs- und Gewöhnungseffekten
fragen sie das denn schon zum dritten Mal?') verringern. weiterhin kann
durch die suchung (Qr-Qs in Abb. 5.10) in die Erhebung aufgenommen. Diese Variante bietet
längeren Zwischenräume zwischen zwei Befragungszeitpunkten die Gefahr von Pa' zrrtrar den Vorteil, für die Panelkomponente jeweils eine Kontrollgruppe in der Untersu-
ist dieses Design chung zu haben, ist allerdings mit dem Nachteil eines erheblich höheren Aufwands
neleffekten verringert werden. Bei einer geringen stichprobengröße
pro welle
allerdings nicht angebracht, da bei mehrwelligen Panels durch die Ausfälle bei der Auswahl (bei jeder Welle muss eine neue Gruppe gezogen werden) sowie einer
Analyse nicht mehr sinnvoll möglich erheblichen Reduzierung der Stichprobengröße in der Panelkomponente verbunden.
Gruppengrößen erreicht werden, mit denen eine
ist. Da aufgrund der unterschiedlichen Erhebungszeitpunkte für die verschiedenen
wer-
Gruppen von einer eingeschränkten Vergleichbarkeit der Ergebnisse ausgegangen tr tz t3 1a t5
den muss, ist eine erneute Zusammenfassung der geteilten Stichprobe
in den letzten
der letzten G1 X X X X X
Wellen nicht möglich; somit birgt dieses Verfahren die Gefahr des ,,Verlusts"
Q1 X
Wellen mit sich. Q2 X
Q3 X
Q4 X
tl tz tr h t5
Q5 X
G1 X X X x X
Eine klare I Gelegentlich werden auch Trend- und Panel-Untersuchungen kombiniert. Ein Beispiel geben Jnn-
Fli,.r.,u, ,ur Trennung dieser Effekie ist häufig verwirrend und teilweise schlicht falsch' ttlt'tcs/v.Dn'rn (1990). Bei dieser Studie zur politischen Partizipation wurden in drei Ländern in zwei
(2013) und O'BRIEN
Einftihrung gibt GLENN (2003), der Forschungsstand findet sich bei Yer'ic/Lal{p
Wellen Daten erhoben, wobei jeweils nur ein Teil der Befragten aus der ersten und zweiten Welle
(2015).
("cross' identisch war.
2 wurden zahlreiche Designvarianten für die Kombination mehreret Koholten vorgeschlagen
Es 2 Vgl, Gal.runc (tg6ltgS)iMnvun/Hnnrrar.nNs (t984:292-294) und Mlntrr,r (19832677-679).
2005)' Neue Literatur
sequential., ,,cohort-sequential",,,time-sequential", vgl. Pnrlzlu/ONGHENA 3 Die gemeinsame Analyse mehrerer replikativer Surveys lässt sich elegant mit Regressionsmodellen
findet sich bei SILSTRMiN u'a. (2015)' Das prinzipielle Problem der
und ein Anwendungsbeispiel durchfähren, vgl. hierzu FTREBAU e:r-(1997).
Designs nicht gelöst
untrennbarkeit der Effekte von periode, Alter und Kohorte wird auch durch diese 4 MenrrN (D83) behandelt erschöpfend methodische Probleme des Vergleichs der Erhebungen in
(Er,orn/Groncn 2016). Trendstudien.
3 Einzelheiten der Studie finden sich bei PowuR/Eluorr (2006)'
5.5 Untersuchungsformen 223
222 5 Forschungsdesign und Untersuchungsformen -
-
oder das Panel, dar. Es sind vielmehr spezielle Kombinationen von unterschiedlichen
vieleneinzelnenreplikativensuweysuntersuchtwerdenkönnen.lFürsolcheAnalysen Techniken bei der Operationalisierung, Bestimmung der Auswahlelemente oder der
benötigtmanzahlreicheDatensätzemitmöglichstvergleichbarenDatenerhebungen.2 Datenerhebung. Daher muss bei der Planung oder Beurteilung jeder sozialwissenschaft-
Die,,AllgemeineBevölkerungsumfragederSoäalwissenschaften"(ALLBUS)istein lichen Studie geprüft werden, welches Design im engeren Sinne Anwendung findet.1
häufigere und in kürzeren Abständen erfol-
Beispiel für eine rrunortoai., Ji. uui "in. von Nur durch die Analyse des Designs einer Studie kann die prinzipielle Aussagekraft
gende Datenerhebung ausgeiegt ist. Diese
Trendstudie wird seit 1980 im Abstand
einer Studie beurteilt werden. Dies gilt für alle Teilbereiche der Sozialwissenschaften,
ie zwei Jahren wiederholt. alle Erhebungsmethoden und alle Analyseverfahren.
Zu den wichtigsten speziellen Untersuchungsformen als Kombination der Grund-
,,seinerKonzeptionnachistderALLBUs(.'.)einForschungsprogrammzurErhebungundVet-
breitungaktuellerundrepräsentativerDateniiberEinstellungenundVerhaltensweisenderBevöI- techniken gehören Einzelfallstudien, Sekundäranalysen und Netzwerkanalysen. Die
Er soll vornehmlich dem Ziel dienen,
ftir Forschung und
kerung der Buna..rupuutit o.utschland.
fiuchtbare und methodisch ,,Einzelfallstudie" - auch Einzelfallanalyse, ,,case study" oder Fallstudie - nimmt ein be-
kontinuierliche' inhaltlich
Lehre in den Sozialwisäschaften eine stimmtes Objekt zum Untersuchungs- bzw. Analysegegenstand. Die,,Sekundäranalyse"
anspruchsvollernror*tionrg-ndlagezuschaffen,dieallgemeinzugänglichist"(Ponsr1983:37)' greift zur Deskription bzw. zum Hypothesentest auf bereits vorhandene Datensätze
zurück.2 Innerhalb des Forschungsprozesses entfäillt somit der Datenerhebungsprozess.
DerALLBUshateinenfestenKernvonFragestellungen'welcherinjederWelleanca.
genutzt werden'
l(ern kann für Trendstudien Bei der Netzwerkanalyse handelt es sich in erster Linie um ein Datenanalyseverfahren,
3000 Personen erneut erhoben wird. Dieser
das iedoch einer bestimmten Datenstruktur bedarf, die bereits bei der Planung der
DerALLBUSistalsMehrthemen-Befragungkonzipiert(d.h.,eswerdenverschiedene
Politik etc. thematisiert). Der ALLBUS Untersuchung berücksichtigt werden muss.
soziologische Bereiche, z. B. Umwelt' Arbeit,
als auch Studien zum sozialen Wandel'3
erlaubt sowohl aktuelleQuerschnittanalysen
5.5.1 Einzelfatlstudie
5.5 Untersuchungsformen Eine Einzelfallstudie als Betrachtung einer singulären Untersuchungseinheit muss
unter dem Label "Untersuch' sich nicht zwangsläufig auf die Analyse eines einzigen Individuums beziehen, sondern
üblicherweise firmieren in den Sozialwissenschaften sie kann auch mehrere Individuen, die zusammen einen Untersuchungsgegenstand
ungsformen..nebendenvorgängigdargestelltenForschungsdesignsweitereFor-
bezeich' bzw. eine Analyseeinheit bilden, umfassen.3 Häufig wird nach folgenden typischen
und vorgehensweisen
schungsstrategien, die spezielie untersuchungsformen Untersuchungseinheiten unterschieden: a
gekennzeichneten vorgehensweisen
nen.a Diese häufig als üntersuchungsformen
-
Eine einzelne Person ist Gegenstand der Analyse.
stellenjedochkeineeigenständigenForschungsstrategien,wieetwadasExperiment Dieser Fall ist z. B. im Bereich der Psychologie und Medizin häufig anzutreffen.
Untersuchungen einer bestimmten Krankheit oder psychischen Störung werden
an einem Patienten vorgenommen. Aber auch im Bereich der Sozialwissenschaf-
für eine solche Studie stellt die Arbeit von
ScHunll/Konlnn (1995) dar' Hier wurde
iEn-rcirpi.t ten können einzelne Personen Analysegegenstand sein, z. B. bei einer Analyse
sozio'demographischer variablen ftir
das
der theoretisch erwartete Rückgang der Erklärungskraft untersucht' der politischen Einflussmöglichkeiten des Bundespräsidenten oder der Rolle des
erhobenen vetgleichbaren surveys
wahlverhalten durch die Analyse von 37 unabhängig Vorsitzenden der Tarifkommission.s
DiemethodischeDiskussionindiesemArtikelundinderFolgediesesArtikelszeigteinigemethodische
ihrer Kontrolle'
Probleme von Trendstudien und Möglichkeiten suweys
schon die Vergleichbarkeit sehr ähnlicher
2 Zahlreiche erhebungstechnische Details können Probleme stellen 1 Häufig wird man bei der Beurteilung feststellen, dass es sich um fubeiten ohne explizites Design han'
(ugr. niurru Sqrrnlr,/KnrurER 2000)' Die
gleichen
zu einem Zeitpunkt erschJe-ren der Feldarbeit delt (scherzhaft: ,,no-design-study"), In diesen Fällen handelt es sich dann bestenfalls um prinzipiell
undokumentielte Details
sich bei Längsschnittuntrrti.iuigän noct et er, da in det Regel nicht verallgemeinerbare Einzelfallstudien.
die Ergebnisse erheblich beeinflussen können' und firr 2 Zur Sekundäranalyse gehören auch dieienigen sogenannten ,,komparativen Studien", bei denen
von Gesis (vgl' Anhang H) bezogen
3 Die Datensätze des ALLBUS können von Interessenten Kennziffern verschiedener Gesellschaften verglichen werden, vgl, Kapitel 5.5.2,1.2.
eigene AnalYsen genutzt werden' 3 Bei Einzelfallstudien gibt es eine Vielzahl möglicher Kombinationen von Design und Erhebungstech-
einer Vorgehensweise als Untelsuchungs'
4 Je nachdem, welche Kriterien man für die Kennzeichnung nik. Eine Einfühyung gibt yrN (2018).
und mit Namen benennen: z'B die "qualitA'
form anlegt, kann man weitere Stlategien charakterisieren Interviews 4 Vgl. PrrrnnreNN/HEHr (t929:3); Ar,rir,rax{Onrlrnn (1975167-169).
tiveSonalforsclrung", die zumeist auf de,
crunatage uoi Einzelfällen unstandardisierte 5 In
konzen' der Soziologie war es vor allem die Chicagoer Schule, die Einzelfallstudien unter dem Begriff,,life
verwendet, die ,,oral history,,die sich auf die nnurvr. *üinlu.i wiedergegebener Biographien histories" zu einer spezifischen Untersuchungsform enhvickelt hat (HAKru 1987r63f).
triert, und viele andere.
5.5 Untersuchungsformen 225
224 5 Forschungsdesign und Untersuchungsformen
- -
daraus ein gravierender Mangel bezüglich der Generalisierungsfähigkeit der ermittelten
- Eine Personengruppe bildet die Analyseeinheit.
Forschungsresultate.
Häufig genannte Beispiele hierfür sind die Studien von FnSttncER/RIEcKEN/
Andererseits kann dieser Nachteil auch bewusst zugunsten einer differenzierteren
Sqr4cnrpn (1956) über eine Sekte, die den Weltuntergang voraussagte oder die
Datenerhebung und -analyse in Kauf genommen werden (BenroVLezARSFELD t979:72-
Gemeindestudie von Meywrz (tgSA) über die soziale Schichtung und den sozialen
77).So beschränkte sich z. B. die Untersuchung von MevNrz (195s) zwar bewusst auf
Wandel in einer Industriegemeinde.
eine Gemeinde, umfasste daftir jedoch eine Vielzahl von Aspekten der sozialen Schich-
- Eine Organisation ist Gegenstand der Untersuchung.
tung und Mobilität und hatte zudem ,,Pilotcharakter" für zahlreiche darauf aufbauende
So wird z. B. von WtNxlnn/IGRHAUsEN/MEIrn (1935) die Organisationsstruktur
Untersuchungen. Eine generelle Empfehlung für oder gegen solche Fallstudien kann es
und Funktion des Deutschen Sportbundes (DSB) und seiner Einzelverbände zum
nicht geben. Hier ist immer eine Abwägung zwischen der Vielschichtigkeit der interes-
Objekt einer Fallstudie.
sierenden theoretischen Aspekte, dem bisherigen Kenntnisstand in dem betreffenden
- Schließlich werden in Soziologie und Politologie (ganze) Gesellschaften oder Kul'
Forschungsgebiet und den Forschungsressourcen zu treffen. Schließlich können ethi
turen als Einzelfälle behandelt.
sche Kriterien eine Beschränkung auf eine Einzelfallstudie nahelegen. Etwa wenn ein
So kann z. B. die (klassische) Analyse von Gnrcnn (1967), welche die ,,soziale Schich-
Drogenabhängiger in eine neue, bisher nicht bewährte Therapie eintritt.l
tung des deutschen Volkes" untersucht, als Einzelfallstudie betrachtet werden.
Einzelfallanalysen werden in den Sozialwissenschaften unter zwei unterschied-
lichen Aspekten vorgenommen. Zum einen, wie bisher unterstellt, als Mittel der Be-
Einzelfallstudien können somit auf der Auswahlebene und auf der Analyseebene auf
schreibung und Erklärung bzw. des Hypothesentests. Dabei unterscheiden sich die
ein Individuum als Gegenstand zurückgreifen oder auf derAuswahlebene mehrere oder
gar sehr viele Individuen umfassen, die jedoch im Hinblick auf das Untersuchungsziel
einzelnen Schritte des Forschungsprozesses abgesehen von der Realisierung eines
Auswahlverfahrens nicht von anderen Forschungsstrategien. Zum anderen werden
als eine Einheit aufgefasst werden. Dies ist in der Regel der Fall bei Studien, die Erklä-
Fallstudien häufig in einer explorativen Absicht unternommen. Dabei verfolgt die
rungen von Gruppen-, Organisations- oder Gesamtgesellschaftsphänomenen geben
Einzelfallstudie nicht das Ziel einer Theorieprüfung, sondern dient der Hypothesenge-
wollen. Die entsprechenden Hypothesen beinhalten dann zumeist Aussagen über Ver'
nerierung. Unter dieser Zielsetzung wird die Einzelfallstudie zumeist in Verbindung
netzung, Arbeitsteilung, Informationsfluss, Entscheidungsprozesse u. a. zwischen und
mit weniger standardisierten Datenerhebungsverfahren (offenes Interview teilneh-
über Individuen hinweg. Auch wenn die Aussagen solcher Studien im Allgemeinen
mende Beobachtung) eingesetzt. Das so gewonnene Material liefert neben anderen
überindividuelle Sachverhalte betreffen, wird bei der Datenerhebung auf Individuen
als Merkmalsträger zurückgegriffen.l Quellen dann wichtige Informationen zur Theoriebildung und Konzeptspezifikation.
gibt verschiedene Gründe ftir die Festlegung auf eine Einzelfallstudie (Huenn Dafür können, wie für den gesamten Entdeckungszusammenhang von Hypothesen
Es
und Theorien, keine allgemein verbindlichen Regeln angegeben werden.
L9T3t38-43)z Zu erklärende soziale Ereignisse können raum'zeitlich und personell
Zusammenfassend muss beachtet werden, dass Einzelfallanalysen sich für die Hy-
sehr selten sein, so dass sich praktisch keine Alternative zu einer Einzelfallstudie
pothesengenerierung und die Plausibilisierung oder Entdeckung von Prozessabläufen
ergibt. Sowohl für Personen in bestimmten Positionen (Bundespräsident), Gruppen
(Verfassungsrichter, Fußballnationalmannschaft), Organisationen (Weltbank, UN, IBM) eignen, nicht hingegen für den endgültigen Test einer Theorie. Aufgrund der Probleme
gar der empirischen Gültigkeit von Basissätzen (vgl, hierzu Kapitel 3,1.4.2) sind solche
als auch für Gesamtgesellschaften kann dies zutreffen. In diesen Fällen stellt sich
(vgl' Kapitel6), da die Tests allenfalls nur durch wiederholte unabhängige Prüfungen an verschiedenen Un-
nicht erst die Frage nach einem möglichen Auswahlverfahren
tersuchungsobiekten durch verschiedene Untersuchungsgruppen möglich. Obwohl
Analyseeinheit zugleich die Gesamtheit der möglichen Auswahlelemente darstellt.
Einzelfallstudien häufig unverzichtbare erste Schritte eines Forschungsprogramms
In den Fällen, in denen es praktisch möglich wäre, mehrere vergleichbare Analyse'
sein können, sind sie keinesfalls zur Theorieprüfung geeignet.
einheiten (Gruppen, Gemeinden, Unternehmen) zu untersuchen, führt oft ein Mangel
aus
an ökonomischen Forschungsmitteln zu einer Beschränkung auf Einzelftille. Wenn
diesen Gründen auf den Einsatz von Auswahlverfahren verzichtet wird, so ergibt sich
be-
ffin-onutn einer solchen Fallstudie können aber auch Aussagen ftir die als Informationsüäger
mehr von einer ffirinr.rzbereich von Fallstudien, für den auch spezielle (experimentelle) Designs entwickelt
nutzten Individuen gemacht werden. In diesem Fall wäre dann korrekterweise nicht wurden, wird z. B. von PETERMANu (1989) detailliert dargestellt. Einzelheiten, vor allem in der Hinsicht
Aussagen
Einzelfallstudie zu sprechen. D. h, eine Studie kann ie nach den Einheiten, über welche auf Interventionsstudien, finden
einer Einzelfallstudie als auch den einet ,vielzahl"-srudie haben' sich in dem von Knnrocuwrlr,/LEvrN (2014) herausgegebenen Band.
erfolgen, sowohl den charakter
5.5 Untersuchungsformen 227
226 5 Forschungsdesign und Untersuchungsformen -
-
gen, Iftankenkassen u. a.).1 Im Rahmen der Tätigkeiten solcher Einrichtungen entste-
5.5.2 SekundäranalYse hen zwei zusätzliche Datenquellen: ,,Aggregatdaten" einerseits, ,,prozess-produzierte"
I
rrichf, dass sich die erwerbstätigen Frauen zu einem besonders hohen Anteil scheiden
nützteswenig'wenngeeignetelndikatorenvorliegen,dieseiedochnuranmännlichen
I lassen. Ein solcher Fehlschluss von Zusammenhängen auf Aggregatebene auf Zusam-
JugendlichenerhobenwurdenunddieSekundäranalyseAussagenüberErwachsene
h. menhänge auf individueller Ebene wird als ökologischer Fehlschluss bezeichnet.2 Da
anstrebt.
Variablen und Auswahlverfahren keine Informationen über die Individuen vorliegen, sind verschiedene Erklärungen auf
Für eine erfolgreiche Datensuche hinsichtlich
sehr nützliche Dienste'2 Sie stellen der Individualebene mit den gleichen Zusammenhängen auf der Aggregatebene ver-
leisten die sozialwissenschaftlichen Datenarchive
einbar. So könnte der Zusammenhang zwischen dem Anteil erwerbstätiger Frauen und
gegeneingeringesEntgeltvorhandeneDatensätzezurwissenschaftlichenBearbei.
der Scheidungsquote dadurch entstehen, dass Ehen mit nicht-erwerbstätigen Frauen
tungzurVerfügung.nareisindzumindestdieneuerenDatenfastimmerbereitsin
die
gängigen Datenträgern zu erhalten' wodurch in Gebieten mit einem hohen Anteil erwerbstätiger Frauen eher geschieden werden.
maschinenlesbarer Form und auf den
Die Analyse von Aggregatdaten zur Erklärung individueller Handlungen ist aufgrund
Datenaufbereitung (vgl. Kapitel S) entfällt'
amt' des Problems des ökologischen Fehlschlusses eine nahezu vollständig ungeeignete
Daneben existierln vielfältige andere mögliche Datenquellen: Die
Bundesamt, statistische Landesämter und kommunale
Vorgehensweise.
liche statistik (statistisches
'eäoch
Einrichtungen (Bundesversi'
statistische Amter), andere staatliche oder halbstaatliche
organisationen (EU, UN, OECD
cherungsanstalt, sonstige Behörden), internationale 5,5,2,7.2 Makro-komparative Studien
(Banken, Kaufhauskonzerne, Versicherun'
u. a.) und auch kommeriielle lnstitutionen Eine besondere Form der Aggregatdatenalyse stellen ,,makto-komparative Studien"
dar.3 Hierbei werden Kennziffern verschiedener Gesellschaften miteinander verglichen.
1 Methodische Probleme werden bei Lenn (2010) diskutiert. Ein Überblick über die verschiedenen
Formen vorhandener Daten gevuinnt man durch die Lektüre der Beiträge in Band 2 des Gutachtens des
eher die Regel als die Ausnahme'
6ä?rina sekundäranalysen in akademischen Kontexten diese RArswD (2010).
für Sozialwissenschaften" in Köln
2 In Deutschland hat das von Gesis betriebene "Datenarchiv Zusatzin- 2 Vgl. RoBTNSoN (1950) und Hurunull (1972t71-92). Nur unter sehr speziellen Bedingungen ist ein
Datensätze inklusive der entsprechenden
Aufgabe übernommen. Dott sind derzeit über 5500 verftigbar' solcher Schluss möglich, vgl. hierzu LeucnulN/LrcHrMAw (1978) und KIr.rc (1997).
(Bericht über Anlage und Durchführung der untersuchung, codepläne etc')
formationen 3 Solche Studien werden leicht irreführend auch als ,,internationaler Vergleich" bezeichnet,
man in Anhang H'
Hinweise auf die wichtigsten Datenarchive findet
-'1
möglicher Alternativer-
Trotz der Bemühungen einiger Methodologen2 muss die Zahl 5.5.2.3 Record-linkage-Studien
als so hoch betrachtet werden' dass der
klärungen bei makro-komparativen Studien Die Möglichkeiten der Sekundäranalyse prozess-produzierter Daten können beträcht-
die Möglichkeit kausaler
langfristige Ertrag dieser untersuchungsform in Hinsicht auf lich erweitert werden, wenn mehrere Datensätze verknüpft werden, Man spricht in
Aussagen skeptisch beurteilt werden muss'3 diesem Fall von ,,record-linkage", So könnte man den Zusammenhang zwischen Lang-
zeitarbeitslosigkeit und Erkrankungen überprüfen, falls z. B. die Daten der Bundes-
agentur ftir Arbeit mit den Daten von Ikankenkassen verkntipft werden könnten.
dieser Forschungs- Um dabei auch Aussagen über einzelne Individuen machen zu können, benö-
ffi**", *eitschweifige, aber leicht verständliche Darstellung der Probleme
(2003).
tigt man mindestens eine gemeinsame Identifikationsvariable. In skandinavischen
richtung findet sich bei GEDDES
z'8. in diesem Zusammenhang Ländern existiert eine einheitliche Personenkennziffer, die in der Bundesrepublik
2 Hierzu gehören vor allem die Arbeiten von Gary KING, vgl'
Kruc/Knonarqt/Vnnsa (1994)'
rechtlich nicht zulässig ist. In der Bundesrepublik verwenden verschiedene büro-
finden sich zahlreiche weitere
3 In der derzeitigen Forschungspraxis makro-komparativet Forschung kratische Organisationen verschiedene Personenkennziffern (Matrikel-, Personalaus-
Form det Kontrolle von Störvariablen oder Fehlet
Probleme, so z. B. die Vernachlässigung iedweder weis-, Krankenversicherungs-, Sozialversicherungs-, Rentenversicherungsnummer
(2. B. Selektion nach den Ausprägungen der
durch fehlerhafte Auswahl der untersuchungseinheiten etc.). Dateien mit mehreren verschiedenen I(ennziffern für dieselbe Person in unter-
auf solche Da-
abhäingigen Variablen). Schließlich ist die Anwendbarkeit vieler Datenanalyseverfahren
(1993:321) schiedlichen Organisationen existieren selten. Unter solchen Umständen bleiben als
fassen Bollw/Et'trwlsLE/AlnnnsoN
ten prinzipiell fraglich (vgl. Kapitel9.4,3). Entsprechend
mögliche Identifikationsvariablen in der Regel nur der Name, das Geburtsdatum und
ihreÜbersicht über solche empirische Studien etwas resignativ zusammen:
die Adresse der Person. Name und Adresse können sich ändern; alle drei Merkmale sind
have explanation as a goal. A maior threat to
many studies
,,Nearly all the studies we investigate mit Erfassungsproblemen verbunden. Verknüpft man lediglich diejenigen Personen
wish to draw general conclusions'
(. . .) is the failure to apply any method of control. Most authors miteinander, bei denen alle Identiflkationsvariablen fehlerfrei übereinstimmen, erhält
ability to do so. Researchers agree that
but problems ofsampling raise questions about theit
irr,r.r rur.uiäiig *.urotut"nt are largely neglected"'
measurement is problematic, However,
zt0 5 Forschungsdesign und Untersuchungsformen 5.5 Untersuchungsformen 231
- -
man nahezu mit Sicherheit selektive Stichproben. Entsprechend sind fehlertolerante ursprünglichen Datenbeständen A und B erstellen die Datengeber Auszüge, die nur die
Verknüpfu ngsmethoden notwendig.l ursprünglichen Identifikationsvariablen (Name etc.) und die jeweilige neue Kennziffer
Die Nutzung von prozess-produzierten Daten für Sekundäranalysen ist stark von enthalten. Beide Auszüge werden einem Datentreuhänder übergeben, der nun zwar
den Zugangsbedingungen zu den Datenbeständen abhängig. Zentral ist dabei die die ursprünglichen Identifikationsvariablen und die neuen Identifikationsnummern
Behandlung der ldentifikationsvariablen: Die Weitergabe personenbezogener Daten kennt, aber nicht die Daten aus A und B. Der Datentreuhänder verknüpft die beiden
mit Identifikationsvariablen ist häufig heikel. Eine Möglichkeit zur Vermeidung des Auszüge über die ursprünglichen Identifikationsvariablen, flihrt also die Zuordnung
(vgl. Abb. 5'10' der Records aufgrund gleicher oder ähnlicher ldentifikationsvariablen durch. Danach
Problems ist die Verwendung einer Institution als ,,Datentreuhänder"
löscht der Treuhänder die ursprünglichen ldentifikationsvariablen und erstellt eine
neue Datei, die nur die Paare aus beiden neuen Kennziffern enthält. Diese Datei wird
Datengeber A Datengeber B dem Forschungsteam übermittelt. Mit dieser Datei können die Datenbestände A und B
zusammengeführt werden, ohne dass das Forschungsteam die Identität der Personen
NameA NameB NummerB Daten B
DatenA NummerA
kennt.
Welche Institution sich als Datentreuhänder eignet, hängt vom jeweiligen For.
schungsgegenstand ab.l Möchte man verhindern, dass der Treuhänder die Identifi-
katoren kennt, können die Datengeber die Identifikatoren verschlüsseln. Dies führt
Treuhänder aber zum Verlust aller Fälle, bei denen die Identifikatoren durch kleine Datenfehler
(2. B. vertauschte Buchstaben im Namen) nicht vollständig tibereinstimmen. Ein von
NummerA Name A Name B NummerB
ScHNeLL/BlcHrEtER/REIHnn (2009) entwickeltes Verfahren erlaubt aber auch fehler.
tolerantes Record-Linkage mit verschlüsselten ldentifikatoren. Dies sollte den Zugang
zu Datenbeständen für das Record-Linkage erleichtern.
Um prinzipiellZugmgzuDaten für das Record-Linkage zu erhalten, müssen selbst-
DatenB
verständlich alle Datenschutzgesetze strikt eingehalten werden. Nicht selten hängt der
Daten A NummerA NummerB
prinzipielle Zugang zu anonymisierten Daten davon ab, inwieweit man sein Anliegen
als sinnvoll und allgemein dienlich darstellen kann.
Gerade in sozialwissenschaftlichen Anwendungen von Record-Linkage wird dieses
lediglich verwendet, um Befragungsdaten mit individuellen administrativen Daten zu
verbinden. Abhängig von den rechtlichen Bedingungen im jeweiligen Untersuchungs-
Daten A Daten B
land und dem Verwendungszweck ist hierfür häufig die Einwilligung der Personen
erforderlich.2 Sollte für ein Record-Linkage-Projekt die Einwilligung der Befragten
Abb. 5.11 Record-Linkage mit einem Datentreuhänder
5.5.3 Netzwerkanatyse
GUADAGNI
Wie die Einzelfallstudie und die Sekundäranalyse ist die Netzwerkanalyse keine beson' STROZZI
,,(, . . ) the structure of relations among actors and the location of individual
actors in the network
have important behavioral, perceptual, and attitudinal consequences both for the individual units
and fot the system as a whole (. . (KIoxn/KUKLINSKI 1982:13).a
')"
Die Verflechtung der Untersuchungsobjekte in soziale Kontexte wird also explizit be'
rücksichtigt: So kann manz.B. die Freundschafts' oder Mobilisierungsbeziehungen
zwischen den Mitgliedern einer Bürgerinitiative untersuchen oder die privaten Kontak'
SALVIATI
ACCIAIUOL
Fi.r. ror* aer Nichtkooperation kann als Nonresponse wie bei Beftagungen (vgl. Kapitel 5.7) inter-
pretiert werden Scslull in der Einwilligungsrate schon
(2015), Entsprechend zeigen sich Unterschiede PUCCI
durch kleine Variationen der Form der Anftage. Eine knappe Übersicht über den Forschungsstand
findet sich bei Saxsnauc/Altotq (2017). 4bb.5.12: Beispiel eines Netzwerks: Florentinische Famitien lm frühen 15ten Jahrhundert
2 Es gibt eine eigene internationale Fachgesellschaft ftir die Forschung mit Record-Linkage
von Daten-
Landes enthalten: Intemadonal Population Data
sätzen, die im Idealfall die gesamte Population eines
Linkage Network (www.ipdln.org). Dieses Netzrrverk veröffentlicht öe Zeitschrift ,,International Journal
of Population Data Science" (https://ilpds.org), die z. B. Beiftäge aus del Demographie, Epidemiologie
und Soziologie veröffentlicht.
über
3 Methodische Details solcher Studien finden sich bei GRovES (1989t299104). Eine Übersicht
weitere Anwendungen und technische Möglichkeiten flndet sich bei ScrNnLL (20t5) und auf der
IDurch diese Art der Darstellung werden zahlreiche, deutlich anspruchsvollere Analysetechniken
Homepage des German Record Linkage Centers (GRLC, www.record-linkage.de).
möglich. Eine neuere Darstellung der Netzwerkanalyse und der Analysetechniken geben Tnanr-
4 Die Tatsache, dass die Netzwerkanalyse inhaltliche Annahmen besitzt, rechtfertigt die Benennung MANN/HUMMELI
(,,wenn-dann", ,,je'desto") existieren nur /Sonnun (2011). Ein nützliches Nachschlagewerk zur Netzwerkanalyse ist das von
,,Netzwerktheorie,. in keiner weise: Allgemeine Hypothesen Scorr/CARRrNGror,r (2011) herausgegebene
Buch.
bei speziellen Anwendungen der Analysemethode. Eine ,,Netzwerktheorie" existiefi nicht'
234 5 Forschungsdesign und Untersuchungsformen 5.5 Untersuchungsformen 235
- -
Ein Beispiel stellt die Abbildung 5,I2danL Dieses Netzwerk resultiert aus den Ver' den werden. Bei Gesamtnetzwerken werden von jeder Einheit Daten über alle anderen
flechtungen 16 florentinischer Familien im frühen l5ten Jahrhundert. Die Verbindun' Einheiten erhoben. Man hat also alle Verbindungen innerhalb des Netzwerkes, unab-
gen zwischen den Familien basieren hier entweder auf Heiraten odet wirtschaftlichen hängigvon der Perspektive einer einzelnen Person. Ego-zentrierte Netzwerke hingegen
Verflechtungen wie gemeinsame wirtschaftliche Unternehmungen oder vergebene Kre- erheben die Daten über das Netzwerk aus der Sicht einer bestimmten Person. Diese
dite.2 Die besondere Stellung der Familie Medici ist im Netzwerk deutlich zu erkennen. gibt gemäß ihrem subjektiven Kenntnisstand Auskunft über ihre Beziehungen zu an-
prinzipiell ist die Netzwerkanalyse an kein bestimmtes Datenerhebungsverfahren deren Personen und über die Beziehungen der anderen Personen untereinander. In
gebunden. Die Daten können sowohl durch Befragung oder Beobachtung als auch der Forschungspraxis werden fast ausschließlich uniplexe Netzwerke aus der Gesamt-
über sekundäre Quellen (Akten, Protokolle, Geschäftsunterlagen etc.) gewonnen wel' oder Ego-Perspektive erhoben.
den. So gewannen z. B. CRyp4NA/VARESE (2013) die Daten für ihre Netzwerkanalyse Den Vorteilen der Netzwerkanalyse bei der Erfassung und Analyse sozialer Bezie-
durch die Vercodung der Polizeiprotokolle abgehörter Telefonate von Mitgliedern der hungen stehen jedoch auch einige nicht unbedeutende Probleme gegenüber:
neapolitanischen Camorra und der russischen Mafia in Rom. 1. Netzwerke sind häufig nicht klar abgrenzbar, prinzipiell ist eine gesamte Gesell-
Die in einer Netzwerkanalyse erhobenen und analysierten Beziehungen können schaftvernetzt (Mnnsonn 199O:4390. ZurUntersuchungmüssen iedoch Netzwerke
nach unterschiedlichen formalen und inhaltlichen Eigenschaften charakterisiert wer- immer auf einen handhabbaren Umfang beschränkt werden, auch auf die Gefahr
den. Zwei der wichtigsten formalen Eigenschaften stellen die Symmetrie und die Be- hin, dass dadurch wichtige Einheiten ausgeschlossen werden.
wertung solcher Beziehungen dar.3 Eine symmetrische Beziehung liegt dann vor, wenn 2. Es existieren keine Zufallsauswahlverfahren, mit denen Netzwerke als solche zufäl-
eine eventuelle Richtung der Beziehung nicht beachtet wird. Es wird also nur eine lig ausgewählt werden können. Zuftillig ausgewählt werden können nur bestimmte
bestehende Verbindung A-B referiert, ohne Beachtung der zusätzlich möglichen Spezif,- Gruppen, von denen man annimmt, dass sie ein Netzwerk bilden. Damit ist die
kation, wer an wen z. B. eine Leistung erbringt, Informationen weitergibt' Geld leiht o.ä. Netzwerkanalyse vor allem ein strukturbeschreibender Ansatz.
Werden solche Richtungen hingegen berücksichtigt, spricht man von asymmetrischen 3. Nur wenn alle relevanten Einheiten eines Netzwerkes auch als Informanten zur
Beziehungen, die als gerichteter Graph dargestellt werden. Eine bewertete Beziehung
I
I
Verfügung stehen, ist eine sinnvolle Analyse möglich. Verweigern Personen ihre
liegt dann vor, wenn auch Angaben über die Stärke oder Intensität einer Beziehung
I
I
Mitarbeit, dann kann durch diese Ausfälle bzw. fehlenden Werte die Struktur des
erhoben und analysiert werden. ,,Restnetzwerkes" von der tatsächlichen stark abweichen.
Bezüglich der inhaltlichen Eigenschaften können prinzipiell beliebige Beziehun- I
gen Gegenstand der Analyse sein. Sie können privater, freundschaftlicher, geschäftli Die Erhebung und Analyse ego-zentrierter Netzwerke wirft andere Probleme auf. Ein
cher, rechtlicher oder anderer Art sein. Welche Beziehungsart erhoben und analysiert ego-zentriertes Netzwerk umfasst nur die Personen, mit denen ein Akteur in direkter
wird, ist von der theoretischen Fragestellung abhängig.a Verbindung steht und die vom Akteur wahrgenommenen Relationen ntrischen diesen
Netzwerke werden nach einer Reihe von Kriterien klassifiziert.5 So werden vor Personen. Die dem Akteur unbekannten Verbindungen zwischen den Personen, mit d€-
allem uniplexe und multiplexe Netzwerke unterschieden. In uniplexen Netzwerken nen er direkt verbunden ist, werden somit nicht durch ego-zentrierte Netzwerkstudien
wird ein Beziehungstyp, in multiplexen werden gleichzeitig mehrere untersucht. Be' erfasst. Damit entfällt aber auch die Möglichkeit, Effekte solcher objektiv vorhande-
trachtet man Netzwerke nach den Bezugspunkten bei der Datenerhebung, so können nen, aber subjektiv nicht wahrgenommenen Verbindungen auf die Handlungen der
Gesamtnetzwerke und ego-zentrierte Netzwerke (persönliche Netzwerke) unterschie' Auskunftsperson zu überprüfen.
Die Vorgehensweise bei der Erhebung und Erfassung von ego-zentrierten Netz-
werken entspricht weitgehend der üblichen Surveyforschung und wird auch in diese
1 Der Datensatz ist unter http://vlado.fmf,uni-lj.si/pub/networks/data/Ucinet/UciData.htm verfiigbar,
unter integriert. So wurden im ,,General Social Survey" (GSS) und im ALLBUS ego-zentrierte
die Visualisierung des Netzwerkes erfolgte mit dem Programm Pajek. Das Programm findet sich
http: i/paiek.imfm.si/doku.php?id=download.
Daten erhoben. Üblicherweise wird dabei in einen Fragebogen ein sogenannter ,,Netz-
2 Auf der Grundlage einer von KENr (1978) durchgeführten Recherche historischer Dokumente wurde werkgenerator" oder,,Namensgenerator" und eine Reihe von Folgefragen aufgenom-
durch paocnrr (1987) in einer unveröffentlichten Arbeit ein Datensatz erstellt. Der hier verwendete men. Der einfachste Generator besteht aus der Frage nach den ,,drei besten Freunden"
oder
Datensatz von Bnucun/PerrrnsoN (1986) enthält nur dieienigen Familien, die als Unterstützer einer Person, die z. B. mit A, B und C gekennzeichnet werden (Lauualvx 1973). Der
Gegner der Medici-Familie auftraten. Befragte beantwortet danach inhaltliche Fragen zu den jewelligen Eigenschaften von
weitergehenden Differenzierungen vgl. Scsnrvx (t984:42ff), Fncnn (1987: 204) und Peppr 957:15il'
(1
3 Zu
4 Zur Systematisierung der inhaltlichen Beziehungen wurden verschiedene Typologien entlvickelt'
Vgl. dazu KI.rorn/KuxltNsrt (1982r15f); BARNES (1972:16fr)i PAPPI (1987).
s Vgl. Sürwx (1984:30ff); PepPI (1987:12ff),
5.7 Weiterführende Literatur 237
2t6 5 Forschungsdesign und Untersuchungsformen
-
-
Vor diesem Hintergrund ist auf die ,,Triangulation" hinzuweisen.l Triangulation ist
A, B und C.1 So können dann, in Orientierung an den Forschungsfragen' Informatio-
weder ein eigenständiges Verfahren noch eine Methode, sondern lediglich ein Begriff
nen zu soziodemographischen Merkmalen, politischen Einstellungen, empfangenen
für den Versuch, durch den kombinierten Einsatz verschiedener Erhebungstechniken,
Hilfeleistungen, Kontakthäufigkeiten etc. gesammelt werden. Weiter lässt sich über
Auswahlverfahren, Versuchsanordnungen und Messtechniken die speziflschen Schwä-
entgprechende Fragen auch feststellen, ob A, B oder c aus der sicht des Befragten
pflegen oder chen der einen Strategie durch den Einsatz einer anderen, die dort ihre besondere
untereinander befreundet sind, bestimmte private Austauschbeziehungen
Stärke hat, zu kompensieren. Aus der Vielzahl der praktischen Triangulationsmög-
geschäftliche Kontakte unterhalten.
lichkeiten sei hier auf die ,,methodological-between-trtangulation" hingewiesen, die
Im Gegensatz zu herkömmlichen Vorgehensweisen in der Umfrageforschung, die
dieser unterschiedliche Untersuchungsanordnungen zur Überprüfung einer Theorie bei den
ebenfalls z. B. Kontakte zu Verwandten, Freunden oder Kollegen bzw. Merkmale
die relevanten gleichen Personen einsetzt (Dnwzrirr 1970:308). So könnte z. B. eine Korrelationsanord-
Personenkreise erheben, werden bei der ego-zentrierten Vorgehensweise
(Freunde, Verwand- nung mit ihren Vorteilen (große Anzahl untersuchter Personen, relativ ausgeprägte
Personen also nicht über festgelegte allgemeine soziale Kategorien
Personen spezifiziert, nach ihrer externe Validitäfl in einer Studie zusammen mit (einer Reihe von) Experimenten im
te etc.) vorgegeben, sondern sie werden von Ego als
Labor (relativ hohe interne Validitä$ Anwendung finden. Auf diese Weise ist es möglich,
Bedeutung ausgewählt und bei einigen Netzwerkgeneratolen in ihrer Anzahl bewusst
katego- eine Theorie einem Maximum an empirischen Tests auszusetzen und dabei verfahrens-
eingeschränkt. Danach können dann diese sozialen Beziehungen nach ihrer
Etwa danach, ob und wie viele der ,,besten spezifische Fehlerquellen zu minimieren.
rialen Zugehörigkeit untersucht werden:
Freunde" Arbeitskollegen oder Nachbarn sind (vgl' PAPPI 1987:2Of). Weitere
Analy-
semöglichkeiten für ego-zentrierte Daten liegen z. B. in der Berechnung der Dichte
dieses persönlichen Netzes, welche dann z. B. für das Ausmaß an sozialer
Unterstüt' 5.7 Weiterflihrende Literatur
zung von Relevanz ist.
Elementare Einführungen in das Forschungsdesign und verschiedene Untersuchungs-
Ego-zentrierte Netzwerke sind eine Ergänzung der üblichen Befragungstechniken,
und ana- formen in den Sozialwissenschaften geben BoRDENS/ABBorr (2018) und Tossrov
da mit ihrer Hilfe die Einschätzung der sozialen Umgebung detailliert erfasst
(2015) für die Politikwissenschaften. Eine grundlegende und leicht verständliche Ein-
lysiert werden kann.2 Zwar ist diese Technik problemlos in konventionelle Surveys zu
führung in die Logik und den Aufbau von Untersuchungsanordnungen (,,Forschungs'
integrieren, aber alternative Erklärungen für die Ergebnisse bleiben daher stets möglich.
wahrgenomme- design") ist das mittlerweile klassische Buch von Caulrnll/Srnlllrv (1963). Die immer
Es handelt sich bei ego-zentrierten Netzwerken immer um die subjektiv
des Ausmaßes noch lesenswerten drei klassischen Bücher zur Artefaktforschung von Robert RosrN-
ne soziale Umgebung. Weiterhin können kausale Aussagen über Effekte
rIrx. und Ralph L, RosNow (,,Artifact in Behavioral Research", ,,Experimenter Effects
der Homogenität der Netze zumindest außerhalb von Längsschnittuntersuchungen
In Behavioral Research" und ,,The Volunteer Subject") wurden gemeinsam in einem
kaum geprüft werden.
Band neu veröffentlicht (Rosnwtw/RosNow 2009). Das mit Abstand beste verfügbare
Lehrbuch zum Forschungsdesign und potentiellen Artefaktquellen ist das Buch von
Sneorsu/Coox/Ceiuenrll (2002).
5.6 Kombination von Untersuchungsformen
Um tatsächliche Studien auf dieser Grundlage beurteilen zu können, sollte die
Entwicklung plausibler alternativer Erklärungen anhand der zahlreichen Beispiele
Wichtiger als eine weitergehende Differenzierung der genannten Untersuchungsfor-
Unter- in dem einzigartigen Buch von Hucx/Slt'lolrn (1979) geübt werden. Das Buch von
men ist die Betonung der Wichtigkeit einer Entscheidung für ein bestimmtes
durch KIxc/Knouewn/Vsnea (1994) zlmethodologischen Problemen und deren Lösungen
suchungsdesign im Sinne der Logik des Experiments (vgl. Kapitel 5.2). Denn
ermöglicht, wird die für qualitative und quantitative Studien gehört nun auch zur unverzichtbaren metho-
die Kontrollmöglichkeiten, die die Untersuchungsanordnung
dologischen Literatur zum Forschungsdesign.
Aussagefähigkeit einer Studie wesentlich bestimmt'
Gründliche Darstellungen der Analyse und des Designs von Experimenten
finden sich z. B. bei Mason/Gulsr/Hnss (2003), Mowrcounnv (2013) und MAx-
ffif,Ai"r.n Namensgenerator wird die maximale Größe des Netzwerkes forschungstechnisch
bereits auf drei personen beschränkt. Ferner ist die Formulierung ,,beste Freunde" mit verschiedenen
problemen verbunden, da die Befragten ihn verschieden interpretieren. Deshalb wurden weitere
(vgl' Lauruai'rr 1973;
Namensgeneratoren vorgeschlagen, die diese Probleme zu umgehen versuchen 1 Zu den verschiedenen Triangulationsmöglichkeiten
(2011)' vgl, Dnwzru (1970:297313);FIELDINc/FIELDING
FrscHER 1982; BURr 1984; n.u.r. Lit t"tur findet sich bei BIDART/CHARBoNNEAU
(tgeo:zl-42).
2 Die so gewonnenen Daten sind mit standaldstatistikproglammen zu analysieren.