Beruflich Dokumente
Kultur Dokumente
Martin Brunner
martin.brunner@uni-potsdam.de
1
Aufbau der Vorlesung
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien von Quasi-Experimenten
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
3
Inhalte der heutigen Vorlesung
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
4
Arten von Studiendesigns / Versuchsplänen
Definition
• Eine empirische Studie wird dann als intern valide bezeichnet, wenn ihre
Ergebnisse die eindeutige Schlussfolgerung zulassen, dass die unabhängige
Variable (X) eine kausale Wirkung auf die abhängige Variable (Y) hat.
• Die Evidenz für die Schlussfolgerung basiert dabei auf
• den empirischen Ergebnissen der Studie selbst
• der Konsistenz dieser Ergebnisse
• über Studien hinweg
• mit den theoretischen Erwartungen
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton Mifflin Company. 7
Was sind Ursache und Wirkung? Kontrafaktisches Modell
Ursache Wirkung
https://www.uni-bamberg.de/fileadmin/bagss/Bilder/Editorial/21711197.jpg
Donald Rubin
• Rubin‘s Kontrafaktisches Modell („counterfactual model“)
• Gedankenexperiment: Welche potentiellen Ereignisse würden wir für eine Person
beobachten, wenn diese unter identischen Rahmenbedingungen an allen
experimentellen Bedingungen teilnimmt
• Potentielle Ereignisse am Beispiel der LekoLemo-Studie
• Empirische Beobachtung
• Wir konnten beobachten, welche Leseleistung ein bestimmter Schüler (z.B.
Klaus) erzielte, der am Training teilnahm
• Kontrafakt
• Welche Leseleistung hätten wir für Klaus beobachten können, wenn er nicht
am LekoLemo-Training teilgenommen hätte?
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton Mifflin Company. 8
Was sind Ursache und Wirkung? Kontrafaktisches Modell
Ursache Wirkung
https://www.uni-bamberg.de/fileadmin/bagss/Bilder/Editorial/21711197.jpg
Donald Rubin
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
10
Prinzipien Quasi-Experimenteller Studien
Ursache Wirkung
Quasi-Experiment
• Ein Experiment ohne Randomisierung
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton Mifflin Company. 11
Inhalte der heutigen Vorlesung
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
12
Beschreibung der Studienanlage
Strukturelle Designelemente zum Ausschluss von Alternativerklärungen bzw.
Konfundierungen
• Strukturelle Designelemente zur Kontrolle von ..
• personengebundenen Störvariablen
• Störvariablen in der Versuchssituation
• Strukturelle Designelemente definieren die Studienanlage (Studiendesign)
Notation
NR O1 X O2 O3
NR O1 O2 O3
• X = LekoLemo-Training
• 1 = Prätest, 2 = Posttest, 3 = Follow-Up Messung
• NR = nicht-randomisierte Zuweisung (nicht-äquivalente Gruppen)
14
Beispiel 2: Project STAR
Bisherige Darstellung
Notation
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
16
Kultusministerkonferenz: Datengestützter Entwicklungskreislauf an einer Schule
Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland. (2010). Konzeption der Kultusministerkonferenz zur Nutzung der Bildungsstandards für die
Unterrichtsentwicklung. München: Wolters Kluwer. Abgerufen von http://www.kmk.org/fileadmin/Dateien/veroeffentlichungen_beschluesse/2010/2010_00_00-Konzeption-Bildungsstandards.pdf
17
Ein-Gruppen Prä-Posttest-Design
O1 X O2 X? O3 X? O4
• X = Maßnahmenpaket; X? = (verändertes?) Maßnahmenpaket
O1 X O2
Effekt des
Trainings?
X = LekoLemo-Training
O1 O2
19
Ein-Gruppen Prä-Posttest-Design
O1 O2 X O3
O1 O2 X O3
Effekt des
Trainings?
X = LekoLemo-Training
O1 O2 O3
22
Ein-Gruppen Prä-Posttest-Design mit zweifachem Prätest
Fiktive LekoLemo-Studie
• nicht-äquivalente Outcome-Variable = Auswahl abhängiger Variablen mit
unterschiedlicher Sensitivität für den Interventionseffekt
• „coherent pattern matching“
• Leseleistung (OA) ist sensitiv für Effekt des Lesetrainings, Mathematikleistung (OB)
ist nicht/kaum sensitiv für den Effekt eines Lesetrainings
• Erwartetes Ergebnismuster: Leistungszugewinn bei der Leseleistung, keine
Veränderung der Mathematikleistung zwischen den beiden Messzeitpunkten
• Sofern das empirische das theoretisch-erwartete Ergebnismuster widerspiegelt,
ist das ein möglicher Nachweis für den kausalen Effekt des Trainings
s. West, S. G. (2009). Alternatives to Randomized Experiments. Current Directions in Psychological Science, 18(5), 299–304. 26
Ein-Gruppen Prä-Posttest-Design mit nicht-äquivalenten Outcome-Variablen
Fiktive LekoLemo-Studie
• Counterfactual
• Leistungszugewinn in der Mathematikleistung (in der Abb. war kein
Leistungszugewinn beobachtbar)
• Potentieller Effekt
• Differenz des Leistungszugewinn in der Leseleistung und dem
Leistungszugewinn in der Mathematikleistung
s. West, S. G. (2009). Alternatives to Randomized Experiments. Current Directions in Psychological Science, 18(5), 299–304. 27
Ein-Gruppen Prä-Posttest-Design mit nicht-äquivalenten Outcome-Variablen
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
29
Prä-Posttest Kontrollgruppen Design
NR O1 X O2
NR O1 O2
30
Prä-Posttest Kontrollgruppen Design
NR O1 X O2
NR O1 O2
NR O1 X O2 O3
NR O1 O2 O3
adjustierter
Mittelwertunterschied* im
Follow-Up zwischen
Trainings- und
adjustierter Mittelwertunterschied beim Kontrollgruppe ist statistisch
Posttest ist statistisch nicht signifikant von signifikant von Null
Null verschieden verschieden.
35
Inhalte der heutigen Vorlesung
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
36
Kontrollgruppendesigns mit mehreren Messzeitpunkten
Brunner, M., Pant, H. A., & Stanat, P. (2014). Diagnostik und Evaluation. In T. Seidel & A. Krapp (Hrsg.), Pädagogische Psychologie (6. Aufl.) (S. 483–516). Weinheim: Beltz.
Raudenbush, S. W. (2001). Comparing personal trajectories and drawing causal inferences from longitudinal data. Annual Review of Psychology, 52, 501–525.
37
Kontrollgruppendesigns mit mehreren Messzeitpunkten
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
40
Kohortenkontroll-Designs
Klassenstufe Schuljahr
2016 2017 2018 2019 2020 2021 2022
1
2
3
4
5
6
Kohortenkontroll-Designs: Im Überblick
• In vielen institutionellen Kontexten (z.B. Einzelschulen, Schulsysteme) „wachsen“
Gruppen (= Kohorten) hoch und werden durch neue Gruppen ersetzt
• Kohorte 1 (orange): Erstklässler, die im Schuljahr 2016/17 eingeschult werden
• Kohorte 2 (lila): Erstklässler, die im Schuljahr 2017/18 eingeschult werden
• Eine Kohorte dient als Kontrollgruppe für die andere Kohorte
• Beispiel
• BERLIN-Studie
• Zentrale Annahme
• Selektionseffekte zwischen Kohorten sind geringer als zwischen anderweitig
zusammengestellten Vergleichsgruppen
Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and
quasi-experimental designs for generalized causal inference. Boston:
Houghton Mifflin Company. 41
Studiendesign zum datengestützten Entwicklungskreislauf an einer Schule
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
43
Schulstruktur in Deutschland
Reform des Berliner Sekundarschulwesens (Beschluss des Berliner Abgeordnetenhauses vom 25.06.2009)
• bis zum Schuljahr 2009/2010: Dreigliedriges System
• Hauptschule, Realschule, Gymnasium
• an den unterschiedlichen Schulformen können nicht alle allgemeinbildenden
Schulabschlüsse erworben werden
• ab dem Schuljahr 2010/2011: Zweigliedriges System
• Integrierte Sekundarschule, Gymnasium
• an den unterschiedlichen Schulformen können alle allgemeinbildenden
Schulabschlüsse erworben werden
Neumann, M., Becker, M., Baumert, J., Maaz, K., & Köller, O. (Eds.). (2017). Zweigliedrigkeit im deutschen Schulsystem: Potenziale und Herausforderungen in Berlin. Münster New York: Waxmann. 45
BERLIN-Studie: Beispiel für ein natürliches Experiment
Stichprobe Jahr
2011 2012 2013 2014 2015 2016 2017 2018
7. Jahrgangsstufe
8. Jahrgangsstufe
9. Jahrgangsstufe
10. Jahrgangsstufe / Ausbildung
11. Jahrgangsstufe
12. Jahrgangsstufe
13. Jahrgangsstufe
Mehrkohortenkontrolldesign
• Vergleich der erzielten Bildungserträge von zwei repräsentativen
Stichproben von Schülerkohorten
• Kontrollkohorte: dreigliedriges Schulsystem
• N = 2.783 Neuntklässler*innen
• Reformkohorte: zweigliedriges Schulsystem
• N = 2.109 Neuntklässler*innen Neumann, M., Becker, M., Baumert, J., Maaz, K., & Köller, O.
(Eds.). (2017). Zweigliedrigkeit im deutschen Schulsystem:
Potenziale und Herausforderungen in Berlin. Münster New
York: Waxmann.
47
BERLIN-Studie: Kohortengemeinsamkeiten und -unterschiede
https://cdn.pixabay.com/photo/
2019/03/30/20/52/test-
4092025_960_720.jpg
Reformkohorte besser
als Kontrollkohorte
Kontrollkohorte besser
als Reformkohorte
Reformkohorte besser
als Kontrollkohorte
Kontrollkohorte besser
als Reformkohorte
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
53
Unterbrochene Zeitreihenstudien
Beispiel: Zeitreihe mit 12 Messungen
Unterbrochene Zeitreihe
• Zeitreihe = Große Anzahl an Messungen
• Für dieselbe Person
• Für dieselbe Analyseeinheit (z.B. schwere Autounfälle in den USA)
• Unterbrochene Zeitreihe
• Wie ändert sich das Muster in der Zeitreihe, wenn eine „Intervention“ X
stattfindet (z.B. X = „der 11. September“)?
54
Gefürchtete Risiken, 11.9.2001 und tödliche Verkehrsunfälle in den USA
“This number of about 350 lost lives is an estimate of the price Americans paid for
trying to avoid the risk of flying”
Gigerenzer, G. (2004). Dread risk, September 11, and fatal traffic accidents. Psychological Science, 15(4), 286–287. https://doi.org/10.1111/j.0956-7976.2004.00668.x
55
Unterbrochene Zeitreihenstudien
Beispiel: Zeitreihe mit 12 Messungen
Unterbrochene Zeitreihe
• Hauptgefährdungsfaktoren der internen Validität
• Historische Ereignisse, die X überlagern
• z.B. wenn sich ab Oktober 2001 die Fahrverhältnisse auf den Straßen
wetterbedingt massiv verschlechtert hätten
• Änderung von Testverfahren
• z.B. wenn ab Oktober 2001 die Kategorie, was als „schwerer“ Unfall zählt,
geändert worden wäre
• Selektionseffekte (falls sich die Komposition der Analyseeinheit bei Beginn der
Intervention X ändern sollte)
• z.B. wenn ab Oktober 2001 andere Personengruppen am Straßenverkehr
in den USA teilgenommen hätten
56
Inhalte der heutigen Vorlesung
• Quasi-Experimente
• Ursache und Wirkung: Wiederholung wichtiger Konzepte
• Prinzipien
• Strukturelle Designelemente der Studienanlage
• Interne Validität von Quasi-Experimentellen Studiendesigns
• Studien ohne Kontrollgruppe
• Studien mit Kontrollgruppe
• Studien mit Kontrollgruppe und mehreren Messzeitpunkten
• Kohorten-Kontrolldesign
• Natürliches Experiment: Die Berlin-Studie
• Zeitreihenstudien
• Wie gut können Quasi-Experimente kausale Effekte approximieren?
57
Interne Validität von Quasi-Experimenten
Heinsman, D. T., & Shadish, W. R. (1996). Assignment methods in experimentation: When do nonrandomized experiments approximate answers from randomized experiments? Psychological Methods, 1, 154–169.
60
Zusammenfassung
61
Zusammenfassung: Was Sie heute lernen konnten
• Quasi-Experimente
• Zentrale Konzepte
• Studiendesigns, Bedingungen für eine kausale Beziehung, Kontrafaktisches
Modell, interne Validität
• Prinzipien
• Identifikation plausibler Gefährdungsfaktoren, Primat der Kontrolle, „coherent
pattern matching“
• Strukturelle Designelemente der Studienanlage
• Notation
• Diskussion der internen Validität von Quasi-Experimentalen Studiendesigns
• ohne Kontrollgruppe, mit Kontrollgruppe, unterbrochene Zeitreihe
• BERLIN-Studie als Beispiel eines natürlichen (Quasi-)Experiments mit
Mehrkohortenkontrolldesign
• Bedingungen unter denen Quasi-Experimente kausale Effekte gut approximieren
können
62