Beruflich Dokumente
Kultur Dokumente
Übersicht
I. Externe Validität
II. Was ist Metaanalyse
III. Schritte einer Metaanalyse
IV. Fixed oder Random
V. Ergebnisse
VI. Beispiele
I. Externe Validität
Positivistische Perspektive
▪ Campbell & Stanley (1966) Cook & Campbell (1979) Shadish et al. (2002): Externe
Validität ist die Frage nach der Generalisierbarkeit von Befunden auf andere als die
untersuchten Populationen, Settings, Behandlungsvariablen und Messverfahren
▪ Kurze Antwort auf Frage ist: gar nicht. Vorausgesetzte Form der Generalisierung
beruht auf Induktion, die philosophische Grundhaltung ist positivistisch.
Kritisch Rationalistische Perspektive
▪ Deduktivistische / kritisch rationale Umdeutung externer Validität nötig. Adäquatheit
von Hypothesentests fokal. Intention der Bestätigung von Hypothesen durch
angestrebte ausbleibende Falsifikation zu ersetzen
Erörterung externer Validität einer Untersuchung sollte fragen:
▪ Sind die hergestellten oder aufgesuchten Bedingungen geeignet? Ist die
Operationalisierung gelungen?
▪ Wie vielfältig und verschiedenartig waren die untersuchten Personen, Situationen
und Messverfahren unter denen Hypothese nicht falsifiziert wurde?
▪ Besteht Hypothese auch Tests unter natürlichen, praxisbezogenen, „ökologischen“
Bedingungen?
Bedrohungen der externen Validität
▪ Shadish , Cook, & Campbell, 2002: The validity of inferences about whether the cause
effect relationship holds over variation in persons, settings, treatment variables, and
measurement variables
…bedroht, wenn Interaktionen mit …
▪ Beobachtungseinheiten ( Vpn
▪ Behandlungsvariationen (UV)
▪ Outcomevariablen (
▪ experimentellen Settings (Zeit, Kultur,…)
Es geht hier eigentlich nur um Generalisierung. Gelten die Ergebnisse im Allgemeinen oder
bezieht es sich nur auf die hier genannten Interaktionen? Um das festzustellen machen wir
diese externale Validierung und das geht am besten mit Metaanalysen.
Meta-analyse
▪ Quantitative Forschungssynthese
▪ Weg zur Untersuchung von Replikationen (Replikationen nicht im Engen Sinne (genau
das gleiche nochmal untersucht) sondern eher allgemein (selbe Fragestellung
untersucht in verschiedenen Settings)
▪ Zusammenfassung umschriebener Forschungsbereiche
▪ Ziel: Identifizierung von Effekten, von Effektvariation und von Prädiktoren hierfür
▪ Basiert auf zentralem Prinzip der Wissenschaft: „The advancement of scientific
knowledge is based on a systematic building of one study on top of a foundation of
prior studies , the accumulation of which takes our understanding to ever increasing
heights .“ Card, 2012
Geschichte
▪ Starkes Interesse an Zusammenfassung von Ergebnissen empirischer (Sozial --)
Forschung Anfang 70er Jahre
▪ Einführung des Begriffs 1976 durch Gene V. Glass
▪ Parallele Entwicklung statistischer Aspekte der Metaanalyse durch:
o Glass, McGaw & Smith (1981): Psychotherapieeffektforschung
o Hunter, Schmidt & Jackson (1982): Validitätsgeneralisierung
o (später) Hedges & Olkin (1985), Rosenthal (1991)
▪ Heute etabliert, anerkannt, wichtig (In APA werden scheinbar fast nur noch
Metaanalyse veröffetlicht.) → http://psycnet.apa.org/PsycARTICLES/journal/bul/
Forschungsgegenstand
▪ Gegenstand: Untersuchungsergebnisse
▪ Ziel: Forschungsstand verstehen
o Markiert Status Quo des Wissens
o Hilft Zufallsbefunde zu erkennen
o Begründet praktische Maßnahmen
o Begründet Entscheidungen über
zukünftige Forschung,
Forschungsförderung etc.
▪ Annahme: Reviewer sind unfähig oder
unmotiviert, eine vollständige, rationale und
transparente Synthese verfügbarer
Forschungsergebnisse durchzuführen
▪ Konsequenz: Forschungssynthese selbst wissenschaftlich-methodischer Gegenstand
Probleme von Meta-analysen
Aber Untersuchungsergebnisse oft problematisch
▪ Exhaustion & Realisierung
▪ HARKing, p hacking, data snooping, specif. search
▪ Reproduzierbarkeit/Replizierbarkeit
▪ Omitting 0 results
▪ Unterpowerte Studien
▪ Publication bias , file drawer
▪ Fehler (Datenübertragung etc.)
▪ Undisclosed Flexibility in Data Collection and Analysis, researcher df : mehr Daten ,
Vpn raus, Bedingungen kombinieren, Daten transformieren
▪ Schwache Designs
▪ Fragwürdige Forschungspraktiken (74% spezielle DV, 71% Ende falls p<.05, 54% post
hoc Hypothesenanpassung)
Beispiele
www.cochranelibrary.com
Siehe auch
www.campbellcollaboration.org/
4. Unverzerrte Auswahl
▪ Database Bias
▪ Publikationsbias: Selektive Publikation positiver Effekte , signifikanter Effekte
▪ Englischbias: nicht englischsprachige Arbeiten häufig ausgeschlossen
▪ Zitationsbias: Sign./pos. Befunde eher häufiger zitiert als nonsig./neg. Befunde
▪ Publikationsformat: Dissertation, Zeitschrift, etc
▪ PRISMA Diagramm erstellen:
▪ Biases:
5. Kritische Bewertung und Kodierung
Zu kodierende Variablen:
▪ Artikelmerkmale: Veröffentlichungsjahr, Veröffentlichungsart (Dissertation,
Zeitschrift, etc.)
▪ Merkmale Stichprobe: N für Effekt, Anteil Frauen, etc.
▪ Merkmale Methode: Name der Tests, Reliabilität, Qualitätsrating Methoden
▪ Spezifische Ergebnisse: Art und Größe des Effektgröße (r, d, …)
▪ In code book sheet doppelt kodieren, Reliabilitätsschätzung
7. Artefakte ES
Bestimmung
▪ Stichprobenfehler
▪ Messfehler AV, Messfehler UV
▪ Dichotomisierung stetiger AVs; UVs
▪ Variabilitätseinschränkung UV
▪ Mangelnde Konstruktvalidität AV; UV
▪ Berichts oder Transkriptionsfehler
▪ Varianz, die auf Drittvariablen zurückzuführen ist
▪ Minderungskorrektur
▪ Gewichte wi
▪ invers proportional zu bedingter Varianz jeder Studie
▪ Minimieren Varianz der Effekte
▪ Alternativ: Gewichtung mit Stichprobengröße 𝑁𝑖
▪ Test der Homogenität von Q über Studien hinweg: χ ² Test mit k-1 Freiheitsgraden (H
0 = kein Unterschied)
▪ I²
o ~ .25 → niedrige Heterogenität
o ~.50 → moderate Heterogenität
o ~ .75 → hohe Heterogenität (Higgins & Thompson, 2002)
▪ T ²: Häufig berichtet aber schwierig zu interpretieren
V. Ergebnisse - Beantwortung der Forschungsfrage (Schritt 8)
Forest plot
Funnel plots
Influence
Symbolgröße proportional zu ES Gewicht .
Gepunktete Linie : 0 Effekt. Durchgezogene Linie
gewichtete lin. Regression aller ES (k = 257).
Qualität
▪ Fragwürdige Forschungspraktiken auch in Metaanalysen?
▪ Reproduzierbarkeit: 54 Metaanalysen in 2013-2014. Nur ⅔ enthalten komplette
Effektgrößentabelle . In jede 2. Studie Daten nicht verfügbar oder Effekte nicht
reproduzierbar (Lakens et al., 2017)
▪ Transparenz
▪ Fehlende file drawer Studien
▪ Rasch überholt
▪ Metaanalysen fortlaufend oder bottom up: http://metabus.org/ ,
http://metalab.stanford.edu/
Ausblick
▪ Metaanalytische Methoden entwickeln sich fort. Beispiele:
▪ Meta SEM
▪ Multilevel MA (one stage) vs. Ind.Participant MA (two stage [erst ES, dann
▪ Second order MA (Metaanalyse von Metaanalysen)
▪ Network MA
▪ Fortlaufende Metaanalysen, Replikations MA
VI. Beispiele
1. Beispiel
▪ .51 für GMA aus sehr großer
Studie (Hunter, 1980;
▪ Hunter & Hunter, 1984). Über
32.000 Beschäftigte in 515
verschiedenen Berufen. AV:
Performanz im Beruf und in der
Qualifikation
▪ Validität GMA fällt mit
Anspruch des Berufs : .58
managerial jobs, .51 für mittel komplexe Jobs, .23 für sehr simple Jobs
▪ Koeffizienten korrigiert für Messfehler im Kriterium und Varianzeinschränkung.
Operationale Validität
▪ Integritätsfragebogen:
o Würde jedermann stehlen, wenn die Bedingungen günstig sind?
o Haben Sie jemals daran gedacht, Geld von Ihrer Arbeitsstelle zu entwenden?
▪ Messfragen! Berufliche Performanz manifestiert in Quantität (n produzierter ,
verarbeiteter , verkaufter Einheiten ), Qualität der Arbeit Fehlerraten ,
Produktinspektion), Produktivität Quantität pro Zeit ), Kreativität , Selbsteinschätzung
, Peereinschätzung , Teameinschätzung , Assessment Center, Unfälle , Kündigung ,
Kündigungsabsichten , Training & Weiterbildung , Empfehlungsschreiben ,
Abmahnungen , Leistungserfassungen , Verspätungen , Fehlzeiten , Willfährigkeit mit
Firmenpolitik ), Org. Citizenship Beh .
▪ 8 Performanzdimensionen: berufsspezifische Fähigkeit, nicht berufsspezifische
Fähigkeit ; Fähigkeit mdl. & schriftl . Zu kommunizieren , Demonstration von
Anstrengung , Erhaltung pers. Disziplin , Erleichtern von Peer und Teamleistung ,
Führung , Management
▪ Evaluation von Trainings
o muss oft durchgeführt werden
o wird oft durchgeführt
o orientiert sich oft am Kirkpatrick Modell
▪ Beziehungen zwischen Trainingskriterien?
→ Alliger , G. M., Tannenbaum, S. I., Bennett, W., Jr., Traver , H. & Shotland , A.
(1997). A meta analysis of the relations among training criteria . Personnel
Psychology , 50 , 341 358.
2. Beispiel
3. Beispiel
Absorption
Analytical / Curiosity
Inquiring Intellect
Intolerance for Ambiguity
NFC
Novelty seeking