Beruflich Dokumente
Kultur Dokumente
Boomgaarden
1
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Empirie
• Wissen kann nur aus Beobachtungen und Erfahrungen generiert werden, die zu Beweisen
führen.
• Alle Theorie muss geprüft werden anhand von Beobachtungen der Realität, und darf nicht nur
auf Argumentation, Intuition oder Offenbarung beruhen.
• Empirie ist auch “nur” eine Theorie… (vs. z.B. Rationalismus)
Empirische (Kommunikations-) Wissenschaft
• Relative Aussagen statt absolute Aussagen
• Probabilistische Aussagen statt deterministische Aussagen Empirische Aussagen über einen
Objektbereich sind nicht “absolut wahr”, sondern haben immer einen “statistischen Fehler”
(Irrtumswahrscheinlichkeit z.B. α < 0.05)
Quantitativ heißt „messen“
Def. Messen = Die Zuordnung von Zahlen zu Objekten nach festen Regeln.
• Ausschnitte aus der sozialen Realität systematisieren und intersubjektiv nachvollziehbar
machen
• Komplexitätsreduktion
• Indikatorenbildung
• Transformation von empirischen in numerische Relative
→ Ziel: numerisches Relativ = empirisches Relativ d.h. eindeutige, strukturtreue Abbildung der sozialen
Wirklichkeit.
Hypothesen und Variablen
Eine (nomologische) Hypothese = die Behauptung eines vermuteten Zusammenhangs zwischen
mindestens zwei Variablen. Deterministische Hypothese = Fallgesetz in der Physik.
Probabilistische Hypothese = Normalfall der Sozialwissenschaften
Eine Variable = ein Name für die Summe der Merkmalsausprägungen, die Objekten
(Untersuchungseinheiten oder Merkmalsträgern) zugeschrieben werden.
Operationalisierung
Messbar machen von theoretischen Konstrukten - Beispiele für Konstrukte: Intelligenz, politisches
Interesse, politisches Wissen, Medienvertrauen
➔ Messbar machen mit Skalen
Skalenniveaus:
• Nominalskala: Die Ausprägungen schließen sich logisch gegenseitig aus. Bsp.: Geschlecht,
Religionszugehörigkeit, Parteiwahl, Lieblingssender.
• Ordinalskala: Abstände zwischen den Ausprägungen NICHT gleich groß. (Rangfolge)
• Intervallskala: kein absoluter Nullpunkt z.B.: Jahreszahl, IQ
• Verhältnisskala/Ratioskala: absoluter Nullpunkt z.B.: Fernsehdauer in min, Alter, Länge
2
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Skalierungsverfahren
Thurstone-Skala: Besteht aus mehreren Items mit dichotomer oder polytomer Antwortvorgabe, deren
Werte, mit bestimmten Punktwerten gewichtet, zu Gesamtwert (Index) zusammengefasst werden.
Bsp.: Tests in Magazinen „Wie gesund ist Ihr Lifestyle?
Likert-Skala: Besteht aus mehreren mindestens fünfstufigen Items, die zu einem Index durch Addition
zusammengefasst werden. Aussagekräftiger als Thurstone. In Sozialwissenschaften gebräuchlicher!
Reliabilität
eines Messinstruments heißt Zuverlässigkeit der Messungen. Wiederholt man die Messung, sollte man
das gleiche Ergebnis erzielen. Beschreibt man als einen Koeffizienten auf einer Skala von 0 bis 1.
• Paralleltest-Reliabilität = Derselben Versuchsperson werden zwei einander stark ähnelnde
Tests (entweder unmittelbar hintereinander oder zeitlich versetzt) dargeboten.
• Split-Half-Test-Reliabilität = Test wird in zwei Hälften unterteilt, mit jeder Hälfte des Tests
sollte in etwa ein ähnlicher Mittelwert bzw. weitere statistische Kenngrößen ermittelt werden.
• Re-Test- Reliabilität = Reliabilität als Korrelation wiederholter Testdurchführungen: Stabilität
desselben Messinstruments über Zeit.
Reliabilität der Kodierer
• INTERcoder Reliabilität: Konsistenz zwischen mehreren KodiererInnen
• INTRAcoder Reliabilität: Konsistenz derselben KodiererInnen über Zeit.
• ForscherInnen-CodiererInnen-Reliabilität: Wie gut stimmen die Verschlüsselungen der
CodiererInnen mit denen der ForscherInnen überein?
3
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Codebuch
• Müssen verständlich sein
• Operationalisierbar sein
• Dient als Kommunikationsmedium, damit andere ForscherInnen die Datenerhebung
reproduzieren können
• Explizites, konkretes Protokoll, dass mit anderen Forscherinnen geteilt werden kann
• Mehrere KodiererInnen sollten die Einheiten unabhängig voneinander kodieren und
zumindest einer sollte das Protokoll nicht mitentwickelt haben.
Validität
wird mit Gültigkeit übersetzt (inhaltliche Richtigkeit). Validität stellt sicher, dass man das misst, was
man messen will. Kein Koeffizient, sondern Verbesserungsvorschläge für Messinstrumente oder
Untersuchungsdesign.
Formen:
• Inhaltsvalidität
• Kriteriumsvalidität
• Konstruktvalidität
Interne Validität = Gültigkeit der Aussagen bezüglich der Testsituation. Die Ergebnisse einer
Untersuchung sind intern valide, wenn sie tatsächlich das messen, was sie messen sollen.
Externe Validität = Gültigkeit der Aussagen im größeren Kontext. Gültigkeit der Ergebnisse außerhalb
der Forschung (→ Generlisierbarkeit).
4
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
5
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Einfache Zufallsauswahl
Jede Einheit der Grundgesamtheit besitzt die selbe Wahrscheinlichkeit ausgewählt zu werden. Die
Auswahl eines Elements, beeinflusst die Wahrscheinlichkeit eines anderen Elements ausgewählt zu
werden nicht.
Zufallsgesteuerte Stichproben:
• Geschichtete Stichprobe: Die Grundgesamtheit wird in Gruppen (Schichten) eingeteilt, aus
denen werden dann Zufallsauswahlen getroffen
• Klumpenauswahl: Wenn auch Gruppenzusammenhänge untersuchtwerden sollen Es werden
nichteinzelne Untersuchungseinheiten zufällig ausgewählt, sondern Aggregate
• Mehrstufige Zufallsauswahlen: Es werden erst Primäreinheiten zufällig ausgewählt, dann
Sekundäreinheiten usw.
Bewusste Auswahlverfahren
Bei der bewussten Auswahl werden Merkmalsträger danach ausgewählt, wie ‚brauchbar‘ bzw. zentral
ihre Untersuchung für die Beantwortung der gewählten Fragestellung ist (z.B. typische oder extreme
Fälle).
Probleme der Zufallsstichprobe
• Grundgesamtheit unbekannt
• Elemente nicht erreichbar (-Online Umfragen -Telefonumfragen)
• Non-response bias
• Stichprobenausfälle: alle Fälle, bei denen ein Element der Stichprobe nicht untersucht werden
konnte.
Forschungsethik
• Ethik = Moralische Prinzipien, was richtig und falsch ist – Nicht absolut: unterschiedlich nach
Person, Zeit, Ort - Können miteinander konkurrieren
• Forschung = Kontrollierte, systematische Untersuchung, die zum Wissen bzw. zur
Theoriebeitragen soll
• Forschungsethik = Einbeziehung ethischer Prinzipien in die Forschungspraxis - In allen Stadien
der Forschung: von Einleitung der Forschung bis zur Publikation der Ergebnisse und darüber
hinaus
Prinzipien:
• Minimierung des physischen und psychischen Gefahrenrisikos
• Schutz von Anonymität und Vertraulichkeit (Die TeilnehmerInnen können nicht identifiziert
werden auch in Quanti-Forschung wichtig!)
• Respekt vor den Teilnehmenden
• Freiwillige Einwilligung nach Aufklärung und das Recht auf Widerruf
• Unabhängigkeit
• Gender Balance
Publikation
• Die ForscherInnen sollten die Ergebnisse und Interpretationen ihrer Forschung auf offene,
ehrliche, transparente und genaue Weise veröffentlichen.
• Die ForscherInnen sollten sich bemühen, die frühestmögliche Veröffentlichung der Ergebnisse
ihrer Forschung zu gewährleisten
• Autorschaft sollte nur auf einem kreativen und signifikanten Beitrag zur Forschung basieren.
6
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
7
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Nominale Definition = Umschreibung des Bedeutungsgehalts
Operationale Definition
• macht Codierungsprozess explizit
• Macht Kategorien auf Objektebene fassbar
• Gibt Regeln an, nach denen Objektmerkmale in Daten überführt werden
• Codierungen bilden Daten
• Indikatoren = empirische Äquivalente für nicht direkt wahrnehmbare Sachverhalte
= Indikatoren – oft in Form von Aufzählungen - zeigt Bedeutung einer Kategorie auf Objektseite an
Ankerbeispiele anführen (Reizwörter)
Kategorienbildung:
1. Extraktion bedeutungstragender Begriffe aus Hypothesen
2. Definition der Begriffe Achtung: unendlicher Regress – Begriff lässt sich nicht durch sich selbst
erklären
3. Extrahierte Dimensionen ins Kategoriensystem (Codebuch) überführen
4. Kategorientypus und Skalenniveau festlegen
Formale Kategorien
Formale Kategorien sind physisch manifeste Sachverhalte, die sich durch messen, zählen oder
Transkription erheben lassen und keine Inferenzen der CodiererInnen erfordern.
Formale Kategorien dienen:
• als Differenzierungskriterium (z.B. für den Vergleich zwischen eher rechten und eher linken
Zeitungen)
• als Schlüsselcode (für die Zuordnung der Elemente auf verschiedenen Analyseebenen)
• als Gewichtungsfaktor (z.B. Artikel nach Länge gewichten)
Inhaltliche Kategorien
Inhaltliche Kategorien können eher manifeste, sowie latente Sachverhalte sein, die sich durch messen,
zählen oder Transkription erheben lassen. Inhaltliche Kategorien sind die vom Erkenntnisinteresse
abhängigen Bedeutungsdimensionen, deren Klassifikation der Inferenz der CodiererInnen bedarf.
• Referentielle Einheiten: beziehen sich auf bestimmte Personen, Objekte, Orte oder Ereignisse
• Thematische Einheiten: halten auf abstrakterer Ebene die Zugehörigkeit zu übergreifenden
Diskursstrukturen (Themen) fest
• Propositionale Einheiten: treffen sachliche oder wertende Feststellungen über Personen,
Tatsachen oder Vorgänge (Meinungen, Argumente, Kommentare) → wertende Kategorien
Ausprägungen & Skalenniveaus
• dichotome Variablen: haben zwei Ausprägungen z.B. Ja/Nein
• nominalskalierte Variablen: verschiedene Ausprägungen z.B. Innenpolitik, Außenpolitik,
Sport, Wirtschaft
• ordinale Variablen: haben Abstufungen, aber Stufen Differenz zwischen Stufen ist unbekannt
z.B. sehr positiv, positiv, neutral, negativ, sehr negativ
• metrische / intervallskalierte Variablen: haben gleiche Abstände zwischen den einzelnen
Stufen z.B. Wortanzahl
• Quasi-metrische Variablen: haben fixe Start- und Endpunkte z.B. (0) sehr negativ, (10) sehr
positiv
8
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Auswahlphase
1. Vollerhebung
2. Zufallsstichprobe
Jedes Element der Grundgesamtheit hat dieselbe Chance, in die Stichprobe aufgenommen zu
werden (und diese Chance ist größer als null).
3. Bewusste Auswahl: Merkmalsträger werden danach ausgewählt, wie wichtig ihre
Untersuchung für die Beantwortung der Fragestellung ist.
• Typische Fälle: Merkmalsträger sind in Bezug auf bestimmte Merkmale besonders
charakteristisch für Grundgesamtheit
• Auswahl von Extremfällen: Bei Merkmalsträgern liegen die zu erforschenden
Merkmale in besondere Stärke vor (oft nach dem Schneeballverfahren).
• Auswahl nach Quotierung: Merkmalsträger werden so ausgewählt, dass ihre
Verteilung in der Stichprobe der in der Grundgesamtheit entspricht.
4. Fallstudie
Merkmalsträger werden ohne besondere Systematik nach ihrer Verfügbarkeit ausgewählt.
Erhebungsphase
Erhebungsphase I: Codierschulung
• Bei umfangreichen Auswahleinheiten verhindert große Zahl von CodiererInnen
Ermüdungsprozesse
• Mit der Zahl der CodiererInnen steigt der Schulungs- und Koordinationsaufwand (=Festkosten
der Analyse)
• Je mehr Personen codieren, desto wahrscheinlicher sind abweichende Codierungen
(Reliabilität!)
Schulung an vergleichbarem, aber nicht in der Analyse verwendeten Material!!!!!!!
9
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Erhebungsphase II: Qualitätskontrolle: Reliabilitätstest I
Zwei Gütekriterien für Inhaltsanalysen:
• Reliabilität= Zuverlässigkeit der Messung
• Validität = Gültigkeit der Messung
→ Bei standardisierten Inhaltsanalysen wird vor allem die Reliabilität geprüft
Erhebungsphase III: Drei Typen von Reliabilitätstest: (siehe Seite 3)
• INTERcoder Reliabilität: Konsistenz zwischen mehreren KodiererInnen
• INTRAcoder Reliabilität: Konsistenz derselben KodiererInnen über Zeit.
• ForscherInnen-CodiererInnen-Reliabilität: Wie gut stimmen die Verschlüsselungen der
CodiererInnen mit denen der ForscherInnen überein?
Erhebungsphase IV: Reliabilität: Übereinstimmungsmaß nach Holsti
➔ CR = CK* CÜ/(CA + CB + ... + CN)
Mittelwert auch für jeden einzelnen Codierenden interessant → Schwarze Schafe identifizieren
Beurteilung des Koeffizienten auf Basis des Schwierigkeitsgrades der jeweiligen Kategorie
• bei inhaltlichen Kategorien Werte ab .80
• bei formalen Kategorien nur Werte nahe 1.0.
Erhebungsphase V: Validitätsprüfung
Vier Typen von Validitätsprüfung:
• Analysevalidität (zwischen ForscherInnen und CodiererInnen)
• Inhaltsvalidität (gemeine Validität –messe ich was ich messen will?)
• Kriteriumsvalidität (über externe Quellen, kommen andere Messungen mit selber Methodik
zu demselben Resultat?)
• Inferenzvalidität (über externe Quellen mit anderer Methodik)
Erhebungsphase VI: Codierung I: Organisation Feldphase
• regelmäßige Treffen zwischen Codierenden und Forschenden, um Feinsteuerung des
Codierprozesses zu ermöglichen und einheitlich auf alle Konkretisierungen des Instruments zu
reagieren
• stichprobenartige Kontrolle der Codierung und Dateneingabe
• Veränderungen des Codebuchs umgehend an alle Codierenden kommunizieren
Erhebungsphase VII: Codierung II: Codebogen und Datenerhebung
Codierung auf Papier vs. direkte Eingabe:
• Papier = flexibler, höhere Datensicherheit, größere Transparenz und Nachvollziehbarkeit des
Codiervorgangs, bessere Abstimmung bei Codiertreffen, bei Archivmaterial besonders
praktisch
• direkte Eingabe = Zeit-und Kostenersparnis, keine fehleranfällige separate Dateneingabe, bei
digitalem Material besonders praktisch
Codebogen bzw. digitale Dateneingabemaske (z.B. in Excel oder SPSS)
• in der Reihenfolge des Codebuchs
• genügend Platz für Codierung von offenen Kategorien
• nachvollziehbare Kategorienbezeichnungen (nicht nur Nummern oder Kürzel)
• klare Trennung zwischen Analyseeinheiten und sonstigen Codebuchelementen
10
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
11
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Term-document matrix
Mithilfe der TDM können dann statistische Analysen durchgeführt werden (Faktoren/ Clusteranalyse,
etc.), weitere relevante Wörter selektiert werden.
Analysen - Scaling
• Bekannteste Vertreter „Wordscores“ (Laver et al., 2003) und „Wordfish“ (Slapin & Proksch,
2008).
• Es geht darum (politische) Akteure oder Diskurse im (politischen/gesellschaftlichen) Raum
einzuordnen.
• Texte werden nicht als Ganzes interpretiert, sondern als Sammlung von Worten
• Benötigt kein vorgefertigtes Wörterbuch und ist weitgehend unabhängig von der Subjektivität
der WissenschafterInnen
• Benötigt allerdings manchmal Referenztexte deren Position im Raum bekannt sind (à
Wordscores)
Wörterbuch Ansätze
Liste von Worten, die Konzepte höherer Ebenen beschreiben. Wörterbuch markiert die ursprünglichen
Worte mit zugeteilten Kategorien oder ersetzt sie durch allgemeinere Worte.
Bildung eines Wörterbuchs
• Ähnlich zur Entwicklung von Suchanfragen/Searchstrings
• Sicherstellen, dass das Forschungsinteresse klar definiert ist, über die Konzepte Bescheid
wissen, die gemessen werde sollen
• Beginnen mit dem Lesen relevanter Texte, Interviews, etc.
• Entwicklung von Listen mit Worten für Konzepte
• Pre-Tests mit ausgewählten Texten, idealerweise von unterschiedlichen Quellen
• Experten die Listen überprüfen lassen
• Die KWIC Listen deiner Wörter beachten (im Korpus)
• Abschließende Verfeinerungen
• Zufälliges Sample überprüfen
Topic Modeling (LDA)
• Werkzeug um thematische Struktur von Textsammlungen zu erfassen
• Zu Beginn à rein statistischer Ansatz (auch unabhängig von Sprache)
• Ein Dokument setzt sich aus mehreren „Topics“ jeweils unterschiedlicher Gewichtung
(Wichtigkeit) zusammen
• Ein Topic ist eine Wahrscheinlichkeitsverteilung über das gesamte Vokabular des Korpus. Die
Wahrscheinlichkeit, dass ein Wort zu einem Thema gehört, wird berechnet.
• Ein Wort kann mehreren Topics mit unterschiedlich hoher Wahrscheinlichkeit angehören.
• LDA benötigt allerdings „qualitative“ Nachbearbeitung
Supervised Machine Learning
• Im Vergleich zu den anderen Methoden ist hier menschlicher Input notwendig.
• Beispiel: Anhand von 1.000 manuell codierten Texten, werden 100.000 nicht codierte Texte
geschätzt.
Programmiersprachen
• Programmiersprache: Python = Viele Scripte frei verfügbar, sowohl text mining als auch text
analysis
• Programmiersprache: R = Ebenfalls große Community mit vielen OpenSource-Paketen
• Kurse und Online Tutorials
12
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Qualitätsbeurteilung
Recall
• Misst die Fähigkeit des Algorithmus, die relevanten Fälle in den analysierten Daten zu
identifizieren
• Recall ist der Anteil von relevanten abgerufenen Fällen an allen relevanten Fällen (oder der
Anzahl von korrekten Ergebnissen)
• Perfekter Recall durch Abrufung aller Fälle in Daten leicht zu erreichen.
• Nicht ausreichend, um die Leistung abzuschätzen.
• 100% recall enstpricht der Abwesenheit von Typ II Fehlern – keine falschen Negative
Hoher Recall: Algorithmus identifiziert die meisten relevanten Fälle.
Precision
• Misst den Prozentanteil der Fälle, die korrekt klassifiziert wurden.
• Präzision ist der Anteil der abgerufenen Fälle, die relevant sind (oder die Anzahl der korrekten
Ergebnisse dividiert durch die Anzahl von allen abgerufenen Ergebnissen).
• 100% Präzision entspricht der Abwesenheit von Typ I Fehlern – keine falschen Positiven.
Hohe Präzision: Algorithmus identifiziert signifikant mehr relevante Fälle als irrelevante Fälle.
• Folgenlosigkeit: Antworten de/r Befragten dürfen später nicht auf sie/ihn zurückführbar sein
• Reaktivität: Die Befragung ist ein reaktives Verfahren, weil sich Menschen anders verhalten
als in einer alltäglichen Situation.
Umfrage-Typen
• Querschnittserhebungen
• Längsschnittstudien → Panel-Umfragen → Rollende Querschnitte
• Spezialisierte / fokussierte Umfragen
• Omnibus-Umfragen
Umfrage-Modi
14
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Testfragen
• Sach- oder Faktenfragen: Fragen nach einfachen Sachverhalten wie z.B. Handy-Besitz /
Soziodemographie
• Wissensfragen: Fragen nach Wissen / Informationsstand
• Einschätzungsfragen: Einschätzungen bestimmter Sachverhalte (z.B. des Meinungsklimas)
• Interessensfragen: Welchen Teil der Tageszeitung lesen sie zuerst?
• Meinungs-, Einstellungsfragen: Wie beurteilen sie Politiker A in Bezug auf folgende
Eigenschaften → Problem der Non-Opinions!
• Stimmungsfragen: Momentane Gefühlsangabe (z.B. Emotionen) gegenüber einem
bestimmten Objekt!
• Tatsächliches soziales / politisches Verhalten oder Verhaltensabsicht: → Problem mit
sozialer Erwünschtheit!
Funktionsfragen
• Eisbrecherfrage: Am Anfang des Fragebogens
• Überleitungsfragen: Funktion → Überleitung zwischen zwei thematisch getrennten
Frageblöcken
• Pufferfragen: Funktion → Abgrenzung zwischen zwei thematischen Blöcken um abzulenken
• Kontrollfragen: Qualität der Antworten einschätzen
• Filterfrage: Funktion → Manche Befragte sollen bestimmte Fragen nicht bekommen
15
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Allgemeine Effekte
Looking-good-Tendenz → Je neutraler der Interviewer als Person bleibt, desto weniger wird der
Befragte Vermutungen über seinen Geschmack und Vorlieben machen.
InterviewerInneneffekte
• InterviewerIn hat einen großen Effekt auf die Ergebnisse der Befragung z.B. Das Merkmal
Mundart wird bei InterviewerInnen systematisch variiert: Ergebnisse beweisen, dass der
Dialekt tatsächlich einen InterviewerIneffekt zur Folge hat
• Das Geschlecht der InterviewerInnen kann starke Verzerrungen im Antwortverhalten bei
geschlechtsrelevanten Inhalten auslösen z.B. Frage nach dem Konsum von pornographischen
Inhalten
Sponsorship-Effekt → Sobald die/der Befragte bemerkt welcher Auftraggeber hinter der Befragung
steckt wird sie/er anders antworten
Anwesenheits-und Zustimmungseffekt → Anwesenheit Dritter beim Interview wie zum Beispiel
EhepartnerIn
Konsistenz-und Kontrasteffekte → Befragte wollen in ihren Antworten „stimmig“ bleiben
Kontexteffekte
Halo-Effekte/Ausstrahlungseffekte → Eine Frage nach einem politischen Skandal des Politikers X
könnte die Antworten auf eine spätere Frage nach politischem Vertrauen im Allgemeinen beeinflussen
(Inklusionseffekt), oder könnte zu höheren Vertrauensnoten der Politikerin Y führen (Kontrasteffekt).
Primacy-/Recency-Effekte → die Tendenz einer selektiven Erinnerung von Vorgaben am Anfang bzw.
am Ende einer Antwortliste.
Non-Opinions → häufig äußern sich Befragte in Umfragen auch zu Bereichen, über die sie sich vorher
noch nie Gedanken gemacht, nur um zu zeigen, dass sie eine Meinung dazu haben. Beispiel: Sind Sie
für oder gegen die Abschaffung von Artikel 148 des GG? → Den Artikel gibt es nicht aber viele sagen,
dass sie dafür/dagegen sind.
Effekte sozialer Erwünschtheit → Befragte werden ungern eine sozial nicht akzeptierte Meinung
äußern, mit der sie sich gegenüber der (vermuteten!) Mehrheitsmeinung isolieren.
Längeneffekte
In nahezu allen europäischen Ländern gibt es Aufnahmeprüfungen und Zugangsbeschränkungen an
den Universitäten. Daher kommt es jedes Jahr in Österreich zu einem Ansturm ausländischer
Studenten und Studentinnen, die in ihrer Heimat nicht zum Studium zugelassen wurden. Halten Sie es
unter diesen Umständen für sinnvoll, bestimmte Zugangsbeschränkungen bzw. Aufnahmeprüfungen
einzuführen, oder sind Sie gegen solche Beschränkungen?
Optimizing vs. Satisficing
Optimizing: das Bestreben, die genaueste, die optimale Antwort zu geben, basiert auf einer hohen
Motivation, eine gute Leistung zu erbringen - Wunsch nach Selbstdarstellung - intellektuelle
Herausforderung - Gefühle von Altruismus der angebliche Nutzen einer Umfrage etc.
Effektive Fragen formulieren
• Möglichst einfache/alltägliche Sprache verwenden
• Möglichst unmissverständliche Sprache verwenden
• Möglichst immer nur eine Frage nach der anderen stellen.
• Möglichst keine Suggestivfragen
• Möglichst keine Vorannahmen treffen
16
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Mediennutzungsmessungen
Um die Medienselektion der Befragten als Differenzierungskriterium zu verwenden, braucht man eine
Messung der Mediennutzung. Mediennutzung kann unterschiedlich gemessen werden.
Bias in Self-Reported News Exposure
Viele Studien über Medieneffekte nutzen selbst berichtete Mediennutzung als unabhängige Variable
Problem der Validität; Es ist möglich, dass Medienwirkungen nicht aufgrund der Unterschiede in der
Mediennutzung auftreten, aber wegen Unterschiede in der Genauigkeit der berichteten Nutzung.
Rücklaufquote – Typen von Rücklaufquoten
• Response rates: Antwortquoten - Die Anzahl der vollständigen Befragungen von
Berichtseinheiten dividiert durch die Anzahl der geeigneten Berichtseinheiten in der
Stichprobe
• Cooperation rates: Kooperationsraten - Der Anteil aller befragten Fälle an allen in Frage
kommenden Einheiten, die jemals kontaktiert wurden.
• Refusal rates: Verweigerungsquoten - Der Anteil aller Fälle, in denen eine Wohneinheit oder
der Befragte sich weigert, interviewt zu werden oder die Befragung abbricht, an allen
potentiell geeigneten Fällen.
• Contact rates: Kontaktrate -Der Anteil aller Fälle, in denen ein Mitglied der zuständigen
Wohneinheit erreicht wurde.
Umfragen veröffentlichen
ESOMAR/WAPOR
Unterschied Meinungsumfragen / Marktforschung: Ziel von Meinungsumfragen ist die
Veröffentlichung.
• Bei der Veröffentlichung von Ergebnissen (von Print, Fernsehen, Internet, andere Medien),
müssen ForscherInnen Informationen über die Durchführung der Umfrage verfügbar machen.
• Umfragen werden immer komplexer und vielfältiger → die ForscherInnen müssen umfassende
Informationen über die methodische Herangehensweise geben.
Die folgenden Informationen müssen im Umfragebericht eingeschlossen oder in einer anderen
schriftlichen Form zur Verfügung gestellt werden:
• Name der Organisation, die die Umfrage durchgeführt hat & Organisation/Person, die das
Ganze finanziert hat
• Offenlegen, ob die Stichprobe alle Erwachsenen/nur die geeigneten/die wahrscheinlichen
Wähler einschließt + geographische Reichweite und ob bestimmte Gruppen ausgeschlossen
wurden
• Sampling Methode
17
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Grundbegriffe
• ProbandInnen: Versuchspersonen, TeilnehmerInnen am Experiment
• Treatment/Stimulus: Manipulation der unabhängige(n) Variable(n)
a) Ein Werbespot wird im Werbeblock einmal gezeigt (Version A), bei Version B zweimal
und bei Version C dreimal (Manipulation der Häufigkeit auf drei Stufen)
b) Treatment: Werbespot, den die ProbandInnen sehen
• Experimenteller Faktor: Manipulierte unabhängige Variable
• Randomisierung: Zufällige Zuweisung der ProbandInnen an Kontroll-/Experimentalgruppe
• Experimentalbedingungen/-gruppen ergeben sich aus den Stufen, auf denen die Faktoren
manipuliert werden
• Experimental- und Kontrollgruppe: → Hypothese: RezipientInnen eines gewalttätigen Films
sind danach aggressiver als RezipientInnen eines gewaltlosen Films
• Mehrere Experimentalgruppen:
a) Hypothese: Je häufiger RezipientInnen einen Werbespot sehen, desto besser erinnern
sie sich an den Werbespot
b) Manipulation auf drei Stufen (einmal, zweimal, dreimal) also 3 Experimentalgruppen
18
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Kausalnachweis im Experiment
Manipulation, Kontrolle, Randomisieren, Matchen und Konfundierung
• Experimental- und Kontrollgruppen dürfen sich nur im experimentell induzierten Stimulus
unterscheiden
• Natürlichen Bedingungen bewusst so manipuliert, dass nur noch der Stimulus als mögliche
„Ursache“ übrigbleibt
• ProbandInnen werden so auf die Gruppen verteilt (Randomisieren), dass sich die
Zusammensetzung der Gruppen nur im Stimulus unterscheidet
• „Mit dem ‚Trick‘ der Randomisierung wird der Einfluss sämtlicher, auch unbekannter
Drittvariablen neutralisiert“
• Durch die zufällige Verteilung der ProbandInnen auf die Experimentalbedingungen wird der
Einfluss von Störgrößen nicht beseitigt, sondern nur neutralisiert.
• ProbandInnen werden anhand ausgewählter, zentraler Merkmale so auf die Gruppen verteilt,
dass diese relevanten Merkmale in allen Gruppen gleich verteilt sind
• ProbandInnen werden so auf die Gruppen verteilt, dass stark und schwach aggressive /
ProbandInnen in allen Gruppen gleich häufig vorkommen („Zwillinge“)
• Nachteile von Matchen: Nur wenige, ausgewählte Merkmale lassen sich vorab messen. Bei
vielen anderen Merkmalen können sich die Gruppen weiterhin unterscheiden - Vorher-
Messung kann die Ergebnisse verzerren (priming / Halo-Effekt etc.) - Vergleichsweise hoher
Aufwand
• Störvariablen (Z) sind im Treatment enthalten und wirken gemeinsam („konfundieren“) mit
dem experimentellen Faktor (X) auf die abhängige Variable (Y)
• Gefahr der Konfundierung steigt mit Komplexität des Stimulus (z. B. TV-Inhalt)
• Beispiel für Konfundierung: Experimentalgruppe sieht Gewaltfilm, Kontrollgruppedagegen
Comedy-Show. Gruppen unterscheiden sich nicht nur im Stimulus (Gewaltgrad des TV-Inhalts),
sondern erhalten Sendungen ganz unterschiedlicher TV-Genres
Exkurs – Effect of product placement
19
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
20
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
21
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Quasi-Experiment
Keine randomisierte Zuteilung von ProbandInnen zu den Untersuchungsgruppen (möglich) (...auch
keine self-selection!)
ProbandInnen sind aufgrund von natürlichen, nicht durch die ForscherInnen kontrollierbaren,
Ereignissen in Experimentalgruppe und Kontrollgruppe eingeteilt werden. ForscherInnen lediglich als
BeobachterInnen.
Beispiel: Einfaktorielles Design
• Abhängige Variable: Zustimmung zu fiktivem
Bundesheereinsatz
• Einfluss der Mediendarstellung auf die Zustimmung
• Einfaktorielles Design – Faktor „Inhaltliche Rahmung
des Bundesheereinsatzes“ (Framing)
Beispiel: Zweifaktorielles Design
Abhängige Variable: Zustimmung zu fiktivem Bundesheereinsatz
Einfluss der Mediendarstellung auf die Zustimmung
Zweifaktorielles Design (2x2 Design)
→ Faktor A „Inhaltliche Rahmung
des Bundesheereinsatzes“ (Framing)
→ Faktor B „Nachrichtenbild“
22
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Grundsätze
• Gütekriterien: Validität & Reliabilität / Systematik / Intersubjektivität
• Handeln, Verhalten und Reaktionen: → Sichtbar und direkt beobachtbar → Nicht direkt
sichtbar und unbewusste Reaktionen (z.B. Puls / Hirnströme) → Sprechhandlungen (die nicht
auf Selbstauskünften basieren!)
• Dokumentation: Mediale Aufzeichnung ist OK, aber keine medialisierte/mediatisierte
Aufzeichnung
Anwendungsgebiete
• Journalismusforschung : z.B. Beobachtung von Redaktionsabläufen
• Abgewandte Medien(nutzungs)forschung: z.B. Telemetrische Messung der „Gesellschaft für
Konsumforschung (GfK)“
• Universitäre Mediennutzungs- & Wahlforschung: z.B. Logfile-Analysen zur Analyse von
Selektionsverhalten
Varianten der Beobachtung
• Datenerhebung durch ForscherIn (intern):
a. ForscherIn kennt Beobachtungsgegenstand gut
b. ForscherIn erfasst möglicherweise zu genau oder dokumentiert nicht jede Entscheidung
(Subjekt-Objekt-Trennung)
• Datenerhebung durch Beobachter (extern):
a. Bei großen Fallzahlen unumgänglich
b. Bei bestimmten Beobachtungsobjekten sind „beauftragte“ BeobachterInnen ratsam
(z.B. Beobachtung von Kleinkindern durch entsprechende BeobachterInnen)
c. Schulung
23
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Strukturiertes Protokollieren:
• Wurden bereits von anderen ForscherInnen gesammelt, vlt. mit anderen Absichten
• Sollten klare Verbindung zur Forschungsfrage haben
• Sind billiger, einfacher und schneller zu bekommen als Primärdaten
• Klare Unterscheidung zwischen ForscherInnen, die die Daten erhoben haben und denen die
sie auswerten (à Researcher-Bias)
• „Demokratisierung der Forschung“
• Keine Übernutzung von Forschungsteilnehmern
• In die Vergangenheit schauen
• Sind die Daten vollständig und erscheinen für meinen Forschungszweck als gültig und
zuverlässig?
• Sind die Instrumente und Methoden zu Datenerhebung transparent und verfügbar
(Stichwort: Codebuch/Fragebogen & Dokumentation?
• Wie werden die Daten geliefert?
Wann Primärdaten?
24
QUANTI SS 2019 Arkadiusz P.
Boomgaarden
Vorteile des Archivierens
• Hautleitfähigkeit
• Herzschlag
• fMRI
Big Data
Datensätze die
• zu groß
• zu komplex
• zu schnelllebig
• oder zu unstrukturiert sind
25