Sie sind auf Seite 1von 16

1.Erklären Sie kurz den Unterschied zwischen Induktion und Deduktion!

Induktion bedeutet der Schluss von Einzelbeobachtungen auf eine allgemeine Theorie. Man
geht theorielos auf die Welt zu.
Deduktion bedeutet der Schluss vom Allgemeinen auf das Besondere. Man leitet von
einem Axiom (Annahme einer Theorie) Einzelbeobachtungen ab.
Man könnte sagen: Es wird mithilfe von empirischen Daten induktiv eine Theorie festgestellt aus
dieser Theorie wiederum können deduktiv Aussagen über Einzelbeobachtungen getätigt werden.

2. Erklären Sie kurz, was eine falsifizierbare Hypothese über einen Zusammenhang ist!
eine falsifizierbare Hypothese über einen Zusammenhang weist durch eine Widerlegung nach,
dass eine Theorie, falsch ist. Theorien gelten höchstens als bewährt, können aber
widerlegt werden.

3. Nennen und beschreiben Sie kurz die Vorteile der experimentellen Forschung im Vergleich zur beobachtenden
Forschung!
Experimente sind Verfahren zur Entdeckung kausaler Zusammenhänge (Ursachen-WirkungsBeziehungen).
ForscherInnen schaffen sich Ihre eigene Welt und verfügen über die Kontrolle. Sie finden isoliert statt und sind
externen Einflüssen nicht ausgesetzt. Sie sind transparent. Im Gegensatz zur beobachtenden Forschung deren Ziel
das Erfassen von Ablauf und Bedeutung einzelner Handlungen und dessen Zusammenhänge es ist
(Handlungszusammenhänge). Dabei ist es schwierig alle relevanten Ereignisse in einer sich ständig verändernden
Situation wahrzunehmen.

Wieso eignet sich die experimentelle Forschung besonders, um kausale Zusammenhänge festzustellen? (5 Punkte)
Damit entdeckt man die Ursache-Wirkungs-Beziehungen. Die Bedingungen werden bei der experimentellen
Forschung selbst hergestellt und unterliegen somit der Kontrolle und Einflussnahme des Forschers. Durch Isolation
können alle gleichzeitig wirkende Ursachen abgeschaltet werden und somit hat der/die ForscherIn die Kontrolle über
die Bestimmung des Ausmaßes der Ursache (bewusste Manipulation).

Wieso kann man mit experimenteller Forschung Kausalitäten klarer feststellen? (5 Punkte)
Da hier die Bedingungen der Untersuchung selbst hergestellt werden und somit unterliegen sie der Kontrolle und
Einflussnahme des Forschers. Durch die Isolation werden alle gleichzeitig wirkende Ursachenfaktoren(die die
Ergebnisse beeinflussen könnten, zb.: Drittvariablen) ausgeschaltet. Außerdem hat der/die ForscherIn die Kontrolle
über die Bestimmung des Ausmaßes der Ursache (bewusste Maipulation).

4. Was sind die drei wichtigsten Erhebungsmethoden bei Umfragen? Nennen Sie kurz jeweils einen
Vor- und einen Nachteil jeder Methode!
Schriftlich (e-mail, mail, online)
Vorteil: Günstig in der Ausführung Nachteil: meist keine gute Stichprobe, Online Befragte eher jüngere Menschen
Telefonisch
Vorteil: geringe Kosten, Erreichbarkeit Nachteil: keine gute Stichprobe
Mündlich-persönlich, face to face
Vorteil: höhere Stichprobengüte Nachteil: sehr teuer

5. Bei der Messung des Bruttoinlandsprodukts in mehreren afrikanischen Ländern gab es letztes Jahrgroße
Änderungen: das BIP wurde nachträglich nach oben korrigiert, um die informelle Wirtschaft zu berücksichtigen. Ist
die Messung jetzt valider oder reliabler? Mit Begründung
Das Ergebnis valider geworden, weil der Inhalt angepasst wurde, es wurde also das gemessen, was
gemessen werden sollte.

6. Der SPIEGEL schrieb am 19.1.2015 „Schon heute besitzen die 80 Superreichen mehr als die
ärmste Hälfte der Weltbevölkerung.“ Welches Lagemaß war notwendig um diese Statistik zu
berechnen – der Median, der Modus oder das arithmetische Mittel? Begründen Sie Ihre Antwort“
Es wurde der Median berechnet. Alle Werte aneinandergereiht und der Größe nach gereiht. Der
Median teilt in zwei Hälften. Sicherer gegen Ausreißer. Zentraler Wert wäre mir arithmetischen
Mittel nicht eindeutig zu definieren gewesen, da z.B. sehr reiche den Mittelwert verfälschen würden.
7. Erklären Sie den Unterschied zwischen Korrelation und Kausalität!
Von Korrelation spricht man, wenn sich zwei Datensätze ähnlich verhalten.
Von Kausalität spricht man, wenn eine Ursache eine Wirkung nach sich zieht.

8. a) zwei Vor- und zwei Nachteile von Face-to-Face-Umfragen im Vergleich zu Telefon-Umfragen!


b) Was ist der Vorteil von probabilistischen Verfahren der Stichprobenziehung im Vergleich zu
nicht-probabilistischen
a) Vorteile: hohe Stichprobengüte, visuelle Unterstützung
Nachteile: Kosten, befragte Person Antwortet aufgrund der fehlenden Anonymität nicht ehrlich
b) bei nicht–probabilistischen Verfahren sind durch Statistik keine Rückschlüsse auf die
Grundgesamtheit möglich.

9. Beschreiben Sie die zwei Arten von Fehlern bei Hypothesentests!


Es gibt den Fehler der 1. Art und den Fehler der 2. Art. Der Fehler der 1. Art bedeutet, dass das H0
tatsächlich zutrifft. H0 wird zurückgewiesen obwohl sie wahr ist (false negative).
Der Fehler der 2. Art sagt, dass HO nicht abgelehnt wird, obwohl sie eigentlich falsch wäre (false
positive).
10. Beschreiben Sie die Eigenschaften einer nützlichen politikwissenschaftlichen Theorie anhand des
Beispiels von Rational Choice!
Sie ist kausal (klarer Mechanismus x löst y aus), allgemein (ohne Eigennamen), einfach (Ockhams Rasiermesser),
Spezifisch und präzise. Rational Choice als Theorie sehr gut und klassisch weil sie all diesen
Anforderungen entspricht.
Individuen betrachten Kosten und Nutzen verschiedener Handlungen.
Individuen entscheiden sich für die Handlung mit dem größten Nutzen
Klare Erwartungen ableitbar.

11. Eine Querschnittsstudie zeigt, dass Studierende, die ein oder mehrere Semester im Ausland verbringen,
bessere Jobs haben. Kann man daraus schließen, dass die beruflichen Chancen sich dadurch verbessern, dass man
ein Auslandssemester gemacht hat? Wieso oder wieso nicht?
Es gibt zwar eine Korrelation (Studierende im Ausland bessere Jobchancen) es geht jedoch nicht
eindeutig aus der Studie hervor da sich die Variablen bedingen, daher keine Kausalität.

12. Ist die Astrologie eine Wissenschaft? Begründen Sie Ihre Antwort!
Nein, Astrologie ist keine Wissenschaft, weil Sie nicht Empirie folgt. Keine Kausalität, kein
überdenken der Theorien. Hingegen gibt es in der Wissenschaft Test von Hypothesen, sowie einen
Korpus aus Theorien und klare Vorhersagen.

13. Nennen Sie drei Antworttendenzen von Befragten, die Umfrageforschern Probleme bereiten! Definieren
Sie jede Antworttendenz!
Es wird nicht die beste Antwort gegeben, sondern jene, die gut genug ist.
Non-attitudes: wenn man keine eindeutige Meinung hat. Entweder weiß nicht oder irgendeine Antwort.
Verzerrung (Biases): Tendenz allem zuzustimmen, sozial erwünschtes nicht angeben (z.B. Antisemitismus)
Gedächtnisprobleme: Kann mich nicht erinnern, was ich gewählt habe.

14. Aus welchen drei Bestandteilen bestehen Stichprobenfehler? Definieren Sie jeden Bestandteil!
Statistischer Zufallsfehler sampling error Stichprobe enthält nicht den wahren Wert
Nichterfassungsfehler non coverage error sample repräsentiert nicht die Population, die
gemessen werden soll (Datei/Liste veraltet z.B. Telefonbuch)
Messfehler: Falsche Frage werden gestellt, Falsche Erwartungen und dadurch falsche Annahmen
Ausfallsfehler non response error

15. Beschreiben Sie kurz, anhand welcher drei generellen Kriterien man die Qualität der Operationalisierung
eines Konzepts evaluieren kann! (4 Punkte)
Objektivität Wie ist das Konzept beschaffen? Skalenniveaus
Reliabilität Wie misst man die Indikatoren (Validität von Reliabilität abhängig aber nicht umgekehrt)
Validität - >Passen die Indikatoren zum Konzept?
16. Wieso sind Zufallsstichproben für die Umfrageforschung so wichtig? (5 Punkte)
Da nur diese auf die Population verallgemeinert werden können.

17. Definieren Sie Validität und Reliabilität als Eigenschaften von Messungen! (6 Punkte)
Validität und Reliabilität sind Güterkriterien von Messungen. Unter Reliabilität wird die Zuverlässigkeit einer
Messung verstanden (Relizierbarkeit!). Hier geht es primör um die Messinstrumente und deren Zuverlässigkeit.
Reliabilitätsprüfungen sind zB.: Paralleltestverfahren, Test-Retest-Verfahren, oder Interne Konsistenz. Unter Validität
versteht man die Gültigkeit einer Messung. Hier geht es darum, ob tatsächlich das gemessen wurde, was gemessen
werden sollte. (Inhaltsvalidität, Konstruktvalidität). Validität hängt von Reliabilität ab, aber nicht umgekehrt. Eine
unzuverlässige Messung kann nicht valide sein und umgekehrt muss eine zuverlässige Messung nicht unbedingt
valide sein.

19. Nennen Sie die allgemeinen Schritte eines Hypothesentests, der die statistische Signifikanz eines
Zusammenhangs ermitteln soll! Was bedeutet dabei statistische Signifikanz? (10 Punkte)
Erstens: Formulierung der Hypothese: Nullhypothesen H0 und Alternativhypothesen HA
Zweitens: Wahl eines geeigneten statistischen Tests
Drittens: Berechnung der Teststatistik aus den Daten
Viertens: Berechnung des p-values bzw. Vergleich mit dem Annahme- und Ablehnungsbereich
Fünftens: Entscheidung für eine der Hypothesen und Interpretation Statistische Signifikanz sagt aus, dass die
Wahrscheinlichkeit, dass ein Verhältnis zwischen zwei Variablen besteht, sehr hoch ist.

20. Was macht eine wissenschaftlich gute Messung eines Konzepts aus? (8 Punkte)
Worauf müssen ForscherInnen achten, wenn sie ein Konzept messen? Definieren Sie die Fachbegriffe, die Sie in
Ihrer Antwort benutzen! (10 Punkte)
Konzept messen: Ausgangspunkt einer Untersuchung sind Theorien und Hypothesen, die es zunächst präzise zu
definieren bzw. zu klären gilt, welche Dimension und Subdimesionen die Begriffe beinhalten. (Was ist das? Welche
Dimensionen?) Danach muss der Begriff operationalisiert werden (messbar gemacht werden), dies beinhaltet alle
Foschungsvorgänge die notwendig sind, um festzustellen ob und wie der Sachverhalt in der Realität vorkommt. Beim
Messen werden Zufallsvariablen nach bestimmten Regeln in reale Zahlen übersetzt, sodann jedem empirischen
Relatic ein numerisches Relativ gegenübersteht. Kurz: Konzept – Dimension – Subdimension – Indikatoren –
Fragestellung/Instrumente.

21. Als Teil eines Forschungsprojekts codieren wir Printwerbung von Parteien. In einem ersten Testdurchlauf
haben 5 Codierer die Tonalität einer Anzeige bewertet, und zwar auf einer Skala von -5 bis +5, wobei negative
Zahlen negative Tonalität und positive Zahlen positive Tonalität bedeuten. Die Ergebnisse waren: -1, -4, 1, 2, 0.
Nach einer Umformulierung und Präzisierung des Codebuchs wurden 5 neue Codierer gebeten, die Anzeige mit
dem neuen Codebuch zu bewerten. Die Ergebnisse waren: -1, -2, 0, -1, -2. Ist die Messung nun reliabler oder
valider geworden? Begründen Sie Ihre Antwort! (5 Punkte)
Das Ergebnis valider geworden, weil der Inhalt angepasst wurde, es wurde also das gemessen, was
gemessen werden sollte.

22. Wie ist die Standardabweichung einer Variable zu interpretieren? Für welche Skalenniveaus darf man die
Standardabweichung berechnen?
die Standardabweichung wird verwendet, um die Streubreite der Daten um den Mittelwert zu ermitteln. Ein höherer
Wert der Standardabweichung verweist auf eine größere Streubreite der Daten. Eine Faustregel für die
Normalverteilung besagt, dass etwa 68 % der Werte innerhalb einer Standardabweichung vom Mittelwert, 95 % der
Werte innerhalb zwei Standardabweichungen und 99,7 % der Werte innerhalb drei Standardabweichungen liegen.
Sie ist für Intervall und Verhältnis Skalen zu berechnen.

In einer Umfrage wird folgende Frage gestellt: „Welche Partei hat im letzten Wahlkampf am meisten zum Thema
Zuwanderung gesagt?“ Die Antwortkategorien sind: SPÖ, ÖVP, FPÖ, Grüne, Team Stronach, Neos und eine andere
Partei.
a. Welches Skalenniveau hat diese Variable? Begründen Sie Ihre Antwort! (5 Punkte)
Es handelt sich um eine nominalskalierte Variable. Die Unterscheidung ist nur hinsichtlich Gleichheit oder
Ungleichheit der Merkmale. Welche Zahlen welcher Ausprägung zugeordnet werden ist irrelevant.
b. Dürfen Sie aus diesen Antworten den Median berechnen? Begründen Sie Ihre Antwort! (5 Punkte)
Nein in diesem Fall wäre es sinnvoller den Modalwert zu berechnen, da dieser jenen Messwert angibt, der in
einer Verteilung am häufigsten vorkommt.
c. Für welche Skalenniveaus macht es Sinn, das arithmetische Mittel zu berechnen? Begründen Sie Ihre
Antwort! (5 Punkte)
Das arithmetische Mittel sollte von Intervallskala und Ratio-/Verhältnisskala berechnet werden, da diese
metrische Skalen sind. Das arithmetische Mittel ist der Wert, den alle Merkmalsträger im Durchschnitt
aufweisen.

In einer Umfrage lautet eine Frage wie folgt: „wie sehr stimmen Sie dieser Aussage zu: Österreich
sollte keine Asylwerber mehr aufnehmen. Sehr, eher schon, eher weniger, gar nicht.“
a. Welches Skalenniveau hat diese Variable? Begründen Sie Ihre Antwort!
b. der Median der Antworten ist „eher schon“. Erklären Sie, wie dieser Wert ermittelt wurde!
c. Für welche Skalenniveaus macht es Sinn, das arithmetische Mittel zu berechnen?
a. es handelt sich um eine ordinalskalierte Variable da es eine Rangordnung mit Abständen gibt,
allerdings sind die Abstände nicht genau definiert.
b. es wurden die Werte der Größe nach geordnet. Der Median bildet die Mitte zwischen den größten
und den kleinsten Werten. (mittlerer Wert der Verteilung)
c. für Skalenniveaus, bei denen es einen klaren nummerischen Wert gibt, z.B. intervall- bzw.
verhältnisskalierten Variablen.

In einer Umfrage werden Befragte gebeten, Ihr monatliches Netto-Einkommen anzugeben.


a. Welches Skalenniveau hat diese Variable? Begründen Sie Ihre Antwort!
b. Der Median der Antworten ist 1.800 Euro, das arithmetische Mittel 2.382 Euro. Erklären Sie, wie
die beiden Werte berechnet wurden!
c. Was schließen Sie daraus, dass das arithmetische Mittel größer ist als der Median?
d. Für welche Skalenniveaus macht es Sinn den Median zu berechnen? Begründen Sie Ihre Antwort!

a) Ordinalskala, kann man in einen Rang ordnen ohne gleiche Abstände


b) Das Arithmetische Mittel wurde berechnet indem alle Einkommen zusammengezählt und
durch die Anzahl der Befragten dividiert wurde. Der Median wurde berechnet indem alle
Werte nach Höhe des Einkommens gereiht wurden. Der Median liegt in der Mitte der
Verteilungen.
c) Das arithmetische Mittel ist Anfällig für Ausreiser, der Median hingegen nicht. Es hat
vermutlich eine Person gegeben die etwas mehr verdient hat.
d) z.B. bei ordinalskalierten. Bei Noten z.B. genügend, nicht genügend, wenn ich keine Ränge
mit definierten Abständen habe. Median geht aber auch bei Nominal- oder Verhältnisskala.
Arithmetisches Mittel hier aber genauer.

In einer Umfrage lautet eine Frage wie folgt: „wie sehr stimmen Sie dieser Aussage zu: Österreich
sollte keine Asylwerber mehr aufnehmen. Sehr, eher schon, eher weniger, gar nicht.“
a. Welches Skalenniveau hat diese Variable? Begründen Sie Ihre Antwort!
b. der Median der Antworten ist „eher schon“. Erklären Sie, wie dieser Wert ermittelt wurde!
c. Für welche Skalenniveaus macht es Sinn, das arithmetische Mittel zu berechnen?
a. es handelt sich um eine ordinalskalierte Variable da es eine Rangordnung mit Abständen gibt,
allerdings sind die Abstände nicht genau definiert.
b. es wurden die Werte der Größe nach geordnet. Der Median bildet die Mitte zwischen den größten
und den kleinsten Werten. (mittlerer Wert der Verteilung)
c. für Skalenniveaus, bei denen es einen klaren nummerischen Wert gibt, z.B. intervall- bzw.
verhältnisskalierten Variablen.

In einer Umfrage wurde folgende Frage gestellt: „Wie oft lesen Sie die Kronenzeitung?“ die
Antwortkategorien sind: oft, gelegentlich, selten, nie.
a. Welches Skalenniveau hat diese Variable? Begründen Sie Ihre Antwort!
b. Dürfen Sie aus diesen Antworten das arithmetische Mittel berechnen? Begründen Sie Ihre Antwort!
c. Nennen Sie zwei andere Skalenniveaus, beschreiben Sie diese und nennen Sie kurz jeweils ein Beispiel!
a. Es handelt sich um eine ordinalskalierte Variable, da wir die Häufigkeiten mit einer Rangordnung
unterscheiden können A<B<C
b. Nein, wir können das arithmetische Mittel nicht berechnen, da es keine klare Rangordnung
zwischen oft, gelegentlich, selten etc. gibt.
c. Intervallskala ordnet nach Rangordnung mit gleichen Abständen z.B. Temperatur. A-B, B+C
Verhältnisskala ordnet nach Rangordnung mit gleichen Abständen bei einem „echten“ Nullpunkt z.B.
Körpergröße, Alter. A/B
Nominalskala ordnet ohne Rangordnung und ohne Abstände z.B. Geschlecht, Blutgruppe. A=B

Erklären Sie anhand dieser Formel die Berechnung der Standardabweichung!


Die Standardabweichung ermittelt wie stark die Streuung von
1 n
Werten um einen Mittelwert ist
bzw. wie groß die Abweichung bei mehrmaliger Durchführung eines
  
n i 1
( xi   ) 2
Stichprobentests ist. n
1
1. Zuerst den Durchschnitt berechnen (X1+x2+x3/n)
2. Die Varianz berechnen (die mittlere quadratische Abweichung der
s  
n  1 i 1
( xi  x ) 2
Ergebnisse um ihren Mittelwert)
3. Die Standardabweichnung berechnen (Ergebnis ist stets im positiven Bereich) Dazu ziehen wir aus der Varianz die
(quadratische) Wurzel.
Zum Schluss können wir eine starke oder geringe Schwankung feststellen.

Nennen und beschreiben Sie drei kognitionspsychologische Gründe, wieso Antworten in Umfragen oft
problematisch sind! (10 Punkte) Nach Kognitionspsychologie kommen Antworten, wie folgt zustande: Frage
verstehen – Information abrufen – Entscheidung für eine Antwort – Zuordnung auf eine Antwortoption. Antworten
können daher problematisch sein, wenn zb.: die Frage nicht verstanden wurde, oder kein Wissen über das
fragegestellte Thema hat, oder sich nicht entscheiden kann welche Antwort man wählen würde.

In einem Forschungsprojekt testen wir, ob es in Österreich einen Zusammenhang zwischen Antisemitismus und
Wahlverhalten gibt. Wir kommen zu dem Schluss, dass unsere Nullhypothese abgelehnt werden soll. In Wirklichkeit
trifft sie aber zu. Erklären Sie, wieso unser Forschungsergebnis problematisch ist! (5 Punkte)
Es gibt den Fehler der 1. Art und den Fehler der 2. Art. Der Fehler der 1. Art bedeutet, dass das H0
tatsächlich zutrifft. H0 wird zurückgewiesen obwohl sie wahr ist (false negative).
Der Fehler der 2. Art sagt, dass HO nicht abgelehnt wird, obwohl sie eigentlich falsch wäre (false
positive).

In einer Umfrage wird folgende Frage gestellt: „Wie wahrscheinlich ist es Ihrer Meinung nach, dass Sie in den
nächsten 12 Monaten arbeitslos werden? Sehr wahrscheinlich, eher wahrscheinlich, eher unwahrscheinlich oder
sehr unwahrscheinlich?“ Auf was für einer Antwortskala wird diese Frage gemessen: einer nominalen, einer
ordinalen oder einer Intervallskala? Begründen Sie Ihre Antwort. (5 Punkte)
es handelt sich um eine ordinalskalierte Variable da es eine Rangordnung mit Abständen gibt,
allerdings sind die Abstände nicht genau definiert.

Eine Befragung unter 500 Franzosen und Französinnen ergibt, dass 40% der Befragten denken, dass der
Staatspräsident Francois Hollande gute Arbeit leistet.
a. Können wir mit 95%iger Sicherheit sagen, dass weniger als die Hälfte der Franzosen und
Französinnen der Arbeit von Hollande zustimmen? Folgen Sie den allgemeinen Schritten von
Hypothesentests!
b. Was ist das 95% Konfidenzintervall für die Zustimmung zu Francois Hollande? Beschreiben Sie
das Konfidenzintervall in Worten.

a.
Ist die Prüfgröße kleiner als -1,96 oder größer als +1,96, wird die Nullhypothese abgelehnt.
Liegt die Prüfgröße zwischen -1,96 und +1,96, dann wird die Nullhypothese beibehalten.

N= 500 P= 40% = 0.4 Po= 50% = 0.5 (die Hälfte der Franzosen)
H0 : p1 = p2 vs HA : p1 /= p2
H0 : p > po wenn Z kleiner als kritische Wert Ho behalten
HA : p < po wenn Z größer als kritische Wert Ho verwerfen

Wir können mit 95%iger Sicherheit sagen, dass weniger als die Hälfte der Franzosen und
Französinnen der Arbeit von Hollande zustimmen. Ho ist also zu verwerfen.
b.

Wir können mit 95%iger Sicherheit sagen, dass das Konfidenzintervall zwischen 0.36; 0.44 liegt

Eine Befragung unter 500 Österreicherinnen und Österreichen ergibt, dass 18% der Frauen und
10% der Männer an diesem Sonntag Grün wählen würden. Es wurden 241 Frauen und 259 Männer
befragt.
a. Nennen Sie die Schritte von einem Hypothesentest, der untersucht, ob sich Männer und Frauen
in Ihrer Wahlabsicht unterscheiden!
b. berechnen Sie einen Test auf Unterschiede zwischen Anteilswerten und nehmen Sie dabei 1,96
als kritischen Wert. Können wir mit 95%iger statistischer Sicherheit sagen, dass sich Männer und
Frauen unterscheiden?
c. Berechnen Sie das 99% Konfidenzintervall für die Wahlabsicht der Männer für die Grünen. Was
schließen Sie daraus: Würden die Grünen es in den Nationalrat schaffen (also mehr als 4% der
Stimmen bekommen), wenn an diesem Sonntag Nationalratswahl wäre und man nur die Stimmen
der Männer berücksichtigen würde?

a. H0= Männer und Frauen unterscheiden sich nicht.


HA= Männer und Frauen untrscheiden sich
Wenn es einen Unterschied im Wahlverhalten bei Männer und Frauen gibt , Ho zu verwerfen.
b.
H0 : p1 = p2 vs HA : p1 /= p2
H0 : p > po wenn Z kleiner als kritische Wert Ho behalten
HA : p < po wenn Z größer als kritische Wert Ho verwerfen
P1= 18%= 0.18
P2= 10% = 0.1
n 1= 241
n 2= 259

Z ist 2.57 also größer als den krischer Wert 1.96. Wir können mit
95%iger statistischer Sicherheit sagen, dass sich Männer und
Frauen im Wahlverhalten unterscheiden. Somit Ho ist zu verwerfen
und Ha zu behalten.

c.

Der Economist beschreibt folgende Korrelation. Die unabhängige Variable ist die
Demokratiequalität, gemessen auf einer Skala von 0-10, wobei 10 die höchste Qualität bedeutet
und 0 die niedrigste. Die abhängige Variable ist das Ausmaß der Korruption, auch auf einer Skala
von 0-10, wobei 10 das maximale Ausmaß bedeutet und 0 das niedrigste.
a. Die Korrelation zwischen diesen zwei Variablen ist -0.25. Interpretieren Sie diesen Wert
b. Die geschätzte Regressionsgleichung ist y=8-0.6*x. Zeichnen Sie die Regressionslinie auf!
Beschriften Sie die Achsen.
c. Welches Korruptionsausmaß würden wir schätzen, wenn die Demokratiequalität 8 Wäre? Und welches,
wenn die Demokratiequalität 2 Wäre?

a. +1 starkes positive Zusammenhang


0 kein Zusammenhang
-1 starkes negativen Zusammenhang
Mit -0.25 steht schwaches negativen Zusammenhang zwischen der unabhängige Variable
Demokratiequalität(x) und der abhängige Variable das Ausmaß der Korruption(y). Je größer die
Demokratiequalität, desto kleiner das Ausmaß der Korruption.
Eine Korrelation misst die Stärke einer statistischen Beziehung von zwei Variablen zueinander. Bei einer
positiven Korrelation gilt „je mehr Variable A… desto mehr Variable B“ bzw. umgekehrt, bei einer
negativen Korrelation „je mehr Variable A… desto weniger
Variable B“ bzw. umgekehrt.
b. y=8-0.6*x

c. X:8 y (8) = 8-0.6*8= 3.2

X:2 y (2) = 8-0.6*2= 6.8

In einer Umfrage 2013 wurde gefragt, ob a) die Befragten die SPÖ gewählt haben (‚spoe‘) und b)
ob sie einer Gewerkschaft (‚union‘) angehören. In der Tabelle unten sehen Sie das Resultat dieser
Umfrage. Spaltenprozente sind angegeben.
a. Beschreiben Sie die Tabelle in eigenen Worten! union
b. Der Chi-Quadrat-Wert ist 29, der dazugehörige p- spoe nein ja Total
wert ist kleiner als 0.005. Nennen Sie die
relevanten Hypothesen und interpretieren Sie das nein 604 172 776
81.84 65.65 77.60
Resultat!
a. Insgesamt wurden 1000 Personen befragt. Spalten
ja 134 90 224
sagen uns ob jemand bei einer Gewerkschaft 18.16 34.35 22.40
war, die Zeilen ob die SPÖ gewählt wurde.
738 von 1000 sind nicht in einer Gewerkschaft. 262 von Total 738 262 1,000
1000 sind in einer Gewerkschaft. 100.00 100.00 100.00
776 von 1000 haben nicht SPÖ gewählt. 224 von 1000
haben SPÖ gewählt.
Es ist ein Muster erkennbar: Leute die SPÖ gewählt haben sind eher einer Gewerkschaft zugehörig.

b ist umso größer, je größer der Unterschied zwischen observed und expected Werten, also desto
eher gibt es Zusammenhang zwischen Gewerkschaftsangehörigkeit und Wahlverhalten.
H0: es gibt keinen Unterschied < als der kritische oder p-Wert groß
HA: es gibt einen Unterschied bzw. Zusammenhang als der kritische Wert und p-Wert klein.
p-Wert < als 0.005 wir können H0 mit 95%iger Sicherheit verwerfen, also gibt es einen signifikanten
Zusammenhang zwischen der Angehörigkeit in einer Gewerkschaft und einem Wahlentscheid für die
SPÖ.

In einer Umfrage nach der Wahl 2013 wurden das Alter und die Wahlbeteiligung von Befragten
ermittelt. In der Tabelle unten sehen Sie das Resultat dieser Umfrage. Spaltenprozente sind
angegeben.
a. Interpretieren Sie die Tabelle! Welches Muster ist ersichtlich?
b. Nennen Sie Null- und Alternativhypothesen, die den Zusammenhang zwischen diesen Variablen
beschreiben könnten.
c. Der Chi-Quadrat-Wert ist 66, der dazugehörige p-Wert ist kleiner als 0.005. Interpretieren Sie
dieses Resultat.
d. Erklären Sie die Berechnung des Chi-Quadrat-Tests!
a. Es wurden insgesamt 1504 (100%)Personen befragt.
Von 1504 Personen waren 368 unter 30, 1136 waren 31 und älter.
Von 1504 haben 286 (19%) nicht gewählt. Von 1504 haben 1218 gewählt.
Muster: Über 30-Jährige sind eher zur Wahl gegangen als unter 30 Jährige.

b.
H0: p-Wert
HA: p-Wert
H0: Es gibt keinen signifikanten Unterschied zwischen …..
HA: Es gibt einen signifikanten Unterschied zwischen ………..

ist 66, der p-wert ist kleiner als 0.005. D.h. ist größer als der kritische Wert, also der p-Wert
mit 0.005. Es gibt also einen signifikanten Unterschied bei der Wahlbeteiligung zwischen Unter 30
Jahre alten Wähler_innen und Über 30 Jahre alten Wähler_innen.

c. Der Chi-Quadrat-Test berechnet den Unterschied zwischen beobachteten Werten (observed) und
erwarteten werten (expected). Das Chi-Quadrat ist umso größer, je größer der Unterschied zwischen
expected und observed ist. p-Wert ist gleich 1-0.95 (0,05) Wir können also mit 95%iger Sicherheit H0 verwerfen.

d . Für jede Zelle einer Kreuztabelle wird die Differenz von beobachtener Häufigkeit ƒo und erwarteter Häufigkeit ƒe
gebildet,
diese quadriert (um negative Vorzeichen zu beseitigen),
durch die erwarteten Häufigkeiten ƒe geteilt
und die Resultate über alle Zellen aufsummiert.

Im 9. Wiener Gemeindebezirk arbeiten 9 Freiwillige beim Wahlkampf der SPÖ an einem Wahlkampfstand mit. Die
folgende Tabelle zeigt, wie viele BürgerInnen jede/r Freiwillige/r am letzten Mittwoch vor der Wahl angesprochen
hat: Person Name Angesprochene Personen
1 Andreas 25 2 Janine 27 3 Martha 39 4 Ingrid 29 5 Richard 35 6 Astrid 43 7Lisa 42 8Michaela 32 9 Gregor 6

a) Was ist der Median? Was ist das arithmetische Mittel? (5 Punkte)
Median= 32 Artimetisches Mittel= 30.8
b) Wie würde sich der Median verändern, wenn Gregor nicht mehr für die Partei arbeiten würde? Und das
arithmetische Mittel? (5 Punkte)
Median= 33.5 Artimetisches Mittel= 34
c) Dieses Beispiel zeigt: -)
Der Median ist immer größer als das arithmetische Mittel. -)
Ausreißer ziehen das arithmetische Mittel immer nach unten. -)
Der Median ist weniger für Ausreißer anfällig als das arithmetische Mittel. -) ( richtig )
Der Median ist nützlicher als das arithmetische Mittel. (5 Punkte)
14. Wir haben einen Datensatz mit 35 hochentwickelten Ländern. Die Einkommensungleichheit wird von 0 bis 10
gemessen, wobei 10 die maximale Ungleichheit bedeutet. Wir haben auch Informationen zum Prozentsatz des BIP,
der für Entwicklungshilfe ausgegeben wird.

a) Die Korrelation zwischen diesen zwei Werten ist -0.3. Was sagt uns das? (5 Punkte)

b) Wir führen eine bivariate Regression durch, mit Entwicklungshilfeausgaben als abhängige Variable und
Einkommensungleichheit als unabhängiger Variable. Die Regressionsgleichung, die wir schätzen, ist y=1.1-
0.05*x. Zeichnen Sie die Regressionslinie. Beschriften Sie die Achsen! (5 Punkte)

c) Wieviel Prozent des BIPs gibt nach unseren Schätzungen ein Land mit der größtmöglichen
Einkommensungleichheit aus? Und ein Land mit der kleinstmöglichen Einkommensungleichheit?
Und ein Land mit einer Einkommensungleichheit von 5 auf der 0-10 Skala? (5 Punkte)

d) Das R-Quadrat ist 0.09. Wie ist dieser Wert zu interpretieren? (5 Punkte)

a. Mit -0.3 steht schwaches negativen Zusammenhang zwischen der unabhängige Variable
Einkommensungleichheit (x) und der abhängige Variable Entwicklungshilfeausgaben (y).

b. y=1.1-0.05*x.

c. X:10 y (0) = 1.1-0.05*10=


X:0 y (0) = 1.1-0.05*0=
X:5 y (5) = 1.1-0.05*5=

d. 0 bis 1
Je größer, desto mehr Varianz wird erklärt
Im bivariaten Fall einfach der Korrelationskoeffizient hoch 2
76% der Varianz des Index wird durch Ungleichheit erklärt
In Österreich zeigt eine Auswertung von Wähler_innendaten folgende Korrelation. Die unabhängige Variable ist
die Links-Rechts-Position der Wähler_innen, gemessen auf einer Skala

von 0-10, wobei 0 „links“ und 10 „rechts“ bedeutet. Die abhängige Variable ist die Einschätzung
des Wählers/der Wählerin, wie sympathisch ihr/ihm Eva Glawischnig, die Parteivorsitzende der
Grünen, ist. Diese Sympathie wird auf einer Skala von 0-10 gemessen, wobei 10 die größtmögliche
Sympathie bedeutet und 0 die niedrigste.
a. Beschreiben Sie allgemein die Eigenschaften und Interpretation des Korrelationskoeffizienten r!
b. Die Korrelation zwischen diesen zwei Variablen ist -0,37. Interpretieren Sie diesen Wert!
c. Die geschätzte Regressionsgleichung ist y=6.2-0.5*x. Zeichnen sie die Regressionslinie auf!
Beschriften sie die Achsen!
d. Welche Sympathie zu Eva Glawischnig würden wir schätzen, wenn die Links-Rechts-Position
einer Wählerin 9 wäre und wie bei 1
a. +1 starkes positive Zusammenhang
0 kein Zusammenhang
-1 starkes negativen Zusammenhang
b. Mit -0.37 steht schwaches negativen Zusammenhang zwischen der unabhängige Variable die Links-Rechts-
Position der Wähler_innen (x) und der abhängige Variable die Einschätzung
des Wählers/der Wählerin (y). Je größer die Position, desto kleiner die Einschätzung
des Wählers/der Wählerin .
Eine Korrelation misst die Stärke einer statistischen Beziehung von zwei Variablen zueinander. Bei einer positiven
Korrelation gilt „je mehr Variable A… desto mehr Variable B“ bzw. umgekehrt, bei einer negativen Korrelation „je
mehr Variable A… desto weniger Variable B“ bzw. umgekehrt.
. In einer Umfrage nach der Wahl 2013 wurden das Alter und die Wahlbeteiligung von Befragten
ermittelt. In der Tabelle unten sehen Sie das Resultat dieser Umfrage. Spaltenprozente sind
angegeben.
a. Interpretieren Sie die Tabelle! Welches Muster ist ersichtlich?
b. Nennen Sie Null- und Alternativhypothesen, die den Zusammenhang zwischen diesen Variablen
beschreiben könnten.
c. Der Chi-Quadrat-Wert ist 66, der dazugehörige p-Wert ist kleiner als 0.005. Interpretieren Sie
dieses Resultat.
E. <Erklären Sie die Berechnung des Chi-Quadrat-Tests!

Alter

Wahlbeteiligung Unter 30 31 und älter Gesamt

Nicht gewählt 123 (33,4%) 163 (14,3 %) 286 (19,0%)

Gewählt 245 (66,6%) 973 (85,6 %) 1.218 (81,0%)

Gesamt 368 (100%) 1.136 (100%) 1.504 (100%)

a. Es wurden insgesamt 1504 (100%)Personen befragt. Die spalten sagen uns das Alter und die Zeilen sagen und ob
sie gewäht haben oder nicht.
Von 1504 Personen waren 368 unter 30, 1136 waren 31 und älter.
Von 1504 haben 286 (19%) nicht gewählt. Von 1504 haben 1218 gewählt.
Muster: Über 30 Jährige sind eher zur Wahl gegangen als unter 30 Jährige.
b.
H0: Es gibt keinen signifikanten Unterschied zwischen Unter 30 Wähler_innen und Über 30
Wähler_innen bei der Wahlbeteiligung
HA: Es gibt einen signifikanten Unterschied zwischen Unter 30 Wähler_innen und Über 30
Wähler_innen bei der Wahlbeteiligung
H0: p-Wert
HA: p-Wert

ist 66, der p-wert ist kleiner als 0.005. D.h. ist größer als der kritische Wert, also der p-Wert
mit 0.005. Es gibt also einen signifikanten Unterschied bei der Wahlbeteiligung zwischen Unter 30
Jahre alten Wähler_innen und Über 30 Jahre alten Wähler_innen.

c.Der Chi-Quadrat-Test berechnet den Unterschied zwischen beobachteten Werten (observed) und
erwarteten werten (expected). Das Chi-Quadrat ist umso größer, je größer der Unterschied zwischen
expected und observed ist. p-Wert ist gleich 1-0.95 (0,05) Wir können also mit 95%iger Sicherheit H0
verwerfen.

In einer Umfrage nach der Wahl 2013 wurden das Geschlecht und die Wahlentscheidung von
Befragten ermittelt. In der Tabelle unten sehen Sie das Resultat dieser Umfrage, wobei
unterschieden wird, ob die Befragten für die FPÖ gestimmt haben oder nicht. Spaltenprozente sind
angegeben.
a. Interpretieren Sie die Tabelle und beschreiben Sie den Zusammenhang zwischen Geschlecht und
FPÖ-Wahl in dieser Umfrage!
b. Nenne Sie Null- und Alternativhypothesen, die den Bevölkerungszusammenhang zwischen
diesen Variablen beschreiben könnten!
c. der Chi-Quadrat-Wert ist 0.002, der dazugehörige p-wert ist 0.895. Interpretieren Sie dieses
Resultat!
d. In der nächsten Tabelle werden Geschlecht und Wahlentscheidung für die Grünen abgebildet.
Interpretieren Sie den Zusammenhang vollständig und verweisen Sie dabei auf den
Hypothesentest!
Geschlecht

FPÖ gewählt? Männlich Weiblich Gesamt

Nein 548 (86%) 495 (85 %) 1.043 (86%)

Ja 91 (14%) 84 (15 %) 175 (14%)

Gesamt 639 (100%) 579 (100%) 1.218 (100%)

a. Es wurden insgesamt 1218 Personen befragt. Von den 1218 Befragten waren 639 männlich und
579 weiblich. Von 1218 Personen haben 1043 (86%) nicht die FPÖ gewählt. 175 (14%) von 1218
haben FPÖ gewählt.
Muster: Es gibt kaum einen Unterschied in der Wahlentscheidung zwischen Männern und Frauen.
b. H0: Es gibt keinen Unterschied im Wahlverhalten zwischen Männern und Frauen in Bezug auf die
FPÖ
HA: Es gibt einen Unterschied im Wahlverhalten zwischen Männern und Frauen in Bezug auf die FPÖ
Ist der Chi2-Wert größer als der p-Wert, gilt es H0 zu verwerfen. Ist der CHI2-Wert kleiner als der p-
Wert H0 behalten. H0: p-Wert HA: p-Wert

c. Der Chi2-Wert berechnet sich aus den beobachteten und erwarteten Werten. Weichen die
erwarteten Werte von den beobachteten Werten mit einem großen Unterschied ab, gilt es H0 zu verwerfen. In
diesem Fall ist der Chi2-Wert kleiner als der p-Wert (1-0,95=0,05) und befindet sich mit
0,002 außerhalb der statistischen Wahrscheinlichkeit von 95%. H0 wird nicht verworfen, es gibt
keinen signifikanten Unterschied im Wahlverhalten zwischen Männern und Frauen in Bezug auf die
FPÖ.
d. Es haben 172 (14%) von 1218 Befragten grün gewählt. 1046 (86%)haben nicht grün gewählt.
77 Männer (12%) haben grün gewählt, 95 Frauen (16%) haben grün gewählt, 562 (88%) haben nicht
grün gewählt, 484 (84%) haben nicht grün gewählt.
Muster: Es gibt einen geringen Unterschied zwischen Wahlverhalten und Geschlecht in Bezug auf die
Grünen.
H0: Es gibt keinen (signifikanten) Unterschied zwischen Geschlecht und Wahlverhalten in Bezug auf
die Grüne Partei
HA: Es gibt einen (signifikanten) Unterschied zwischen Geschlecht und Wahlverhalten in Bezug auf
die Grüne Partei
Der Chi2-Wert ist mit 4.7560 größer als der p-Wert von 0.029, es gibt somit mit statistischer
Sicherheit einen Unterschied zwischen Geschlecht und Wahlverhalten in Bezug auf die Grüne Partei.

Geschlecht

Grün gewählt? Männlich Weiblich Gesamt

Nein 562 (88%) 484 (84 %) 1.046 (86%)

Ja 77 (12%) 95 (16 %) 172 (14%)

Gesamt 639 (100%) 579 (100%) 1.218 (100%)

Chi-Quadrat-Wert= 4.7560, p = 0.029

In einer weiteren Auswertung dieser Daten wird untersucht, wie der Sympathiewert für H.-
C. Strache und der Sympathiewert für die FPÖ insgesamt (auch auf einer 0-10 Skala gemessen) zusammenhängen.
a. Die Korrelation zwischen diesen zwei Variablen ist 0,82. Interpretieren Sie diesen Wert! (5 Punkte)
b. Danach schätzen wir eine Regression mit FPÖ-Sympathie als abhängige und H.-C.-
Strache-Sympathie als unabhängige Variable. Das Regressionsmodell hat als geschätzte
Gleichung y = 1,3 + 0,7*x. Zeichnen Sie die Regressionslinie auf! Beschriften
Sie die Achsen! (5 Punkte)
c. Welche Sympathie zur FPÖ würden wir anhand dieses Modells erwarten, wenn die
Sympathie für H.-C. Strache 6 wäre? Und welches, wenn die Sympathie für H.-C. Strache 4 wäre? Schreiben Sie zu
jeder Frage einen Antwortsatz! (5 Punkte)

a. +1 starkes positive Zusammenhang


0 kein Zusammenhang
-1 starkes negativen Zusammenhang
Zusammenhang zwischen Sympathie für Strache und Sympathie für Fpö stark positiv. Je mehr sympathie für Strache,
desto mehr sympathie für fpö

b. zeichnen
c. x6: y(6)= 1,3+0,7*6=5.5
X4: y(4)= 1,3+0,7*4= 4.1

In einer Befragung unter 513 Österreicherinnen und Österreichern wird der Sympathiewert für H.-C.
Strache (FPÖ) auf einer 0-10 Skala abgefragt, wobei 0 keine Sympathie und 10 große Sympathie bedeutet.
Die Umfrage zeigt, dass der durchschnittliche Sympathiewert bei Frauen 2,32 und bei Männern
2,96 ist (Standardabweichung: 2,25 bei Frauen, 3,52 bei Männern). Es wurden 267 Frauen und
246 Männer befragt.
a. Erklären Sie kurz, wie das arithmetische Mittel (der durchschnittliche Sympathiewert)
hier ermittelt wurde!
b. Nennen Sie die Schritte von einem Hypothesentest, der untersucht, ob sich Männer
und Frauen in Ihrer Sympathie für H.-C. Strache unterscheiden!
c. Berechnen Sie einen Test auf Unterschiede zwischen Mittelwerten und nehmen Sie
dabei 1,96 als kritischen Wert! Können wir mit 95%iger statistischer Sicherheit sagen,
dass sich Männer und Frauen in Ihrer Sympathie für H.-C. Strache unterscheiden?
d. Berechnen Sie das 99% Konfidenzintervall für den Sympathiewert der Männer für
H.-C. Strache! Fassen Sie das Ergebnis Ihrer Berechnung in eigene Worte!

a. Das Arithmetische Mittel wurde berechnet indem alle Werte zusammengezählt und durch die Anzahl der
Befragten dividiert wurde.

b. H0: Es gibt keinen signifikanten Unterschied zwischen Männer und Frauen


HA: Es gibt einen signifikanten Unterschied zwischen Männer und Frauen

H0 : x1 = x2 wenn T kleiner als kritische Wert Ho behalten


HA : x1 /= x2 wenn T größer als kritische Wert Ho verwerfen

c. n = 513
n 1= 267 n 2= 246
X1= 2.32 X2= 2. 96
S1= 2.25 S2= 3. 52

T ist mit – 2.46 größer als den kritischen Wert . Männer und Frauen unterscheiden sich. Ho zu verwerfen

d.
Wann ist welche Lagemaße sinnvoll zu berechnen?
In einer amerikanischen Umfrage wurde gefragt: Wie sehr sind Sie auf einer Skala von 1-7 mit der Arbeit von
Präsident Barack Obama zufrieden, wobei 1 sehr unzufrieden bedeutet und 7 sehr zufrieden?

a. Berechnen sie die relativen und kumulativen Prozente für diese Antworten (nur auf eine Nachkommastelle)

b. Die drei Lagemaße sind Modus, Median und arithmetisches Mittel. Welche Lagemaße sind für diese Variable
sinnvoll? Begründen Sie für jedes Lagemaß Ihre Antwort!
Intervallskalle. Man berechent alle drei Lagemaße. Weil es
Modus weil es verschiedne Zahlen von Befragten zu verschiedenen Antworten gibt.
Median weil es eine Reihe von den Werten sein kann
Mittelwert um das Zentrum der Verteilung zu beschreiben

c. Berechnen Sie die sinnvollen Lagemaße und beschreiben Sie das Ergebnis in Worten! (5 Punkte)
der Mittelwert ist ein sinnvoller statistischer Kennwert zur Beschreibung dieser Variablen.
arithmetisches Mittel wäre bei mir 4,25. (6497 alle Werte / 1528 )

d. Die Standardabweichung bei diesen Werten beträgt 2,43. Interpretieren sie das Ergebnis in eigenen Worten! (5
Punkte)
Die Standardabweichung vom Durchschnitt / Maß für die Streuung der Werte dieser Variable beträgt einen Wert um
etwa 2.43 . Die Zufriedenheit ändert sich relativ .

e. Berechnen Sie das 95%-Konfidenzintervall der durchschnittlichen Zustimmung zur Arbeit von Barack Obama!
Interpretieren Sie das Ergebnis in eigenen Worten! (10 Punkte)

f. Testen Sie anhand dieses Konfidenzintervalls die Hypothese, dass die Zustimmung zur Arbeit von Barack Obama
höher als der Mittelpunkt der Skala (4) ist. Benennen und folgen Sie dabei den allgemeinen Schritten eines
Hypothesentests, der die statistische Signifikanz eines Zusammenhangs ermitteln soll! (5 Punkte)

g. Die durchschnittliche Zustimmung zur Arbeit von Barack Obama ist bei den 198 befragten Afro-Amerikanern 6,3,
bei den 254 befragten hispanisch-Amerikanern 5,7. Die Standardabweichungen in den beiden Gruppen beträgt
jeweils 2,3 und 2,5. Können wir anhand dieser Information sagen, dass sich die zwei Gruppen in ihrer Meinung über
die Arbeit von Barack Obama unterscheiden? Benennen und folgen Sie dabei den allgemeinen Schritten eines
Hypothesentests! (10 Punkte)

Das könnte Ihnen auch gefallen