Sie sind auf Seite 1von 7

Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“

Wintersemester 2019 / 2020

Merkblatt: Univariate und Bivariate Analyse

Die schlichte Ausgabe von Tabellen, Teststatistiken…etc. ist bei empirischen


Untersuchungen üblicherweise nicht ausreichend; die verbale Beschreibung der Ergebnisse
(und deren Interpretation) ist hingegen das Wesentliche! Bevor aber überhaupt mit der
Prüfung von Hypothesen bzw. der Beschreibung bivariater Zusammenhänge begonnen
werden kann, erfolgt üblicherweise immer die Beschreibung der univariaten Verteilungen der
jeweiligen Variablen. Dabei gilt es zu klären welche Datenlage vorliegt: Wie verteilen sich die
Befragten über die verschiedenen Kategorien; wo ordnen sich die meisten Befragten ein; wie
streuen ihre Antworten…etc.? Dabei wird üblicherweise auf Tabellen und Maßzahlen (Lage-
und Streuungsmaße) zurückgegriffen, die sich je nach Skalenniveau unterscheiden.

Die folgenden Beispiele beziehen sich auf den AUTNES 2009 Datensatz (ZA Nr.: 5855); die
darin beschriebene Vorgehensweise kann jedoch auch auf andere Datensätze umgelegt
werden. Beachten Sie daher die hier dargestellten Beschreibungen bei Ihren eigenen
Auswertungen!

Univariate Analyse: Nominalskalenniveau

Wie kann ich unterscheiden: gleich/ungleich

Was möchte ich wissen: Wie verteilen sich Befragte über Kategorien?

Wie erfahre ich das: Modalwert, Häufigkeitstabelle

Wie sagt mir Stata das: tabulate [Variable]

Beispiel: tabulate d011a

D011a:Momentane berufliche |
Stellung | Freq. Percent Cum.
--------------------------------+-----------------------------------
Angestellte/ Angestellter | 306 51.69 51.69
Arbeiter/ Arbeiterin | 120 20.27 71.96
Beamter/ Beamtin | 35 5.91 77.87
Vertragsbedienstete/er | 16 2.70 80.57
Selbstständig ohne Arbeitnehmer | 59 9.97 90.54
Selbstständig mit Arbeitnehmern | 30 5.07 95.61
Landwirt/in | 26 4.39 100.00
--------------------------------+-----------------------------------
Total | 592 100.00

Wie beschreibe ich das: Insgesamt wurde die Frage nach der beruflichen Stellung der
Befragten von 592 Personen beantwortet (Variable d011a). Nach der beruflichen Stellung
der Befragten befinden sich am häufigsten Angestellte in der AUTNES Stichprobe; rund 52%

Christian Glantschnigg 1
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

der Befragten ordnen sich in diese Gruppe ein, die damit die Modalkategorie der beruflichen
Stellung darstellt. Die zweitgrößte Gruppe machen die Arbeiter und Arbeiterinnen aus, auf
die ein Anteil von rund 20% entfällt. Als Selbstständige (unabhängig ob mit oder ohne
Arbeitnehmerinnen und Arbeitnehmer) bezeichnen sich rund 15% der Befragten, 6% gehen
einer Tätigkeit als Beamtin oder Beamter nach. Die übrigen Befragten entfallen auf
Landwirtinnen und Landwirte (4%) sowie Vertragsbedienstete (3%).

Univariate Analyse: Ordinalskalenniveau

Wie kann ich unterscheiden: gleich/ungleich, Rangordnung

Was möchte ich wissen: Wie verteilen sich Befragte über Kategorien, wie streuen ihre
Antworten?

Wie erfahre ich das: Median (2. Quartil), 1. und 3 Quartil, IQR, Häufigkeitstabelle

Wie sagt mir Stata das:

tabulate [Variable]

tabstat [Variable], stats (p25 median p75 iqr)

Beispiel:

tabulate d016a

D016:Wie häufig gehen Sie in |


die Kirche/Gotteshaus? | Freq. Percent Cum.
-----------------------------+-----------------------------------
nie | 95 10.47 10.47
etwa ein bis zweimal im Jahr | 276 30.43 40.90
etwa drei bis elfmal im Jahr | 190 20.95 61.85
einmal im Monat | 114 12.57 74.42
zwei bis dreimal im Monat | 96 10.58 85.01
einmal die Woche | 107 11.80 96.80
öfter | 29 3.20 100.00
-----------------------------+-----------------------------------
Total | 907 100.00

tabstat d016, stats (p25 median p75 iqr)

variable | p25 p50 p75 iqr


-------------+----------------------------------------
d016 | 2 3 5 3
------------------------------------------------------

Wie beschreibe ich das: Die Fragen nach der Kirchgangshäufigkeit bzw. der Häufigkeit des
Besuches von Gottesdiensten (unabhängig vom Bekenntnis der Befragten) wurde insgesamt

Christian Glantschnigg 2
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

von 907 Personen beantwortet. Die meisten Befragten (30%) besuchen etwa ein bis zweimal
im Jahr eine Kirche bzw. ein Gotteshaus abseits besonderer Anlässe wie Hochzeiten,
Begräbnissen…etc. Dies ist somit als Modalwert dieser Variable anzusehen Am
zweithäufigsten besuchen die Befragten ein Gotteshaus etwa drei bis elfmal im Jahr, was
zugleich auch der Medianwert dieser Variable ist.

Die Verteilung zeigt weiters, dass 25% der Befragten (1. Quartil) höchstens nur ein bis
zweimal im Jahr in die Kirche geht und 25% (3.Quartil) mindestens mehrmals im Monat. Der
Interquartilabstand, in dem sich die zentralen 50% der Befragten befinden, erstreckt sich
demnach zwischen diesen beiden Grenzen und umfasst somit drei Kategorien.

Univariate Analyse: Metrische Variablen (Intervall- und Ratioskalenniveau)

Wie kann ich unterscheiden: gleich/ungleich, Rangordnung, gleiche Abstände

Was möchte ich wissen: Welchen Mittelwert hat diese Variable, welchen Medianwert hat
sie, wie streuen die Antworten der Befragten?

Wie erfahre ich das: arithmetisches Mittel, Standardabweichung, Median (2. Quartil), 1. und
3 Quartil, IQR

Wie sagt mir Stata das:

tabstat [Variable], stats (mean sd p25 median p75 iqr min max)

Beispiel:

tabstat Alter, stats (mean sd p25 median p75 iqr min max)

variable | mean sd p25 p50 p75 iqr


-------------+------------------------------------------------------------
Alter | 51.46438 17.74606 39 51 66 27
--------------------------------------------------------------------------

variable | min max


-------------+--------------------
Alter | 18 96
----------------------------------

summarize Alter

Variable | Obs Mean Std. Dev. Min Max


-------------+--------------------------------------------------------
Alter | 1165 51.46438 17.74606 18 96

Christian Glantschnigg 3
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

Wie beschreibe ich das: Das Durchschnittsalter der Befragten liegt bei rund 51 Jahren
(arithmetisches Mittel 51,46; Standardabweichung 17,75, Median 51); 25% der Befragten
sind jünger als 39 Jahre und 25% sind älter als 66 Jahre. Demnach erstreckt sich der
Interquartilabstand der zentralen 50% der Befragten über 27 Jahre. Der oder die jüngste
Befragte ist 18 Jahre alt, der oder die älteste Befragte 96. Diese Frage wurde insgesamt von
1165 Personen der AUTNES 2009 Erhebung beantwortet.

Christian Glantschnigg 4
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

Bivariate Analyse

Was möchte ich wissen: Wie verteilt sich die abhängige Variable über die Kategorien der
unabhängigen Variable?

Wie erfahre ich das: Kreuztabelle mit Spaltenprozent (= konventionelle Darstellungsform)

Wie sagt mir Stata das: tabulate [abhVar] [unabhVar], column nofreq (oder
umgekehrt mit row bei einer nicht-konventionellen Darstellung)

Wie beschreibe ich das: Die Auswertung der Wahlentscheidung 2008 nach beruflicher
Stellung hat Folgendes gezeigt: Angestellte wählten überwiegend die SPÖ (32%), gefolgt
von ÖVP (26%) und FPÖ (20%). Demnach ist hier ein deutlicher Unterschied zu allen
Befragten insgesamt zu erkennen, bei denen sich die Anteile von SPÖ und ÖVP jeweils bei
rund 31% befinden und der für die FPÖ bei rund 17%.

Arbeiterinnen und Arbeiter wählten mit 38% ebenfalls mehrheitlich die SPÖ; ÖVP und FPÖ
liegen hier mit Anteilen von jeweils 22% gleichauf in der Gunst der Wählerinnen und Wähler.

Bei den Beamten ist der deutlichste Unterschied nach Parteien zu erkennen; eine absolute
Mehrheit von rund 54% der befragten Beamtinnen und Beamte wählte die SPÖ, 18% die
ÖVP und jeweils 7% FPÖ oder Grüne. Aufgrund der geringen Zahl von Beamten in der
Stichprobe (n=28) ist dieses Ergebnis jedoch mit Vorsicht zu interpretieren.

Bei den Selbstständigen, sowohl mit als auch ohne Arbeitnehmerinnen und Arbeitnehmer,
liegt jedoch die ÖVP mit 43% bzw. 60% auf dem ersten Platz, die SPÖ mit 19% bzw. 12%
auf dem zweiten Platz. FPÖ und Grüne teilen sich mit jeweils 12% und 8% bei dieser Gruppe
den dritten Rang.

Bei Landwirtinnen und Landwirten ist die traditionelle Stärke der ÖVP am deutlichsten zu
sehen; rund 73% der Befragten aus dieser Berufsgruppe wählte 2008 die ÖVP. In dieser
Gruppe liegen die FPÖ und das BZÖ mit jeweils 9% auf dem zweiten Platz, gefolgt von SPÖ
und Grünen mit jeweils 6%. Allerdings gilt auch für diese Berufsgruppe, dass Interpretationen
aufgrund der geringen Fallzahl (n=22) nur unter Vorbehalt anzustellen sind.

ACHTUNG: Sollen die Parteien nach der Zusammensetzung ihrer Wählerinnen und Wähler
nach verschiedenen Berufsgruppen untersucht und beschrieben werden, so muss die
Analyse (und damit auch die Ausgabe) nach Zeilenprozent erfolgen. Das Aufsummieren von
Spaltenprozentwerten über Zeilen ist hierbei nicht zielführend, da hierbei meistens Werte
über oder unter 100% das Ergebnis sein werden!

Christian Glantschnigg 5
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

Beispiel: tabulate q27c d011a, column

Q27c: Welche |
Partei haben Sie |
bei den |
NR-Wahlen 2008 | D011a:Momentane berufliche Stellung
gewählt? | Angestell Arbeiter/ Beamter/ Vertragsb Selbststä Selbststä Landwirt/ | Total
-----------------+-----------------------------------------------------------------------------+----------
SPÖ | 74 33 15 3 10 3 1 | 139
| 32.46 38.37 53.57 27.27 19.61 12.00 4.55 | 30.82
-----------------+-----------------------------------------------------------------------------+----------
ÖVP | 59 19 5 4 22 15 16 | 140
| 25.88 22.09 17.86 36.36 43.14 60.00 72.73 | 31.04
-----------------+-----------------------------------------------------------------------------+----------
FPÖ | 46 19 2 0 6 2 2 | 77
| 20.18 22.09 7.14 0.00 11.76 8.00 9.09 | 17.07
-----------------+-----------------------------------------------------------------------------+----------
Grüne | 21 6 2 3 6 2 1 | 41
| 9.21 6.98 7.14 27.27 11.76 8.00 4.55 | 9.09
-----------------+-----------------------------------------------------------------------------+----------
BZÖ | 22 7 1 0 2 1 2 | 35
| 9.65 8.14 3.57 0.00 3.92 4.00 9.09 | 7.76
-----------------+-----------------------------------------------------------------------------+----------
LIF | 1 0 0 1 3 1 0 | 6
| 0.44 0.00 0.00 9.09 5.88 4.00 0.00 | 1.33
-----------------+-----------------------------------------------------------------------------+----------
Liste Dinkhauser | 1 2 2 0 1 0 0 | 6
| 0.44 2.33 7.14 0.00 1.96 0.00 0.00 | 1.33
-----------------+-----------------------------------------------------------------------------+----------
Andere Partei | 2 0 0 0 0 0 0 | 2
| 0.88 0.00 0.00 0.00 0.00 0.00 0.00 | 0.44
-----------------+-----------------------------------------------------------------------------+----------
Keine Partei | 2 0 1 0 1 1 0 | 5
| 0.88 0.00 3.57 0.00 1.96 4.00 0.00 | 1.11
-----------------+-----------------------------------------------------------------------------+----------
Total | 228 86 28 11 51 25 22 | 451
| 100.00 100.00 100.00 100.00 100.00 100.00 100.00 | 100.00

Christian Glantschnigg 6
QM_2019
Lernhilfe UE „Quantitative Methoden der empirischen Sozialforschung“
Wintersemester 2019 / 2020

Vergleich: Analyse der Zusammensetzung der WählerInnen nach beruflicher Stellung (nicht-konventionelle Darstellung mit Zeilen-%)

tabulate q27c d011a, row

Q27c: Welche |
Partei haben Sie |
bei den |
NR-Wahlen 2008 | D011a:Momentane berufliche Stellung
gewählt? | Angestell Arbeiter/ Beamter/ Vertragsb Selbststä Selbststä Landwirt/ | Total
-----------------+-----------------------------------------------------------------------------+----------
SPÖ | 74 33 15 3 10 3 1 | 139
| 53.24 23.74 10.79 2.16 7.19 2.16 0.72 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
ÖVP | 59 19 5 4 22 15 16 | 140
| 42.14 13.57 3.57 2.86 15.71 10.71 11.43 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
FPÖ | 46 19 2 0 6 2 2 | 77
| 59.74 24.68 2.60 0.00 7.79 2.60 2.60 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
Grüne | 21 6 2 3 6 2 1 | 41
| 51.22 14.63 4.88 7.32 14.63 4.88 2.44 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
BZÖ | 22 7 1 0 2 1 2 | 35
| 62.86 20.00 2.86 0.00 5.71 2.86 5.71 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
LIF | 1 0 0 1 3 1 0 | 6
| 16.67 0.00 0.00 16.67 50.00 16.67 0.00 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
Liste Dinkhauser | 1 2 2 0 1 0 0 | 6
| 16.67 33.33 33.33 0.00 16.67 0.00 0.00 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
Andere Partei | 2 0 0 0 0 0 0 | 2
| 100.00 0.00 0.00 0.00 0.00 0.00 0.00 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
Keine Partei | 2 0 1 0 1 1 0 | 5
| 40.00 0.00 20.00 0.00 20.00 20.00 0.00 | 100.00
-----------------+-----------------------------------------------------------------------------+----------
Total | 228 86 28 11 51 25 22 | 451
| 50.55 19.07 6.21 2.44 11.31 5.54 4.88 | 100.00

Christian Glantschnigg 7
QM_2019