Sie sind auf Seite 1von 65

Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Elementare Datenanalyse mit EDV


Hausübungen mit LATEX

Peter Flucher

Sommersemester 2011

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen, Kreuztabelle

1 Hausübung 1
Häufigkeitsauszählungen
Kreuztabelle

2 Hausübung 2

3 Hausübung 3

4 Hausübung 4

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Verschaffen Sie sich einen Überblick durch


Häufigkeitsverteilung!

Aufgabestellung
Verschaffen Sie sich einen Überblick über die Verteilungen der
Variablen f8a-f8d, indem Sie Häufigkeitsverteilungen, zentrale Lage-
und Streuungsmaße berechnen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Maße für ordinal skalierte Daten

Da die Variablen ordinal skaliert sind die erlaubten zentralen


Lagemaße der Modus und der Median. Die erlaubten Steuungsmaße
sind Minimum, Maximum und die sich daraus ergebende
Spannweite.
FREQUENCIES VARIABLES = f8a f8b f8c f8d
/ STATISTICS = RANGE MINIMUM MAXIMUM MEDIAN MODE
/ ORDER = ANALYSIS .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

zentrale Lage- und Steuungsmaße

Zustimmung: wenig Zustimmung: wenig Zustimmung: wenig Zustimmung: wenig


Arbeit, Männer eher Arbeit, Jüngere eher Arbeit, Inländer eher Arbeit, Gesunde eher
Recht auf Arbeit als Recht auf Arbeit als Recht auf Arbeit als Recht auf Arbeit als
Frauen Ältere Ausländer Behinderte
Gültig 993 993 992 985
Fehlend 5 5 6 13
Median 5 3 2 3
Modus 5 3 1 5
Spannweite 4 4 4 4
Minimum 1 1 1 1
Maximum 5 5 5 5

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Rangreihen bilden

Aufgabestellung
Bilden Sie danach eine Rangreihe der Items nach dem Prozentsatz
der Zustimmung - fassen Sie dabei die Kategorien „stimme sehr zu“
und „stimme eher zu“ jeweils zusammen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Wert 1 und 2 zusammenfassen

Variable erstellen, die die Zustimmung zusammenfasst. (Zwei


Ausprägungen: Zustimmung und keine Zustimmung)
Häufikeitsauszählung.

RECODE f8a f8b f8c f8d ( MISSING = SYSMIS ) (1 thru


2=1) ( ELSE =2) INTO f8a_zust f8b_zust f8c_zust
f8d_zust .
EXECUTE .

FREQUENCIES VARIABLES = f8a_zust f8b_zust


f8c_zust f8d_zust
/ ORDER = ANALYSIS . /* VARIABLE . */

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Jugendliche sind Ausländerfeindlich


Variable Rang Zustimmung
f8c_zust 1. 54,3%
f8b_zust 2. 30,6%
f8d_zust 3. 24,6%
f8a_zust 4. 16,7%

Interpretation
Mehr als die hälfte der Personen, die die Frage beantwortet haben
sind der Meinung Inländer sollen bei der Jobvergabe bevorzugt
werden. Bei dem letzten Rang, der Frage nach der Bevorteilung von
Männern vermute ich eine Gleichverteilung von Männern und
Frauen in der Umfrage.
Elementare Datenanalyse mit EDV
Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Häufigkeitsauszählungen

Verteilung der von „Geschlecht“

Eine Häufigkeitsauzählung des Geschlechts (f68)ergibt eine


Gleichverteilung.
FREQUENCIES VARIABLES = f68
/ ORDER = ANALYSIS .

männlich 50,5%
weiblich 49,5%

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Kreuztabelle

Kreuztabelle

1 Hausübung 1
Häufigkeitsauszählungen
Kreuztabelle

2 Hausübung 2

3 Hausübung 3

4 Hausübung 4

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Kreuztabelle

Skalenniveau

Aufgabestellung
Untersuchen Sie, ob Personen mit und ohne Matura (bildung 2)
bestimmte Aussagen (Varialben f1a (Arbeit), f1e (Politik) sowie
f1f (Religion)) anders beantworten.

Die Abhängige Variabel sagt aus ob eine Person eine Matura hat. Es
handelt sich um eine nominal skalierte Variabel mit zwei
Ausprägungen, also eine dichotome Variable. Die anderen,
unabhängigen Variablen sind ordinal skaliert. (Die Werte „5“ und
„6“ sind als fehlender Wert definiert. Wäre das nicht so wären die
Variablen nominal skaliert.)

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Kreuztabelle

Kreuztabelle mit Kontingenzkoeffizient

Um die Abhängigkeit der Variablen zu überprüfen erstelle ich eine


Kreuztabelle und lasse mir den χ2 -Test ausführen und den
Kontingenzkoeffizienten (Cramer-V) mitausgeben.
CROSSTABS
/ TABLES = bildung2 BY f1a f1e f1f
/ FORMAT = AVALUE TABLES
/ STATISTICS = PHI CHISQ
/ CELLS = COUNT ROW
/ COUNT ROUND CELL .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Kreuztabelle

Politik am am abhängigsten

Anhand der Kreuztabelle kann man sehen, dass „Politik“ noch am


stärksten abhängig von der Matura ist.
Variable χ2 -Test Cramer-V
Wichtige Bereiche im Leben: Arbeit 0,024 0,105
Wichtige Bereiche im Leben: Politik 0,000 0,171
Wichtige Bereiche im Leben: Religion 0,084 0,88

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Kreuztabelle

Schwacher Zusammenhang feststellbar

Interpretation
Der χ2 -Test ist bei einem Signifikanz-Niveau von 5% bei Arbeit und
bei Politik unter dem Kritischen Wert, also wir können von einer
Abhängigkeit ausgehen. Der Cramer-V ist unter 0,2. Das heißt der
Zusammenhang ist schwach.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Rekodieren, Korrelation

1 Hausübung 1

2 Hausübung 2
Variablen rekodieren
Korrelationsanalyse

3 Hausübung 3

4 Hausübung 4

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Verschaffen Sie sich einen Überblick durch


Häufigkeitsverteilung!

Aufgabestellung
Untersuchen Sie mittels Kreuztabellenanalyse (inkl. zulässiger
Assoziationsmaße), ob sich die Einstellung der Jugendlichen zu
Politik (f1e) nach und Geschlecht (f68), Alter (f69) und
Wohnortgröße (f82) unterscheidet.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Geschlecht – Ineresse an Politik

Das Geschlecht ist nominal skaliert, aber da es nur zwei


Ausprägungen gibt, darf es wie metrische Daten behandelt werden.
Die Einstellung zu Politik ist ordinal skaliert. Ich verwende den
χ2 -Test um festzustellen ob es überhaupt eine Abhängigkeit
zwischen den Variablen gibt. Weiters lasse ich mir den Cramer-V
ausgeben um die Stärke des Zusammenhangs anzuzeigen und den
Kendall-Tau-C und den Spearman ob eine Tendenz in eine Richtung
feststellbar ist.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

zentrale Lage- und Steuungsmaße

CROSSTABS
/ TABLES = f68 BY f1e
/ FORMAT = AVALUE TABLES
/ STATISTICS = CHISQ PHI CORR CTAU
/ CELLS = COUNT ROW
/ COUNT ROUND CELL
/ BARCHART .

χ2 -Test 0,004
Cramer-V 0,117
Spearman 0,07

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Geringer Zusammenhang

Interpretation
Es besteht ein Zusammenhang. Der Zusammenhang ist gering. Man
kann nicht sagen, dass Frauen oder Männer mehr interesse für
Politik haben.

Aufgabestellung
Führen Sie diese Berechnungen einerseits mit den ursprünglichen
Variablen, andererseits auch mit rekodierten Variablen durch.
Es erscheint mir keine rekodierung Sinnvoll.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Alter – Interesse an Politik

Alter ist metrisch skaliert. Es beinhält Daten von 14–24. Da mein


geringstes Niveau diesmal wieder ordinal ist gehe ich wie oben vor.
CROSSTABS
/ TABLES = f69 BY f1e
/ FORMAT = AVALUE TABLES
/ STATISTICS = CHISQ PHI CORR CTAU
/ CELLS = COUNT ROW
/ COUNT ROUND CELL
/ BARCHART .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Korrelation feststellbar

χ2 -Test 0,000
Cramer-V 0,163
Spearman –0,216

Interpretation
Es besteht ein Zusammenhang. Der Zusammenhang ist gering. Eine
geringe Tendenz ist festzustellen. (Umso älter umso mehr Interesse)

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Mich interesiert nun dei Gruppe der „Neu-Wähler“, also der 16–17
Jährigen. Ich kodiere die Variable Alter in eine ordinale Variable mit
drei Ausprägungen um.
RECODE f69 (14 thru 15=1) (15 thru 16=2) (17
thru 24=3) INTO f69_uk .
EXECUTE .

CROSSTABS
/ TABLES = f69_uk BY f1e
/ FORMAT = AVALUE TABLES
/ STATISTICS = CHISQ PHI CORR CTAU
/ CELLS = COUNT ROW
/ COUNT ROUND CELL
/ BARCHART .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Wählen ab 16?

P
1 2 3 4
14–15 Jahre 8.3% 11.9% 43.7% 35.9% 100%
15–16 Jahre 3.2% 15.2% 45.6% 35.9% 100%
17–24 Jahre 7.7% 25.2% 49.1% 17.9% 100%

Interpretation
Die „neuen Wähler“ sind offenbar nicht sehr an Politik interessiert.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Wohnortgröße – Interesse an Politik

Die Wohnortgröße ist ordinal skaliert und hat acht Ausprägungen.


Ich verfahre wie bei den zwei anderen Bespielen.
CROSSTABS
/ TABLES = f82 BY f1e
/ FORMAT = AVALUE TABLES
/ STATISTICS = CHISQ PHI CORR CTAU
/ CELLS = COUNT ROW
/ COUNT ROUND CELL
/ BARCHART .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

geringer Zusammenhang

χ2 -Test 0,035
Cramer-V 0,110
Spearman 0,002

Interpretation
Es besteht wieder ein Zusammenhang und er ist sehr, sehr gering.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Kategorien begründen

Aufgabestellung
Begründen Sie die Kategorien, die Sie im Zuge der Rekodierungen
bilden und interpretieren Sie jeweils die Ergebnisse. Dokumentieren
Sie dabei auch Unterschiede, die sich durch die Verwendung der
umkodierten im Vergleich zu den ursprünglichen Variablen ergeben.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Wohnortgrößen überprüfen

Da ich die Kategorien der Wohnortsgröße nicht ganz nachvollziehen


kann, kodiere ich so um, dass die Variable dann annähernd
gleichverteilt ist. Dafür mache ich zuerst eine Häufigkeitsauszählung
mit Histogram.
FREQUENCIES VARIABLES = f82
/ HISTOGRAM
/ ORDER = ANALYSIS .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Wohnortgrößen umkodieren

Anhand der Häufigkeiten erstelle ich meine neue Variable.


RECODE f82 (1=1) (2=2) (3 thru 5= 3) (6 thru 8=4)
INTO f82_uk .
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Häufigkeiten und Korrelationen


Jetzt gehe ich wieder wie oben vor.
FREQUENCIES VARIABLES = f82_uk
/ HISTOGRAM
/ ORDER = ANALYSIS .

CROSSTABS
/ TABLES = f82_uk BY f1e
/ FORMAT = AVALUE TABLES
/ STATISTICS = CHISQ PHI CORR CTAU
/ CELLS = COUNT ROW
/ COUNT ROUND CELL
/ BARCHART .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Variablen rekodieren

Nicht Signifikant

χ2 -Test ist mit 0,495 nicht Signifikant. Das heißt wir können bei
gleichmäßig verteilten Kategorien nicht mehr von einem
Zusammenhang ausgehen. Die anderen Werte bestätigen das. Das
bestätigt für mich die Problematik bei der Kategorienbildung.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Korrelationsanalyse

Korrelationsanalyse

Aufgabestellung
Untersuchen Sie den Zusammenhang zwischen Einstellung zu Politik
(f1e) und Geschlecht (f68) bzw. Vertrauen in das Parlament (f61f),
politische Parteien (f61l) und die Polizei (f61e) mittels
Korrelationsanalyse.

Die Variablen Interesse an Politik und Geschlecht wurde schon


weiter oben in Zusammenhang gesetzt.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Korrelationsanalyse

Vertrauen in . . .

Ich gehe davon aus das es starke Korrelationen zwischen Vertrauen


in Partein und Vertrauen in das Parlament gibt.
Das Skalenniveau unsere Variablen ist ordinal. Die richtige
Messgröße für die Korrelation ist daher der
Spearman-Rankorrelationskoeffizient.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Korrelationsanalyse

Korrelation - Vertrauen in . . .

NONPAR CORR
/ VARIABLES = f61e f61f f61l
/ PRINT = SPEARMAN TWOTAIL NOSIG
/ MISSING = PAIRWISE .

Polizei Parlament Parteien


Polizei 1 0,457 0,244
Parlament 0,457 1 0,512
Parteien 0,244 0,512 1

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Korrelationen und Rekodieren

1 Hausübung 1

2 Hausübung 2

3 Hausübung 3
Vorüberlegungen
Esoterik – Geschlecht
Esoterik – Bildung
Esoterik – Ortsgröße

4 Hausübung 4
Elementare Datenanalyse mit EDV
Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Vorüberlegungen

Vorüberlegungen

Aufgabestellung
Berechnen und interpretieren Sie den korrekten Test um zu prüfen,
ob Unterschiede hinsichtlich der Erfahrungen mit esoterischen
Praktiken nach Geschlecht, Bildung und Ortsgröße bestehen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Vorüberlegungen

Skalenniveaus

esoterische Erfahrungen nominal (ordinalisierbar)


Geschlecht nominal, darf wegen dichotomie als metrisch
behandelt werden.
Bildung nominal
Ortsgröße ordinal

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Vorüberlegungen

Testauswahl

Aufgabestellung
Entscheiden Sie sich für den adäquaten Test und begründen Sie
diese Entscheidung.

Da die abhängigen Variablen alle nominal sind ist der anzuwendende


Test der χ2 -Test. Die Stärke der Abhängigkeit wird standardisiert
mit dem Cramer-V ausgegeben. (Der Signifikanz-Parameter des
χ2 -Test wird mit dem Cramer-V mit ausgegeben) Bei signifikanten
Abhängigkeiten empfielt sich eine ordinalisierung und eine
Überprüfung einer Korrelation. Dafür eignet sich der
Spearman-Korrelationskoeffizient.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Geschlecht

Esoterik – Geschlecht

CROSSTABS
/ TABLES = f43a f43b f43c f43d f43e f43f f43g BY
f68
/ FORMAT = AVALUE TABLES
/ STATISTICS = PHI
/ CELLS = COUNT ROW
/ COUNT ROUND CELL .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Geschlecht

Talisman ist am stärksten Abhängig

χ2 -Test Cramer-V
Yoga 0,000 0,206
Medidation 0,000 0,255
Talisman 0,000 0,374
Tischerlrücken 0,000 0,179
Mondphasen 0,000 0,316
alt. Medizin 0,000 0,262
Tarot, etc. 0,000 0,201

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Geschlecht

Daten sind abhängig

Jedes Wertepaar ist hochsignifikant von einander abhängig. Bei


Talisman zu Geschlecht ist die Abhängigkeit am höchsten. Um eine
Korrelation zu überprüfen kodiere ich „Talisman“ (und gleich auch
alle anderen) zu einer ordinal Skalierten Variable um. Danach lasse
ich mir zusätzlich den Spearman ausgeben.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Geschlecht

Ordinalisieren für Spearman

RECODE f43a f43b f43c f43d f43e f43f f43g (1=1)


(2=2) (3=3) (4 thru 5=4) ( ELSE = SYSMIS ) INTO
f43a_uk
f43b_uk f43c_uk f43d_uk f43e_uk f43f_uk
f43g_uk .
EXECUTE .

CROSSTABS
/ TABLES = f43a_uk f43b_uk f43c_uk f43d_uk
f43e_uk f43f_uk f43g_uk BY f68
/ FORMAT = AVALUE TABLES
/ STATISTICS = PHI CORR

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Geschlecht

Mädchen benutzen Talismänner öfter

Der Zusammenhang hat ein klein wenig abgenommen (Cramer: von


0,374 auf 0,368) und es ist einer mäßige negative Korrelation
(Spearman: –0,354) festzustellen. Das heißt: es besteht eine
Tendenz, dass Mädchen öfter Talismänner benutzen als Buben.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Bildung

Umkodieren

RECODE f73 (8=3) (9=4) (1 thru 4=1) (5 thru


7=2) INTO f73_uk .
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Bildung

Esoterik – Bildung

CROSSTABS
/ TABLES = f43a f43b f43c f43d f43e f43f f43g BY
f73_uk
/ FORMAT = AVALUE TABLES
/ STATISTICS = PHI
/ CELLS = COUNT ROW
/ COUNT ROUND CELL .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Bildung

Abhängigkeit bei „Yoga“ und „Medidation“


χ2 -Test Cramer-V
Yoga 0,017 0,106
Medidation 0,001 0,121
Talisman 0,893
Tischerlrücken 0,718
Mondphasen 0,414
alt. Medizin 0,113
Tarot, etc. 0,128
Es gibt eine geringe Abhängigkeit bei Yoga und Medidation. Bei den
anderen Wertepaaren gibt es keine signifikante Abhängigkeit. Sprich:
Man kann nicht sagen, dass das Tragen von Talismännern mit der
Bildung zusammen hängt.
Elementare Datenanalyse mit EDV
Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Esoterik – Ortsgröße

Esoterik – Ortsgröße

Es wird wie oben vorgegangen. Bei Yoga, Talisman, Tischerlrücken


und Tarot gibt es signifikante Abhängigkeiten. Sie sind alle sehr
gering. Korrelationen mit den ordinalisierten Variablen sind nicht
signifikant.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Typ, Skala, Index

1 Hausübung 1

2 Hausübung 2

3 Hausübung 3

4 Hausübung 4
Typenbildung
Skala: „Politisches Interesse“
Mit Skala testen
Zählindex
Elementare Datenanalyse mit EDV
Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Typenbildung

Typ mit politischem Interesse und Geschlecht

Aufgabestellung
Bilden Sie folgenden Typ (und lassen Sie sich anschließend eine
Häufigkeitsauszählung ausgeben): politisches Interesse ja/nein und
Geschlecht.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Typenbildung

IF OR AND =

Die Typenbildung erfolgt nach dem Schema: Wenn X ist a oder b


und Y ist c dann bilde einen Typen mit dem Wert d.
IF (( f1e = 1 OR f1e = 2) AND f68 = 1 ) Typ =1.
IF (( f1e = 1 OR f1e = 2) AND f68 = 2 ) Typ =2.
IF (( f1e = 3 OR f1e = 4) AND f68 = 1 ) Typ =3.
IF (( f1e = 3 OR f1e = 4) AND f68 = 2 ) Typ =4.
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Typenbildung

Typ überprüfen

Zur Sichheit machen wir noch eine Häufigkeitsauszählung.


FREQUENCIES VARIABLES = Typ
/ FORMAT = NOTABLE
/ ORDER = ANALYSIS .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Variablen finden
Aufgabestellung
Wählen Sie 5-8 Items aus dem Datensatz aus, die Ihrer Ansicht nach
dazu geeignet sind, das politische Interesse der befragten Personen
adäquat abzubilden.

f1e Wichtige Bereiche im Leben: Politik


f31c Zustimmung: Welt verantwortl. mitzugestalten
f31g Zustimmung: feste poltische Überzeugung
f56 Politikinteresse
f57 Sprechen Sie mit Freunden über Politik?
f58 Häufigkeit Konsum von polit. Nachrichten?
Elementare Datenanalyse mit EDV
Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Items: Richtung, Ausprägungen

Aufgabestellung
Achten Sie darauf, dass
die Items in die gleiche Richtung gepolt sind.
die Spannweiten der Items vergleichbar sind.
Ist dies nicht der Fall, korrigieren Sie dies durch entsprechende
Umkodierungen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Variablen rekodieren
Ich kodiere die Variablen um.
RECODE f1e (1=1) (2=2) (3=4) (4=5) (5=3)
( ELSE = SYSMIS ) INTO f1eSkala .
RECODE f31c f31g (1=1) (2=2) (4=5) (3=4) (5=3)
( ELSE = SYSMIS ) INTO f31cSkala f31gSkala .
RECODE f56 (1=1) (2=2) (3=3) (4=5) (5=3)
( ELSE = SYSMIS ) INTO f56Skala .
RECODE f57 (1=1) (2=2) (3=5) (4=4)
( ELSE = SYSMIS ) INTO f57Skala .
RECODE f58 (1 THRU 2 =1) (3=2) (4=4) (5=5)
(6=4) ( ELSE = SYSMIS ) INTO f58Skala .
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Reliabilitätsanalyse
Aufgabestellung
Führen Sie anschließend eine Reliabilitätsanalyse durch, um zu
prüfen, ob die Items für die Skalenbildung geeignet sind. Schließen
Sie wenn nötig Items, die der Qualität der Gesamtskala schaden,
schrittweise aus.

RELIABILITY
/ VARIABLES = f1eSkala f58Skala f57Skala
f56Skala f31gSkala f31cSkala
/ SCALE ( ’ ALL VARIABLES ’) ALL
/ MODEL = ALPHA
/ SUMMARY = TOTAL .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Skala berechnen

Ich entscheide mich alle Variablen in der Skala zu lassen. So verliere


ich weniger Fälle und das ist mir wichtiger als einen hohen Wert.
Aufgabestellung
Bilden Sie eine Skala mittels „COMPUTE“.

COMPUTE SkalaPolInt =( f1eSkala + f31cSkala +


f31gSkala + f56Skala + f57Skala + f58Skala )
/ 6.
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Mittelwert

Aufgabestellung
Berechnen Sie den Mittelwert der Skala und interpretieren Sie das
Ergebnis.

FREQUENCIES VARIABLES = SkalaPolInt


/ FORMAT = NOTABLE
/ STATISTICS = MEAN
/ ORDER = ANALYSIS .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Skala: „Politisches Interesse“

Mittelwert

Interpretation
Der Mittelwert von 3,2 bei möglichen Werten von 1–5 dass der
Mittelwert der Skala nahe dem Mittelwert der möglichen
Ausprägungen ist.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Mit Skala testen

Skala nach Geschlecht und Matura testen

Aufgabestellung
Prüfen Sie, ob sich das politische Interesse (gemeint ist hier die von
Ihnen gebildete Skala!) nach Geschlecht und bildung2 unterscheidet,
indem Sie einen geeigneten (parametrischen oder
nichtparametrischen) Test auswählen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Mit Skala testen

dichotom → Pearson

Beide unabhängigen Variablen sind dichotom und dürfen also wie


metrisch behandelt werden. Auch eine Skala darf wie metrisch
behandelt werden. Weiters darf in allen Fällen (God knows why) von
einer Normalverteilung ausgegangen werden. Also sind alle Kriterien
gegeben um den Pearson-Korrelationkoeffizenten verwenden zu
dürfen.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Mit Skala testen

negativer Zusammenhang

CORRELATIONS
/ VARIABLES = SkalaPolInt bildung2 f68 f69 /* mit
Alter zur Ü berpr ü fung */
/ PRINT = TWOTAIL NOSIG
/ MISSING = PAIRWISE .

Es gibt einen negativen Zusammenhang (Pearson: –0,284) zwischen


der Variablen politisches Interesse und Matura.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Mit Skala testen

Skala nach Geschlecht und Matura testen

Aufgabestellung
Interpretieren Sie das Ergebnis.

Interpretation
Bei Jugendlichen mit Matura steigt ist die Wahrscheinlichkeit, dass
Sie sich für Politik interessieren größer als bei Jugendlichen die kein
Matura haben. Man darf nicht vergessen, dass hier das Alter aus
dem Spiel genommen wurde. Es haben garnicht alle Jugendlichen
die Möglichkeit schon maturiert zu haben. Weiters korreliert das
Alter mit der Skala auch (Pearson: 2,12). Das Ergebnis sagt nicht
soviel aus, wie es auf den ersten Blick scheint.

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Zählindex

Zählindex bilden

Aufgabestellung
Bilden Sie aus nachfolgenden Items einen Zählindex um die
Religiosität der befragten Personen zu messen:
f38a: Religiöse Feier bei Kindesgeburt wichtig?
f38b: Feier bei Hochzeit wichtig?
f38c: Feier bei Beerdigung wichtig?
f40a: Glauben Sie an Gott?
f40c: Glauben Sie an die Hölle?
f40d: Glauben Sie an den Himmel?

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Zählindex

„ja“ zählen

Alle Variablen haben vier Ausprägungen: „ja“, „nein“, „weiß nicht“


und „k. A.“. Ich zähle die „ja“.
COUNT SkalaZRel = f38a f38b f38c f40a f40c
f40d (1) .
EXECUTE .

Elementare Datenanalyse mit EDV


Hausübung 1 Hausübung 2 Hausübung 3 Hausübung 4

Zählindex

Fast 50% ja

Aufgabestellung
Interpretieren Sie das Ergebnis!

Interpretation
Im Durchschnitt werden fast die Häfte aller Fragen der Skala
Religiösität mit „ja“ beantrwortet.

Elementare Datenanalyse mit EDV


Danke.

Elementare Datenanalyse mit EDV