Sie sind auf Seite 1von 10

SPSS einfhrende Erluterungen

SPSS ist ein Programm, mit dem sich sehr einfach auch groe Mengen von Daten bearbeiten
lassen.
Das Programm besteht aus drei Fenstern:
1. Dem Datenfenster, in dem die Daten eingegeben werden (data view) und in dem die
Variablen angeschaut und bearbeitet werden knnen (variable view).
2. Dem Outputfenster, in das smtliche Ergebnisse (und auf Anforderung auch smtliche
ausgefhrte Befehle) geschrieben werden.
3. Dem Syntaxfenster, in das Befehle geschrieben werden knnen. Man kann SPSS auch
ohne Kenntnis des Syntaxfensters ber das Pull-down-Men steuern. Dies hat aber
mehrere Nachteile, von denen die fehlende Nachvollziehbarkeit der Bearbeitungen der
grte ist. Man kann ber das Pull-down-Men Befehle ansteuern und diese dann ber
den Befehl paste in das Syntaxfenster kopieren, von wo aus sie dann gestartet werden
knnen.

Daten einlesen
Datenstze, die in anderen Programmen als SPSS erstellt wurden, knnen in SPSS importiert
werden.

Pull-Down-Men: File Open Data.

Anschlieend lsst man sich durch den Editor fhren.


Wichtig: Eingelesene Daten als unvernderlichen Ursprungsdatensatz speichern am
besten schreibgeschtzt.

DATEN VORBEREITEN
Benennung der Variablen und Benennung der eingegebenen Werte
Damit Variablen nicht nur mit den acht Buchstaben des Variablennamens gekennzeichnet
sind, kann man ihnen noch ein Label geben bzw. das Label verndern:
variable labels
sex Geschlecht der Versuchsperson.
Auch fr die einzelnen Zahlen, die man eingegeben hat, kann man noch die Bedeutung
eingeben.
value labels
sex 1 weiblich 2 mnnlich.
Man darf nicht vergessen, dem Computer zu sagen, welche Werte fehlende Werte bedeuten.
missing values sex (9).

Es macht Sinn, sich die deskriptiven Statistiken und die Hufigkeiten der einzelnen Items
anzuschauen.
des gdv01 gdv02.
freq gdv01 gdv02.
Besonders sollte man hier darauf achten, ob die angegebenen Werte auch plausibel sind, z.B.
sollte bei einer 1 bis 4 Skala nicht der Wert 5 auftauchen. Auch sollte man prfen, ob die
Mittelwerte plausibel sind. Hohe Mittelwerte knnen ein Hinweis darauf sein, dass missings
nicht richtig kodiert wurden.

Rekodieren von Werten


blicherweise teilt man hohe Zahlenwerte hohen Ausprgungen auf einer Variable zu.
Ein Beispiel:
trifft
vllig zu

trifft eher
zu

trifft eher
nicht zu

trifft
berhaupt
nicht zu

1. Ich bin mit meinem damaligen Leben zufrieden. Gdv02


2. Mein damaliges Leben war genau das richtige fr mich.Gdv03
3. Meine damaligen Lebensumstnde waren ausgezeichnet.Gdv04
4. Damals hatte ich alles Wichtige, das ich wollte.Gdv05

Bei diesen Fragen wurde bei der Eingabe der Wert 1 der Aussage trifft vllig zu zugeteilt.
Wir mchten dies gern ndern. Dazu bilden wir eine neue Variable, die wir rgdg02 nennen.
recode gdg02 (4=1) (3=2) (2=3) (1=4) into rgdg02.
exe.

Alle Befehle, die die Daten verndern, mssen mit dem Wort exe. (bzw. execute =
ausfhren) beendet werden
Wenn in einer Skala einige Items positiv, andere aber negativ formuliert sind, mssen
entweder die positiv oder die negativ formulierten Items rekodiert werden.

Faktorenanalyse (Hauptkomponentenanalyse)
Wenn Items oder Skalen hoch korrelieren, kann man sich natrlich fragen, ob sie wirklich
Verschiedenes messen oder doch nur das Gleiche. Ein Verfahren, das hier ntzlich ist, ist die
Faktorenanalyse.
Primres Ziel der Faktorenanalyse ist es, einem greren Variablensatz eine ordnende
Struktur zu unterlegen. Dabei werden die Variablen gem ihrer korrelativen Beziehungen in
wenige voneinander unabhngige Gruppen klassifiziert.
Faktor
Ist eine hypothetische Gre, die das Zustandekommen von Korrelationen zwischen
Variablen erklren soll (Unterschied zu varianzanalytischen Terminus Faktor als
unabhngige Variable). Wird ein Faktor aus den Variablen herauspartialisiert, ergeben sich

Partialkorrelationen, die diejenigen Variablenzusammhnge erfassen, die nicht durch den


Faktor erklrt werden knnen.
Eigenschaften der Faktorenanalyse
1. Die Faktorenanalyse ist ein datenreduzierendes Verfahren: viele mehr oder weniger
hoch korrelierte Variablen knnen durch wenige voneinander unabhngige Faktoren ersetzt
werden.
2. Die Faktorenanalyse ist ein heuristisches, hypothesengenerierendes Verfahren: es existiert
nicht nur eine mgliche Struktur der Variablen. Ausgehend von den Ergebnissen der FA
knnen Hypothesen ber Zusammenhnge formuliert werden
3. Die Faktorenanalyse ist ein Verfahren zur berprfung der Dimensionalitt komplexer
Merkmale. Messen die gewhlten Indikatoren zur Erfassung eines Merkmales ein
eindimensionales oder ein mehrdimensionales Konstrukt?
Kennwerte der Faktorenanalyse
1. Faktorwert: kennzeichnet die Position einer Person auf einem Faktor; beschreibt wie
stark das durch den Faktor reprsentierte Merkmal bei der jeweiligen Person
ausgeprgt ist.
2. Faktorladung: entspricht der Korrelation zwischen einer Variablen und einem Faktor.
Beschreibt wie gut eine Variable zu einer Variablengruppe passt.
3. Kommunalitt: gibt den Anteil der durch die Faktoren erklrten Varianz einer
Variablen an.
4. Eigenwert: gibt an wie viel von der Gesamtvarianz der Variablen durch einen Faktor
erklrt wird.
Kriterien fr die Anzahl der Faktoren
Ziel ist es Faktoren zu extrahieren, die die Gesamtvarianz hinreichend gut erklren, ohne dass
die Anzahl von Variablen und Faktoren gleich ist. Dafr werden meistens folgende Kriterien
verwendet.
Kaiser-Guttman-Kriterium:
Demnach werden nur Faktoren interpretiert deren Eigenwert grer ist als 1, denn nur dann
binden die Faktoren mehr Varianz als eine z-standardisierte Variable. Dieses Kriterium
berschtzt jedoch zumeist die Anzahl der bedeutsamen Faktoren.
Scree-Test
Im Eigenwertediagramm werden die Faktoren nach ihren Eigenwerten und ihrer Rangnummer
abgetragen. Man kann dabei den Zuwachs in der durch die Faktoren aufgeklrten Varianz
ablesen. Es werden diejenigen Faktoren als bedeutsam interpretiert, die vor dem Knick
liegen

Scree Plot

3,0

2,5

Eigenvalue

2,0

1,5

1,0

0,5

0,0
1

10

Component Number

Wir mchten im Folgenden herausfinden, ob die Zufriedenheit mit Vergangenheit, Gegenwart


und Zukunft wirklich voneinander unterscheidbar ist.

FACTOR
/VARIABLES gdv02 gdv03 gdv04 gdv05 gdz02 gdz03 gdz04 gdz05 gdg02 gdg03
gdg04 gdg05 /MISSING LISTWISE /ANALYSIS gdv02 gdv03 gdv04 gdv05 gdz02
gdz03
gdz04 gdz05 gdg02 gdg03 gdg04 gdg05
/PRINT INITIAL EXTRACTION ROTATION
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION .

Wir erhalten u.a. diese Tabelle. Sie zeigt, dass man drei Faktoren extrahieren sollte, weil die
Eigenvalues bei drei Komponenten ber 1 sind. (Es gibt allerdings auch alternative
Verfahren.)

Total Variance Explained


Initial
Eigenvalues
Componen
Total
% of Cumulativ
t
Varianc
e%
e
1
4,967 41,391
41,391
2
2,034 16,951
58,341
3
1,405 11,711
70,053
4
,654 5,453
75,505
5
,567 4,722
80,227
6
,470 3,914
84,142
7
,430 3,582
87,724
8
,359 2,994
90,718
9
,328 2,730
93,448
10
,303 2,525
95,972
11
,263 2,188
98,160
12
,221 1,840 100,000
Extraction Method: Principal Component Analysis.

Wir erhalten auerdem eine perfekte Ladungsmatrix:


Rotated Component Matrix
Component
1
,842

2
3
GDV02 Ich bin mit meinem damaligen Leben
zufrieden.
GDV03 Mein damaliges Leben war genau
,861
das richtige fr mich.
GDV04 Meine damaligen Lebensumstnde
,824
waren ausgezeichnet.
GDV05 Damals hatte ich alles Wichtige, das
,820
ich wollte.
GDG02 Ich bin mit meinem gegenwrtigen
,809
Leben zufrieden.
,849
GDG03 Das Leben, das ich derzeit fhre, ist
genau das richtige fr mich.
GDG04 Meine gegenwrtigen
,794
Lebensumstnde sind ausgezeichnet.
GDG05 Ich habe alles Wichtige, das ich will.
,783
GDZ02 Ich werde mit meinem zuknftigen
,774
Leben zufrieden sein.
GDZ03 Ich erwarte, dass mein zuknftiges
,773
Leben genau das richtige fr mich sein wird.
GDZ04 Meine zuknftigen Lebensumstnde
,791
werden ausgezeichnet sein.
GDZ05 Ich werde alles Wichtige haben, das
,743
ich will.
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser
Normalization.
a Rotation converged in 5 iterations.

Man wrde schreiben: Es wurden drei Faktoren (Eigenwerte 4.97, 2.03, 1.41) extrahiert. Es
wurde eine Varimax-Rotation vorgenommen, bei der alle Items auf den jeweils passenden
Faktoren ihre hchste Ladung hatten. Keine Nebenladung war hher als .30.

berprfen der Gte einer Skala


Hufig konstruiert man eine Skala aus mehreren Items. Wenn man wissen will, ob die Items
wirklich zusammenpassen, kann man dies ber eine Skalenanalyse testen. blich ist hierbei
die Errechnung des sogenannten Cronbachs Alpha, ein Ma fr die innere Konsistenz einer
Skala.
RELIABILITY
/VARIABLES= gdg02 gdg03 gdg04 gdg05
/FORMAT=NOLABELS
/SCALE(ALPHA)=ALL/MODEL=ALPHA
/STATISTICS=DESCRIPTIVE SCALE
/SUMMARY=TOTAL MEANS .
Erweist sich Cronbachs Alpha als hoch genug (ab .60 okay fr unsere Zwecke), knnen die
Items zusammengefasst werden. Wichtig ist hier auch die Betrachtung der Trennschrfen
(Korrelation des Items mit den anderen Items der Skala) der einzelnen Items. Als Faustregel
gilt ein Wert ab .32 als okay.
Im Ergebnisausdruck findet sich dann u.a. die folgende Angabe:
Reliability Coefficients
N of Cases =
Alpha =

116,0

N of Items =

,83

In einem Versuchsbericht kann man beispielsweise schreiben: Die Skala wies eine hohe
innere Konsistenz (Cronbachs = .83) auf.

Erzeugung neuer Variablen/ Skalenbildung


Wenn mehrere Items das gleiche Konstrukt erfassen (die Faktorenanalyse hat einen Faktor
ergeben, die Trennschrfen der Items liegen alle ber .32, Cronbachs liegt ber .60) , kann
man sie zu einer Skala zusammenfassen. Hier bilden wir eine Skala fr die gegenwrtige
Lebenszufriedenheit. Der Befehl besagt, dass die neue Variable gdg der Mittelwert aus den
4 Items der Lebenszufriedenheit ist, und zwar bei allen Personen, die mindestens 3 Items
beantwortet haben (daher mean.3).
compute gdg=mean.3(gdg02, gdg03,
exe.

gdg04, gdg05).

Wie bereits dargestellt, knnen wir diese Skala benennen.


variable labels
gdg "Diener Lebenszufriedenheit Gegenwart".

Mit dem compute-Befehl haben wir eine neue Variable erzeugt (einen Wert fr die
Lebenszufriedenheit der Versuchsteilnehmer), die den Mittelwert von vier Einzelitems
darstellt.

Zusammenfassung der Daten: Hufigkeiten und Mittelwerte


Folgendes Kommando zeigt uns, wie viele Frauen und Mnner am Versuch teilgenommen
haben.
frequencies sex.
Um den Mittelwert beispielsweise des Alters zu bekommen, whlen wir
descriptives alter.
Auch fr die gebildeten Skalen knnen wir und Mittelwerte und Hufigkeiten angeben lassen:
des gdg.
freq gdg.

AUSWERTUNG DER DATEN


Vergleich von mehreren Gruppen (Mittelwertsvergleiche)
Fr viele Forschungsfragen braucht man die Funktion Analyze/Compare Means. Hier kann
man beispielsweise zwischen t-test (meist verwendet bei 2 Gruppen) und Varianzanalyse
whlen. Wir untersuchen als nchstes, ob sich die bereichsspezifische Lebenszufriedeneheit
von Mnnern und Frauen unterscheidet. Wir benutzen die folgenden Fragen, wobei die
Antwortskalen zuerst invertiert werden.
Wie zufrieden sind Sie zur Zeit

sehr
zufrieden

eher
zufrieden

1. mit Ihrer Freizeit und Freizeitgestaltung?


2. mit Ihrem Sexualleben?

eher
sehr
unzufrieden unzufrieden

recode glzu01 to glzu07 (4=1) (3=2) (2=3) (1=4).


exe.
ONEWAY
glzu04 glzu07 BY gsex
/STATISTICS DESCRIPTIVES HOMOGENEITY
/MISSING ANALYSIS .

Hier wird also eine einfaktorielle Varianzanalyse gerechnet, wobei die zwei Geschlechter
(Variable gsex) auf Unterschiede bei den Lebenszufriedenheitsskalen untersucht werden.
Zuerst bekommen wir wenn wir es angefordert haben die Mittelwerte und
Standardabweichungen ausgedruckt (der Rest interessiert uns zunchst nicht).
N

Mean

95%
Std. Std. Error
Confidenc
Deviatio
e Interval
n

GLZU04 mit Ihrer Frauen


Freizeit und
Freizeitgestaltung?
Mnner
Total
Total

for Mean
Lower
Bound
1,85E-02
2,75

1530

2,78

,72

854
2384
2381

2,94
2,84
2,74

,69 2,38E-02
,72 1,47E-02
,96 1,97E-02

2,89
2,81
2,70

Upper
Bound
2,82

2,98
2,87
2,78

Wir lesen also ab, dass die Mnner hinsichtlich ihrer Freizeitgestaltung den Wert von M =
2.94 (SD = 0.69) haben, whrend der Wert bei Frauen bei M = 2.78 (SD = 0.72). Ist dieser
Unterschied signifikant? Das sehen wir in der folgenden Tabelle:
ANOVA
GLZU04 mit Ihrer
Freizeit und
Freizeitgestaltung?

Sum of
Squares
12,871

df
1

Mean
Square
12,871

Within 1209,981
Groups
Total 1222,852

2382

,508

Between
Groups

Sig.

25,338

,000

2383

Der F-Wert dieses Vergleichs ist sehr hoch (25.34) und bei den vorhandenen Freiheitsgraden
(1 zwischen den Gruppen, 2382 innerhalb der Gruppen) signifikant (.000). Man wrde
schreiben: Es ergab sich ein signifikanter Mittelwertsunterschied, F(1,2382) = 25.34, p <
.001. Bei t-Tests luft das fast analog.

Korrelationen
Auch Korrelationen finden sich unter dem Programmpunk Analyze. Wir untersuchen z.B., ob
eine Zufriedenheit mit der Gegenwart mit einer hohen Lebenszufriedenheit hinsichtlich der
Vergangenheit korreliert.
correlate gdv gdg gdz.
Wir finden folgendes Ergebnis:
Correlations
GDV Diener
Lebenszufrie
denheit
Vergangenh
eit
1,000

GDG Diener
Lebenszufrie
denheit
Gegenwart
,391

GDZ Diener
Lebenszufried
enheit Zukunft
,289

,000

,000

GDV Diener
Lebenszufriedenheit
Vergangenheit

Pearson Correlation
N

2384

2376

2368

GDG Diener
Lebenszufriedenheit
Gegenwart

Pearson Correlation

,391

1,000

,467

Sig. (2-tailed)

,000

,000

2376

2384

2368

Pearson Correlation

,289

,467

1,000

Sig. (2-tailed)

,000

,000

2368

2368

2375

GDZ Diener
Lebenszufriedenheit
Zukunft

Sig. (2-tailed)

Im Bericht knnte man schreiben: Die Lebenszufriedenheit hinsichtlich der Vergangenheit


korreliert signifikant positiv mit der Lebenszufriedenheit hinsichtlich der Gegenwart, r = .39
(p < .001).

Regressionsanalyse
Will man wissen, inwieweit eine Variable von einer anderen beeinflusst ist (im Sinne einer
kausalen Beeinflussung), kann man eine Regressionsanalyse rechnen. Allerdings muss man
mit der Behauptung von Kausalitt sehr vorsichtig sein.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT gdg
/METHOD=ENTER glzu01 glzu02 glzu03 glzu04 glzu05 glzu06 glzu07

Wir schauen gleich auf das zentrale Ergebnis: Alle Bereiche (bis auf die Gesundheit) tragen
zu Lebenszufriedenheit bei. Man sieht das an der Gre der Beta-Gewichte und/bzw. an den
Signifikanzen.

Coefficientsa
Standardi
zed
Coefficien
ts

Unstandardized
Coefficients
Model
1

B
4,929

Std. Error
,069

t
71,180

Sig.
,000

GLZU01 mit Ihren


sozialen Beziehungen
(Partner, Familie,
Freunde, Bekannte etc.)?

-,212

,017

-,226

-12,492

,000

GLZU02 mit Ihrem Beruf,


Ihrer Ausbildung oder
Ihrem Studium?

-,268

,014

-,311

-18,848

,000

GLZU03 mit Ihrer


Gesundheit?

-2,78E-02

,016

-,029

-1,743

,081

GLZU04 mit Ihrer Freizeit


und Freizeitgestaltung?

-5,58E-02

,015

-,062

-3,732

,000

GLZU05 mit Ihrer


finanziellen Situation?

-,128

,012

-,163

-10,297

,000

GLZU06 mit sich selbst


als Person?

-,217

,018

-,209

-11,752

,000

-5,82E-02

,012

-,087

-5,019

,000

(Constant)

GLZU07 mit Ihrem


Sexualleben?

Beta

a. Dependent Variable: GDG Diener Lebenszufriedenheit Gegenwart

bersichtlicher ist es natrlich, wenn man dieses Ergebnis in die Form einer Graphik bringt
(z.B. mit Excel).

Durch welche Aspekte wird die allgemeine


Lebenszufriedenheit besonders beeinflusst?
Sexualitt
Persnliche Entwicklung
Finanzen
Freizeit
Gesundheit
Beruf/ Ausbildung/ Studium
Soziale Beziehungen
0

0,05

0,1

0,15

0,2

0,25

0,3

Bedeutung der einzelnen Faktoren

0,35