Sie sind auf Seite 1von 76
Institut für Soziologie Professur für empirische Sozialforschung Prof. Dr. Johannes Ko pp Dr. Daniel Lois

Institut für Soziologie Professur für empirische Sozialforschung Prof. Dr. Johannes Kopp Dr. Daniel Lois

Einführung in die Mehrebenenanalyse

(und Anwendung in Mplus / SPSS)

Stand: März 2010

Inhaltsverzeichnis

1. Mehrebenenanalyse: Grundlagen

3

2. Mehrebenenanalyse in Mplus

26

3. Mehrebenenanalyse in SPSS

54

4. Exkurs: Fixed oder Random?

64

5. Hinweise

74

6. Literaturempfehlungen

76

Mehrebenenanalyse: Grundlagen

Eine Mehrebenenstruktur liegt vor, wenn Daten einer Analyseebene hierarchisch in einer zweiten geschachtelt sind

Die nächste Folie zeigt hierzu drei Beispiele: Personen (Ebene 1) sind der übergeordneten Ebene „Land“ oder „Haushalt“ zugeordnet

Auch Längsschnitt- bzw. Paneldaten lassen sich als Mehrebenendaten auffassen; hier entspricht Ebene 1 den Messzeitpunkten und die übergeordnete Ebene 2 sind Personen, bei denen eine Variable mehrfach gemessen wird

Die Beispiele beschränken sich auf 2 Ebenen; grundsätzlich sind jedoch auch komplexere Hierarchien mit 3 oder mehr Ebenen denkbar (z.B. Ebene 3 = Länder, Ebene 2 = Haushalte, Ebene 1 = Personen)

Mehrebenenanalyse: Grundlagen

Beispiel 1: Personen

g sich in Ländern (Ebene 2)

(Ebene 1)

ru pp

ieren

Beispiel 2: Personen (Ebene 1) gruppieren sich in Haushalten (Ebene 2)

Beispiel 3:

Messzeitpunkte (Ebene 1) gruppieren sich in Personen (Ebene 2)

Land 1 Person 1 Person 2
Land 1
Person 1
Person 2
Haushalt 1 Person 1 Person 2
Haushalt 1
Person 1
Person 2
Person 1 Zeitpunkt 1 Zeitpunkt 2
Person 1
Zeitpunkt 1
Zeitpunkt 2
Land 2 Person 3 Person 4
Land 2
Person 3
Person 4
Haushalt 2 Person 3 Person 4
Haushalt 2
Person 3
Person 4
Person 2 Zeitpunkt 1 Zeitpunkt 2
Person 2
Zeitpunkt 1
Zeitpunkt 2

Mehrebenenanalyse: Grundlagen

Wenn hierarchische Daten vorliegen, sind die einzelnen Beobachtungen auf Ebene 1 (z.B. Personenebene) nicht unabhängig voneinander, was bei der Datenanalyse zu berücksichtigen ist

Geschieht dies nicht, können Schätzungen von Zusammenhängen, Varianzen und Signifikanzniveaus verfälscht werden

Das folgende Skript beschäftigt sich einführend mit Verfahren zur Analyse von Mehrebenendaten; behandelt werden das Prinzip und die praktische Umsetzung in den Programmen Mplus und SPSS

Die Darstellung beschränkt sich auf 2 Ebenen, eine metrische abhängige Variable und Querschnittdaten

Erweiterungen (3 oder mehr Ebenen, Verfahren für dichotome AV, Multi- Level-Panelanalyse) sind der genannten Literatur zu entnehmen

Mehrebenenanalyse: Grundlagen

Mehrebenenanalysen sind vor allem zum Zweck der Analyse von Individuen in Gruppen entwickelt worden

Da z.B. Schüler in Schulklassen geschachtelt sind, muss die Leistung eines Schülers als Funktion von Einflüssen auf individueller Ebene (etwa kognitive Fähigkeiten) und auf Klassenebene (z.B. Erfahrung des jeweiligen Lehrers) analysiert werden

Merkmale auf Klassenebene sind für alle Schüler einer Klasse gleich, können sich aber zwischen Schulklassen unterscheiden

Daneben kann von Interesse sein, ob die Beziehungen zwischen Variablen auf der Individualebene auf Gruppenebene variieren und ob diese Variabilität durch Gruppenmerkmale erklärt werden kann

Mehrebenenanalyse: Grundlagen

Ein Beispiel: Es geht um den Zusammenhang zwischen sozialer Herkunft und Schulleistung für einen Datensatz mit 40 Personen aus zwei Schulklassen

Auf der folgenden Folie ist der positive Zusammenhang der beiden Variablen dargestellt; berechnet wurde eine einfache lineare Regression

Auf der Regressionsgeraden sind der Gesamtmittelwert (5,27) und die Steigung der Geraden (b = 1,61) eingetragen

Das einfache Regressionsmodell trifft die Wirklichkeit jedoch nicht bzw. führt zu falschen Schlussfolgerungen

Mehrebenenanalyse: Grundlagen

Mehrebenenanalyse: Grundlagen Quelle: Ditton (1998: 22) Mehrebenenanalyse 8

Quelle: Ditton (1998: 22)

Mehrebenenanalyse: Grundlagen

Es bleibt offen, ob bedeutsame Unterschiede zwischen den Schulklassen bestehen, wobei es hier mehrere Möglichkeiten gibt:

 

Zum einen kann das Leistungsniveau in den beiden Klassen unterschiedlich sein

Zum anderen kann auch der Zusammenhang zwischen sozialer Herkunft und Leistung in der einen Klasse stärker oder schwächer sein als in der anderen

Zu beiden Fragestellungen bietet die zuvor durchgeführte Analyse mittels einer einzigen linearen Regression keine Informationen; es besteht vielmehr die Gefahr, dass Unterschiede verdeckt geblieben sind

Mehrebenenanalyse: Grundlagen

Mehrebenenanalyse: Grundlagen Quelle: Ditton (1998: 24) Mehrebenenanalyse 10

Quelle: Ditton (1998: 24)

Mehrebenenanalyse: Grundlagen

Auf der vorangehenden Folie ist das Streudiagramm erneut dargestellt; diesmal sind jedoch – getrennt für beide Klassen – zwei Regressionsgeraden eingezeichnet und es werden gravierende Unterschiede deutlich:

Es ist zu erkennen, dass die Schüler aus der zweiten Schulklasse deutlich höhere Schulleistungen erzielen (der Mittelwert in Klasse 2 beträgt 7,45 gegenüber 3,10 in Klasse 1)

Der zweite Unterschied besteht darin, dass der Zusammenhang zwischen sozialer Herkunft und Schulleistung in Klasse 2 viel stärker ist (b = 2,80) als in Klasse 1 (b = 0,66)

Eine einfache Methode, um die Unterschiede zwischen den Klassen aufzuzeigen, ist die Berechnung von zwei getrennten Regressionen

Mehrebenenanalyse: Grundlagen

Der Unterschied zwischen den Schulklassen äußert sich dann a) in den unterschiedlichen Regressionskonstanten (intercepts) und b) in den unterschiedlichen Regressionsgewichten (slopes)

Diese Vorgehensweise wird bei steigender Zahl von Level 2-Einheiten unpraktikabel (Verfahren zur Mehrebenenanalyse sen dies eleganter), sie soll hier aus didaktischen Gründen jedoch vorläufig genügen

Wenn also Unterschiede zwischen den Klassen im Hinblick auf die Konstanten und die Regressionsgewichte bestehen stellt sich die Frage:

wie können diese Unterschiede erklärt werden?

Denkbar wäre, dass die Leistungsunterschiede zwischen den Klassen durch unterschiedliche kognitive Fähigkeiten der Schüler, also durch einen individuellen Faktor, erklärbar sind

Mehrebenenanalyse: Grundlagen

Über solche Erklärungen auf der Individualebene hinaus könnten aber auch Merkmale der Schulklassen selbst, z.B. des Lehrers oder des Unterrichts, für die Unterschiede zwischen den Klassen verantwortlich sein

Im Hinblick auf den unterschiedlichen Zusammenhang zwischen Herkunft und Leistung könnte es z.B. sein, dass durch Vorurteile der Lehrer Kinder aus oberen Schichten in der einen Klasse bevorzugt werden, in der anderen dagegen weniger stark

Damit entsteht eine Fragestellung, die eine Mehrebenenanalyse erfordert: Gibt es über den Effekt individueller Faktoren hinaus Bedingungen und Prozesse in den Schulklassen, die zu Unterschieden im Leistungsniveau oder zu einer größeren Selektivität beitragen?

Mehrebenenanalyse: Grundlagen

Das einfache Beispiel hat verdeutlicht: Analysen für hierarchisch strukturierte Daten, welche die Mehrebenenstruktur der Daten ignorieren, sind unbefriedigend und können irreführend sein

Zumindest müssen bei dieser Datenstruktur die folgenden beiden Fragen gestellt werden:

Gibt es Differenzen in den Mittelwerten der Level 2-Einheiten (Regressionskonstanten)?

Gibt es Differenzen in den Beziehungen zwischen den Variablen innerhalb der Level 2-Einheiten (Regressionssteigungen)?

Verfahren zur Mehrebenenanalyse können diese Fragen beantworten; ihr Grundprinzip ist, dass Phänomene auf unterschiedlichen Analyseebenen (Individual- und Aggregatebene) gleichzeitig untersucht werden

Mehrebenenanalyse: Grundlagen

Daten mit Mehrebenenstrukturen wurden lange Zeit mit suboptimalen Verfahren analysiert (dazu zählt z.B. die Aggregation oder Disaggregation der Daten, um Analysen auf nur einer Ebene durchzuführen können)

Seit den 1980er Jahren stehen leistungsfähige Verfahren zur Verfügung, die für hierarchisch strukturierte Datensätze angemessen sind

Behandelt werden im Folgenden Mehrebenenmodelle mit Zufallskoeffizienten (multilevel random coefficient modeling, MRCM)

Diese Verfahren kann man sich konzeptuell als eine Reihe geschachtelter Regressionsanalysen vorstellen, in denen die Koeffizienten einer Analyseebene zur abhängigen Variablen auf der nächsten Analyseebene werden (deshalb wird oft auch von hierarchischen linearen Modellen(HLM) gesprochen)

Mehrebenenanalyse: Grundlagen

Im Rahmen der „systems of equations“-Notation werden diese Modelle durch separate Gleichungen für jede Analyseebene beschrieben (so auch im Folgenden)

Die einfachsten Analysen, die als Nullmodell bezeichnet werden, modellieren nur den Mittelwert auf jeder Ebene (siehe Tabelle chste Folie, Modell 1)

In diesem Modell wird die kontinuierliche Variable Y für i Individuen in j Gruppen gemessen

Die Regressionskonstante (intercept) β 0j gibt den Mittelwert von Y für jede Gruppe j an

Die Variable Y wird auf Ebene 1 als Funktion der Regressionskonstante für jede Gruppe (β 0j ) und des Fehlers r ij modelliert; die Varianz von r ij entspricht der Varianz der abhängigen Variablen auf Ebene 1

Mehrebenenanalyse: Grundlagen

Klasse

Nr .

 

Gleichun en

g

Anmerkun g

Unkonditioniert

 

Level 1:

Y

ij

=β + r

oj

ij

Wird benutzt, um ICC zu berechnen

(„Nullmodell )

1

Level 2:

β

0 j

=γ + u

00

0 j

 
   

Level 1:

Y

ij

=β +β X + r

oj

1 j

ij

ij

 

2

Level 2:

β

0

j

=γ + u

00

0 j

Random

β =γ

1

j

10

Intercept

 
 

Level 1:

Y

ij

=β + r

oj

ij

Fokus liegt auf Erklärung von Unterschieden zwischen Level 2- Einheiten (z.B. Länder)

3

Level 2: β = γ + γ W + u

0 j

00

01

j

0 j

Mehrebenenanalyse: Grundlagen

Die Regressionskonstante β 0j wird in diesem Modell nur als Funktion des Gesamtmittelwertes (γ 00 ) und des Fehlers (u 0j ) modelliert; die Varianz von u 0j ist die Varianz der abhängigen Variablen auf Ebene 2

Die Gesamtvarianz von Y entspricht der Summe der Varianzen auf Ebene 1 und 2; Nullmodelle geben also – als erster Schritt in der Analyse – Aufschluss darüber, wie die Varianz auf die einzelnen Analyseebenen verteilt ist

Das Hauptinteresse wird jedoch meist auf Modellen mit Prädiktoren liegen

Die nächste Modellklasse wird unter dem Begriff Random Interceptzusammengefasst

Mehrebenenanalyse: Grundlagen

Ein solches Modell ist anzuwenden, wenn davon ausgegangen wird, dass es zwar Unterschiede im Y-Mittelwert zwischen den Level 2- Einheiten gibt (die intercepts also variieren), der Effekt einer oder mehrerer Level 1-Variablen X sich aber nicht zwischen den Level 2- Einheiten unterscheidet (siehe Folie 22)

In Modell Nr. 2 ist eine Individualvariable X als Prädiktor enthalten, die Level 2-Modellierung entspricht hier dem unkonditionierten Modell

Dieses Modell ähnelt einer einfachen OLS-Regression, das Subscript j zeigt allerdings, dass je ein Level 1-Modell pro Level 2-Einheit geschätzt wird

In Modell Nr. 3 wird eine Level 2-Variable W als Prädiktor verwendet; die Gleichung auf Level 1 entspricht dem Nullmodell

Mehrebenenanalyse: Grundlagen

In diesem Modell wird überprüft, ob der mittlere Y-Wert einer Level 2- Einheit mit dem Level 2-Prädiktor W zusammenhängt, indem die Signifikanz des γ 01- Koeffizienten getestet wird; erklärt werden sollen also Unterschiede zwischen Level 2-Einheiten

Die Modelle Nr. 3 und Nr. 4 erhöhen die Komplexität weiter, weil es nun einen Random Intercept und zusätzlich einen Random Slope gibt

Derartige „slopes as outcome“-Modelle sind anzuwenden, wenn man davon ausgeht, dass sich nicht nur Unterschiede im mittleren Y-Wert zwischen den Level 2-Einheiten ergeben, sondern dass zusätzlich der Effekt eines Level 1-Prädiktors X zwischen den Level 2-Einheiten variiert (zur Verdeutlichung siehe auch das Diagramm übernächste Folie)

Mehrebebenanalyse: Grundlagen

 

T yp

Nr .

 

Gleichun en

g

Anmerkun g

   

Level 1:

Y

ij

=β +β X + r

oj

1 j

j

ij

 

Intercepts und Slopes varrieren zwischen Level 2-Einheiten, diese Variabilität wird aber nicht durch L2- Prädiktoren erklärt

3

Level 2:

β 0 j

=γ + u

00

0 j

Random

I

t

n ercep

t +

β 1 j

=γ + u

10

ij

Random Slope

 

Level 1:

Y

ij

=β +β X + r

oj

1 j

j

ij

Level-1 Intercept und Slope werden als Funktion von Level 2- Variablen modelliert

4

Level 2:

β

0 j

=γ +γ W + u

00

01

j

0 j

β

1 j

=γ +γ W + u

10

11

j

1 j

Mehrebenenanalyse: Grundlagen

Mehrebenenanalyse: Grundlagen Quelle: Luke (2004: 12) Mehrebenenanalyse 22

Quelle: Luke

(2004: 12)

Mehrebenenanalyse: Grundlagen

In den Modellen Nr. 3 und Nr. 4 wird für jede der j Level 2-Einheiten ein Koeffizient β 1j (slope) geschätzt, der den Effekt von X auf Y in jeder Gruppe repräsentiert

In Modell Nr. 3 wird der Mittelwert der Regressionssteigungen durch γ 10 repsentiert; wenn dieser Koeffizient sich signifikant von Null unterscheidet, ist der mittlere Effekt von X auf Y signifikant

Sowohl β 0j (intercept) als auch β 1j (slope) werden als Zufallseffekte modelliert; entsprechend ist beiden ein Zufallsfehlerterm (u 0j , u 1j ) zugeordnet, der jeweils Auskunft über ihre (Residual-)Varianz gibt

In Modell Nr. 4 wird nun versucht, nicht nur die Unterschiede zwischen den Level 2-Einheiten bei den intercepts durch einen Level 2-Prädiktor W zu erklären, sondern auch die Unterschiede zwischen den slopes

Mehrebenenanalyse: Grundlagen

Dies bedeutet, dass Interaktionseffekte modelliert werden, nämlich Interaktionen von Prädiktoren auf der Individualebene und der Kontextebene (sog. „cross-level interaction“)

Konkret gibt die Stärke und Signifikanz des Effektes γ 11 darüber Auskunft, inwieweit der Effekt einer Level 1-Variablen X in Abhängigkeit der Level 2-Variablen W zwischen den Level 2-Einheiten variiert (siehe das Diagramm nächste Folie)

Alle zuletzt dargestellten Modelle tragen zudem der Tatsache Rechnung, dass die Level 1-Einheiten, die zu derselben Level 2-Einheit gehören, statistisch nicht unabhängig voneinander (d.h.: sich ähnlich) sind

Mehrebenenanalysen führen also – im Gegensatz zu einfachen OLS- Regressionen – zu einer unverzerrten Schätzung der Standardfehler und Signifikanzniveaus in hierarchischen Datensätzen

Mehrebenenanalyse: Grundlagen

Mehrebenenanalyse: Grundlagen Mehrebenenanalyse 25

Mehrebenenanalyse in Mplus

Nach der formellen Einführung soll das Verfahren nun anhand eines emprischen Beispiels erläutert werden

Die Datengrundlage bildet die 1999er-Welle des SOEP; hier stellen Personen Level 1 und Haushalte Level 2 dar, Personen sind also innerhalb von Haushalten gruppiert

Die abhängige Variable ist die allgemeine Lebenszufriedenheit (1 = sehr niedrig bis 10 = sehr hoch)

Folgende allgemeine soziodemografischen Variablen sind unabhängig:

Level 1: Alter, Bildung (casmin), Geschlecht, Ost/West, Familienstand

Level 2: Haushaltseinkommen (gewichtet), Wohnfläche des Haushaltes in qm, Kinder 0-1 Jahre im Haushalt (ja/nein), Anzahl der Kinder 2-4 Jahre im Haushalt

Mehrebenenanalyse in Mplus

Zur Durchführung von Mehrebenenanalysen stehen verschiedene Programmpakete zur Verfügung (spezialisierte Programme wie HLM und MLwiN sowie allgemeine Programme wie STATA, SAS, R, SPSS, Mplus); im Folgenden wird zunächst die Anwendung in Mplus erläutert

Zum Import der Daten in Mplus (z.B. aus SPSS) siehe die chste Folie

Zur Datenstruktur: Die Zeilen des Datensatzes stellen Personen dar, in einem Haushalt zusammen lebende Personen werden über eine gemeinsame Haushaltsnummer identifiziert; alle Personen mit missings wurden entfernt

Manche Mehrebenen-Programme (z.B. HLM) erfordern, dass Level 1- Prädiktoren und Level 2-Prädiktoren in separaten Dateien gespeichert werden; dies ist in Mplus oder SPSS nicht notwendig

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 28

Mehrebenenanalyse in Mplus

Der erste Analyseschritt ist die Überprüfung der Frage, ob die Anwendung eines Mehrebenenmodells überhaupt notwendig und angemessen ist

Neben verschiedenen grafischen Analysemöglichkeiten (siehe z.B. Luke 2004: 17ff), die sich vor allem bei einer überschaubaren Anzahl von Level 2-Einheiten anbieten, besteht ein formeller Test in der Berechnung des sog. Intraklassenkorrelationskoeffizienten (ICC)

Dieser gibt den Anteil der Level 2-Varianz an der Gesamtvarianz in der abhängigen Variablen wieder (σ u0 = Level 2-Varianz, σ r = Level 1- Varianz):

ρ

=

2

σ u 0

(

2

u 0

σ

+

σ

2

r

)

Mehrebenenanalyse in Mplus

Zur Berechnung des ICC in Mplus muss ein unkonditioniertes Modell (Nullmodell) geschätzt werden; die Syntax im entsprechenden Syntaxfile ist auf der nächsten Folie dargestellt

Mit „TYPE = TWOLEVEL“ wird festgelegt, dass eine Mehrebenenanalyse berechnet wird; mit CLUSTER = hhnrwird angegeben, dass die Level 2-Einheiten anhand der Haushaltsnummer (hhnr) zu indentifizieren sind

In Mplus wird das Modell getrennt für Ebene 1 (within, hier: Personen) und für Ebene 2 (between, hier: Haushalte) spezifiziert

Bei einem Nullmodell wird auf beiden Ebenen lediglich die abhängige Variable („zufried“) angegeben

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 31

Mehrebenenanalyse in Mplus

Auf der nächsten Folie ist der Teil des Outputs dargestellt, der grundsätzliche Informationen über die Datenstruktur liefert

Es gibt 7132 Level 2-Einheiten (Haushalte), die durchschnittliche Clustergröße beträgt 1,884 Personen. Im Durchschnitt leben also knapp 2 Personen in einem Haushalt

Der ICC beträgt für diesen Datensatz 0,477, knapp 50% der Varianz der Lebenszufriedenheit geht also auf Unterschiede zwischen Haushalten zurück; der Rest entfällt auf Unterschiede zwischen Personen

Würde der ICC einen Wert nahe 0 annehmen, wäre eine Mehrebenenanalyse nicht angemessen; in unserem Fall ist sie jedoch unbedingt erforderlich, da ein vergleichsweise großer Varianzanteil auf die Aggregatebene, d.h. die Haushaltebene, zurückgeht

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 33

Mehrebenenanalyse in Mplus

Die nächste Folie zeigt die Ergebnisse des Nullmodells:

Geschätzt wird nur ein fester Effekt, der Gesamtmittelwert der Lebenszufriedenheit (6,953); dies ist γ 00 in Modell Nr. 1 auf Folie 17

Außerdem werden die quadrierten Abweichungen der personenspezifischen Werte von diesem Gesamtmittelwert berechnet; dies ergibt in Summe die Level 1-Varianz zwischen Personen (1,673); dies ist r ij

Parallel werden die quadrierten Abweichungen der Haushaltsmittelwerte vom Gesamtmittelwerte berechnet; dies ergibt die Level 2-Varianz zwischen Haushalten (1,520); dies ist u 0j

Der ICC berechnet sich dann als: 1,520 / (1,520 + 1,673) = 0,477

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 35

Mehrebenenanalyse in Mplus

Der nächste Schritt besteht darin, Prädiktoren in das noch leere Modell aufzunehmen; wir beschränken uns zunächst auf Merkmale der Individuen (X) auf Ebene 1

Im Mplus-Input werden dazu im Menü „Variable“ die Merkmale Geschlecht, Alter, Bildung, Ost/West und Familienstand (mit der Referenz ledig) als within-Variablen definiert und auch unter „Model“ im within-Teil angegeben

Die Ergebnisse sind auf der übernächsten Folie dargestellt; ausgewiesen sind standardisierte Koeffizienten (Betas)

Die Regressionskoeffizienten (β

1j

f

in Modell Nr. 2 au Folie 17) zeigen

folgende Effekte: Ältere und geschiedene (im Vergleich zu ledigen) Personen sind signifikant unzufriedener, westdeutsche und

hochgebildete Personen signifikant zufriedener

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 37
Mehrebenenanalyse: Grundlagen Mehrebenenanalyse 38
Mehrebenenanalyse: Grundlagen
Mehrebenenanalyse
38

Mehrebenenanalyse in Mplus

Die Residualvarianz der Lebenszufriedenheit auf Ebene 1 (r ij in Modell Nr. 2 auf Folie 17) beträgt 0,934

Da es sich um standardisierte Ergebnisse handelt, sind die Level 1- und Level 2-Varianz auf 1 normiert; das R² auf Level 1 beträgt daher: 1-0,934 = 0,066; 6,6% der Unterschiede zwischen Personen werden also durch das Modell erklärt

Die standardisierte Varianz auf Level 2 (u 0j ) beträgt 1,0, da keine Erklärungsfaktoren auf Level 2 im Modell enthalten sind; Unterschiede zwischen Haushalten bleiben also unaufgeklärt

Mehrebenenanalyse in Mplus

Im nächsten Schritt werden nun auch Level 2-Prädiktoren (W) in das Modell eingefügt; hierbei handelt es sich um das Haushaltseinkommen, die Wohnfläche des Haushaltes und die Anzahl der Kinder im Haushalt

Diese Merkmale sind für alle Mitglieder eines Haushaltes gleich, sie können sich aber zwischen den Haushalten unterscheiden

Die Level 2-Prädiktoren (hhek2, wohn, k1, k2) werden im Menü „Variable“ als between-Variablen definiert und auch in der Modellspezifikation im between-Teil angegeben

Mehrebenenanalysein Mplus

Mehrebenenanalysein Mplus Mehrebenenanalyse 41
Mehrebenenanalyse: Grundlagen Mehrebenenanalyse
Mehrebenenanalyse: Grundlagen
Mehrebenenanalyse

42

Mehrebenenanalyse in Mplus

Im Output sind nun auch für die Level 2-Prädiktoren Regressions- gewichte angegeben; diese entsprechen γ 01 in Modell Nr. 3 auf Folie 17

Personen in Haushalten mit hohem Einkommen, mit großer Wohnfläche und mit Kindern im Alter von 0-1 Jahren sind hiernach signifikant zufriedener

Die standardisierte Residualvarianz auf Level 2 (u 0j ) beträgt nun 0,934; 6,6% der Unterschiede zwischen Haushalten werden also durch die Level 2-Prädiktoren erklärt

Auch auf Level 1 ergeben sich Unterschiede, da vor allem der Bildungseffekt nicht mehr signifikant ist. Effekte von Level 1-Prädiktoren lassen sich also durch Level 2-Prädiktoren erklären

Der Intercept (5,68) bezieht sich wie gewohnt auf den Fall, dass alle Level 1- und Level 2-Prädiktoren den Wert 0 annehmen

Mehrebenenanalyse in Mplus

Nun wird die Komplexität weiter gesteigert, in dem ein Modell mit Random Slope berechnet wird

In diesem Modell wird zugelassen, dass der Effekt des Lebensalters auf die Zufriedenheit zwischen den Haushalten variiert (die Varianz der Slopes zwischen Haushalten wird also geschätzt)

In der Mplus-Syntax ist bei Random Slopes unter „Analysis“ „TYPE = TWOLEVEL RANDOM“ anzugeben

Der Random Slope wird im within-Teil mit der Befehlszeile „s | zufried ON alter“ definiert, wobei s ein vom Benutzer frei wählbarer Name ist

Mehrebenenanalysein Mplus

Mehrebenenanalysein Mplus Mehrebenenanalyse 45

Mehrebenenanalyse in Mplus

Der Output ist auf der nächsten Folie dargestellt; eingegangen wird im Folgenden nur auf die neuen Elemente

Der mittlere Effekt des Alters auf die Zufriedenheit über alle Personen und Haushalte hinweg (γ 10 in Model Nr. 3 auf Folie 21) wird unter Means“ angegeben und beträgt b = -0,011

Der Sinn des Modells besteht nun darin zu testen, ob dieser mittlere Alterseffekt überzufällig zwischen den Haushalten variiert, ob es also eine signifikante Varianz der Slopes gibt

Dies ist der Fall: Die haushaltsspezifische Varianz des Slopes für den f

Effekt des Alters

auf die Zufriedenheit (u

ij in Modell Nr. 3 au Folie 21) ist

hochsignifikant (t = 11,562)

Mehrebenenanalyse: Grundlagen Mehrebenenanalyse
Mehrebenenanalyse: Grundlagen
Mehrebenenanalyse

47

Mehrebenenanalyse in Mplus

Der nächste Schritt besteht nun darin, die Varianz der Slopes zu erklären. Von welchen Haushaltsmerkmalen hängt es also ab, dass der Effekt des Alters in bestimmten Haushalten stärker oder schwächer ist?

Es wird die Hypothese formuliert, dass die Stärke des Zusammenhangs zwischen Alter und Lebenszufriedenheit davon abhängt, über wie viel Einkommen der Haushalt insgesamt verfügt

In Mplus wird dazu der über Haushalte variierende Effekt des Alters auf Zufriedenheit (s) durch den Level 2-Prädiktor Haushaltseinkommen erklärt („s on hhek2“); dies ist eine sog. cross-level-interaction

Mehrebenenanalyse in Mplus

Mehrebenenanalyse in Mplus Mehrebenenanalyse 49

Mehrebenenanalyse in Mplus

Der mittlere Effekt des Alters auf die Zufriedenheit über alle Personen und Haushalte hinweg (γ 01 in Model Nr. 4 auf Folie 21) wird nun unter „Intercepts“ angegeben und beträgt b = -0,011

Dieser Effekt bezieht sich zudem auf den Fall, dass das Haushaltseinkommen den Wert 0 annimmt

Da ein Haushaltseinkommen von 0 ein empirisch nicht vorkommender theoretischer Wert ist, wurde das Haushaltseinkommen um seinen Gesamtmittelwert zentriert (siehe Folie 50, der Befehl lautet „CENTERING = GRANDMEAN (hhek2)“)

Der mittlere Effekt des Alters auf Zufriedenheit von b = -0,011 bezieht sich also zudem auf ein mittleres Haushaltseinkommen

Mehrebenenanalyse: Grundlagen Mehrebenenanalyse
Mehrebenenanalyse: Grundlagen
Mehrebenenanalyse

51

Mehrebenenanalyse in Mplus

Der Effekt des Alters wird ferner tatsächlich tendenziell durch das Einkommen des Haushaltes moderiert, wie die cross-level-interaction (b = 0,002) zeigt (diese entspricht γ 11 in Model Nr. 4 auf Folie 21)

Der über alle Haushalte und bei mittlerem Einkommen negative Effekt des Alters wird also mit steigendem Haushaltseinkommen positiver; ein Level 2-Merkmal beeinflusst demnach tendenziell die Stärke des Effektes eines Level 1-Merkmals

Dennoch kann durch diese cross-level-interaction die Varianz der Slopes zwischen den Haushalten nicht sichtbar aufgeklärt werden:

Die Residualvarianz des Random Slope (u bleibt hochsignifikant (t = 11,549)

f

1j in Modell Nr. 4 au Folie 21)

Mehrebenenanalyse in SPSS

Im Folgenden wird anhand desselben Beispiels zur Lebenszufriedenheit kurz erläutert, wie Mehrebenenanalysen in SPSS durchgeführt werden; behandelt werden wie zuvor ein Null-, Random Intercept- und Random- Slope-Modell

Mehrebenenanalysen sind in SPSS seit Version 12 im Rahmen des MIXED-Moduls (gemischte Modelle) möglich

Im Folgenden wird die – für SPSS-Verhältnisse recht übersichtliche – Syntax vorgestellt; alternativ kann man die Modelle auch per Menü unter „Analysieren – gemischte Modelle“ klicken

Die folgende Folie zeigt, wie ein Nullmodell per Syntax angefordert wird

Mehrebenenanalyse in SPSS

MIXED zufried /RANDOM = INTERCEPT | SUBJECT(hhnr) /METHOD = ML /PRINT = G SOLUTION TESTCOV. EXECUTE.

Der übergreifende Befehl für Mehrebenenmodelle lautet „MIXED“, gefolgt von der abhängigen Variablen, die in SPSS nur metrisch sein darf

Mit der zweiten Befehlszeile wird festgelegt, dass der Mittelwert der Lebenszufriedenheit über verschiedene Level 2-Einheiten (Haushalte) variieren soll (Random Intercept)

Die dritte Befehlszeile fordert eine Maximum-Likelihood-Schätzung an

In der vierten Befehlszeile werden bestimmte Elemente des Outputs angefordert, die für die Berechnung des ICC benötigt werden

Mehrebenenanalyse in SPSS

Der auf der nächsten Folie dargestellte Output ist anders strukturiert als in Mplus, enthält aber dieselben Elemente und Ergebnisse:

Der Gesamtmittelwert der Lebenszufriedenheit (6,95) findet sich in der Tabelle „feste Parameter“

Die Varianz zwischen Personen (1,671) und zwischen Haushalten (1,522) können der Tabelle „Kovarianzparameter“ entnommen werden

Der ICC nimmt entsprechend erneut den Wert 0,477 an

Mehrebenenanalyse in SPSS

Schätzungen fester Parameter a

   

Standardf

Freiheits

   

Konfidenzintervall 95%

Parameter

Schätzung

ehler

grade

T-Statistik

Signifikanz

Untergrenze

Obergrenze

Konstanter Term

6,952630

,018752

6674,602

370,773

,000

6,915870

6,989389

a. Abhängige Variable: Lebenszufriedenh. gegenwaertig.

Schätzungen von Kovarianzparametern a

         

Konfidenzintervall 95%

Parameter

Schätzung

Std.-Fehler

Wald Z

Sig.

Untergrenze

Obergrenze

Residuum Konstanter Term

 

1,671727

,030000

55,724

,000

1,613950

1,731573

Varianz

1,522519

,046072

33,046

,000

1,434845

1,615550

a. Abhängige Variable: Lebenszufriedenh. gegenwaertig.

Intraklassenkorrelation (ICC): 1,522 / (1,671 + 1,522) = 0,477

Mehrebenenanalyse in SPSS

Auf der nächsten Folie wird per Syntax ein Random-Intercept-Modell mit Prädiktoren auf beiden Ebenen spezifiziert

Nach dem Befehl „MIXED zufried“ werden kategoriale Prädiktoren auf beiden Ebenen (in SPSS Faktoren genannt) nach dem Befehl „BY“ aufgelistet, während metrische Kovariaten nach dem Befehl WITH“ aufgeführt werden

Die für die einzelnen Prädiktoren auf beiden Ebenen zu schätzenden Regressionskoeffizienten werden in der Befehlszeile „/FIXED“ angefordert

Außerdem wird wieder festgelegt, dass die mittlere Lebenszufriedenheit zwischen Haushalten variieren soll (Zeile „/RANDOM = INTERCEPT“)

Mehrebenenanalyse in SPSS

MIXED zufried BY sex verheiratet geschieden verwitwet k1 ow WITH alter bild k2 hhek wohn /FIXED = sex verheiratet geschieden verwitwet k1 ow alter bildung k2 hhek wohn /RANDOM = INTERCEPT | SUBJECT(hhnr) /METHOD = ML /PRINT = G SOLUTION TESTCOV. EXECUTE.

Zur Wiederholung: Der Random Intercept ist kein fester, sondern ein zufälliger Effekt, weil eben nicht für jeden Haushalt die mittlere Lebenszufriedenheit „fixed“ (z.B. über eine Dummy-Variable pro Haushalt) geschätzt wird; berechnet wird vielmehr nur die Varianz der Intercepts, d.h. die Abweichungen der Haushaltsmittelwerte vom Gesamtmittelwert

Mehrebenenanalyse in SPSS

Die in SPSS geschätzten Effekte der Level 1- und Level 2-Prädiktoren (nächste Folie) entsprechen in ihrer Richtung den Mplus-Ergebnissen (Folie 43)

Die Abweichungen in der Höhe der Koeffizienten erklären sich dadurch, dass im Mplus-Output standardisierte Koeffizienten ausgewiesen wurden (Betas), im SPSS-Output dagegen unstandardisierte Koeffizienten; letztere stimmen exakt zwischen SPSS und Mplus überein

Die Abweichungen in der t-Statistik zwischen den beiden Programmen erklären sich dadurch, dass Mplus als Standard eine robuste ML- Schätzung verwendet, die für eine schiefe Verteilung der Variablen korrigiert wird

Wird in Mplus eine normale ML-Schätzung angefordert, sind auch die t- Werte in beiden Programmen exakt identisch

Mehrebenenanalyse in SPSS

Schätzungen fester Parameter b

   

Standardf

Freiheits

   

Konfidenzintervall 95%

Parameter

Schätzung

ehler

grade

T-Statistik

Signifikanz

Untergrenze

Obergrenze

Konstanter Term

6,377651

,196357

10303,12

32,480

,000

5,992753

6,762548

[sex=0]

-,037819

,023944

7745,809

-1,579

,114

-,084756

,009118

[sex=1]

0

a

0

.

.

.

.

.

[verheiratet=,00]

,052058

,045522

12676,69

1,144

,253

-,037171

,141287

[verheiratet=1,00]

0

a

0

.

.

.

.

.

[geschieden=,00]

,566820

,064023

13259,17

8,853

,000

,441327

,692314

[geschieden=1,00]

0

a

0

.

.

.

.

.

[verwitwet=,00]

,093584

,085340

12791,51

1,097

,273

-,073695

,260864

[verwitwet=1,00]

0

a

0

.

.

.

.

.

[k1=,00]

-,340744

,100781

6785,664

-3,381

,001

-,538307

-,143182

[k1=1,00]

0

a

0

.

.

.

.

.

[ow= 00]

- 416500

042431

6915 763

-9 816

000

- 499677

- 333323

,

,

,

,

,

,

,

,

[ow=1,00]

0

a

0

.

.

.

.

.

alter

-,008528

,001324

10658,35

-6,442

,000

-,011123

-,005933

bild

,003777

,006463

12837,28

,584

,559

-,008892

,016446

k2

,001271

,061218

6813,737

,021

,983

-,118736

,121278

hhek

,021623

,001679

7768,872

12,882

,000

,018333

,024913

wohnqm

,002725

,000488

6487,211

5,585

,000

,001769

,003682

a. Dieser redundante Parameter wird auf null gesetzt.

b. Abhängige Variable: Lebenszufriedenh. gegenwaertig.

Mehrebenenanalyse in SPSS

Schätzungen von Kovarianzparametern a

         

Konfidenzintervall 95%

Parameter

Schätzung

Std.-Fehler

Wald Z

Sig.

Untergrenze

Obergrenze

Residuum Konstanter Term

 

1,643688

,029523

55,675

,000

1,586830

1,702582

Varianz

1 346182

042927

31 360

000

1 264622

1 433003

 

,

,

,

,

,

,

a. Abhängige Variable: Lebenszufriedenh. gegenwaertig.

Kovarianzstruktur mit zufälligen Effekten (G) a

Konstanter

Term |

PHHNR

Konstanter Term | PHHNR

1,346182

Varianz-Komponenten

a. Abhängige Variable: Lebenszufriedenh. gegenwaertig.

Mehrebenenanalyse in SPSS

Abschließend wird demonstriert, wie ein Random Slope-Modell mit cross-level-interaction in SPSS spezifiziert wird; die entsprechende Syntax ist auf der nächsten Folie dargestellt

Das Ziel der Analyse besteht erneut in der Überprüfung der Frage, ob der Effekt des Alters auf die Zufriedenheit in Abhängigkeit vom Haushaltseinkommen variiert

Daher wird nun zusätzlich zum einen ein Interaktionseffekt zwischen Alter und Haushaltseinkommen unter „/FIXED“ angefordert (alter*hhek)

Zum anderen wird festgelegt, dass nicht nur der Intercept, sondern auch der Effekt des Alters auf Zufriedenheit zwischen Haushalten variiert („/RANDOM = alter | SUBJECT (hhnr)“)

Mehrebenenanalyse in SPSS

MIXED zufried BY sex k1 ow WITH alter bild k2 hhek wohn /FIXED = sex k1 ow alter bildung k2 hhek wohn alter*hhek /RANDOM = INTERCEPT | SUBJECT(hhnr) /RANDOM = alter | SUBJECT(hhnr) /METHOD = ML /PRINT = G SOLUTION TESTCOV. EXECUTE.

Die von SPSS für dieses Modell geschätzten Regressionskoeffizienten (nicht dargestellt) stimmen exakt mit den MPlus-Ergebnissen (Folie 52) überein

Exkurs: Fixed oder Random?

In der Mehrebenenanalyse können sowohl Fixed-Effects (FE)- als auch Random-Effects(RE)- Modelle geschätzt werden; im Folgenden wird kurz diskutiert, wo die Unterschiede liegen und wann welche Variante verwendet werden sollte

Gegeben ist als Beispiel eine Stichprobe von etwa 7.000 Frauen, die abhängige Variable ist das Haushaltsnettoeinkommen (bedarfsgewichtet) und die unabhängigen Variablen auf Level 1 sind das Bildungsniveau der Frau und ihre Autonomie beruflichen Handelns (Nichterwerbstätige = 0)

Das Level 2 wird über die Bundesländer definiert, die 7000 Frauen sind also gruppiert in 16 Level 2-Einheiten

Exkurs: Fixed oder Random?

Zum einen kann man nun ein Fixed Effects-Modell spezifizieren, indem man für jedes Bundesland bis auf eines (Referenz) eine Dummy- Variable in eine normale OLS-Regression aufnimmt

Die Effekte dieser Dummy-Variablen sind die Fixed Effects

Zum anderen kann wie weiter unten dargestellt wurde ein Random Effects-Modell spezifiziert werden, der Einfachheit halber zunächst ein Random Intercept-Modell

Hier werden die Mittelwertunterschiede zwischen den einzelnen Bundesländern wie beschrieben als eine zufällige Fehlerkomponente aufgefasst, deren Varianz geschätzt wird (Random Effect)

Exkurs: Fixed oder Random?

Wann sind nun Random Effects angemessen und wann sind ihnen Fixed Effects vorzuziehen? In der Literatur finden sich u.a. folgende Empfehlungen:

Wenn es sich bei den Level 2-Einheiten um eine reale oder hypothetische Stichprobe aus einer Population handelt und man inferenzstatistisch etwas über diese Population aussagen will, sind RE- Modelle vorzuziehen

Das FE-Modell erklärt, durch die Verwendung von Dummy-Variablen, alle Unterschiede zwischen den Level 2-Einheiten (hier: Bundesländer) auf (es bleibt also keine Varianz zwischen den Gruppen übrig)

Dies bedeutet, dass im FE-Modell keine Level 2-Prädiktoren gleichzeitig mit den Level 2 Dummy-Variablen in das Modell aufgenommen werden können; zur Analyse der Effekte von Level 2-Prädiktoren empfiehlt sich also ein RE-Modell

Exkurs: Fixed oder Random?

Im RE-Modell wird u.a. angenommen, dass die Level 1-Prädiktoren nicht mit den als zufällig definierten Level 2-Effekten korrelieren; dies hat vor allem Konsequenten für die Anwendbarkeit von RE-Modellen bei Panelanalysen:

RE-Modelle sind zwar grundsätzlich auch zur Analyse von Paneldaten geeignet (das im entsprechenden Skript genannte „Random Effects- Modell“ ist ein Random Intercept-Modell)

Die oben genannte Annahme (Unkorreliertheit von zufälligen Level 2- Effekten und Level 1-Prädiktoren) führt jedoch dazu, dass RE-Modelle nicht für Kausalanalysen eingesetzt werden sollten, da sie anfällig für Selbstselektion sind (die größere Teststärke von RE-Modellen ist hier ein schwaches Argument). Für Kausalanalysen mit Paneldaten sollten also FE-Modelle verwendet werden

Exkurs: Fixed oder Random?

Mehrebenenanalysen mit Zufallskoeffizienten (RE) wurden traditionell für die Anwendung mit sehr großen Stichproben entwickelt; in der Literatur finden sich bestimmte Minimalanforderungen an die Zahl der Level 2- Einheiten

Nach neueren Simulationsstudien werden für die Identifizierung von Kontexteffekten (Random Intercept) mindestens 30 Level 2-Einheiten und für eine korrekte Schätzung der Standardfehler mindestens 50 Level 2-Einheiten benötigt (Netzlek et al. 2006)

Bei wenigen Level 2-Einheiten wird empfohlen, FE- anstelle von RE- Modellen einzusetzen

Exkurs: Fixed oder Random?

Im Folgenden werden für das genannte Beispiel verschiedene Schätzvarianten mit RE und FE präsentiert; auf der nächsten Folie sind insgesamt vier Modelle dargestellt

Im ersten Modell (einer normalen OLS-Regression) wird die Mehrebenen-Struktur der Daten ignoriert, da Niveauunterschiede im Haushaltseinkommen zwischen Bundesländern gar nicht (weder mit FE oder RE) modelliert werden

Allerdings ist die Mehrebenen-Struktur eher schwach ausgeprägt, da laut Intraklassen-Korrelation nur etwa 3% der Gesamtvarianz auf Unterschiede zwischen den Bundesländern zurückgehen

Bei den Level 1-Prädiktoren zeigen sich positive Effekte des Bildungsniveaus und der beruflichen Autonomie

Exkurs: Fixed oder Random?

 

Standard-

OLS

OLS mit

BL D

-

ummys

OLS mit BL- D ummys + robuste SE

I

Random

t

n ercep

t

Fixed Effects

 

b-Koeffizient (t-Wert)

 

Intercept

1880,6

1949,4

1949,4

 

1782,7

Berufl. Autonomie

200,1

189,8

189,8

 

190,3

 

(22,3)

(21,5)

(12,9)

 

(21,6)

Bildungsniveau

50,3

 

70,9

70,9

 

69,9

 

(9,3)

(12,9)

(4,9)

 

(12,8)

Random Effects

 

Schätzer (z-Wert)

 

Intercept (BL)

-

 

-

-

 

45184

         

(2,6)

AV = Haushaltsäquivalenzeinkommen; N = 7209 Frauen

Exkurs: Fixed oder Random?

Im zweiten Modell werden zusätzlich für jedes Bundesland außer für eins Dummy-Variablen (also FE) in das Modell aufgenommen (Effekte der Dummys sind nicht dargestellt)

Dies bedeutet, dass nun die gesamte Ländervarianz, also Unterschiede im Haushaltseinkommen, die auf Unterschiede zwischen Bundesländern zurückgehen, kontrolliert wird

Die Effekte der Level 1-Prädiktoren verändern sich dahingehend, dass das Bildungsniveau nach Kontrolle von Level 2-Effekten an Bedeutsamkeit gewinnt, während der Netto- bzw. Individualeffekt der beruflichen Autonomie kleiner ist als der Effekt in Modell 1

Exkurs: Fixed oder Random?

Im dritten Modell werden zusätzlich robuste Standardfehler berechnet mit denen die Clusterung von Personen in Bundesländern berücksichtigt wird (verfügbar z.B. über die cluster-Option in STATA)

Während die Regressionskoeffizienten sich nicht verändern, ist eine deutliche Reduktion der t-Werte im Vergleich zu Modell 2 zu beobachten

Dies deutet darauf hin, dass Personen, die in demselben Bundesland leben, sich überzufällig ähnlich sind, was in Modell 2 offensichtlich zu einer Unterschätzung der Standardfehler führt

Da 16 Level 2-Einheiten streng genommen zu wenig für ein RE-Modell sind, wäre Modell 3 die für diesen Fall empfehlenswerte (konservative) Spezifikation

Exkurs: Fixed oder Random?

Im vierten Modell wird ein Modell mit Random Intercept berechnet, dessen Varianz (45184), trotz nur 16 Level 2-Einheiten, auf dem 1%- Niveau signifikant ist

Die Effekte der Level 1-Prädiktoren liegen im RE-Modell insgesamt deutlich näher am FE-Modell (3) als an der OLS-Regression ohne FE (Modell 1)

Inwieweit es bei den Level 1-Prädiktoren zu größeren Abweichungen zwischen der RE- und der FE-Spezifikation kommen kann, hängt auch davon ab, welcher Anteil der Gesamtv