Sie sind auf Seite 1von 13

4

1. Einleitung

Charakteristikum von Mehrebenenanalysen:

Zahlreiche Datensätze, die in der sozialwissenschaftlichen Forschung analysiert werden,


haben eine hierarchische Struktur. Sehr häufig liegen Variablen für Untersuchungseinheiten
vor, die in natürlicher Weise übergeordneten Einheiten (Einheiten höherer Ordnung)
zugeordnet werden können. Ein anschauliches Beispiel dafür sind Daten für einzelne Schüler,
die nach den Schulklassen oder Schulen, die sie besuchen, zusammengefasst werden können.

Im Sinn eines statistischen Verfahrens kann von einer Mehrebenenanalyse dann gesprochen
werden, wenn Gegenstände verschiedener Ordnung in einer Analyse simultan verrechnet
werden und somit hinsichtlich der Wirkungen auf eine abhängige Variable neben Merkmalen
der individuellen Einheiten auch Merkmale kollektiver Einheiten Berücksichtigung finden.
Anwendungsfälle für Mehrebenenanalysen sind folglich Datensätze mit einer hierarchischen
Struktur, bei denen Daten für individuelle und kollektive Einheiten vorliegen, die in Bezug
aufeinander zu analysieren sind. In der Regel wird als abhängige Variable ein
Individualmerkmal (z.B. die Schulleistung von Schülern) untersucht, zu dessen Erklärung
bzw. Vorhersage weitere Individualmerkmale (z.B. Motivation, schulische Einstellungen) und
zudem noch Merkmale der Einheiten einer höheren Ordnung (z.B. des Unterrichts in der
Schulklasse, Merkmale der Schule, des Wohngebietes) herangezogen werden.
(http://www1.ku-eichstaett.de/PPF/PaedagogikI/allgphdx.htm)

In einer Mehrebenenanalyse können untersucht werden:

• Effekte von Individualvariablen (z.B. Geschlecht, Alter, sozialer Status).

• Effekte von Aggregatvariablen (Merkmale von Schulklassen, Schulen, Wohngebieten,


Gemeindeklassen).

• Das Zusammenwirken von Aggregat- und Individualvariablen.

Die Mehrebenenanalyse ist eigentlich eine Erweiterung zur einfachen Regressionsgleichung.


Sie bietet im Gegensatz zur Regressionsanalyse den Vorteil, Kontexteffekte, sprich
Unterschiede zwischen Klassen und zwischen Schulen berücksichtigen zu können.
Die Residualgrößen, d.h. „der Teil der Abweichung des beobachteten y-Wertes vom
Mittelwert aller Beobachtungswerte“ sind Kernstücke der Mehrebenenanalyse.
5

Um die Gleichungen und Untersuchungen meiner Arbeit besser verständlich zu machen,


möchte ich kurz eine einfache Regressionsgleichung interpretieren.
yi = ß0 + ß1x1i + ei
y = Responsevariable ß0 = Regressions-intercept
ß1 = Steigung x1 = Prädiktor für Schüler i ei = Residual ( Rest)

2. Forschungsfrage:

Ich werde in meiner Arbeit die Mehrebenenanalyse in ihren unterschiedlichen Punkten


behandeln. Der Datensatz, mit welchem ich arbeiten werde beinhaltet Daten von 19 Schulen,
56 Klassen und 930 Schülern.

Ich werde jedoch kein 3-Ebenen, sondern ein „ 2-Ebenenmodell untersuchen, d.h. ich
behandle nur Unterschiede zwischen Klassen und Unterschiede zwischen Individuen. Ich
habe es mit Prädiktoren wie Mathenoten, Gesamtnoten, Lehrerurteil usw. zu tun. Die
einzelnen Schritte der Mehrebenenanalyse werde ich im Hinblick auf folgende
Forschungsfrage untersuchen.

„ Gibt es beim Random-Slope-Modell und beim Random-Intercept-Modell Unterschiede


bezüglich der Outlierklassen?

In statistics, an outlier is a single observation "far away" from the rest of the data.
(vgl.www.wikipedia.at)
Outlier sind so genannte “ Ausreißer”, Daten bzw. Werte, die sich von anderen Werten
hervorheben, bzw. aus der Menge herausstechen. Ich untersuche nun den Unterschied der
„Outlier“ bezüglich der Klassen aus meinem Datensatz zwischen dem Random-intercept und
dem Random-slope-modell.

Nun werde ich im Hinblick auf meine Forschungsfrage einige Modelle und Grafiken der
Mehrebenenanalyse am Computer errechnen und interpretieren.
Manche Schritte betreffen auch solche Modelle, in denen noch keine Outlier berechnet
werden und ich sie daher auch noch nicht interpretiere.
6

3. Mehrebenenanalyse

Nachdem ich meinen Datensatz, der aus 20 Variablen besteht vom SPSS nach MLwin
transferiert habe, werde ich als erstes ein Nullmodell erstellen. Die Responsevariable( y-
achse) dieser Gleichung stellen hier die Mathenoten 98 dar. Beim Nullmodell gibt es noch
keine Steigung, sondern nur ein Regressions-intercept (siehe Nullmodell, ß0 cons). Daher
haben wir hier auch noch keinen Prädiktor.

Nullmodell:

Grafische Darstellung des Nullmodells:


7

Diese Grafik zeigt alle 56 Klassen aus dem Datensatz. Die Geraden sind deswegen alle
parallel zur x-Achse, weil das Nullmodell noch keine Steigung hat. Wie sich jedoch erkennen
lässt sind die Regressionsgeraden nicht alle gleich lang. Dies lässt sich folgend interpretieren:
Je länger die Regressionsgerade, desto heterogener die Klasse → Je kürzer, die Gerade, umso
homogener die Klasse.

Als nächsten Schritt gehe ich vom Nullmodell über in das Random-interceptmodell.
Das Random-intercept-modell bedeutet folgendes:
Es wird nun für jede Klasse ein Intercept berechnet. Im Gegensatz zum Nullmodell gibt es in
dieser Gleichung eine Steigung, jedoch wird sie bei allen Klassen konstant gehalten.
Die Responsevariable sind wiederum die Mathenoten 98. Da wir jedoch im Random-intercept
eine Steigung haben, obgleich sie für alle Klassen gleich ist, gibt es hier einen Prädiktor,
nämlich Mathenoten 97 zentriert.

Random-Intercept-Modell:
8

Grafische Darstellung des Random-intercept:

Wiederum sieht man hier die


Regressionslinien der 56 Klassen.
Diesmal erhält jede gerade eine
Steigung, jedoch dieselbe. Daher bleiben
die Geraden zueinander parallel. Anhand
der Länge der Linien lässt sich abermals
feststellen, wie homogen bzw. heterogen
eine Klasse ist. Die Homogenität zeugt
davon, dass in der Klasse ein
ausgleichender Mathematikunterricht
stattfindet.

Da ich nun das erste Random-intercept-modell errechnet habe, kann ich genauer auf meine
Forschungsfrage eingehen. Um ersten Aufschluss über die Outlierdaten zu bekommen,
möchte ich sie mir im bereits errechneten Random-intercept- Modell anschauen.

Da es sich bei den Outlierdaten um Daten handelt, die Ausreißer darstellen bzw. sich vom
Rest der Werte sei es positiv oder negativ hervorheben beziehe ich mich im nächsten Schritt
nur auf Solche. Ich untersuche den Unterschied zwischen den Klassen, daher stelle ich nun
fest, welche die beste und welche die schlechteste Klasse ist.

Klasse 41. Abstand 2.3686 Rang 56.000

Klasse 52. Abstand -2.3686 Rang 1.0000

Interpretation:
Da beim Random intercept Modell nur die Intercepte der einzelnen Klassen berechnet werden
die Steigungen aber konstant gehalten werden, haben alle Klassen die gleichen Steigungen.
9

Klasse 41 stellt mit dem Rang 56 die beste Klasse dar, Klasse 52 mit dem Rang 1 die
schlechteste.
Jedoch lässt sich bei Vergrößerung der Grafik zum RI-Modell feststellen, dass die Klasse 41
eine kürzere Regressionslinie hat, d.h. sie ist also heterogener, als Klasse 52.
Der Abstand der Klasse 41 von der General Line beträgt 2.3686 und der Abstand der Klasse
52,-2.3686. Dies bedeutet beide Klassen sind gleich weit von der General Line entfernt. Der
einzige Unterschied besteht darin, dass Klasse 41 oberhalb und Klasse 52 unterhalb der
General Line liegt.
Somit lässt sich allgemein für das Random Intercept Modell besagen, dass Klasse 41 die
modellhafte Klasse darstellt und Klasse 52 zu intervenieren wäre.

Ich werde bei meinen weitern Berechnungen mich auf die Klassen 41 und 52 konzentrieren
und ihre Veränderungen bezüglich der Änderungen vom Modell interpretieren.

Der nächste Schritt stellt die Erweiterung des Random-intercept-modell um die


Dummyvariablen dar. Dummyvariablen sind nominalskalierte Variablen, die keine Steigung,
sondern eine Differenz.( wie. Z.b. Geschlecht)

Random-intercept-modell mit Dummyvariablen:


10

Grafische Darstellung RI-Modell mit Dummyvariablen:

Bei der Erweiterung der Gleichung um die Dummyvariablen ergibt sich folgende
Veränderung in Bezug auf die Outlierklassen.

Klasse 41: Intercept 1.1080 Rang 49.000

Klasse 52: Intercept -2.3686 Rang 1.0000

Interpretation:
Klasse 41 verliert um sieben Positionen ihren 56 Rang und steht jetzt auf dem Rang 49. Ihr
Abstand zur General Line hat sich von 2.3686 auf 1.1080 verringert. Dies bedeutet, sie ist nun
nicht mehr die beste Klasse. Die beste Klasse ist nun Klasse 38 logischerweise mit dem 56
Rang und dem Abstand, 2,3686.
Klasse 52 hingegen bleibt auf dem Rang 1 und somit die schlechteste Klasse.
Somit ergibt sich beim Random-intercept Modell mit Dummyvariablen eine kleine Änderung.
Der beste Platz wechselt von der 41. auf die 38 Klasse. Der schlechteste Platz bleibt gleich
mit der Klasse 52
11

Im nächsten Schritt werde ich das Random-intercept-Modell um einige Prädiktoren, welche


ich auswähle verändern. Ich habe alle Prädiktoren meines Datensatzes ausgewählt, weil ich
denke, dass hierbei die interessantesten Werte von Outliern zustande kommen.

Random-intercept-Modell mit allen Prädiktoren:

Grafische Darstellung des RI-Modell mit allen Prädiktoren:


12

Natürlich interessieren mich bei der Erweiterung dieser Gleichung auch die Veränderung der
Outlierdaten.

Klasse 41: Abstand 0.82264 Rang 45.000

Klasse 52: Abstand -2.3686 Rang 1.0000

Interpretation:

Die Klasse 41 verliert weitere Plätze und sinkt auf den Rang 45. Der Abstand zur General
Line wird immer weniger, da sich die Klasse immer mehr dem Durchschnitt annähert. Klasse
38 ist bleibt bei der Erweiterung der Gleichung die beste Klasse.
Mit dem Rang 1 und dem Abstand -2.3686 von der General Line bleibt die Klasse 52 trotz der
Erweiterung um alle im Datensatz vorhandenen Prädiktoren die schlechteste Klasse.
Resümee: Aus den bisherigen drei unterschiedlichen Gleichungen ist und bleibt Klasse 52 die
schlechteste Klasse.

Mein letzter Schritt mit dem ich auf meine Forschungsfrage eingehe, ist das Random-Slope-
Modell. Im Gegensatz zum Random-intercept-Modell können nicht nur die Intercepte der
einzelnen Klassen variieren, sondern auch die Steigungen. Das bedeutet die Steigungen
können verschiedene Zahlenwerte annehmen. Diese Veränderung vom Random-intercept-
modell zum Random-slope-modell in Hinblick auf Änderung der Outlier ist meine eigentliche
Forschungsfrage.
So interessiert es mich nun am meisten, ob sich die beiden Modelle unterschiedlich auf die
Outlier auswirken.
UM am besten zwischen RI und RS bezüglich der Outlier unterscheiden zu können werde ich
ebenfalls ein Random-slope-modell mit allen im Datensatz vorhandenen Prädiktoren erstellen.
13

Random-Slope-Modell mit allen Prädiktoren:

Grafik zum Random- slope mit Varianzfunktion:

Die erste Abbildung zeigt nun verschiedene Steigungen der Klassen, dass bedeutet folgendes:
Je steiler die Kurve, desto mehr sind die Testpunkte des diesjährigen Mathetests, von den
Testpunkten des Vorjahres abhängig. Die beste Klasse sollte daher eine geringe Steigung und
14

eine möglichst kurze Regressionslinie haben. Dies würde dann bedeuten, dass ein
ausgleichender Mathematiktest stattfindet und die Klasse nicht sehr selektiv ist.
Klasse 52 : Abstand -2.3686 Steigung -0.70286 Rang 1.0000 14.000

Klasse 41: Abstand 0.88715 Steigung 0.29518 Rang 46.000 35.000

Klasse 38: Abstand 1.6992 Steigung 1.6992 Rang 54.000 54.000

Interpretation:
Laut Random-slope-Modell liegt Klasse 52 auf dem 14. Rang, d.h. auch im Random-slope-
modell wird diese Klasse als eher schlechte Klasse eingestuft; Allerdings nicht als
schlechteste Klasse, sowie im Random-intercept-Modell. Der Abstand zur General Line
jedoch liegt bei gleich bleibenden -2.3686, somit einem negativen Abstand. Klasse 52 hat
zudem eine negative Steigung von -0.70286.
Laut Random-slope-modell wird die Klasse 41 wesentlich schlechter eingestuft als beim
Random-intercept, nämlich auf den 35. Rang. Nach dem Random-slope wäre die Klasse 41
eine durchschnittsklasse und nicht eine bessere Klasse. Ihre Steigung ist mit 0.29518 ziemlich
gering.
Klasse 38 hingegen wird sowohl vom Random-slope, als auch vom Random-intercept mit
dem Rang 54 als eine sehr gute Klasse eingestuft. Sie hat eine eher höhere Steigung von
1.6992.
Abschluss zu meiner Forschungsfrage:
Anhand der beiden Modelle lässt sich nun nicht genau sagen, welche Klasse wirklich besser
ist. Man kann aber feststellen, dass die Klassen meist unterschiedlich eingestuft wurden, trotz
dem, dass bei beiden Gleichungen mit allen Prädiktoren des Datensatzes gerechnet wurde.
Gleiche Ergebnisse erzielen die beiden Modelle eigentlich nur für die Klasse 38 und zwar
dahingehend, dass sie eine der besten Klassen darstellt.

Als letzten Punkt in der Mehrebenenanalyse möchte ich ein Random-intercept- Modell mit
einer nicht kognitiven Responsevariablen durchführen. Hierfür wähle ich die responsevariable
„Angst“. Auch wenn dies meine Forschungsfrage nicht mehr direkt behandelt, halte ich
dennoch die Outlierdaten für erwähnenswert und interessant.
15

Random-intercept-Modell mit der Responsevariable Angst:

Klasse 52: Abstand -2.3686 Rang 1.0000

Klasse 41: Abstand 0.43893 Rang 38.000

Klasse 38: Abstand -0.88715 Rang 11.000

Interpretation:
Genauso wie im Random-intercept mit allen Prädiktoren, errechnet das RI mit der
Responsevariable Angst den Rang 1, somit den schlechtesten Platz für die Klasse 52.
Ähnlich wie im Random-slope stuft diese Gleichung Klasse 41 eher als durchschnittsklasse
ein. Ihr Abstand zur General Line beträgt 0.43893.
Mit dem Rang 11 wird die Klasse 38, welche im RI mit allen Prädiktoren die beste Klasse war
im RI mit der Responsevariable Angst zu einer der schlechtesten Klassen. Sie hat einen
negativen Abstand von -0.88715 zur General Line, d.h. sie liegt unterhalb der General Line.
16

Literaturverzeichnis:

Quellen aus dem Internet:


http://www.wikipedia.org.de

http://www1.ku-eichstaett.de/PPF/PaedagogikI/allgphdx.htm

Buch:

Schwetz, H. (2003): Die Klasse macht den Unterschied. Mehrebenenanalytische


Untersuchung der Effekte von Unterricht. (Erziehungswissenschaft, Bd. 15).
Landau: Verlag Empirische Pädagogik

Schwetz, H. & Subramanian, S.V. (2005): Einführung in die Mehrebenenanalyse


mit MLWin. Von der Regressionsanalyse zum Random-Slope-Modell (Forschung,
Statistik & Methoden, Band 9). Landau: Verlag Empirische Pädagogik