Sie sind auf Seite 1von 25

M2

Tutorium
Wintersemester 20/21
9. Sitzung
Ablauf lineare Regression

1.  Bestimmung der Regressionsgewichte


1.  b1
2.  b0
2.  Bestimmung der Modellgüte


Regressionsparameter

•  b1
–  Steigung der Regressionsgeraden
–  Interpretation: Wenn X um eine Einheit steigt,
verändert sich Y im Schnitt um b1 Einheiten
Regressionsgewichte

•  b0
–  Regressionskonstante
–  Schnittpunkt mit der Y-Achse
–  Interpretation: vorhergesagter y-Wert für den Fall
dass x=0
Lineare Regression
Variationszerlegung
Variationszerlegung
Berechnung R2
Modellgüte

•  Vorhersage durch das Modell umso besser,…


–  je kleiner der Anteil an Residualvariation
–  je größer der Anteil der erklärten Variation

-> Da die Gesamtvariation die Summe erklärter


und nicht erklärter Variation ist, laufen beide
Ansätze auf dasselbe Ergebnis hinaus
Modellgüte
•  R² Interpretation
–  PRE-Logik:
•  Fehlerreduktion bei der Vorhersage von Y mit vs. Ohne
Kenntnis von X
•  Bei Kenntnis von X verbessert sich die Vorhersage von Y
um ...%.
ODER: ...% der Varianz von Y kann durch X vorhergesagt
werden.
–  Interpretation als Korrelation
•  Im bivariaten Fall lässt sich R² als Quadrat der Korrelation
zwischen den beobachteten X- und Y-Werten interpretieren
•  R²=(rxy)²= bedeutet demnach, dass vorhergesagt und
tatsächliche Y-Werte perfekt korrelieren
Standardisiertes Regressionsgewicht
•  Vergleich unstandardisieter Regressionskoeffizienten
häufig nicht sinnvoll, da diese von der Skalierung der
Variablen abhängen
-> Standardisierung der Regressionsgewichte
•  Entweder vorher X und Y z-transformieren
•  Oder nachträglich Regressionsgewichte normieren
•  Interpretation b1*: Wenn X um eine
Standardabweichung steigt, verändert sich Y um 𝑏1∗
Standardabweichungen.
Dummy-Regression
•  Datensituation: Prädiktor X ist eine dichotome
Variable, die AV ist metrisch
–  dichtome UV (D) sollte immer „dummycodiert“ werden,
d.h. 0/1-codiert
–  Gruppe mit dem Code „0“ => Referenzkategorie
–  Stochastische Regressionsgleichung: Y = b0 + b1 · D + E
–  Achtung: ein standardisiertes Regressionsgewicht einer
Dummyvariablen ist inhaltlich nicht sinnvoll
interpretierbar! (die Variable kann sich nur um genau eine Einheit verändern, es
gibt keine Ausprägungen außer 0 & 1).
Aufgabe
Eine Bildungsforscherin möchte
untersuchen, wie sich die
Englischkenntnisse von Schülern in
den ersten sechs Schuljahren
verändern und wählt dafür zufällig
sechs Schülerinnen und Schüler der
1. bis 6. Klasse im Alter von sechs bis
elf Jahren aus. Sie führt eine
bivariate Regressionsanalyse mit der
Leistung im Englischtest (Y) und dem
Alter der Kinder in Jahren (X) durch.

Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27

Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27

•  b1 berechnen
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27

•  b1 = 3,49
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
b1 = 3,49

•  Mittelwerte X und Y
•  b0 berechnen à sinnvoll
interpretierbar?
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
b1 = 3,49

•  Mittelwerte X und Y
x = 8,5
y = 21,33
•  b0 = -8,34
à sinnvoll interpretierbar?
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49

•  Regressionsschätzgleichung
•  Interpretationssatz b1

Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49

•  Regressionsschätzgleichung
•  Interpretationssatz b1 à Trend?

Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  Gesamtmittelwert Y und
Regressionsgerade einzeichnen
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  Variationszerlegung 9-jähriger
Schüler (Gesamtabweichung,
erklärte Abweichung, nicht-
erklärte Abweichung)
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  Neuer Schüler 7. Klasse (12 Jahre)
à 35 Punkte
Wird Schüler unterschätzt /
überschätzt?
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  Neuer Schüler 7. Klasse (12 Jahre)
à 35 Punkte
Wird Schüler unterschätzt /
überschätzt?
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  PRE-Aussage?
R²=(rxy)²
Aufgabe
Kovarianz: sXY = 12,2
︎Varianz: s2x = 3,5 ︎
Varianz: s2y= 50,27
Mittelwert x = 8,5
Mittelwert y = 21,33
b0 = -8,34
b1 = 3,49


•  PRE-Aussage?
rxy= 0,92
R² = 0,8459