Sie sind auf Seite 1von 4

Aufgabe 1:

[20 Punkte]

Sie interessieren sich fr die Determinanten der schulischen Bildung. Sie vermuten, dass die schulische Ausbildungszeit abhngt von der Bildung der Eltern und der Anzahl der Geschwister, die eine Person hat. Sie unterstellen folgendes Modell (Modell A):
educi 0 1 sibsi 2 meduci 3 feduci 4 agei 5 agei2 6 urbani i

educi: sibsi: meduci: feduci: agei: urbani:

schulische Ausbildungszeit der i-ten Person (in Jahren) Anzahl der Geschwister der i-ten Person schulische Ausbildungszeit der Mutter der i-ten Person (in Jahren) schulische Ausbildungszeit des Vaters der i-ten Person (in Jahren) Alter in Jahren Dummy-Variable (=1, wenn Person i in stdtischen Regionen aufgewachsen ist)

Die Auswertung einer Stichprobe von 722 erwerbsttigen Mnnern im Alter von 28 bis 37 Jahren ergibt folgenden in Stata geschtzten Output:
Source | SS df MS -------------+-----------------------------Model | 820.103132 6 136.683855 Residual | 2787.11155 715 3.89805811 -------------+-----------------------------Total | 3607.21468 721 5.00307168 Number of obs F( 6, 715) Prob > F R-squared Adj R-squared Root MSE = = = = = = 722 35.06 0.0000 0.2274 0.2209 1.9744

-----------------------------------------------------------------------------educ | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------sibs | -.0846774 .0343776 -2.46 0.014 -.1521706 -.0171842 meduc | .1350329 ??? 4.15 0.000 .0711662 .1988996 feduc | ??? .0275416 7.61 0.000 .1553855 .2635296 age | 1.769902 .6000867 2.95 0.003 .5917594 2.948045 age^2 | -.0260541 .0090319 -2.88 0.004 -.0437863 -.0083218 urban | .1562581 .1651927 0.95 0.345 ??? _cons | -19.59485 9.917491 -1.98 0.049 -39.06573 -.1239624 ------------------------------------------------------------------------------

a) Berechnen Sie unter Angabe des Rechenwegs a1) den Standardfehler fr b2 ; a2) den geschtzten Koeffizienten fr 3 ; a3) ein 95%-Konfidenzintervall fr b6 . b) Interpretieren Sie die Koeffizienten b1 und b2 inhaltlich und statistisch.

(4 Punkte)

(2 Punkte)

c) Berechnen Sie den marginalen Effekt des Alters am Stichprobenmittel (= 32,9 Jahre) und interpretieren Sie diesen inhaltlich. (3 Punkte) d) Um hhere Flexibilitt fr den Alterseffekt zuzulassen, werden statt age und age^2 DummyVariablen (in 2er-Jahresschritten: age1 Alter zwischen 28 und unter 30; age2 Alter zwischen 30 und unter 32, etc.) in das Modell aufgenommen (Modell B): (6 Punkte)
Source | SS df MS -------------+-----------------------------Model | 824.672744 8 103.084093 Residual | 2782.54194 713 3.90258336 -------------+-----------------------------Total | 3607.21468 721 5.00307168 Number of obs F( 8, 713) Prob > F R-squared Adj R-squared Root MSE = = = = = = 722 26.41 0.0000 0.2286 0.2200 1.9755

------------------------------------------------------------------------------

educ | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------sibs | -.0859938 .0344421 -2.50 0.013 -.1536139 -.0183737 meduc | .136387 .0325627 4.19 0.000 .0724568 .2003173 feduc | .2110122 .0275786 7.65 0.000 .1568672 .2651571 age1 | -.5654847 .2372335 -2.38 0.017 -1.031244 -.0997249 age2 | .0090609 .2056578 0.04 0.965 -.3947064 .4128282 age3 | .291775 .2177267 1.34 0.181 -.1356871 .7192372 age4 | .1254812 .2451913 0.51 0.609 -.3559019 .6068644 urban | .172182 .1664973 1.03 0.301 -.1547016 .4990656 _cons | 10.15607 .3852695 26.36 0.000 9.399671 10.91247 ------------------------------------------------------------------------------

d1) Interpretieren Sie den Koeffizienten der Variable age1 inhaltlich. d2) Welches der beiden Modelle ist zu bevorzugen? Ziehen Sie hierzu die AIC-Werte der beiden Modelle heran; die Summe der quadrierten geschtzten Residuen betrgt 2786.123 in Modell A und 2781.146 in Modell B. e) Sie vermuten, dass die Fehlertermvarianz mit steigendem Alter variiert: var( i ) i2 2 agei2 . Wie kann man Modell (A) so transformieren, dass die Heteroskedastie eliminiert wird? Stellen Sie zudem formal die Auswirkung der Transformation auf die Varianz des Strterms dar. (5 Punkte)

Aufgabe 6:

[25 Punkte]

Wahr oder falsch? Tragen Sie fr jede der folgenden Aussagen ein w fr wahr oder ein f fr falsch ein. Fr jede richtige Antwort gibt es 1 Punkt, fr jede falsche Antwort wird 1 Punkt abgezogen. Die Gesamtpunktzahl kann nicht negativ werden. Zu den Gauss-Markov-Annahmen gehrt, dass der Erwartungswert der Regressionskonstante Null ist. Marginale Effekte beschreiben den Zusammenhang zwischen der abhngigen und einer erklrenden Variablen, gegeben der Wert aller anderen im Modell bercksichtigten erklrenden Variablen. Ein "Encompassing Test" wird genutzt, um alternative Spezifikationen der abhngigen Variablen gegeneinander zu testen. Bei falschen Standardfehlern sind Schlussfolgerungen auf Basis von t-Tests ungltig. Der Wert des R2 kann nicht kleiner als Null sein. Auf Basis linearer Modelle geschtzte Koeffizienten knnen immer als Kausaleffekte interpretiert werden. Heteroskedastieprobleme knnen mit einem verallgemeinerten KQ-Schtzer gelst werden. Unter einem Interaktionsterm versteht man das Produkt zweier erklrender Variablen. Beim einfachen t-Test werden Hypothesen zu Eigenschaften des Strterms berprft. AIC und BIC Kriterium bewerten die Gte von Schtzmodellen auf Basis der nicht erklrten Variation, der Anzahl der Parameter sowie der Anzahl der Beobachtungen. Homoskedastische Strterme haben eine Varianz von 1. Die Transponierte einer Matrix ist ebenfalls eine Matrix.

Ein Modell mit hohem Wert des BIC-Kriteriums passt besser zu den Daten als eins mit niedrigem BIC-Wert. Wenn der p-Wert grer als das Signifikanzniveau ist, wird H0 verworfen. Bei Gltigkeit des Gauss-Markov Theorems gibt es keinen Schtzer des linearen Regressionsmodells mit kleinerer Varianz als die des Kleinstquadrateschtzers. Im linearen Regressionsmodell wird unterstellt, dass die abhngige Variable keine Zufallsvariable ist. Der Kleinstquadrateschtzer minimiert die Summe der quadrierten horizontalen Abweichungen von der Regressionsgerade. Die Normalverteilung ist eine einparametrige Verteilungsfunktion. Die statistische Signifikanz eines Steigungsparameters lsst sich mittels eines F-Tests testen. Der Goldfeld-Quandt Test ist ein F-Test auf die Gleichheit der Varianz zweier Teilstichproben. Der F-Test auf gemeinsame Signifikanz einer Gruppe von erklrenden Variablen im Rahmen eines linearen Modells kann mittels R2 Werten durchgefhrt werden. Durch das Hinzufgen weiterer erklrender Variablen kann der angepasste R2 Wert nicht sinken. Wenn der p-Wert grer ist als das Signifikanzniveau eines Tests, wird die Nullhypothese verworfen. Mithilfe des Akaike Information Criterion (AIC) und des Schwarz Bayesian Information Criterion (BIC) wird auf Strukturbruch in den Daten getestet. Der Chow-Test berprft mittels einer F-Teststatistik, ob vorhergesagte Werte der abhngigen Variable den Erklrungsgehalt des Modells erhhen.

Aufgabe 7:

[15 Punkte]

Wahr oder falsch? Begrnden Sie Ihre Auffassung (Bsp.: "Wahr, weil..." bzw. "Falsch, weil..."). Nur bei korrekter Begrndung erhlt jede richtige Antwort 1.5 Punkte; Angaben ohne Begrndung werden nicht gewertet. Es ist nicht mglich, im Rahmen eines linearen Regressionsmodells Elastizitten zu schtzen.

Am Signifikanzniveau von 5 Prozent weisen ein- und zweiseitige Tests einer Hypothese den gleichen kritischen Wert der Teststatistik aus.

Die Unverzerrtheit des Kleinstquadrateschtzers lsst sich nicht nachweisen, wenn E{X'}= 0.

Der PE Test testet in zwei Stufen, ob das lineare oder loglineare Modell angemessen ist.

Identisch und unabhngig verteilte Strterme knnen heteroskedastisch sein.

Wenn die Strterme des Regressionsmodells alle gleich Null sind, so betrgt der R2 Wert 1.

Der marginale Effekt erklrender Variablen kann auch von anderen erklrenden Variablen abhngen.

Das Modell g xi , 1 xi xi2 lsst sich nicht per KQ schtzen. 1


2 3

In Stichproben, die aus zwei Gruppen mit jeweils homoskedastischen Fehlertermvarianzen bestehen, kann Heteroskedastie ein Problem darstellen.

In Modellen mit logarithmierter abhngiger Variable y lassen sich prozentuale Vernderungen in y bei hohen Absolutwerten der geschtzten Koeffizienten direkt aus diesen ablesen.