Sie sind auf Seite 1von 10

Mikro-Okonometrie, WS 2015/2016

Musterlosung Aufgabenblatt 6
Aufgabe 6: Wir verwenden erneut die Daten aus CPS91.DTA zu verheirateten US-amerikanischen
Frauen aus dem Jahr 1991, die u.a. folgende Variablen enthalt:
age : wifes age hrwage : earns/hours
black : =1 if wife black husage : husbands age
earns : wifes weekly earnings husblck : =1 if husband black
educ : wifes yrs schooling husearns : husband weekly earns
exper : age educ 6 huseduc : husbands yrs schooling
expersq : exper2 kidlt6 : =1 if have child < 6
faminc : annual family income kidge6 : =1 if have child >= 6
hispanic : =1 if wife hispanic lwage : log(hrwage)
hours : wifes weekly hours nwifeinc : non-wife income, $1000s
In den ersten Aufgabenteilen geht es darum, die Variable hours (= die von der jeweiligen Frau pro Wo-
che fur Erwerbsarbeit aufgewandte Zeit in Stunden) zu erklaren durch die im Makro xlist gelisteten
Variablen:
. global xlist age educ kidlt6 kidge6 nwifeinc husearns

i. Schauen Sie sich deskriptive Statistiken der Variablen aus $xlist sowie von hours, hrwage und
lwage an, einmal in der gesamten Stichprobe und einmal in der Teilstichprobe der Haushalte, bei
denen die Frau erwerbstatig war ( hours > 0).

Einschub: Wir setzen zuvor die Variablen hrwage (Lohn) und lwage (Log des Lohns) auf 0, wenn
die Frau nicht erwerbstatig war. Auerdem setzen wir lwage auf 0, wenn lwage < 0. Das hat
zur Konsequenz, dass in einem Tobit-Modell fur lwage eine Frau nur dann als erwerbstatig gilt,
wenn ihr Stundenlohn mindestens einen Dollar betragt (betrifft nur 4 der fast 6000 Haushalte);
Man beachte dazu: Ein Stundenlohn unter $1 in den USA im Jahr 1991 erscheint merkwurdig.

use cps91.dta, clear

. replace hrwage=0 if hrwage == .


(2348 real changes made)

. replace lwage=0 if lwage == .


(2348 real changes made)

. replace lwage=0 if lwage < 0


(4 real changes made)

. global xlist age educ kidlt6 kidge6 nwifeinc husearns


Vgl. der summary-Statistiken Erwerbstatige vs. Alle

. summarize $xlist hours hrwage lwage
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
age | 5634 39.42758 9.98761 18 59
educ | 5634 12.98403 2.615436 0 18
kidlt6 | 5634 .2793752 .448732 0 1
kidge6 | 5634 .3075967 .4615396 0 1
nwifeinc | 5634 30.26923 27.21158 0 112.5
husearns | 5634 453.5406 406.9878 0 1923
hours | 5634 20.72222 19.39618 0 120
hrwage | 5634 6.046621 7.415488 0 200
lwage | 5634 1.281383 1.152865 0 5.298317

. summarize $xlist hours hrwage lwage if hours > 0


Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
age | 3286 38.67925 9.470228 18 59
educ | 3286 13.40505 2.439894 0 18
kidlt6 | 3286 .2474133 .4315746 0 1
kidge6 | 3286 .3420572 .4744708 0 1
nwifeinc | 3286 27.05264 24.10646 0 111.2
husearns | 3286 474.3743 387.3083 0 1923
hours | 3286 35.52921 10.9029 1 120
hrwage | 3286 10.36721 7.034759 .0333333 200
lwage | 3286 2.196991 .5166187 0 5.298317

Machen Sie sich bitte fur jede der Variablen klar, in welcher Einheit sie gemessen wurde (und
ggf. auf welchen Zeitraum sie sich bezieht).

age : Alter der Frau gemessen in Jahren; Mittelwert ca. 40 Jahre bei einer Std.Abweichung
von 10 Jahren. Die Vtlg. des Alters scheint sich bei den erwerbstatigen ( selektierten,

partizipierenden) Frauen nicht wesentlich von der in der ges. Stichprobe zu unterscheiden.

educ bezeichnet die Ausbildungsdauer der Frau gemessen in Jahren; Mittelwert bei ca. 13 bzw.
13.5 Jahren mit einer Std.Abweichung von 2.5 Jahren. Die erwerbstatigen Frauen weisen
eine etwas langere Ausbildungsdauer als der Schnitt auf.
kidlt6 : Dummy-Variable, die anzeigt, ob ein Kind im Vorschulalter im Haushalt vorhanden ist.
Im Schnitt in der gesamten Stichprobe ist dies bei ca. 28% der Fall, bei den Haushalten
mit erwerbstatigen Frauen nur bei ca. 25%.
kidlt6 : Dummy-Variable, die anzeigt, ob ein Kind im Ausbildungsalter im Haushalt vorhanden
ist. Im Schnitt uber die gesamte Stichprobe ist dies bei ca. 31% der Fall, bei den Haushalten
mit erwerbstatigen Frauen bei ca. 34%.
nwifeinc : Einkommen des Haushalts abzuglich des Einkommens der Frau, gemessen in Tausend $.
Die erwerbstatigen Frauen haben im Schnitt mit ca. 27 Tsd. $ ein geringeres Reservati-

onseinkommen als der Schnitt uber alle, der bei ca. 30 Tsd. $ liegt. Der Zeitraum scheint
hier 1 Jahr zu sein.

husearns : Einkommen des Ehemanns, in Dollar pro Woche. (D.h. man musste die Zahlen mit 52 mul-
tiplizieren, um Vergleichbarkeit mit nwifeinc zu bekommen.) Familien mit erwerbstatigen
Frauen verfugen im Schnitt uber ein hoheres Einkommen des Ehemanns (bei geringere
Std.Abweichung!) als es beim Durchschnitt uber alle der Fall ist.

2
Fortsetzung von Teil i., Vgl. der summary-Statistiken Erwerbstatige vs. Alle

. summarize $xlist hours hrwage lwage
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
age | 5634 39.42758 9.98761 18 59
educ | 5634 12.98403 2.615436 0 18
kidlt6 | 5634 .2793752 .448732 0 1
kidge6 | 5634 .3075967 .4615396 0 1
nwifeinc | 5634 30.26923 27.21158 0 112.5
husearns | 5634 453.5406 406.9878 0 1923
hours | 5634 20.72222 19.39618 0 120
hrwage | 5634 6.046621 7.415488 0 200
lwage | 5634 1.281383 1.152865 0 5.298317

. summarize $xlist hours hrwage lwage if hours > 0


Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
age | 3286 38.67925 9.470228 18 59
educ | 3286 13.40505 2.439894 0 18
kidlt6 | 3286 .2474133 .4315746 0 1
kidge6 | 3286 .3420572 .4744708 0 1
nwifeinc | 3286 27.05264 24.10646 0 111.2
husearns | 3286 474.3743 387.3083 0 1923
hours | 3286 35.52921 10.9029 1 120
hrwage | 3286 10.36721 7.034759 .0333333 200
lwage | 3286 2.196991 .5166187 0 5.298317

hours : Wochentliche Arbeitszeit der Frau, gemessen in Stunden. Der Schnitt ist bei den er-
werbstatigen Frauen mit ca. 35 Stunden naturlich hoher als bei allen (ca. 20 Stunden).
Bemerkenswert ist der Unterschied in der Std.Abweichung: Sie liegt bei den erwerbstatigen
Frauen nur bei 10 Stunden, uber alle ist sie doppelt so gro.
hrwage : Stundenlohn, im Schnitt ca. 10 $ uber die Erwerbstatigen, ca. 6 $ uber alle.
lwage : Log des Stundenlohns. Der Mittelwert ist naturlich niedriger, wenn man auch uber die
Nicht-Erwerbstatigen mittelt.

Wieviele der Frauen waren erwerbstatig?


In 3286 der 5634 Haushalte waren die Frauen erwerbstatig
Gibt es Variablen, die bei Erwerbstatigkeit der Ehefrau einer massiven Selektionsverzerrung un-
terliegen?
Auer den Variablen, die direkt mit der Erwerbstatigkeit verbunden sind (hours, hrwage und
lwage) sieht man gewisse Selektionseffekte bei der Ausbildung der Frau, den Kinder-Variablen

(kidlt6, kidge6 ) und den Einkommensvariablen (nwifeinc, husearns). Ob man diese als massiv

ansieht, ist Geschmackssache.

3
ii. Wir fuhren die Regression von hours auf die Variablen aus xlist durch als:
OLSTrunc: Lineare Regression auf dem bei hours = 0 gestutzten ( truncated) Sample: Die

Regressionskoeffizienten werden nur auf Basis der erwerbstatigen Frauen mit OLS geschatzt.

. regress hours $xlist if hours > 0

Source | SS df MS Number of obs = 3286


-------------+------------------------------ F( 6, 3279) = 21.59
Model | 14843.781 6 2473.96349 Prob > F = 0.0000
Residual | 375654.914 3279 114.563865 R-squared = 0.0380
-------------+------------------------------ Adj R-squared = 0.0363
Total | 390498.695 3285 118.873271 Root MSE = 10.703

------------------------------------------------------------------------------
hours | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | -.0554354 .0224728 -2.47 0.014 -.0994976 -.0113732
educ | .3485268 .0797153 4.37 0.000 .1922299 .5048237
kidlt6 | -4.658066 .5357552 -8.69 0.000 -5.708515 -3.607618
kidge6 | -3.089431 .4383729 -7.05 0.000 -3.948944 -2.229919
nwifeinc | -.042817 .0085126 -5.03 0.000 -.0595076 -.0261263
husearns | .000065 .0005235 0.12 0.901 -.0009614 .0010914
_cons | 36.33811 1.451354 25.04 0.000 33.49245 39.18376
------------------------------------------------------------------------------
. estimates store OLSTrunc

OLSCens: Lin. Regres. mit zensiertem y: Die Regres.koeffizienten werden auf Basis des ge-
samten Samples mit der Setzung hours = 0 bei nicht-erwerbstatigen Frauen OLS-geschatzt.

. regress hours $xlist

Source | SS df MS Number of obs = 5634


-------------+------------------------------ F( 6, 5627) = 111.16
Model | 224570.579 6 37428.4299 Prob > F = 0.0000
Residual | 1894629.7 5627 336.703341 R-squared = 0.1060
-------------+------------------------------ Adj R-squared = 0.1050
Total | 2119200.28 5633 376.211659 Root MSE = 18.349

------------------------------------------------------------------------------
hours | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | -.2634499 .0294285 -8.95 0.000 -.3211411 -.2057586
educ | 1.606612 .0971489 16.54 0.000 1.416162 1.797061
kidlt6 | -8.637881 .7115054 -12.14 0.000 -10.03271 -7.243056
kidge6 | -.8096952 .6023804 -1.34 0.179 -1.990593 .3712027
nwifeinc | -.1483794 .0097564 -15.21 0.000 -.1675058 -.1292531
husearns | .003381 .0006463 5.23 0.000 .0021139 .004648
_cons | 15.86932 1.848825 8.58 0.000 12.24491 19.49373
------------------------------------------------------------------------------
. estimates store OLSCens

4
Tobit-Regression (hours zensiert als hours = 0, wenn hours 0).
. tobit hours $xlist, ll(0)
Tobit regression Number of obs = 5634
LR chi2(6) = 657.13
Prob > chi2 = 0.0000
Log likelihood = -17594.169 Pseudo R2 = 0.0183
------------------------------------------------------------------------------
hours | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | -.4287647 .0495562 -8.65 0.000 -.5259139 -.3316155
educ | 2.843447 .1711015 16.62 0.000 2.508023 3.178872
kidlt6 | -13.46309 1.199164 -11.23 0.000 -15.81391 -11.11227
kidge6 | .1132339 1.00123 0.11 0.910 -1.849562 2.07603
nwifeinc | -.2677722 .0173985 -15.39 0.000 -.30188 -.2336644
husearns | .0061359 .0011083 5.54 0.000 .0039632 .0083086
_cons | 1.099475 3.160145 0.35 0.728 -5.095627 7.294576
-------------+----------------------------------------------------------------
/sigma | 28.86641 .399344 28.08354 29.64928
------------------------------------------------------------------------------
Obs. summary: 2348 left-censored observations at hours<=0
3286 uncensored observations
0 right-censored observations

Vergleichen Sie die Ergebnisse.


. estimates table OLSTrunc OLSCens Tobit, b(%8.3f) p stats(N) eq(1)
-----------------------------------------------
Variable | OLSTrunc OLSCens Tobit
-------------+---------------------------------
hours | legend: b/p
age | -0.055 -0.263 -0.429
| 0.0137 0.0000 0.0000
educ | 0.349 1.607 2.843
| 0.0000 0.0000 0.0000
kidlt6 | -4.658 -8.638 -13.463
| 0.0000 0.0000 0.0000
kidge6 | -3.089 -0.810 0.113
| 0.0000 0.1790 0.9100
nwifeinc | -0.043 -0.148 -0.268
| 0.0000 0.0000 0.0000
husearns | 0.000 0.003 0.006
| 0.9012 0.0000 0.0000
_cons | 36.338 15.869 1.099
| 0.0000 0.0000 0.7279
-------------+---------------------------------
N | 3286 5634 5634
-----------------------------------------------

Mit Ausnahme von kidge6 werden die Effekte der Regressoren bei OLSCens (viel) starker als
bei OLSTrunc und dann nochmal (viel) starker bei Tobit gegenuber OLSCens geschatzt.
Gleiche Reihung in Bezug auf die Signifikanzen (hier gemessen durch die p-Werte)

5
Entsprechen die Vorzeichen der Regressionskoeffizienten von kidlt6 und kidge6 den Erwartungen?
kidlt6 : Alle drei Schatzungen sehen einen negativen Effekt von Kindern im Vorschulalter auf die

von der Frau angebotenen Arbeitsmenge (die Zeit, die die Frau mit Erwerbsarbeit verbringt).
Das war so zu erwarten, weil es mit Kindern im Vorschulalter fur die Mutter (in den 1990er
Jahren in den USA) schwierig(er) war, (langer) arbeiten zu gehen.
kidge6 : Die OLSTrunc-Schatzung sieht einen negativen Effekt von Kindern im Schul/Ausbildungs-

alter auf die von der Frau angebotene Arbeitsmenge. Die beiden anderen Schatzungen sehen
keinen signifikanten Effekt dieser Variable. Das Ergebnis von OLSTrunc erscheint merkwurdig,
denn Kinder im Ausbildungsalter erfordern eher nicht die Anwesenheit der Mutter, sondern (be-
sonders in den USA) vielleicht eher Geld der Eltern zur Finanzierung einer teuren Ausbildung.
Die Frauen mit Kindern im Ausbildungsalter sollten daher eher langer arbeiten.
Erlautern Sie, unter welchen Annahmen die drei Schatzungen den Effekt der einzelnen Regres-
soren auf das Arbeitsangebot von Ehefrauen schatzen.
OLSTrunc: Die Effekte werden auf Basis der faktisch Erwerbstatigen geschatzt. Ein potentielles
Problem dabei sind Selektionseffekte. Z.B. sieht man hier einen signifikant negativen Effekt

von kidge6 (Kindern im Schul-/Ausbildungsalter) auf das Arbeitsangebot der Frau (die von
der Frau angebotene Arbeitsmenge hours), wenn man nur die tatsachlich erwerbstatigen Frauen
berucksichtigt. Es konnte sein, dass dies einem Selektionseffekt geschuldet ist. Wie oben erlautert
erscheint ein negativer Effekt von Kindern im Ausbildungsalter auf die Arbeitszeit der Frau
merkwurdig: Man wurde eher vermuten, dass eine Frau mit Kindern im Ausbildungsalter (wenn
dann) tendentiell mehr arbeitet. Sollte das stimmen, konnte man hier einen Selektionseffekt
vermuten derart, dass sich bei den Haushalten mit erwerbstatigen Frauen eher solche finden,
bei denen die Kinder nicht sehr auf ein hohes Einkommen der Eltern zur Finanzierung ihrer
Ausbildung angewiesen sind. Das ist aber sehr spekulativ. Aber die Tobit-Schatzung wurde
diese Interpretation unterstutzen, denn nach der Tobit-Schatzung ist der Effekt dieser Variable
insignifikant (wenn, dann positiv).
OLSCens: Die Effekte werden mit der Setzung hours = 0 bei den Nicht-Erwerbstatigen

geschatzt.
Tobit: ML-geschatzt unter der Annahme latente Var. hours < 0 erklart Nicht-Erwerbstatigkeit

Auerdem nimmt das Tobit-Modell an, dass die gleichen erklarenden Variablen dafur zustandig
sind, dass hours negativ wird, wie die Variablen, die im Fall hours > 0 erklaren, welchen
Wert hours = hours dann annimmt. Mehr noch: Die Regressionskoeffizienten mussen in beiden
Gruppen die gleichen sein. Auerdem mussen die Storterme/Residuen, die dabei bzgl. der laten-
ten Variable entstehen, auch noch normalverteilt sein (schon die Homoskedastie keine andere
Residualvarianz bei hours < 0 wie bei hours > 0 ist eine starke Annahme).
Macht es Sinn, dass, mit Ausnahme von kidge6, der Effekt der Regressoren am schwachsten von
OLSTrunc und am starksten von Tobit geschatzt wird?
Dies wurde dann Sinn machen, wenn es starke Selektionseffekte bei den erwerbstatigen Frauen
gibt, d.h. wenn sich die Haushalte mit erwerbstatigen Frauen massiv von denjenigen, wo die
Frau nicht-erwerbstatig ist, unterscheidet. Hier drangt sich allerdings der Verdacht auf, dass das
Tobit-Modell die daraus resultierenden Effekte uberschatzt.
Der Regressor kidge6 ist unter Tobit sehr insignifikant, unter OLSTrunc dagegen signifikant. Bei
husearns ist es umgekehrt: Dieser Regressor ist unter OLSTrunc sehr insignifikant, unter Tobit
dagegen signifikant. Wie kann ein solches Ergebnis zustande kommen?
Fur kidge6 haben wir das schon oben diskutiert. Auch bei husearns konnte der Selektionseffekt,
der bei OLSTrunc unberucksichtigt ist, eine Rolle spielen. In Ubung diskutieren.

6
iii. Wir unterstellen nun, dass man hours als die von der jeweiligen Frau angebotene Arbeitsmenge
interpretieren kann. Fugen wir dem Modell aus ii. als weitere erklarende Variable den Lohn, den
sie dafur erhalt, hinzu, so wird eine Angebotsfunktion fur die Ware Arbeit modelliert: Wie

sehr wirkt der Lohn ( Preis der Ware), den die Frau am Arbeitsmarkt erzielen kann, auf die

Menge an Arbeit, die sie anbietet? Den Lohn binden wir in logarithmierter Form ein: lwage. Wir
schatzen dieses Modell mit den gleichen drei Methoden wie in Teil ii.
. estimates table OLSTrunc OLSCens Tobit, b(%8.3f) t p stats(N r2 r2_p) eq(1)
-----------------------------------------------
Variable | OLSTrunc OLSCens Tobit
-------------+--------------------------------- legend: b/t/p
hours |
age | -0.062 -0.113 -0.200
| -2.74 -7.20 -7.78
| 0.0062 0.0000 0.0000
educ | 0.249 -0.338 -0.942
| 2.85 -6.25 -10.08
| 0.0044 0.0000 0.0000
kidlt6 | -4.648 -3.318 -4.974
| -8.68 -8.72 -7.97
| 0.0000 0.0000 0.0000
kidge6 | -3.022 -1.360 -1.155
| -6.89 -4.25 -2.25
| 0.0000 0.0000 0.0248
nwifeinc | -0.042 -0.026 -0.053
| -4.95 -4.96 -5.56
| 0.0000 0.0000 0.0000
husearns | -0.000 -0.001 -0.003
| -0.33 -3.74 -5.21
| 0.7436 0.0002 0.0000
lwage | 1.120 14.527 22.796
| 2.72 119.66 82.60
| 0.0065 0.0000 0.0000
_cons | 35.521 13.671 8.177
| 23.99 13.92 5.03
| 0.0000 0.0000 0.0000
-------------+---------------------------------
N | 3286 5634 5634
r2,r2_p | 0.040 0.748 0.227
-----------------------------------------------

Interpretieren Sie die geschatzten Koeffizienten von lwage.

OLSTrunc: Bei einem um 1% hoheren Lohn steigt das Arbeitsangebot verheirateter Frauen
im Schnitt um 0.011 Stunden (ca. 6 Sekunden) pro Woche, bei einem um 10% hoheren
Lohn also um ca. 1 Minute pro Woche (im Schnitt, c.p., geschatzt).
Dass ein derart schwacher Effekt noch als 1%-signifikant gesehen wird (p = 0.65%), hangt
mit der groen Stichprobe (dem groen N ) zusammen.
OLSCens: Bei einem um 1% hoheren Lohn steigt das Arbeitsangebot verheirateter Frauen
im Schnitt um 0.15 Stunden (ca. 9 Minuten) pro Woche, bei einem um 10% hoheren Lohn
also um ca. anderthalb Stunden.
Tobit: Bei einem um 1% hoheren Lohn wurde das Arbeitsangebot der Frauen im Schnitt
um 0.23 Stunden pro Woche (ca. 14 Minuten) steigen, bei einem um 10% hoheren Lohn
also um ca. 2.4 Stunden.

7
Nochmal die Ergebnistabelle bei der Angebotsfunktion (Regression von hours auf lwage):

-----------------------------------------------
Variable | OLSTrunc OLSCens Tobit
-------------+--------------------------------- legend: b/t/p
hours |
age | -0.062 -0.113 -0.200
| -2.74 -7.20 -7.78
| 0.0062 0.0000 0.0000
educ | 0.249 -0.338 -0.942
| 2.85 -6.25 -10.08
| 0.0044 0.0000 0.0000
kidlt6 | -4.648 -3.318 -4.974
| -8.68 -8.72 -7.97
| 0.0000 0.0000 0.0000
kidge6 | -3.022 -1.360 -1.155
| -6.89 -4.25 -2.25
| 0.0000 0.0000 0.0248
nwifeinc | -0.042 -0.026 -0.053
| -4.95 -4.96 -5.56
| 0.0000 0.0000 0.0000
husearns | -0.000 -0.001 -0.003
| -0.33 -3.74 -5.21
| 0.7436 0.0002 0.0000
lwage | 1.120 14.527 22.796
| 2.72 119.66 82.60
| 0.0065 0.0000 0.0000
_cons | 35.521 13.671 8.177
| 23.99 13.92 5.03
| 0.0000 0.0000 0.0000
-------------+---------------------------------
N | 3286 5634 5634
r2,r2_p | 0.040 0.748 0.227
-----------------------------------------------
Inwiefern erkennt man a) am t-Wert des Koeffizienten von lwage und b) am R2 (bzw. Pseudo-
R2 ), dass der erzielbare Lohn in der Tat eine wichtige Variable zur Erklarung des Arbeitsangebots
zu sein scheint?
Die t-Werte von lwage bei OLSCens und Tobit sind hier mit Werten von 120 bzw. 82.60 sehr
gro. Groe t-Werte (hohe Signifikanzen) sind zwar angesichts des groen N nicht uberraschend,
aber diese t-Werte liegen doch eine Groenordnung uber denen der anderen Regressoren (denen
man sicherlich eine wichtige Rolle fur das Arbeitsangebot zusprechen wurde). Bei OLSTrunc
dagegen hat lwage nur einen moderaten t-Wert von knapp 3.
Auffallig ist auch der Sprung im R2 . Bei OLSCens betragt das R2 nun fast 0.75, ein sehr groer
Wert im Vgl. zu R2 = 0.04 bei OLSTrunc und auch im Vgl. zu den R2 -Werten von OLSCens
und Tobit in Teil ii. (ohne lwage als erklarende Variable).
Dies wurde dafur sprechen, dass, wenn man den Selektionseffekt berucksichtigt, der Lohn den
bei weitem starksten Anreiz fur (mehr) Erwerbstatigkeit verheirateter Frauen darstellt.
Wieso entstehen bei den beiden Methoden, die auf der gesamten Stichprobe schatzen, derart hohe
Signifikanzen (derart groe t-Werte) und derart groe Werte von R2 ?
Mit der OLSCens bzw. Tobit-Regression ist man sehr nahe an folgendem Gedankenexperiment:
Wir reduzieren hours auf eine binare Variable (den Dummy fur hours > 0) und verfahren

entsprechend mit lwage. Dann wurde man ein Regressionsmodell schatzen, bei dem man im
Wesentlichen die erklarte Variable als erklarende Variable auf die rechte Seite einfugt. Mit ei-
ner linearen Regression wurde man ein R2 von 1 bekommen (und unendlich hohe t-Wert des
betreffenden Regressors).

8
Was wurde geschehen, wenn man wage als Regressor in eine binare Regression (Probit oder
Logit) einbezieht, die erklaren soll, ob uberhaupt ein Angebot auf dem Arbeitsmarkt stattfindet?
Hinweis: Wir betrachten hier wage, nicht lwage, da wage = 0 perfekt aquivalent zu keiner

Erwerbstatigkeit (inlf = 0, siehe vorherige Aufgabe) ist.
Siehe vorheriges Gedankenexperiment.
iv. Im Anschluss an die Tobit-Regression von iii. geben Sie in Stata den Befehl test educ = 5*age
ein, mit dem Ergebnis:
. test educ = 5*age

( 1) - 5*[model]age + [model]educ = 0
F( 1, 5627) = 0.15
Prob > F = 0.6943

Auf was ist damit getestet worden und wie ist das Testergebnis zu interpretieren?
Die Nullhypothese lautet Der (positive) Effekt eines zusatzlichen Ausbildungsjahres auf das

Arbeitsangebot verheirateter Frauen wird im Schnitt durch den (negativen) Effekt auf das Ar-
beitsangebot von funf Lebensjahren kompensiert. Das Testergebnis besagt, dass diese Nullhy-
pothese auf keinem vernunftigen Signifikanzniveau abgelehnt werden kann (wir finden trotz der
groen Stichprobe keine Evidenz dafur, dass es anders ist).
Welche Art von Test hat Stata dabei durchgefuhrt?
Wald-Test im Kontext einer ML-Schatzung (da nur Schatzung des unrestringierten Modells).
Stata verwendet hier eine F -Statistik, obwohl im Kontext von ML eine 2 -Statistik ublicher
ware.

9
v. Wir vertauschen die Rollen von hours und lwage gegenuber Teil iii. D.h. wir regressieren lwage
auf hours (sowie die Variablen aus xlist).

. regress lwage $xlist hours


. estimates store OLSCens
// usw
. estimates table OLSTrunc OLSCens Tobit, b(%8.3f) p stats(N) eq(1)

-----------------------------------------------
Variable | OLSTrunc OLSCens Tobit
-------------+---------------------------------
lwage |
age | 0.006 0.003 0.003
| 0.0000 0.0039 0.0448
educ | 0.088 0.054 0.081
| 0.0000 0.0000 0.0000
kidlt6 | 0.000 0.061 0.117
| 0.9871 0.0066 0.0016
kidge6 | -0.054 0.078 0.164
| 0.0042 0.0000 0.0000
nwifeinc | -0.001 -0.001 -0.002
| 0.1200 0.0005 0.0010
husearns | 0.000 0.000 0.000
| 0.0000 0.0000 0.0000
hours | 0.002 0.049 0.071
| 0.0065 0.0000 0.0000
_cons | 0.656 -0.633 -1.903
| 0.0000 0.0000 0.0000
-------------+---------------------------------
sigma |
_cons | 0.830
| 0.0000
-------------+---------------------------------
Statistics |
N | 3286 5634 5634
-----------------------------------------------
legend: b/p

Interpretieren Sie einige der Regressionskoeffizienten quantitativ, wenn die Schatzung mit den
hier betrachteten drei Verfahren durchgefuhrt wird.
Zum Beispiel:
educ (OLSTrunc) = 0.088: Mit jedem Jahr mehr an Ausbildung steigt der Lohn um 0.088*100%
= 8.8% (im Schnitt, c.p., geschatzt)
educ (OLSCens) = 0.054: Mit jedem Jahr mehr an Ausbildung steigt der Lohn um 5.4% (...)
Wenn hours tatsachlich das Arbeitsangebot beim Lohn wage darstellt, lassen sich die Koeffizien-
ten von hours im Sinne einer Preis-Absatz-Funktion (inverse Angebotsfkt) interpretieren:
hours (OLSTrunc) = +0.002: Damit die angebotene Arbeitszeit der Frauen um eine Stunde pro
Woche steigt, muss der Lohn um 0.2% steigen (im Schnitt ...)
hours (OLSCens) = +0.049: Damit die angebotene Arbeitszeit der Frauen um eine Stunde pro
Woche steigt, muss der Lohn um 4.9% steigen (im Schnitt ...)

10