Sie sind auf Seite 1von 55

` variables instrumentales - IV models.

Mod` eles a
tre vraie Lhypoth` ese de la moyenne-conditionnelle nulle doit e pour pouvoir appliquer la m ethode des moindres carr es ordinaires. Il existe trois situations assez courantes qui violent cette hy conomie : poth` ese dans les recherches en e ` savoir la d 1. lendog en eit e, a etermination simultan ee de la variable d ependante et des variables explicatives 2. le biais de la variable omise 3. les erreurs dans les variables, telles que des erreurs de mesure ou dencodage des variables explicatives.

Bien que ces probl` emes aient des origines tr` es diff erentes, ils tre trait ` laide dun m peuvent e es a eme outil, les variables instrumentales - IV the instrumental-variables. Une variable est endog` ene si elle est corr el ee au terme derreur. y = 1x1 + 2x2 + . . . + k xk + xj est endog` ene si Cov [xj , ] = 0 xj est exog` ene si Cov [xj , ] = 0 ` variance minimale si et seuleLes estimateurs des MCO sont a ment si Cov [xj , ] = 0

Cette hypoth` ese dune covariance nulle implique que E [] = 0 gale a ` z Lhypoth` ese desp erance conditionnelle e ero E [|X] = 0 gale a ` z est sufsante pour que la variance conditionnelle e ero soit vraie.

conomiques Lendog en eit e dans les relations e

conomistes mod conomiques Les e elisent souvent les comportements e comme des syst` emes d equations simultan ees dans lesquels les variables endog` enes sont d etermin ees par dautres variables endog` enes et des variables exog` enes. Prenon lexemple bien connu de loffre et de la demande : on crit habituellement : e q d = 0 + 1p + 2inc (1) pour indiquer que la quantit e demand ee dun bien (q) d epend de son prix (p) et du revenu de lacheteur (inc). Lorsque 0 > 0, 1 < 0 et 2 > 0, la courbe de demande dans lespace [p, q ] a tant donn une pente n egative, et e e le prix, la quantit e demand ee va

saccro tre avec le revenu de lacheteur. ` l Si nous ajoutons un terme derreur a equation, et que lon ` laide des pairs [p, q ], les esestime l equation par les MCO a timations ne seront pas de variance minimale car la variable ind ependante est endog` ene : dans l equation ci-dessus, un choc ` savoir, le prix sur la courbe de demande va modier l equilibre, a et la quantit e sur le march e. Par d enition, le choc est corr el e au prix p. Il nous manque souvent les donn ees micro economiques, ou les donn ees de m enages qui nous permettraient destimer la relation ees pour un bien donn e. Habituellement, on dispose plut ot de donn es de march e. Les observations de p et q sont des prix et quantit ` des p d equilibre a eriodes diff erentes.

Comment utiliser les donn ees de march e pour estimer la courbe de demande dun bien? Pour ce faire, il faut sp ecier des instruments pour p qui ne ` mais n ` p. sont pas corr el es a eanmoins fortement corr el es a Cette proc edure est quali ee de probl` eme didentication. Quest-ce qui va nous permettre didentier ou de d eterminer la courbe de demande? ` savoir loffre; tout facConsid erons lautre partie du march e, a teur intervenant dans la fonction doffre qui nappara t pas dans la fonction de demande constituera un instrument valable. Si on mod elise la demande pour un bien agricole, des facteurs tels tre utilis que les pr ecipitations ou le climat pourront e es.

conomique, ces facteurs apparaissent dans les Dans ce mod` ele e quations sous forme r e eduite de q et de p : il sagit l` a de la forme alg ebrique du syst` eme d equations simultan ees. ` variance minimale de l Pour d eriver des estimateurs a equation ci-dessus, il nous faut trouver une variable instrumentale -IV qui satisfasse aux conditions suivantes : tre non corr les instruments z doivent e el es avec tre fortement corr ` p. les instruments z doivent e el es a Comme il nest pas possible dobserver , on ne peut pas tester directement lhypoth` ese de non corr elation entre z et , que lon peut qualier aussi dhypoth` ese dorthogonalit e. Mais en pr esence de plusieurs instruments, on peut construire un tel test.

En revanche, on peut facilement tester la seconde hypoth` ese en ` laide de r r egressant p sur linstrument z a egression auxiliaire suivante : pi = 0 + pi1zi + i (2) ` rejeter lhypoth` Si on ne parvient pas a ese nulle H0 : pi1 = 0 on conclut que z ne constitue pas un bon instrument. En revanche, ` assurer quil ne le non rejet de lhypoth` ese nulle ne suft pas a sagit pas dun faible instrument. Si lon d ecide que lon a un instrument valide, comment lutiliser?

y = X + egresseur On d enit Z de la m eme dimension que X dans laquelle le r endog` ene -p de notre exemple est remplac e par z . Zy = ZX + Z ` implique que 1/N (Z) Lhypoth` ese que Z est non corr el ee a tend vers z ero en probabilit e alors que N devient grand. Ainsi, IV a ` partir de : on d enit lestimateur IV Zy = ZX (3) IV = (ZX)1Zy (4)

gale On peut aussi utiliser lhypoth` ese desp erance math ematique e ` z a ero pour d enir lestimateur de la m ethode des moments pour le mod` ele IV. On d enit une matrice Z comme plus haut dans laquelle chaque regresseur endog` ene sera remplac e par son instrument, ` lestimateur de la m conduisant ainsi a ethode des moments pour . Z = 0 Z(y X ) = 0 (5) (6)

` partir de notre On peut alors substituer les moments calcul es a chantillon dans lexpression et remplacer les coefcients incone . nus avec les valeurs estim ees IV = 0 Zy ZX IV = (ZX)1Zy ese Lestimateur IV a un cas particulier int eressant : Si lhypoth`

desp erance conditionnelle nulle se tient, chaque variable ex tre utilis plicative peut e ee comme son propre instrument, X = Z ` un estimateur des MCO. Ainsi, et lestimateur IV se r eduit alors a lestimateur des MCO appara t comme un cas particulier des IV qui est appropri e lorsque lhypoth` ese desp erance conditionnelle nulle est satisfaite.

Les doubles moindres carr es - 2SLS - two-stage least-squares

Consid erons le cas dun regresseur endog` ene et de plusieurs instruments potentiels. Dans l equation (1), on pourrait avoir deux instruments potentiels : z1 et z2. On pourrait appliquer lestimateur IV de l equation (3) avec z1 entrant dans z et obtenir une estimaIV et les deux estimations seraient diff tion de erentes. Lapproche des doubles moindres carr es - DMC - combine plusieurs tre utilis instruments en un instrument optimal, qui peut alors e e pour d eterminer lestimateur IV. Cette combinaison optimale suppose de faire une r egression. Consid erons la r egression auxiliaire (2) qui permet de tester si les instruments candidats z sont suffisamment corr el es au r egresseur.

tendre le mod` On peut donc e ele, pi = 0 + 1zi1 + 2z2i + i ` paret obtenir un instrument qui est en fait la valeur estim ee p a tant donn tir de l equation ; e e les MCO, p est une combinaison lin eaire optimale de linformation donn ee par z1 et z2. On peut alors estimer les param` etres de (3) en utilisant lestimateur IV avec p comme une colonne de Z. La m ethode des doubles moindres carr es est donc lestimateur IV avec une r` egle de d ecision qui r eduit le nombre dinstruments au n ecessaire pour estimer l equation et d eterminer Z; Z est une matrice dinstruments de dimension N l, l k . = Z(ZZ)1ZX X (7)

Soit la matrice de projection PZ = Z(ZZ)1Z, alors 2SLS = (X X)1X y = [XZ(ZZ)1ZX]1[XZ(ZZ)1Zy] = (XPzX)1XPZy

(8) (9) (10)

tapes (des doubles moindres carr o` u lestimateur en deux e es) peut tre calcul e e en une fois en utilisant les donn ees sur X, Z, y. Lorsque l = k , les DMC se r eduisent aux IV, et par cons equent la galement lestimateur formule des DMC donn ee ci-dessous couvre e IV.

Supposons des erreurs ind ependantes et de distributions iden chantillon tiques i.i.d, un estimateur de variance minimale dun grand e des DMC s ecrit : 2SLS] = Var[ 2[XZ(ZZ)1ZX]1 = 2(XPzX)1 (11) o` u ` partir de calcul ea = N
2

(12)

2SLS = y X (13) Bien que lon parle des doubles moindres carr es comme dun tapes (pour des raisons p processus en deux e edagogiques), on ne ` lestimation en deux e tapes a ` la main car proc` ederait jamais a ` la main, sinon on obtiendrait des r esultats biais es. Si on le faisait a a ` estimer X ` partir dune premi` c a reviendrait a ere r egression des

` utiliser les estimations variables endog` enes sur les instruments et a dans une seconde r egression des MCO. En faisant cela, la seconde r egression g en` ererait des r esidus incorrects 2SLS =yX au lieu des r esidus corrects 2SLS = y X En utilisant la commande ivreg pour les DMC dans Stata, on vite ces probl` e emes. La formulation dans Stata ivreg q inc (p = rainfall temperature) tre estim ` laide de inc et p avec permet dindiquer que q doit e ea rainf all et temperature comme instruments. Comme pour les

MCO et la commande regress, une constante est inclue et appara t , implicitement dans la liste des instruments utilis es pour sp ecier Z tape. la matrice des instruments utilis es lors de la premi` ere e ivreg y x2 (x3 x4 = za zb zc zd ) ` Stata quels sont les inIl nest pas n ecessaire dindiquer a ` utiliser pour chaque variable endog` struments a ene car dans la m ethode des DMC, tous les instruments sont utilis es comme tape. Dans notre exemple, x3 x4 r egresseurs dans la premi` ere e ` laide de z. sont estim es a

Tests didentication

quation sont dits identi Les param` etres (coefcients) dune e es lorsquil y a sufsamment dinstruments valides de sorte que lestimateur des DMC en d etermine une estimation unique. L equation (9) 2SLS est unique si et seulement si ZZ est une matrice montre que l l non singuli` ere de rang k . Si les instruments sont lin eairement ind ependants, ZZ sera non singuli` ere. Le fait que ZX soit de rang k est connu comme la condition de rang. Le fait que la matrice soit l k est la condition dordre. 1. si le rang est ZX < k , l equation est dite sous-identi ee 2. si le rang est ZX = k , l equation est dite exactement identi ee 3. si le rang est ZX > k , l equation est dite sur-identi ee

` la condition de rang mais qui ne Les instruments qui satisfont a sont pas sufsamment corr el es aux variables endog` enes dans les chantillons sont quali grands e es de faibles instruments. quations exactement identi Les param` etres des e ees peuvent tre estim e es par la m ethode IV. quations sur-identi tre es Les param` etres des e ees peuvent e tim es par la m ethode IV en combinant les instruments comme dans la m ethode des DMC. La sur-identications produit des chantillons. estimations plus efcaces dans le cas des grands e value lad On e equation des instruments dans un context de sur` laide dun test de sur-identication: les r identication a esidus des DMC sont r egress es sur les toutes les variables exog` enes.

` Sous H0 : tous les instruments sont non corr el es a la statistique du multiplicateur de lagrange LM est utilis ee, il suit une distribution 2(r), avec r le nombre de restrictions suridenti ees, cest-` a-dire le nombre dinstruments en plus. Si lhypoth` ese est rejet ee, on peut alors douter que lensemble des instruments est appropri e. Ce test de Sargan (1958) ou de Basmann (1960) est ` laide de la commande overid. propos e dans Stata a
3.0.1

Application

` Prenons un exemple classique qui porte sur l etude des salaires a chantillon de 758 jeunes hommes. La base de donn partir dun e ees am ericaine NLS -National Longitudinal Survey - est int eressante

car elle combine des informations sur les revenus, le niveau d etude ainsi que des mesures de laptitude des individus. La base contient deux mesures des aptitudes, un score du QI -quotient intellectuel et un test sur la connaissance du monde du travail - knowledge of the wordld of work (kww)-. Les mod` eles de Griliches permettent dexpliquer les salaires en fonction dun certain nombre de facteurs tels que le nombre dann ees d ecole s, le nombre dann ees dexp erience expr, et le nombre dann ees pass ees dans la m eme entreprise tenure; une variable indicatrice indiquant si la personne r eside dans le sud des EtatsUnis rns; un indicateur pour la r esidence urbaine plut ot que rurale smsa; et un ensemble de variables indicatrices pour les ann ees dans la mesure o` u les donn ees sont des donn ees annuelles en coupe, telles que le QI iq, le niveau d etude de la m` ere med, le score au

test kww, l age du travailleur; le statut marital mrt.


. use http://www.stata-press.com/data/imeus/griliches, clear . summarize lw s expr tenure rns smsa iq med kww age mrt Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------lw | 758 5.686739 .4289494 4.605 7.051 s | 758 13.40501 2.231828 9 18 expr | 758 1.735429 2.105542 0 11.444 tenure | 758 1.831135 1.67363 0 10 rns | 758 .2691293 .4438001 0 1 -------------+-------------------------------------------------------smsa | 758 .7044855 .456575 0 1 iq | 758 103.8562 13.61867 54 145 med | 758 10.91029 2.74112 0 18 kww | 758 36.57388 7.302247 12 56 age | 758 21.83509 2.981756 16 30 -------------+-------------------------------------------------------mrt | 758 .5145119 .5001194 0 1

valuer On utilise loption rst pour la commande ivreg pour e le degr e de corr elation entre les quatre facteurs et la variable endog` ene iq. I est une commande qui permet dintroduire les indicatrices viter la colin pour les ann ees (lann ee 66 est exclue pour e earit e parfaite).
. ivreg lw s expr tenure rns smsa _I* (iq = med kww age mrt), first First-stage regressions ----------------------Source | SS df MS ----------+-----------------------------Model | 47176.4676 15 3145.09784 Number of obs = F( 15, 742) = Prob > F = 758 25.03 0.0000

Residual | 93222.8583 742 125.637275 ----------+-----------------------------Total | 140399.326 757 185.468066

R-squared = Adj R-squared = Root MSE =

0.3360 0.3226 11.209

--------------------------------------------------------------------------iq | Coef. Std. Err. t P>|t| [95% Conf. Interval] ----------+---------------------------------------------------------------s | 2.497742 .2858159 8.74 0.000 1.936638 3.058846 expr | -.033548 .2534458 -0.13 0.895 -.5311042 .4640082 tenure | .6158215 .2731146 2.25 0.024 .0796522 1.151991 rns | -2.610221 .9499731 -2.75 0.006 -4.475177 -.7452663 smsa | .0260481 .9222585 0.03 0.977 -1.784499 1.836595 _Iyear_67 | .9254935 1.655969 0.56 0.576 -2.325449 4.176436 _Iyear_68 | .4706951 1.574561 0.30 0.765 -2.620429 3.56182 _Iyear_69 | 2.164635 1.521387 1.42 0.155 -.8221007 5.15137 _Iyear_70 | 5.734786 1.696033 3.38 0.001 2.405191 9.064381 _Iyear_71 | 5.180639 1.562156 3.32 0.001 2.113866 8.247411 _Iyear_73 | 4.526686 1.48294 3.05 0.002 1.615429 7.437943 med | .2877745 .1622338 1.77 0.077 -.0307176 .6062665

kww | .4581116 .0699323 6.55 0.000 .3208229 .5954003 age | -.8809144 .2232535 -3.95 0.000 -1.319198 -.4426307 mrt | -.584791 .946056 -0.62 0.537 -2.442056 1.272474 _cons | 67.20449 4.107281 16.36 0.000 59.14121 75.26776 --------------------------------------------------------------------------Instrumental variables (2SLS) regression Source | SS df MS ----------+-----------------------------Model | 59.2679161 12 4.93899301 Residual | 80.0182337 745 .107407025 ----------+-----------------------------Total | 139.28615 757 .183997556 Number of obs F( 12, 745) Prob > F R-squared Adj R-squared Root MSE = = = = = = 758 45.91 0.0000 0.4255 0.4163 .32773

-------------------------------------------------------------------------lw | Coef. Std. Err. t P>|t| [95% Conf. Interval] ----------+---------------------------------------------------------------iq | .0001747 .0039374 0.04 0.965 -.0075551 .0079044

s | .0691759 .013049 5.30 0.000 .0435587 .0947931 expr | .029866 .006697 4.46 0.000 .0167189 .0430132 tenure | .0432738 .0076934 5.62 0.000 .0281705 .058377 rns | -.1035897 .0297371 -3.48 0.001 -.1619682 -.0452111 smsa | .1351148 .0268889 5.02 0.000 .0823277 .1879019 _Iyear_67 | -.052598 .0481067 -1.09 0.275 -.1470388 .0418428 _Iyear_68 | .0794686 .0451078 1.76 0.079 -.009085 .1680222 _Iyear_69 | .2108962 .0443153 4.76 0.000 .1238984 .2978939 _Iyear_70 | .2386338 .0514161 4.64 0.000 .1376962 .3395714 _Iyear_71 | .2284609 .0441236 5.18 0.000 .1418396 .3150823 _Iyear_73 | .3258944 .0410718 7.93 0.000 .2452642 .4065247 _cons | 4.39955 .2708771 16.24 0.000 3.867777 4.931323 ------------------------------------------------------------------------Instrumented: iq Instruments: s expr tenure rns smsa _Iyear_67 _Iyear_68 _Iyear_69 _Iyear_70 _Iyear_71 _Iyear_73 med kww age mrt --------------------------------------------------------------------------

tape - rst-stage regresion- sugg` Les r esultats de la premi` ere e erent ` que trois des quatres instruments sont fortement corr el es avec iq, a lexception de mrt. N eanmoins la variable endog` ene iq a un coefcient IV qui nest pas diff erent de z ero (p-valeur est de 0,965). Etant donn e les autres variables incluses dans la r egression, iq ne semble pas jouer un r ole important comme d eterminant du salaire. tre en accord avec les pr Les autres coefcients semblent e edictions des th eories du travail et les r esultats empiriques habituels.

` lerreur? Les instruments pour iq sont-ils non corr el es a


. overid Tests of overidentifying restrictions: Sargan N*R-sq test Basmann test 87.655 97.025 Chi-sq(3) Chi-sq(3) P-value = 0.0000 P-value = 0.0000

Le test ci-dessus sugg` ere un rejet fort de lhypoth` ese nulle que les instruments sont non corr el es au terme derreur, ce qui implique que la sp ecication de l equation nest pas satisfaisante.

Lestimateur GMM

taient Jusqu` a pr esent, nous avons fait lhypoth` ese que les erreurs e i.i.d. pour d eriver les estimateurs IV et des DMC. Les estimateurs IV et DMC produisent des estimateurs non biais es (consis` variance non minimale (inefcient) ce qui implique tent) mais a que lon applique une m ethode robuste pour les estimer. Lestimateur des moments g en eralis es (GMM - Generalized Meth` variance ods of Moments) produira des estimateurs non biais es a minimale en pr esence derreurs non i.i.d. L equation qui nous int eresse s ecrit : y = X + E[|X] =

Le terme derreur suit une distribution desp erance nulle et tre distingu est sa matrice de covariance. Quatre cas doivent e es : 1. lhomosc edasticit e 2. lh et erosc edasticit e conditionnelle 3. le regroupement clustering 4. la pr esence dh et erosc edasticit e et dautocorr elation (-HAC) Certains regresseurs sont endog` enes de sorte que E[x] = 0. On s epare les r egresseurs en deux groupes {x1 x2} avec dune part, les regresseurs {x1} consid er es comme endog` enes et ceux (k k1) suppos es exog` enes. La matrice des variables instrumentales Z est N l. Ces variables sont suppos ees exog` enes : E [z]. On partitionne les instru-

ments en {z1 z2} avec l1 instruments {z1} exclus et les (l l1) instruments restant {z2 x2} sont les instruments inclus ou les variables exog` enes.
4.1

Les estimateurs GMM

Les estimateurs standards IV et DMC deviennent des cas particuliers des estimateurs GMM. Lhypoth` ese selon laquelle les instruments Z sont exog` enes peut sexprimer comme un ensemble de conditions sur les moments E [z] = 0. Les l instruments donnent un ensemble de l moments: gi( ) = Zii = Zi(yi xi ) o` u gi est l 1. Ces conditions impliquent que Z et sont non

corr el es, cest pourquoi elles sont souvent quali ees de condition dorthogonalit e. On obtient ainsi un ensemble de l moments : 1 N 1 N 1 N g i ( ) = zi(yi xi ) = Z g ( ) = N i=1 N i=1 N i=1 Lintuition du GMM est de choisir un estimateur pour qui GMM ) = 0 r esoud g ( ` estimer est exactement identi Si l equation a ee l = k , on a autant de conditions pour les moments que dinconnus. On peut alors r esoudre les l conditions pour les k coefcients dans GMM . Il y a donc un unique GMM qui r GMM ) = 0. esoud g ( ` lestimateur IV standard Cet estimateur de GMM est identique a de (4). Si l equation est suridenti ee, l > k , on a donc plus d equations

GMM que dinconnus. On risque de ne pas trouver un k-vecteur GMM ) = qui permette de r esoudre les l conditions de moments, g ( GMM de sorte que les 0. Par cons equent, il nous faut choisir GMM ) soient le plus proche de z l e ements de g ( ero que possiGMM )g GMM ), ble.On pourrait obtenir cela en minimisant g ( ( ` la m mais cette m ethode ne permet pas a ethode GMM de pro` variance minimale lorsque les erreurs ne duire des estimateurs a sont pas i.i.d. GMM qui minPour cette raison, lestimateur de GMM choisit le imise : GMM ) = N g GMM )Wg GMM ) J ( ( ( (14) pour lequel W est une matrice pond er ee de taille l l qui tient GMM ) lorsque les erreurs sont compte des corr elations entre les g (

non i.i.d. qui minimise J ( GMM ). Un estimateur GMM pour est le ` lordre un, Lorsque lon d erive et que lon r esoud les conditions a GMM ) J ( =0 on obtient lestimateur GMM pour l equation sur-identi ee : GMM = (XZWZX)1(XZWZy) (15) Il y a autant destimateurs GMM que de matrices pond er ees W. La matrice de poids ne joue quen pr esence de sur-identication. Lorsque l equation est parfaitement identi ee alors W = iN. La matrice de poids optimal est telle que W = s1 o` u S est une matrice de covariance des conditions de moments g :

S = E [Z Z ] = E [Z Z ] (16) o` u S est une matrice l l. Si on substitue cette matrice dans (14), on obtient un estimateur GMM efcace : EGMM = (XZS1ZX)1(XZS1Zy) On peut noter la g en eralit e de cette approche. En effet, aucune t hypoth` ese na e e faite sur , la matrice des covariances des er tre estim reurs. Mais lestimateur GMM ne peut pas e e car S est inconnu. Il nous faut donc estimer S, ce qui implique de faire des ` propos d . hypoth` eses a Supposons que lon ait un estimateur de variance minimale pour . On peut utiliser lestimateur pour d S not eS enir un estimateur

tapes quasi g GMM en deux e en eralis es (a feasible efcient twostep GMM estimator (FEGMM)) estim e par la commande ivreg2 tape, on lorsque loption gmm est appliqu ee. Dans la premi` ere e utilise une estimation standard des DMC pour engendrer des esti tape, on mations des coefcients et des r esidus. Dans la seconde e a ` partir fait une hypoth` ese sur la structure de pour produire S des r esidus, d enissant ainsi lestimateur FEGMM: FEGMM = (XZS 1ZX)1(XZS 1Zy)
4.2

GMM dans un context homosc edastique

Si on suppose que = 2IN , la matrice de poids optimale sera ` la matrice identit proportionnelle a e. Lestimateur GMM est simplement lestimateur IV standard.

4.3

cart-types h GMM et les e et erosc edastiques

Il nous faut un estimateur qui tienne compte de lh et erosc edasticit e S tel que 1 N 2 S= i ZiZi N i=1 Si la r egression est exactement identi ee avec l = k , le r esultats de ` la commande ivreg2, la commande ivreg2, gmm sera identique a robust. Pour les mod` eles sur-identi es, lapproche GMM fait un meilleur usage de linformation des l conditions que la m ethode standard des DMC.

Pour comparer la m ethode GMM avec la m ethode DMC, on es` nouveau l time a equation de salaire en utilisant loption gmm. tape engendre automatiquement des e cart-types robustes a ` Cette e lh et erosc edasticit e. Par d efaut, ivreg2 rapporte des statistiques chantillons. pour les coefcients z pour de grands e
. ivreg2 lw s expr tenure rns smsa _I* (iq = med kww age mrt), gmm GMM estimation -------------Number of obs F( 12, 745) Prob > F Centered R2 Uncentered R2 Root MSE = = = = = = 758 49.67 0.0000 0.4166 0.9967 .33

Total (centered) SS Total (uncentered) SS Residual SS

= = =

139.2861498 24652.24662 81.26217887

--------------------------------------------------------------------------| Robust lw | Coef. Std. Err. z P>|z| [95% Conf. Interval] ----------+---------------------------------------------------------------iq | -.0014014 .0041131 -0.34 0.733 -.009463 .0066602 s | .0768355 .0131859 5.83 0.000 .0509915 .1026794 expr | .0312339 .0066931 4.67 0.000 .0181157 .0443522 tenure | .0489998 .0073437 6.67 0.000 .0346064 .0633931 rns | -.1006811 .0295887 -3.40 0.001 -.1586738 -.0426884 smsa | .1335973 .0263245 5.08 0.000 .0820021 .1851925 _Iyear_67 | -.0210135 .0455433 -0.46 0.645 -.1102768 .0682498 _Iyear_68 | .0890993 .042702 2.09 0.037 .0054049 .1727937 _Iyear_69 | .2072484 .0407995 5.08 0.000 .1272828 .287214 _Iyear_70 | .2338308 .0528512 4.42 0.000 .1302445 .3374172 _Iyear_71 | .2345525 .0425661 5.51 0.000 .1511244 .3179805 _Iyear_73 | .3360267 .0404103 8.32 0.000 .2568239 .4152295 _cons | 4.436784 .2899504 15.30 0.000 3.868492 5.005077 --------------------------------------------------------------------------Hansen J statistic (overidentification test of all instruments): 74.165

Chi-sq(3) P-val = 0.00000 --------------------------------------------------------------------------Instrumented: iq Instruments: med kww age mrt s expr tenure rns smsa _Iyear_67 _Iyear_68 _Iyear_69 _Iyear_70 _Iyear_71 _Iyear_73 ---------------------------------------------------------------------------

On constate que le regresseur endog` ene iq ne joue toujours aucun r ole dans l equation. La statistique Hansen donn ee avec les r esultats ivreg2 est l equivalent pour la m ethode GMM du test de Sargan que lon obtient avec overid. Lind ependance des instruments et des erreurs est remise en question ici par le fort rejet de lhypoth` ese null du test J.

4.4

cart-types HAC GMM et les e

Lorsque les erreurs sont conditionnellement h et erosc edastiques et autocorr el ees (HAC), on peut d eterminer une estimation HAC de S pour d eterminer des estimations des param` etres appropri es. La routine ivreg2 d eterminera lestimation Newey-West de la matrice ` laide de la pond des variance-covariances des estimateurs a eration Bartlett-Kernel lorsque les options robust et bw() sont sp eci ees.
4.4.1

Application

` laide de s eries Pour illustrer, on estime une courbe de Phillips a temporelles annuelles pour les Etats-Unis de 1948-1996. Les statis` la consommation tiques descriptives pour lination li ee aux prix a

(cinf) et le taux de ch omage (unem) sont donn es dans le tableau ci-dessous :


. use http://www.stata-press.com/data/imeus/phillips, clear . summarize cinf unem if cinf<.

Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------cinf | 48 -.10625 2.566926 -9.3 6.6 unem | 48 5.78125 1.553261 2.9 9.7

Une relation de Phillips est une relation entre lination sur les prix ou les salaires et le taux de ch omage. Dans ce mod` ele, les variable devraient avoir une relation n egative, un ch omage plus faible ` une pression a ` la hausse des salaires et des prix. Etant conduisant a donn e que chaque variable est d etermin ee est d etermin ee au sein de lenvironnement macro economique, on ne peut pas les consid erer

comme exog` enes. Lorsque lon utilise les donn ees, on r egresse lination sur le taux de ch omage. An de traiter la question de la simultan eit e, on utilise comme instrument le taux de ch omage avec un d ecalage de deux ou trois p eriodes. Lorsque lon sp ecie bw(3), gmm et robust, ivreg2 va produire une estimation GMM efcace.
. ivreg2 cinf (unem = l(2/3).unem), bw(3) gmm robust GMM estimation -------------Heteroskedasticity and autocorrelation-consistent statistics kernel=Bartlett; bandwidth=3 time variable (t): year Number of obs = 46

Total (centered) SS Total (uncentered) SS Residual SS

= = =

217.4271745 217.4900005 244.9459113

F( 1, 44) Prob > F Centered R2 Uncentered R2 Root MSE

= = = = =

0.39 0.5371 -0.1266 -0.1262 2.3

--------------------------------------------------------------------------| Robust cinf | Coef. Std. Err. z P>|z| [95% Conf. Interval] ----------+---------------------------------------------------------------unem | .1949334 .3064662 0.64 0.525 -.4057292 .795596 _cons | -1.144072 1.686995 -0.68 0.498 -4.450522 2.162378 --------------------------------------------------------------------------Hansen J statistic (overidentification test of all instruments): 0.589 Chi-sq(1) P-val = 0.44262 -------------------------------------------------------------------------Instrumented: unem Instruments: L2.unem L3.unem --------------------------------------------------------------------------

La relation telle que nous lavions anticip ee nest pas conrm ee par les estimations, comme de nombreux chercheurs ont peu en tait effectivement faire lexp erience. La relation originale qui e valide, a cess e de fonctionner dans les ann ees 1970 en pr esence de chocs doffres (chocs p etroliers) et de forte ination. Pour ce qui est de la technique IV, on peut constater que la statistique J du test Hansen indique que les instruments sont non corr el es avec les erreurs. Si en revanche, on utilisait les premier et second d ecalages du ch omage, le test J rejetterai lhypoth` ese nulle avec une p-valeur de 0,02. Le premier d ecalage de unem nest donc pas un instrument appropri e pour cette sp ecication.

Test pour la sur-identication pour la m ethode GMM

De m eme que pour les DMC, on peut tester la validit e de la suridentication dans le cas de la m ethode GMM. On utilise la statistique J Hansen : EGMM ) 2 EGMM ) = N g EGMM )S 1g ( J ( ( lk value lensemble Le test Hansen-Sargan pour la sur-identication e des restrictions. Dans un mod` ele qui contient un grand nombre dinstruments, le test de C quali e de difference-in-Sargan test C est plus appropri e. Il permet de tester un sous ensemble des conditions dorthogonalit e dorigine. La statistique est calcul ee comme la diff erence entre les deux statistiques J. C est distribu ee suivant gale a ` la perte des restrictions ou le un 2 au nombre de degr es e

nombre dinstrument suspects test es. Un exemple de C est donn e ci-dessous pour savoir si s est un instrument valide.
. ivreg2 lw s expr tenure rns smsa _I* (iq = med kww age mrt), gmm orthog(s) GMM estimation -------------Number of obs F( 12, 745) Prob > F Centered R2 Uncentered R2 Root MSE = = = = = = 758 49.67 0.0000 0.4166 0.9967 .33

Total (centered) SS Total (uncentered) SS Residual SS

= = =

139.2861498 24652.24662 81.26217887

---------------------------------------------------------------------------

| Robust lw | Coef. Std. Err. z P>|z| [95% Conf. Interval] ----------+---------------------------------------------------------------iq | -.0014014 .0041131 -0.34 0.733 -.009463 .0066602 s | .0768355 .0131859 5.83 0.000 .0509915 .1026794 expr | .0312339 .0066931 4.67 0.000 .0181157 .0443522 tenure | .0489998 .0073437 6.67 0.000 .0346064 .0633931 rns | -.1006811 .0295887 -3.40 0.001 -.1586738 -.0426884 smsa | .1335973 .0263245 5.08 0.000 .0820021 .1851925 _Iyear_67 | -.0210135 .0455433 -0.46 0.645 -.1102768 .0682498 _Iyear_68 | .0890993 .042702 2.09 0.037 .0054049 .1727937 _Iyear_69 | .2072484 .0407995 5.08 0.000 .1272828 .287214 _Iyear_70 | .2338308 .0528512 4.42 0.000 .1302445 .3374172 _Iyear_71 | .2345525 .0425661 5.51 0.000 .1511244 .3179805 _Iyear_73 | .3360267 .0404103 8.32 0.000 .2568239 .4152295 _cons | 4.436784 .2899504 15.30 0.000 3.868492 5.005077 --------------------------------------------------------------------------Hansen J statistic (overidentification test of all instruments): 74.165 Chi-sq(3) P-val = 0.00000

-orthog- option: Hansen J statistic for unrestricted equation:

Chi-sq(2) P-val = C statistic (exogeneity/orthogonality of specified instruments): Chi-sq(1) P-val = Instruments tested: s --------------------------------------------------------------------------Instrumented: iq Instruments: med kww age mrt s expr tenure rns smsa _Iyear_67 _Iyear_68 _Iyear_69 _Iyear_70 _Iyear_71 _Iyear_73 ---------------------------------------------------------------------------

15.997 0.00034 58.168 0.00000

Le test C rejette lhypoth` ese nulle indiquant que linstrument sus choue au test de suridentication. La statistique J signipect s e cative de 15,997 pour l equation qui exclut les instruments suspects the suspect implique que le fait de traiter s comme exog` ene quation non satisfaisante. Les instruments restant d ebouche sur une e tre ind ne semblent pas e ependants des erreurs.

Loption orthog() permet de tester si un sous-ensemble dinstruments exclus est effectivement exog` ene. On inclut l age et lindicatrice du statut marital dans la liste des variables en option.
. ivreg2 lw s expr tenure rns smsa _I* (iq = med kww age mrt), gmm orthog( age mrt) GMM estimation -------------Number of obs F( 12, 745) Prob > F Centered R2 Uncentered R2 Root MSE = = = = = = 758 49.67 0.0000 0.4166 0.9967 .33

Total (centered) SS Total (uncentered) SS Residual SS

= = =

139.2861498 24652.24662 81.26217887

---------------------------------------------------------------------------

| Robust lw | Coef. Std. Err. z P>|z| [95% Conf. Interval] ----------+---------------------------------------------------------------iq | -.0014014 .0041131 -0.34 0.733 -.009463 .0066602 s | .0768355 .0131859 5.83 0.000 .0509915 .1026794 expr | .0312339 .0066931 4.67 0.000 .0181157 .0443522 tenure | .0489998 .0073437 6.67 0.000 .0346064 .0633931 rns | -.1006811 .0295887 -3.40 0.001 -.1586738 -.0426884 smsa | .1335973 .0263245 5.08 0.000 .0820021 .1851925 _Iyear_67 | -.0210135 .0455433 -0.46 0.645 -.1102768 .0682498 _Iyear_68 | .0890993 .042702 2.09 0.037 .0054049 .1727937 _Iyear_69 | .2072484 .0407995 5.08 0.000 .1272828 .287214 _Iyear_70 | .2338308 .0528512 4.42 0.000 .1302445 .3374172 _Iyear_71 | .2345525 .0425661 5.51 0.000 .1511244 .3179805 _Iyear_73 | .3360267 .0404103 8.32 0.000 .2568239 .4152295 _cons | 4.436784 .2899504 15.30 0.000 3.868492 5.005077 --------------------------------------------------------------------------Hansen J statistic (overidentification test of all instruments): 74.165 Chi-sq(3) P-val = 0.00000

-orthog- option: Hansen J statistic for unrestricted equation:

Chi-sq(1) P-val = C statistic (exogeneity/orthogonality of specified instruments): Chi-sq(2) P-val = Instruments tested: age mrt --------------------------------------------------------------------------Instrumented: iq Instruments: med kww age mrt s expr tenure rns smsa _Iyear_67 _Iyear_68 _Iyear_69 _Iyear_70 _Iyear_71 _Iyear_73 ---------------------------------------------------------------------------

1.176 0.27822 72.989 0.00000

L equation estim ee sans les instruments suscepts, et sans les conditions dorthogonalit e age et mrt, a un J signicatif, alors que C pour les deux instruments est fortemenet signicatif. Pour savoir si on a obtenu une sp ecication plus appropri ee, on r eestime l equation avec la liste r eduite dinstruments.

. ivreg2 lw s expr tenure rns smsa _I* (iq = med kww), gmm GMM estimation -------------Number of obs = 758 F( 12, 745) = 30.77 Prob > F = 0.0000 Total (centered) SS = 139.2861498 Centered R2 = 0.1030 Total (uncentered) SS = 24652.24662 Uncentered R2 = 0.9949 Residual SS = 124.9413508 Root MSE = .41 --------------------------------------------------------------------------| Robust lw | Coef. Std. Err. z P>|z| [95% Conf. Interval] ----------+---------------------------------------------------------------iq | .0240417 .0060961 3.94 0.000 .0120936 .0359899 s | .0009181 .0194208 0.05 0.962 -.0371459 .038982 expr | .0393333 .0088012 4.47 0.000 .0220833 .0565834 tenure | .0324916 .0091223 3.56 0.000 .0146122 .050371

rns | -.0326157 .0376679 -0.87 0.387 -.1064433 .041212 smsa | .114463 .0330718 3.46 0.001 .0496434 .1792825 _Iyear_67 | -.0694178 .0568781 -1.22 0.222 -.1808968 .0420613 _Iyear_68 | .0891834 .0585629 1.52 0.128 -.0255977 .2039645 _Iyear_69 | .1780712 .0532308 3.35 0.001 .0737407 .2824016 _Iyear_70 | .139594 .0677261 2.06 0.039 .0068533 .2723346 _Iyear_71 | .1730151 .0521623 3.32 0.001 .070779 .2752512 _Iyear_73 | .300759 .0490919 6.13 0.000 .2045407 .3969772 _cons | 2.859113 .4083706 7.00 0.000 2.058721 3.659504 -----------------------------------------------------------------------------Hansen J statistic (overidentification test of all instruments): 0.781 Chi-sq(1) P-val = 0.37681 --------------------------------------------------------------------------Instrumented: iq Instruments: med kww s expr tenure rns smsa _Iyear_67 _Iyear_68 _Iyear_69 _Iyear_70 _Iyear_71 _Iyear_73 ---------------------------------------------------------------------------

En accord avec la th erie, iq appara t comme un regresseur signicatif pour la premi` ere fois et la statistique J de l equation est satisfaisante. Le regresseur s, qui est apparu comme inappropri e pr ec edemment ne joue pas de r ole dans lestimation.