Sie sind auf Seite 1von 76

Modles Estims sur Donnes de Panel

Introduction Il est frquent en conomtrie quon ait composer avec des donnes deux dimensions : une dimension chronologique une dimension spatiale

Par exemple, on sintresse la relation qui existe entre le ROA dune banque et un certain nombre de ratios reprsentatifs soit de la structure de son bilan, soit de son activit au cours de lexercice coul. On a rassembl cet effet un certain nombre dinformations relatives aux valeurs prises par ces ratios pour un chantillon de 24 banques europennes (UK, France, Allemagne) sur la priode 1995 2000 (fichier ROA.xls). Cet chantillon est compos de 24 banques : cest la dimension spatiale de lchantillon. Ces banques tant de tailles et de nationalits diffrentes on comprend que la question de lhomognit / htrognit des donnes se pose avec acuit. Pour chaque banque on dispose dobservations dans le temps (de 1995 2000) : cest la dimension chronologique. Quel intrt peut-il y avoir traiter de lestimation dune relation avec ce genre de donnes ? Ce qui est intressant avec les donnes de panel, cest quelles vont nous permettre de rpondre certaines questions quil eut t impossible dlucider avec un simple chantillon chronologique ou un simple chantillon en cross section . Je mexplique : 1. Imaginons que la relation Ratios de structure ROA ait t estime sur un chantillon de banques en coupe instantane (par exemple, les observations relatives la seule anne 1995) et quon ait pu mettre en vidence le caractre effectif de cette relation. La question quon est en droit de se poser, lissue de cet ajustement est : quest-ce

Philippe ROUS Cours dEconomtrie des Donnes de Panel Master Economie et Finance Facult de Droit et des Sciences Economiques de Limoges

qui nous garantit que cette relation, effective pour lanne 1995, le sera aussi pour les annes ultrieures ? . Nous navons, ce stade l, aucun lment qui nous permette de nous prononcer sur la validit de cette relation dans le temps. 2. De faon un peu diffrente, supposons prsent que cette mme relation ait t estime sur un chantillon de nature chronologique... mais pour une seule banque. Quest-ce qui nous autorise extrapoler cette relation, propre la banque A, une autre banque B ? En dautres termes : la banque A tudie ne prsente-t-elle pas des spcificits telles quil devient difficile de gnraliser les rsultats. Seul un chantillon en donnes de panel est susceptible de nous aider nous prononcer quant la stabilit de la relation dans sa double dimension spatiale et temporelle. Illustration : FATALITY.WF1, FATALITY-1.DOC L'exemple trait ici est emprunt J.H. STOCK et M.W.WATSON 1. Il est destin illustrer justement tout l'intrt qu'on peut trouver exploiter un chantillon en donnes de panel. La problmatique est la suivante : tous les ans, aux USA on dnombre approximativement 40000 dcs par accidents de la route. Dans 1/3 des cas ces accidents impliquent un conducteur en tat d'brit. Une enqute a mme montr qu'entre 1 h et 3 h du matin, un quart des automobilistes dpasse le taux autoris d'alcoolmie. Des mesures de lutte contre l'alcool au volant ont t adoptes ici et l dans diffrents tats des USA. C'est sur l'efficacit de ces mesures au regard du nombre des dcs par accident de la route qu'on s'interroge ici. L'chantillon : pour 48 tats des USA on dispose d'observations annuelles sur la priode 1982 1988 pour ce qui concerne un certain nombre de variables et, notamment : le taux de mortalit par accident de la route MRALLit (nombre de dcs par accident de la route pour 10000 habitants dans l'tat i au cours de

J.H. STOCK et M.W.WATSON : "Introduction to Econometrics" Addison Wesley 2003.

l'anne t) le taux de taxe sur les alcools ajust de l'inflation BEERTAXit

On a reproduit ci-dessous la relation Taxe sur les Alcools Taux de Mortalit en utilisant, pour commencer, l'ensemble de toutes les observations dans le temps et dans l'espace, soit, au total, 48 7 = 336 couples observs :
3 2.5 MRALL 2 1.5 1 0.5 0 0 1 2 BEERTAX 3 4 5

Ce graphique suggre, paradoxalement, une relation positive (!) entre la taxe et le rtaux de mortalit, ce que confirme l'ajustement ralis sur donnes empiles :
Dependent Variable: MRALL_?*10000 Method: Pooled Least Squares Date: 14/05/04 Time: 09:04 Sample: 1982 1988 Included observations: 7 Cross-sections included: 48 Total pool (balanced) observations: 336 Variable C BEERTAX_? R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1.853308 0.364605 0.093363 0.090648 0.543736 98.74685 -271.0387 0.132716 Std. Error 0.043567 0.062170 t-Statistic 42.53913 5.864668 Prob. 0.0000 0.0000 2.040444 0.570194 1.625230 1.647951 34.39433 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

On retrouve ce mme rsultat paradoxal quand on se limite un simple chantillon en coupe instantane pour l'anne 1982 (on a, dans ce cas, 48 observations qui

correspondent, chacune, un des tats) ou encore pour l'anne 1988 :

1982
0.00045 0.0004 0.00035 0.0003 0.00025 0.0002 0.00015 0.0001 0.00005 0 0 0.5 1 1.5 BEERTAX 2 2.5 3

MRALL

1988
0.00035 0.0003 0.00025 MRALL 0.0002 0.00015 0.0001 0.00005 0 0 0.5 1 1.5 BEERTAX 2 2.5

Variable C BEERTAX_? R-squared

Coefficient 1.859073 0.438755 0.134003

Std. Error 0.105989 0.164454

t-Statistic 17.54030 2.667950

Prob. 0.0000 0.0105 2.069594

Mean dependent var

Ajustement 1988

Sur la base de ces rsultats peut-on conclure une relation positive ou, pour le moins,

l'absence de relation entre le taux de taxe et le taux de mortalit ? On peut nourrir quelque soupon quant au sens de cette relation... A ce stade de nos investigations on doit se souvenir que la relation, telle qu'elle est ici spcifie (le taux de mortalit ne dpendrait que du taux de taxe) occulte un certain nombre de variables qui exercent, vraisemblablement, une certaine influence sur le taux de mortalit : l'tat des routes l'tat du parc automobile les habitudes socio-culturelles par rapport la consommation d'alcool la densit urbaine de l'tat considr

autant de variables qui sont susceptibles d'tre corrles la fois avec la variable explique et avec la variable explicative et dont l'omission induit ncessairement un biais sur la valeur estime du coefficient attach la taxe sur les alcools. Certaines de ces variables dont on sait bien qu'elles exercent une influence sur le taux de mortalit sont particulirement difficiles mesurer. Comment mesurer en particulier le niveau de tolrance culturelle dans un tat de l'union par rapport la consommation d'alcool ? Faut-il pour autant renoncer la prise en compte de ces variables en acceptant du mme coup les consquences de leur omission ? Pas ncessairement si certaines conditions sont vrifies. Imaginons que les valeurs prises par ces variables inobservables ou difficilement mesurables puissent tre considres comme constantes travers le temps pour un individu (tat) donn. Tel est par exemple le cas des variables socio-culturelles dont les caractristiques ne se dforment que trs lentement dans le temps. Le modle peut alors tre ainsi spcifi : MRALLit = + BEERTAXit + Zi + it En exprimant les variables en diffrences premires on voit qu'il est possible de se dbarrasser des variables inobservables et d'obtenir ainsi une estimation sans biais du coefficient attach la variable explicative : MRALLit = BEERTAXit + it - i t-1 Le graphique et le tableau ci-dessous reproduisent la relation qui unit la variation de la taxe sur les alcools entre 1982 et 1988 la variation du taux de mortalit sur cette

mme priode. On voit par consquent que, lorsqu'on prend la prcaution, par ce truchement, de composer avec la prsence de spcificits individuelles, la relation est conforme ce que dictait l'intuition : il y a bien un lien ngatif entre l'importance de la taxe et le taux de mortalit.
1 Variation 82 - 88 MRALL 0.5 0 0 -0.5 -1 -1.5 Variation 82 - 88 BEERTAX 20 40 60

Coefficients Constante Variable X 1

Erreur-type

Statistique t

Probabilit

-0.0720371 0.06064401 -1.18786832 0.24098262 -1.04097257 0.41722785 -2.49497383 0.01624848

Avec cet exemple, on peroit dj un peu les bnfices qu'on peut retirer de l'utilisation de donnes de panel : l'estimation de la relation X Y sur donnes chronologiques pour un individu n'est pas toujours possible. Tel est ici le cas : on ne dispose que de 7 observations dans le temps, ce qui est videmment trop peu pour qu'on puisse estimer efficacement le coefficient . Quand bien mme disposerait-on d'un nombre d'observations dans le temps suffisamment grand se poserait ensuite la question du choix de l'individu "reprsentatif" et du caractre gnralisable des rsultats obtenus pour cet individu l'estimation en coupe instantane (envisageable ici puisque le nombre N des individus est suffisamment grand) ne permet pas de composer avec la prsence de spcificits individuelles... ce qui induit, dans ce contexte, un biais sur les coefficients estims Conscients de tout l'intrt qu'il peut y avoir travailler avec des donnes de panel, on

tudie prsent les techniques qui peuvent tre mises en oeuvre pour exploiter le plus efficacement possible toute l'information contenue dans ce type d'chantillon. Section I : structure gnrale et typologie des modles Paragraphe 1 : structure gnrale du modle Quand on travaille sur des donnes de panel, la structure gnrale du modle peut tre exprime, pour lindividu i et pour la date t, sous la forme : Yit = Xit + Zi + it o Yit est lobservation relative au ie individu la date t. it est lerreur du modle relative lindividu i et la date t. On fait sur ce terme derreur un certain nombre dhypothses sur le bien fond desquelles on pourra par la suite sinterroger. En attendant, on suppose que :
E it = E it | X = 0 i, t

E it2 = E it2| X = 2 i, t Le modle ci-dessus peut tre rcrit sous forme matricielle relative lindividu i : Yi = Xi + Zi + i Xi est une matrice T K (o K est le nombre de variables explicatives) 2

X1i1 X Xi = 1i2 X1iT

X 2i1 X 2i2 X 2iT

X Ki1 X Ki2 X KiT

On notera Xk,it la ralisation de la ke variable pour lindividu i et la date t. est, lui, un vecteur colonne (vecteur des coefficients de pente). Dans tout ce qui suit, on supposera que le jeu des coefficients k est intangible dans le temps et dans lespace quoique cette hypothse puisse tre leve... au prix dun degr de complexit bien plus lev.

Attention : les ralisations de X1i ne sont pas gales 1.

Llment Zi est incontestablement le plus intressant de ce modle en cela quil va permettre lutilisateur, en fonction de sa composition, de spcifier lhomognit ou lhtrognit de la relation dans sa dimension spatiale. Zi est une matrice dont la premire colonne Z1i est une constante (suppose gale 1) qui sera la mme dun individu lautre et quelle que soit la date considre. Les autres colonnes, sil y en a, sont les ralisations dun certain nombre de variables, 1. susceptibles de diffrer dun individu lautre 2. mais rputes constantes travers le temps pour un mme individu. Le modle ci-dessus peut donc tre rcrit sous une forme plus dveloppe :

Yi1 X1i1 Y X i2 = 1i2 YiT X1iT

X 2i1 X 2i2 X 2iT

X Ki1 1 1 Z2i X Ki2 2 1 Z2i + X KiT K 1 Z2i

ZHi 1 i1 ZHi 2 i2 + ZHi H iT

Dans le cas de lexplication du ROA de la banque i la date t on retrouve au rang des composantes de Zi : . une variable indicatrice de lactivit (spcialise ou universelle) de cette banque . une variable indicatrice de sa nationalit . une variable indicatrice de la cotation de cette banque et c...

Paragraphe 2 : typologie des modles On peut imaginer trois grands types de modles : . le modle des MCO . le modle effet fixes connu aussi sous le nom de LSDV (Least Squares Dummy Variables) . le modle effet alatoire connu aussi sous le nom de modle composantes derreur

. le modle coefficients alatoires . le modle structure de covariance A - Le modle MCO Cest le plus simple. Il se fonde sur le postulat que les individus qui composent lchantillon sont rigoureusement homognes cest dire ne se dmarquent les uns des autres par aucune caractristique spcifique. Ds lors, il ny a quune composante au vecteur Zi : la constante, commune tous les individus. Le modle est ainsi spcifi : Yit = + Xit + it = + 1 X1,it + ... + K XK,it + it o les coefficients sont estims sur la base dun chantillon lintrieur duquel les donnes sont empiles sans gard par rapport aux individus non plus que par rapport aux dates. En termes matriciels et pour lindividu i on a encore : Yi = Xi + Zi + i mais avec une matrice Zi une seule colonne dont tous les lments sont gaux 1 de telle sorte que la constante est la mme pour tous les individus. A la condition que le postulat dhomognit soit fond dune part et que, dautre part, les proprits relatives it soient vrifies (en particulier labsence dautocorrlation) lestimateur MCO de est sans biais, convergent et de variance minimum. B - Le modle effets fixes (LSDV) Imaginons que chaque individu prsente des caractristiques propres susceptibles daffecter la relation tudie. Dans ce contexte dhtrognit des individus une spcification MCO sur donnes empiles qui postule une mme structure X Y quel que soit lindividu tudi induit un biais domission : lestimateur MCO des k est biais et non convergent (cf. cours Economtrie III). Deux cas de figure peuvent tre envisags : . toutes les caractristiques spcifiques sont observables et quantifiables

10

. certaines ne le sont pas... quoiquon sache quelles existent 1) Toutes les caractristiques spcifiques sont observables et quantifiables En admettant que les spcificits individuelles puissent tre mesures, de faon exhaustive, laune des ralisations de deux variables Z2 et Z3 (variables dans lespace mais constantes dans le temps pour un mme individu) 3, le modle peut alors tre rcrit sous la forme : Yi = Xi + Zi + it

avec :

1 Z2i 1 Z 2i Zi = [iT, Z2i, Z3i] = 1 Z2i

Z3i Z3i Z3i

1 = 2 3

o iT est un vecteur de dimension T dont toutes les composantes sont gales 1. Sous forme matricielle, on peut rcrire ce modle comme : Y=X+Z+
Y11 Y1T Y= YN1 Y NT X1,11 X1,1T X= X1, N1 X 1,NT X K,11 X K,1T X K,N1 X K, NT 1 Z2,1 1 Z2,1 Z = 1 Z2,N 1 Z 2,N Z3,1 Z3,1 Z3,N Z3,N

Tel quil est spcifi, ce modle peut, en principe, tre estim par les MCO. Il est peu vraisemblable cependant que les caractristiques qui dterminent les spcificits individuelles puissent tre recenses et mesures de manire exhaustive et, dans ce

Par exemple, dans le cas de lexplication du ROA de la banque i la date t on retrouve au rang des composantes de Zi : . une variable indicatrice de lactivit (spcialise ou universelle) de cette banque . une variable indicatrice de sa nationalit . une variable indicatrice de la cotation de cette banque et c...

11

cas, le risque dun biais domission demeure... sauf envisager une autre spcification du modle. 2) Certaines des caractristiques ne sont pas observables. Plus simplement, un moyen commode de composer avec la prsence de spcificits non observables consiste introduire dans la matrice Z autant de variables dummy quil y a dindividus. Par exemple, dans le cas N = 2 et T = 3 on a :
1 1 1 0 0 0 0 0 0 1 1 1

Z=

Les coefficients 1, 2 reprsentent alors une mesure synthtique de lensemble de toutes les caractristiques spcifiques observables ou non observables- susceptibles dinfluencer la relation tudie. Le risque de biais domission est ainsi considrablement rduit... sous rserve que lhypothse de constance dans le temps des spcificits individuelles ait un rel fondement. Bien sr, comme il sagit dsormais dune mesure synthtique, il devient ipso facto impossible disoler au sein de leffet spcifique ce qui peut tre attribu telle ou telle caractristique en particulier. On verra plus loin que lestimation de ce modle LSDV peut poser quelques problmes de faisabilit (lies la puissance des moyens de calcul) lorsque le nombre dindividus (et donc de variables dummy) est important. Dans ce contexte on verra que la mise en oeuvre de loprateur within peut tre une alternative intressante pour lestimation des coefficients du modle. C - Le modle effets alatoires (modle composantes derreur) Une autre manire daborder la question de lhtrognit des individus lintrieur dun chantillon en donnes de panel consiste interprter le terme derreur comme tant la somme de deux composantes (do la terminologie utilise de modle composantes derreur) : une premire composante it similaire celle qui apparaissait dj dans les modles prcits

12

une seconde, plus originale, postule que chaque individu se dmarque des autres par la ralisation dune variable alatoire ui dont les caractristiques (en particulier, moyenne et variance) sont identiques dun individu lautre.

Ce type de modle est ainsi spcifi : Yit = + Xit + ui + it avec ui ~ IID(0, u). Attention, contrairement ce qui se passe dans le cadre du modle effet fixe pour lequel les individus se dmarquent les uns des autres par un lment constant, la composante ui qui apparat ici nest pas une constante mais bien la ralisation dune variable alatoire. Bien sr, comme on sait que la prsence dune corrlation entre terme derreur et variables explicatives engendre des problmes de biais dans lestimation des coefficients du modle, lhypothse sous-jacente lusage dun modle composante derreur est que la composante alatoire spcifique ui nest pas corrle avec les variables explicatives du modle. Cette hypothse sous-jacente peut tre suspecte dans certaines circonstances. Imaginons par exemple quil sagisse dexpliquer le salaire dun individu. Au rang des variables explicatives on retrouvera sans surprise des variables reprsentatives de lanciennet dans lentreprise mais aussi, et de manire plus intressante, le nombre dannes dtudes ou encore le niveau de diplme. Llment spcifique alatoire est rput rendre compte des influences exerces par toutes les variables omises ou non observables... au rang desquelles figurent vraisemblablement les qualits innes de lindividu, dont on peut penser quelles ne sont sans doute pas totalement indpendantes du nombre dannes dtudes ou du niveau de diplme. Il est alors difficile de soutenir que cette composante alatoire est sans corrlation avec les variables explicatives retenues. D - Le modle coefficients alatoires. A vrai dire, le modle composante derreur se dmarque du modle MCO rapidement prsent au A en cela que ce qui est ncessairement constant dans le modle MCO :

13

Yit = + Xit + it devient alatoire dans le modle composante derreur : Yit = ( + ui) + Xit + it On peut gnraliser ce traitement rserv jusquici llment constant lensemble de tous les coefficients du modle qui devient alors : Yit = ( + ui) + Xit ( + hi) + it Lhypothse qui est faite dans ce cas est que les valeurs des coefficients peuvent diffrer alatoirement dun individu lautre quoiquen esprance ces coefficients soient identiques. Les modles hirarchiques compltent cette panoplie de modles coefficients alatoires en mnageant la possibilit de coefficients alatoires dont les esprances pourraient varier dun individu lautre. Le modle est alors ainsi spcifi : Yit = ( + ui ) + Xit ( + hi + zi) + it o zi est un vecteur de variables dont les ralisations sont spcifiques lindividu i (p. ex. le niveau de diplme pour reprendre lexemple prcdent) et un vecteur de coefficients. On voit que, dans ce cas, le coefficient attach chacune des variables reprsentes dans la matrice X est susceptible de varier dun individu lautre la fois en niveau et en esprance. E - Le modle structure de covariance Une autre faon (assez peu exploite jusquici) de modliser les spcificits individuelle consiste introduire llment dhtrognit non pas au niveau des coefficients du modle mais plutt celui de la matrice des variances covariances du terme derreur it en posant que le terme derreur prsente une proprit dhtroscdasticit dans la dimension des individus : Var it = i2

Exemple : prendre le fichier AIRLINE_COST_FUNCTION.WF1 (source Greene). Sous Eviews 5, il sera bon de structurer le fichier en fonction des individus

14

et des dates. On sintresse la modlisation de la fonction de cot laquelle serait confronte une compagnie arienne. A cet effet, on a collect un certain nombre dinformations relatives 6 compagnies ariennes sur une priode de 15 ans pour ce qui concerne : le cot total de production C apprci en milliers de US $ le niveau de la production Q (nombre de miles par passager transport) le prix du fuel P le taux dutilisation des capacits de production LF

La fonction de cot est spcifie sous la forme : Log C = + 1 Log Q + 2 Log P + 3 LF + Lestimation par les MCO sur donnes empiles (pooled data) a abouti au rsultat suivant :
Dependent Variable: LOGC Method: Least Squares Sample: 1 90 Variable LOGQ LOGP LF C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Coefficient 0.883 0.454 -1.628 9.517 0.988 0.988 0.125 1.335 61.770 0.383

Std. Error 0.013 0.020 0.345 0.229 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

t-Statistic 66.599 22.359 -4.713 41.514

Prob. 0.000 0.000 0.000 0.000 13.366 1.132 -1.284 -1.173 2419.341 0.000

On notera que les coefficients qui rsultent de cet ajustement sont significatifs et ont le signe attendu. Paragraphe 3 : Homognit des donnes et homognit des comportements A - Intrt de la question : consquences dune htrognit ou dune homognit mal spcifie La toute premire question laquelle on devrait normalement apporter une rponse avant mme de songer lestimation des coefficients du modle cest celle qui consiste se demander : les individus qui composent lchantillon prsentent-ils ou non des spcificits individuelles susceptibles dinduire des comportements diffrents pour ce qui concerne la relation tudie. La question est dimportance car elle va dterminer le choix entre deux grandes catgories de modles.

15

si on peut montrer (par un test appropri) que les individus ont des comportements homognes, il ny a pas lieu de tenir compte de spcificits individuelles... sauf accepter une perte defficience dans lestimation des coefficients attachs aux diffrentes variables explicatives. On privilgie dans ce cas une estimation par les MCO sur un chantillon pour lequel les donnes dans le temps et dans lespace sont finalement empiles les unes sur les autres.

si, en revanche, on peut montrer quil y a bien htrognit des comportements, lestimation MCO sur donnes empiles nest plus approprie puisquelle ignore les spcificits individuelles. On doit alors redouter lexistence dun biais probable domission.

Exemple : Hetero_Non_Specifiee.prg. On montre ici quune htrognit des comportements non prise en compte se traduit gnralement 4 par un estimateur biais des coefficients attachs aux diffrentes variables explicatives. B - Les tests dhomognit des comportements Il sagit ici de rpondre la question de lopportunit de la prise en compte dune htrognit des comportements. On sintresse uniquement la possibilit dune htrognit interindividuelle 5. En partant de l'hypothse nulle la plus contraignante celle d'une homognit complte des comportements- et en progressant vers des hypothses alternatives de moins en moins contraignantes pour s'acheminer vers celle d'une htrognit complte, on va construire pour chaque couple d'hypothse (H0 versus HA) une statistique de test de Fisher. C'est sur la base de ces statistiques que peut tre tabli, in fine, le type d'htrognit auquel on est confront. Cette stratgie de test peut tre prsente conformment au schma de la page suivante. La statistique de test est une statistique de Fisher construite sur la base des sommes

Dans le cas pour lequel la (les) variable(s) explicative nentretient aucun lien avec limportance de leffet fixe, lestimateur

MCO de obtenu sur donnes empiles est simplement inefficace quoique sans biais et convergent.
5

On peut en effet concevoir que lhtrognit des comportements puisse sexprimer non seulement dans la dimension

individuelle mais aussi dans la dimension temporelle. Cette htrognit se traduit alors par un modle pour lequel les coefficients sont susceptibles de prendre des valeurs diffrentes en fonction de la date laquelle la relation est apprcie.

16

des carrs des rsidus induites par lestimation des modles sous-jacents lhypothse nulle et lhypothse alternative faisant lobjet du test. Cest ainsi, par exemple, que, dans le cas du test dhomognit complte versus htrognit total, la statistique de test est ainsi calcule : ESS(H 0 ) ESS(H A ) (k + 1) (N 1) F= ESS(H A ) NT N (k + 1) o N est le nombre dindividus, T le nombre dobservations dans le temps, k le nombre de variables explicatives (hors constante).

17

H0 : Homognit complte : i = ; i = i versus HA : Htrognit complte : i et i spcifiques

OUI

REJET

NON

H0 : Homognit partielle : i spcifiques ; i = i versus HA : Htrognit complte : i et i spcifiques

Yit = + Xit + it

OUI

REJET

NON

Yit = i + Xit + it

H0 : Homognit partielle : i spcifiques ; i = i versus HA : Htrognit complte : i et i spcifiques

OUI

REJET

NON

Yit = i + i Xit + it

Yit = + i Xit + it

18

Remarque : pour la ralisation de ces diffrents tests dhypothse on utilise le plus souvent, pour des raisons de commodit, la mthode LSDV ce qui revient admettre que, si spcificits il y a, celles-ci seraient de type fixe. Comprenons bien que ces tests de spcification ont pour vocation de dceler la prsence dune possible htrognit des comportements mais quils ne nous renseignent en aucune faon sur la nature fixe ou alatoire- de ces effets spcifiques. Note : le plus souvent, on pourra se contenter dune procdure de test simplifie qui consiste confronter les sommes des carrs des rsidus de deux modles simplement : le modle qui postule lhomognit complte des comportements dun individu lautre (hypothse nulle H0) : Yit = + Xit + it celui qui intgre une htrognit partielle des comportements, cette htrognit prenant la forme de constantes spcifiques : Yit = i + Xit + it C - Homognit des donnes : la dcomposition de la variance Au del de la question de lhomognit des comportements, se pose aussi celle de lhomognit des donnes elles mmes. On dira que, pour une variable donne (quil sagisse au demeurant de la variable explique Y ou de lune des K variables explicatives Xj), il y a homognit des donnes si la distribution de cette variable dans le temps est trs proche dun individu lautre. Sur la base de cette dfinition, lune des conditions de lhomognit des donnes est que, pour la variable tudie, les moyennes individuelles soient identiques. Un bon indicateur du degr dhomognit des donnes peut tre construit partir de la dcomposition de la variabilit totale TSS de la variable tudie. On montre ici que la variabilit totale dune variable (par exemple Y) peut tre dcompose comme la somme de sa variabilit inter-individuelle (variabilit between BSS) de sa variabilit intra-individuelle (variabilit within WSS)

19

La variabilit totale de Y est donne par : TSSYY =

( Y
N T i =1 t =1

it

Y)

o Y est la moyenne gnrale de Y telle quelle peut tre calcule sur lensemble de lchantillon : Y = On montre que : TSSYY = WSSYY + BSSYY avec : WSSYY = 1 Yit T t 1 Yit NT i t

( Y
N T i =1 t =1

it Yio )

BSSYY = T

(Y
N i =1

io

Y)

avec Y io =

En effet, on a :

( Yit Y ) =
N T 2 i =1 t =1

( Y
N T i =1 t =1 2

it

Yio + Yio Y )
N T

=
N T

( Y
N T i =1 t =1 it

it Yio ) + ( Yio Y ) + 2 2 i =1 t =1

( Y
N T i =1 t =1

it

Yio )( Yio Y )

Or,
N

( Y
i =1 t =1 T it

Yio )( Yio Y ) = 0 puisque :

( Y
i =1 t =1

Yio )( Yio Y )

( Y
i =1 N i =1

io

T Y ) ( Yit Yio ) t =1

= ( Yio Y ) .N ( Yio Yio ) = 0

TSSYY = WSSYY + BSSYY

CQFD

La variabilit totale de Y peut donc tre interprte comme la somme de la variabilit

20

entre les moyennes individuelles et de la variabilit dans le temps des Y par rapport leurs moyennes individuelles. Ce qui est dit ici de la variabilit de Y peut l'tre tout aussi bien de n'importe quelle autre variable ou mme de la covariabilit de X et Y. On pourrait montrer de la mme faon que la variabilit totale de Y peut aussi tre interprte comme la somme de :

( Y
N T i =1 t =1

it

Y) =
2

( Y
N T i =1 t =1

it

Yot ) + ( Yot Y )
2 N T i =1 t =1

o
N

( Y
N T i =1 t =1 T ot

it

Yot ) est la variabilit des Y par rapport leurs moyennes temporelles et


2 2

( Y
i =1 t =1

Y ) est la variabilit des moyennes temporelles par rapport la moyenne

gnrale. Deux cas particuliers mritent dtre signals : 1. Sil y a parfaite homognit des donnes, les moyennes individuelles de Y (resp. de X) sont identiques entre elles et identiques la moyenne gnrale de Y (resp. de Y). Dans ce contexte, la variabilit inter-individuelle BSSYY de Y est nulle et la variabilit totale est gale la variabilit intra-individuelle WSSYY. Homognit parfaite des donnes TSSYY = WSSYY 2. Si, en revanche, pour un mme individu (et ceci quel que soit lindividu considr), la valeur de Y ne scarte jamais de sa moyenne individuelle (pas de variabilit dans le temps), la variabilit intra-individuelle est nulle et la variabilit totale est alors gale la variabilit inter-individuelle BSSYY Stabilit dans le temps de la valeur de Y pour un mme individu TSSYY = BSSYY Intrt de la dcomposition de la variabilit des X et des Y : si on peut montrer que la variabilit des X et des Y travers le temps (variabilit intra-individuelle) est trs faible pour un mme individu (quel que soit celui-ci), il nest pas trs utile de chercher exploiter la dimension temporelle du panel : dans ce cas on peut trs bien se contenter de travailler simplement sur les moyennes individuelles des X et des Y pour

21

estimer le modle en coupe instantane (cft infra lestimateur Between). Exercice : airline_cost_function.wf1 On se pose ici la question du degr dhomognit des observations relatives aux cots de production de 6 compagnies ariennes. Apprciez, sous Eviews 5, ce degr dhomognit en dcomposant la variabilit totale de LOGC. Slectionnez la variable LOGC puis cliquez sur VIEW - Tests for Descritive Statistics - Equality Test by Classification Choisissez la srie i comme variable classifiante et cochez le test dgalit des moyennes (individuelles)
Test for Equality of Means of LOGC Categorized by values of I Date: 14/05/04 Time: 19:18 Sample: 1 15 Included observations: 90

Method

df

Value

Probability

Anova F-statistic Analysis of Variance

(5, 84)

31.87474

0.0000

Source of Variation

df

Sum of Sq.

Mean Sq.

Between Within Total Category Statistics

5 84 89

74.67988 39.36101 114.0409

14.93598 0.468583 1.281358

I 1 2 3 4 5 6 All

Count 15 15 15 15 15 15 90

Mean 14.67563 14.37247 13.37231 13.13580 12.36304 12.27441 13.36561

Std. Dev. 0.494617 0.680536 0.522066 0.727387 0.711945 0.891749 1.131971

Std. Err. of Mean 0.127710 0.175714 0.134797 0.187810 0.183823 0.230249 0.119320

On rejette fortement lhypothse nulle dgalit des moyennes individuelles. La part de la variabilit inter-individuelle est forte au sein de la variabilit totale. Il y a htrognit des donnes relatives cette variable. Attention : lhtrognit des donnes et, en particulier le fait que les moyennes individuelles d'une mme variable soient significativement diffrentes les unes des

22

autres ne permet pas de prjuger de lhtrognit des comportements. Les moyennes individuelles des variables du modles peuvent tre trs diffrentes dun individu lautre sans que, pour autant ; les comportements soient fondamentalement diffrents (les paramtres de la fonction de consommation peuvent trs bien tre identiques dun individu lautre mme si ces individus ont des niveaux de revenu et des niveaux de consommation peuvent tre trs diffrents.

Section II : Le modle sur donnes empiles : estimateur MCO et estimateur Between Ce type de modlisation nest appropri que dans le cas pour lequel lhomognit des comportements a pu tre tabli. On passera assez rapidement sur cette premire classe de modle qui ne diffre pas des modles traditionnels. En admettant que lhomognit des comportements ait donc pu tre tablie, rien ne soppose ce que la relation X Y puisse tre spcifie sous la forme : Y = iNT + XNT,K + et estime directement par les MCO. Sous rserve que les bonnes proprits habituelles de lerreur soient ici encore vrifies et que lhypothse dhomognit des comportements soit fonde, lestimateur MCO de est sans biais, convergent et efficace. Dans le cas particulier pour lequel la variabilit intra-individuelle (within) de Y est ngligeable (en termes relatifs), on peut, sans grande perte dinformation, utiliser lestimateur Between ou estimateur sur les moyennes individuelles. Le principe en est relativement simple puisquil consiste, comme lindique son nom, conduire un ajustement MCO non plus sur les donnes brutes mais sur les moyennes individuelles :
Yio = + X io + io

Il est clair que ce type de modle ne peut tre envisag lorsque les observations sur Xk

23

et Y prsentent une forte variabilit dans le temps (within) : dans ce cas, le fait de ne travailler que sur les moyennes individuelles aboutit une perte importante dinformation (puisque, vrai dire, on remplace chaque Xk,it par sa moyenne individuelle X k,io) qui se paie en termes defficacit de lestimateur.

24

Section III : Le modle effets fixes Paragraphe 1 : Spcification et estimation. Estimateur LSDV et estimateur Within. Avec le modle effets fixes, on prend en compte lhtrognit des comportements des individus qui composent lchantillon en considrant que les quations qui rgissent les relations X Y se dmarquent, dun individu lautre, par un simple lment constant i de telle sorte que ce modle a pour expression : /2.1/ Yit = i + 1 X1,it + + K XK,it + it

ou encore, sous forme matricielle et pour un individu i : Yi = iT i + Xi + it avec : 1 1 iT = de dimension T 1, Xi = 1


1 2 K

X1,i1 X 1,i2 X1,iT

X 2,i1 X K,i1 X 2,i2 X K,i2 X 2,iT X K,iT

de dimension T K

et =

de dimension K 1

A un niveau plus agrg encore (celui de lensemble des individus) le modle est rcrit :
1 2+D K 1 2 N

/2.2/

Y=X

X1,11 X1,1T avec X = X1, N1 X 1,NT

X K,11 X K,1T de dimension NT K X K,N1 X K, NT

25

D=

i T 0 0

0 iT 0 0 iT 0

= [d1, d2, ..., dN] de dimension NT N

et de dimension K 1 Dans un souci de concision on peut aussi concatner : les matrices X et D horizontalement : Z = [D : X] les vecteurs de coefficients et verticalement : = dimension K+N 1

et le modle peut tre rcrit plus simplement encore : Y=Z+ Comme on la dj dit, rien ne soppose, thoriquement ce que les coefficients du modle (les K coefficients du vecteur et les N coefficients du vecteur ) soient estims par les MCO :

= (Z' Z)-1 Z' Y


Les estimateurs ainsi obtenus directement sappellent les estimateurs LSDV (Least Square Dummy Variables) en cela que les estimations des constantes spcifiques sont obtenues directement comme on le voit en rgressant, en particulier, la variable Y sur un ensemble de variables dummy qui permettent didentifier les diffrents individus (cest la matrice D). Toutefois, dans le cas pour lequel N est grand, on peut se heurter un problme de capacit de calcul. Ds lors, on doit trouver un artifice pour rendre possible le calcul de ces coefficients.
Les estimateurs et des coefficients du modle /2.2/ sont ncessairement tels

quils minimisent la somme des carrs des rsidus :


ESS = [Y X - D ] [Y X - D ]

26

Les conditions du premier ordre snoncent ainsi : condition C1 : condition C2 :


X Y = XX + XD DY = DX + DD

Ces conditions du premier ordre constituent un systme de K + N quations K + N inconnues dont la rsolution fournit les estimations des coefficients. Ce systme qui peut tre trs volumineux peut tre considrablement simplifi dans le cas pour lequel N est grand. On note en effet que de la condition 2 on peut dduire :
= (DD)-1 [DY - D X ] En reportant cette expression de dans la premire quation il est possible de donner lexpression de la matrice des estimateurs des seuls coefficients k : X Y = XX + XD (DD)-1 [DY - D X ] = [XX XD (DD)-1 DX] + XD (DD)-1 DY

soit encore : X [I D (DD)-1 D] Y = X [I D (DD)-1 D] X ce qui peut scrire plus simplement : X W Y = X W X en posant W = I D (DD)-1 D. On tudiera par la suite les proprits intressantes de la matrice B = D (DD)-1 D (oprateur Between ) et de la matrice W = I - B (oprateur Within ). On en dduit lexpression de lestimateur within with : with = (X W X)-1 X W Y Munis des estimations des coefficients j il est ensuite possible, dans un deuxime temps, den dduire celles des coefficients i, cest dire des effets fixes. On sait en

27

effet, compte tenu de la deuxime condition du premier ordre que et sont

ncessairement tels que :


DY = DX + DD On en dduit que with = (DD)-1 D (Y X with)

Paragraphe 2 : les oprateurs between et within


On tudie les proprits . de la matrice B = D (DD)-1 D . de la matrice W = I D (DD)-1 D oprateur Between oprateur Within

et on montre que lestimateur qui vient dtre dfini est lestimateur des MCO dun modle Yit - Y i o = 1 (X1,it avec Y i o =

X1,i o) + + K (XK,it - XK,i o ) + (it - i o)

1 T Yit T t =1

Xk,i o = 1 X k,it T
t =1

o les variables, comme on le voit, sont exprimes en cart par rapport leurs moyennes individuelles. La matrice W = INT,NT D (DD)-1 D est de dimension NT NT. Elle a une structure et des proprits trs particulires.
i T 0 Rappelons que D = 0 0 0 de telle sorte que cette matrice peut aussi tre 0 iT 0

iT

rcrite comme le produit de Kronecker : DNTN = IN iT de telle sorte que :

28

(D D)N,N =

T 0 0 0 T 0 0 0 T

et (DD)-1N,N =

1 T 0 0

0 1 0 T 1 0 T 0

(D (DD)-1 D)NT,NT =

1 T 1 T 0 0 0 0

1 T 1 T
0 0

0 0 0 0 1 1 T T 1 1 T T 0 0 0 0

0 0 0 0

0 0 0 0 1 1 T T 1 1 T T

0 0

Au sein de cette matrice D (DD)-1 D : il y a en ligne comme en colonne N sous blocs de matrices o chaque bloc de matrice est lui-mme de dimension T T

Par exemple, dans le cas pour lequel N = 2 et T = 3 on a : -1 D (DD) D = 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33

Quest-ce qui se passe par consquent quand on multiplie, par exemple, cette matrice D (DD)-1 D par la matrice YNT,NT ? On obtient alors une matrice dont les

29

composantes correspondent aux moyennes individuelles de Y :

Y1 Y 1 -1 D (DD) D Y = B Y = YN YN

De la mme faon on a :

X1,1 X 1,1 -1 D (DD) D X = BX = X1,N X 1,N

X K,1 X K,1 qui est de dimension NT K. X K,N X K,N

On voit par consquent que la matrice B = D (DD)-1 D est, en quelque sorte, un

oprateur de calcul des moyennes individuelles. On lappelle plus communment


loprateur Between . Cest ainsi quon lappellera dsormais. De ce qui vient dtre dit il dcoule que la matrice W = INT,NT - B autorise, elle, le calcul des carts dune variable (quil sagisse de Y ou des composantes de X) par rapport ses moyennes individuelles :

30

Y Y 1o 11 Y Y 1o 1T WY= YN,1 YNo Y Y No N,T

X1,1,1 - X1,1o X -X 1,1,T 1,1o WX= X1,N,1 -X1,No X -X 1,N,T 1,No

X K,1,1 -X K,1o X K,1,T -X K,1o X K,N,1 -X K,No X K,N,T -X K,No

Loprateur Within W prsente deux proprits importantes (tout comme loprateur

Between dailleurs) :
1/ la matrice W est symtrique 2/ la matrice W est idempotente De ces deux proprits il dcoule que : W W = W W = W En rsum, on peut crire que : B = D (DD)-1 D =
1 IN T 1 IN T JT

W = INT B = IN

IT -

JT

o JT est une matrice carre de dimension T dont toutes les composantes sont gales 1, IN et IT sont des matrices identit de dimensions N et T respectivement. Exercice : proprietes_mat_D.prg : ce programme autorise le calcul de D, B , W et dexprimenter les diffrentes proprits de loprateur Within.

Paragraphe 3 : variance de lerreur et variance de lestimateur within dans le modle effets fixes A - Lestimateur within de la variance de lerreur
On vient de voir quil est possible de simplifier la question de lestimation des coefficients j dans le modle effets fixes Yit = i + 1 X1,it + + K XK,it + it en travaillant sur des variables centres par rapport leurs moyennes individuelles. On aboutit ainsi lexpression de lestimateur within des K coefficients j

31

with = (X W X)-1 X W Y

et celle des N effets fixes i : with = (DD)-1 D (Y X with) de telle sorte que, pour chaque i on a : i = Y io - 1 X 1,i o - ... - K X K,i o Munis de ces estimations des pentes et des effets fixes, il est possible de calculer les rsidus de l'ajustement : it = Yit - i - 1 X1it - ... - K XKit ainsi que la somme des carrs de ces rsidus et la variance estime s2 de lerreur du modle (suppose homoscdastique). Cette variance estime de lerreur est donne par : s =
2
N T 1 Yit i 1 X1,it ... K X K,it NT N K i =1 t =1

Attention : on a vu que lestimateur within des j est lestimateur des MCO appliqu des variables centres sur leurs moyennes individuelles. Si, aprs avoir centr les variables, on utilise sans prcautions la mthode des MCO on va calculer (selon la procdure automatique) la variance de lerreur comme s2 =
N T 1 Yit i 1 X1,it ... K X K,it NT K i =1 t =1

en oubliant, tort, que les moyennes individuelles ont du, elles-mmes, faire lobjet dune estimation. On sous-estime alors la variance de lerreur... et donc celles des estimateurs des coefficients. B - Lestimateur within de la variance des estimateurs des coefficients La matrice des variances covariances estimes des estimateurs des coefficients se calcule comme dans le cas du modle de rgression multiple ceci prs quon travaille dsormais sur des variables centres sur leurs moyennes individuelles. La matrice des variances covariances est donc dtermine partir des matrices Y* et X* qui sont les matrices des valeurs centres de Y et des Xj sur leurs moyennes

32

individuelles (Y* = W Y et X* = W X) . On la dtermine donc comme :


2 -1 2 -1 V ( with) = s (X*X*) = s (X W W X)

= s2 (X W X)-1 puisque loprateur within W est symtrique et idempotent. Connaissant les variances estimes des estimateurs des coefficients j il est ensuite facile de retrouver celles des effets fixes en se servant du fait que les estimateurs des effets fixes sont des combinaisons linaires des j et de Y puisque :

Y1o X1,1o -1 Y2o - X1,2o with = (DD) D (Y X with) = YNo X1,No

X 2,1o X 2,2o X 2,No

X K,1o X K,2o X K,No

1 2 K

Il est alors possible de montrer que lestimateur de la variance de i within est donn par : s V ( i within) = avec x io = x1,io
o, de faon plus gnrale : X1,1o X avec X N,K = 1,2o X1,No X 2,1o X 2,2o X 2,No X K,1o X K,2o X K,No
2

+ x io V() x io '
x 2,io x K,io

s V ( wit) =

+ X V() X '

Il est intressant de noter que la transformation des variables (et donc du modle) par le truchement de loprateur within cre automatiquement un phnomne dautocorrlation des erreurs l o, dans le modle sminal, il ny en avait pas. En effet, on passe du modle : Yit = i + 1 X1,it + + K XK,it + it un modle en variables dcarts aux moyennes individuelles : Yit - Y io = 1 (X1,it - X1,io) + + K (XK,it - XK,io) + (it - io)

33

Il est clair, dans ces conditions, que le nouveau terme derreur (it - io) est autocorrl puisque (it - io) et (is - io) ont un lment commun io. On note toutefois que cette autocorrlation ne peut jamais tre observe qu lintrieur du groupe dobservations relatives un mme individu. En dpit de cette autocorrlation artificielle, il est possible de montrer (sur la base du thorme de Kruskal qui sapplique ici et sous rserve que par ailleurs le terme derreur it prsente toutes les bonnes proprits nonces plus haut) que lestimateur des MCO sur donnes en carts aux moyennes individuelles est rigoureusement quivalent lestimateur MCG appliqu ces mmes donnes6. Exercice : airline_cost_function.wf1 et between_estimator.prg : donnez les estimateurs between du modle : LOGCit = + 1 LOGQit + 2 LOGPit + 3 LFit + it Calculez aussi les t de student et le R2.

Section IV : Le modle effets alatoires Paragraphe 1 : Le modle A - La problmatique Un des inconvnients du modle effets fixes tient ce que le coefficient i est vraiment propre lindividu i et uniquement cet individu. Ceci signifie que les prvisions construites partir du modle estim ne peuvent jamais porter que sur les individus faisant partie de lchantillon destimation. Autrement dit, les rsultats mis en vidence pour les individus faisant partie de cet chantillon ne peuvent tre extrapols lensemble de la population dont cet chantillon a t extrait. Cette proprit nest gure gnante si lobjet dtude est un groupe de pays clairement identifis et dont il sagit didentifier les spcificits. Il peut tre trs intressant par exemple, sagissant de ltude des fonctions de production macroconomiques des pays qui composent la zone euro de mettre en vidence, dessayer de voir sil y a des

Cf SEVESTRE pp. 27.

34

spcificits pays et, le cas chant, didentifier les origines possibles de ces spcificits. En revanche, imaginons prsent quon sintresse aux habitudes de consommation des franais en gnral ; on a constitu cet effet un chantillon de 10000 individus reprsentatifs de la population. Aprs avoir mis en vidence lopportunit de modliser lhtrognit des individus on a estim un modle effets fixes qui attribue chaque individu de lchantillon une constante spcifique. La question est : quel intrt y a-t-il savoir que Mr X prsente une constante spcifique suprieure celle de Mlle Y ? Dans ce cas, le modle, tel quil a pu tre estim sur la base de cet chantillon, est de peu dintrt ds lors quil sagit de gnraliser les rsultats obtenus lensemble de la population. Dans un tel contexte, on doit privilgier lusage dun modle effets alatoires. B - Spcification du modle et proprits supposes des termes derreur On pose dsormais que : Yit = + Xit + ui + it = + Xit + it avec it = ui + it ou, en termes matriciels : au niveau individuel i :

Yi = iT + Xi + u i + i
T 1 T 1 T K K 1 T 1

T 1

avec :
u i u i u i i1 i2 iT

ui =

i =

au niveau de lensemble de tous les individus :


NT 1

Y = i NT + X + u
NT 1 NT K K 1

NT 1

NT 1

On suppose dsormais que la spcificit individuelle ui dont la valeur, pour un mme individu, est stable dans le temps, est la ralisation dune variable alatoire dont la loi de distribution est la mme pour tous les individus. A partir de l, et en admettant que les coefficients et paramtres du modle aient dj t estims, il devient possible de

35

construire une prvision pour nimporte quel individu tir de la population mre quand bien mme celui-ci naurait pas fait partie de lchantillon utilis pour lestimation... exercice impossible avec le modle effet fixe. On fait sur les erreurs ui et it les hypothses suivantes (en esprant quelles soient vrifies !) : E(it | X) = E(ui | X) = 0 i, t : linformation contenue dans X nest daucune utilit pour prvoir la valeur de it ou celle de ui E(it2 | X) = 2 i, t : lerreur est homoscdastique E(ui2 | X) = u2 i : lventail des valeurs possibles de ui est le mme (et avec les mmes probabilits) dun individu lautre E(uj it | X) = 0 i, j, t : les deux composantes de lerreur ne sont pas corrles entre elles, quil sagisse dun mme individu ou non E(it js | X) = 0 i, j, t, s , pour i j ou t s : les erreurs ne sont ni autocorrles ni corrles entre des individus diffrents E(ui uj | X) = 0 i, j, i j: les erreurs spcifiques ne sont pas corrles dun individu lautre. C - Matrice des variances covariances de lerreur du MCE On note que la matrice des variances covariances des erreurs it du modle prsente une structure particulire... qui justifiera lusage dun estimateur adapt. En effet, en notant la matrice des erreurs avec it = ui + it on a :
11 1T = N1 NT

et donc NT NT= E

2 11 111T 0 0 0

111T 0 0 0 0 0 0 1T
2

0 0 0 0 0 0 0 0 0 N1
2

N1NT NT
2

N1NT

= IN

36

ou, encore :

0 = 0 0

0 0 0

0 0 0

0 0 0
2 + u 2 2 u 2 u u 2 u
2 2 2

u u
2

2 2 2

avec = E

i1iT 2 iT i1 iT
2 i1

+ u u u
2 2

+ u u
2

u 2 u 2 2 + u u
2 2

= 2 IT + u2 iT iT = 2 IT + u2 JT

o iT est un vecteur colonne unitaire de dimension T et JT = iT iT une matrice carre unitaire. On en dduit que = 2 [IN IT] + u2 [IN JT]. Il est clair, compte tenu des proprits des erreurs nonces ci-dessus, que : les covariances entre les erreurs de deux individus diffrents sont nulles les covariances entre les erreurs dun mme individu mais des dates diffrentes sont gales 2u (puisque ui est alors la seule composante commune de ces deux erreurs) la variance de lerreur relative lindividu i la date t est gale u2 + 2.

On montre, pour en terminer avec ltude des proprits de la matrice , que celle-ci peut tre exprime comme une combinaison particulire des oprateurs within et between. En effet on a : = 2 [IN IT] + u2 [IN JT] = 2 IN [IT +
u
2 2

JT]

37

= 2 IN [IT -

JT T JT T JT T JT T

JT T

2 2

JT]
u
2 2

= 2 IN [(IT -

)+

JT T JT T

(1 + T
2

)]
2

= 2 IN [(IT -

)+

+ T u JT T
2

]
2

= 2[ IN (IT 2

) + IN
2

+ T u
2

= 2 [W +

+ T u
2

B]

= 2 W + (2 + T u2) B On voit donc bien que la matrice des variances covariances est, en effet, une combinaison linaire des oprateurs within et between. On peut facilement vrifier (rsultat quon aura rutiliser) que : -1 =
1 2

[W + B]

avec =

2 2

+ T u

Paragraphe 2 : Proprits des estimateurs Between et Within appliqus au modle composantes derreur. En admettant que le modle X Y prenne la forme dun modle composantes derreur : Y=i+X+u+ on peut envisager plusieurs classes destimateurs lmentaires pour les coefficients du modle. Lestimateur des MCO :
mco = (X1 X1)-1 X1 Y

en prenant la prcaution de dfinir X1 comme tant la matrice X augmente dune premire colonne unitaire

38

Lestimateur Within :
Lestimateur Between :

within = (X W X)-1 X W Y

Between = (X1 B X1)-1 X1 B Y

On note au passage que le vecteur between (tout comme le vecteur mco dailleurs) prsente une composante de plus (lestimateur du coefficient ) que le vecteur within. Quoiquil puisse tre dmontr que, dans le contexte dfini par les hypothse relatives aux termes derreur, ces estimateurs demeurent sans biais 8 et convergents, ils ne sont pas, en revanche, de variance minimum (cf. cours de licence). On doit leur prfrer lestimateur des MCG.

Paragraphe 3 : Lestimateur des MCG


On sait dores et dj (dmonstration supra) que la matrice des variances covariances des erreurs du modle MCE 1. nest pas diagonale 2. est une combinaison linaire des oprateurs Within et Between. On sait galement (cest un rsultat connu de lalgbre des matrices) que, si la matrice

est dfinie positive (ce qui est en effet le cas), alors il existe ncessairement une
matrice H, de mme dimension que la matrice telle que : H H = I On dduit de ce rsultat que :

Attention : lestimateur within ne peut tre dfini comme (X1 W X1)-1 X1 W Y puisque, dans ce cas,

la matrice (X1 W X1) nest pas inversible. On note en effet que toutes les composantes de la premire colonne de la matrice X1 sont gales 1. On en dduit que la premire colonne de X1 W est nulle et donc (X1 W X1) nest pas inversible.
8

Ceci est particulirement simple mettre en vidence dans le cas de lestimateur within puisque, en

travaillant sur les carts aux moyennes individuelles, on gomme la totalit des effets alatoires spcifiques ui : Yit = + Xit + ui + it

Yi=+ Xi+ ui+ i

Yit -

Y i = (Xit - X i) + it - i

39

= (H H)-1 soit encore : H H = -1

On peut montrer, compte tenu de la structure dsormais familire de la matrice , que cette matrice H a pour expression : H = IN Hi avec : Hi = o = 1
+ T u
2 2

I T T i T i T '

10

Quel intrt y a-t-il dfinir cette matrice H ? La rponse cette question passe par ltude des proprits du terme derreur dans le modle ainsi transform : HY = HX + H ( + u)
11

On note en effet que, si dans le modle primitif (Y = X1 + + u) le terme derreur + u est auto-corrl il en va diffremment dans le modle transform puisque : E [H ( + u) ( + u) H] = H H = INT

En effet on a : H = I H H H = H H = (H H)-1 H H H = I = (H H)-1 Le programme omega_hprimh.prg met en vidence lquivalence entre ces deux critures de :

10

= 2 [IN IT] + u2 [IN JT] = (H H)1

11

Rappelons que la matrice X est ici augmente dune premire colonne unitaire.

40

de telle sorte que, au final, lerreur H ( + u) du nouveau modle est homoscdastique... et le modle peut (pourrait) alors tre estim par les MCO. Lestimateur MCG est donc lestimateur MCO du modle transform :
mcg = (XHHX)-1 XHHY = (X-1X)-1 X -1 Y On peut montrer que lestimateur MCG est une moyenne pondre des estimateurs

within et between. En effet, on sait que :


= 2 [IN IT] + u2 [IN JT] et donc : -1 =

1 2

2 I N IT 2 u 2 I N J T + T u

o, rappelons-le, JT est une matrice carre de dimension T et dont tous les lments sont gaux 1. En partant de cette dernire expression de -1 on peut crire que : -1 = 1 2
2 1 1 I N IT I N J T + I N J T 2 u 2 I N J T T T + T u

Or, on se souvient que loprateur between B et loprateur within W sont tels que : B = D (DD)-1 D =
1 IN T 1 IN T JT

W = INT B = IN de telle sorte que :

IT -

JT

-1 =

1 2

2 1 W + IN JT 2 u 2 IN JT T + T u

1 2

2 2 1 T u 1 1 IN JT = I JT W + IN JT 2 W + 2 2 2 2 N T T + T u + T u

41

1 2

2 1 W + 2 2 B = 2 [ W + B] + T u

en posant que :

2 2 + T u
2

Ds lors, lexpression de lestimateur mcg devient : mcg = [X (W + B) X]-1 X (W + B) Y = [X (W + B) X]-1 X W Y + [X (W + B) X]-1 X B Y Posons prsent : FW = [X (W + B) X]-1 X W X FB = [X (W + B) X]-1 X B X On voit tout de suite que FW + FB = 1 et que, donc : FB = I FW. Or FW with = [X (W + B) X]-1 X W X (X W X)-1 X W Y = [X (W + B) X]-1 X W Y correspond au premier lment de mcg De la mme faon, on a : FB betw = (I FW) betw = [X (W + B) X]-1 X B X (X B X)-1 X B Y = [X (W + B) X]-1 X B Y correspond, lui, au second lment de mcg. On en dduit que : mcg = FW within + (I FW) between On notera que : 1. dans le cas pour lequel = 0 (ce qui se produit, compte tenu de lexpression mme de , lorsque le nombre T des observations dans le temps tend vers linfini), tous les lments de la matrice FB = I FW sont nuls ; lestimateur des MCG converge donc vers lestimateur within quand T tend vers linfini.

cqfd

42

2. dans le cas oppos pour lequel = 1 (ce qui se produit lorsque la variance de ui tend vers 0, cest dire lorsquil ny a pas deffets spcifiques puisque les ui sont alors identiques), lestimateur des MCG converge vers lestimateur MCO du modle en pooling (aucune spcificit individuelle) puisque, en effet, dans ce cas on a : = 2 [IN IT] + u2 [IN JT] = 2 INT On voit tout de suite quon retrouve alors une matrice des variancescovariances qui est diagonale (pas dautocorrlation) et homoscdastique : lestimateur des MCG est alors analogue celui des MCO. Dans le cas gnral pour lequel est compris strictement entre 0 et 1, lestimateur des MCG doit par consquent tre interprt comme une combinaison linaire de lestimateur within (htrognit forte) et de lestimateur MCO sur donnes empiles (absence dhtrognit). La matrice des variances covariances de lestimateur des MCG est donne (rsultat connu) par :
V( mcg) = [X -1 X]-1 = 2 [X (W + B) X]-1 On peut montrer que les lments diagonaux de cette matrice (cest dire les variances des estimateurs MCG des coefficients) sont infrieurs ce queussent t ces mmes lments, dans le mme contexte marqu par la prsence deffets alatoires, si on avait privilgi lusage (alors inappropri) de lestimateur effets fixes within. Dans ce contexte, lestimateur des MCG est lestimateur BLUE (quoique, rappelons-le, lestimateur within, en particulier, demeure un estimateur sans biais et convergent).

Paragraphe 4 : Lestimateur des MCQG


Un des problmes qui se pose avec le calcul de lestimateur mcg (et non des moindres !) cest quil requiert ncessairement que soit connue la matrice des variances covariances , ou, ce qui est quivalent, que soit connue la valeur du paramtre , cest dire encore les variances 2 et u2. Or, gnralement, ces

43

paramtres sont inconnus : il faut les estimer. On peut imaginer pour cela plusieurs procdures. Lune des mthodes 12 les plus couramment utilises (sans doute en raison de sa simplicit) consiste exploiter les variances des rsidus issus de lestimation du modle composantes derreur par les mthodes within dune part et between dautre part. La variance rsiduelle de lestimateur within du modle effets alatoires Rappelons que, en partant de lexpression gnrale du modle erreurs composes Yit = +

k =1

X k ,it + i t

avec it = ui + it

on peut liminer les spcificits individuelles en travaillant sur des variables centres autour de leurs moyennes individuelles : Yit Yio = soit matriciellement : WY=WX+W Lestimateur within du modle erreurs composes est donn par :
with = (XWWX)-1 XW W Y et, comme la matrice W (oprateur within) est symtrique et idempotente with = (XWX)-1 X W Y La matrice des rsidus issus de lestimation du modle effets alatoires sur donnes centres sur les moyennes individuelles est donne par : with = W Y W X with On peut montrer13 que la somme des carrs des rsidus pondre par le nombre de degrs de libert de ce modle (NT observations N moyennes individuelles K coefficients)

k =1

(X k,it X k,io ) + it - io

12

Mthode de Swamy et Arora (1972). Voir P. SEVESTRE p.60-62

13

44

sw2() =

with ' with N(T 1) K

est un estimateur sans biais de la variance thorique de la composante non spcifique de lerreur dans le modle MCE : E sw2() = 2 La variance rsiduelle de lestimateur between du modle effets alatoires En appliquant loprateur between au modle composantes derreur il vient : Yio = 0 + soit, matriciellement : B Y = B X1 + B en prenant, on le rappelle, la prcaution de dfinir X1 comme la matrice X augmente dune premire colonne dont tous les lments sont gaux lunit. Lestimateur between du modle ainsi transform est :
betw = (X1 B X1)-1 X1 B Y et le vecteur des rsidus 14 qui en rsulte : betw = B Y B X1 betw La variance des rsidus issus de ce modle : sB2() =
N T 1 ' i t 2 = (Nbetwk betw (N k b ) T i =1 t =1 b) T

j=1

X j,io + i o

avec io = ui + io

est, elle, un estimateur sans biais de la variance thorique de ui + io, cest dire de

14

Attention : il convient de noter tout particulirement que ce vecteur est un vecteur NT

composantes et non pas N composantes individuelles seulement. Pour un mme individu il y a T rsidus identiques. Cette remarque a son importance dans le calcul de la somme des carrs de ces rsidus !

45

u+ T
2

15

. dautre part il est alors T


2

Ainsi munis des estimateurs de 2u dune part et de 2u +

possible de fournir un estimateur sans biais du paramtre = 2 2 : + T u


2

s2W T s2 B

Lestimateur des MCQG est alors fourni par :


mcqg = [X (W + B) X]-1 X (W + B) Y Lestimateur MCQG de la constante 0 dans le modle composante derreur est donn par : 0 mcqg = Yoo -


j=1

jmcqg

X j,oo

Enfin, la matrice des variances covariances thoriques des estimateurs des coefficients : V( mcg) = [X -1 X]-1 = 2 [X (W + B) X]-1 o 2 est la variance thorique de la composante non spcifique de lerreur peut tre approche par sw2() puisque E sw2() = 2. Ds lors, la matrice des variances covariances des estimateurs des coefficients peut tre estime par :
2 V ( mcg) = sw () [X (W +

B) X]-1

Paragraphe 5 : Effets fixes ou effets alatoires : le test dHausman.


En admettant que nous ayons dj la certitude de la prsence de spcificits individuelles, se pose maintenant la question de la nature de ces spcificits : doit-on retenir une spcification de type effets fixes ou, au contraire, de type effets alatoire . La question nest pas sans importance.

46

On se souvient du rsultat selon lequel lestimateur des MCG est lestimateur optimal du modle effets alatoires... la condition que lerreur du modle (et, notamment, sa composante spcifique) ne soit pas suspecte de corrlation avec les diffrentes variables explicatives. Si, malheureusement, tel ntait pas le cas, lestimateur des MCG est alors biais... ce qui est videmment trs gnant. Or, si on peut tre dispos admettre labsence de corrlation entre la composante non spcifique de lerreur et les variables explicatives, on prouve quelque rticence admettre ce mme postulat dabsence de corrlation entre la composante spcifique et les variables explicatives qui sont elles-mmes senses rendre compte, justement, des caractristiques propres de chaque individu. Cest la critique de Mundlack. On commence par exprimenter 1. le caractre biais de lestimateur des MCQG et le caractre non biais de lestimateur within si lerreur spcifique est corrle avec lune au moins des variables explicatives. Dans ce cas, il existe une diffrence significative entre les estimations engendres par ces deux estimateurs 2. le caractre non biais des estimateurs within et MCQG si lerreur spcifique nest pas corrle avec les variables explicatives. Dans ce cas, il ny a pas de diffrence significative entre les estimations engendres par ces deux estimateurs. On privilgiera toutefois, dans ce contexte, lusage de lestimateur des MCQG dont on vrifie quil est alors plus efficace que lestimateur within. On dfinit ensuite la statistique de test de Hausman pour lhypothse nulle dabsence de corrlation entre erreur spcifique et variables explicatives. Du rsultat de ce test dpend le choix de la mthode destimation qui sera finalement retenue. A - Corrlation des erreurs spcifiques avec les variables explicatives : quelles proprits pour les estimateurs within et mcqg ? On exprimente les proprits des deux estimateurs (within et mcqg) en prsence et en labsence de corrlation entre erreur spcifique et variables explicatives.

15

On doit noter en effet que Var(io) = Var(ui + io) = Var(ui) + Var(io) = Var(ui) + Var(it) / T

47

Programme : WITH_OU_MCQG_EFF_ALEAT.PRG A 100 reprises, on cre un chantillon de donnes de panel pour les variables X et Y. On note N le nombre des individus et T la taille de lchantillon dans la dimension temporelle. Pour la simplicit on suppose . que le panel est cylindr . que le nombre des variables explicatives est gal 1 (ce qui ne nuit pas la gnralit du rsultat). On a suppos ici que N = 20 et T = 20. A chaque itration et pour chaque individu 1/ on produit une chronique derreurs non spcifiques it. On suppose ces erreurs non autocorrles dans le temps et non corrles de manire interindividuelle. On suppose que les it sont IIDN(0,1). 2/ on produit une erreur spcifique u telle que la ralisation de cette erreur pour lindividu i est tire alatoirement dune distribution Normale centre et dcart type u = 5. On se souvient que la valeur prise par cette erreur, spcifique lindividu i, est la mme quel que soit t. 3/ On cre une chronique pour la variable explicative X en ayant soin, selon le cas, dintroduire ou, au contraire, de ne pas introduire un lment de corrlation entre lerreur spcifique et les ralisations de X sil ny a pas de corrlation, les ralisations de X sont tires alatoirement dune distribution du Chi-Deux 1 DDL sil y a corrlation, on augmente la valeur de Xit dun lment ui en posant ici = 0.5 4/ Munis des ralisations de X, de U et de on cre ensuite la chronique de Y sur la base dune relation du type : Yit = 10 + 0.5 Xit + it avec it = ui + it 5/ On utilise successivement les trois estimateurs : OLS sur donnes empiles,

48

Within et MCQG. Dans le cas, pour commencer, pour lequel il ny a pas de corrlation entre Xit et lerreur spcifique ui les estimations within et mcqg du coefficient attach X obtenues sur la base de ces 100 simulations prsentent les caractristiques suivantes :
.60 .56 .52 .48 .44 .40 .36 25 50 75 100
.60 .56 .52 .48 .44 .40 .36 25 50 75 100

BETA_ESTIME_WITH

BETA_ESTIME_MCQG

On note que, dans ce cas, les deux estimateurs sont sans biais et fournissent des estimations assez voisines. Dans le cas, prsent, pour lequel il existerait un lien entre la variables explicative et lerreur spcifique (cas de figure qui na rien dexceptionnel) les 100 estimations engendres par lusage des estimateurs within et mcqg prsentent les caractristiques suivantes :
.60

.56

.52

.48

.44

.40 25 50 75 100

BETA_ESTIME_WITH

49

.68 .64 .60 .56 .52 .48 .44 25 50 75 100

BETA_ESTIME_MCQG

Il est important de noter ici que lestimateur des MCQG est dsormais biais (il est aussi non convergent) de telle sorte quil existe une diffrence sensible entre les estimations issues de ces deux estimateurs. Le test de Hausman est, prcisment, fond sur ces proprits compares des estimateurs within et mcqg en prsence ou, au contraire, en labsence dun phnomne de corrlation X u. B - La statistique de test de Hausman On veut prouver lhypothse nulle dexognit des variables explicatives par rapport lerreur spcifique du modle... tant bien entendu que, du rsultat de ce test, dpend la mise en oeuvre d'un estimateur ou dun autre. Lintuition du test est que : . sil y a une diffrence significative entre les estimations within et mcqg cest que, vraisemblablement, lune au moins des variables explicatives est corrle avec lerreur spcifique. Dans ce cas il convient de privilgier lusage de lestimateur within qui garantit des estimations sans biais des coefficients j . sil ny a pas de diffrence significative entre les estimations within et mcqg cest que les variables sont exognes par rapport lerreur spcifique ; dans ce cas on privilgie lusage de lestimateur mcqg qui est alors sans biais et plus efficace que lestimateur within. Il sagit donc de tester lhypothse nulle :
H0 : j within - j mcqg = 0 j versus HA : j | j within - j mcqg 0

50

La statistique de test est :


H = ( within - mcqg) [ V ( within - mcqg) ]-1 ( within - mcqg) o V ( within - mcqg) est la matrice des variances covariances des diffrences entre les deux estimateurs. Sous H0, cette statistique est distribue selon une loi du Chideux k degrs de libert (o k est le nombre de composantes du vecteur des coefficients). Il est possible de montrer que, sous H0, cette matrice peut tre rcrite comme : V ( within - mcqg) = V ( within) - V ( mcqg) Le graphique ci-dessous reproduit les valeurs qui ont t obtenues pour la statistique de Hausman dans chaque cas de figure (absence / prsence dun phnomne de corrlation en X et u) :
9 8 7 6 5 4 3

160 140 120 100 80 60

2 1 0 25 50 EXOGENEITE 75 100

40 20 25 50 75 100 NON EXOGENEITE

La valeur critique pour un seuil de 5 % est, ici, gale 3.841, de telle sorte que, dans le premier cas (exognit) on nest amen rejeter lH0 que dans, approximativement, 5 % des cas.

Section V : Lapprciation de laptitude du modle reproduire les volatilits totale, intra et inter individuelles de Y
A lissue de lestimation dun modle en donnes de panel on est en droit de se poser quelques questions sur la qualit elle-mme de lajustement. Dans le cadre traditionnel du modle de rgression estim soit en coupe instantane soit sur sries chronologiques on apprcie la performance densemble du modle au regard de

51

son aptitude reproduire la variabilit de Y. Dans le cadre plus complexe dun modle estim sur donnes de panel, la performance du modle peut tre apprcie laune de plusieurs indicateurs. On se souvient 16 en effet que la variabilit totale TSS de Y (section I, paragraphe 3, B), cest dire la somme des carrs des carts des Yit par rapport sa moyenne densemble Y peut se dcomposer comme la somme de la variabilit interindividuelle BSS et de la variabilit intra individuelle WSS : TSSYY = WSSYY + BSSYY avec : TSSYY =

( Y
N T i =1 t =1 T N i =1 t =1 it

it

Y)

WSSYY =

( Y
N i =1

Yio ) Y)

BSSYY = T

(Y

io

La performance du modle tudi (quel quil soit au demeurant) peut tre apprcie par rapport son aptitude expliquer chacune de ces trois variabilits ; il est alors possible de dfinir, pour chaque modle, trois R2 : . le R2Total traditionnel qui nous renseigne sur la part explique de la variabilit totale de Y . le R2within qui nous renseigne sur la part explique de la variabilit intraindividuelle de Y . le R2betweenqui nous renseigne sur la part explique de la variabilit interindividuelle. Bien sr, chaque modle (MCO-Pooled, Within et Between) est plus particulirement ddi lexplication de lune de ces trois variabilits : . le modle MCO sur donnes empiles, par construction, est calibr pour

16

section I, paragraphe 3, B

52

minimiser la somme des carrs des rsidus entre Y observs et Y calculs. Cest le modle qui expliquera le mieux la variabilit totale de Y ; cest donc avec cette mthode que le R2 traditionnel sera le plus lev . quand on utilise le modle WITHIN sur donnes centres autour des moyennes individuelles, on cherche expliquer la variabilit intra-individuelle de Y ; cest donc avec cette mthode que le R2within sera le plus lev . quand on utilise le modle BETWEEN sur donnes centres autour des moyennes individuelles, on cherche expliquer la variabilit intra-individuelle de Y ; cest donc avec cette mthode que le R2between sera le plus lev De faon trs pratique, comment doit-on sy prendre pour calculer ces diffrents R2 ? On prendra comme exemple le cas du modle sur donnes empiles (modle Pooled) le calcul du R2total est tout fait standard ; il ny a donc pas lieu de sy attarder le calcul du R2within se fait ainsi : on commence par calculer les carts observs Yit Yio des Yit leurs moyennes individuelles ; on construit
ensuite les carts Yit Yio des Y calculs leurs moyennes individuelles avec :
Y it

1 T j pool X j it et Y io = Yit T t =1 j=1

Le R2within, pour ce modle, est alors calcul comme le carr du coefficient de corrlation entre les Yit Yio et les Yit Yio .

Cov Y Y , Y Y ( it io ) it io 2 R within = s ( Yit Yio ) s Yit Yio

( (

)) )

le calcul du R2between se fait ainsi : on commence par calculer les moyennes individuelles des Y observs et calculs. Le R2between est alors calcul comme le carr du coefficient de corrlation entre ces moyennes individuelles :

53

Cov Y , Y io io 2 R between = s ( Yio ) s Yio

) ( )

En partant prsent du modle Within, une prcaution doit tre prise pour le calcul
des Y it qui serviront au calcul des trois R2. Il convient en effet de ne pas introduire les effets fixes dans le calcul de ces Y ... sauf se retrouver avec un R2between gal 1

puisque les effets fixes sont justement calculs de telle sorte que les moyennes individuelles observes et calcules soient identiques 17 ; dans ces conditions, il y aurait adquation parfaite entre moyennes individuelles observes et moyennes individuelles calcules. Exemple : On dispose de donnes de panel relatives au nombre de grves dans le secteur industriel 18 . On note GREVEit le nombre de jours de grve pour 1000 salaris du secteur industriel dans le pays i au cours de lanne t. On souhaite relier cette variable au taux de chmage (CHOMit) et au taux dinflation (INFLit) du pays i tels quils ont pu tre observs au cours de lanne t. Le panel est constitu de 17 individus-pays et de 35 observations dans le temps chelonnes de 1951 1985. On estime les 5 modles tudis jusquici (Pool, LSDV, Within, Between et MCQG) et, pour chaque modle, on value sa performance au regard de la reproduction des diffrentes variabilits. Les donnes et le programme utiliss sont respectivement : hurlin_greves_emp.wf1 estimation_panel_data.prg (programme EViews)

17

On peut sen assurer sous Eviews 5.0 (page structure) en comparant les proprits statistiques des

valeurs observes et calcules (within) de Y.


18

Les donnes sont issues de http://lib.stat.cmu.edu/datasets/. Lexemple est issu de Ch.

HURLIN : Lconomtrie des donnes de panel : modles linaires simples . Document de Travail Ecole Doctorale Edocif Sminaire Mthodologique (2000).

54

MCO - Donnes Empiles Variable CHOM INFL Const ESS R2 Total =

Coefficient 27.437903 18.613561 95.078706 183837589 0.0529

Ect.type 7.5399679 4.9865259 SE R2 Intra =

T Stat 3.6389947 3.7327713 557.25799 0.0026

Prob 0.0002976 0.0002077

R2 Inter =

0.5929

Estimateur LSDV Variable Coefficient CHOM -21.596840 INFL 16.272887 ESS R2 Total = 146958281 0.0004

Ect.type T Stat 9.1915834 -2.3496321 4.7565830 3.4211297 SE R2 Intra = 505.10979 0.0252

Prob 0.0191286 0.0006678

R2 Inter =

0.1969

Estimateur WITHIN Variable Coefficient CHOM -21.596840 INFL 16.272887 ESS R2 Total = 146958281 0.0004

Ect.type T Stat 9.1915834 -2.3496321 4.7565830 3.4211297 SE R2 Intra = 505.10979 0.0252

Prob 0.0191286 0.0006678

R2 Inter =

0.1969

Estimateur BETWEEN Variable Coefficient CHOM 80.954240 INFL 59.388224 Const -341.54624 ESS 503607.36 R2 Total = 0.0528

Ect.type 23.165030 32.606827 SE R2 Intra =

T Stat 3.4946745 1.8213433 189.66274 0.0032

Prob 0.0035728 0.0899879

R2 Inter =

0.5933

Estimateur MCQG Variable Coefficient CHOM -12.081434 INFL 16.424731 Const 248.62161 ESS 192970787 R2 Total = 0.0081

Ect.type T Stat 8.7862316 -1.3750417 4.7266967 3.4748858 SE R2 Intra = 579.31112 0.0234

Prob 0.1696541 0.0005496

R2 Inter =

0.0385

On notera que, conformment ce qui a t dit prcdemment, des diffrents modles, 1. celui qui maximise la valeur du R2total, cest le modle MCO sur donnes empiles

55

2. celui qui maximise la valeur du R2within, cest le modle Within sur donnes en diffrences aux moyennes individuelles 3. celui qui maximise la valeur du R2between, cest le modle Between sur les moyennes individuelles. Accessoirement, le programme fournit galement deux autres informations : un test pour lhypothse dhomognit (H0 : Homognit complte versus HA : Prsence deffets fixes ) un test de Hausman pour lhypothse nulle dexognit des variables explicatives par rapport aux erreurs spcifiques (le rsultat du test dtermine le choix dun modle effets fixes ou composantes derreur).
Test d'homognit (absence d'effets fixes) H0 : Homognit versus Ha : Prsence d'effets fixes F calc 9.03

DDL F* 5% Conclusion F* 1% Conclusion 16, 576 1.66 Rejet de H0 2.03 Rejet de H0

Le rsultat du test permet de rejeter lhypothse dhomognit interindividuelle de la relation (chmage, inflation) grves. Il faut donc privilgier un modle tenant compte des spcificits individuelles.
Test d'Hausman H0 : EXOGENEITE DES Xj H calc DDL H* 5% Conclusion H* 1% Conclusion 13.92 2 5.99 Rejet de H0 9.21 Rejet de H0

Le rsultat du test est donc que lhypothse nulle dexognit des variables explicatives doit tre rejete. Dans ce contexte, on sait que les estimateurs des MCQG sont biaiss. On privilgiera donc lusage dun estimateur de type Within qui a le mrite de demeurer sans biais dans un tel environnement. Section VI : Htroscdasticit et autocorrlation : dtection et correction On a suppos jusquici que les erreurs du modle tudi prsentaient quelques bonnes proprits. Notamment : 1/ elles sont supposes homoscdastiques dans la dimension interindividuelle 2/ elles sont supposes non corrles dans la dimension chronologique

56

Plus formellement, ceci peut tre exprim comme : E(it2 | X) = 2 i, t : lerreur est homoscdastique E(it js | X) = 0 t, s, i, j, i j : les erreurs ne sont ni autocorrles ni corrles entre des individus diffrents On pose ici deux questions : celle de la dtection dune possible violation de lune ou lautre de ces deux hypothses celle de la prise en compte dun phnomne dautocorrlation ou dhtroscdasticit. On traitera de cette double question dans le cadre thorique dun modle effets fixes. Cette question nest pas vaine : comme on le sait dj (cft. cours de Licence) une autocorrlation ou une htroscdasticit non prises en compte (utilisation par exemple de lestimateur des MCO) ont pour consquence le caractre biais et non convergent des estimateurs de la variance de lerreur et, par voie de consquence, des estimateurs des variances et covariances des estimateurs des diffrents coefficients. Illustration de ce rsultat connu : GENR_PANEL_AUTOCORRELATION.PRG A 100 reprises on gnre un panel de donnes pour lesquelles le terme derreur qui affecte la relation X Y est autocorrl : it = i 1 + t o on suppose que les it sont IIDN(0,1). La variance thorique des it, dans ce contexte, est donc telle que : 2 = 2 2 + 2 = 1 1 2

On exprimente le fait que, quoique lestimateur within du coefficient associ X soit sans biais, celui de la variance de lerreur it est, lui, biais (on pourrait ventuellement montrer quil est aussi non convergent). On comparera notamment la moyenne des valeurs estimes de sa valeur thorique (ectyp_theorique). Paragraphe 1 : violation des hypothses : la dtection

57

La dtection des phnomnes dautocorrlation ou dhtroscdasticit procde, quelques difficults supplmentaires prs, de la mme mthodologie que celle qui est mise en oeuvre dans le cas dchantillons plus conventionnels . A - Le test dabsence dautocorrlation Soit le modle Yit = i + Xit + it. On veut prouver le bien fond de lhypothse nulle dabsence dautocorrlation. Dire quil ny a, dans le modle tudi, aucun phnomne dautocorrlation, cest reconnatre que : E is jt = 0 i, j, s, t, s t A dire vrai, le test dhypothse traditionnellement mis en oeuvre se borne prouver lhypothse nulle dabsence dautocorrlation dordre 1 pour quelque individu i que ce soit. En dautres termes, il sagit de tester : H0 : E i t i t-1 = 0 i, t La statistique de test utilise est elle-mme une forme tendue de la statistique de Durbin Watson, propose par Bhargava, Franzini et Narendranathan (1982) 19. La statistique DWBFN est calcule comme une statistique de DW usuelle, ceci prs que les rsidus utiliss sont les rsidus issus de lestimation du modle effets fixes et

centrs autour de leurs moyennes individuelles it = it io o, il faut le prciser, les


it sont les rsidus issus de lestimation du modle :
it = Yit - i - 1 X1 it - ... - k Xki t

DWBFN =

(
N T i =1 t = 2 N

it

i t 1 )
2 it


i =1 t =1

La statistique ainsi calcule est gnralement produite par la plupart des logiciels qui rendent possible l'estimation des modles sur la base de donnes de panel.

19

Bhargava, Franzini et Narendranathan : Serial correlation and fixed effect model . Review of

economic studies, 49, 1982, pp.533-549.

58

On reproduit ci-dessous le tableau des valeurs critiques telles quelles ont t produites par BFN (1982) pour un nombre dindividus relativement important :
N = 100 dmin T=6 K=3 K=9 T = 10 K=3 K=9 1.859 1.839 1.891 1.878 dmax 1.880 1.902 1.904 1.916 dmin 1.939 1.935 1.952 1.949 N = 500 dmax 1.943 1.947 1.954 1.957 dmin 1.957 1.954 1.967 1.965 N = 1000 dmax 1.959 1.961 1.968 1.970

Pour un nombre dobservations trs important N = 1000, on voit quil est possible de rejeter lhypothse nulle dabsence dautocorrlation si la valeur calcule de la statistique est infrieure 1.96. B - Un test dhomoscdasticit Ici encore le test de lhypothse nulle dhomoscdasticit est une extension au cas des donnes de panel du test bien connu de White. Il suffit simplement, lissue de lestimation, sur donnes de panel, du modle principal : Yit = i + 1 X1 it + ... + k Xk it + i t de procder un ajustement auxiliaire, toujours sur donnes de panel, du type : it2 = 0 + 1 X1 it2 + ... + k Xk it2 + i t
20

o, videmment, les i t sont les rsidus issus de lajustement principal. Sous lhypothse nulle dhomoscdasticit, la statistique W = N.T. R2auxiliaire est rpute tre distribue selon une loi du Chi Deux k degrs de libert. Exemple : strikes_hurlin.wf1 On a repris les donnes produites par Ch. Hurlin, relatives lexplication du nombre de jours de grves en fonction du taux de chmage et du taux dinflation dans un pays i une date t. Rappelons que lestimation est conduite sur la base dun panel de 17 pays pour lesquels on dispose de 35 observations dans le temps (le panel est cylindr).

20

Le cas chant, on peut introduire, de faon complmentaire, les variables en niveaux et les produits

croiss de celles-ci.

59

Lestimation within du modle est reproduite ci-dessous (on a nglig de faire apparatre les effets fixes) :

Dependent Variable: GREVES? Method: Pooled Least Squares Date: 02/16/04 Time: 15:37 Sample: 1951 1985 Included observations: 35 Ccross-sections included: 17 Total pool (balanced) observations: 595 Variable INFL? CHOM? Coefficient 16.27289 -21.59684 Std. Error 4.756583 9.191583 t-Statistic 3.421130 -2.349632 Prob. 0.0007 0.0191

Munis des rsidus de cet ajustement principal on a ensuite procd lajustement auxiliaire :

Dependent Variable: RESID?^2 Sample: 1951 1985 Included observations: 35 Ccross-sections included: 17 Total pool (balanced) observations: 595 Variable INFL?^2 CHOM?^2 C R-squared Coefficient 4.581650 -1781.656 286068.0 0.000701 Std. Error 1111.859 2780.008 128204.0 t-Statistic 0.004121 -0.640882 2.231350 Prob. 0.9967 0.5218 0.0260 246988.7

Mean dependent var

La statistique W est : W = 595 * 0.000701 = 0.417 La valeur prise par la statistique permet de conclure limpossibilit de rejeter H0. Paragraphe 2 : La violation des hypothses : la prise en compte On suppose prsent que lune ou lautre des deux hypothses dabsence dautororrlation et dhomoscdasticit a t rejete. Comment peut on en tenir compte. A - La correction de lautocorrlation

60

Le test de Durbin a mis en vidence, pour le modle tudi, la ralit dun phnomne dautocorrlation des rsidus. On peut donner deux interprtations de ce rsultat qui dbouchent sur un traitement spcifique de cette autocorrlation. la mise en vidence dun phnomne dautocorrlation des rsidus doit ncessairement amener lutilisateur sinterroger, avant toute chose, sur lventuelle omission dune variable essentielle qui serait elle-mme autocorrle. Une telle omission, au del de lautocorrlation des rsidus quelle suscite, est susceptible dengendrer aussi un biais sur lestimation des coefficients associs aux diffrentes variables explicatives si lventualit dune autocorrlation des rsidus induite par lomission dune variable essentielle peut tre carte, il faut alors songer un traitement spcifique de la probable autocorrlation des erreurs. Il est alors toujours possible de mettre en oeuvre une mthode de correction du type Cochrane Orcutt qui consiste prfrer au modle Yit = i + 1 X1 it + ... + k Xk it + i t pour lequel lerreur i t est, intraindividuellement, autocorrle une spcification du type : Yit = i (1-) + 1 (X1 it - X1 i t-1) + ... + k (Xk it - Xk i t-1) + i t - i t-1 pour laquelle le terme derreur i t - i t-1 ne serait pas autocorrl (sous rserve que le paramtre ait t correctement estim). Exercice : genr_panel_autocorrelation.prg. Ce programme fabrique 100 reprises un panel de donnes pour lequel l'erreur du modle est autocorrle. On montre que : - l'estimateur within demeure un estimateur sans biais de beta ( la condition, bien sr, que l'erreur ne soit pas aussi corrle avec la variable explicative X !) - que, dans ce contexte, la correction la Cochrane Orcutt induit un estimateur de beta qui est, lui, plus efficace. La relation X Y est du type : Yit = 10 + 10 Xi t + it avec i t = 0.95 i t-1 + t o les t sont iid N(0,1). Le graphique ci-dessous reproduit les estimations qui ont t obtenues du coefficient associ la variable X pour chaque panel de donnes en utilisant dabord

61

lestimateur within sans tenir compte du caractre autocorrl des erreurs puis en prenant en compte cette autocorrlation. On exprimente que les estimations induites par la mthode Cochrane Orcutt prsentent un degr defficacit suprieur.
10.16 10.12 10.08
10.02 10.06 10.04

10.04
10.00

10.00 9.96 9.92 9.88 25 50 75 100


9.98 9.96 9.94 25 50 75 100

Sans Correction de l'Autocorrlation

Avec Correction de l'Autocorrlation

B - La correction de lhtroscdasticit Dans le cas pour lequel la statistique de White rvlerait la prsence dun phnomne dhtroscdasticit interindividuelle on met traditionnellement en oeuvre une mthode de correction inspire de la mthode des MC Pondrs. On admet, par hypothse, que la variance de lerreur i t est homoscdastique pour un mme individu (homoscdasticit intraindividuelle) mais htroscdastique dun individu lautre (htroscdasticit interindividuelle) : Var it = i2 i, t Dans ce contexte on peut essayer de corriger lhtroscdasticit en pondrant toutes les observations relatives un mme individu par un coefficient spcifique cet individu. Il reste, videmment, dterminer la valeur de ces coefficients de pondration spcifiques. Un moyen simple consiste estimer, dans un premier temps, la relation X Y sur donnes empiles et calculer les variances intra individuelles des rsidus issus de cet ajustement prliminaire. Les carts type intra individuels ainsi calculs seront ensuite utiliss pour pondrer les observations relatives aux diffrents individus. Exemple : genr_panel_heteroscedasticite.prg. On montre que, en prsence dune htroscdasticit interindividuelle des erreurs, la mthode des MCP induit des estimateurs plus efficaces. A 100 reprises on construit un panel de donnes pour 20 individus (numrots !i =

62

1, ..., 20) et 30 observations dans le temps avec : effets fixes : on suppose que leffet fixe i relatif au ie individu est gal i. htroscdasticit des erreurs : on suppose que lcart type intra individuel de lerreur associe au ie individu est li lordre de grandeur de X, luimme variable dun individu lautre it = 10 X io it une relation X Y du type : Yit = i + 10 Xit + it A chaque itration, 1. on estime pour commencer un modle effet fixe sans correction de lhtroscdasticit 2. on calcule la statistique de White pour lhypothse nulle dhomoscdasticit 3. on estime un modle effets fixes en ayant soin de pondrer les variables du modle par les carts type intra individuels tels quils peuvent tre calculs. On exprimente que la statistique de White, dans ce cas dune htroscdasticit lie lordre de grandeur de X, dtecte correctement le phnomne 21 dune part et que, dautre part, la pondration des variables induit des estimateurs de plus efficaces.
90 80 70 60 50 40 30 20 10 0 25 50 VSTAT_WHITE 75 100

avec it iid N(0,1)

21

25%(1) = 3.85

63

11.5 11.0

10.8 10.6 10.4

10.5 10.0 9.5 9.0 8.5 25 50 VBETA_WITH 75 100

10.2 10.0 9.8 9.6 9.4 9.2 25 50 VBETA_MCP 75 100

Dans le cas pour lequel le phnomne dhtroscdasticit sexprime dans les deux dimensions, cest dire le cas pour lequel : Var it = it2 il est possible de mettre en oeuvre une autre technique pour lestimation des carts type it. 1/ On commence par estimer un modle effets fixes sans pondration des variables utilises 2/ Munis des coefficients estims, on calcule les rsidus de cette estimation :
it = Yit - i - Xit 3/ Sous lhypothse dune htroscdasticit lie lordre de grandeur de lune des variables du modle (par exemple X) selon la relation fonctionnelle : it2 = f(0 + 1 Xit + 2 Xit2) on obtient une estimation de llment 0 + 1 Xit + 2 Xit2 en rgressant f-1( it2) sur X et son carr. On obtient par ce truchement une estimation de it2 quon peut ensuite utiliser pour pondrer les variables du modle.

64

Section VII : Les modles dynamiques On sintresse ici une classe particulire de modles de donnes de panel. Ce sont les modles qui font dpendre la valeur de Y pour le ie individu la date t non seulement des valeurs prises par les variables Xj pour ce mme individu mais aussi et cest l que rside la source des difficults associes lestimation de ces modles des valeurs retardes de la variable explique elle-mme. Le modle tudi ici peut donc tre spcifi sous la forme : Yit = i + Xi t + Yi t-1 + i t si on sen tient une seule variable exogne. On pourrait considrer la valeur retarde de Y comme une variable explicative tout fait ordinaire et procder par consquent lestimation des coefficients du modle en mettant en oeuvre les techniques qui ont t prsentes jusquici (par exemple en utilisant lestimateur within). Malheureusement, on va montrer que, prcisment, Yi t-1 nest pas une variable explicative comme une autre et que lestimateur (within notamment) du coefficient qui lui est attach est ncessairement biais et non convergent. Ds lors, dautres techniques destimation doivent tre envisages qui font appel lusage de variables instrumentales. Paragraphe 1 : Les estimateurs traditionnels sont biaiss et non convergents On met ici en vidence le fait que les estimateurs usuels dvelopps jusquici sont biaiss et non convergents ds lors quils sont utiliss dans le cadre dun modle dynamique. Pour ne pas alourdir inutilement lexpos, on se contentera de mettre en vidence cette proprit fcheuse dans le cas de lestimateur within. On part du modle : /1/ Il implique : /2/ Y io = i + X io + Y io (1) + io o Y io (-1) est la moyenne intraindividuelle des Yit calcule sur les T-1 premires observations relatives lindividu i. Yit = i + Xi t + Yi t-1 + i t

65

Lestimateur within consiste, on le rappelle, appliquer lestimateur des MCO au modle /3/ obtenu en retranchant le contenu de lquation /2/ celui de lquation /1/ : /3/ (Yit - Y io) = (Xit - X io) + (Yi t-1 - Y io (-1)) + (it - io)

Le problme majeur qui se pose avec cette nouvelle quation est que sa spcification introduit de facto un phnomne de corrlation entre la nouvelle erreur du modle (it - io) et la variable (Yi t-1 - Y io (-1)). Lexplication dun tel phnomne est simple comprendre : le calcul de Y io (-1) fait intervenir implicitement les T-1 premires erreurs it... de telle sorte que, par construction, (Yi t-1 - Y io (-1)) et (it - io) sont ncessairement corrles. Les consquences dun tel phnomne sont bien connues :

lestimateur du coefficient associ la variable endogne retarde est biais et non


convergent (cf. cours Economtrie III). On exprimente cette proprit laide dune simulation. Illustration : genr_panel_dynamique.prg (alternativement on peut aussi utiliser panel_dynamique_biais.prg) A 100 reprises on a cr un panel de donnes de 24 individus et 32 observations dans le temps. On introduit une relation dynamique du type : Yit = i + Xit + 0.8 Yi t-1 + it Les ralisations du terme derreur it sont tires de manire purement alatoire et indpendante dune distribution normale standard. Les effets fixes relatifs aux diffrents individus sont tirs dune distribution uniforme dont les modalits sont des entiers compris entre 0 et 100. On exprimente le fait que lestimateur within est biais :

66

.81 .80 .79 .78 .77 .76 .75 .74 .73 .72 10 20 30 40 50 60 70 0.8 80 90 100

COEFYLAG

En faisant varier la taille de lchantillon dans lune puis dans lautre des deux dimensions on peut vrifier que cet estimateur biais est . convergent dans la dimension temporelle . non convergent dans la dimension individuelle 22 :
.808 .806 .804 .802 .800 .798 .796 .794 .792 10 20 30 40 50 60 70 0.8 80 90 100

COEFYLAG

N = 24 ; T = 1000

22

Sur ce point, on pourra consulter M. Verbeek, op.cit. pp. 327-329

67

.805 .800 .795 .790 .785 .780 .775 .770 .765 10 20 30 40 50 60 70 0.8 80 90 100

COEFYLAG

N = 1000 ; T = 32

On montrerait sur la base du mme argument que lestimateur between et lestimateur D1 du modle rcrit en diffrence premire sont, tous les deux, biaiss. On note en
effet que, pour le modle en diffrence premire : /4/ Yit = Yi t-1 + Xi t + (it - i t-1) Le terme Yi t-1 = Yit-1 Yi t-2 et le terme derreur (it - i t-1) on un lment commun, i t-1 en loccurrence. Paragraphe 2 : Lestimateur des Variables Instrumentales (Anderson et Hsiao 1981) On vient de voir que lestimateur within et lestimateur des MCO appliqu aux variables en diffrences premires sont biaiss. Rcrivons justement le modle en diffrences premires (on supposera, pour la simplicit, que le modle est purement autorgressif) : Yit Yi t-1 = (Yi t-1 Yi t-2) + (it - i t-1) On vient de voir que lestimateur des MCO appliqu ce modle est biais par construction puisque la variable explicative Yt-1 est corrle avec le nouveau terme derreur it (i t-1 est une des composantes de Yi t-1). Pour autant, Yi t-2, lui, nest thoriquement pas corrl avec it tout en demeurant fortement corrle avec

68

Yt1 23. Yt-2 prsente donc ce titre toutes les qualits attendues dun bon instrument. Dans ce contexte, la logique veut quon mette en oeuvre la mthode des variables instrumentales. Rappelons que, si Zt est un instrument pour la variable explicative Xt corrle avec le terme derreur, lestimateur VI des variables instrumentales, pour le modle Yt = + Xt + t est donn par :

VI =

z z
t =1 t =1 T

yt xt

Pour le modle dynamique tudi, lestimateur des variables instrumentales (Anderson et Hsiao 1981) a pour expression :

VI

y
i =1 t = 2

i =1 t = 2 N T

i t 2

(Yi t Yi t 1 )

i t2

(Yi t 1 Yi t 2 )

o yi t-2 est la valeur centre de Yi t-2 (on admet que Yit - Yi t-1 est desprance nulle). Alternativement, Anderson et Hsiao ont aussi propos dutiliser :

VI =

(Y (Y
i =1 t = 3 i =1 t =3 N T

i t 2

Yi t 3 ) (Yi t Yi t 1 )

i t 2

Yi t 3 ) (Yi t 1 Yi t 2 )

qui prsente toutefois linconvnient de conduire la perte dun degr de libert.

Illustration : genr_panel_dynamique_stacked.prg
A 100 reprises, on construit un panel de donnes et une relation : Yit = i + Xit + Yi t-1 + it avec i tir alatoirement, pour chaque individu, dune distribution uniforme [0, 100]. = 1 = 0.8

23

... la condition videmment que lerreur it ne soit pas elle-mme autocorrle.

69

On cherchera, chaque itration, retrouver les valeurs de ces coefficients en estimant les coefficients dun modle dynamique Yit = i + Xit + Yi t-1 + it. A cet effet, on utilisera . un simple modle effets fixes . un modle en diffrences premires . la mthode des variables instrumentales (applique au modle en diffrence) avec Yi t-2 comme instrument . la mthode des variables instrumentales avec Yi t-2 comme instrument. Les rsultats obtenus peuvent tre apprcies au travers des graphes reprsentatifs des estimations qui ont t obtenues du coefficient attach Yi t-1 :
.80
.44 .40 .36

.76

.72

.32 .28

.68

.24 .20 .16

.64

.60 10 20 30 40 50 60 70 80 90 100

.12 10 20 30 40 50 60 70 80 90 100

VGAMA_FE

VGAMA_DELTA1

4 3 2

0 1 -4 0 -1 -2 10 20 30 40 50 60 70 80 90 100 -8

-12 10 20 30 40 50 60 70 80 90 100

VGAMA_VI1

VGAMA_VI2

Moyenne des
Effet Fixe 0.71

70

Diffrences Variables instrumentales 1 Variables instrumentales 2

0.29 0.77 0.43

Paragraphe 3 : lestimateur des moments gnraliss (Arellano et Bond 1991) On vient de voir, en nous plaant dans le cadre analytique simplifi dun modle purement autorgressif, que la mthode des variables instrumentales consiste retenir Yi t-2 comme instrument la place de Yt-1 dans le modle rcrit en diffrence premire : Yit Yi t-1 = (Yi t-1 Yi t-2) + (it - i t-1) Yi t = Yi t-1 + i t On sait que, la condition bien sr que Yi t-2 soit effectivement non corrl avec lerreur i t, lestimateur des variables instrumentales est convergent. Est-ce pour autant quil est efficient ? Arellano et Bond (1991) montrent prcisment quun gain defficience peut tre obtenu en exploitant, pour chaque observation, tous les instruments disponibles... opportunit qui a t nglige jusquici et, notamment, comme on va le voir dans un instant, par la mthode des variables instrumentales qui vient dtre prsente. On se limitera ici une prsentation simplifie de la mthode de Arellano et Bond dans le cadre du modle autorgressif pur24 A - Lestimateur des moments gnraliss : le cas dun modle purement autorgressif Soit donc ici le modle : /1/ Yit = Yi t-1 + i + i t

quon rcrit, comme on la dj fait, en vue dliminer les effets fixes, en diffrence premire :

24

Pour une gnralisation au cas pour lequel le modle serait augment dun certain nombre de

variables exognes on pourra consulter B.H.BALTAGI pp. 134 136.

71

/2/

Yi t = Yi t-1 + i t

On suppose quon dispose dun chantillon ET de T observations indices t = 1, 2, ...T. Dans ce contexte, la premire ralisation observable du modle /2/ spcifi en diffrence premire est : Yi3 Yi2 = (Yi2 Yi1) + i3 - i2 La dernire ralisation observable (la T-2e) est : YiT Yi T-1 = (YiT-1 Yi T-2) + i T - i T-1 On fait sur les erreurs it les hypothses habituelles : E(it) = 0 i, t E(it2) = 2 i, t E(is it) = 0 i, s, t, s t Les erreurs it du modle en diffrence premire sont donc telles que : E(it) = 0 i, t E(it2) = 2 2 i, t E(it i t-1) = - 2 i, t E(it i t-k) = 0 i, t, k >1 La matrice des variances covariances des erreurs i t du modle en diffrences premires pour le ie individu est donc : E(i i) = 2 G o la matrice G, de dimension T-2 T-2, est telle que : 2 1 0 1 2 1 0 1 2 G= 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 2 1 0 1 2 1 0 1 2 0 0

72

Si on crit le modle sous forme matricielle : /3/ Y = Y-1 +

avec = 13, 14, ..., 1T, ..., N3, N4, ..., NT la matrice des variances covariances des erreurs pour lensemble des individus est de la forme : E( ) = 2 IN G = 2 N(T-2) N(T-2) o , on le rappelle, est le produit de Kronecker.

Lorsquil sagit, pour la premire ralisation du modle en diffrence, Yi3 Yi2 = (Yi2 Yi1) + i3 - i2 de dfinir un instrument pouvant se substituer la variable explicative (Yi2 Yi1), corrle avec le terme derreur (i3 - i2), vrai dire, le seul instrument sur lequel on puisse sappuyer est Yi1. Cest cet instrument quon pourrait qualifier dinstrument de premier plan qui avait t utilis implicitement par lestimateur des variables instrumentales. Ds lors quil sagit de la deuxime ralisation disponible Yi4 Yi3 = (Yi3 Yi2) + i3 - i2 deux instruments sont offerts qui peuvent se substituer (Yi3 Yi2) : linstrument de premier plan Yi2 (dj utilis implicitement avec la mthode des variables instrumentales) mais aussi un instrument de second plan,Yi1, qui avait t dlaiss jusquici. A fortiori, lorsquil sagit de dfinir les instruments utilisables pour la T-2e et dernire ralisation du modle : YiT Yi T-1 = (Yi T-1 Yi T-2) + iT - i T-1 on peut alors compter sur un instrument de premier plan : Yi T-2 T-3 instruments de second plan : Yi T-3, Yi T-4, ... Yi 1

soit, au total, T-2 instruments. On comprend quil peut tre dommageable, en termes defficience, de ne pas tenir

73

compte de linformation dlaisse jusquici - contenue dans les instruments de second plan. La prise en considration de cette information passe par la construction dune matrice Zi dinstruments de premier et de second plans 25 pour lindividu i : [ Yi1 ] 0 Zi = 0 0 [ Yi1 , Yi 2 ] 0 Yi1 , Yi 2 ,..., Yi T 2 0 0

de dimension T-2 (1 + 2 + ... + T-2). Au niveau agrg de lensemble des individus, la matrice Z des instruments est donne par :
[ Z1 ] [ Z2 ] de dimension N (T-2) (1 + 2 + ... + T-2) Z= [ Z N ] On doit bien noter que les composantes de cette matrice Z doivent, par nature, vrifier les conditions suivantes dites conditions sur les moments : E (Z ) = 0 puisque ces composantes sont rputes tre des instruments pour les variables quelles reprsentent. Rien ninterdit de prmultiplier chacun des lments du modle /3/ par cette matrice des instruments de telle sorte que : /4/ Z Y = Z Y-1 + Z

La matrice des variances covariances du modle ainsi rcrit a pour contenu :

25

On peut rapprocher cette matrice de celle qui avait t implicitement utilise avec la mthode des

variables instrumentales :

Yi1 0 Zi = 0

0 Yi2 0

0 0 Yi T 2

74

E(Z Z) = 2 Z Z Quel bnfice peut-on retirer dune telle transformation du modle sminal /3/ ? Ce quil faut bien comprendre (et ce qui a dj t mis en vidence) cest que lestimateur

MCO du modle en diffrence premire est, par construction, biais pour N grand et T fini. En revanche, lestimateur MCO du modle /4/ pour lequel les diffrentes
composantes du modle ont t prmultiplies par Z prsente une proprit intressante. On note en effet que cet estimateur dfini comme :

mco = (Y-1 Z Z Y-1)-1 Y-1 Z Z Y


= (Y-1 Z Z Y-1)-1 Y-1 Z Z ( Y-1 + ) = + (Y-1 Z Z Y-1)-1 Y-1 Z Z Si les conditions sur les moments sont effectivement vrifies alors la limite en

probabilit de mco est gale . Lestimateur est donc asymptotiquement sans biais.
Malheureusement, et parce que les erreurs it sont autocorrles, cet estimateur nest pas efficient. On doit lui prfrer lestimateur des MCG qui tient compte explicitement du caractre autocorrl des erreurs. Il est calcul comme (cest lestimateur one step de Arellano et Bond :

AB1 = (Y-1 Z (Z )-1 Z Y-1)-1 Y-1 Z (Z )-1 Z Y Muni de lestimation AB1 du coefficient , il est possible de calculer le vecteur
des rsidus du modle en diffrence premire. Il est alors possible de construire lestimateur de Arellano et Bond two step qui consiste substituer la matrice Z Z une estimation plus fine de la matrice des variances covariances : V = Z Z Au final, lestimateur des moments gnraliss la Arellano Bond est donn par :

AB2 = (Y-1 Z V-1 Z Y-1)-1 Y-1 Z V-1 Z Y


et lestimateur de la variance de lestimateur de est :

s2 ( AB2) = (Y-1 Z V-1 Z Y-1)-1


Application :

75

Dependent Variable: GREVES Method: Panel Generalized Method of Moments Transformation: First Differences Date: 02/25/04 Time: 22:14

Sample (adjusted): 1952 1985 Cross-sections included: 17 Total panel (balanced) observations: 561 White period instrument weighting matrix White period standard errors & covariance (d.f. corrected) Instrument list: @DYN(GREVES,-2,-2) INFL CHOM

Variable

Coefficien t

Std. Error

t-Statistic

Prob.

GREVES(-1) INFL CHOM

0.023364 17.50172 -23.15917

0.000104 0.190061 0.955292

224.0578 92.08494 -24.24302

0.0000 0.0000 0.0000

Effects Specification

Cross-section fixed (first differences)

R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat Instrument rank

-0.019134 -0.022787 669.4901 2.906874 17.00000

Mean dependent var S.D. dependent var Sum squared resid J-statistic

-11.31142 661.9903 2.50E+08 15.87603

76

Introduction Section I : structure gnrale et typologie des modles Section II : Le modle sur donnes empiles : estimateur MCO et estimateur Between Section III : Le modle effets fixes Section IV : Le modle effets alatoires Section V : Lapprciation de laptitude du modle reproduire les volatilits totale, intra et inter individuelles de Y Section VI : Htroscdasticit et autocorrlation : dtection et correction Section VII : Les modles dynamiques