Sie sind auf Seite 1von 41

Cours dconomtrie II Donnes de panel

Cours du 2 fvrier 2006


Michel Juillard

Cours dconomtrie IIDonnes de panel p. 1/4

Donnes de panel
Des donnes de panel contiennent des donnes sur plusieurs individus observs diffrentes dates. Exemples: Des donnes sur les 420 districts scolaires de Californie en 1999 et 2000, soit 840 observations en tout. Des donnes sur les 24 pays de lUnion europenne pendant trois ans, soit 72 observations. Des donnes sur 1000 individus pendant quatre mois, soit 4000 observations.

Cours dconomtrie IIDonnes de panel p. 2/4

Notation
Les donnes sont indices par un double indice:
i : lindividu, i = 1, . . . , n, soit n individus t : la priode, t = 1, . . . , T , soit T priodes

Pour un modle avec une variable explicatives, les donnes sont (Xit , Yit ) Avec k variables explicatives
(X1it , X2it , . . . , Xkit , Yit )

Cours dconomtrie IIDonnes de panel p. 3/4

Terminologie
donnes longitudinales est synonyme de donnes de panel un panel quilibr (balanced panel en anglais) a le mme nombre dobservations pour tous les individus un panel dsquilibr est un panel o il manque des observations pour certains individus

Cours dconomtrie IIDonnes de panel p. 4/4

Utilit des panels


Les donnes en panel permettent de contrler pour des facteurs qui varient entre les individus, mais ne varient pas au cours du temps, pourraient causer un biais domission si lon en tenait pas compte, sont inobservables ou non disponibles et ne peuvent tre inclus dans la rgression. Si ces facteurs ne varient pas au cours du temps, ils ne peuvent pas inuencer la variation de Y au cours du temps.

Cours dconomtrie IIDonnes de panel p. 5/4

Exemple
Accidents mortels de la circulation et impts sur lalcool aux EtatsUnis Unit dobservation: une anne dans un Etat des EtatsUnis: 48 Etats: n = 48, 7 ans (1982, . . . , 1988): T = 7, panel quilibr: 7 48 = 336 observations

Cours dconomtrie IIDonnes de panel p. 6/4

Exemple (suite)
Variables: nombre de morts par accident de la circulation pour 10000 habitants impts sur un paquet de bires autres (ge minimum pour la conduite, lois contre lalcool au volant, . . . )

Cours dconomtrie IIDonnes de panel p. 7/4

Donnes pour 1982

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 8/4

Donnes pour 1988

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 9/4

Autres facteurs
Pourquoi y auraitil davantage de morts par accident de la circulation dans les Etats qui ont des impts plus levs sur lalcool? Qualit (ge) des automobiles Qualit des routes Tolrance culturelle vis vis de boire et conduire Densit des voitures sur la route Ces facteurs peuvent causer un biais domission sils sont corrl avec les impts sur lalcool.

Cours dconomtrie IIDonnes de panel p. 10/4

Densit du trafc
Une densit du trafc plus leve est associe avec davantage daccidents mortels sur la route Les Etats de lOuest, moins peupls, ont des impts plus faibles sur lalcool. Facteur peu susceptible des changer au cours du temps (en 7 ans)

Cours dconomtrie IIDonnes de panel p. 11/4

Tolrance culturelle
Une tolrance culturelle envers le fait de boire et conduire peut tre associe des accidents mortels plus nombreux Il peut y avoir une corrlation entre les impts sur lalcool et lattitude culturelle Les attitudes culturelles ne changent en gnral pas dune anne lautre

Cours dconomtrie IIDonnes de panel p. 12/4

Panel sur deux priodes


Modle
F Rit = 0 + 1 BTit + 2 Zi + uit i = 1, . . . , 48; t = 1, 2

avec F Rit le taux daccidents mortels (fatality rate), dans lEtat i, la priode t, et BTit , les impts sur la bire (beer tax), dans lEtat i, la priode t. Zi est un facteur qui ne varie pas au cours du temps. Si Z nest pas observ et que corr(BT, Z) = 0, son omission entrane un biais de lestimateur 1

Cours dconomtrie IIDonnes de panel p. 13/4

Eliminer Z
Lquation pour 1982:
F Ri82 = 0 + 1 BTi82 + 2 Zi + ui82

Lquation pour 1988


F Ri88 = 0 + 1 BTi88 + 2 Zi + ui88

Supposon que E (uit |BTit , Zi ) = 0 (Supposons quil ny a pas dautres facteurs importants). Diffrence entre 1982 et 1988
F Ri = 1 BTi + vi

avec vi = ui88 ui82 . Bien que Z a disparu, corr (BT, v) = 0.

Cours dconomtrie IIDonnes de panel p. 14/4

Rsultats
Donnes pour 1982
F Ri = 2.01 + 0.15 BTi
(0.15) (0.13)

(n = 48)

Donnes pour 1988


F Ri = 1.86 + 0.44 BTi
(0.11) (0.13)

(n = 48)

Diffrences 19821988
F Ri = 0.072 1.04 BTi
(0.065) (0.36)

(n = 48)

Cours dconomtrie IIDonnes de panel p. 15/4

Reprsentation graphique

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 16/4

Rgression effet xe
Comment faire lorsquon dispose dobservations sur plus de 2 priodes? On peut crire le modle
Yit = 0 + 1 Xit + 2 Zi + uit

comme
Yit = i + 1 Xit + uit

avec i = 0 + 2 Zi . Leffet xe individuel inobservable devient un coefcient estimer!

Cours dconomtrie IIDonnes de panel p. 17/4

Estimation
Il existe trois mthodes pour estimer un modle effets xes: 1. Reprsenter i par n 1 variables binaires (en pratique, que si n nest pas trop grand) 2. Estimer en cart la moyenne de chaque individu (au cours du temps) 3. Estimer sur les donnes en diffrence (seulement si T = 2) Les trois mthodes fournissent les mmes valeurs estimes et les mmes erreurstype pour les coefcients.

Cours dconomtrie IIDonnes de panel p. 18/4

Variables binaires
Imaginons que nous navons que trois Etats: Californie (CA), Texas (TX) et Massachusetts (MA). Nous obtenons les quations suivantes:
YCA,t = CA + 1 XCA,t + uCA,t YT X,t = T X + 1 XT X,t + uT X,t YM A,t = M A + 1 XM A,t + uM A,t

Trois droites parallles avec la mme pente (1 ). On peut reprsenter les trois i laide de deux variables binaires: DCA = 1, sil sagit de la Californie, 0 autrement DT X = 1, sil sagit du Texas, 0 autrement.

Cours dconomtrie IIDonnes de panel p. 19/4

Variables binaires (suite)


On obtient le modle
Yit = 0 + CA DCAi + T X DT Xi + 1 Xit + uit

et
CA = 0 + CA T X = 0 + T X M A = 0

En gnral, il faut n 1 variables binaires.

Cours dconomtrie IIDonnes de panel p. 20/4

Variables binaires (suite)


Modle gnral:
Yit = 0 + 1 Xit + 2 D2i + . . . + n Dni + ui

Peut tre estim par les MCO Les tests et les intervalles de conance se calculent de la manire habituelle (en utilisant les erreurs-type robustes lhtroscdasticit) Difcile utiliser pour un trs grand nombre dindividus

Cours dconomtrie IIDonnes de panel p. 21/4

Donnes centres
Modle effets xes
Yit = i + 1 Xit + uit

Moyennes au cours du temps pour chaque individu:


1 T
T t=1

1 Yit = i + 1 T

T t=1

1 Xit + T

uit
t=1

Modle en carts la moyenne:


1 Yit T
T

Yit
t=1

= 1

1 Xit T

Xit
t=1

1 + uit T

uit
t=1

Cours dconomtrie IIDonnes de panel p. 22/4

Donnes centres (suite)


Yit = 1 Xit + uit
avec 1 Yit T 1 Xit T 1 uit T
T

Yit

Yit
=1 T

Xit

Xit
=1 T

uit

uit
=1

Par exemple, pour i = 1 et t = 1, Yit reprsente la diffrence entre le taux de mortalit par accident en Alabama en 1982 et le taux moyen de mortalit dans cet Etat entre 1982 et 1988.

Cours dconomtrie IIDonnes de panel p. 23/4

Estimation
Yit = 1 Xit + uit

Calculer Yit et Xit Estimer par les MCO Les tests et les intervalles de conance se calculent de la manire habituelle (en utilisant les erreurs-type robustes lhtroscdasticit)

Cours dconomtrie IIDonnes de panel p. 24/4

Exemple
F Rit = 0.66 BTit + effets xes
(0.20)

A comparer avec diffrences 19821988


F Ri = 0.72 1.04 BTi
(0.065) (0.36)

Cours dconomtrie IIDonnes de panel p. 25/4

Effets xes temporels


Une variable omise peut tre identique dans les diffrents Etats, mais varier au cours du temps. Par exemple la scurit des vhicles ou la rglementation nationale. On introduit des constantes qui changent avec le temps, mais pas les individus
Yit = 0 + 1 Xit + 2 Zi + 3 St + uit

Cours dconomtrie IIDonnes de panel p. 26/4

Estimation
Modles uniquement effets xes temporels
Yit = 0 + 1 Xit + 3 St + uit

Les modles effets xes temporelles peuvent sestimer en ajoutant T-1 variables binaires en centrant les donnes autour de la moyenne des individus par priode

Cours dconomtrie IIDonnes de panel p. 27/4

Effets xes individuels et temporels


Le modle
Yit = 0 + 1 Xit + 2 Zi + 3 St + uit

peut sestimer 1. laide de variables binaires


Yit = 0 + 1 Xit + 2 D2i + . . . + n Dni 2 B2t + . . . + T BTt + uit

2. en centrant les variables autour de la moyenne globale ( travers le temps et les individus)
1 Yit = Yit nT
n T

Yj
j=1 =1

Cours dconomtrie IIDonnes de panel p. 28/4

Hypothses
H1 : le modle Yit = i + 1 Xit + uit H2 : E (uit |Xi1 , . . . , XiT i ) = 0 H3 : (Xi1 , . . . , XiT , Yi1 , . . . , YiT ) est i.i.d. H4 : (Xit , uit ) a des quatrimes moments nis H5 : il ny a pas de multicolinarit parfaite (lorsquil y a plusieurs variables explicatives) H6 : corr (uit , uis |Xit , Xis , i ) = 0

Cours dconomtrie IIDonnes de panel p. 29/4

E (uit|Xi1, . . . , XiT i) = 0
uit = 0 tant donn leffet xe pour lindividu i et toute lhistoire de X pour cet individu.

Il ne peut y avoir deffets retards omis. Les effets retards doivent tre modliss explicitement. Il ne peut non plus y avoir deffets vers le futur. Par exemple, un taux daccidents particulirement lev une anne ne doit pas entraner une hausse des impts sur la bire les annes suivantes.

Cours dconomtrie IIDonnes de panel p. 30/4

(Xi1, . . . , XiT , Yi1, . . . , YiT ) est i.i.d.


Lhypothse est satisfaite si les individus sont tirs au hasard dans la population et quon enregistre lhistoire de ces individus Il nest pas ncessaire que les observations successives au cours du temps pour le mme individu soient i.i.d. Ce serait hautement irraliste.

Cours dconomtrie IIDonnes de panel p. 31/4

corr (uit, uis|Xit, Xis, i) = 0


Nouvelle hypothse propre aux panels. Les erreurs ne sont pas corrles au travers du temps pour un mme individu. Les facteurs omis de lquation ne doivent pas tre corrls au cours du temps. Exemples: Conditions mtorologiques Ouverture dune nouvelle autoroute Fluctuations du trafc dues aux conditions conomiques locales

Cours dconomtrie IIDonnes de panel p. 32/4

Si H6 nest pas satisfaite


Autocorrlation des erreurs. 1 demeure nonbiais et convergent lerreurtype de lestimateur est fausse. Intuitivement, lorsque les erreurs sont autocorrles, on ne dispose pas dautant dinformation quon le croit. Solution: utiliser une formule qui corrige les erreurstype poru lhtroscdasticit et lautocorrlation (HAC).

Cours dconomtrie IIDonnes de panel p. 33/4

Application
Quels sont les effets des diffrentes mesures contre lalcool au volant? sanctions pnales ge minimum pour consommer de lalcool impts sur lalcool

Cours dconomtrie IIDonnes de panel p. 34/4

Donnes
Un panel quilibr (n = 48, T = 7) Variables: taux de mortalit par accident de la circulation (pour 10000 habitants) impts sur la bire ge minimum pour consommer de lalcool sanctions pnales prison service dintrt gnral amende miles parcourus par conducteur taux de chmage revenu rel par habitant

Cours dconomtrie IIDonnes de panel p. 35/4

Utilit dun panel


Effets manquants, variables dun Etat lautre, mais constants au cours du temps attitudes culturelles visvis de boire et conduire qualit des routes ge des vhicules Effets manquants, constants parmi les Etats, mais changeants au cours du temps amlioration de la scurit des vhicules modication nationale de lattitue visvis de boire et conduire

Cours dconomtrie IIDonnes de panel p. 36/4

Rsultats

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 37/4

Rsultats (suite)

(Source: Stock et Watson, 2003)

Cours dconomtrie IIDonnes de panel p. 38/4

Discussion
Le signe de leffet des impts sur la bire change lorsquon introduit des effets xes individuels. Les effets xes temporels sont signicatifs, mais ne changent pas les rsultats de lestimation de manire importante. Leffet estim de limpt sur la bire diminue lorsquon introduit les autres mesures dissuasives. La seule mesure qui apparat statistiquement signicative est limpt sur la bire. Les variables denvironnement conomique apparaissent comme importante.

Cours dconomtrie IIDonnes de panel p. 39/4

Utiliser des variables binaires


On peut utiliser des variables binaires dans dautres contextes que les donnes en panel pour contrler des effets de groupe. Cest utile si lon souponne que des groupes dobservations sont affects par des effets nonobservs constants pour les observations dun groupe. Exemple: si la politique scolaire tait dcide au niveau du comt et que chaque comt soit compos de plusieurs districts scolaires.

Cours dconomtrie IIDonnes de panel p. 40/4

Donnes de panel: rsum


Avantages des effets xes: permettent de contrler pour des effets nonobservs xes au cours du temps ou travers les individus Davantage dobservations fournit davantage dinformation (valeurs estimes plus prcises) Extension de la mthodologie de la rgression Infrence se conduit de la manire habituelle Limitations: Les observations doivent varier au cours du temps. Les effets retards peuvent tre importants Les erreurstypes peuvent tre sousestimes si les erreurs sont autocorrles

Cours dconomtrie IIDonnes de panel p. 41/4