Beruflich Dokumente
Kultur Dokumente
UNIVERSITE DE CARTHAGE
MODULE N1
SOUS STATA
MAI 2012
1re dition
Introduction
Je voudrai donner quelques conseils principalement aux jeunes doctorants qui auront dans
leur recherches utiliser les techniques conomtriques afin de russir leur partie empirique
qui constitue une barrire pour plusieurs chercheurs confronts la mise en pratique de leurs
connaissances qui restent trs souvent thoriques. Il sagit l, dune rflexion qui permet, un
tant soit peu, dorienter le chercheur vers le choix appropri des mthodes conomtriques
utiliser, compte tenu de la nature de linformation statistique disponible, tout en gardant
lesprit que tout travail de recherche demeure perfectible. Seul Dieu est parfait !
La dmarche conomtrique.
Une double vision est requise au niveau de la lecture des articles de rfrence. (Type
de donnes, de variables retenues, mthodes destimation, type dinstruments et de
tests,) en plus du cadre conceptuel de la thorie conomique. Economie et
statistique vont de pair.
Cette collection dconomtrie applique sous Stata et/ou E-Views est une srie de modules,
fruit dun travail de recherche assidu dune quipe de jeunes chercheurs passionns du LEFA
que jai eu le privilge de diriger. Pour ce premier module, je tiens particulirement
remercier Seifallah Sassi et Dorsaf El Byr pour leur srieux. La srie N1 est consacre
lconomtrie des donnes de panel sous Stata. Elle fait lobjet de sminaires de formation
pour les doctorants pour leur permettre de manipuler les principales estimations en donnes
de panel, classiques et dynamiques. Dautres modules sont en cours dlaboration et paraitront
sous forme de modules complmentaires. Je peux citer :
Les lecteurs de ce document peuvent tlcharger les bases de donnes, partir du site du
laboratoire dconomie et de finance appliques, LEFA. Nous esprons recevoir vos
commentaires, afin damliorer et de mettre jour, de faon continue les versions proposes.
Mohamed Goaied
3
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Introduction
I. Initiation Stata
1. Connaissance avec lenvironnement de stata
2. Importation des donnes.
3. Analyse descriptive.
4
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Rfrences bibliographiques.
5
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
1. Initiation Stata
6
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Une instruction utile qui vient juste aprs licne (8) est variables Manager .
Elle permet de dattribuer des tiquettes pour les diffrentes variables du fichier des
donnes.
Exemple, le fichier des donnes ci-dessus contient comme troisime variable, GDP-
Capita qui est le taux de croissance du PIB par tte. Pour lui attribuer une
tiquette, il suffit de cliquer sur licne (variables Manager) , aprs avoir
ouvert le fichier des donnes. Vous aurez la figure suivante :
Pour attribuer une tiquette ou Label une variable, vous cliquez sur la variable, puis
vous indiquez la case label ( droite) : croissance du PIB par tte, puis vous
cliquez sur Apply. Le label indiqu apparait droite de la variable concerne.
Vous pouvez refaire ce principe pour toutes les variables du fichier de
donnes.
7
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Vous pouvez crer plusieurs documents, mais les deux principaux sont les suivants :
Data
Fichiers.dta : Base de donnes brutes + Bases de donnes qui intgrent les
modications (transformation logarithmique, nouvelles variables cres, etc.)
Il est fortement conseill de ne pas travailler directement sur la base brute, mais plutt
sur une copie.
Log
Fichiers.log : indiquent toutes les sorties de stata. Ils contiennent tous les
rsultats des commandes stata que vous avez effectu. Il doit tre ouvert, juste aprs
louverture du fichier des donnes afin de contenir tous les rsultats des commandes que
vous allez effectuer.
8
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Les principales variables sont la croissance annuelle du PIB par tte (prix
constants). Un Indicateur du dveloppement financier CPS : Lensemble des
crdits allous au secteur priv, en pourcentage du PIB, le taux dinflation, le
degr douverture (importations+Exportations/PIB) et les dpenses
gouvernementales. La base de donnes , se prsente sous forme dun fichier excel,
de ma manire suivante :
9
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
10
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Input file : Le fichier excel rechercher avec Browse. Output file, vous recherchez
la version Stata. Vous cliquez par la suite sur Transfert, pour vous permettre
davoir le fichier.xlsx converti, dans le mme rpertoire en fichier.dta ( exemple ;
Panel.xlsx est converti en fichier stata, panel.dta).
Quelques commandes Stata sont utiles, pour crer de nouvelles variables, calculer des
moyennes, des correlations, etc.
11
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
summarize ..., Calcule pour une variable ou une liste de variables la moyenne, lcart-
type, le minimum, le maximum
tabulate Calcule les frquences des observations dune variable et permet de faire
des tableaux croiss pour deux variables
pwcorr et corr Permet dobtenir la matrice des corrlations et la matrice des
variance-covariances, avec la significativit statsitique du coefficient de
corrlation linaire.
ttest ou sdtest Test de comparaison des moyennes ou des variances
tabulate ..., chi2 Test dindpendance de 2 caractres, test de Pearson
On peut utiliser galement les botes de dialogue de Stata. Par exemple si, on
veut calculer les : moyenne, carts type, minimum et maximum des variables, on
procde de la manire suivante :
12
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Aprs avoir retenu les variables, dans la case de gauche (variables), on obtient les
rsultats qui suivent :
13
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
On observe que le nombre dobservations pour les differentes variables, nest pas
identique. Cela est expliqu par le nombre de donnes manquantes pour les
principales variables retenues. Les valeurs minimales et maximales peuvent nous
permettre de dtecter lexistence deventuels points aberrants. Il est possible de
calculer les coeffcients de variation pour chaque variable (ecart-type/ moyenne)
pour voir lhomognit/Htrognit de lechantillon selon la variable tudie. A
titre dexemple, le CV de la variable ln_cps est gal 0.25 < 0.15. Ceci indique
une htrognit de lechantillon par rapport lindicateur du dveloppement
financier. On peut aussi calculer les correlations possibles avec les differentes
variables du modle afin de detecter le risque de multicolinrit, en cas de
correlations fortes entre certaines variables explicatives du modle. On procde
de la manire suivante :
De la mme faon, on choisit par la suite, les variables, pour lesquelles nous
effectuons lanalyse de la correlation, comme suit :
14
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
15
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Introduction
On utilise une notation deux indices, i pour l'individu i et t pour le temps. Les variables
explicatives Xkit sont variables dans le temps, alors que les variables z pi sont des facteurs
invariants dans le temps. La double dimension quoffrent les donnes de panel est un
atout majeur. En effet, si les donnes en sries temporelles permettent dtudier
lvolution des relations dans le temps, elles ne permettent pas de contrler
lhtrognit entre les individus. A linverse, les donnes en coupes transversales
permettent danalyser lhtrognit entre les individus mais elles ne peuvent pas tenir
compte des comportements dynamiques, puisque la dimension temporelle est exclue du
champ danalyse.
16
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
En utilisant des donnes de panel, on pourra exploiter les deux sources de variation de
linformation statistique : Temporelle o variabilit intra-individuelle et individuelle ou
variabilit inter-individuelle. Laugmentation du nombre dobservations permet de
garantir une meilleure prcision des estimateurs, de rduire les risques de multi
colinarit et surtout dlargir le champ dinvestigation. De nombreux modles
conomtriques, exploitant essentiellement des donnes d'entreprise, peuvent tre
confronts des donnes croises, le caractre particulier de celles-ci invite considrer
des spcifications et des mthodes d'estimation adaptes. Le panel considr nest pas
ncessairement complet (cylindr) o toutes les units statistiques sont observs durant
la priode considre. Il peut sagir dun panel incomplet, non cylindr, o les individus
ne sont pas observs sur toute la priode de lanalyse du fait du problme dentre/sortie.
A titre dexemple si on dispose dun panel incomplet de 1500 entreprises observes sur la
priode 1991-2010, certaines entreprises nexistaient pas en 1991 et ont t cres par la
suite. Par ailleurs, dautres entreprises qui existaient en 1991 ont pu disparatre de
lchantillon avant 2010, pour diverses raisons (fusion, acquisition, banqueroute, etc).
Dans ce cas de figure, le cylindrage de lchantillon nest pas conseill cause du risque
de biais de slectivit, puisque les entreprises que nous liminerons de lchantillon, pour
raisons dinformations temporelle incomplte, peuvent ne pas avoir la mme typologie
que celle qui sont observes sur toute la priode indique.
Ce chapitre prsente les techniques les plus courantes de modlisation des donnes de
panel. Thoriquement, les mthodes proposes dans ce cadre supposent que la dimension
individuelle est infinie (des centaines, voire des milliers dentreprises) et la dimension
temporelle est finie (bilans annuels observs sur quinze vingt ans). Do lintrt de
contrler lhtrognit des individuelle qui peut tre suppose fixe ou alatoire.1
1
Dans notre exemple empirique, on retient pour des raisons de commodit un panel de 15 pays observs sur 46
ans.
17
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Le modle effets fixes suppose que les relations entre la variable dpendante et
les variables explicatives sont identiques pour tous les individus. Si lon considre N
individus, observs sur Ti priodes de temps et K variables explicatives, le modle scrit
alors :
yi,t = i + k Xk,i,t + i,t , i =1,.,N et t =1,., Ti (4.1)
18
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
On suppose que les rsidus i,t sont i.i.d. et satisfont les conditions suivantes, et
[1;N] ; [1;Ti] :
E (i,t) = 0
E (i,t i,s) = ,
E (i,t j,s) = 0 , ,
Le modle effets fixes individuels prsente une structure des rsidus qui vrifient les
hypothses standards des MCO. Il sagit en fait dun modle classique avec variables
indicatrices individuelles.
Les ralisations des estimateurs des constantes i sont dduites au point moyen, aprs
estimation des paramtres k selon la relation qui suit :
K
i yi k xki
k 1
Lestimateur MCO des coefficients k est obtenu en centrant les diffrentes (variables
19
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
K
yit k xkit it
k 1
Ti
Avec yit yit yi , xkit xkit xki , it it i . On note que yit 1
Ti y
t 1
it .
Les variables xkit et it , tant dfinies de faon analogue. Il est conseill dans le cas o le panel
est non cylindr dutiliser loption robuste de manire tenir compte de lhtroscdasticit
des erreurs, puisque la variance des erreurs du modle transform nest pas constante. En
effet, on vrifie que : v( it ) 2 TiTi 1 .
Outre le fait que la variabilit inter-individuelle nest pas exploite pour estimer les
paramtres structurels du modle, une limite inhrente au modle effets fixes rside
dans le fait que limpact des facteurs invariants travers le temps ne peut tre identifi.
Ceci constitue une limite au niveau de lanalyse conomique, puisquil revient
restreindre le champ danalyse conomique de ltude.
Pour toutes les applications sous STATA sur des donnes de panel, on utilise la
mme base de donnes panel.dta, prsente dans la section prcdente.
Avant d'utiliser les commandes sur donnes de panel, il faut indiquer Stata la variable prcisant la
dimension individuelle et celle relative la dimension temporelle. Cela se fait par la commande tsset.
Exemple : tsset id tps dclare des donnes de panel ; o id est la variable indicatrice de la dimension
individuelle et tps l'indicatif de la dimension temporelle.
Pour les commandes qui suivent, il est sous-entendu que la commande tsset doit les prcder.
Dans cette application, lindicateur de la dimension individuelle est le code_pays, celui de la dimension
temporelle est la variable anne.
20
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
21
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La croissance moyenne du PIB par tte, sur lensemble de lchantillon est de 1.98%. La
variance inter-individuelle (between) est gale 3.9, alors que la variance intra-
individuelle (temporelle) est gale 60.1 sur une variance totale de 63.9, soit 94% de la
variance totale. Ceci sexplique par limportance de la dimension temporelle dans notre
chantillon (en moyenne 35 ans par pays) par rapport la dimension individuelle (15
pays).
22
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Lestimation dun modle effets fixes sous Stata se fait avec la syntaxe suivante :
xtreg variable dpendante_ variables explicatives , fe
2
On retient un modle double logarithmique de manire pouvoir estimer des lasticits et effectuer lanalyse
en terme relatif.
23
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
L'option robust associe la commande xtreg, corrige les t de student de l'htroscdasticit par la
mthode de White. Mais La commande xtreg..., fe ne permet pas d'option robust pour la correction de
l'htroscdasticit. Pour le faire, il faut utiliser une autre commande nomme areg. (estimation par les MCO
avec variables indicatrices individuelles). La commande areg ncessite de spcifier la dimension individuelle,
mme si la commande tsset est utilise avant. L'option absorb(id) spcifie la variable id comme reprsentant la
dimension individuelle. Ceci permet de crer les 15 variables indicatrices relatives aux pays.
24
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La diffrence entre xtreg..., fe et areg est qu'avec le premier, les donnes sont transformes en
diffrences par rapport a la moyenne individuelle pour liminer les effets fixes, alors que la commande areg
revient a faire des MCO sur un modle dans lequel on introduit une variable muette pour chaque individu ou
pays. On note que les deux mthodes fournissent les mmes valeurs pour les paramtres estims. La diffrence
rside dans les carts-types estims avec la fonction (areg) qui permet de fournir des estimateurs robustes.
Les estimations des paramtres sont identiques que celles du tableau prcdent. Seuls
les carts types estims de ces estimateurs sont plus faibles, cause de linstruction
robuste. Les rsultats montrent quen termes dimpact, louverture commerciale prsente
un effet marginal plus important sur la croissance conomique, quune politique
montaire visant la matrise de linflation. Leffet ngatif du dveloppement financier sur
la croissance peut sexpliquer par plusieurs raisons : (htrognit des pays en matire
de dveloppement financier, la non linarit de la relation, la prsence dun effet seuil,
etc. La recherche dune explication doit tre davantage du ct de la littrature
conomique, plutt que de larsenal conomtrique utiliser !
1.3.2 Modle effets fixes avec variables instrumentales
Pour estimer un modle effets fixes avec des variables instrumentales, il faut utiliser la commande
xtivreg..., fe dont la syntaxe gnrale est:
xtivreg variable_dpendante variables_exognes (variables endognes = instruments), fe
25
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Dans l'exemple qui suit, On retient comme variables exognes les trois variables
de contrle. La variable endogne est le ratio des crdits aux secteurs privs par rapport
au PIB, logCPS. On retient comme instrument supplmentaire le trend, (variable year),
sachant que toutes les variables exognes du modle sont utilises comme instruments.
Lapplication avec variables instrumentales propose dans cette section ne permet pas
damliorer la prcision des estimateurs. Elle est retenue, juste pour la vulgarisation de la
mthode. Le choix des instruments peut ne pas tre pertinent. Dans la pratique, il sagit de
procder des modifications des instruments retenir, jusqu lobtention de rsultats
significatifs.
2. Le modle erreurs composes.
Le modle erreurs composes suppose que la spcificit individuelle est sous
forme alatoire. Le terme constant spcifique lindividu i est alatoire. Il se dcompose
en un terme fixe et un terme alatoire spcifique lindividu permettant de contrler
lhtrognit individuelle. En regroupant les termes alatoires du modle, on obtient
une structure erreurs composes.
Comme nous dcomposons la constante dans le modle effets fixes, il sagit dans
le modle effets alatoires de dcomposer les rsidus. Cest en effet dans ces derniers
quinteragissent les variables explicatives omises. Le modle scrit toujours :
26
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Gnralement, on est conduit faire un certain nombre dhypothses sur cette structure
de rsidus.
2.1 Les hypothses sur les rsidus.
On suppose que les rsidus sont i.i.d. et satisfont les conditions suivantes :
E (ui) = E (i,t) = 0
E (ui i,t) = 0
E (ui u j) = u i j , 0 sinon
Contrairement au modle effets fixes, le modle erreurs composes utilise les deux
dimensions du panel. Par consquent, on peut largir le champ de recherche empirique,
en mesurant leffet de facteurs invariants dans le temps, z pi (secteur dactivit de
lentreprise, titre dexemple), en plus des facteurs explicatifs variables dans le temps,
xkit . Puisque les erreurs composes, sont corrles par individu dans le temps, on utilise
la mthode des moindres carrs gnraliss. Il est ais de vrifier que lapplication des
MCG, revient appliquer les MCO sur le modle transform suivant:
3
On retient une structure erreurs composes ou seule la composante individuelle est prise en compte. Il est
possible dinclure une composante temporelle.
27
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
2
O i
Ti u2 2
Dans la pratique, lorsque le panel est incomplet on, retient o Ti est remplac par T .
Pour estimer un modle a effets alatoires, il suffit de remplacer l'option fe dans la commande xtreg par
l'option re. La syntaxe gnrale est donc la suivante:
xtreg variable_dependante variables_explicatives , re
28
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La commande :
Les rsultats destimation obtenus par le modle erreurs composes ne sont pas
meilleurs que ceux obtenus par le modle effets fixes. En effet, les coefficients
associs linflation et louverture commerciale ne sont plus significatifs, au
seuil conventionnel de 5%. Cela laisse penser que lhypothse dabsence de
corrlation entre le terme alatoire individuel ui et les variables explicatives du
modle nest pas vrifie. Il sen suit des estimations biaises. Le test de Haussmann
dvelopp la section 3, devrait confirmer ces prsomptions. Toutefois, cette dfaillance
statistique peut galement sexpliquer par le problme dendognit de la variable (CPS).
Do lintrt dutiliser les techniques des variables instrumentales.
29
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La commande :
3. Le test de Hausman
3.1. La procdure du test.
Le test de spcification dHausman (1978) est un test gnral qui peut tre
appliqu des nombreux problmes de spcification en conomtrie, traitant avec le
problme dendognit. Son application la plus rpandue est celle des tests de
spcification des effets individuels alatoires en panel. Lide gnrale du test
dHausman est simple : Supposons que lon cherche tester la prsence ventuelle dune
corrlation ou dun dfaut de spcification. Admettons que lon dispose de deux types
destimateurs pour les paramtres du modle tudi. Le premier estimateur est suppos
tre lestimateur non biais variance minimale sous lhypothse nulle de spcification
correcte du modle (absence de corrlation). En revanche, sous lhypothse alternative de
mauvaise spcification, cet estimateur est suppos tre biais. Par contre, le second
estimateur, celui du modle effets fixes, est non biais dans les deux cas. Lapplication
30
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
technique de ce principe suppose tout de mme que lon construise la matrice de variance
covariance de lcart entre les deux estimateurs. Le test de spcification de Haussman
repose sur le corps dhypothses suivant :
H0 : E(ui i) = 0 ( les estimateurs du modle erreurs composes sont efficaces.)
31
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La premire ligne de commande estime le modle effets fixes. La seconde ligne conserve les rsultats du
modle effets fixes sous le nom fixed. La troisime ligne estime le modle effets alatoire et la quatrime
ligne excute le test de Hausman proprement dit.
Appliquons le test de Hausman pour choisir le modle le plus appropri aux donnes.
32
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Les estimateurs du modle erreurs composes sont biaiss. Il est prfrable de retenir
ceux du modle effet fixes qui sont sans biais. Il est possible de refaire la mme
procdure pour les estimations du modle effets individuels fixes et alatoires dans le
cadre des techniques des variables instrumentales.
Le modle linaire des donnes de panel est fond sur lhypothse de non-
corrlation entre les effets spcifiques non observs, i , les rgresseurs xit et Zi. Hypothse
z'1i correspond aux L1 variables invariantes dans le temps et non corrles avec i .
E ( i x1it ) E ( i z1i ) 0
E ( i x2it ) 0 et E ( i z2i ) 0
33
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Sur le plan pratique, la difficult rside dans la partition des facteurs explicatifs
(variant et invariants dans le temps) entre variables endognes et exognes. La
mthode destimation est celle des MCG avec variables instrumentales.
La commande :
La syntaxe gnrale de la commande sur Stata est la suivante:
xthtaylor var_dep var_explicatives ,endo(listel) cons(liste2) small
listel est la liste des variables endognes du modle (spares par un espace) y compris
les variables endognes invariantes dans le temps. Ici le terme endogne dsigne une
corrlation uniquement avec l'effet spcifique i et non avec le terme rsiduel it.
liste2 est la liste de l'ensemble des variables invariantes dans le temps. Cette option est
facultative car Stata dtecte automatiquement les variables constantes dans le temps et
celles qui varient selon les individus et le temps.
small est l'option qui permet de reporter les t de student au lieu des statistiques z de la
loi normale centre rduite, et la statistique F de Fisher au lieu de la statistique de chi2.
Cette dmarche est valide dans les chantillons de petites tailles, en labsence de
convergence asymptotiques en lois. Dans cette application, nous avons introduit 2
variables supplmentaires invariantes dans le temps (une variable rgionale, exogne:
Middle East=1, pour les pays du moyen orient, 0 sinon) et ressources naturelles,
suppose endogne, gale 1 pour les pays producteurs de ptrole, 0 sinon). Par
consquent, pour lobjet de cet exercice, on a 2 variables endognes : le dveloppement
34
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
35
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Avec
Avec:
n = Nombre d'observations
k = Nombre de variables explicatives si les donnes proviennent des rsidus d'une
rgression linaire. Sinon, k=0.
S = Coefficient d'asymtrie : Moment d'ordre 3 d'une variable centre-rduite
K = Kurtosis : Moment d'ordre 4 d'une variable centre-rduite
Le test de Jarque-Bera ne teste pas proprement parler si les donnes suivent une loi
normale, mais plutt si les coefficients de kurtosis et d'asymtrie des donnes sont les
mmes que ceux d'une loi normale, de mme esprance et variance. On a donc:
H0: S = 0 et K = 3
H1: S 0 et K 3
consquent, si les donnes suivent une loi normale, le test s'approche alors de 0 et on
accepteHo, au seuil . Le rsidu prdit, provient d'un modle estim par xtreg..., fe ou
xtreg..., re selon l'estimateur choisi. Choisissons le modle effets fixes tester : Aprs
avoir appliqu le modle effets fixes, puis on rcupre les valeurs prdites du rsidu :
4
Ce test peut aussi sappliquer si on ne dispose pas de donnes de panel.
36
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La probabilit du test est 0.80 > 0.05, on accepte l'hypothse nulle Ho de normalit des
rsidus.
H 0 : 2 0
H 0 : 2 0
37
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La statistique du test est base sur les rsidus estims par les MCO. Elle prend la forme
suivante :
2
N Ti 2
2
it
NT i 1 t 1
LM 1 2 (1)
2(T 1) N Ti
it2
i 1 t 1
La probabilit du test est 0.0707 > 5%, on accepte l'hypothse nulle. Le test rejette la
spcification dune structure erreurs composes. Ce test doit prcder celui de
Hausman, qui traite du problme de corrlation du terme alatoire et des variables
explicatives du modle.
38
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
O Zit dsigne la matrice des instruments. La statistique du test suit la loi de chi-deux
IP degrs de libert, avec I le nombre des instruments et P le nombre de paramtres
estimer.
Pour un niveau de significativit , le corps dhypothses tester est le suivant:
39
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
La probabilit du test est de 0.63 > 0.05. On ne peut donc pas rejeter l'hypothse nulle
Ho, de validit des instruments. Le test de chi-deux est de 1 degr de libert ( I=5, P=4),
dans le modle effets fixes, il ny a pas de terme constant.
40
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
instruments sont en niveau, et vice versa. Dans le modle estimer, l'utilisation des
variables retardes comme instruments diffre selon la nature des variables explicatives:
(a) Pour les variables exognes, leurs valeurs courantes sont utilises comme
instruments.
(b) Pour les variables prdtermines ou faiblement exognes (des variables qui
peuvent tre influences par les valeurs passes de la variable dpendante, mais
qui restent non corrles aux ralisations futures du terme d'erreur), leurs
valeurs retardes d'au moins une priode peuvent tre utilises comme
instruments.
(c) Pour les variables endognes, leurs valeurs retardes de deux priodes et plus
peuvent tre des instruments valides.
La validit des instruments retenus peut tre confirme ou infirme, partir des
tests de Hansen et de Sargan. Il existe deux variantes d'estimateur des GMM en panel
dynamique: L'estimateur GMM en diffrences premires et l'estimateur GMM en
systme.
Il sagit ensuite d instrumenter la variable endogne retarde par ses valeurs passs de
2 priodes et plus. Cependant, cette mthode ne permet pas didentifier leffet des
facteurs invariants dans le temps. De plus, Blundel et Bond (1998) ont montr l'aide
des simulations de Monte Carlo que l'estimateur GMM en systme est plus performant
que celui en diffrences premires, ce dernier donne des rsultats biaiss dans des
chantillons finis lorsque les instruments sont faibles.
41
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Les principaux tests en panels dynamiques, reposent sur les hypothses suivantes,
accepter.
- Test de Sargan : H 0 . Les instruments sont valides.
Cet exemple est la suite logique du modle de croissance conomique retenu dans
la premire partie. On introduit la variable endogne retarde dune priode dans les
variables explicatives notamment le PIB par tte t-1 , de manire tester leffet de
Comportements dynamiques. Dans cette application, on retient le revenu initial comme
proxy de la croissance du PIB par tte, dcal dune priode, pour tester leffet de
convergence. Le modle scrit :
( a 2 ) On ajoute linstruction collapse lorsque le nombre de retard est fix. Dans le cas contraire (lag(2 .), il ny
a pas lieu de la rajouter, puisquon ne spcifie pas la borne suprieure du retard des instruments qui commencent
partir du retard dordre 2. Pour iv(varinstrum), varinstrum, indique la liste des variables exognes du modle qui
sont utilises comme instruments. L'option small reporte les t de student la place des statistiques de la loi
normale centre rduite z. Loption two permet davoir un estimateur en 2 tapes, plus prcis que celui en une
tape (sans two), car lestimateur MM en deux tapes tient compte de la structure de la matrice des variances
covariances des erreurs.
42
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
On voit quon accepte la prsence dun effet AR(1) pour les rsidus et on accepte labsence
dun effet AR(2). Ceci est en conformit avec les hypothses formules. Par ailleurs, les tests
de Sargan ou de Hansen valident le choix des instruments. De plus les variables explicatives
sont statistiquement significatives, avec un effet ngatif de lindicateur du dveloppement
financier, de linflation et un effet positif de louverture commerciale. Si on se base sur la
littrature des modles de convergence, en matire de croissance, lhypothse de convergence,
suppose un effet ngatif du revenu initial. Pour la variable endogne revenu initial, on a
retenu de manire arbitraire les retards dordre 4 8 comme instruments, soit 5 instruments.
Pour lindicateur du dveloppement financier, on retient les retards dordre 4 9 comme
instruments, soit 6 instruments. En plus de ces instruments, les 3 variables exognes (ln_inf,
ln_gc, ln_to) sont utiliss comme instruments. Le nombre total des instruments est gal 14
Instruments, comme il est mentionn. Par ailleurs, le nombre de paramtres est gal P=5.
Par consquent les tests de Sargan et Hansen, suivent une chi-deux 14-5=9 degrs de
liberts.
43
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
De plus, les rsultats des paramtres estims sont meilleurs et conformes lintuition
conomique. Un effet positif et significatif de louverture commerciale sur la croissance
du PIB par tte, un effet ngatif et significatif de linflation, indiquant quune politique
montaire qui vise la maitrise de linflation permet daccroitre le PIB par tte. Le
comportement dynamique de la croissance capt par le revenu initial, prconise un effet
de convergence. Seule fausse note, leffet ngatif, toujours significatif de lindicateur de
dveloppement financier sur la croissance du PIB par tte et ce, malgr les diffrentes
procdures conomtriques retenues. La solution est plutt dordre conomique que
44
conomtrie des donnes de panel Mohamed GOAIED & Seifallah SASSI
Rfrences bibliographiques
Baltagi B.H.(2009). A companion to Econometric Analysis of Panel data. John Wiley and
Sons.
45