Beruflich Dokumente
Kultur Dokumente
1.
En guise dintroduction
a) Economie et conomtrie
Pour tudier un phnomne conomique, on essaie de reprsenter celui-ci par le comportement dune
variable. Cette variable conomique dpend elle-mme dautres variables que lon relie entre elles par une
relation mathmatique. Cette relation dfinit ce quon appelle un modle thorique. Par exemple, si on se
propose dtudier la consommation dun certain bien par les mnages, la thorique conomique postule que
C f (R) .
Toutefois, la thorie conomique se contente en gnral dindiquer les variables conomiques qui permettent
dexpliquer le phnomne et suggre le signe probable des drives partielles. Elle ne nous renseigne pas sur un
certain nombre de choses dont la forme exacte des fonctions (f) intervenant dans le modle (spcification du
modle), et la dfinition et la mesure des variables qui la composent.
Lobjet de lconomtrie est de tester la validit empirique des modles thoriques noncs. Pour cela elle doit
postuler dabord une forme pour les fonction intervenant dans le modle. Cette fonction mathmatique restant
bien entendu compatible avec les hypothses a priori du modle thorique. Ensuite, elle doit disposer dun
chantillon dunits sur lesquelles ont t observes les variables du modles. Enfin, elle a recours aux tests
statistiques afin de juger de la validit du modle qui a t spcifi. Ces tests portent entre autres sur la forme
fonctionnelle du modle, test sur les paramtres, test sur les hypothses thoriques etc.
b) Exemple de spcification et vocabulaires
La thorie conomique postule une relation linaire entre la consommation et le revenu. Cette relation
peut scrire C c o aR (fonction de consommation Keynsienne).
Dans cette relation, C (la consommation) est la variable explique. On dit aussi variable endogne.
R (le revenu) est la variable qui permet dexpliquer le niveau de la consommation. On dit que cest une variable
explicatives ou encore variable exogne.
Les paramtres c o et a sont des coefficients interprtables appels coefficients de rgression. c o et a
reprsentent respectivement la consommation incompressible et la propension marginale consommer.
Lobjectif du cours dconomtrie est de fournir des estimations de ces paramtres partir dun chantillon
dobservations.
Il existe en gnral deux types dchantillons en conomtrie
- Echantillon en donnes temporelles ou sries chronologiques : les variables reprsentent des phnomnes
observs intervalle rguliers
C t c o aRt t 1,...., T
- Echantillon en coupe instantane ou coupes transversales : les variables reprsentent des phnomnes
observs au mme instant sur plusieurs individus (au sens statistique)
C i co aRi i 1,...., N
c)
La relation prcdente suppose que le nuage des couples (C,R) saligne parfaitement sur une droite de pente a et
dordonne lorigine gale c o . Or en pratique, cette forme parfaitement linaire nest pas observe ; la
consommation scarte lgrement de la droite. Autrement dit il y a une diffrence entre les valeurs rellement
observes de la consommation et les valeurs qui auraient t rigoureusement observes si la relation linaire
avait t rigoureusement exacte. Cette diffrence peut provenir de trois sources : soit la relation qui lie C et R
nest pas linaire, on parle dans ce cas derreur de spcification , soit dune erreur de mesure sur les variables C
et R, soit enfin dune erreur dans la constitution mme de lchantillon, on parle alors derreur
dchantillonnage.
Ces diffrentes erreurs peuvent alors tre prises en compte travers une variable alatoire et le modle scrit
C i co aRi i i 1,.., N .
Consquence : la prsence dun terme alatoire implique que les estimations des paramtres c o et
aussi des variables alatoires.
a seront
2.
a) Motivation ?
Le modle prcdent est un modle de rgression simple parce quil permet dexpliquer les variations dune
variable (la consommation) en fonction des variations dune autre variable (le revenu). Or, il est rare, dans la
ralit conomique, que lon puisse expliquer correctement les fluctuations dune variable par celles dune seule
autre variable. En gnral, une ralit conomique met en jeu plusieurs variables explicatives dun phnomne
donn. Par exemple, si lon considre notre fonction de consommation ci-dessus, il semble naturelle de rajouter,
comme variable explicative de la consommation, le prix. En effet, si le revenu peut largement influencer le
niveau de la consommation dun individu ou dun mnage, celui-ci nen reste pas moins influenc par le niveau
du prix.
On peut mme penser que le nombre denfants influence considrablement le niveau de consommation des
mnages. Dans ces conditions, la relation devient C t c o aRt bPt cnenf t u t t 1,.., T .
Pourquoi u t au lieu de t ?
En effet, puisque la relation conomtrique change, alors lerreur que lon fait nest plus la mme que celle faite
dans la spcification prcdente. Cependant, elle nest pas forcement plus petite : elle est tout simplement
diffrente !
Cependant il nest pas possible de disposer de faon exhaustive de tous les facteurs dterminant la variable
endogne. Lessentiel en conomtrie est de construire partir des variables disponibles une approximation
acceptable de la ralit conomique tudie.
b) Le modle linaire multiple
Le modle linaire multiple gnralise le modle linaire simple en augmentant le nombre de variables
explicatives.
De faon gnrale, le modle linaire multiple scrit :
Yi a o a1 X 1i a 2 X 2i ... a K X Ki u i i 1;...; N (Eq3)
La variable endogne est matrialise ici par Y, et les variables explicatives, au nombre de K, sont
X 1 ; X 2 ;.....; X K .
On entend ici par modle linaire un modle dans lequel la variable endogne sexprime comme fonction
linaire des paramtres estimer.
On fait les hypothses suivantes :
Hypothses sur les variables :
(H0)
1. les toutes les variables X 1 ; X 2 ;.....; X K , Y, sont observes sans erreur. Les variables explicatives ne sont
pas alatoires (mais Y est alatoire travers le terme derreur).
2. lim X ' X / N Q matrice finie et non singulire.
3.
Rang (1; X 1 , X 2 ,..., X K ) K 1 N : il ny a pas de colinarit parfaite ou forte entre les variables
explicatives. En dautres termes, certaines variables explicatives ne sont pas redondantes. Cela permet en effet
dinverser facilement la matrice XX.
On peut en pratique contrler cette hypothse. En cas de colinarit entre un groupe de variables, on prend une
seule variable du groupe, celle-ci tant cens reprsente les autres. On peut utiliser cet effet efficacement
lACP.
Hypothse sur le terme derreur :
( H 1)
E ( u i ) 0i
Cela signifie que tous ce qui a t omis de lexplication de Y est desprance nulle. Donc, en moyenne, on ne se
trompe pas.
( H 2) E (u i . X ki ) 0i, k : les erreurs sont non corrles aux variables explicatives.
. ( H 4)
( H 6) u i (0, u2 )
3.
Estimer le modle (Eq3) cest donner une estimation des paramtres du modles i.e. a o ; a1 ;...; a K . (On
rappelle quun estimateur est une formule mathmatique qui permet de calculer une approximation (estimation)
dune grandeur partir des donnes observes).
La mthode destimation par les MCO cherche minimiser la moyenne des carrs des erreurs. Ceci revient donc
rsoudre le programme suivant :
Min
( ao , a1 ,..., a K )
a o a1 X 1i ... a K X Ki ( PMCO )
2
Il sagit dun programme doptimisation simple. La rsolution de ce programme donne des estimateurs des
o ; a1 ;...; a K . Ces estimateurs sont bien videmment
paramtres a o ; a1 ;...; a K , que nous notons a
fonction de Y et des X k ( k 1..K ) .
Lexpression analytique des estimateurs est cependant plus aise donner si lon prsente au pralable lquation
(Eq3) sous forme matricielle.
a) Ecrire matricielle du modle
Lquation (Eq3) peut scrire facilement sous forme matricielle en empilant les N observations de Y dans un
vecteur colonne.
Y1
.
Ainsi, en posant Y Yi
.
YN
1
1
X 11
X 12
X 21
X 22
.... X K 1
.... X K 2
.
X
X 1i
.
1 X 1N
.
X 2i
.
, vecteur (N,1) ;
ao
a1
.
a
, vecteur (K+1,1) ; et u
a
k
a
K
X 2N
X Ki
... .
.... X KN
u1
.
u i , vecteur (N,1)
.
u N
Y Xa u (Eq.3)
Les hypothses (H1), (H4) et (H5) se ramnent aux deux hypothses suivantes :
( H 1' )
E (u ) 0 ; ( H 4' )
rsiduelle)
f ( a )
0 , ce qui donne pour
a
mco .
solution a ( X ' X ) 1 ( X ' Y ) . Cette solution est lestimateur des MCO du vecteur a. On le notera a
A retenir
4.
La vraisemblance en conomtrie est dfinie comme la probabilit dobserver un chantillon, tant donn les
paramtres du processus ayant engendr les donnes. Si on observe un vecteur de variables alatoires
x ( x1, x 2,.., xk ) indpendantes et identiquement distribues suivant une loi
f ( x, ) , alors la
probabilit de lchantillon est le produit des probabilits associes chaque variable :
f ( x, ) .
L ( x, )
i 1.. N
Lestimation par la mthode du maximum de vraisemblance cherche trouver les valeurs du paramtre vectoriel
qui rendent lobservation de lchantillon le plus vraisemblable. Intituvement, puisque lon a effectivement
observ lchantillon, cest que sa probabilit dapparition tait forte. Son on maximise la vraisemblance
associe lchantillon, on peut remonter au processus gnrateur des donnes.
Toutefois, deux conditions limitent le sens pratique de cette mthode. En effet le principe du maximum de
vraisemblance suppose dabord de bien spcifier la forme fonctionnelle de la distribution f des observations. Si
la loi des variables est mal choisie, alors le processus gnrateur des donnes ne correspondra pas celui choisi
par lconomtre. on parle de biais de spcification et des choix alternatifs devront tre recherchs (mthodes des
moments par exemple).Ensuite, il, faut quun seul paramtre 0 maximise la vraisemblance.
2
Si on suppose donc que les termes derreurs suivent une loi normale Yi N ( X i a, u ) et la vraisemblance de
lchantillon scrit f (Y , a )
On
f (Y , a )
(Y X a) u
2
f (Y ,
i
1
(
2 )
2
u
) avec f (Y , 2 )
i
u
1
exp
2 2
(Y
1
exp
(Yi X i a) 2 .
2
2
2 u
X i a) 2 .
En
remarquant
que
Une fois estims les paramtres du modle, lon doit se poser la question de savoir si notre regression est assez
bonne ou non. Il existe une faon simple de repondre cette proccupation: cest de comparer les Yi leurs
valeurs estimes Yi ( Xa mco ) i . En pratque on compare plutot la variance des Yi ( Xa mco ) i celle des
Yi 2 u i2 .
i
u
1
Y
2
i
ou encore coefficienr de correlation multiple. Il determine la part de la variance des Yi explique par les Yi .
(Ecrire le r2 sans les sigma, c--d avec les matrices, faire ressorte SCR et SCE)
Un mauvais R2 peut venir de loublie de variables explicatives, mauvaise spcification du modle (Box-Cox),
ces m^mes causes peuvent etre lorigine de lautocorrelation de sresidus.
Interprtation gomtrique de R2
Remarque:
le R2 na pas une bonne interprtation si le modle ne comporte pas de terme constant. Le R2 nest pas
vraiement un critre suffisant pour juger de la qualit dune rgression. En effet il est aisment manipulable et
augmente artificiellement avec K et avec la forme sous laquelle les variables sont introduites dans le modle.
Donc R2 ne permet pas de comparer des modles avec un nombre diffrents dexplicatives ou spcifies
diffrement.
2
Solution : on corrige le R2 des degrs de liberts. On obtient un R2 ajust tel que (1 R )
N 1
(1 R 2 )
N K
Comme les estimateurs des paramtres du modle sont des variables alatoires, il peut alors tre intressant
dtudier certaines de leurs proprits distance finie et distance infinie.
6.1 Proprits distance finie
a) Estimateur sans biais de a.
mco est un estimateur sans biais de
On vrifie facilement que a
: E (a mco ) a
avec
do
V (a mco ) 2 u ( X ' X ) 1
Si
2u
u' u
SCR
2u
2
Si on fait MCO alors on a mco
dmontrer)
2
Si on fait MV, alors on obtient directement un estimateur de 2 : MV SCR / N . Mais on voit que cet
2
estimateur est biais, car E ( uMV )
(a
N K
E ( MV ) (1 K / N ) u2 u2 . La mthode du MV sousN
2
2
estime la variance u Cependant, asymptotiquement, MV SCR / N est un estimateur sans biais de
u2 ( X ' X ) 1 est la matrice de variance covariance estime de a mco , et les termes diagonaux de cette
2
2
1
matrices sont les variances estimes des paramtres ; soit ak ( u ( X ' X ) ) kk
c)
Thorme de Gauss-Markov
a mco est le meilleur (de variance minimale )estimateurs linaire sans biais de a. on dit que a mco est BLUE
(Best Linear Unbiased Estimator)
c.2 Proprits distance infinie
a). Etude de la convergence des estimateurs des MCO
1
1
X ' X ) 1 ( X ' u )
n
n
si lim( X ' X ) / n V X matrice finie et dfinie positive ou lim( X ' X ) 1 0 (cette hypothse est moins
forte que la premire puisque la premire exclut que une Variable gale au temps figure dans les explicatives), ,
mco tend en probabilit vers a. plim( a mco )=a.
alors a
Mots cls: test unilateral, test bilateral, region de confiance, estimation par maximum de vrais, notion de
covariance, coeff de corelation, independance entre variable, existence de la racine carr dune matrice
definie positive, drive de fonction crite sous forme matricielle. estimateur sans biais, estimateur
convergent, efficace. Matrice de variance covariance dun vecteur alatoire. Loi normale, loi de Student, loi
de Fisher.
d) Test sur les paramtres
Rappel sur les tests paramtriques dhypothses: procdure et remarques
Un test statistique est une procdure de dcision sur une hypothse contre une autre (son alternative) partir
dun chantillon exprimental de taille connu. Cest nest pas une dmonstration proprement dit. Un test
statistique est, par nature, ngatif. Accepter lhypothse nulle (H0) ne signifie pas quelle est vraie, mais
seulement que les observations disponibles ne sont pas compatibles avec cette hypothse et que lon na pas de
raison suffisante de lui prfrer lhypothse lalternative compte tenu des rsultats exprimentaux obtenus sur
lchantillon
Lhypothse de normalt des residus permet deffectuer un certain nombre de tests statistiques sur les paramtres
2
2
1
du modles. En effet, si u (0, u I N ) alors a mco (a, u ( X ' X ) ) . Mme si cette hypothse de
normalit savrait viole en pratique, les tests restent valables asymptotiquement grce au thorme central
limite!
On a
a k (a k , a2k ) donc
a k a k
(0,1) avec a2 ( u2 ( X ' X ) 1 ) kk inconnue
k
a k
( N K ) u2
2 ( N K ) , a mco et 2 u sont des variables indpendantes. Pour le montrer, il suffit de
2
u
mco et u sont non corrles (i.e. Cov( a mco , u ) 0) (deux variables
montrer que les variables gaussiennes a
gaussiennes indpendantes sont non corrles). Et de remarquer que les deux statistiques sont fonction de ces
variables
indpendantes.
On
a
donc
(a k a k )
u (( X ' X )) 1 kk )1 / 2
( N K ) u2 / u2
N K
a k a k
u (( X ' X ) 1 ) kk
a k a k
St ( N K 1)
a k
a) Test de significativit (significativit golbale du modle (test de Fisher: crire Le F de Fisher avec les
R2, , et signficativi des coeffocient)
i)
a k 0 contre
ak 0 .
H1
a k
St ( N K 1) . t k est couramment appl t de Student.
k
On choisit un niveau de risque de prmire espce (cest la proba de rejeter Ho alors quelle est vrai). est
encore appl seuil de significativit dans le cas des test de significativit. On peut donc construire un intervalle
a k
de confiance pour a k : Pr ob
Aprs avoir estimer les paramtres du modle on peut se demander si tous les coefficient sauf la constante
peuvent tre considrs comme nuls. Cela reveint se demander si aucuen des variables explicatives du modle
nexplique Y. On dira que le modle est globalement significatif sil existe au moins une variable qui soit
significative. Pour tester cela, on test H 0 a1 a 2 ... a K 0
contre H 1 i / ai 0
- Test de fisher
R2
N K 1
F ( K , N K 1)
2
K
(1 R )
on compare ce F au F tabul.
-
Ce test compare au fait le modle estim avec lensemble des K variables explicatives au modle estim avec la
constante seule. Cela permet de voir si les explicatives apportent quelque chose de significatif lexplication de
Y.
2
La statistqiue de est est donne par LR 2(l 0 l1 ) ( K ) l 0 est la log-vraisemblance du modle sous
H0.
H0
c)
a k contre H 1
a k
St ( N K 1)
a k
Test de r contraines
Lhypthse de nulit de lensemble des coefficients nest pas toujours la plus intrssante. On peut en effet tre
amner tester, par exemple, dans une fonction de production si les rendement dchelle sont constants. Cela
revient effectuer un test de contrainte linaire sur les paramtres.
De faon gnrale, on peut tester lexistence de r contraintes linaires indpendantes sur les K paramtres du
modle en posant
( r , K 1) ( K 1,1)
indpendantes: il faut liminer toutes les quations redondantes) et r K 1 (si r=K+1alors lestimation na
plus son sens puisque les contraintes permetternt dobtenir les paramtres: a C 1c )
Exemple : on se demande si
a1 a 2 et
a3 a 4 1 on a
a0
a1
0 1 1 0. . . .0 a2 0
0 0 1 1. . . . 0 . 0
.
a
K
( R12 R02 ) T k 1
F (r , T K 1)
On afit un test de Wald W
r
(1 R12 )
R02 et R12 dsigne respectivement le coefficient de determination des estimations sous H 0 et H 1 .
Rq: le test de Fisher est un cas particulier du test de Wald. Donner lexpression de C et c et retrouver la
statistique de Fisher.
e)
N k
6
1
2
2
2
S 4 K 3 ( 2) 5.99
5%.
o S est le coefficient de skewness, K le kurtosis, and k represente le nombre de coefficients.
cest pas trop grave sielle nest vrifie, on fait des tests asymptotqes de Wald si N est grand. Dans ce cas, le t
de student suit asymptotiquement une loi centre-rduite!
c)
H 0 Var (u i ) i2 u2 i
Test de White (1980)
On estime le modle (*)
R 2 / 2K
F ( 2 K , N 2 K 1) .
(1 R 2 ) /( N 2 K 1)
i2 2 f ( X ji )
o X j est la variable qui introduit lhtroscdacticit. pour dectecter cette variable on regresse le rsidu sur
chaque variable explicative.
Une fois la varaible responsable trouve on effectue les tapes suivantes:
- on classe les observations par ordre croissant des X j ;
- on divise lchantillon en 3 sous chantillons
- on effectue la regression sur les 2 sous chantillon extrmes
-
on forme F
SCR 2 /( N 2 K )
F ( N 2 K , N 1 K ) SCR2 est la somme des carres des rsidus sur
SCR1 /( N 1 K )
u 2 i sur les
Zj.
appele
coefficient
cov(u t , u t p )
var(u t ) var(u t p )
dautocorrlation
cov(u t , u t p )
var(u t )
dordre
p,
le
coefficient
p dfinit
par
(fonction dautocovariance), m tant la moyenne de u t . On a suppos ici que le procesus u est stationnaire ( la
moyenne et la variance de u t existent et sont constantes, (independante de t), et les autocovarinces ne dependent
pas du du nombre dedecalage, i.e. cov(u t , u t p ) cov(u t l , u t l p ) p ). On montre que lorsque le
procesus est stationaire, les coefficients dautocorrlation diminue assez rapidement et tendent vers 0 et
10
Lensemble 1 , 2 ,..., p ..
sexprime en fonction de p.
Un estimateur de p est p
(u
t p 1
(u
t 1
u )(u t p u )
t
u )2
1
(u t u )(u t p u )
T 1 t p 1
et
un
1
(u t u ) 2 )
T 1 t 1
Bartlett a cherch tester si les coefficients dautocorrlation successifs sont significativement diffrent de 0.
H0
p 0p
Si le processus est stationnaire et de moyenne nulle (ce qui une hypothse faite sur les rsidus) alors sous H 0 ,
Bartlett montre que p N (0,1 / T ) quand T devient grand.
Ainsi on rejette lhypothse de non autocorrlation des erreurs au seuil de 5 % ds que p 2 / T . Si on
trace le corrlagramme (cest--dire les k pou k=1.p) on doit observer que les k ne sortent pas de la bande
Horizontale de largeur 2 / T autour de 0.
Test de Box-Pierce
Box et pierce testent la significativit des p premiers coefficients dautocorrlation. Le test est le suivant
H 0 1 2 .... p 0 .
La statistique de test tablit partir de la statistique de Quenouille Q BP ( p ) T
k 1. p
2
k
. Sous H0,
11
2
k
Q JB ( p) T (T 2)
1 k p T k
2
sous H0: non autocorrlation des erreurs, Q JB ( p ) ( p*) quand
T .
Sil ny a aucune autoccorlation des erreurs lordre p, les k sont proches de 0 et les Q-stat de Ljung-Box
sont non significatifs avec des probabilits lves ( suprieures 0.05).
Ce test sert tester si un processus est un bruit blanc (i.e. un processus stationnaire de moyenne nulle et dont les
autocovariances sont nulles (sauf la variance)).
En pratique, on prend p Min T / 2;
3 T .
Remarque : L examen des PAC permet de detecter si la serie est autocorrle et lordre de cette autocorrelation.
En effet les PAC sont les coefficients de la relation u t a 0 a1u t 1 .. a p u t p t . Cest lcriture
formelle dun AR(p). Donc PAC (k ) significativement non nul signifie quil y a autocorrlation lodre k. Un
PAC nulle indique quil ny a pas dautocorrlation. Tester la nullit des PAC sest aussi tester la nullit des .
Pour un AR(p), les PAC (k) sont significativment nuls pour k p . Les k sont gometriquement decroisants
au dl de k p , (on a une exponentielle et/ou une sinusoidale amortie); mais les k restent differents de 0
k sont
u u
t p 1..T
t p
t 1..T
/(T p )
2
t
/T
u u
on estime par MCO le modle (**), on obtient
u
t 2
t 2
t 1
2
t 1
(u u
, on a DW
u
t 2
t 1
)2
2(1 )
t 1
12
Si
la
variable
y t 1 figure
dans
les
explicatives,
on
utilise
le
de
Durbin
definit
par:
DW
T
)
o b est le coefficient de y t 1 dans le modle initial. Sous H0, h suit
2
1 T var .est (b)
une loi normale centre reduite.
h (1
IN
En effet: si u t AR (1) ( u t u t 1 t ) et les u t sont stationnaires (i.e. E (u t ) et var(u t ) existent et
sont indpendantes de t)
2
2
Alors on monte que E (u t ) u
)
Dans ce cas, on a
2
p 2
et cov(u t , u t p ) E (u t .u t p )
. (Ecrire la forme de
1
1
2
V (a mco ) u ( X ' X ) 1 X ' X ( X ' X ) 1 ,
V (a mco ) 2 u ( X ' X ) 1 .
Donc en prsence dheteroscdasticit ou dautocorrlation residuelle, les MCO donnent des estimateurs non
efficaces, mais toujours sans biais. Les tests dhypothse, les intervalles de confiances utilisant les erreurs sont
alors biaiss (on surestime le test de student c--d on accepte des coefficient qui ne sont pas significatifs).
Solution ?
y* X * a u *
avec
X * 1 / 2 X et
y* 1 / 2 y .
1
1
1
Ainsi a mcg va minimser f ( a ) u ' 1u . On a amcg ( X ' X ) X ' y
V ( a mcg ) u2 ( X ' 1 X ) 1
u * ' u *
est un estimateur sans biais de
N K 1
2
1
1
est V ( a mcg ) mcg ( X ' X ) .
2
Comme dans le modle transform, V (u*) u I alors 2 mcg
Remarque: Les MCG en prsence dhtroscedasticit sont les Moindres Carrs Pondrs (MCP).
En effet en prsence dhtroscdasticit, le modle transform
observations
par
zi * zi / i
de
sorte
y* X * a u *
que
le
modle
en
instantane
y i / i a0 / i a1 ( X 1i / i ) ... a k ( X ki / i ) ... u i / i
Cas particuliers:
1) Htroscedasticit du type
peut detecter cette forme par une simple regression des carrs des residus sur les carrs des explicatives)
-
2) Autocorrlation dordre 1
on
cherche
liminer
le
terme
Yt Yt 1 a ( X t X t 1 ) b(1 ) t (3)
derreur
du
modle(1)
on
obtient
on estime par MCO le model initial (1) sans tenir compte de lautocorrelation des erreurs u mco
dans
- on
remplace
par
(3)
et
on
estime
par
MCO
le
modle
Yt Yt 1 a ( X t X t 1 ) b(1 ) t
Notes finales
1) La prise en compte de phonmne non linaires par le modle linaire
Le modle linaire permet de traiter une diversit de situations de non linarit. Il suffit dans certains cas
dintroduire une variable supplmantaire.
Exemple 1: Estimation dune fonction de Cout moyen
On veut estimer le cout moyen (C.M) de la production (Q). On sait daprs la thorie conomique que cette
relation nest pas linaire en Q, la courbe a une forme en U.
Pour prendre en compte ce caractre non linaire de la rlation on pose que CM a bQ cQ 2 .
14
Ainsi la rlation raliste entre le salaire et lexprience est loin dtre linaire. Pour tenir compte de cette non
2
linarit on peut crire le modle sous la forme S i a 0 a1 Ai a 2 Ep i a3 Ep i u i . On sattend ce que le
paramtre a 3 soit significatif et ngatif.
2) les variables indicatrices
Les variables indicatrices jouent un grand rle dans les modlisations conmtriques. En particuleir, elles
permettent de prendre en compte dans les changements de comportements ou les changements structurels dans
lvolution dun phnomne.
Exemple 1: Estimation dune fonction de consommation en donnes temporelles
On dispose de la consommation des mnages de la CI sur la priode 1975-2000.
Un modle simple de consommation serait C t a 0 a1 Rt u t .
On peut se demander si la devaluation a eu un effet sur la consommation. Autrement est-ce quil ya eu
changement de la consommation des mnages depuis la dvaluation.
Le modle tel quil est spcifi ne nous permet pas de donner une rponse cette question.
On va donc introduire une variable qui capte le changement conjoncturel.
0 si t 1994
1 sin on
Dt
On se demande si le fait dtre homme ou femme a un effet sur le salaire. Pour cela on va introduire dans le
modle la variable sexe valant 1 pour un sexe et 0 pour lautre. On sattend ce que le coefficient de cette
variable soit significatif.
On peut aller plus loin et se demander, si exprience professionnelles gales, les femmes ont les mmes salaires
que les hommes. On ajoutes aux variables explicatives, la variable Sexe * Ep .
On peut aussi faire un test de CHOW.
Le problme de la multicolinarit
Pour detecter la multocolinarit entre les explicatives on peut rgresser chaque explicative sur les autres. Si le
R2 est bon alors il ya multicolinarit. La matrice de coorlation ne permet devoir que les corrlation entre les
Variable deux deux, la colinarit nest pas transitive.
Sil ya colinarit entre X1 et X2,on choisit le bon des deux. Pour cela on regresse le modle sans X1, puis sans
X2, et on retient le modle qui a le plus ptit AIC.
Pour detecter la multicolinarit, on peut penser une ACP.
Choix du nombre dexplicatives: la mthode de rgression pas pas (mthode descendante/ mthode
ascendante)
Test de SHOW
Le test de Show permet dexaminer si les coefficients dune rgression sont stables par rapport aux observations
utilises. Il compare donc les estimations deux sous-chantillons dobservation afin dexaminer si les coefficients
sont significativement diffrents.
Sur des donnes temporelles, ce test est appel test de stabilit temporelle. Sur des donnes en coupe le test de
show est qualifi de test dhomognit des comportements.
Le test de Show permet donc de rpondre des question du genre : la productivit du capital sest-elle amliore
dans la priode rcente ? Est-elle la mme en Cte dIvoire quau Gabon ? A qualification gale, les femmes ontelles des salaires infrieurs aux hommes ? etc.
CE TEST UTILISE EN FAIT LES DUMMY VARIABLES.
16