Beruflich Dokumente
Kultur Dokumente
MOSEF
Partie 2
y i = y i + u i
y i = 0 + 1 x i
Quelques dfinitions :
2
(
)
y
y
la somme des carrs totale (SCT)
i
2
(
)
y
y
la somme des carrs explique (SCE)
i
2
u
i
SCT = ( yi y ) = [( yi y i ) + ( y i y )]
2
= [ui + ( y i y )]
= ui2 + 2 ui ( y i y ) + ( y i y )
= SCR + 2 ui ( y i y ) + SCE
sachant que ui ( y i y ) = 0
on obtient : SCT = SCR + SCE
.
R2 = SCE/SCT = 1 SCR/SCT
0 < R2 < 1 , Plus proche de 1 est R2 mieux cest
. reg
wage
Source
educ
SS
df
MS
Model
Residual
1 17 9 .7 3 20 4
5 98 0 .6 8 22 5
1
52 4
1 17 9 .7 3 2 04
1 1. 4 13 5 1 58
Total
7 16 0 .4 1 42 9
52 5
1 3. 6 38 8 8 44
wage
Coef.
educ
_cons
.5 4 13 5 93
- .9 0 48 5 16
Std. Err.
.0 5 32 4 8
. 68 4 96 7 8
t
1 0 .1 7
- 1 .3 2
Number of obs
F( 1,
524)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0. 0 00
0. 1 87
=
=
=
=
=
=
5 26
1 03 . 36
0 .0 0 00
0 .1 6 48
0 .1 6 32
3 .3 7 84
.6 4 59 6 51
.4 4 07 6 87
Source
SS
df
MS
Model
Residual
2.0732e+10
2.2093e+10
1 2.0732e+10
504 43835857.8
Total
4.2826e+10
505
price
Coef.
rooms
_cons
9119.548
-34796.2
Number of obs
F( 1,
504)
Prob > F
R-squared
Adj R-squared
Root MSE
84803032
Std. Err.
419.3385
2651.532
t
21.75
-13.12
P>|t|
0.000
0.000
=
=
=
=
=
=
506
472.95
0.0000
0.4841
0.4831
6620.9
9943.415
-29586.78
. reg
wage
Source
tenure
SS
df
MS
Model
Residual
861.62965
6298.78464
1
524
861.62965
12.0205814
Total
7160.41429
525
13.6388844
wage
Coef.
tenure
_cons
.1773271
4.990925
Std. Err.
.0209449
.185158
t
8.47
26.95
Number of obs
F( 1,
524)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
526
71.68
0.0000
0.1203
0.1187
3.4671
P>|t|
0.000
0.000
.1361809
4.627182
.2184733
5.354669
Dans ce cadre:
Nous allons dmontrer que les estimateurs des paramtres ne sont pas biaiss.
Calculer leur variances.
Calculer la variance de terme derreur (biaise et non biaise) ncessaire pour obtenir
les carts types (erreurs) des paramtres estims.
Nous allons aborder la question de homoscdasticit Var(u|x) = 2 (constante)
(et htroscdasticit), Var(u|x) 2 (variable)
:
E 1 = E
(x x )2
(x x )2
i
i
(xi x )E ( yi )
=
2
(xi x )
( )
(x x )( + x )
(x x )
( x x ) + (x x )x
=
(x x )
=
1 i
avec (xi x ) = 0
=
on obtient :
0 + 1 (xi x )xi
(x x )
et avec (x x ) = (x x )x
2
on obtient :
=
1 (xi x )xi
(x x )x
i
( )
ainsi
E 1 = 1
= 1
=
=
( x x )2
( x x )2 ( x x )2
i
i
i
(x x )( y
i
y ) = (xi yi x yi yxi + yx )
= yi ( xi x ) + y (xi x )
= yi ( xi x ) + ny (xi x )
= yi ( xi x )
parce que (x i x) = 0
et de la mme faon :
(x x )( y
i
y ) = (xi yi x yi yxi + yx )
= xi ( yi y ) + x ( yi y )
= xi ( yi y ) + nx ( yi y )
= xi ( yi y )
parce que (y i y ) = 0
( ) (
E 0 = E y 1 x
= E ( y ) x E ( 1 )
= E (y ) x (1)
1
sachant que :
yi E ( yi )
=
E ( y ) = E
n
n
( 0 + 1 xi )
=
n
n 0 + 1 xi
=
n
= 0 + 1 xi
en remettant ceci dans (1) on obtient
E ( 0 ) = 0 + 1 xi x 1 = 0
(xi x )( yi y )
( x x ) yi
= var i
var 1 = var
( x x )2
(x x )2
i
i
( )
(x x ) var( y )
=
( (x x ) )
(x x )
=
( (x x ) )
2
2 2
2 2
(x x )
( )
var 0 = var( y 1 x )
( )
yi ( xi x ) y j
Cov( y , 1 ) = Cov i , j
2
n ( xi x )
(x j x )Cov( yi , y j )
=
2
n ( xi x )
=
=
( xi x ) var( yi ) + (x j x )Cov( yi , y j )
n ( xi x )
2 ( xi x ) + 0
=0
j i i
n ( xi x )
et sachant que
yi
i
var( yi ) n 2 2
var(y) = var
= 2 =
=
2
n
n
n
n
on obtient :
var( ) = var( y ) + x 2 var( )
0
=
=
x
2
(xi x )
2
2 ( (xi x )2 + nx 2
n ( xi x )
(x x ) = x
2
nx 2
on obtient :
2 xi
var( 0 ) =
2
n ( xi x )
2
) (
2
2
u i = ( u i - u ) 2 + 1 1 ( x i x ) 2 2 ( u i - u ) 1 1 ( x i x )
(u i - u ) 2 + 1 1
) (x
2
x ) 2 2 1 1
) u ( x
i
x)
2
2
ui = (ui - u) 2 + 1 1 ( xi x ) 2 2(ui - u) 1 1 ( xi x )
2
2
2
2
ui = (ui - u) + 1 1 ( xi x ) 2 1 1 ui ( xi x )
calcul de l' sprance..., aprs transformations ;
E ( ui ) = (n 1) 2 + 2 2
2
= (n 2) 2
estimateur non bias 2 dgrs de libert prs
ui = 0
xi ui = 0
2
ui
=
n2
= SCR /(n 2)
2
(n 2)
o SCR somme des carrs des rsidus
rappel :
le vrai (mais biais) estimateur de 2 est SCR / n
1
2 = ui2 = SCR / n
n
la diffrence c' est le nombre de dgrs de liberts n 2 pour le premier
et n pour le second . En connaissant n - 2 rsisus nous pouvons calculer les 2 restants
partir des contraintes :
= 0 et x i u i = 0
Ainsi on obtient l' estimateur non bias par l' ajustement des dgrs de liberts
( )
var 1 =
var(0 ) =
2
(
)
x
x
i
2 xi 2
n ( xi x )
( )
var 0 =
xi
n ( xi x )
( )
var 1 =
(x x )
x
var( ) =
n (x x )
2
Jusqu prsent, nous tions dans le cadre de 5 hypothses GaussMarkov qui nous garantissaient que les estimateurs MCO taient BLUE
.
( )]
1 ~ N 1 , Var 1
( )
Var 1 =
(x x )
( )
sd ( ) = f ( )
1
( )
se
~ t n2
( )
sd 1
=
=
( x x )2
( x x )2 ( x x )2
i
i
i
(x x )( y
i
y ) = (xi yi x yi yxi + yx )
= yi ( xi x ) + y (xi x )
= yi ( xi x ) + ny (xi x )
= yi ( xi x )
parce que (x i x) = 0
et de la mme faon :
(x x )( y
i
y ) = (xi yi x yi yxi + yx )
= xi ( yi y ) + x ( yi y )
= xi ( yi y ) + nx ( yi y )
= xi ( yi y )
parce que (y i y ) = 0
( )
1
yi = 0 + 1xi1 + ui
H0: 1 = 0
H1: 1> 0
yi = 0 + 1Xi1 + ui
H0: 1 = 0
H1 : 1 0
1 = 0
H0: 1 = 0
Par default lhypothse alternative est considere comme
bilatrale.
Quand on rejette H0 on dit que xj est statistiquement
significatif au seuil %. ( on choisit 95% le plus souvent)
Quand on ne peut rejetter H0 , on dit que xj nest pas
statistiquement significatif au seuil %.
( )
1 c 1 ,
avec c, 1 - %
2
de la distribution t n 2
(Il y a (1 - ) % de chance que se trouve lintrieur de lintervalle)
1 c (1 ),
avec c, 1 - %
2
de la distribution tn 2
Salaire=exp(0+ 1* (education))
. reg
wage
Source
educ
SS
df
MS
Model
Residual
1 17 9 .7 3 20 4
5 98 0 .6 8 22 5
1
52 4
1 17 9 .7 3 2 04
1 1. 4 13 5 1 58
Total
7 16 0 .4 1 42 9
52 5
1 3. 6 38 8 8 44
wage
Coef.
educ
_cons
.5 4 13 5 93
- .9 0 48 5 16
Std. Err.
.0 5 32 4 8
. 68 4 96 7 8
t
1 0 .1 7
- 1 .3 2
Number of obs
F( 1,
524)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0. 0 00
0. 1 87
=
=
=
=
=
=
5 26
1 03 . 36
0 .0 0 00
0 .1 6 48
0 .1 6 32
3 .3 7 84
.6 4 59 6 51
.4 4 07 6 87
Modle
Var.Dp.
(y)
Var.Indp
(x)
Intpretation de 1
Niveau-niveau
y= 1 x
Niveau-log
log(x)
y= (1 /100)%x
Log -niveau
log(y)
%y= (1001 )x
Log - log
log(y)
log(x)
%y= 1 %x
(lasticit)
(modle multiple)
y = 0 + 1x1 + u
(modle simple)
(modle multiple)
y = 0 + 1x1 + u
(modle simple)
+ 1(educ)+ 2(exper)+u
Ce qui nous intresse cest toujours la relation entre le salaire et lducation (ceteris paribus).
Nous suspectons que lexprience professionelle joue un rle important aussi. Ainsi nous
voudrions contrler son influence en la mettant explicitement dans lquation, sinon elle serait
reste intgre dans u parmi dautres inobservables avec hypothse (difficile dfendre) de
lindpendance de lexprience de lducation (E(u|educ)=0). Sil faut rejeter cette hypothse
les estimateurs OLS du modle simple seront biaiss.
(modle multiple)
(modle simple)
(salaire)
= 1 + 2 2 (education)
(education )
au lieu de
(salaire)
= 1
(education )
dans le modle simple
k = 2:
y = 0 + 1 x1 + 2 x2 , on peut dmontrer que :
(
ri1 yi )
1 =
2
r
i1
o ri1 sont des rsidus de la regression estime :
x1 = 0 + 2 x2
.
x2
x1
y
y
Stratgie de slection des
variables x:
Moins corrls entre elles
quavec y
y
x1
.
x2
x2
x1
1 1
et multiple y = 0 + 1 x1 + 2 x2
~
En gnral 1 1
Sauf si
1. 2 = 0 (il n' ya pas d' effet de x2 )
2. x1 et x2 ne sont pas corrls
.
(
)
u
i
Ainsi :
SCT = SCE + SCR
.
(
( y y )(y y ))
=
( ( y y ) )( (y y ) )
2
1 1
On a alors :
~
1
.
(x
=
(x
i1
x1 ) yi
i1 x1 )
(x x )(
(x x )
i1
0
2
i1
+ 1 xi1 + 2 xi 2 + ui ) =
+ 2 ( xi1 x1 )xi 2 + ( xi1 x1 )ui
= 1 + 2
(x x )x + (x
((x x ) ) ((x
i1
i1
i2
2
i1
i1
x1 )ui
x1 )
( )
~
E 1 = 1 + 2
.
(x x )x
((x x ) )
i1
i1
i2
2
1 1
on obtient alors 1
(x x )x
=
((x x ) )
i1
i1
i2
2
( )
~
E 1 = 1 + 2
(x x )x
((x x ) )
i1
i1
on a :
~
~
E 1 = 1 + 21
( )
i2
2
Biais positif
Biais Negatif
2 < 0
Biais Negatif
Biais positif
x2
x1
y
Stratgie de slection des
variables x:
Moins corrls entre elles
quavec y
y
x1
x2
x2
x1
de n
H3.
Les valeurs de x varient dans lchantillon (et donc aussi dans la population
gnrale): aucune nest constante et il n ya pas de relation linaire exacte entre elles
(aucune nest une combinaison linaire de lautre)
H4. Le terme derreur a une esprance zro pour nimporte quelle valeur des variables
indpendantes x: E(u|x1 x2 xk)=0
H5. Le terme derreur u a la mme variance pour toutes les valeurs des x:
Var(u| x1 x2 xk) = 2 (homoscdasticit)
Lestimateur qui satisfait ces
5 hypothses est