Slides 5 - Econo

Econométrie
Cours 5
• Matière du cours :
— Prévision
— Le coefficient de détermination : R2
— Unités de mesure
— Forme fonctionnelle
1. Prévision
• On distingue 2 types de prévision :
— une prévision de l’espérance de y sachant x0 : E(y0) = β 1 + β 2x0
— une prévision de la valeur de y sachant x0 : y0 = β 1 + β 2x0 + e0
1.1. Prévision de l’espérance de y sachant x0

• Un estimateur / prédicteur naturel de E(y0) = β 1 + β 2x0 = X0β est donné par :
ŷ0 = β̂ 1 + β̂ 2x0 = X0β̂ , où X0 = 1 x0
• Lespropriétés de cet estimateur / prédicteur sont déterminées par la distribution

d’échantillonnage de l’erreur de prévision p̂0 = ŷ0 − E(y0)
• Sous les hypothèses A1 à A5, on a :
E(p̂0) = 0, → ŷ0 est un estimateur / prédicteur non biaisé de E(y0)
V ar(p̂0) = X0V (β̂)X0′ , → dépend de x0 et V (β̂)
3
• Sous l’hypothèse A6 de normalité, on a encore :
ŷ0 − E(y0)
p̂0 ∼ N(0, V ar(p̂0)) ⇔ ẑp0 = ∼ N(0, 1)
s.e.(p̂0)
où s.e.(p̂0) = V ar(p̂0) = X0V (β̂)X0′ = σ 2X0(X ′X)−1X0′
• Le remplacement de σ 2 par ŝ2 fait passer d’une loi normale à une loi de Student :
ŷ0 − E(y0) ŷ0 − E(y0)
ẑp0 = ∼ N(0, 1) → t̂p0 = ∼ t(n − 2)
s.e.(p̂0) s.ê.(p̂0)
où s.ê.(p̂0) = V âr(p̂0) = X0V̂ (β̂)X0′ = ŝ2X0(X ′X)−1X0′
• Pour α fixé, on a ainsi :

ŷ0 − E(y0)
IP −tn−2;1− α2 ≤ ≤ tn−2;1− α2 =1−α
s.ê.(p̂0)
→ un intervalle un intervalle de prévision à (1 − α) × 100% pour E(y0) :
ŷ0 − tn−2;1− α2 s.ê.(p̂0) ; ŷ0 + tn−2;1− α2 s.ê.(p̂0)
1.2. Prévision de la valeur de y sachant x0

• Un prédicteur de y0 = β 1 + β 2x0 + e0 = X0β + e0 est encore donné par :
ŷ0 = β̂ 1 + β̂ 2x0 = X0β̂ , où X0 = 1 x0
• Les propriétés de ce prédicteur sont déterminées par la distribution d’échantillonnage

de l’erreur de prévision fˆ0 = ŷ0 − y0
• Sous les hypothèses A1 à A5, on a :

E(fˆ0) = 0, → ŷ0 est un prédicteur non biaisé de y0
V ar(fˆ0) = σ 2 + X0V (β̂)X0′ , → dépend de σ 2, x0 et V (β̂)
• Sous l’hypothèse A6 de normalité, on a encore :

ŷ0 − y0
fˆ0 ∼ N(0, V ar(fˆ0)) ⇔ ẑf0 = ∼ N(0, 1)
s.e.(fˆ0)
où s.e.(fˆ0) = V ar(fˆ0) = σ 2 + X0V (β̂)X0′ = σ 2(1 + X0(X ′X)−1X0′ )

5
2 2
• Le remplacement de σ par ŝ fait passer d’une loi normale à une loi de Student :
ŷ0 − y0 ŷ0 − y0
ẑf0 = ∼ N(0, 1) → t̂f0 = ∼ t(n − 2)
s.e.(fˆ0) s.ê.(fˆ0)
où s.ê.(fˆ0) = V âr(fˆ0) = ŝ2 + X0V̂ (β̂)X0′ = ŝ2(1 + X0(X ′X)−1X0′ )
• Pour α fixé, on a ainsi :

ŷ0 − y0
IP −tn−2;1− α2 ≤ ≤ tn−2;1− α2 =1−α
ˆ
s.ê.(f0)
→ un intervalle un intervalle de prévision à (1 − α) × 100% pour y0 :

ŷ0 − tn−2;1− α2 s.ê.(fˆ0) ; ŷ0 + tn−2;1− α2 s.ê.(fˆ0)
1.3. Prévision et non-normalité

• L’intervallede prévision pour E(y0) reste valable asymptotiquement, pour n grand,
sous les seules hypothèses A1 à A5
• Ce n’est pas le cas de l’intervalle de prévision pour y0 !
2. Le coefficient de détermination : R2
• Une fois le modèle estimé, chaque observation yi peut être décomposée en une partie
expliquée par le modèle ŷi, et une partie non expliquée ou résiduelle êi :
yi = ŷi + êi, où ŷi = β̂ 1 + β̂ 2xi et êi = yi − ŷi
• De cette décomposition, on peut tirer :

n n n
2 2
(yi − ȳ) = (ŷi − ŷ) + ê2i
i=1 i=1 i=1
SCT SCE SCR
⇔ V are(yi) = V are(ŷi) + V are(êi)

Variance totale Variance expliquée Variance résiduelle
• Le coefficient de détermination est défini par :

SCE SCR V are(ŷi)
R2 = =1− =
SCT SCT V are(yi)
→ Le R2 mesure la part de la variance des yi expliquée par la régression
7
• Par construction, le R2 est toujours compris entre 0 et 1 :

0 ≤ R2 ≤ 1, avec : - R2 = 0 ssi SCE = 0
- R2 = 1 ssi SCR = 0
ne faut pas surestimer l’importance du R2. Il s’agit simplement d’une mesure

• Il
descriptive
• On peut encore montrer que :

— leR2 est égal au carré du coefficient de corrélation empirique ρe(xi, yi)
entre xi et yi :
R2 = (ρe(xi, yi))2
→ les régressions linéaires simples de yi sur xi et de xi sur yi ont le même R2
— leR2 est égal au carré du coefficient de corrélation empirique ρe(yi, ŷi)

entre yi et ŷi :
R2 = (ρe(yi, ŷi))2
3. Unités de mesure
• Lesparamètres et les statistiques calculés dans le cadre du modèle de régression ne
sont pas sans unités de mesure : ils dépendent des unités de mesure de xi et de yi
→ Si on modifie les unités de mesure de xi et/ou de yi, les valeurs des paramètres
et statistiques calculés seront similairement modifiées
• Exemple : P oidsi = β 1 + β 2 T aillei + ei , V ar(ei) = σ 2

↓ ↓ ↓ ↓ ↓ ↓
kg kg kg/cm cm kg kg2
- Si on mesure le poids en grammes plutôt qu’en kilogrammes, on aura :

P oidsi → ×1000, β 1 → ×1000, β 2 → ×1000, ei → ×1000 et σ 2 → ×106
- Si on mesure la taille en mètres plutôt qu’en centimètres, on aura :

T aillei → ÷100, β 1 → idem, β 2 → ×100, ei → idem et σ 2 → idem
9
• Formellement :
yi = β 1 + β 2xi + ei
avec :
E(ei) = 0, V ar(ei) = σ 2 et Cov(ei, ej ) = 0
Nouvelles unités de mesure : yi∗ = ayi et x∗i = cxi

yi∗ x∗i
Le modèle devient : = β 1 + β 2 + ei
a c
⇔ yi∗ = β ∗1 + β ∗2 x∗i + e∗i
avec :
a
β ∗1 = aβ 1 , β ∗2 = β 2 , e∗i = aei ,
c
E(ei ) = 0 , V ar(ei ) = a2σ 2 et Cov(e∗i , e∗j ) = 0
∗ ∗
• Lesvaleurs estimées des paramètres et autres statistiques du modèle se modifient

de façon semblable
• L’ajout d’une constante à xi et/ou yi s’analyse de façon similaire
10
4. Forme fonctionnelle
• Le modèle de régression linéaire suppose uniquement une linéarité dans les paramètres
• Des relations non-linéaires entre variables peuvent être modélisées en transformant

les variables du modèle
4.1. Le modèle lin-log
• Le modèle s’écrit : yi = β 1 + β 2 ln xi + ei , (xi > 0)
Graphiquement :
2 0 2 0
y y
0 1
0 1
e 2 x e 2 x
dy dy
— β2 s’interprète comme une semi-élasticité : β 2 = d ln x = dx
x
— β2 est insensible à une modification des unités de mesure de xi

11
4.2. Le modèle log-lin

• Le modèle s’écrit : ln yi = β 1 + β 2xi + ei , (yi > 0)
Graphiquement :
2 0 2 0
y y 1
e
1
e
0 0
x x
dy
d ln y
— β2 s’interprète comme une semi-élasticité : β 2 = dx = dx
y
— β2 est insensible à une modification des unités de mesure de yi
• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :

yi = eβ 1+β 2xi vi , où vi = eei ≃ 1 + ei
tel que :
2
E(yi) ≃ eβ 1+β 2xi et V ar(yi) ≃ σ 2 eβ 1+β 2xi = σ 2 [E(yi)]2
12
4.3. Le modèle log-log

• Le modèle s’écrit : ln yi = β 1 + β 2 ln xi + ei , (xi > 0, yi > 0)
Graphiquement :
2 0 2 1 2 0
2 1
y 1
y
2
0 0
x x
dy
d ln y
— β2 s’interprète comme une élasticité : β 2 = d ln x = y
dx
x
— β2 est insensible à une modification des unités de mesure de xi et de yi
• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :

yi = eβ 1 xβi 2 vi , où vi = eei ≃ 1 + ei
tel que :
2
β β
E(yi) ≃ eβ 1 xi 2 et V ar(yi) ≃ σ 2
eβ 1 xi 2 = σ 2 [E(yi)]2

Slides 5 - Econo

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Slides 5 - Econo

Hochgeladen von

Copyright:

Verfügbare Formate

Econométrie

1.1. Prévision de l’espérance de y sachant x0

• Lespropriétés de cet estimateur / prédicteur sont déterminées par la distribution

où s.e.(p̂0) = V ar(p̂0) = X0V (β̂)X0′ = σ 2X0(X ′X)−1X0′

où s.ê.(p̂0) = V âr(p̂0) = X0V̂ (β̂)X0′ = ŝ2X0(X ′X)−1X0′

• Pour α ﬁxé, on a ainsi :

1.2. Prévision de la valeur de y sachant x0

• Les propriétés de ce prédicteur sont déterminées par la distribution d’échantillonnage

• Sous les hypothèses A1 à A5, on a :

• Sous l’hypothèse A6 de normalité, on a encore :

où s.e.(fˆ0) = V ar(fˆ0) = σ 2 + X0V (β̂)X0′ = σ 2(1 + X0(X ′X)−1X0′ )

où s.ê.(fˆ0) = V âr(fˆ0) = ŝ2 + X0V̂ (β̂)X0′ = ŝ2(1 + X0(X ′X)−1X0′ )

• Pour α ﬁxé, on a ainsi :

→ un intervalle un intervalle de prévision à (1 − α) × 100% pour y0 :

1.3. Prévision et non-normalité

• De cette décomposition, on peut tirer :

SCT SCE SCR

⇔ V are(yi) = V are(ŷi) + V are(êi)

• Le coeﬃcient de détermination est déﬁni par :

• Par construction, le R2 est toujours compris entre 0 et 1 :

ne faut pas surestimer l’importance du R2. Il s’agit simplement d’une mesure

• On peut encore montrer que :

— leR2 est égal au carré du coeﬃcient de corrélation empirique ρe(yi, ŷi)

• Exemple : P oidsi = β 1 + β 2 T aillei + ei , V ar(ei) = σ 2

- Si on mesure le poids en grammes plutôt qu’en kilogrammes, on aura :

- Si on mesure la taille en mètres plutôt qu’en centimètres, on aura :

Nouvelles unités de mesure : yi∗ = ayi et x∗i = cxi

• Lesvaleurs estimées des paramètres et autres statistiques du modèle se modiﬁent

• Des relations non-linéaires entre variables peuvent être modélisées en transformant

— β2 est insensible à une modiﬁcation des unités de mesure de xi

4.2. Le modèle log-lin

— β2 est insensible à une modiﬁcation des unités de mesure de yi

• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :

4.3. Le modèle log-log

— β2 est insensible à une modiﬁcation des unités de mesure de xi et de yi

• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :

Das könnte Ihnen auch gefallen