Beruflich Dokumente
Kultur Dokumente
ESTIMATION ET PREVISION
Elyse Aristide HOUNDETOUNGAN
courriel : ariel92and@gmail.com
Janvier 2016
2
2
3
6
6
7
9
Introduction
Lconomtrie consiste en gnral modliser une variable laide dautres facteurs
appels explicatifs. On peut sintresser lvolution du taux de croissance, de linvestissement, de la consommation . . . ou mme lvolution du chiffre daffaires dune entreprise,
pour dgager limpact que pourraient avoir un certain nombre de variables sur leur volution. Sous un autre angle, lapproche conomtrique peut sintresser la prvision, du
chiffre daffaires par exemple. Dans ce cas prcis, les valeurs antrieures de la variables
dintrt sont gnralement utilises. Autrement dit, on modlise la variable uniquement
par ses valeurs passes sans faire recours dautres facteurs exognes. Ces modles sont
dits autorgressifs.
Il existe un paradigme de modles autorgressifs. Dans ce document nous allons parler
des modles Seasonal AutoRegressive Integrated Moving Average (SARIMA). Ces modles
sont une extension des modles ARIMA avec la prise en compte de la saisonnalit. Il est
assez frquent de se rendre compte que beaucoup dconomtres maitrisent les modles
ARIMA sans pour autant manipuler les SARIMA. En principe lapproche des SARIMA
est la mme que celle des ARIMA et devrait tre perue facilement.
Nous allons mettre laccent sur trois aspects. La premire des choses sera de lever cette
illusion qui fait croire quon peut toujours dsaisonnaliser une srie saisonnire pour lui
appliquer un modle ARIMA. En fait, a ne va pas toujours marcher et nous allons le
dcouvrir avec des exemples concrets. Une deuxime partie vas plutt se focaliser sur la
thorie des modles SARIMA. On aura dterminer leur fonction dautocorrlation et
autocorrlation partielle. La dernire partie sera la mise en uvre sous certains logiciels.
NB : Ce cours suppose que vous maitrisez les modles ARIMA. Abstenez vous
de le lire si ce nest pas le cas.
1.1
Notations
Soit (Xt )tZ un processus stochastique qui suit un ARIM A(p, d, q). Alors on a :
(1 B)d (B)Xt = (B)t avec t
BB(0, 2 )
Le polynme (.) est de degr p et (.) de degr q. Notons que le processus (1 B)d Xt
est stationnaire, ainsi les racines de (.) ne sont pas sur le cercle unit. Pour identifier un
ARIMA, il sagit donc de dterminer le p, le d et le q.
Le problme est un peu plus complexe pour les SARIMA. le nombre de paramtre augmente. Ainsi, on dit quun processus (Xt )tZ suit un SARIM A(p, d, q)(P, D, Q)s lorsque :
(1 B)d (1 B s )D (B s )(B)Xt = (B s )(B)t avec t
BB(0, 2 )
les polynmes (.), (.), (.) et (.) sont respectivement de degrs P , p, Q et q. Dans ce
cas aussi le processus (1 B)d (1 B s )D Xt est stationnaire. Les polynmes (.) et (.)
ont donc des racines qui ne sont pas sur le cercle unit.
De faon gnrale, le paramtre s reflte la frquence de la mesure de la variable dans
un cycle. Par exemple, si on observe la temprature moyenne dune rgion donne, le cycle
Aristide E.
HOUNDETOUNGAN
Page 2
1.2
Pour traiter les sries saisonnires, lapproche la plus frquente est de la dsaisonnaliser.
On obtient donc une srie non saisonnires qui peut rpondre aux critres des modles
ARIMA. Cette approche nest pas trop conseille. En effet, dune part on traite les toutes
les sries saisonnires de la mme faon dans distinction de D = 0 ou D = 1 ou autre (on
ne se soucie pas mal des paramtres P , D et Q). Dautre part la mthode applique pour
la dsaisonnalisation peut ne pas tre adquate.
La saisonnalit dun processus va bien au del de ce que lon pense. Voici un exemple de
ce que nous percevons souvent comme une saisonnalit.
Exemple 1 :
Supposons un produit A dont le prix Xt mesur chaque trimestre prend de fortes valeurs
pour le premier trimestre (en moyenne 140), une valeur moyenne pour les deuxime et
troisimes trimestres (en moyenne 100 et 80 respectivement), et une forte valeur pour le
quatrime trimestre (en moyenne 162). Ainsi, pour chaque trimestre, le prix va fluctuer
autour de la valeur correspondante. De faon concrte le processus peut tre de la forme
suivante :
(1 B 4 )Xt = t = Xt = Xt4 + t soit Xt
Anne
Anne
Anne
Anne
Anne
1
2
3
4
5
Trimestre 1
Trimestre 2
Trimestre 3
Trimestre 4
140,00
139,29
140,70
141,65
142,81
100,00
98,85
97,54
97,11
95,58
80,00
80,34
79,85
80,55
79,99
162,00
165,02
164,86
165,93
167,98
A coup sr, les tests de saisonnalits vont aboutir des meilleurs rsultats. Juste
parce que la saisonnalit est de type dterministe et plus rapidement, lon peut obtenir
les coefficients saisonniers (il suffit de faire ici une moyenne pour chaque trimestre). On
peut donc dsaisonnaliser la srie.
Aristide E.
HOUNDETOUNGAN
Page 3
n1
-T
r
n1 i1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri 2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri 3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri4
1
2
3
4
5
Trimestre 2
Trimestre 3
Trimestre 4
0,15
-0,21
0,33
-0,20
0,30
0,65
-0,70
0,50
-0,49
0,29
0,40
-0,33
0,25
-0,15
0,08
-0,10
0,39
-0,37
0,44
-0,19
n1
-T
A ri1
n1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri 1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri 4
Anne
Anne
Anne
Anne
Anne
Trimestre 1
Lallure de la courbe ne rvle pas que la srie est saisonnire. Mieux, les tests infirment
la saisonnalit, pourtant nous venons de simuler un SARIMA. Il est vrai que dans une
certaine mesure, on pourrait considrer la srie comme un ARIMA creux. Mais en rendant
Aristide E.
HOUNDETOUNGAN
Page 4
n1
-
Tr
n1 i1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri 1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri4
n = 500 signifie quon a simul une srie de taille 500. Les paramtres de la variable
ar et ma ne sont rien dautre que les paramtres du polynme autorgressif et ceux du
polynme moving average. Le graphique suivant prsente lvolution de la srie (juste
pour les cinq premires annes).
Aristide E.
HOUNDETOUNGAN
Page 5
Avec un peu de manque de vigilance, on peut conclure que cette srie nest pas saisonnire, donc jamais elle ne peut tre modlise avec un SARIMA. Ce sera un dbut de
tous les problmes, car lidentification dun ARIMA simple va toujours chouer. Pour en
tre certain, analysons juste les fonctions dautocorrlations simples et partielles.
Rien quavec ces graphiques on pourrait affirmer que la srie suit un SARIMA cause
des pic rguliers significatifs. Il sera impossible didentifier un ARIMA simple de cette
srie et esprer avoir un bruit blanc comme rsidu.
2
2.1
Dickey Fuller (1981) a construit un test pour vrifier la prsence de racine unitaire
dans la partie AR des modles ARIMA. Soit un processus stochastique qui vrifie
Aristide E.
HOUNDETOUNGAN
Page 6
(B)Xt = (B)t ,
avec t
BB(0, 2 )
(1)
Le test de Dickey Fuller (DF) est bas sur le modle gnral suivant :
(1 B)(Xt at b) = t
(2)
La srie considre est (Xt at b) afin dliminer la prsence dune tendance linaire
ventuelle. Le principe du test est de rechercher la valeur de . Si = 1, alors le polynme
(.) de lquation 1 est factorisable par (1 B). Dans le cas, contraire phi(.) nest pas
factorisable par (1 B) et le processus (Xt at b) serait stationnaire. Daprs 2, on a :
Xt at b Xt1 + a(t 1) + b = t
Xt = Xt1 + a(1 )t + b(1 ) + t
Xt = ( 1)Xt1 + a(1 )t + b(1 ) + t
Lhypothse nulle du test est = 1. Autrement dit le polynme (.) de la partie AR a au
moins une racine unitaire (d > 1). La srie nest pas donc stationnaire (Lorsquon parle
de la srie, il sagit de (Xt at b), afin dannuler ventuellement la prsence tendance
linaire). Si 6= 1, alors d = 0.
Attention !
Avec le modle 2, si on ne prend pas en compte les autocorrtations de Xt , il pourrait
avoir un biais dans le rsultat. Soit un ARIM A(1, 1, 0) tel que :
(1 B)(1 + 0.6B)Xt = t
(1 0.4B 0.6B 2 )Xt = t
Xt = 0.4Xt1 + 0.6Xt2 + t
Xt = (0.4 1)Xt1 + 0.6Xt2 + t
Le test aura donc tendance rejeter = 1. On risque de dire que la srie est stationnaire.
Do le test de Dickey Fuller Augment (DFA) est plus pertinent que celui de DF simple.
Le modle 2 prend en compte une tendance linaire et une drive. Cependant, cette
spcification doit tre teste. Au cas o elle sera rejete (si la tendance nest pas significative par exemple donc la srie nest pas TS), il faut passer un modle sans constante mais
avec constante seule qui fera aussi lobjet de vrification. Si cette dernire spcification
est aussi rejete, on fait recours un modle sans constante ni tendance. Cette mthode
est celle la plus utilise pour dterminer d. Si on rehette = 1, alors d > 1 (et non d = 1).
Il faut reprendre le test sur la diffrence premire pour sassurer quelle est stationnaire
(sinon on peut avoir d = 2, surtout en finance).
2.2
Dtermination de D
Page 7
p
X
ar Xtr + t ,
avec t
BB(0, 2 )
(3)
r=1
s Xt = ( 1)Xts +
p
X
ar s Xtrs + t ,
avec t
BB(0, 2 )
(4)
r=1
Page 8
2.3
Aristide E.
HOUNDETOUNGAN
0,69658169
1,06211448
1,15937296
-1,53522099
-0,55518051
2,05715341
0,14758854
-1,50661166
0,17227184
0,16103259
1,6488265
-0,38222083
-0,25956979
-0,28648892
1,0782304
0,48651561
1,52813926
-0,69413836
0,16355957
0,25596819
N (0, 1)
-0,10604278
1,96504775
-1,14510414
0,2015445
0,75772279
-0,88440313
-0,75830872
-1,40912993
0,30978152
1,04732852
-0,13882289
-2,05711755
-0,07440587
-0,93593927
-1,29334061
0,2733151
-0,3793212
0,160586
0,12435981
0,12076081
Page 9