Beruflich Dokumente
Kultur Dokumente
ESTUDO COMPARATIVO DE MTODOS DE PREVISO APLICAO SRIE DO NMERO SEMANAL DE ADULTOS ALOJADOS NUM HOTEL
Tese submetida Faculdade de Cincias da Universidade do Porto para a obteno do grau de Mestre em Estatstica
Agradecimentos
Gostaria de comear por agradecer minha orientadora, Professora Doutora Maria Eduarda Silva pelo apoio cientfico dado a este projecto. Os seus conselhos e crticas foram muito construtivos, pois conduziram-me pelas linhas deste trabalho de uma forma mais segura e esclarecida. Aos colegas e amigos que me apoiaram e encorajaram. Ao Instituto Politcnico de Tomar por todo o apoio concedido, principalmente no acesso ao software indispensvel a este trabalho. Ao hotel e em especial ao seu director, que pediu o anonimato, pelo fornecimento incondicional dos dados. A D. Ana Bela Vieira pela dedicao e pacincia que demonstrou nestes meses ao ajudar-me, principalmente com a Patrcia. A me e irm do Vitor por cuidarem da Patrcia. Aos meus pais pelo carinho e apoio que me deram no decorrer deste trabalho. Ao meu marido, Vitor, pelo carinho, compreenso e pacincia incondicionais. A minhafilhapelo seu sorriso.
Resumo
Neste trabalho o nosso objectivo obter previses para as sries temporais do nmero semanal de adultos alojados num hotel, para o que utilizmos trs mtodos diferentes, nomeadamente: previso Holt-Winters, modelos estruturais e modelao Box-Jenkins ARTMA. Conclumos que, embora o melhor ajustamento em termos de varincia residual seja fornecido pelo mtodo de decomposio clssica, as melhores previses so dados pelo Modelo Estrutural Bsico (MEB).
Palavras chave: sries temporais; decomposio clssica; Holt-Winters; modelos estruturais; filtro de Kalman; Box-Jenkins; modelos ARJJVIA
Abstract
Our aim is to obtain predictions for the time series of the weekly occupancy rate of adult customers in an hotel, we use three different methodologies namely Holt-Winters prediction, structural models and Box-Jenkins ARIMA approach. We conclude that although the best fit in terms of residual variance is given by the classical decomposition method, the best predictions are given by the Basic Structural Model (BSM).
Key words: time series; classical decomposition; Holt-Winters; structural models; Kalman filter; Box-Jenkins; ARIMA models
ndice
Dedicatria Agradecimentos Resumo Abstract ndice Captulo 1. Introduo 1.1. Motivao e Estrutura do Trabalho 1.2. Conceitos Fundamentais Captulo 2. Mtodo de Anlise de Sries Temporais 2.1. Introduo 2.2. Mtodo de Decomposio Clssica 2.2.1. Modelo Aditivo 2.2.2. Previso 2.3. Modelao Box-Jenkins 2.3.1. Identificao do Modelo 2.3.2. Estimao e Diagnstico 2.3.3. Previso 2.4. Modelos Estruturais 2.4.1. Modelo Estrutural Simples 2.4.2. Modelo Estrutural Bsico (MEB) 2.4.3. Modelo Cclico 2.4.4. Os Modelos Estruturais na Sua Forma Reduzida 2.4.5. Seleco do modelo 2.4.6. Anlise da Componente Residual 2.4.7. Modelos em Espao de Estados 2.4.8. Filtro de Kalman
3 4 5 5 7 9 9 10 13 13 13 14 17 18 20 21 22 23 24 25 27 28 32 32 32
36
Captulo 3. Modelao do Nmero Semanal de Adultos Alojados num Hotel . . 40 3.1. Apresentao da Srie 3.2. Diagnstico Preliminar dos Dados 3.3. Modelao da Srie Atravs da Decomposio Clssica 3.3.1. Estimao das Componentes 3.3.2. Estudo da Componente Residual 3.4. Modelao Box-Jenkins 3.4.1. Identificao do Modelo 3.4.2. Estimao dos Parmetros 3.4.3. Estudo dos Resduos 3.5. Modelo Estrutural 3.5.1. Estimao das Componentes 3.5.2. Estudo da Componente Residual 3.6. Comparao de Resultados 3.7. Previso 3.8. Concluses Bibliografia Anexo I Anexo II Anexo III Anexo IV Anexo V Anexo VI Anexo VII Anexo VIII 40 41 43 44 . 4 5 4g 48 49 50 53 53 54 55 57 60 62 63 65 66 68 70 71 72 73
Captulo 1. Introduo
Para ultrapassar as dificuldades apresentadas nas duas metodologias anteriores usam-se os modelos estruturais de sries temporais, desenvolvidos por Harvey (1996), que aliam a facilidade de interpretao ao rigor formal e controlo estatstico. Estes modelos so formulados em termos das componentes tradicionais sendo cada uma destas formalizada como um processo estocstico. Neste trabalho pretende-se modelar e obter previses para a srie do nmero semanal de adultos alojados num hotel aplicando as trs metodologias atrs referidas. Iniciamos o nosso estudo tentando ajustar srie das observaes um modelo de decomposio, prosseguimos com um modelo estrutural e conclumos com o ajustamento de um modelo ARTMA. Os trs melhores modelos obtidos com as diferentes metodologias sero depois comparados quer em termos de ajustamento, quer em termos de previso. Assim, no Captulo 2 comeamos por descrever a decomposio clssica de uma srie temporal e apresentamos o mtodo utilizado na previso. De seguida descrevemos a metodologia de Box-Jenkins, que se divide nas fases: (i) identificao, (ii) estimao e diagnstico e (iii) previso. E por ltimo centramo-nos nos principais modelos estruturais, na sua representao em espao de estados e no filtro de Kalman. Finalmente, no Captulo 3 aplicaremos as diferentes metodologias estudadas na construo de modelos para o nmero semanal de adultos alojados num hotel. Na sequncia dos modelos construdos faremos as previses para esta srie temporal.
{Yt, t = 1,2, ..., N). A srie temporal tambm pode ser registada em tempo contnuo, e neste casorepresenta-sepor {Y(t\ 0<t<T}. Uma srie temporal apenas uma das realizaes de determinado processo estocstico; no entanto, o termo srie temporal empregue para designar a realizao observada do processo estocstico. O processo {Yt} diz-se estritamente estacionrio sse a distribuio^ conjunta de Yh %, YtJ igual distribuio conjunta de \Y,l+k,Yh+k,...,Ytn+k)para todo o w-plo (tu 2, ...,)etodoo*,ouseja, F, p / j _ J r , , ^ , . . . , ^ ^ , ^ ^+k
(YX,Y2,...,YJ
em todos OS
pontos (yi, y2,..., y) e em que F ( ) representa a funo distribuio conjunta de(7I(, Yh,..., Yt ) De uma forma resumida significa que um processo estritamente estacionrio goza da propriedade de que a distribuio de um qualquer conjunto de margens se mantm a mesma quando estas so sujeitas a uma translao no tempo. Na prtica esta propriedade no se verifica com facilidade, recorrendo-se por isso estacionaridade fraca. Um processo diz-se fracamente estacionrio at ordem m, ou simplesmente estacionrio, se os vectores -dimensionais (^, Ytt..., Yt) e {Yh+k, Yh+k, Yt^+k) possurem momentos conjuntos at m-sima ordem e esses momentos forem iguais. O processo {Yt, teT) diz-se fracamente estacionrio de Ia ordem se E(y,) = /x, Vf e fracamente estacionrio de 2" ordem ou para a covarincia sse for tal, que para todo o /: 1) E(Yt) = ju, constante, V, 2) E\Yt2)= ju2, constante, V, ecomoft)=JE(r2)-2ft)=^-^=cT2 3) E(Y,YS) = E[Y,YS]-/?, i.e., funo apenas da diferena t-s. Seja { Yt, teT) um processo estacionrio de 2a ordem em que E(Yt) = jue var(Yt) = o2, t= 0, 1, 2,... a funo de autocovarincia dada por yk = E{(Yr-fi)( Yt+k-n)} = cov (Yh Yt+k). A funo de autocorrelao (FAC) dada por pk = Y. = corr(Yt, Yt+k) onde para cada k a funo pk mede a correlao entre pares de valores do processo separados por um intervalo k. f t{YfY\YM-f) O estimador da FAC dado por = ~r~ = , k = 0,1,... onde Y
f=i
1 a mdia amostrai Y = Y Y.. A estimao da FAC efectua-se para k > 0 As funes de autocovarincia e autocorrelao gozam das propriedades:
11
l)KO) = var(r,);
p,= \ ^{x1^1)
2) |#| < y(0) e em consequncia |/ty} | < 1 em virtude da desigualdade de CauchySchwarz: \E(XY) < 3) ft = /-* ; A * A*
4) As funes /* e pst so semidefinidas positivas. A funo de autocorrelao partial (FACP) dada por <f>u = corr(Yt,'Yt+k), retirando os efeitos de Yt e Yt*~\. Para cada k mede a correlao entre Yt e W, depois de eliminar o efeito produzido pelas variveis Yt+\,..., Yt+k-i. O clculo do estimador da FACP feito por meio recursivo partindo de :
k-\
, = e utilizando t t =
j^ -Zh-ijpj
7=1
em que } k J = ik.lJ
-KKu-j*
y = l,2,...,*-l. A representao grfica da FAC e da FACP designam-se, respectivamente, por correlograma e correlograma parcial estimados, pois na prtica geralmente apenas dispomos de uma realizao do processo. O processo {et} constitui rudo branco se for formado por uma sucesso de variveis aleatrias independentes e identicamente distribudas com mdia constante E(e,) = //, geralmente assumida como sendo zero, var(et) = a2 e covarincia yk = 0 para k * 0, ou seja, um processo estacionrio de 2a ordem l, k = 0 \a2, * = 0 com Pk-\n , n e Yk -\ [0, Ar^O [o , k>\ Quando a amostra significativamente grande, assume-se que A- tem distribuio /V(0, l/n). Os valores (95%), tanto da FAC como da FACP, devero situar-se dentro dos limites de confiana: l.96/-Jn.
12
2.1. Introduo
Neste captulo faremos uma abordagem aos trs mtodos de anlise de sries temporais utilizados no estudo da srie das observaes. Comeamos pelo mtodo de decomposio clssica, prosseguimos com a modelao Box-Jenkins e finalizamos com os modelos estruturais.
Embora todas as sries temporais contenham a componente residual, as outras trs componentes, que reflectem um certo padro comportamental, podem no estar presentes na sua totalidade. O objectivo da anlise das sries temporais identificar as componentes presentes de modo a identificar as suas causas e prever valores futuros. Ento, sendo y, a srie dos valores observados, yt=Tt,St,Ct,et) a expresso genrica do modelo de decomposio. Este modelo pode ser do tipo aditivo yt = T, + St + C, + et, do tipo multiplicativo yt= Tt St Ct et ou ter uma forma mista yt = Tt S, Ct + et /2.4) *2 3) (2 2) ^2.1)
A opo entre (7.2) e (2.3) baseia-se no tipo de sazonalidade presente, s uma das formas de perspectivar as caractersticas desta passa pela observao do cronograma. Se se observar que com o aumento (ou diminuio) do nvel da tendncia h um aumento (ou diminuio) da amplitude dos movimentos peridicos, ento aconselhvel um modelo do tipo (2.3). Por outro lado, se os movimentos peridicos permanecerem estveis em torno da tendncia, deve-se optar por um modelo aditivo. Por ser a que mais relevncia parece ter para o nosso trabalho, na seco que se segue vamo-nos restringir construo de um modelo de decomposio do tipo aditivo, e dentro deste tipo de modelos consideraremos apenas os que contm na sua estrutura a tendncia, a componente sazonal e, claro, a componente residual.
Como referimos anteriormente, o modelo aditivo especificado do seguinte modo: yt=Tt + St + et, =l,2,...,
(2 .5)
onde Tt a tendncia, S, a componente sazonal ee ( a componente residual. Nesta perspectiva de anlise do comportamento da srie temporal comea-se oor dessazonalizar a srie com mdias mveis, prossegue-se com a estimao da componente da tendncia efinalmenteestima-se a componente residual.
14
Dessazonalizao com Mdias Mveis Considerando ento que a componente sazonal est presente, o objecto inicial estimar os coeficientes sazonais.
k+S
significa que o valor dos efeitos depressivos compensa o valor dos efeitos expansivos. Os diferentes valores que a funo S, toma, isto , a Sk+U Sk+2 , ..., Sk+s chamamos coeficientes sazonais. A estimao dos coeficientes sazonais compreende duas fases: na primeira estimam-se as suas componentes no normalizadas e na segunda estas so normalizadas. Na primeira fase, o primeiro passo construir um processo de mdias mveis associado yt. Se S por par(1), ento definimos o processo de mdias mveis centrado como:
"n
'
-+^ H
rr
P a r a t - T + 1 - , # - Realce-se que / agora o instante mdio das observaes includas na mdia mvel. Se 7", for constante ou linear, M, considerado um bom estimador do rVel T, da srie, no momento /. Num segundo passo obtemos as estimativas das componentes sazonais e residuais atravs das diferenas
s .
.S/ 2/<+7 2,
(2.6)
s;=yt-Mt)
pois yt-M,=Tt+S,+et-Mt*St+et, t = ~ + l,...,N--
(27)
(2 .8)
Admita-se que, sem perda de generalidade, N = mL, e represente-se / com /' = S(j-\), onde / = 1, 2, ..., S ey = 1, 2, ..., m, com m o nmero de anos de observaes disponveis. Constroem-se para os, anteriormente obtidos, 1 m
5
S* = S*+S(H) as S mdias
(2.9)
Os S, so as estimativas no normalizadas dos coeficientes sazonais no instante /' de cada ano. Passando segunda fase, as estimativas S, sero normalizadas, para assegurar que 2^ St = 0, V t meiro} tomando ento
(
(2-10)
\M
e 5, = St_s,
i>S, onde a estimativa da componente sazonal dada por (2.10). ento definida pela remoo da componente sazonal na (2.ii)
Est feita, portanto, a dessazonalizao por mdias mveis dej>,. Prossegue-se, nesta perspectiva de decomposio, com a estimao da componente de tendncia.
E stimao da Tendncia importante olhar atentamente para o grfico da srie para assim identificar a forma da tendncia a estimar. Pois a tendncia, nas suas abordagens determinsticas ou estocsticas, pode ser (i) constante, (ii) linear ou ter (iii) outras formas (quadrtica, exponencial, logartmica, etc.). Se concluirmos que a tendncia linear, isto , Tt =fa+pit + e, (2.12)
a regresso linear simples uma tcnica que fornece uma boa estimativa da tendncia. Pois fornece estimadores lineares centrados de varincia mnima, atravs do mtodo dos mnimos quadrados. Tambm podemos utilizar a regresso mltipla afimde ajustar, se for esse o caso, uma tendncia do tipo polinomial, ou seja, yt = /3o+fit + ...+/3pf + et (2.13)
Mas nem sempre claro o tipo de tendncia que mais se adequa s observaes. Nesse caso constri-se uma sucesso de mdias mveis associada, em que se substitui cada observao pela mdia da prpria observao com as que lhe esto prximas.
E stimao da Componente Residual Temos vindo a analisar a estimao das componentes de um modelo do tipo aditivo (2.5), nesta altura falta estimar a componente residual et. A estimativa desta componente dada por ,=yt-ft-St, t = l,...,N (2.14)
16
Aps a decomposio espera-se obter uma srie estacionria, se tal suceder resta modelar a srie dos resduos utilizando a metodologia Box-Jenkins (Brockwell & Davis, 1996).
2.2.2. Previso
A decomposio das sries, em componentes no observveis, alm de ser uma ferramenta que permite compreender o comportamento das sries temporais, tambm um mtodo de previso. Neste trabalho a decomposio ser utilizada para descrever e compreender a estrutura da srie e assim ajudar na escolha de um mtodo de previso. Quando a srie yt (como em 2.5) apresenta tendncia e sazonalidade com perodo S usa-se o mtodo Holt-Winters (que uma extenso do mtodo de Holt) (Brockwell & Davis, 1996). Este mtodo permite construir as previses pontuais da srie. Baseia-se em trs equaes de alisamento: a do nvel, a da tendncia e a da sazonalidade, e apresenta a vantagem de no se supor um padro sazonal fixo. Considerando ento yt = a + bt + St + et o modelo subjacente, a funo de previso yt+H=t+bth + St+h_ks com//= 1, 2,... ek= 1 seO<h<L,k Assim , = a(y, -St_s)+ (l - af t - x + *,_,) 0 < a < 1 bt = fi(, - t_{)+ (1 - /?),_,, 0 < fi < 1 (2.16)
(2 .17)
(2.15) = 2seL<h<2L.
st=r(yt-at)+(i-r)st_s,
'-S
o<^<i
(2.i8)
Para aplicar este mtodo necessrio definir os valores iniciais para (0), A(0) e / = !,. ..,S. Comeando em yu tem-se: (i)(0)=fm~{' (w-\)S (H)(0) = J 7 1 - ^ 6 ( 0 ) com J7ta mdia do primeiro ano e J7ma mdia do ano m\ (iii) para / = 1,..., mS os ndices sazonais (2.20) m = 2 ou m = 3 e mS<N (2.19)
sl,<M)=yi+su-i)~
yt=y^s{!-i),
(2-21)
17
S,=-Z<W-.)> i = \-,S
(2.22)
As constantes de alisamento a, pz y escolhem-se minimizando uma funo dos erros de previso. Os coeficientes sazonais estimados, por vezes ao fim de S perodos," tero de ser renormalizados, devido sucessiva aplicao de (iii). At aqui vimos como obter previses pontuais para a srie, mas muitas vezes interessanos construir intervalos de confiana para as previses, os chamados intervalos de previso. Isto , pretende-se obter intervalos que se cr conterem o valor futuro da varivel com certa probabilidade. No entanto, fazer previso por intervalos depende da especificao de certas hipteses relativas ao comportamento da varivel, do seu modelo terico e em particular do seu termo residual. O mtodo de Holt-Winters no o mais adequado deduo de intervalos de previso, sendo que um dos principais motivos o facto de o modelo estatstico equivalente no estar teoricamente fundamentado.
Neste captulo debruar-nos-emos sobre a metodologia Box-Jenkins utilizada na anlise de sries temporais, com a qual se pretende escolher modelos ARMA(2) (auto regressive moving average) para modelar a srie das observaes. Um processo {yt} diz-se um modelo ARMA (p, q) se a equao s diferenas estocsticas satisfeita
yt - <fayt-i - - fayt-p
= e
^ ~ &e<-i ~ - ~
##-*
ou escrevendo de uma forma mais concisa fB)yt= GlE)et E(et) = 0 e var(e,) = o2. As razes do polinmio 0q(B) - 0 devem situar-se fora do crculo unitrio para que o processo seja invertvel e para o processo ser estacionrio as razes de <j><,(B) = 0 devem estar
(2)
(2.23)
onde B o operador atraso B'yt=yt-i, / = 0, 1, ... e {et} um processo de rudo branco com
fora do crculo unitrio. Assume-se daqui para a frente que o processo estacionrio e invertvel e que os polinmios 0q{B) = 0 e </>p(B) = 0 no tm razes comuns. A FAC de um processo ARMA (p, q) decai gradualmente para zero (ou sob a forma de sinusoidal amortecida), pois o seu comportamento como o de um processo autoregressivo (AR). A FACP, cujo comportamento semelhante de um processo de mdias mveis (MA), tambm decai gradualmente para zero (ou sob a forma de sinusoidal amortecida). Segundo Box-Jenkins (1994) na construo de um modelo podemos distinguir trs fases essenciais, conforme representado esquematicamente na Figura 2.1: (i) identificao, (ii) estimao e diagnstico e (iii) utilizao do modelo na previso.
Fase I Identificao
Preparao das Observaes Transformao dos dados para estabilizar a varincia Diferenciao dos dados para obter uma srie estacionria
Seleco do Modelo
T
1r
~
^
M
Estimao Estimar parmetros dos potenciais modelos Seleccionar o melhor modelo usando critrios apropriados 1r Diagnstico Verificar FAC/FACP resduos Fazer testes aos resduos So os resduos rudo branco ? 1r Sim No
Figura 2.1 - Metodologia Box-Jenkins (Makridakis, Wheelwright & Hyndman. 1998, p. 314) 19
Na anlise da nossa srie sero estas as fases por ns utilizadas e que neste captulo descrevemos sucintamente.
Na fase de identificao dos modelos dois desafios se nos colocam: (i) preparao das observaes e (ii) determinar os possveis modelos ARMA (p, q) para a srie em estudo. (i) Preparao das Observaes Na prtica, na maior parte dos casos procuramos ajustar um modelo a uma srie {yi, yi, ..., y} que no estacionria (em mdia, em varincia ou em ambas). Isto levanta um problema uma vez que na modelao Box-Jenkins, pretende-se escolher modelos ARMA, que correspondem a processos estacionrios. Portanto se lidamos com uma srie no estacionria preciso transform-la de modo a que se torne estacionria. Quanto estabilizao da varincia dever ser feita antes das transformaes estabilizadoras da mdia, utilizando a transformao de Box-Cox (Box & Cox, 1964). A transformao Box-Cox uma famlia paramtrica de transformao de^f para y\X) definida da seguinte maneira
(2.24)
Devero ento experimentar-se vrios valores de X at chegar ao valor de X mais apropriado. Ao "melhor" X corresponder a menor soma de quadrados residuais, isto , para o qual SU) = tk"-Mtf menor. No caso da srie ser no estacionria em mdia torna-se necessrio diferenciar a srie. A tcnica de diferenciao usada, consoante os casos, para remover quer a tendncia quer a sazonalidade. A diferenciao para eliminar a tendncia tem a forma Vy,=(l-Byyt onde o inteiro d, na maior parte das situaes prticas, toma os valores 0, 1 ou 2. Torna-se no entanto k:ecessrio recordar que, embora o operador d possa ser qualquer inteiro, d > 0, se deve ter em ateno que se a ordem da diferenciao for muito elevada, introduzem-se varincias esprias.
20
(2 .26)
(2.25)
Quando estamos perante dados sazonais poder ser apropriado aplicar a diferenciao sazonal, para estacionar a srie, atravs do operador diferena sazonal
VDsyt={\-Bsfyt
(2.27)
onde o inteiro D a ordem da diferenciao sazonal e S a periodicidade. (ii) Escolha de possveis modelos ARMA (p, q) Aps a aplicao das transformaes necessrias (se for esse o caso) para estabilizar a srie, examinamos o cronograma, a FAC e FACP amostrais da srie convenientemente transformada e tentamos encontrar as ordens de p e q com vista a encontrar os modelos ARMA (p, q) que parecem ajustar-se srie dos dados. De seguida passamos segunda fase da modelao Box-Jenkins.
Nesta fase vamos decidir qual, de entre os vrios modelos propostos, ser utilizado para previso. Para isso temos de estimar os parmetros dos vrios modelos e, usando critrios adequados, seleccionar o melhor modelo. Por fim, e ainda nesta fase, fazemos a anlise dos resduos e assim decidimos se o modelo vai, ou no, ser utilizado para previso. (i) Estimao dos parmetros dos potenciais modelos J temos no horizonte um leque de modelos que podero ajustar-se srie em estudo, mas para chegar forma final destes modelos preciso estimar os seus parmetros, os quais so estimados pelo mtodo da mxima verosimilhana. Os estimadores P de
P ~ Wi >fa 4p #i, #2 &q )' so aproximadamente N(fi, nl V(fi)\ onde V(JJ) a matriz de covarincia assinttica (Brockwell & Davis, 1996 e 1991). Estando em poder das estimativas dos parmetros de cada modelo preciso analisar a sua significncia. Assim as estimativas que apresentem um p-value superior a 0.05 (para um nvel de significncia de a = 5%) devero ser excludos do modelo. Por outro lado os parmetros no devem ser correlacionadas, sob pena de produzirem um modelo instvel. (ii) Seleco do modelo Os diferentes modelos ajustados so comparados com base nos critrios AIC e BIC. Segundo Murteira, Muller e Turkman (1994) existem dois importantes critrios de seleco de modelos: Akaike (AIC) e critrio de informao de Bayes (BIC). No critrio AIC, a regra de deciso seleccionar o modelo que minimiza
21
AIC(m) = -2 log L$>) + 2m onde Ly) o valor da funo de mxima verosimilhana e m o nmero de parmetros (Harvey, 1993). O critrio BIC dado por BIC{m) = -2 log L^)+ mlogT, tambm selecciona o modelo ao qual corresponde o valor de m que minimiza esta funo. (iii) Diagnstico Nesta segunda sub-etapa vamos verificar se o modelo seleccionado fornece uma descrio adequada dos dados atravs da anlise dos resduos. Se os resduos se comportarem como um processo de rudo branco, devero ser uma sequncia de variveis aleatrias no correlacionadas, provenientes de uma distribuio fixa, com mdia constante, normalmente assumida como sendo zero, e varincia constante. Estas hipteses sobre a componente residual podero ser verificadas atravs de representaes grficas e testes estatsticos adequados. Assim, constri-se o cronograma dos resduos, o qual dever revelar uma mdia prxima de zero e no apresentar movimentos peridicos e analisamos os grficos das funes de autocorrelao (FAC) e autocorrelao parcial (FACP) amostrais. A normalidade da componente residual poder ser verificada graficamente atravs do histograma dos resduos e da representao em papel de probabilidades. Alm disso deveremos analisar tambm os testes adequados para verificar se esta componente tem um comportamento compatvel com uma amostra de rudo branco. Estes testes so utilizados para avaliar a aleatoriedade dos resduos e esto resumidamente apresentados no Anexo I. Caso os resduos tenham todas as caractersticas de rudo branco, o modelo em causa utilizado para previso.
2.3.3. Previso Aps a seleco do modelo que melhor se ajusta srie dos dados, este utilizado para previso de valores futuros da srie: a partir do passado da srie jr, y^i, yt-i, ... pretendemos prever um valor no observado da srie yt+m, m>0. O objectivo escolher v^w) ~fiyt,yt-h-) que mii;.mize [(y(+m - y, (w))2 J. E a melhor funo para/ o valor mdio condicional deyt+m em>v, _y,-i, yt-2, ou seja, o preditor de erro quadrtico mdio mnimo.
22
Seja yt+m a previso de {y,} em t + m. yt+m =yt(m)=E(yt+m \yy,-\,yt-2,~). (2.28) (2.29) Se {y,} satisfaz um ARTMA (p, d, q) da forma: Op(B)(l-B)dyt=Qq(B)et,
onde as razes do polinmio <(/?) so em mdulo estritamente superiores unidade e o valor das razes de (B) no interfere com a estacionaridade do processo. Se V(B) = p(B)(l -B)d = \-xB-...-p+dB^d tem-se (l-lB-...-p+dB^)yt+m ento y,+m = xyt+m-x + + P+dyt+m-p-d + et+m - 0xet+m_x -... - 0qel+m^ da equao anterior, obtm-se a equao de previso ym) = y/,yXrn-\) + ... + P+Jf"-p-d) onde y,U) = E(yt+j \yt,yt.l,yt1,..) e ,(./') = 0, j>\ quandoy < 0 y,U) = y,+J e t(j) = et+j. (2.37) (2.36) (2.35) (2.34) + t(m)-e,t(m-\)-...-eqt{.n-q) (2.33) (2.32) = Qq(B)et (2.31) (2.30)
Tomando ento o valor mdio condicionado ayt, yt-i, yt-i, em ambos os membros
No caso de pretendermos calcular um intervalo de confiana a (1-a) 100% para a previso do valor futuro Yt+m admitindo que os resduos tm distribuio gaussiana:
r
m-l
Nas sries temporais frequente observar que estas apresentam tendncia, sazonalidade, ciclos e perturbaes aleatrias.
23
Por vezes a tendncia no pode ser ajustada por linhas rectas, a menos que o perodo de tempo seja razoavelmente pequeno. Isto significa que a maior parte das vezes a tendncia determinstica limita o estudo das sries temporais. O ideal seria que a tendncia no fosse to restritiva, mas sim maisflexvel.A forma de o conseguir permitir que os parmetros, do nvel e do declive, evoluam ao longo do tempo. Surge, assim, necessidade de construir uma tendncia estocstica, em que o nvel e o declive se alteram com o decorrer .do tempo. De modo semelhante, torna-se necessrio que as outras componentes sejam suficientemente flexveis de modo a que reflictam os padres do comportamento da srie. Os modelos compostos por componentes com tais caractersticas, so muitas vezes vistos como modelos de regresso, nos quais as variveis so funes do tempo e cujos parmetros variam ao longo do tempo. Tais modelos designam-se por modelos estruturais de sries temporais e foram desenvolvidos por Harvey (1996). Os modelos estruturais de sries temporais so uma classe de modelos formulados em termos de componentes estocsticas, que tm por isso uma interpretao directa. Se para alm da tendncia e da sazonalidade, se inclurem variveis exploratrias, o modelo resulta numa mistura de sries temporais e regresso. A regresso um caso especial, na qual no existem componentes estocsticas, para alm do termo da perturbao aleatria. A combinao das variveis exploratrias com as componentes no observveis, abre um vasto leque de possibilidades na modelao. De seguida iremos abordar os principais modelos estruturais.
2.4.1. Modelo Estrutural Simples O modelo estrutural simples definido por duas componentes: a tendncia e a perturbao aleatria. Este modelo definido por: yt = Mt + t, t=\,...,T (2.38) Se a srie se caracteriza por um nvel localmente constante, ento jut a tendncia sem declive e st uma perturbao aleatria com caractersticas de rudo branco de mdia zero e varincia <j]., que se assume ser no correlacionado com fit. A tendncia define-se por A - #-i+ lt # = //,_i+#_i + P,= fi-i + 4, ty (2.39) (2.40a) (2.40b)
24
onde rjt e so perturbaes aleatrias com caractersticas de rudo branco, com mdia zero e
.*
. 2 2
e ^
Este modelo difere do anterior pois alm de incluir as componentes de nvel de tendncia IM e aleatria st, inclui a componente sazonal yu de perodo s. Assim, o modelo estrutural bsico representa-se do seguinte modo: Jir-A + J + * /* = A-i + Pt-\ + Tjt #=
-i
t=\,...,T
#-i +
r.2rw+k
que se assume serem no correlacionadas entre si.
Os termos ,, 7,, $ e <yf sLo perturbaes aleatrias com caractersticas de rudo branco As equaes (2.41b) e (2.41c) juntas definem o modelo da tendncia: a equao (2.41b) representa o modelo do nvel da tendncia e , (equao (2.41c)) o modelo do respectivo declive, que tem comportamento de passeio aleatrio. A tendncia tem diferentes modelos estocsticos consoante se admite que cada uma das varincias a2n e a\ nula, ou at que ambas so nulas.
Se
determinstica do tempo em que /?, = /?,_, = ...= /?e jut = JM-\ + pt,
que apesar de continuar a ser um processo estocstico tem uma componente determinstica: /?, sendo B o operador atraso. No caso de B= O a tendncia um passeio aleatrio.
25
Se al > 0 e al = O, ento
5, = 5,_, + o
o(l-5)5, = $ o 1-5 Temos ento que /?,_, = -21e
o(l-5)
Se crj > 0 0"2 > 0, temos que
1-5
1-5'
0(1-5)^ = ^ + 7 , 0 o (1 - 5 ) % = $_i + (l - 5 ) 7 f o o ( l - 5 ) 2 / / , = /7,-/;,_, + _,. Portanto a tendncia no caso, a] > O e crj > O, um processo ARIMA (O, 2, 1). A componente sazonal dada pela equao /, = - J ] t-} + ), o Y ^f_ = <f Esta componente pode ser actualizada quer sob a forma de varivel muda
26
-1
Ur,-j
[,/2]
CO,
r, = TrJt
7=1
sin Xj
COS XJ
*
),
(2.42)
<y,
onde e <y* so processos de rudo branco com mdia zero e varincia <J~ .
O), Yjt =rJ,t-1 cos A, +rl,_lsinXJ +,
De (2.42) tem-se
Os modelos cclicos apresentam uma componente cclica, y/h para alm das componentes da tendncia e aleatria. Podem definir-se trs tipos de modelos com componente cclica: o modelo ciclo mais rudo, o modelo de tendncia mais ciclo e o modelo de tendncia cclica. Define-se ciclo estocstico i//t da seguinte forma
Yt
+
V
k:
(2.43)
Vt
V
k:
(2.44)
Ciclo Mais Rudo Este modelo formalizado da seguinte forma: y, = ju+if/t+et, t=l,...,T
(2.45)
27
=i,...,r
(2.46)
Neste modelo considera-se a componente cclica como estacionria e representa-se por yt = jut+Y< + t, t=\,...,T (2.47a)
onde [M o modelo da tendncia como no modelo estrutural bsico: //, = /*_/+#_,+ 77, Pt= jflU + $ (2.47b) (2.47c)
Tendncia Cclica Tal como no modelo anterior a componente cclica deste modelo assume-se como estacionria e # = //, + t=\,...,T (2.48a) (2.48b) (2.48c) _, ^ + *' com jut= A-/ + Vt-i + $-; + % e m Que ciclo incorporado na tendncia. A = A-i + Ento, com A=l -B, tem-se _ 7, , (l-/?cos2^)Arf_1+(yQy/>?/L^)C * 7 + Z l ( l - 2 p c o s ^ + p252)
= +
<2-49)
Os modelos estruturais de sries temporais contm vrios termos de perturbao, mas uma vez que so lineares, estas perturbaes podem ser combinadas de modo a que exista apenas uma perturbao. Quando os modelos estruturais de sries temporais se encontram nesta nova forma diz-se que esto na sua forma reduzida, cujas caractersticas probabilsticas so equivalentes a modelos, com restries, da famlia ARIMA. Uma das vantagens dos modelos estruturais na sua forma reduzida, que so formulados em termos das componentes no observveis dos modelos ARTMA. Pois a classe dos modelos ARIMA abrange muitos modelos e parmetros, os quais no tm uma interpretao sensvel.
28
Na prtica, em termos de previso, os modelos ARIMA at funcionam bastante bem, mas tal s acontece porque os modelos estruturais de sries temporais tm a forma ARIMA reduzida (Harvey, 1997). Apresentamos de seguida a forma reduzida do modelo estrutural simples do modelo estrutural bsico.
Nvel Localmente Constante O modelo dado pelas seguintes equaes: yt = jut + st,
jUt = jUt-i+ rj,
=l,...,T
(2.50)
(2.51)
Sendo
JUt = jUt-i + T]t^>
oMt
1, \-B
\-B
&(l-B)yt=Tit
o ( l -B)yt=
jt+St-St-i
Ento a forma reduzida do modelo estrutural simples com nvel localmente constante
(l-B)yt= jjt+St-St-i.
No segundo membro temos um processo ARMA (0, 0) e um processo ARMA (0, 1), logo yt um processo ARIMA (0, 1, 1), isto , satisfaz uma equao da forma
2 (l-B)yt = Zt+QZ,-i, ondeZ, o rudo branco e 6= (q [q +q y -2-q /2,onde q-p\l >2 y>-2-q qf +y a razo das varincias (Harvey, 1996). Verifica-se que sob estas condies - l < 9< 0.
p\
Assim, o modelo estrutural simples com nvel localmente constante um processo ARIMA (0, 1,1), mas com restries.
29
Nvel Localmente Linear O modelo estrutural simples com nvel localmente linear definido pelo seguinte conjunto de equaes yt = jut + st, t=l,...,T (2.52a) (2.52b)
A=
A-i + 6
(2-52c)
1-5
e tambm ju, = ju,-i + pt-\ + rito < = > fXt - /4_i = 5 M + ]t o o ( 1 - ) / / , = /?, i + ^ o " 1-5 1-5
o ( l - 5 ) / / f = #_, + /;,
Como 5,_i =
f
' YTE+r1'^
T
<//=^i(\-B)2
+- \ 1-5
(2.53)
Substituindo esta ltima em y, - jut + st, vem: v = ^"' 2 + - ^ - + gr ' (1-5) 1-5 o
O(1-5)2V=^1+(1-5)7+(1-5)2>
^ (1 - B)2yt = _, +?jt- rjt_} +et- 2et_x + Bst_, < = > (1 - B)2 y, = et - 2et_, + et_2 +rjt- r]t_x + &_,
Esta ltima expresso representa um processo ARIMA (O, 2, 2) e a forma reduzida do modelo estrutural simples com nvel localmente linear.
30
O modelo dado por: yt = ^ + yt + t, /* = /4-i + )SU + ft A= A-i + + t=\,...,T (2.54a) (2.54b) C2-540) 2 54d
rt=-Z^-/ ^
(- )
E no caso em que a\ > 0 e cr,2. > 0, a equao (2.54b) fica como em (2.53)
Mt
bf-i
:
(1
l-B
<=>
0- -By
7, - 7 , - i+4t-i
(1-z?)2
+ 6-, <=>
com 5(5) = l + 5 + 5 2 +... f l , vem $()# = <, que rudo branco, ou ento Yt - , 1-5* . 0 ~ 5) Como 5(5) = - T - y vem yt = L - o yt = \-B E no modelo y, = jut + yt +firsubstitumos //f e # pelas expresses que determinmos, ficando
* =
=(i-5)7(-(i-5)/7(-,+a-5)^_l+(i-5)3u)/+(i-Jff)2(i-B)fi a qual a forma reduzida do modelo estrutural bsico, que um MA (5+1) (Harvey, 1996). No Anexo II apresentamos de um modo resumido os principais modelos estruturais, suas componentes e a sua forma reduzida.
31
2.4.5. Seleco do Modelo Deparamo-nos agora com o problema de escolher qual o modelo, de entre os analisados, que melhor se ajusta srie. Tal como na Seco 2.3.2. utilizam-se os critrios adequados de seleco de modelos. 2.4.6. Anlise da Componente Residual Aps a seleco do modelo que parece ajustar-se melhor srie dos dados observados, faz-se a anlise dos resduos, como na Seco 2.3.2.. 2.4.7. Modelos em Espao de Estados Na teoria do controlo, a representao de um sistema em espao de estados essencial pois permite que os parmetros dos modelos sejam ajustados de modo recursivo medida que surgem novas observaes. Define-se espao de um sistema como a informao mnima, do passado e do presente, necessria para que o comportamento futuro de um sistema possa ser "traado" com base no presente estado e nas observaes futuras. Assim a propriedade Markoviana o fundamento da representao de um sistema em espao de estados: dado um estado presente, o futuro do sistema independente do passado. Suponhamos que temos um processor, = 1,..., Tcaracterizado por evoluir no tempo e cujos valores futuros pretendemos prever. Seja x, um vector de estados (m x 1), cujas componentes so as variveis de estado, em geral no observveis. Num dado instante /, os valores assumidos por estas variveis definem o estado do processo. A relao entre as observaes, yt, e o vector de estados x, traduzido pela seguinte equao: yt = zixt + dt+et, t=\,...,T (2.55) que se designa por equao das observaes, equao de medida ou equao de "output". Em modelos univariados, zt um vector 1 x m, dt vector 1 x 1 e st o erro com distribuio N(0, o*ht), com ht funo conhecida do tempo.
32
O vector de estados, xt, embora no directamente observvel actualizado ao longo do tempo atravs da equao de transio que o define: Xt = Ttxt.i + Ct + Rt7]t, t = 1,..., T (2.56)
onde Tt uma matriz m x m, Ct um vector m x \, Rt uma matriz m x g (cuja incluso arbitrria) e TJ, um vector g x l . Sendo este ltimo um vector de perturbaes aleatrias no correlacionadas com mdia zero e matriz de covarincia Q,, i.e., E(rjt) = 0 e var(rjt) = Q,. A representao do modelo em espao de estados dada pelas equaes (2.55) e (2.56).
Os modelos estruturais de sries temporais, tal como outros modelos (aps manipulaes algbricas), admitem representao em espao de estados, o que uma vantagem, pois a partir daqui podemos fazer previses atravs do filtro de Kalman. A seguir damos exemplos da representao em espao de estados de alguns modelos estruturais.
a) Nvel Localmente Constante O modelo estrutural simples com nvel localmente constante, como vimos no captulo anterior y, = jut + st, ju, = jut-i + Tj, J se encontra representado em espao de estados com z = 1 e T= 1 e
Xt = JUt = JUt-i + T]t.
t=l,...,T
(2.57a) (2.57b)
b) Nvel Localmente Linear O modelos estrutural simples com nvel localmente linear representa-se, na sua forma habitual, da seguinte maneira: yt = fit + t, fit = jut-i + J3,-I + TJ, t=\,...,T (2.58a) (2.58b)
33
fr=
yt=[\
A-i + 6
0]xt + et,
(2.58c)
=
fit
" r
0
Mt-i
1 fit-x
7,"
li
0 1
(2.59b)
r com^=^]',Z = [l 0] e T ="
Modelo Estrutural Bsico Este modelo representado pelas seguintes equaes
yt = jut + yt + et, Ht = jUt-i + Pt-i + ri, fit = Pt-i + t t=\,...,T
y r, = -Z rt-J+<ot
O modelo estrutural bsico adequado para muitas sries mensais e trimestrais (s = 4). E a componente da sazonalidade para s = 4
3
(2.61)
j=\
A sua representao em espao de estados, com a componente da sazonalidade de perodo s = 4, a seguinte ^ , = [ 1 0 1 0 0]xt + eh t=\,...,T (2.62a)
1 1 0
=
0 0 -1 1 0
0 0 -1 0 1
1 0 0 0
It
t
(2.62b)
0
x. =
Yt
0 0 0
Yt-x Yt-t.
Yt-x + a, 0 Yt-2
Yt-3 .
*t=k
fit
Yt
Yt-x Y,-i\
e Z = [l 0 1 0 o]e T
0 0 0
Modelo Cclico
a) Tendncia Mais Ciclo O modelo cclico com as componentes da tendncia e do ciclo representa-se por
y, = M,+ Vt + t, A = A-i+A-i + fr =
Wt
t=\,...,T ty
sinkc 1 ^ _ , pfcf
A-i +
cos c
^;J
[-sfiiA.
cos 4, y/\
fr*
(2.63d)
Admite a seguinte representao em espao de estados: ys=W 0 1 0]xt + st, t= l, ...5 Tque a equao de medida. A equao de transio em termos matriciais
j",
(2.64a)
A
Vr
1 1 0 1 0 0 0
0 0
pCOSc
0 0 psinc pcosc
Pt-X fit*
i
7r
-r
,
*, *;
Vt-i
(2.64b)
w]_
0 - psinc
yli.
0]e
b) Tendncia Cclica O modelo estrutural com tendncia cclica y, = jut + t, t=\,...,T (2.65a) (2.65b) (2.65c)
COS c STIC
Wt
-sin.
cos A,
(2.65d)
i,
x. =
fit
t *_
fi + t-x
6
*;
(2.66b)
0 - psinXc
yli.
Sendo xt =\/it
1 1 0 1 0 0
J3t y/t
1 0
pcosc
0 0 - psinc
A representao de um modelo em espao de estados permite a aplicao do filtro de Kalman para calcular o estimador do vector de estados no instante t, com base na informao disponvel nesse instante. Ofiltrode Kalman um processo de estimao recursiva ptima, que permite construir as previses dos modelos estruturais (Harvey, 1997). Dadas estimativas iniciais, este permite obter os parmetros do modelo e ajustar essas estimativas sempre que surge uma nova observao, dando uma estimativa do erro em cada actualizao. Os modelos utilizados para previses em sries temporais dividem-se em lineares e no lineares. Segundo Harvey (1993:266) "Qualquer modelo que tem uma forma linear em espao de estados e perturbaes gaussianas certamente linear". Ora, os modelos estruturais, objecto deste nosso estudo, tm todas as caractersticas de modelos lineares. Assim, enquanto nos modelos lineares se utiliza o filtro de Kalman discreto, nos modelos no lineares aplica-se o filtro de Kalman estendido (Welch & Bishop, s/d). Portanto ns s iremos abordar o filtro de Kalman discreto.
O filtro de Kalman discreto aplica-se quando um processo contnuo obtido em intervalos de tempo discretos. Estefiltro definido por um conjunto de equaes, as quais por
36
sua vez se dividem em dois grupos: equaes de previso e equaes de actualizao. As primeiras permitem fazer uma previso inicial (estimativa a priori) para o processo e para o erro, no instante seguinte. O segundo grupo de equaes actualiza as estimativas a priori. Resumidamente, o filtro de Kalman aplica-se da seguinte forma: - A partir da informao inicial das estimativas dos parmetros iniciais e do erro associado, calcula-se a matriz de ganho. - O erro entre a estimativa do parmetro e a observao determinado e multiplicado pela matriz de ganho para actualizar os parmetros e a covarincia do erro estimados. - Estas actualizaes so depois usadas para se obter informao inicial e segue-se todo o procedimento descrito para actualizar, os parmetros e o erro, no prximo instante. estimativas iniciais dos parmetros e erros
(|
vector dos parmetros actuais, no instante /. vector da estimativa actual dos parmetros no instante anterior actualizao. vector da estimativa do parmetro no instante t + 1. matriz da covarincia do erro dos parmetros actuais.
t\t-i t+i\t
p
1
flf-1
-*
Yt Zt stst'
-* -* -
vector contendo as observaes. matriz (no contendo rudo) que d a relao entre x, e yt. matriz que denota o erro nas observaes, que conhecida ou que ter de ser estimada a priori.
Tt Kt
-* ~*
matriz que contm o modelo que relaciona xt com xf+]. matriz de ganho que relaciona a quantidade de influncia do erro entre ;%_i e Yt.
Consideremos o modelo yt = Ztxt+St x, = TjCt-i + R,]t ondes, ~ M(0,<T ht\ com ht funo conhecida do tempo e Rt tambm conhecida. Seja X/+i o processo que pretendemos estimar com as condies iniciais x0=ju0 P(0) = Po e Yt o processo das observaes. Suponhamos que inicialmente temos x0 = x0|0, calcular *,,, . Comeamos por calcular a funo de previso a um passo x]|0 = ro^oio
e
,/=l,..., T
(2.67a) (2.67b)
P0 = P0l0 = P1|0
e que pretendemos
depois
calculamos a matriz de ganho K\, que dada por AT, = / ^ Z , ' \ZXPX^ZX '+exef J . De seguida actualizamos a varincia atravs de P\\\ -[Iatravs de xvl = x1|0 + Kx [F, - Z,xl|0 J. No clculo de *2|2, tal como acima, comeamos por obter x2|] = T} x,,, e a covarincia do erro Au = TXP^TX+R2R2' E depois calculamos a matriz de ganho K2 = P2nZ2 '[Z2P2|1Z2 '+e2s2 'J* para podermos actualizar o estado ^ u , e temos: x2[2 = x2|] + K2 [72 - Z2x2,, J, que a estimativa actualizada. Por fim actualiza-se a covarincia do erro com: P2\i = [I- K2Z2]P2\iEstas duas ltimas actualizaes so depois as estimativas iniciais para a estimativa no instante seguinte e assim sucessivamente para as restantes estimativas. Um possvel esquema ilustrativo do processo de actualizao atravs do filtro de Kalman encontra-se na Figura 2.3. K\Z{\Pi$ e finalmente actualizamos a estimativa
38
Estimativas Iniciais
x
t\t-\
"t\t-i
Equaes de Actualizao Equaes de Previso (1) Predio do Estado (1) Clculo do Ganho de Kalman
x
(2) P
=T x
(2)
x
t\t-\
^t[^t
~^txt\t-\\
Se o modelo se encontra na forma (2.67), o predictor a m passos para o processo das observaes Yt YT+mT = Z' xT+m[T =Z'TmxT, (l-a)100% para YT+m um tipo fr+m|r m = ! 2,... e um intervalo de confiana a
t<?[d2)(pQM$T^Tf.
39
40
Existem vrias modas. E apresentada a de menor valor. Tabela 3.1- Estatsticas resumo da srie Adultos
b) Histograma Tal como se pode observar na Figura 3.1, a srie no se afasta muito da distribuio normal, apresenta uma certa assimetria positiva e a curva tem um aspecto leptocrtico.
41
SM. Cev = 328,32 Mean =836 N = 208,00 100 200 300 400 500 600 700 800 900 1100 1300 1500 1000 1200 1400 1600
ADULTOS
c) Cronograma Na Figura 3.2 encontram-se representados os valores da srie Adultos de 1 de Janeiro de 1995 a 31 de Dezembro de 1998.
2000
1000
O
3
Q <
1 12
23 34
45 56
67 78
89 100
111 122
133 144
155 166
177 188
199
Semanas
Como se pode observar na Figura 3.2, a variabilidade no parece sofrer alteraes com o nvel da srie, o que um sinal de homocedasticidade. Fomos no entanto verificar se era preciso estabilizar a srie atravs de vrias transformaes de Box-Cox, e conclumos que . 1, pelo que no foi necessrio aplicar qualquer transformao.
42
No entanto a srie parece evoluir em torno de uma tendncia linear, acompanhada de um efeito sazonal, sendo portanto no estacionria
d) Correlograma Nas Figuras 3.3 e 3.4 apresentamos os correlogramas da srie em estudo, constatando que estamos perante uma srie no estacionria. A FAC estimada decresce lentamente para zero, indicando a no estacionaridade e a FACP decai para zero de forma sinusoidal.
e) Periodograma Para examinar as periodicidades que regem a variao dos dados calculmos o periodograma da srie Adultos, cuja representao grfica e anlise se encontra no Anexo IV.
43
A sazonalidade e a tendncia so componentes no observveis, tendo que ser estimadas a partir da informao contida na srie, pelo que o objectivo inicial estimar os ndices sazonais St para dessazonalizar a srie Yt. Deste modo, comeamos por aplicar uma mdia mvel centrada, Mt, de 52 semanas aos dados da nossa srie, para assim obter as estimativas no normalizadas St, da componente sazonal.
K+S
=0,
de observaes anuais), calculamos as estimativas normalizadas St, dos ndices sazonais, com base nas Si No Anexo V encontra-se a tabela destas estimativas, as quais esto representadas na Figura 3.5.
600
1 12
23 34
45 56
67 78
89 100
111 122
133 144
155 166
177 188
199
Semanas
Figura 3.5 - ndices sazonais da srie Adultos Finalmente dessazonalizamos a srie Y, subtraindo a esta os efeitos sazonais. Na Figura 3.6 apresentam-se os grficos da srie dos valores observados Yt e a srie dos valores dessazonalizados YtD.
44
2000
1000
1 12
23 34
45 56
67 78
89
133
155 166
177
199
144
188
Semanas
Figura 3.6 - Srie Adultos original e srie Adultos dessazonalizada Uma vez que as flutuaes sazonais foram amaciadas, verificamos que a srie dessazonalizada apresenta apenas uma tendncia linear crescente. Na perspectiva da decomposio da srie, prosseguimos a anlise das componentes estimando a componente da tendncia Tt = a + bt pelo mtodo dos mnimos quadrados, obtendo como estimativa da componente tendncia f - 473.1033 + 3.473061/A componente residual foi obtida por subtraco de f srie de valores dessazonalizados: t = yt -yt-
3.3.2. Estudo da Componente Residual Nesta seco vamos fazer a anlise dos resduos. Como podemos observar na Figura 3.7 os resduos no tm um comportamento padro.
55 63
71 79
87 95
103 111
119 127
135 143
151 159
167 175
183 191
199 207
Semanas
O modelo estimado ajusta-se bem srie em estudo se os resduos sugerirem que so rudo branco (Murteira, Miiller & Turkman, 1994). Nas Figuras 3.8 e 3.9 esto representados os valores estimados das funes FAC e FACP.
0,80,60,40,2-
M11l . i u . B H . _ --. !i
S o -- J U
-0,2-0,4 -0,6 -0,8-
1 LAG
De facto os valores estimados no saem das bandas de confiana, demonstrando, por isso, um comportamento muito semelhante ao do rudo branco (Figuras 3.8 e 3.9). Para verificarmos se de facto se comportam como um processo de rudo branco, de seguida vamos averiguar se se verificam as hipteses subjacentes: I - Normalidade Para verificar a normalidade dos resduos vamos em primeiro lugar observar o seu histograma e de seguida a sua representao em papel de probabilidades. a) Histograma dos Resduos
-3,25 -2,75
-2,25 -1,25 -,25 ,75 1,75 2,75 -1,75 -,75 ,25 1,25 2,25
RESDUOS
46
A forma deste histograma sugere uma distribuio aproximadamente Gaussiana com resduos standartizados. b) Representao em Papel de Probabilidades Para concluirmos da normalidade dos resduos, estes foram representados em papel de probabilidades. Normal Q-Q Plot of RESDUOS
Observed Value
Figura 3.11- Representao em papel de probabilidades da componente residual Os pontos do grfico seguem praticamente a linha recta (notando-se apenas um afastamento nas caudas), sugerindo que seguem uma distribuio normal. II - Varincia Constante No evidente que exista violao desta hiptese, pois os resduos apresentam-se com um comportamento aleatrio, no seguindo nenhum padro (Figura 3.12).
Til
off
D a
go
J%aP%
1 i
o 9 tf o o o
tar
u
rJ
nu
a
n
4,
n
S , :
CO
o Q -3
CO
ce -4
200
400
600
800
1000
1200
1400
1600
FIT
HI - Independncia Na prtica, violaes desta hiptese so muito difceis de distinguir graficamente Assrm, uma forma de analisar esta hiptese voltarmos a olhar para a Figura 3.12 Como no temos evidncia do tipo de resduos positivos se seguirem a resduos positivos e resduos negafvos se seguirem a resduos negativos, ento no nos parece que esta hiptese seja violada.
Os testes (descritos no Anexo I) efectuados aos resduos levam no rejeio das tapoteses de gaussianidade e independncia. Assim a srie completamente explicada pelo modelo yt = 473,1 + 3,471 + Sc +et. Teste Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Rank Valores 23.18
24.27
I Hiptese a Testar ^20 Os resduos so ^20 Observaes #(137.33; 6.052) Gaussianas 2 #(10764; 1505.26 ) i.i.d.
Distribuio
Tentmos ajustar srie dos dados um modelo ARMA, como tal seguimos a metodologia de Box-Jenkins apresentada na Figura 2.1 Deste modo, numa primeira fase tentmos identificar o modelo. 3.4.1. Identificao do Modelo Para neutralizar a tendncia diferencimos a srie observada, aplicando o operador diferena, com d= 1: Xt=Vrt = Yt-YtA 3.13. De facto, diferenciando a srie conseguimos estacion-la como se pode ver na Figura
48
1000
IS
-1000
2
13
24 35
46 57
68 79
90
134 145
156 167
178 189
200
Sequence number
Nas Figuras 3.14 e 3.15 apresentamos os grficos da FAC e FACP da srie diferenciada.
1 0,8 0l6 0,4 O 0,2 < 0
1 0,8 0,6 0,4 0,2
-0,2 -0,4 -0,6 -0,8 -1
0.
U"U
n D
- R n
LA3
|-| -
|i"
..1 .
S"
LAG
Os grficos da FAC e da FACP da srie diferenciada sugeriam vrios modelos ARMA. Fomos ento testar vrios modelos ARMA, cujo resumo da anlise apresentamos no Anexo VI, concluindo que o mais adequado parece ser um AR (3).
2B2-$^){\-B)yt
= et
Estimmos os parmetros pelo mtodo da mxima verosimilhana, e os valores encontrados so os que figuram na Tabela 3.3.
49
Parmetro
Estimativa
-0.5277295 -0.3474348 -0.3307658
Desvio do Erro
0.0660738 0.0718723 0.0664675 -8.0130862 -4.8608065 -5.0349918
Tabela 3.3 - Estudo dos parmetros Pela matriz de correlaes vemos que os parmetros esto pouco correlacionados, o que sugere a razovel qualidade do modelo (Murteira, Muller & Turkman, 1994).
ARI ARI AR2 AR3 1,0000000 ,4311042 ,1981055 AR2 ,4311042 1,0000000 ,4336456 AR3 ,1981055 ,4336456 1,0000000
Tabela 3.4 - Matriz de correlaes dos parmetros Ento o modelo estimado (l+0,5277JB+0,347452+0,3308JB3)(l-5)>'f = e,
Esta a segunda sub-etapa da segunda fase, na qual vamos verificar as hipteses sobre os resduos.
Avaliao da Qualidade do Ajustamento Pela anlise visual do cronograma dos resduos, Figura 3.16, conclumos que estes no revelam padres de comoortamento.
3l
hl!jt
UjL_iJ " r ni i U
M
Si fi 1 , I
: /' , ( m ':n ;'t M , f i a >(
55 63
71 79
87 95
103 111
119 127
135 143
151 159
167 175
183 191
199 207
Semanas
Nas Figuras 3.17 e 3.18, temos representadas a FAC e a FACP e verificamos que so compatveis com as do rudo branco.
1 0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 -0,8 -1
"
n -
. -
m . .
LAG
Mas para validar esta afirmao temos de constatar se de facto so uma sequncia de variveis aleatrias independentes e identicamente distribudas com mdia prxima de zero e varincia constante. I - Normalidade a) Histograma dos Resduos
RESDUOS
O histograma dos resduos revela um comportamento destes muito prximo da distribuio Gaussiana (Figura 3.19). b) Representao em Papel de Probabilidades Na Figura 3.20 temos a representao dos resduos em papel de probabilidades na qual, confirmando o que j tnhamos dito anteriormente, podemos observar que seguem de perto a linha recta, o que sugere que seguem uma distribuio Gaussiana.
51
2'
(11
3 m
>
m
f- -1
2.
T>
m
o d) UJ
-^!
-3
-3 -2 -1
ft
Observed Value
Figura 3.20 - Representao em Papel de Probabilidades dos resduos II - Varincia Constante Com base na representao dos resduos do modelo estimado versus os valores estimados, podemos identificar claras violaes da hiptese da varincia constante.
3-
?
a
a
D o D a
1 '
a n a 13
ai
o o o a a -1 r;.t D DQ Da 0 a-1
n%
cP
a a a
n , aa
&
D D a o
n a
o "
D
1
0-
8 o a" o
u#
D D o a a a D Cl D
n * dn
u
n D o n o n
'V , v D ti !
G a
L1
%
o a
-1
B
a
o
O
-2
n
o
W
LU
c e
-3 200
400
600
800
1000
1200
1400
1600
Figura 3.21 - Resduos vs. valores estimados No nosso caso, de acordo com a Figura 3.21, no evidente que haja heterocedasticidade, pois no existe nenhum tipo de padro no seu aspecto. III - Independncia Finalmente temos que verificar se os resduos so independentes e pela Figura 3.21 observamos que de facto tm um comportamento aleatrio, no revelando falta de independncia.
52
Parafinalizara anlise dos resduos temos os valores obtidos, com o ITSM, para os vrios testes na Tabela 3.5.
Teste Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Teste Rank Valores 23.30 31.94 128 10224 Distribuio
Z20 Z20
Ordem do Modelo com AICC Mnimo = 0 Tabela 3.5 - Testes efectuados aos Resduos Conclumos que os valores obtidos levam no rejeio da hiptese nula.
Visando ajustar um modelo estrutural srie Adultos, a seleco das componentes a incluir no modelo baseada nas caractersticas observveis da srie. Uma vez que, tal como j tnhamos visto, a srie apresenta tendncia e sazonalidade, ento fomos testar alguns modelos que inclussem estas componentes de previso, dos quais o modelo estrutural bsico (MEB) com sazonalidade trigonomtrica foi o que apresentou melhores resultados (Anexo VII).
3.5.1. Estimao das Componentes Dado que este modelo j foi definido na Seco 3.2., de seguida apenas apresentamos as estimativas significativas das componentes (Tabela 3.6).
Ht
1192.0 -54.412
fit
3.3624
39.751
90.779
^45
35.073 -39.457
Ta
-50.855
Ti*
43.693
Tu
34.575
ras
-33.464
64.391
-43.414
Tabela 3.6 - Componentes do MEB Como podemos observar na Tabela 3.6, e devido ao facto de termos utilizado a sazonalidade trigonomtrica, obtivemos poucos coeficientes sazonais, o que corrobora a afirmao de Andrews (1994:130): "The primary advantage of trigonometric seasonality is that, in some cases, the higher-orderfrequenciesmay be removed, resulting in fewer seasonal coefficients. This could be particulary useful when modeling Weekly or daily data"
53
Ainda dando relevo a esta afirmao, realamos que o MEB com sazonalidade muda apresentou 33 coeficientes sazonais, ou seja, mais do dobro do que com a sazonalidade trigonomtrica.
atravs da anlise dos resduos que verificamos se o modelo estimado descreve bem a sucesso em estudo. O modelo pode ser considerado adequado se os resduos se apresentarem como rudo branco. Observando o cronograma dos resduos (Figura 3.22) vemos que a sua mdia prxima de zero.
55 63
71 79
87 95
103 111
119 127
135 143
151 159
167 175
183 191
199 207
Semanas
Os valores estimados da FAC e FACP, Figuras 3.23 e 3.24, apresentam caractersticas de rudo branco.
R __n
a 13
DD
o.
0^
D"
UJ
""Il
54
Fizemos outras representaes grficas dos resduos (Anexo VIII), atravs das quais constatmos que estes se afastam ligeiramente da normalidade, no nos parecendo no entanto que extsta heterocedasticidade e que estejam correlacionados. Na Tabela 3.7 apresentamos os resultados obtidos, com o ITSM, para os vrios testes efectuados aos resduos. Os resultados agradam-nos particularmente, pois !evam no rejeio da htptese nula, confirmando que o MEB com s a n i d a d e trigonomtrica o modelo adequado para a srie Adultos. Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Teste Rank Valores 16.69
24.21 i^jbuijfo 1 Hiptese a Tes.aT
Nesta fase do esmdo a comparao dos resultados obtidos pelos trs modelos passa a ser o nosso principal objectivo. Comeamos portanto por avaliar a qualidade do ajustamento de cada um dos modelos, utilizando para tal o desvio padro da srie residual (Mailer ,997) Deste modo, apesar de os trs modelos se ajustarem bem srie Adultos, verificamos que o que apresenta melhores resultados, em termos de desvio padro da srie residua, o modelo de decomposio (Tabela 3.8). Modelo Decomposio
MEB ARBVIA Tabela 3.8 - Desvio padro da componente residual
Passando agora anlise grfica do ajustamento dos vrios modelos, desde a 3' semana de 1996 at 52" semana de 1998, comeamos pelo modelo de Decomposio Podemos observar na Figura 3.25 que apesar de o modelo de decomposio no apresentar um mau ajustamento, mesmo assim verificamos que em alguns picos a aderncia fraca.
55
ADULTOS Holt-Winters 55 63 71 79 87 95 103 119 135 151 167 183 199 207 111 127 143 159 175 191
Semanas
Por seu lado, o MEB (Figura 3.26) tambm apresenta um ajustamento razovel srie Adultos, embora no to bom quanto o modelo anterior.
55 63
71 79
87 95
103
119
135
151
167
111
127
143
159
175
Semanas
Por ltimo, no que diz respeito ao modelo ARIMA, verificamos que este o que apresenta maiores dificuldades em reproduzir as observaes, como se pode constatar na Figura 3.27.
56
ADULTOS A RIMA 55 63 71 79 87 95 103 119 135 151 167 159 183 199 207 111 127 143 175 191
Semanas
Figura 3.27 - Srie Adultos e valores ajustados pelo modelo Arima At aqui vimos o ajustamento dos vrios modelos srie Adultos em termos do seu passado, mas o mais interessa no nosso estudo o comportamento dos modelos em termos futuros. Pois nem sempre o modelo que melhor se ajusta ao conjunto das observaes o que produz as melhores previses.
3.7. Previso
Nesta Seco do nosso estudo apresentamos as previses que obtivemos com os trs modelos para as primeiras 17 semanas de 1999 (as primeiras subsequentes s da nossa srie), as quais apresentamos na Tabela 3.9.
Semanas 209 210 211 212 213 214 215 216 217 218 219 Valores Observados 1203 979 868 1072 821 850 866 978 1057 998 818 Decomp. 1157 859 863 1055 833 909 910 1159 1252 1072 948 MEB 1207 986 873 1081 859 894 919 1043 1132 1076 906 Previses ARIMA 220 221 222 223 224 225 1068 1330 1348 1233 1205 1253 1204 1207 1404 1380 1252 1376 1147 1378 1419 1300 1310 1343
926 891 882 850 889 890 894 885 895 899 903 903 908 911 915 917 920
Tabela 3.9 - Valores observados e previstos para a srie Adultos Para podermos avaliar rigorosamente a qualidade das previses e saber a credibilidade que lhes podemos conferir, importa determinar o erro quadrtico mdio (Makridakis, 1 17 Wheelwright & Hyndman, 1998): EQM = ]T e] e como se pode ver na Tabela 3.10 o MEB 17 =i o modelo que apresenta melhores previses. Modelo EQM Holt-Winters 11228.4 MEB 3941.5 ARIMA 52001.6 57
Nas Figuras 3.28, 3.29 e 3.30 podemos ver isoladamente as previses e os intervalos de previso de cada um dos modelos para a srie Adultos.
2000
___.-----
1000
\ \ /
/>
KJf x<J/ \7
213 215 214 216 217 218 219 220 221 222 223 224 225
"*v
X.
209 210
211 212
Semanas Figura 3.28 - Srie Adultos, previses e intervalos de previso do modelo de Decomposio
1600
1400
1200
1000
ADULTOS Mffl
800 Lim Inferior 600 209 210 Lim Superior 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225
Semanas Figura 3.29 - Srie Adultos, previses e intervalos de previso obtidas pelo modelo MEB
58
14ULT
1300' 1200-
\ \ v
\
11001000900800
\ \ \
A
211 212
Is
i~
215 214 216
-'
J
i
ADULTOS A RIMA
213
217 218
219 220
221 222
223 224
225
Semanas
Para melhor podermos comparar as previses obtidas pelos trs modelos representmo-las conjuntamente na Figura 3.31. Como j havamos observado, o modelo que melhor se ajusta srie Adultos o MEB, e o modelo que mais se afasta o modelo ARIMA (3, 1, 0).
209 210
211 212
213 214
215 216
217 218
219 220
221 222
223 224
225
Semanas
Constatamos que as previses do MEB e as obtidas pelo mtodo Holt-Winters so semelhantes, mas nas duas ltimas semanas as previses deste ltimo so um pouco melhores do que as do MEB. Relativamente aos outros dois, o modelo ARIMA o modelo que oferece as previses menos ajustadas.
59
Por observao da Figura 3.31 vemos que nas primeiras cinco semanas as previses do mtodo Holt-Winters e do MEB so praticamente coincidentes umas com as outras e com a srie Adultos. A partir da 7a semana at 15a, o MEB o que melhor acompanha o comportamento da srie Adultos. Deste modo, em termos globais, consideramos que o modelo que melhores previses nos fornece o MEB.
3.8. Concluso
Neste trabalho estudmos trs mtodos diferentes de anlise de sries temporais: decomposio clssica, modelos estruturais e Box-Jenkins. As duas primeiras so muito semelhantes, no sentido em que ambas decompem as sries nas componentes que as compem: tendncia, sazonalidade, ciclo e rudo. Nos modelos estruturais estas componentes so formalizadas como processos estocisticos. O que ptimo do ponto de vista da previso, pois permite a representao destes modelos em espao de estados, que por sua vez permite a utilizao do filtro de Kalman. Estefiltro um processo de estimao recursivo ptimo que actualiza as estimativas medida que vo surgindo novai observaes. Na decomposio clssica tambm se definem e se constrem as componentes, que so no observveis, permitindo uma certa sistematizao do trabalho. Mas a estimao das componentes est sujeita a alguma arbitrariedade dos mtodos a seguir, justificando-se a sua aplicao pela presena da componente residual com comportamento de rudo branco. Da que teoricamente este mtodo esteja menos explicado que na prtica. A aplicao da metodologia Box-Jenkins apresenta mais rigor que a decomposio clssica, mas menos facilidade em ser executada e interpretada. O rigor da sua aplicao advm do facto de ser sustentada por uma famlia de modelos tericos eventualmente capazes de reproduzir o comportamento da srie. A sua execuo dificultada por exigir algumas condies (e.g., estacionaridade) da srie temporal antes da sua modelizao, e porque o modelo que se obtm no oferece a possibilidade de inferncia imediata das caractersticas da srie. Na partefinaldeste trabalho modelmos a srie do nmero semanal de adultos alojados num hotel, utilizando para tal as trs metodologias referidas. Verificou-se que o modelo de decomposio clssica foi o que apresentou melhor ajustamento srie em termos de varincia residual.
60
Obtivemos as previses para as primeiras dezassete semanas subsequentes s nossas observaes, com o intuito de observar qual o mtodo que conseguia obter melhores resultados Constatmos que o modelo estrutural bsico (MEB) foi o que forneceu melhores previses. Pelo mtodo Holt-Winters (na sequncia da decomposio clssica da srie) tambm se obtiveram boas previses, no tanto quanto pelos modelos estruturais, mas bastante melhores do que as obtidas com o modelo ARIMA (utilizando o mtodo Box-Jenkins). Este ltimo revelou uma quase total falta de aderncia ao comportamento da srie. Como projecto para trabalho futuro serie interessante analisar uma srie semelhante mas com observaes dirias, em que fossem considerados os feriados, osfns-de-semanae outras datas relevantes, pois para a rea da hotelaria, caso se conseguissem resultados animadores, seria um trabalho de grande interesse. Julgamos que considerando estes aspectos num futuro estudo, o trabalho se revelaria muito mais conclusivo e valioso.
61
Bibliografia
Andrews, R L. (,994). Forecasting Performance of S.ruchna, Time Series Models. Journal of Business & Economic Statistics, 12 (1), 129-133 Box, G E. P. & Cox, D. R. (,964). An Analysis of Tnmsfonnarion. Journal of Roya, Statistical Society, Series B, (26), 211 -252. Box, G. E. P., Jemdns, G . M .
& Reinse ,_ Q c
neoiy
amjMeihods
New
York
Springer-Verlag. Brockwe,,, P. ,
& D a v i s , R . A. ( 1 9 9 6 )
fc
York. Springer. Harvey, A. C. (,993). Ti Series Models. New York.- Harvester Wheatsheaf. Harvey, A. C. (,996). Forecasts Saurai Time Series Models and ,ne Kalman Filler.
Cambridge: Cambridge University Press. Hatvey, A. C. (,997). Trends, Cycles and Autoregressions. Vie Economic Journal (,07) h 192-201. ' Makridakis, S, Wheelwright, S. C. * Hyndman, R. ,
(I 998).
Applications. New York: John Wiley & Sons, Inc.. Muer, D. (,997). Como Lidar com as Mudanas de Estruiura em Sries Temporais 7 Textos de Apoio n 10. CEMAPRE. Murteira, B. , F., Maer, D. A. * Tnrkman, Cronolgicas. Lisboa: McGraw-Hill. Welch, G. & Bishop, G.(s/d). An introduction to the Kalman Filter. http://www.cs.unc.edu/~welch/kalman^alman.html (17 Mai. 1999).
62
K. F. (I994)
Anexo I
Testes estatsticos efectuados aos resduos (Brockwell & Davis, 1994 e 1991) Teste de Ljung-Box Portmanteau - Neste teste utilizada a estatstica
A
{n-k)
onde pRk a autocorrelao amostrai dos resduos, no lag k e h deve ser da ordem de a, se o valor observado de O for maior do que o quantil (1-a) da distribuio * ' ^ onde n a dimenso da amostra. Este teste rejeita o modelo ARMA (p, q) proposto, no nvel
-p-q.
Teste de McLeod-Li Portmanteau - Apesar de se basear na mesma estatstica que o teste anterior, este teste em vez de utilizar as autocorrelaes amostrais utiliza as autocorrelaes amostrais dos quadrados dos resduos P^,
h
obtendo-se:
Q =n(n + 2)
2 RRk
1
(ll-k)
A hiptese dos resduos serem normais e i.i.d. ser rejeitada no nvel a, se o valor deQ for maior do que o quantil (l-a) da distribuio xl
-p-q.
Teste baseado nos Pontos de Viragem" (Turning Points) - A estatstica T utilizada no presente teste o nmero de pontos de viragem na sucesso dos resduos. Mostra-se que para uma sucesso i.i.d., T assimptoticamente normal com mdia juT = 2(,;-2)/2 e varincia a2T= (16W-29)/90. A hiptese dos resduos serem uma sucesso de observaes i.i.d. ento rejeitada se \T-^l<yT>0Uaa onde 0^2 o quantil (i-a/2 ) da distribuio standard.
63
Teste Rank - Este um teste muito til para detectar alguma tendncia linear nos resduos. Seja P o nmero de pares (ij) tais que/?, > R,
ej
i.i.d., ento a mdia de P & = n(n-l)/4, a varincia a] = n(n - l)(2n+5)/8 e P assimptoticamente normal. A hiptese dos resduos serem uma sucesso de observaes i.i.d. consequentemente rejeitada se \P-^P\lai>0Uaa onde 0^2.
Modelo AR com AICC mnimo - Se os resduos forem compatveis com uma sequncia de observaes i.i.d., ento a autorregresso com AICC mnimo ajustvel aos resduos dever ter ordem p = 0. No ITSM (PEST) atravs das equaes de Yule-Walker so calculados os valores de AICC para modelos AR de ordens 0, 1, ..., 26 ajustados aos resduos, dando-nos depois a ordem p do modelo com AICC mnimo. Um valor dep > 0 sugere a existncia de alguma correlaes nos resduos, contradizendo a hiptese dos resduos serem observaes de um rudo branco.
64
<
es JO
TS
"5 s
+
m O
I s)
ta
o (S
<
cN I
I
&5
+ <
8. s
H
CO
u u
* *
c
o m
TJ
os
03
2q
U o
+
(/]
o o
SB eu
5 I
+ +
2 So
as
i
O CN
tu
a o C
a O
=3
5?
8. s
o O
VI
+
T , T
VI
O c -es
o o a o
CJ -CJ
o u
V VI
a o '5
II
I
en
s
o
s s
t
t?
CJ O es
s;
CJ
GO s s>
_c "C 0. I
+
+ n
E
u o
+ + +
Il II
u
o
8 s
i
o o 73
i
+ o
+
+
-
s
o
II
n u
+
T Il
<
e '5
u
*1
+ o n E
*1
+ o n E *8
o -w
*l
0. es
1
es
a
an
*8
. . 8 c
o
+ 7
n n E
w+ I
- s- o
S
o
n s *8
5 S S
H
II
1t
CJ
'5 rs a II
K CJ
a O o '1?
+
<*v
E
CJ
o et
i^
.-
o CJ o
T3
^ _
i
a o
O CJ
Il |
es o
-03 O O
il
o
es
c
a o 73
es
-o
-O
es
e
an Ci O
es
O
/5
CJ 25
>
<IJ TJ
o o
U S '5 c
VI
3 VI
|
g
a o
o .a
CJ
o U
e e a.
I
to
_o
U
? eu
C O c>
o les a o 73
G
s
r>
es IT)
I
H5
J3 V5
C/J
5
~~ es C3 T 3
CJ
a
c o
.2 S
o u L> J2 73 es a o
CD O
es o
es
<>
O *3
t T3 O
e E
S o , o. u i
S, 73 -S S
'S3
CJ
c s
1 * 1
C cl) T3 C
es
o o
5 o .S u
CJ
H
W
65
Anexo III
Exemplo de Aplicao do Filtro de Kalman Consideremos o modelo em espao de estados yt=st+wt+et st = 0.6s,_,+0.5w,_,+wf wt =0.3M+0.8w,_,+v, onde st ~ N(0.1), ut o N(0, 2), v, n N(0, 3) e cov (ut, vt) = 0.7. Dispomos das observaes^,,y2, ...,yt_x e pretendemos obter j)r+1. Como o modelo 4.3.1 se encontra representado em espaos de estados, temos que
Z=
T=
R=
" 2 0.7"
0.7 3
Previso Atravs do filtro de Kalman temos 0.6 O.5T1O 0.3 0.8 5 8.5 7
rir-i
= 75c
T-\\T-\T+RR'-
=15 5.
T\T
67
Anexo IV
Da anlise da representao grfica da srie (Figura 4.2), constatamos que a srie Adultos apresenta tendncia linear. Ajustmos ento uma tendncia linear srie Adultos, efectuando uma regresso linear simples, em que a varivel independente o tempo, que permitiu obter os resultados sumariados na Tabela A. 2. Estimativas 465,27 3,548 Erro Padro 34,793 0,289 Estatstica / 13,373 12,290 Valor-/? 0,000 0,000
A partir dos resultados obtidos construmos a srie Adultos sem tendncia, cuja representao grfica pode ser analisada na Figura A. 1.
600
400
200
-200
m
" 5
<j -600
-400
1
12
23 34
45 56
67 78
89
133 144
155 166
177 188
199
Esta srie foi posteriormente utilizada para examinar quais as periodicidades, se as houver, que regem a variao dos dados. Para isso calculmos o periodograma da srie Adultos, depois de retirada a tendncia, cuja representao grfica se apresenta na Figura A.2. Como dispomos de 208 observaes, o periodograma consta de 104 ordenadas.
68
5000000
4000000
3000000
2000000
1000000
0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103
Figura A. 2 - Periodograma da srie Adultos sem tendncia Para avaliar a significncia dos picos observados utilizmos os testes de Walker e de Whittle, cujos resultados apresentamos na Tabela A.3. Perodo 52 26 17,33333 10,4 2,166667 4 4,333333 4,727273 5 , 2 3,714286 Frequncia 0,12083 0,241661 0,362491 0,604152 2,899932 1,570796 1,449966 1,329135 1,208305 1,691627 Periodograma 4564622 1954216 770623,1 549706,6 414140,7 376889,7 337759,4 315144,1 303394,5 297577,9
g*
73,96084 0,236232 0,121968 0,099089 0,082863 0,082223 0,080287 0,081451 0,085368 0,091546
Valor-/? 0,000 0,000 0,000 0,003 0,019 0,022 0,029 0,028 0,020 0,011
Tabela A. 3 - Resultados da regresso linear simples Verificamos que a srie apresenta vrias componentes peridicas bastante significativas, sendo algumas delas mltiplas de outras. Destacam-se, no entanto, as correspondentes aos perodos 52, 26, 17 e 10 semanas.
69
Anexo V
s s s s
3 75 29 82,9 42
4 77 30 -69,1 43
5 18 57 23,2 44
6 79 32 102,6 45
7 20 33 156,5 46
S 27 34 -3,5 47
9 25,0 22 35 -57,2 48
70 23 36 122,8 49
77 24 -1,1 37 198,6 50
72 25 35 57
73 -33,3 26 39 52
70
Anexo VI
)
42795,1 42882,5 43090,6 42886,2 41209,6 42205,2 42170,7 40705,8 40235,0 40528,5 40509,6
AIC 2797,3 2798,7 2800,7 2798,8 2794,0 2797,5 2801,3 2792,2 2785,7 2789,2
L
BIC 2803,9 2808,7 2814,1 2808,8 2807,3 2814,2 2821,3 2815,5 2795,7 2805,9 2810,2
Parmetros Significativos* 1 1 2 1 2 3 2 3 3 3 3
2790,2
71
Anexo VII
72
Anexo VIII
Std. Cev = ,96 Mean = ,05 N = 154,00 -2,75 -1,75 -,75 ,25 1,25 2,25 3,25 -2,25 -1,25 -.25 ,75 1,75 2,75 3,75 RESIDUAL
b) Representao em Papel de Probabilidades Uma das formas mais evidentes para averiguar a normalidade dos resduos fazer a representao em papel de probabilidades. Normal Q-Q Plot of RESIDUAL
-3
-2
3'
n
2'
L+l.
M
o a a
a
act
4
a #
no o
D
0.
P a
o a
^ J aU I o
a
KJ
,J
ai o
na
a
r.i
-1 .
a _l
r ft
a
a
D
O a o D a
3
Q W LU
-2-
a a
a
i n
or
-3 200
400
600
800
1000
1200
1400
1600
1800
FIT
74