Sie sind auf Seite 1von 75

Maria Isabel Vaz Pitacas

ESTUDO COMPARATIVO DE MTODOS DE PREVISO


APLICAO SRIE DO NMERO SEMANAL DE ADULTOS ALOJADOS NUM HOTEL

Departamento de Matemtica Aplicada Faculdade de Cincias da Universidade do Porto Dezembro / 1999

Maria Isabel Vaz Pitacas

ESTUDO COMPARATIVO DE MTODOS DE PREVISO APLICAO SRIE DO NMERO SEMANAL DE ADULTOS ALOJADOS NUM HOTEL

Tese submetida Faculdade de Cincias da Universidade do Porto para a obteno do grau de Mestre em Estatstica

Departamento de Matemtica Aplicada Faculdade de Cincias da Universidade do Porto Dezembro / 1999

Dissertao orientada por

Maria Eduarda da Rocha Pinto Augusto da Silva

Professora Auxiliar do Departamento de Matemtica Aplicada da Faculdade de Cincias da Universidade do Porto

Ao meu marido Vtor e minha filha Patrcia

Agradecimentos

Gostaria de comear por agradecer minha orientadora, Professora Doutora Maria Eduarda Silva pelo apoio cientfico dado a este projecto. Os seus conselhos e crticas foram muito construtivos, pois conduziram-me pelas linhas deste trabalho de uma forma mais segura e esclarecida. Aos colegas e amigos que me apoiaram e encorajaram. Ao Instituto Politcnico de Tomar por todo o apoio concedido, principalmente no acesso ao software indispensvel a este trabalho. Ao hotel e em especial ao seu director, que pediu o anonimato, pelo fornecimento incondicional dos dados. A D. Ana Bela Vieira pela dedicao e pacincia que demonstrou nestes meses ao ajudar-me, principalmente com a Patrcia. A me e irm do Vitor por cuidarem da Patrcia. Aos meus pais pelo carinho e apoio que me deram no decorrer deste trabalho. Ao meu marido, Vitor, pelo carinho, compreenso e pacincia incondicionais. A minhafilhapelo seu sorriso.

A todos, o meu muito obrigado.

Resumo

Neste trabalho o nosso objectivo obter previses para as sries temporais do nmero semanal de adultos alojados num hotel, para o que utilizmos trs mtodos diferentes, nomeadamente: previso Holt-Winters, modelos estruturais e modelao Box-Jenkins ARTMA. Conclumos que, embora o melhor ajustamento em termos de varincia residual seja fornecido pelo mtodo de decomposio clssica, as melhores previses so dados pelo Modelo Estrutural Bsico (MEB).

Palavras chave: sries temporais; decomposio clssica; Holt-Winters; modelos estruturais; filtro de Kalman; Box-Jenkins; modelos ARJJVIA

Abstract

Our aim is to obtain predictions for the time series of the weekly occupancy rate of adult customers in an hotel, we use three different methodologies namely Holt-Winters prediction, structural models and Box-Jenkins ARIMA approach. We conclude that although the best fit in terms of residual variance is given by the classical decomposition method, the best predictions are given by the Basic Structural Model (BSM).

Key words: time series; classical decomposition; Holt-Winters; structural models; Kalman filter; Box-Jenkins; ARIMA models

ndice

Dedicatria Agradecimentos Resumo Abstract ndice Captulo 1. Introduo 1.1. Motivao e Estrutura do Trabalho 1.2. Conceitos Fundamentais Captulo 2. Mtodo de Anlise de Sries Temporais 2.1. Introduo 2.2. Mtodo de Decomposio Clssica 2.2.1. Modelo Aditivo 2.2.2. Previso 2.3. Modelao Box-Jenkins 2.3.1. Identificao do Modelo 2.3.2. Estimao e Diagnstico 2.3.3. Previso 2.4. Modelos Estruturais 2.4.1. Modelo Estrutural Simples 2.4.2. Modelo Estrutural Bsico (MEB) 2.4.3. Modelo Cclico 2.4.4. Os Modelos Estruturais na Sua Forma Reduzida 2.4.5. Seleco do modelo 2.4.6. Anlise da Componente Residual 2.4.7. Modelos em Espao de Estados 2.4.8. Filtro de Kalman

3 4 5 5 7 9 9 10 13 13 13 14 17 18 20 21 22 23 24 25 27 28 32 32 32
36

Captulo 3. Modelao do Nmero Semanal de Adultos Alojados num Hotel . . 40 3.1. Apresentao da Srie 3.2. Diagnstico Preliminar dos Dados 3.3. Modelao da Srie Atravs da Decomposio Clssica 3.3.1. Estimao das Componentes 3.3.2. Estudo da Componente Residual 3.4. Modelao Box-Jenkins 3.4.1. Identificao do Modelo 3.4.2. Estimao dos Parmetros 3.4.3. Estudo dos Resduos 3.5. Modelo Estrutural 3.5.1. Estimao das Componentes 3.5.2. Estudo da Componente Residual 3.6. Comparao de Resultados 3.7. Previso 3.8. Concluses Bibliografia Anexo I Anexo II Anexo III Anexo IV Anexo V Anexo VI Anexo VII Anexo VIII 40 41 43 44 . 4 5 4g 48 49 50 53 53 54 55 57 60 62 63 65 66 68 70 71 72 73

Captulo 1. Introduo

1.1. Motivao e Estrutura do Trabalho


Define-se uma srie temporal como um conjunto de observaes associadas a determinado fenmeno aleatrio, efectuadas em perodos sucessivos de tempo e estatisticamente relacionadas. Ao analisar uma srie temporal pretende-se, de uma forma geral, alcanar dois objectivos, os quais se encontram fortemente relacionados. O primeiro, a modelao, consiste em encontrar um modelo que tenha em conta as relaes existentes entre as observaes, permitindo a descrio da srie temporal. O segundo, diz respeito previso de valores futuros, pois como observa Murteira (1994:5) " a prpria existncia do tempo que leva as pessoas a fazer previses e a tentar antecipar a evoluo no futuro das sucesses que estudam". Um dos mtodos possveis para a anlise e previso das sries temporais a decomposio clssica da srie em vrias componentes bsicas no directamente observveis. So elas: a tendncia, ciclo, sazonalidade e erro, que por no serem observveis, podero ser estimadas a partir da informao contida nos dados que constituem a srie. Quando estuda determinada srie temporal, o analista confronta-se, por vezes, com o problema da no estacionaridade. A metodologia desenvolvida por Box e Jenkins, baseia-se na ideia de que tais sries podem tornar-se estacionrias atravs de operaes de diferenciao. Este mtodo segue essencialmente trs etapas: na primeira faz-se a escolha do modelo ARMA, na segunda etapa estimam-se os parmetros do modelo e na terceira diagnostica-se o comportamento dos resduos. Na terceira etapa, se o modelo se apresentar como satisfatrio, este usado na previso de valores futuros. Caso no se apresente satisfatrio voltamos primeira etapa. A metodologia de Box e Jenkins, relativamente abordagem decomposicionista, apresenta rigor e controlo, mas no tem uma interpretao e execuo bvias.
9

Para ultrapassar as dificuldades apresentadas nas duas metodologias anteriores usam-se os modelos estruturais de sries temporais, desenvolvidos por Harvey (1996), que aliam a facilidade de interpretao ao rigor formal e controlo estatstico. Estes modelos so formulados em termos das componentes tradicionais sendo cada uma destas formalizada como um processo estocstico. Neste trabalho pretende-se modelar e obter previses para a srie do nmero semanal de adultos alojados num hotel aplicando as trs metodologias atrs referidas. Iniciamos o nosso estudo tentando ajustar srie das observaes um modelo de decomposio, prosseguimos com um modelo estrutural e conclumos com o ajustamento de um modelo ARTMA. Os trs melhores modelos obtidos com as diferentes metodologias sero depois comparados quer em termos de ajustamento, quer em termos de previso. Assim, no Captulo 2 comeamos por descrever a decomposio clssica de uma srie temporal e apresentamos o mtodo utilizado na previso. De seguida descrevemos a metodologia de Box-Jenkins, que se divide nas fases: (i) identificao, (ii) estimao e diagnstico e (iii) previso. E por ltimo centramo-nos nos principais modelos estruturais, na sua representao em espao de estados e no filtro de Kalman. Finalmente, no Captulo 3 aplicaremos as diferentes metodologias estudadas na construo de modelos para o nmero semanal de adultos alojados num hotel. Na sequncia dos modelos construdos faremos as previses para esta srie temporal.

1.2. Conceitos Fundamentais


Sendo o objectivo desta introduo abordar alguns conceitos bsicos relacionados com a anlise de sries temporais, vamos de seguida definir os conceitos de processo estocstico, srie temporal, estacionaridade, funo autocovarincia, funo de autocorrelao, funo de autocorrelao parcial e rudo branco. Seja (Z2, % 9) um espao de probabilidades e T um conjunto arbitrrio, define-se processo estocstico como sendo uma funo Y(t, a), definida em TxQ que para cada teT uma varivel aleatria. E representa-se por {Y(t, co): ael, teT}. Para cada m fixo, Y(t, ah) uma realizao ou trajectria do processo. Uma srie temporal, ou sucesso cronolgica, define-se como um conjunto de observaesytl,yt2,-,y,v feitas em pontos ou perodos h,t2,...,tN, e representa-se por
10

{Yt, t = 1,2, ..., N). A srie temporal tambm pode ser registada em tempo contnuo, e neste casorepresenta-sepor {Y(t\ 0<t<T}. Uma srie temporal apenas uma das realizaes de determinado processo estocstico; no entanto, o termo srie temporal empregue para designar a realizao observada do processo estocstico. O processo {Yt} diz-se estritamente estacionrio sse a distribuio^ conjunta de Yh %, YtJ igual distribuio conjunta de \Y,l+k,Yh+k,...,Ytn+k)para todo o w-plo (tu 2, ...,)etodoo*,ouseja, F, p / j _ J r , , ^ , . . . , ^ ^ , ^ ^+k
(YX,Y2,...,YJ

em todos OS

pontos (yi, y2,..., y) e em que F ( ) representa a funo distribuio conjunta de(7I(, Yh,..., Yt ) De uma forma resumida significa que um processo estritamente estacionrio goza da propriedade de que a distribuio de um qualquer conjunto de margens se mantm a mesma quando estas so sujeitas a uma translao no tempo. Na prtica esta propriedade no se verifica com facilidade, recorrendo-se por isso estacionaridade fraca. Um processo diz-se fracamente estacionrio at ordem m, ou simplesmente estacionrio, se os vectores -dimensionais (^, Ytt..., Yt) e {Yh+k, Yh+k, Yt^+k) possurem momentos conjuntos at m-sima ordem e esses momentos forem iguais. O processo {Yt, teT) diz-se fracamente estacionrio de Ia ordem se E(y,) = /x, Vf e fracamente estacionrio de 2" ordem ou para a covarincia sse for tal, que para todo o /: 1) E(Yt) = ju, constante, V, 2) E\Yt2)= ju2, constante, V, ecomoft)=JE(r2)-2ft)=^-^=cT2 3) E(Y,YS) = E[Y,YS]-/?, i.e., funo apenas da diferena t-s. Seja { Yt, teT) um processo estacionrio de 2a ordem em que E(Yt) = jue var(Yt) = o2, t= 0, 1, 2,... a funo de autocovarincia dada por yk = E{(Yr-fi)( Yt+k-n)} = cov (Yh Yt+k). A funo de autocorrelao (FAC) dada por pk = Y. = corr(Yt, Yt+k) onde para cada k a funo pk mede a correlao entre pares de valores do processo separados por um intervalo k. f t{YfY\YM-f) O estimador da FAC dado por = ~r~ = , k = 0,1,... onde Y
f=i

1 a mdia amostrai Y = Y Y.. A estimao da FAC efectua-se para k > 0 As funes de autocovarincia e autocorrelao gozam das propriedades:
11

l)KO) = var(r,);

p,= \ ^{x1^1)

2) |#| < y(0) e em consequncia |/ty} | < 1 em virtude da desigualdade de CauchySchwarz: \E(XY) < 3) ft = /-* ; A * A*

4) As funes /* e pst so semidefinidas positivas. A funo de autocorrelao partial (FACP) dada por <f>u = corr(Yt,'Yt+k), retirando os efeitos de Yt e Yt*~\. Para cada k mede a correlao entre Yt e W, depois de eliminar o efeito produzido pelas variveis Yt+\,..., Yt+k-i. O clculo do estimador da FACP feito por meio recursivo partindo de :
k-\

, = e utilizando t t =

j^ -Zh-ijpj
7=1

em que } k J = ik.lJ

-KKu-j*

y = l,2,...,*-l. A representao grfica da FAC e da FACP designam-se, respectivamente, por correlograma e correlograma parcial estimados, pois na prtica geralmente apenas dispomos de uma realizao do processo. O processo {et} constitui rudo branco se for formado por uma sucesso de variveis aleatrias independentes e identicamente distribudas com mdia constante E(e,) = //, geralmente assumida como sendo zero, var(et) = a2 e covarincia yk = 0 para k * 0, ou seja, um processo estacionrio de 2a ordem l, k = 0 \a2, * = 0 com Pk-\n , n e Yk -\ [0, Ar^O [o , k>\ Quando a amostra significativamente grande, assume-se que A- tem distribuio /V(0, l/n). Os valores (95%), tanto da FAC como da FACP, devero situar-se dentro dos limites de confiana: l.96/-Jn.

12

Captulo 2. Mtodo de Anlise de Sries Temporais

2.1. Introduo

Neste captulo faremos uma abordagem aos trs mtodos de anlise de sries temporais utilizados no estudo da srie das observaes. Comeamos pelo mtodo de decomposio clssica, prosseguimos com a modelao Box-Jenkins e finalizamos com os modelos estruturais.

2.2. Mtodo de Decomposio Clssica


A decomposio das sries temporais comeou a ser estudada nos finais do sculo passado e desenvolveu-se nos princpios deste sculo. Este foi um dos primeiros mtodos utilizados na anlise de sries temporais (Makridakis, Wheelwright & Hyndman, 1998). Este mtodo consiste numa descrio matemtica dos movimentos presentes nas sries, os quais aps serem identificados, podem ser utilizados para facilitar a interpretao e projeco da srie temporal. Os movimentos, ou componentes, que se distinguem nas sries temporais so usualmente classificados em quatro tipos: Tendncia (Tt) - Variao em mdia ou varincia ao longo do tempo, ou ainda, mudana de nvel. Movimentos que se manifestam suavemente e consistentemente durante perodos longos. Componente Sazonal (St) - Representa uma variabilidade peridica em relao tendncia. Componente Cclica ( Q - Esta componente associa-se s fases alternadas de expanso e depresso que afectam a srie, mas no apresenta qualquer periodicidade definida. Os ciclos longos so dificilmente separveis da tendncia. Componente Residual (*?,) - Esta componente representa tudo o que no pode ser atribudo s outras trs componentes.
13

Embora todas as sries temporais contenham a componente residual, as outras trs componentes, que reflectem um certo padro comportamental, podem no estar presentes na sua totalidade. O objectivo da anlise das sries temporais identificar as componentes presentes de modo a identificar as suas causas e prever valores futuros. Ento, sendo y, a srie dos valores observados, yt=Tt,St,Ct,et) a expresso genrica do modelo de decomposio. Este modelo pode ser do tipo aditivo yt = T, + St + C, + et, do tipo multiplicativo yt= Tt St Ct et ou ter uma forma mista yt = Tt S, Ct + et /2.4) *2 3) (2 2) ^2.1)

A opo entre (7.2) e (2.3) baseia-se no tipo de sazonalidade presente, s uma das formas de perspectivar as caractersticas desta passa pela observao do cronograma. Se se observar que com o aumento (ou diminuio) do nvel da tendncia h um aumento (ou diminuio) da amplitude dos movimentos peridicos, ento aconselhvel um modelo do tipo (2.3). Por outro lado, se os movimentos peridicos permanecerem estveis em torno da tendncia, deve-se optar por um modelo aditivo. Por ser a que mais relevncia parece ter para o nosso trabalho, na seco que se segue vamo-nos restringir construo de um modelo de decomposio do tipo aditivo, e dentro deste tipo de modelos consideraremos apenas os que contm na sua estrutura a tendncia, a componente sazonal e, claro, a componente residual.

2.2.1. Modelo Aditivo

Como referimos anteriormente, o modelo aditivo especificado do seguinte modo: yt=Tt + St + et, =l,2,...,
(2 .5)

onde Tt a tendncia, S, a componente sazonal ee ( a componente residual. Nesta perspectiva de anlise do comportamento da srie temporal comea-se oor dessazonalizar a srie com mdias mveis, prossegue-se com a estimao da componente da tendncia efinalmenteestima-se a componente residual.
14

Dessazonalizao com Mdias Mveis Considerando ento que a componente sazonal est presente, o objecto inicial estimar os coeficientes sazonais.
k+S

Admita-se que St = 0, para qualquer inteiro k, sendo S o perodo sazonal. Isto


t=k+\

significa que o valor dos efeitos depressivos compensa o valor dos efeitos expansivos. Os diferentes valores que a funo S, toma, isto , a Sk+U Sk+2 , ..., Sk+s chamamos coeficientes sazonais. A estimao dos coeficientes sazonais compreende duas fases: na primeira estimam-se as suas componentes no normalizadas e na segunda estas so normalizadas. Na primeira fase, o primeiro passo construir um processo de mdias mveis associado yt. Se S por par(1), ento definimos o processo de mdias mveis centrado como:

"n

'

-+^ H

rr

P a r a t - T + 1 - , # - Realce-se que / agora o instante mdio das observaes includas na mdia mvel. Se 7", for constante ou linear, M, considerado um bom estimador do rVel T, da srie, no momento /. Num segundo passo obtemos as estimativas das componentes sazonais e residuais atravs das diferenas

s .

.S/ 2/<+7 2,

(2.6)

s;=yt-Mt)
pois yt-M,=Tt+S,+et-Mt*St+et, t = ~ + l,...,N--

(27)

(2 .8)

Admita-se que, sem perda de generalidade, N = mL, e represente-se / com /' = S(j-\), onde / = 1, 2, ..., S ey = 1, 2, ..., m, com m o nmero de anos de observaes disponveis. Constroem-se para os, anteriormente obtidos, 1 m
5

S* = S*+S(H) as S mdias

< = ; [ 2 X s o - i ) ' ' = 1,2,..., 5

(2.9)

Os S, so as estimativas no normalizadas dos coeficientes sazonais no instante /' de cada ano. Passando segunda fase, as estimativas S, sero normalizadas, para assegurar que 2^ St = 0, V t meiro} tomando ento
(

Se S for mpar as mdias simples j so centradas. 15

Si'l-TlZ] ' = 12,-.J


0

(2-10)

\M

e 5, = St_s,

i>S, onde a estimativa da componente sazonal dada por (2.10). ento definida pela remoo da componente sazonal na (2.ii)

A srie dessazonaiizada y, srie original^,, isto , yt =yi+S{j-l)-si,


= I,...,N

Est feita, portanto, a dessazonalizao por mdias mveis dej>,. Prossegue-se, nesta perspectiva de decomposio, com a estimao da componente de tendncia.

E stimao da Tendncia importante olhar atentamente para o grfico da srie para assim identificar a forma da tendncia a estimar. Pois a tendncia, nas suas abordagens determinsticas ou estocsticas, pode ser (i) constante, (ii) linear ou ter (iii) outras formas (quadrtica, exponencial, logartmica, etc.). Se concluirmos que a tendncia linear, isto , Tt =fa+pit + e, (2.12)

a regresso linear simples uma tcnica que fornece uma boa estimativa da tendncia. Pois fornece estimadores lineares centrados de varincia mnima, atravs do mtodo dos mnimos quadrados. Tambm podemos utilizar a regresso mltipla afimde ajustar, se for esse o caso, uma tendncia do tipo polinomial, ou seja, yt = /3o+fit + ...+/3pf + et (2.13)

Mas nem sempre claro o tipo de tendncia que mais se adequa s observaes. Nesse caso constri-se uma sucesso de mdias mveis associada, em que se substitui cada observao pela mdia da prpria observao com as que lhe esto prximas.

E stimao da Componente Residual Temos vindo a analisar a estimao das componentes de um modelo do tipo aditivo (2.5), nesta altura falta estimar a componente residual et. A estimativa desta componente dada por ,=yt-ft-St, t = l,...,N (2.14)
16

Aps a decomposio espera-se obter uma srie estacionria, se tal suceder resta modelar a srie dos resduos utilizando a metodologia Box-Jenkins (Brockwell & Davis, 1996).

2.2.2. Previso

A decomposio das sries, em componentes no observveis, alm de ser uma ferramenta que permite compreender o comportamento das sries temporais, tambm um mtodo de previso. Neste trabalho a decomposio ser utilizada para descrever e compreender a estrutura da srie e assim ajudar na escolha de um mtodo de previso. Quando a srie yt (como em 2.5) apresenta tendncia e sazonalidade com perodo S usa-se o mtodo Holt-Winters (que uma extenso do mtodo de Holt) (Brockwell & Davis, 1996). Este mtodo permite construir as previses pontuais da srie. Baseia-se em trs equaes de alisamento: a do nvel, a da tendncia e a da sazonalidade, e apresenta a vantagem de no se supor um padro sazonal fixo. Considerando ento yt = a + bt + St + et o modelo subjacente, a funo de previso yt+H=t+bth + St+h_ks com//= 1, 2,... ek= 1 seO<h<L,k Assim , = a(y, -St_s)+ (l - af t - x + *,_,) 0 < a < 1 bt = fi(, - t_{)+ (1 - /?),_,, 0 < fi < 1 (2.16)
(2 .17)

(2.15) = 2seL<h<2L.

st=r(yt-at)+(i-r)st_s,
'-S

o<^<i

(2.i8)

Para aplicar este mtodo necessrio definir os valores iniciais para (0), A(0) e / = !,. ..,S. Comeando em yu tem-se: (i)(0)=fm~{' (w-\)S (H)(0) = J 7 1 - ^ 6 ( 0 ) com J7ta mdia do primeiro ano e J7ma mdia do ano m\ (iii) para / = 1,..., mS os ndices sazonais (2.20) m = 2 ou m = 3 e mS<N (2.19)

sl,<M)=yi+su-i)~
yt=y^s{!-i),

onde / = 1,..., S;j ~ 1,..., m e y} constitui a mdia do ano y e ao qual pertence

yj" :Lir~i *() L v ^_ ) J

(2-21)

17

(iv) controem-se as mdias 1 m que de seguida se normalizam.

S,=-Z<W-.)> i = \-,S

(2.22)

As constantes de alisamento a, pz y escolhem-se minimizando uma funo dos erros de previso. Os coeficientes sazonais estimados, por vezes ao fim de S perodos," tero de ser renormalizados, devido sucessiva aplicao de (iii). At aqui vimos como obter previses pontuais para a srie, mas muitas vezes interessanos construir intervalos de confiana para as previses, os chamados intervalos de previso. Isto , pretende-se obter intervalos que se cr conterem o valor futuro da varivel com certa probabilidade. No entanto, fazer previso por intervalos depende da especificao de certas hipteses relativas ao comportamento da varivel, do seu modelo terico e em particular do seu termo residual. O mtodo de Holt-Winters no o mais adequado deduo de intervalos de previso, sendo que um dos principais motivos o facto de o modelo estatstico equivalente no estar teoricamente fundamentado.

2.3. Modelao Box-Jenkins

Neste captulo debruar-nos-emos sobre a metodologia Box-Jenkins utilizada na anlise de sries temporais, com a qual se pretende escolher modelos ARMA(2) (auto regressive moving average) para modelar a srie das observaes. Um processo {yt} diz-se um modelo ARMA (p, q) se a equao s diferenas estocsticas satisfeita
yt - <fayt-i - - fayt-p
= e

^ ~ &e<-i ~ - ~

##-*

ou escrevendo de uma forma mais concisa fB)yt= GlE)et E(et) = 0 e var(e,) = o2. As razes do polinmio 0q(B) - 0 devem situar-se fora do crculo unitrio para que o processo seja invertvel e para o processo ser estacionrio as razes de <j><,(B) = 0 devem estar
(2)

(2.23)

onde B o operador atraso B'yt=yt-i, / = 0, 1, ... e {et} um processo de rudo branco com

Os modelos ARIMA e SARIMA so uma generalizao dos modelos ARMA. 18

fora do crculo unitrio. Assume-se daqui para a frente que o processo estacionrio e invertvel e que os polinmios 0q{B) = 0 e </>p(B) = 0 no tm razes comuns. A FAC de um processo ARMA (p, q) decai gradualmente para zero (ou sob a forma de sinusoidal amortecida), pois o seu comportamento como o de um processo autoregressivo (AR). A FACP, cujo comportamento semelhante de um processo de mdias mveis (MA), tambm decai gradualmente para zero (ou sob a forma de sinusoidal amortecida). Segundo Box-Jenkins (1994) na construo de um modelo podemos distinguir trs fases essenciais, conforme representado esquematicamente na Figura 2.1: (i) identificao, (ii) estimao e diagnstico e (iii) utilizao do modelo na previso.

Fase I Identificao

Preparao das Observaes Transformao dos dados para estabilizar a varincia Diferenciao dos dados para obter uma srie estacionria

Seleco do Modelo

T
1r

~
^
M

Examinar dados, FAC e FACP para Identificar potenciais modelos

Fasen Estimao e diagnstico

Estimao Estimar parmetros dos potenciais modelos Seleccionar o melhor modelo usando critrios apropriados 1r Diagnstico Verificar FAC/FACP resduos Fazer testes aos resduos So os resduos rudo branco ? 1r Sim No

Fase III Aplicao

Previso Utilizar o modelo na previso

Figura 2.1 - Metodologia Box-Jenkins (Makridakis, Wheelwright & Hyndman. 1998, p. 314) 19

Na anlise da nossa srie sero estas as fases por ns utilizadas e que neste captulo descrevemos sucintamente.

2.3.1. Identificao do Modelo

Na fase de identificao dos modelos dois desafios se nos colocam: (i) preparao das observaes e (ii) determinar os possveis modelos ARMA (p, q) para a srie em estudo. (i) Preparao das Observaes Na prtica, na maior parte dos casos procuramos ajustar um modelo a uma srie {yi, yi, ..., y} que no estacionria (em mdia, em varincia ou em ambas). Isto levanta um problema uma vez que na modelao Box-Jenkins, pretende-se escolher modelos ARMA, que correspondem a processos estacionrios. Portanto se lidamos com uma srie no estacionria preciso transform-la de modo a que se torne estacionria. Quanto estabilizao da varincia dever ser feita antes das transformaes estabilizadoras da mdia, utilizando a transformao de Box-Cox (Box & Cox, 1964). A transformao Box-Cox uma famlia paramtrica de transformao de^f para y\X) definida da seguinte maneira

- ' x*o rcv,)=y>=. A


log.y,, 1=0

(2.24)

Devero ento experimentar-se vrios valores de X at chegar ao valor de X mais apropriado. Ao "melhor" X corresponder a menor soma de quadrados residuais, isto , para o qual SU) = tk"-Mtf menor. No caso da srie ser no estacionria em mdia torna-se necessrio diferenciar a srie. A tcnica de diferenciao usada, consoante os casos, para remover quer a tendncia quer a sazonalidade. A diferenciao para eliminar a tendncia tem a forma Vy,=(l-Byyt onde o inteiro d, na maior parte das situaes prticas, toma os valores 0, 1 ou 2. Torna-se no entanto k:ecessrio recordar que, embora o operador d possa ser qualquer inteiro, d > 0, se deve ter em ateno que se a ordem da diferenciao for muito elevada, introduzem-se varincias esprias.
20
(2 .26)

(2.25)

Quando estamos perante dados sazonais poder ser apropriado aplicar a diferenciao sazonal, para estacionar a srie, atravs do operador diferena sazonal

VDsyt={\-Bsfyt

(2.27)

onde o inteiro D a ordem da diferenciao sazonal e S a periodicidade. (ii) Escolha de possveis modelos ARMA (p, q) Aps a aplicao das transformaes necessrias (se for esse o caso) para estabilizar a srie, examinamos o cronograma, a FAC e FACP amostrais da srie convenientemente transformada e tentamos encontrar as ordens de p e q com vista a encontrar os modelos ARMA (p, q) que parecem ajustar-se srie dos dados. De seguida passamos segunda fase da modelao Box-Jenkins.

2.3.2. Estimao e Diagnstico

Nesta fase vamos decidir qual, de entre os vrios modelos propostos, ser utilizado para previso. Para isso temos de estimar os parmetros dos vrios modelos e, usando critrios adequados, seleccionar o melhor modelo. Por fim, e ainda nesta fase, fazemos a anlise dos resduos e assim decidimos se o modelo vai, ou no, ser utilizado para previso. (i) Estimao dos parmetros dos potenciais modelos J temos no horizonte um leque de modelos que podero ajustar-se srie em estudo, mas para chegar forma final destes modelos preciso estimar os seus parmetros, os quais so estimados pelo mtodo da mxima verosimilhana. Os estimadores P de

P ~ Wi >fa 4p #i, #2 &q )' so aproximadamente N(fi, nl V(fi)\ onde V(JJ) a matriz de covarincia assinttica (Brockwell & Davis, 1996 e 1991). Estando em poder das estimativas dos parmetros de cada modelo preciso analisar a sua significncia. Assim as estimativas que apresentem um p-value superior a 0.05 (para um nvel de significncia de a = 5%) devero ser excludos do modelo. Por outro lado os parmetros no devem ser correlacionadas, sob pena de produzirem um modelo instvel. (ii) Seleco do modelo Os diferentes modelos ajustados so comparados com base nos critrios AIC e BIC. Segundo Murteira, Muller e Turkman (1994) existem dois importantes critrios de seleco de modelos: Akaike (AIC) e critrio de informao de Bayes (BIC). No critrio AIC, a regra de deciso seleccionar o modelo que minimiza
21

AIC(m) = -2 log L$>) + 2m onde Ly) o valor da funo de mxima verosimilhana e m o nmero de parmetros (Harvey, 1993). O critrio BIC dado por BIC{m) = -2 log L^)+ mlogT, tambm selecciona o modelo ao qual corresponde o valor de m que minimiza esta funo. (iii) Diagnstico Nesta segunda sub-etapa vamos verificar se o modelo seleccionado fornece uma descrio adequada dos dados atravs da anlise dos resduos. Se os resduos se comportarem como um processo de rudo branco, devero ser uma sequncia de variveis aleatrias no correlacionadas, provenientes de uma distribuio fixa, com mdia constante, normalmente assumida como sendo zero, e varincia constante. Estas hipteses sobre a componente residual podero ser verificadas atravs de representaes grficas e testes estatsticos adequados. Assim, constri-se o cronograma dos resduos, o qual dever revelar uma mdia prxima de zero e no apresentar movimentos peridicos e analisamos os grficos das funes de autocorrelao (FAC) e autocorrelao parcial (FACP) amostrais. A normalidade da componente residual poder ser verificada graficamente atravs do histograma dos resduos e da representao em papel de probabilidades. Alm disso deveremos analisar tambm os testes adequados para verificar se esta componente tem um comportamento compatvel com uma amostra de rudo branco. Estes testes so utilizados para avaliar a aleatoriedade dos resduos e esto resumidamente apresentados no Anexo I. Caso os resduos tenham todas as caractersticas de rudo branco, o modelo em causa utilizado para previso.

2.3.3. Previso Aps a seleco do modelo que melhor se ajusta srie dos dados, este utilizado para previso de valores futuros da srie: a partir do passado da srie jr, y^i, yt-i, ... pretendemos prever um valor no observado da srie yt+m, m>0. O objectivo escolher v^w) ~fiyt,yt-h-) que mii;.mize [(y(+m - y, (w))2 J. E a melhor funo para/ o valor mdio condicional deyt+m em>v, _y,-i, yt-2, ou seja, o preditor de erro quadrtico mdio mnimo.
22

Seja yt+m a previso de {y,} em t + m. yt+m =yt(m)=E(yt+m \yy,-\,yt-2,~). (2.28) (2.29) Se {y,} satisfaz um ARTMA (p, d, q) da forma: Op(B)(l-B)dyt=Qq(B)et,

onde as razes do polinmio <(/?) so em mdulo estritamente superiores unidade e o valor das razes de (B) no interfere com a estacionaridade do processo. Se V(B) = p(B)(l -B)d = \-xB-...-p+dB^d tem-se (l-lB-...-p+dB^)yt+m ento y,+m = xyt+m-x + + P+dyt+m-p-d + et+m - 0xet+m_x -... - 0qel+m^ da equao anterior, obtm-se a equao de previso ym) = y/,yXrn-\) + ... + P+Jf"-p-d) onde y,U) = E(yt+j \yt,yt.l,yt1,..) e ,(./') = 0, j>\ quandoy < 0 y,U) = y,+J e t(j) = et+j. (2.37) (2.36) (2.35) (2.34) + t(m)-e,t(m-\)-...-eqt{.n-q) (2.33) (2.32) = Qq(B)et (2.31) (2.30)

Tomando ento o valor mdio condicionado ayt, yt-i, yt-i, em ambos os membros

No caso de pretendermos calcular um intervalo de confiana a (1-a) 100% para a previso do valor futuro Yt+m admitindo que os resduos tm distribuio gaussiana:
r

m-l

et (m) n N 0, G] ] y] , constri-se ento o intervalo pretendido Yt+m Zx_a/ae rjT y/] .


\ M J
<j=0

2.4. Modelos E struturais

Nas sries temporais frequente observar que estas apresentam tendncia, sazonalidade, ciclos e perturbaes aleatrias.

23

Por vezes a tendncia no pode ser ajustada por linhas rectas, a menos que o perodo de tempo seja razoavelmente pequeno. Isto significa que a maior parte das vezes a tendncia determinstica limita o estudo das sries temporais. O ideal seria que a tendncia no fosse to restritiva, mas sim maisflexvel.A forma de o conseguir permitir que os parmetros, do nvel e do declive, evoluam ao longo do tempo. Surge, assim, necessidade de construir uma tendncia estocstica, em que o nvel e o declive se alteram com o decorrer .do tempo. De modo semelhante, torna-se necessrio que as outras componentes sejam suficientemente flexveis de modo a que reflictam os padres do comportamento da srie. Os modelos compostos por componentes com tais caractersticas, so muitas vezes vistos como modelos de regresso, nos quais as variveis so funes do tempo e cujos parmetros variam ao longo do tempo. Tais modelos designam-se por modelos estruturais de sries temporais e foram desenvolvidos por Harvey (1996). Os modelos estruturais de sries temporais so uma classe de modelos formulados em termos de componentes estocsticas, que tm por isso uma interpretao directa. Se para alm da tendncia e da sazonalidade, se inclurem variveis exploratrias, o modelo resulta numa mistura de sries temporais e regresso. A regresso um caso especial, na qual no existem componentes estocsticas, para alm do termo da perturbao aleatria. A combinao das variveis exploratrias com as componentes no observveis, abre um vasto leque de possibilidades na modelao. De seguida iremos abordar os principais modelos estruturais.

2.4.1. Modelo Estrutural Simples O modelo estrutural simples definido por duas componentes: a tendncia e a perturbao aleatria. Este modelo definido por: yt = Mt + t, t=\,...,T (2.38) Se a srie se caracteriza por um nvel localmente constante, ento jut a tendncia sem declive e st uma perturbao aleatria com caractersticas de rudo branco de mdia zero e varincia <j]., que se assume ser no correlacionado com fit. A tendncia define-se por A - #-i+ lt # = //,_i+#_i + P,= fi-i + 4, ty (2.39) (2.40a) (2.40b)
24

Se a tendncia for considerada linear, introduz-se em 2.39 o declive /?, e tem-se

onde rjt e so perturbaes aleatrias com caractersticas de rudo branco, com mdia zero e
.*
. 2 2

varincias cr, localmente linear.

e ^

, respectivamente. A sucesso portanto caracterizada por um nvel

2.4.2. Modelo Estrutural Bsico (MEB)

Este modelo difere do anterior pois alm de incluir as componentes de nvel de tendncia IM e aleatria st, inclui a componente sazonal yu de perodo s. Assim, o modelo estrutural bsico representa-se do seguinte modo: Jir-A + J + * /* = A-i + Pt-\ + Tjt #=
-i

t=\,...,T

(2.41a) (2.41b) (2.41c)


(2.4id)

#-i +

r.2rw+k
que se assume serem no correlacionadas entre si.

Os termos ,, 7,, $ e <yf sLo perturbaes aleatrias com caractersticas de rudo branco As equaes (2.41b) e (2.41c) juntas definem o modelo da tendncia: a equao (2.41b) representa o modelo do nvel da tendncia e , (equao (2.41c)) o modelo do respectivo declive, que tem comportamento de passeio aleatrio. A tendncia tem diferentes modelos estocsticos consoante se admite que cada uma das varincias a2n e a\ nula, ou at que ambas so nulas.
Se

, o modelo da tendncia ((2.41b) e (2.41c)) uma funo t=\,...,T

determinstica do tempo em que /?, = /?,_, = ...= /?e jut = JM-\ + pt,

Se a\ = O e a2n > O, o declive constante # = #-1 = ... = /?e a tendncia fica

que apesar de continuar a ser um processo estocstico tem uma componente determinstica: /?, sendo B o operador atraso. No caso de B= O a tendncia um passeio aleatrio.

25

Se al > 0 e al = O, ento

o //, - //,_! = 5,_/ o o ( l - 5 ) , u f = /?,_,. ecomo

5, = 5,_, + o
o(l-5)5, = $ o 1-5 Temos ento que /?,_, = -21e

substituindo esta em (1 - 5)//, = 5,_y fica


2 A =-/

o(l-5)
Se crj > 0 0"2 > 0, temos que

1-5

que rudo branco nas segundas diferenas.


e

o5,-5M = o o (1-)/?, = o 1-5 e consequentemente /?,_i =


M

1-5'

Quanto equao da tendncia, vem:

0(1-5)^ = ^ + 7 , 0 o (1 - 5 ) % = $_i + (l - 5 ) 7 f o o ( l - 5 ) 2 / / , = /7,-/;,_, + _,. Portanto a tendncia no caso, a] > O e crj > O, um processo ARIMA (O, 2, 1). A componente sazonal dada pela equao /, = - J ] t-} + ), o Y ^f_ = <f Esta componente pode ser actualizada quer sob a forma de varivel muda
26

-1

Ur,-j
[,/2]

CO,

quer como funo trigonomtrica

r, = TrJt
7=1

A representao trigonomtrica de yjt um ciclo no estacionrio, com Xj = Injls, j= 1,2, ...,[5/2]:


r

cos /l. - sin Xj

sin Xj
COS XJ
*

),

(2.42)

<y,

onde e <y* so processos de rudo branco com mdia zero e varincia <J~ .
O), Yjt =rJ,t-1 cos A, +rl,_lsinXJ +,

De (2.42) tem-se

Se s for par ento 70* = , logo #,, =fij-iCOsX,+ )Jt.

2.4.3. Modelo Cclico

Os modelos cclicos apresentam uma componente cclica, y/h para alm das componentes da tendncia e aleatria. Podem definir-se trs tipos de modelos com componente cclica: o modelo ciclo mais rudo, o modelo de tendncia mais ciclo e o modelo de tendncia cclica. Define-se ciclo estocstico i//t da seguinte forma
Yt
+

cos Xc sinXc -sinX cos/L YU

V
k:

(2.43)

Vt

e utilizando o operador atraso B, tem-se que


Yt * Yt

1-/3 o,osXcB - psinXcB psinXcB 1 - p cos XCB

V
k:

(2.44)

um vector de um processo AR(1), com 0<p< 1 eO<Xc< n.

Ciclo Mais Rudo Este modelo formalizado da seguinte forma: y, = ju+if/t+et, t=l,...,T
(2.45)
27

Mas substituindo (2.43) emyt obtm-se o modelo:


Jt

v -ai 0-PCQSW,+(PWW* , \-2pcoscB + p2B2 Tendncia Mais Ciclo

=i,...,r

(2.46)

Neste modelo considera-se a componente cclica como estacionria e representa-se por yt = jut+Y< + t, t=\,...,T (2.47a)

onde [M o modelo da tendncia como no modelo estrutural bsico: //, = /*_/+#_,+ 77, Pt= jflU + $ (2.47b) (2.47c)

Tendncia Cclica Tal como no modelo anterior a componente cclica deste modelo assume-se como estacionria e # = //, + t=\,...,T (2.48a) (2.48b) (2.48c) _, ^ + *' com jut= A-/ + Vt-i + $-; + % e m Que ciclo incorporado na tendncia. A = A-i + Ento, com A=l -B, tem-se _ 7, , (l-/?cos2^)Arf_1+(yQy/>?/L^)C * 7 + Z l ( l - 2 p c o s ^ + p252)
= +

<2-49)

2.4.4. Os Modelos Estruturais na Sua Forma Reduzida

Os modelos estruturais de sries temporais contm vrios termos de perturbao, mas uma vez que so lineares, estas perturbaes podem ser combinadas de modo a que exista apenas uma perturbao. Quando os modelos estruturais de sries temporais se encontram nesta nova forma diz-se que esto na sua forma reduzida, cujas caractersticas probabilsticas so equivalentes a modelos, com restries, da famlia ARIMA. Uma das vantagens dos modelos estruturais na sua forma reduzida, que so formulados em termos das componentes no observveis dos modelos ARTMA. Pois a classe dos modelos ARIMA abrange muitos modelos e parmetros, os quais no tm uma interpretao sensvel.
28

Na prtica, em termos de previso, os modelos ARIMA at funcionam bastante bem, mas tal s acontece porque os modelos estruturais de sries temporais tm a forma ARIMA reduzida (Harvey, 1997). Apresentamos de seguida a forma reduzida do modelo estrutural simples do modelo estrutural bsico.

Modelo Estrutural Simples

Nvel Localmente Constante O modelo dado pelas seguintes equaes: yt = jut + st,
jUt = jUt-i+ rj,

=l,...,T

(2.50)
(2.51)

Sendo
JUt = jUt-i + T]t^>

oMt

1, \-B

Ento, substituindo jut em yt = //, + st, vem


Jt

\-B

' <=> + (l-B)eto

&(l-B)yt=Tit
o ( l -B)yt=

jt+St-St-i

Ento a forma reduzida do modelo estrutural simples com nvel localmente constante
(l-B)yt= jjt+St-St-i.

No segundo membro temos um processo ARMA (0, 0) e um processo ARMA (0, 1), logo yt um processo ARIMA (0, 1, 1), isto , satisfaz uma equao da forma
2 (l-B)yt = Zt+QZ,-i, ondeZ, o rudo branco e 6= (q [q +q y -2-q /2,onde q-p\l >2 y>-2-q qf +y a razo das varincias (Harvey, 1996). Verifica-se que sob estas condies - l < 9< 0.

p\

Assim, o modelo estrutural simples com nvel localmente constante um processo ARIMA (0, 1,1), mas com restries.

29

Nvel Localmente Linear O modelo estrutural simples com nvel localmente linear definido pelo seguinte conjunto de equaes yt = jut + st, t=l,...,T (2.52a) (2.52b)

pk = /4_i+ fi-i + T]t

A=

A-i + 6

(2-52c)

Consequentemente temos # = #_! + o <^ fi - A-i = & o o(i-5)/?f=<


Pt

1-5

e tambm ju, = ju,-i + pt-\ + rito < = > fXt - /4_i = 5 M + ]t o o ( 1 - ) / / , = /?, i + ^ o " 1-5 1-5

o ( l - 5 ) / / f = #_, + /;,
Como 5,_i =
f

e substituindo em //, = // M + 5f_i + 77,, temos que


(l B)ju =

' YTE+r1'^
T

<//=^i(\-B)2

+- \ 1-5

(2.53)

Substituindo esta ltima em y, - jut + st, vem: v = ^"' 2 + - ^ - + gr ' (1-5) 1-5 o

O(1-5)2V=^1+(1-5)7+(1-5)2>

^ (1 - B)2yt = _, +?jt- rjt_} +et- 2et_x + Bst_, < = > (1 - B)2 y, = et - 2et_, + et_2 +rjt- r]t_x + &_,

<=> (1 - 5) 2 v, = _, + 77, - //,_, + fft - 2s,_, + et_2 <

Esta ltima expresso representa um processo ARIMA (O, 2, 2) e a forma reduzida do modelo estrutural simples com nvel localmente linear.

30

Modelo Estrutural Bsico

O modelo dado por: yt = ^ + yt + t, /* = /4-i + )SU + ft A= A-i + + t=\,...,T (2.54a) (2.54b) C2-540) 2 54d

rt=-Z^-/ ^

(- )

E no caso em que a\ > 0 e cr,2. > 0, a equao (2.54b) fica como em (2.53)
Mt
bf-i
:

(1

l-B

<=>

0- -By
7, - 7 , - i+4t-i
(1-z?)2

+ 6-, <=>

Quanto componente da sazonalidade tambm pode ser escrita assim:


- i

com 5(5) = l + 5 + 5 2 +... f l , vem $()# = <, que rudo branco, ou ento Yt - , 1-5* . 0 ~ 5) Como 5(5) = - T - y vem yt = L - o yt = \-B E no modelo y, = jut + yt +firsubstitumos //f e # pelas expresses que determinmos, ficando

* =

7r-7r-i+-i +, (JZ:gK L+g S .1 -"2 V 1-5 -t> ~ ( 5)2

=(i-5)7(-(i-5)/7(-,+a-5)^_l+(i-5)3u)/+(i-Jff)2(i-B)fi a qual a forma reduzida do modelo estrutural bsico, que um MA (5+1) (Harvey, 1996). No Anexo II apresentamos de um modo resumido os principais modelos estruturais, suas componentes e a sua forma reduzida.

31

2.4.5. Seleco do Modelo Deparamo-nos agora com o problema de escolher qual o modelo, de entre os analisados, que melhor se ajusta srie. Tal como na Seco 2.3.2. utilizam-se os critrios adequados de seleco de modelos. 2.4.6. Anlise da Componente Residual Aps a seleco do modelo que parece ajustar-se melhor srie dos dados observados, faz-se a anlise dos resduos, como na Seco 2.3.2.. 2.4.7. Modelos em Espao de Estados Na teoria do controlo, a representao de um sistema em espao de estados essencial pois permite que os parmetros dos modelos sejam ajustados de modo recursivo medida que surgem novas observaes. Define-se espao de um sistema como a informao mnima, do passado e do presente, necessria para que o comportamento futuro de um sistema possa ser "traado" com base no presente estado e nas observaes futuras. Assim a propriedade Markoviana o fundamento da representao de um sistema em espao de estados: dado um estado presente, o futuro do sistema independente do passado. Suponhamos que temos um processor, = 1,..., Tcaracterizado por evoluir no tempo e cujos valores futuros pretendemos prever. Seja x, um vector de estados (m x 1), cujas componentes so as variveis de estado, em geral no observveis. Num dado instante /, os valores assumidos por estas variveis definem o estado do processo. A relao entre as observaes, yt, e o vector de estados x, traduzido pela seguinte equao: yt = zixt + dt+et, t=\,...,T (2.55) que se designa por equao das observaes, equao de medida ou equao de "output". Em modelos univariados, zt um vector 1 x m, dt vector 1 x 1 e st o erro com distribuio N(0, o*ht), com ht funo conhecida do tempo.
32

O vector de estados, xt, embora no directamente observvel actualizado ao longo do tempo atravs da equao de transio que o define: Xt = Ttxt.i + Ct + Rt7]t, t = 1,..., T (2.56)

onde Tt uma matriz m x m, Ct um vector m x \, Rt uma matriz m x g (cuja incluso arbitrria) e TJ, um vector g x l . Sendo este ltimo um vector de perturbaes aleatrias no correlacionadas com mdia zero e matriz de covarincia Q,, i.e., E(rjt) = 0 e var(rjt) = Q,. A representao do modelo em espao de estados dada pelas equaes (2.55) e (2.56).

Representao em Espao de Estados dos Principais Modelos E struturais de Sries Temporais

Os modelos estruturais de sries temporais, tal como outros modelos (aps manipulaes algbricas), admitem representao em espao de estados, o que uma vantagem, pois a partir daqui podemos fazer previses atravs do filtro de Kalman. A seguir damos exemplos da representao em espao de estados de alguns modelos estruturais.

Modelo Estrutural Simples

a) Nvel Localmente Constante O modelo estrutural simples com nvel localmente constante, como vimos no captulo anterior y, = jut + st, ju, = jut-i + Tj, J se encontra representado em espao de estados com z = 1 e T= 1 e
Xt = JUt = JUt-i + T]t.

t=l,...,T

(2.57a) (2.57b)

b) Nvel Localmente Linear O modelos estrutural simples com nvel localmente linear representa-se, na sua forma habitual, da seguinte maneira: yt = fit + t, fit = jut-i + J3,-I + TJ, t=\,...,T (2.58a) (2.58b)
33

fr=
yt=[\

A-i + 6
0]xt + et,

(2.58c)

A sua representao em espao de estados (2.59a)

A equao de transio, matricial, :


*t

=
fit

" r
0

Mt-i

1 fit-x

7,"

li
0 1

(2.59b)

r com^=^]',Z = [l 0] e T ="
Modelo Estrutural Bsico Este modelo representado pelas seguintes equaes
yt = jut + yt + et, Ht = jUt-i + Pt-i + ri, fit = Pt-i + t t=\,...,T

(2.60a) (2.60b) (2.60c) (2.60d)

y r, = -Z rt-J+<ot

O modelo estrutural bsico adequado para muitas sries mensais e trimestrais (s = 4). E a componente da sazonalidade para s = 4
3

(2.61)
j=\

A sua representao em espao de estados, com a componente da sazonalidade de perodo s = 4, a seguinte ^ , = [ 1 0 1 0 0]xt + eh t=\,...,T (2.62a)

Com equao matricial de transio


M,
fit

1 1 0
=

0 0 -1 1 0

0 0 -1 0 1

1 0 0 0

0 " Mt-t 0 fit-x -1 0 0

It

t
(2.62b)
0

x. =

Yt

0 0 0

Yt-x Yt-t.

Yt-x + a, 0 Yt-2
Yt-3 .

em que o vector de estados


1 1 0 1 0 0 0 0 0 -1 1 0 0 0 -1 0 1 0 0 -1 0 0
34

*t=k

fit

Yt

Yt-x Y,-i\

e Z = [l 0 1 0 o]e T

0 0 0

Modelo Cclico

a) Tendncia Mais Ciclo O modelo cclico com as componentes da tendncia e do ciclo representa-se por

y, = M,+ Vt + t, A = A-i+A-i + fr =
Wt

t=\,...,T ty
sinkc 1 ^ _ , pfcf

(2.63a) (2.63b) (2.63c)

A-i +
cos c

^;J

[-sfiiA.

cos 4, y/\

fr*

(2.63d)

Admite a seguinte representao em espao de estados: ys=W 0 1 0]xt + st, t= l, ...5 Tque a equao de medida. A equao de transio em termos matriciais
j",

(2.64a)

A
Vr

1 1 0 1 0 0 0

0 0
pCOSc

0 0 psinc pcosc

Pt-X fit*
i

7r
-r

,
*, *;

Vt-i

(2.64b)

w]_

0 - psinc

yli.
0]e

O vector de estados e Z = [l 1 1 T = 0 0 0 1 0 0 0 0 pcosc - psinkc 0 0 psinc /7cos/Le 0 1

b) Tendncia Cclica O modelo estrutural com tendncia cclica y, = jut + t, t=\,...,T (2.65a) (2.65b) (2.65c)
COS c STIC

fit = JUt-i + If/t-i + Pt-\ + Tft

Wt

-sin.

cos A,

(2.65d)

Representando-o em espao de estados, a equao de medida #=[100 Q]xt + st, (2.66a)


35

a equao de transio matricial


Mt 1 1 0 1 0 0 0 1 0 pcosc 0 0 psinlc pcosc
Mt-i

i,

x. =

fit

t *_

fi + t-x

6
*;

(2.66b)

0 - psinXc

yli.

Sendo xt =\/it
1 1 0 1 0 0

J3t y/t
1 0

y/*\e o vector de estados Z = [l 0 0 o]e


0 0 psini pcos)

pcosc

0 0 - psinc

2.4.8. Filtro de Kalman

A representao de um modelo em espao de estados permite a aplicao do filtro de Kalman para calcular o estimador do vector de estados no instante t, com base na informao disponvel nesse instante. Ofiltrode Kalman um processo de estimao recursiva ptima, que permite construir as previses dos modelos estruturais (Harvey, 1997). Dadas estimativas iniciais, este permite obter os parmetros do modelo e ajustar essas estimativas sempre que surge uma nova observao, dando uma estimativa do erro em cada actualizao. Os modelos utilizados para previses em sries temporais dividem-se em lineares e no lineares. Segundo Harvey (1993:266) "Qualquer modelo que tem uma forma linear em espao de estados e perturbaes gaussianas certamente linear". Ora, os modelos estruturais, objecto deste nosso estudo, tm todas as caractersticas de modelos lineares. Assim, enquanto nos modelos lineares se utiliza o filtro de Kalman discreto, nos modelos no lineares aplica-se o filtro de Kalman estendido (Welch & Bishop, s/d). Portanto ns s iremos abordar o filtro de Kalman discreto.

Filtro de Kalman Discreto

O filtro de Kalman discreto aplica-se quando um processo contnuo obtido em intervalos de tempo discretos. Estefiltro definido por um conjunto de equaes, as quais por
36

sua vez se dividem em dois grupos: equaes de previso e equaes de actualizao. As primeiras permitem fazer uma previso inicial (estimativa a priori) para o processo e para o erro, no instante seguinte. O segundo grupo de equaes actualiza as estimativas a priori. Resumidamente, o filtro de Kalman aplica-se da seguinte forma: - A partir da informao inicial das estimativas dos parmetros iniciais e do erro associado, calcula-se a matriz de ganho. - O erro entre a estimativa do parmetro e a observao determinado e multiplicado pela matriz de ganho para actualizar os parmetros e a covarincia do erro estimados. - Estas actualizaes so depois usadas para se obter informao inicial e segue-se todo o procedimento descrito para actualizar, os parmetros e o erro, no prximo instante. estimativas iniciais dos parmetros e erros

clculo do ganho de Kalman

clculo das estimativas, no prximo instante, dos parmetros e do erro

actualizao da estimativa com as observaes

clculo da covarincia do erro da estimativa actualizada

Figura 2.2 - Esquema do processo do filtro de Kalman

Descrio dos Elementos do Filtro de Kalman

(|

vector dos parmetros actuais, no instante /. vector da estimativa actual dos parmetros no instante anterior actualizao. vector da estimativa do parmetro no instante t + 1. matriz da covarincia do erro dos parmetros actuais.

t\t-i t+i\t

p
1

flf-1

matriz da covarincia do erro dos parmetros estimados.


37

-*

matriz da covarincia do erro da estimativa do parmetro no prximo instante, t+1.

Yt Zt stst'

-* -* -

vector contendo as observaes. matriz (no contendo rudo) que d a relao entre x, e yt. matriz que denota o erro nas observaes, que conhecida ou que ter de ser estimada a priori.

Tt Kt

-* ~*

matriz que contm o modelo que relaciona xt com xf+]. matriz de ganho que relaciona a quantidade de influncia do erro entre ;%_i e Yt.

Algoritmo do Filtro de Kalman Discreto

Consideremos o modelo yt = Ztxt+St x, = TjCt-i + R,]t ondes, ~ M(0,<T ht\ com ht funo conhecida do tempo e Rt tambm conhecida. Seja X/+i o processo que pretendemos estimar com as condies iniciais x0=ju0 P(0) = Po e Yt o processo das observaes. Suponhamos que inicialmente temos x0 = x0|0, calcular *,,, . Comeamos por calcular a funo de previso a um passo x]|0 = ro^oio
e

,/=l,..., T

(2.67a) (2.67b)

P0 = P0l0 = P1|0

e que pretendemos

depois

calculamos a matriz de ganho K\, que dada por AT, = / ^ Z , ' \ZXPX^ZX '+exef J . De seguida actualizamos a varincia atravs de P\\\ -[Iatravs de xvl = x1|0 + Kx [F, - Z,xl|0 J. No clculo de *2|2, tal como acima, comeamos por obter x2|] = T} x,,, e a covarincia do erro Au = TXP^TX+R2R2' E depois calculamos a matriz de ganho K2 = P2nZ2 '[Z2P2|1Z2 '+e2s2 'J* para podermos actualizar o estado ^ u , e temos: x2[2 = x2|] + K2 [72 - Z2x2,, J, que a estimativa actualizada. Por fim actualiza-se a covarincia do erro com: P2\i = [I- K2Z2]P2\iEstas duas ltimas actualizaes so depois as estimativas iniciais para a estimativa no instante seguinte e assim sucessivamente para as restantes estimativas. Um possvel esquema ilustrativo do processo de actualizao atravs do filtro de Kalman encontra-se na Figura 2.3. K\Z{\Pi$ e finalmente actualizamos a estimativa

38

Estimativas Iniciais
x

t\t-\

"t\t-i

Equaes de Actualizao Equaes de Previso (1) Predio do Estado (1) Clculo do Ganho de Kalman

x
(2) P

=T x

(2)
x

Actualizao da Estimativa t\t


=x

Covarincia do Erro =T P T +0 O '

t\t-\

^t[^t

~^txt\t-\\

(3) Covarincia do Erro da Estimativa

Figura 2.3 - Esquema do algoritmo dofiltrode Kalman

Intervalos de Confiana pra Previses

Se o modelo se encontra na forma (2.67), o predictor a m passos para o processo das observaes Yt YT+mT = Z' xT+m[T =Z'TmxT, (l-a)100% para YT+m um tipo fr+m|r m = ! 2,... e um intervalo de confiana a

t<?[d2)(pQM$T^Tf.

39

3. Modelao do Nmero Semanal de Adultos Alojados num Hotel

3.1. Apresentao da Srie


Neste captulo vamos analisar a srie do nmero semanal de adultos alojados num hotel, utilizando para tal as trs metodologias estudadas nos dois captulos anteriores e iremos comparar as previses. Os dados disponveis so provenientes de um hotel de quatro estrelas com capacidade diria para 354 adultos, e referem-se ao nmero semanal de adultos alojados no mesmo, de 1 de Janeiro de 1995 a 31 de Dezembro de 1998, num total de 208 observaes. A srie passar a ser designada por srie Adultos. Iniciamos o estudo tentando ajustar aos nossos dados um modelo de decomposio, prosseguimos com um modelo estrutural efinalizamoscom um modelo ARMA. Os trs melhores modelos obtidos nas diferentes abordagens so depois comparados conjuntamente quer em termos de ajustamento quer em termos de previses. Para a realizao deste trabalho foi indispensvel a utilizao de instrumentos informticos apropriados. Na anlise da nossa srie utilizmos os packages estatsticos STAMP 5.0 {Structural Time Series Analyser, Modeller and Predictor), SPSS 9.0 {Statistical Program for Social Sciences) e YISMfor Windows (mais concretamente o programa PEST - Parameter Estimation). Tambm utilizmos a folha de clculo Microsoft Excel 97, sobretudo para ajustar o modelo de decomposio aditivo.

40

3.2. Diagnstico Preliminar dos Dados


Neste captulo pretendemos fazer uma anlise dos dados e o primeiro passo olhar para os grficos dos mesmos, juntamente com as estatsticas resumo simples. Por se tratarem de observaes efectuadas ao longo do tempo, os grficos que se revelam mais importantes no estudo so o cronograma e os correlogramas analisados nas alneas c) e d) seguintes. a) Estatsticas Resumo Na Tabela 3.1 apresentamos o output das estatsticas resumo dos dados.
N Mdia Erro Padro da Mdia Mediana Moda Desvio Padro Varincia Enviesamento Erro Padro do Enviesamento Curtose Erro Padro da Curtose Amplitude Mnimo Mximo Soma 208 836,04 22,77 852,00 149a 328,32 107795,70 -,112 ,169 -,446 ,336 1510 101 1611 173896

Existem vrias modas. E apresentada a de menor valor. Tabela 3.1- Estatsticas resumo da srie Adultos

b) Histograma Tal como se pode observar na Figura 3.1, a srie no se afasta muito da distribuio normal, apresenta uma certa assimetria positiva e a curva tem um aspecto leptocrtico.

41

SM. Cev = 328,32 Mean =836 N = 208,00 100 200 300 400 500 600 700 800 900 1100 1300 1500 1000 1200 1400 1600

ADULTOS

Figura 3.1- Histograma da srie Adultos

c) Cronograma Na Figura 3.2 encontram-se representados os valores da srie Adultos de 1 de Janeiro de 1995 a 31 de Dezembro de 1998.
2000

1000

O
3

Q <

1 12

23 34

45 56

67 78

89 100

111 122

133 144

155 166

177 188

199

Semanas

Figura 3.2 - Cronograma da srie Adultos

Como se pode observar na Figura 3.2, a variabilidade no parece sofrer alteraes com o nvel da srie, o que um sinal de homocedasticidade. Fomos no entanto verificar se era preciso estabilizar a srie atravs de vrias transformaes de Box-Cox, e conclumos que . 1, pelo que no foi necessrio aplicar qualquer transformao.

42

No entanto a srie parece evoluir em torno de uma tendncia linear, acompanhada de um efeito sazonal, sendo portanto no estacionria

d) Correlograma Nas Figuras 3.3 e 3.4 apresentamos os correlogramas da srie em estudo, constatando que estamos perante uma srie no estacionria. A FAC estimada decresce lentamente para zero, indicando a no estacionaridade e a FACP decai para zero de forma sinusoidal.

Figura 3.3 - FAC da srie Adultos

Figura 3.4 - FACP da srie Adultos

e) Periodograma Para examinar as periodicidades que regem a variao dos dados calculmos o periodograma da srie Adultos, cuja representao grfica e anlise se encontra no Anexo IV.

3.3. Modelao da Srie Atravs da Decomposio Clssica


A Decomposio Clssica da srie Adultos tem como objectivo compreender melhor o seu comportamento e auxiliar na escolha de um modelo de previso. Por observao da Figura 3.2 verificamos que esto presentes a tendncia e a componente sazonal de amplitude constante, o que sugere o modelo do tipo aditivo como sendo o mais adequado (Murteira, Miiller & Turkman, 1994). Seja Yt = St+Tt + st, t=\, ...,208

o modelo representativo dos dados, definido como em (2.5).

43

3.3.1. E stimao das Componentes

A sazonalidade e a tendncia so componentes no observveis, tendo que ser estimadas a partir da informao contida na srie, pelo que o objectivo inicial estimar os ndices sazonais St para dessazonalizar a srie Yt. Deste modo, comeamos por aplicar uma mdia mvel centrada, Mt, de 52 semanas aos dados da nossa srie, para assim obter as estimativas no normalizadas St, da componente sazonal.
K+S

Numa segunda etapa, de modo a assegurar que ^St


t=K+

=0,

V^(com S como o nmero

de observaes anuais), calculamos as estimativas normalizadas St, dos ndices sazonais, com base nas Si No Anexo V encontra-se a tabela destas estimativas, as quais esto representadas na Figura 3.5.
600

1 12

23 34

45 56

67 78

89 100

111 122

133 144

155 166

177 188

199

Semanas

Figura 3.5 - ndices sazonais da srie Adultos Finalmente dessazonalizamos a srie Y, subtraindo a esta os efeitos sazonais. Na Figura 3.6 apresentam-se os grficos da srie dos valores observados Yt e a srie dos valores dessazonalizados YtD.

44

2000

1000

1 12

23 34

45 56

67 78

89

111 100 122

133

155 166

177

199

144

188

Semanas

Figura 3.6 - Srie Adultos original e srie Adultos dessazonalizada Uma vez que as flutuaes sazonais foram amaciadas, verificamos que a srie dessazonalizada apresenta apenas uma tendncia linear crescente. Na perspectiva da decomposio da srie, prosseguimos a anlise das componentes estimando a componente da tendncia Tt = a + bt pelo mtodo dos mnimos quadrados, obtendo como estimativa da componente tendncia f - 473.1033 + 3.473061/A componente residual foi obtida por subtraco de f srie de valores dessazonalizados: t = yt -yt-

3.3.2. Estudo da Componente Residual Nesta seco vamos fazer a anlise dos resduos. Como podemos observar na Figura 3.7 os resduos no tm um comportamento padro.

55 63

71 79

87 95

103 111

119 127

135 143

151 159

167 175

183 191

199 207

Semanas

Figura 3.7 - Cronograma da componente residual 45

O modelo estimado ajusta-se bem srie em estudo se os resduos sugerirem que so rudo branco (Murteira, Miiller & Turkman, 1994). Nas Figuras 3.8 e 3.9 esto representados os valores estimados das funes FAC e FACP.
0,80,60,40,2-

M11l . i u . B H . _ --. !i

S o -- J U
-0,2-0,4 -0,6 -0,8-

1 LAG

Figura 3.8 - FAC da componente residual

Figura 3.9 - FACP da componente residual

De facto os valores estimados no saem das bandas de confiana, demonstrando, por isso, um comportamento muito semelhante ao do rudo branco (Figuras 3.8 e 3.9). Para verificarmos se de facto se comportam como um processo de rudo branco, de seguida vamos averiguar se se verificam as hipteses subjacentes: I - Normalidade Para verificar a normalidade dos resduos vamos em primeiro lugar observar o seu histograma e de seguida a sua representao em papel de probabilidades. a) Histograma dos Resduos

Std. Cev = ,97 Mean =,01 N = 154,00

-3,25 -2,75

-2,25 -1,25 -,25 ,75 1,75 2,75 -1,75 -,75 ,25 1,25 2,25

RESDUOS

Figura 3.10 - Histograma da componente residual

46

A forma deste histograma sugere uma distribuio aproximadamente Gaussiana com resduos standartizados. b) Representao em Papel de Probabilidades Para concluirmos da normalidade dos resduos, estes foram representados em papel de probabilidades. Normal Q-Q Plot of RESDUOS

Observed Value

Figura 3.11- Representao em papel de probabilidades da componente residual Os pontos do grfico seguem praticamente a linha recta (notando-se apenas um afastamento nas caudas), sugerindo que seguem uma distribuio normal. II - Varincia Constante No evidente que exista violao desta hiptese, pois os resduos apresentam-se com um comportamento aleatrio, no seguindo nenhum padro (Figura 3.12).

Til

off

D a

go

J%aP%
1 i

o 9 tf o o o
tar
u

rJ

nu

a
n

4,
n

S , :

CO

o Q -3
CO

ce -4

200

400

600

800

1000

1200

1400

1600

FIT

Figura 3.12 - Componente residual vs. Valores Estimados


47

HI - Independncia Na prtica, violaes desta hiptese so muito difceis de distinguir graficamente Assrm, uma forma de analisar esta hiptese voltarmos a olhar para a Figura 3.12 Como no temos evidncia do tipo de resduos positivos se seguirem a resduos positivos e resduos negafvos se seguirem a resduos negativos, ento no nos parece que esta hiptese seja violada.

Os testes (descritos no Anexo I) efectuados aos resduos levam no rejeio das tapoteses de gaussianidade e independncia. Assim a srie completamente explicada pelo modelo yt = 473,1 + 3,471 + Sc +et. Teste Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Rank Valores 23.18
24.27

131 10764 I Ordem do Modelo com AICC Mnimo = 0

I Hiptese a Testar ^20 Os resduos so ^20 Observaes #(137.33; 6.052) Gaussianas 2 #(10764; 1505.26 ) i.i.d.

Distribuio

Tabela 3.2 - Testes efectuados componente residual 3.4. Modelao Box-Jenkins

Tentmos ajustar srie dos dados um modelo ARMA, como tal seguimos a metodologia de Box-Jenkins apresentada na Figura 2.1 Deste modo, numa primeira fase tentmos identificar o modelo. 3.4.1. Identificao do Modelo Para neutralizar a tendncia diferencimos a srie observada, aplicando o operador diferena, com d= 1: Xt=Vrt = Yt-YtA 3.13. De facto, diferenciando a srie conseguimos estacion-la como se pode ver na Figura

48

1000

Jli , iiiiyi fl|f llilp'llff^f i KmuBUuwr


o z:
LU T LU LL

IS

-1000

2
13

24 35

46 57

68 79

90

112 101 123

134 145

156 167

178 189

200

Sequence number

Figura 3.13 - Srie Adultos diferenciada a 1

Nas Figuras 3.14 e 3.15 apresentamos os grficos da FAC e FACP da srie diferenciada.
1 0,8 0l6 0,4 O 0,2 < 0
1 0,8 0,6 0,4 0,2
-0,2 -0,4 -0,6 -0,8 -1

"- -0,2 i -04 -0,6 -0,8 -1

: f c " " " T P " " . u - u n J 3 n1ni Tr n i

0.
U"U

n D

- R n

LA3

|-| -

|i"

..1 .

Finn U |-u U"Uiauy

S"

LAG

Figura 3.14 - FAC dos resduos

Figura 3.15 - FACP dos resduos

Os grficos da FAC e da FACP da srie diferenciada sugeriam vrios modelos ARMA. Fomos ento testar vrios modelos ARMA, cujo resumo da anlise apresentamos no Anexo VI, concluindo que o mais adequado parece ser um AR (3).

3.4.2. E stimao dos Parmetros

O modelo que iremos estudar , portanto, um ARIMA (3, 1, 0):


(1H>I#H>

2B2-$^){\-B)yt

= et

Estimmos os parmetros pelo mtodo da mxima verosimilhana, e os valores encontrados so os que figuram na Tabela 3.3.

49

Parmetro

Estimativa
-0.5277295 -0.3474348 -0.3307658

Desvio do Erro
0.0660738 0.0718723 0.0664675 -8.0130862 -4.8608065 -5.0349918

Valor de p 0.0000 0.0000 0.0000

Tabela 3.3 - Estudo dos parmetros Pela matriz de correlaes vemos que os parmetros esto pouco correlacionados, o que sugere a razovel qualidade do modelo (Murteira, Muller & Turkman, 1994).
ARI ARI AR2 AR3 1,0000000 ,4311042 ,1981055 AR2 ,4311042 1,0000000 ,4336456 AR3 ,1981055 ,4336456 1,0000000

Tabela 3.4 - Matriz de correlaes dos parmetros Ento o modelo estimado (l+0,5277JB+0,347452+0,3308JB3)(l-5)>'f = e,

3.4.3. E studo dos Resduos

Esta a segunda sub-etapa da segunda fase, na qual vamos verificar as hipteses sobre os resduos.

Avaliao da Qualidade do Ajustamento Pela anlise visual do cronograma dos resduos, Figura 3.16, conclumos que estes no revelam padres de comoortamento.
3l

hl!jt
UjL_iJ " r ni i U

M
Si fi 1 , I
: /' , ( m ':n ;'t M , f i a >(

55 63

71 79

87 95

103 111

119 127

135 143

151 159

167 175

183 191

199 207

Semanas

Figura 3.16 - Cronograma dos Resduos 50

Nas Figuras 3.17 e 3.18, temos representadas a FAC e a FACP e verificamos que so compatveis com as do rudo branco.
1 0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6 -0,8 -1

"
n -

. -

m . .

LAG

Figura 3.17 - F AC dos resduos

Figura 3.18- FACP dos resduos

Mas para validar esta afirmao temos de constatar se de facto so uma sequncia de variveis aleatrias independentes e identicamente distribudas com mdia prxima de zero e varincia constante. I - Normalidade a) Histograma dos Resduos

Std. Dev = ,94 Mean = ,0 N = 154,00

RESDUOS

Figura 3.19 - Histograma dos Resduos

O histograma dos resduos revela um comportamento destes muito prximo da distribuio Gaussiana (Figura 3.19). b) Representao em Papel de Probabilidades Na Figura 3.20 temos a representao dos resduos em papel de probabilidades na qual, confirmando o que j tnhamos dito anteriormente, podemos observar que seguem de perto a linha recta, o que sugere que seguem uma distribuio Gaussiana.
51

Normal Q-Q Plot of RESDUOS

2'

(11

3 m

>
m

f- -1

2.
T>

m
o d) UJ

-^!
-3
-3 -2 -1

ft

Observed Value

Figura 3.20 - Representao em Papel de Probabilidades dos resduos II - Varincia Constante Com base na representao dos resduos do modelo estimado versus os valores estimados, podemos identificar claras violaes da hiptese da varincia constante.
3-

?
a

a
D o D a

1 '
a n a 13

ai

o o o a a -1 r;.t D DQ Da 0 a-1
n%
cP

a a a

n , aa

&
D D a o
n a

o "

D
1

0-

8 o a" o
u#

D D o a a a D Cl D

n * dn
u
n D o n o n

'V , v D ti !
G a

L1

%
o a

-1

B
a

o
O

-2

n
o

W
LU

c e

-3 200

400

600

800

1000

1200

1400

1600

Fit for ADULTO S from AR IMA

Figura 3.21 - Resduos vs. valores estimados No nosso caso, de acordo com a Figura 3.21, no evidente que haja heterocedasticidade, pois no existe nenhum tipo de padro no seu aspecto. III - Independncia Finalmente temos que verificar se os resduos so independentes e pela Figura 3.21 observamos que de facto tm um comportamento aleatrio, no revelando falta de independncia.
52

Parafinalizara anlise dos resduos temos os valores obtidos, com o ITSM, para os vrios testes na Tabela 3.5.
Teste Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Teste Rank Valores 23.30 31.94 128 10224 Distribuio
Z20 Z20

NQ.36.67; 6.042) N( 10660.50; 1494.452)

Hiptese a Testar Os resduos so observaes Gaussianas i.i.d.

Ordem do Modelo com AICC Mnimo = 0 Tabela 3.5 - Testes efectuados aos Resduos Conclumos que os valores obtidos levam no rejeio da hiptese nula.

3.5. Modelo Estrutural

Visando ajustar um modelo estrutural srie Adultos, a seleco das componentes a incluir no modelo baseada nas caractersticas observveis da srie. Uma vez que, tal como j tnhamos visto, a srie apresenta tendncia e sazonalidade, ento fomos testar alguns modelos que inclussem estas componentes de previso, dos quais o modelo estrutural bsico (MEB) com sazonalidade trigonomtrica foi o que apresentou melhores resultados (Anexo VII).

3.5.1. Estimao das Componentes Dado que este modelo j foi definido na Seco 3.2., de seguida apenas apresentamos as estimativas significativas das componentes (Tabela 3.6).
Ht
1192.0 -54.412
fit

3.3624

-192.47 -60.466 -125.51 -84.169 Til 32.234


/26

39.751

90.779
^45

35.073 -39.457

Ta
-50.855

Ti*
43.693

Tu
34.575

ras
-33.464

64.391

-43.414

Tabela 3.6 - Componentes do MEB Como podemos observar na Tabela 3.6, e devido ao facto de termos utilizado a sazonalidade trigonomtrica, obtivemos poucos coeficientes sazonais, o que corrobora a afirmao de Andrews (1994:130): "The primary advantage of trigonometric seasonality is that, in some cases, the higher-orderfrequenciesmay be removed, resulting in fewer seasonal coefficients. This could be particulary useful when modeling Weekly or daily data"
53

Ainda dando relevo a esta afirmao, realamos que o MEB com sazonalidade muda apresentou 33 coeficientes sazonais, ou seja, mais do dobro do que com a sazonalidade trigonomtrica.

3.5.2. Estudo da Componente Residual

atravs da anlise dos resduos que verificamos se o modelo estimado descreve bem a sucesso em estudo. O modelo pode ser considerado adequado se os resduos se apresentarem como rudo branco. Observando o cronograma dos resduos (Figura 3.22) vemos que a sua mdia prxima de zero.

55 63

71 79

87 95

103 111

119 127

135 143

151 159

167 175

183 191

199 207

Semanas

Figura 3.22 - Cronograma da componente residual

Os valores estimados da FAC e FACP, Figuras 3.23 e 3.24, apresentam caractersticas de rudo branco.

0,8 0,6 0,4-

O .2< 0" -0,2 -0,4 -0,6 -0,8

R __n

a 13

DD

o.

0,8 0,6 0,4 0,2 !

0^

u. -0,2 -0,4 -0,6 -0,8 LAG LAG

D"

UJ

""Il

Figura 3.23 - FAC da componente residual

Figura 3.24 - FACP da componente residual

54

Fizemos outras representaes grficas dos resduos (Anexo VIII), atravs das quais constatmos que estes se afastam ligeiramente da normalidade, no nos parecendo no entanto que extsta heterocedasticidade e que estejam correlacionados. Na Tabela 3.7 apresentamos os resultados obtidos, com o ITSM, para os vrios testes efectuados aos resduos. Os resultados agradam-nos particularmente, pois !evam no rejeio da htptese nula, confirmando que o MEB com s a n i d a d e trigonomtrica o modelo adequado para a srie Adultos. Ljung-Box Portmanteau McLeod-Li Portmanteau Pontos de Viragem Teste Rank Valores 16.69
24.21 i^jbuijfo 1 Hiptese a Tes.aT

5901 Ordem do Modelo com AICC Mnimo = 0

#001.33; 27.04) #(5890.5; 12.89)

Os resduos so observaes Gaussianas i.i.d.

Tabela 3.7 - Testes efectuados componente residual

3.6. Comparao de Resultados

Nesta fase do esmdo a comparao dos resultados obtidos pelos trs modelos passa a ser o nosso principal objectivo. Comeamos portanto por avaliar a qualidade do ajustamento de cada um dos modelos, utilizando para tal o desvio padro da srie residual (Mailer ,997) Deste modo, apesar de os trs modelos se ajustarem bem srie Adultos, verificamos que o que apresenta melhores resultados, em termos de desvio padro da srie residua, o modelo de decomposio (Tabela 3.8). Modelo Decomposio
MEB ARBVIA Tabela 3.8 - Desvio padro da componente residual

Passando agora anlise grfica do ajustamento dos vrios modelos, desde a 3' semana de 1996 at 52" semana de 1998, comeamos pelo modelo de Decomposio Podemos observar na Figura 3.25 que apesar de o modelo de decomposio no apresentar um mau ajustamento, mesmo assim verificamos que em alguns picos a aderncia fraca.

55

ADULTOS Holt-Winters 55 63 71 79 87 95 103 119 135 151 167 183 199 207 111 127 143 159 175 191

Semanas

Figura 3.25 - Srie adultos e valores ajustados pelo modelo de decomposio

Por seu lado, o MEB (Figura 3.26) tambm apresenta um ajustamento razovel srie Adultos, embora no to bom quanto o modelo anterior.

55 63

71 79

87 95

103

119

135

151

167

183 199 191 207

111

127

143

159

175

Semanas

Figura 3.26 - Srie Adultos e valores ajustados pelo MEB

Por ltimo, no que diz respeito ao modelo ARIMA, verificamos que este o que apresenta maiores dificuldades em reproduzir as observaes, como se pode constatar na Figura 3.27.

56

ADULTOS A RIMA 55 63 71 79 87 95 103 119 135 151 167 159 183 199 207 111 127 143 175 191

Semanas

Figura 3.27 - Srie Adultos e valores ajustados pelo modelo Arima At aqui vimos o ajustamento dos vrios modelos srie Adultos em termos do seu passado, mas o mais interessa no nosso estudo o comportamento dos modelos em termos futuros. Pois nem sempre o modelo que melhor se ajusta ao conjunto das observaes o que produz as melhores previses.

3.7. Previso
Nesta Seco do nosso estudo apresentamos as previses que obtivemos com os trs modelos para as primeiras 17 semanas de 1999 (as primeiras subsequentes s da nossa srie), as quais apresentamos na Tabela 3.9.
Semanas 209 210 211 212 213 214 215 216 217 218 219 Valores Observados 1203 979 868 1072 821 850 866 978 1057 998 818 Decomp. 1157 859 863 1055 833 909 910 1159 1252 1072 948 MEB 1207 986 873 1081 859 894 919 1043 1132 1076 906 Previses ARIMA 220 221 222 223 224 225 1068 1330 1348 1233 1205 1253 1204 1207 1404 1380 1252 1376 1147 1378 1419 1300 1310 1343

926 891 882 850 889 890 894 885 895 899 903 903 908 911 915 917 920

Tabela 3.9 - Valores observados e previstos para a srie Adultos Para podermos avaliar rigorosamente a qualidade das previses e saber a credibilidade que lhes podemos conferir, importa determinar o erro quadrtico mdio (Makridakis, 1 17 Wheelwright & Hyndman, 1998): EQM = ]T e] e como se pode ver na Tabela 3.10 o MEB 17 =i o modelo que apresenta melhores previses. Modelo EQM Holt-Winters 11228.4 MEB 3941.5 ARIMA 52001.6 57

Tabela 3.10 - EQM para os trs modelos estudados

Nas Figuras 3.28, 3.29 e 3.30 podemos ver isoladamente as previses e os intervalos de previso de cada um dos modelos para a srie Adultos.
2000

___.-----

1000

\ \ /

/>

KJf x<J/ \7
213 215 214 216 217 218 219 220 221 222 223 224 225

ADULTOS Holt-Winters Lim Inferior Lim Su perior

"*v

X.

209 210

211 212

Semanas Figura 3.28 - Srie Adultos, previses e intervalos de previso do modelo de Decomposio

1600

1400

1200

1000

ADULTOS Mffl

800 Lim Inferior 600 209 210 Lim Superior 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225

Semanas Figura 3.29 - Srie Adultos, previses e intervalos de previso obtidas pelo modelo MEB

58

14ULT

1300' 1200-

\ \ v

\
11001000900800

\ \ \

A
211 212

Is

i~
215 214 216

-'

J
i

ADULTOS A RIMA

700 209 210

213

217 218

219 220

221 222

223 224

225

Semanas

Figura 3.30 - Srie Adultos e previses do modelo ARIMA (3, 1,0)

Para melhor podermos comparar as previses obtidas pelos trs modelos representmo-las conjuntamente na Figura 3.31. Como j havamos observado, o modelo que melhor se ajusta srie Adultos o MEB, e o modelo que mais se afasta o modelo ARIMA (3, 1, 0).

209 210

211 212

213 214

215 216

217 218

219 220

221 222

223 224

225

Semanas

Figura 3.31 - Srie Adultos, modelo de decomposio, MEB e ARIMA

Constatamos que as previses do MEB e as obtidas pelo mtodo Holt-Winters so semelhantes, mas nas duas ltimas semanas as previses deste ltimo so um pouco melhores do que as do MEB. Relativamente aos outros dois, o modelo ARIMA o modelo que oferece as previses menos ajustadas.

59

Por observao da Figura 3.31 vemos que nas primeiras cinco semanas as previses do mtodo Holt-Winters e do MEB so praticamente coincidentes umas com as outras e com a srie Adultos. A partir da 7a semana at 15a, o MEB o que melhor acompanha o comportamento da srie Adultos. Deste modo, em termos globais, consideramos que o modelo que melhores previses nos fornece o MEB.

3.8. Concluso
Neste trabalho estudmos trs mtodos diferentes de anlise de sries temporais: decomposio clssica, modelos estruturais e Box-Jenkins. As duas primeiras so muito semelhantes, no sentido em que ambas decompem as sries nas componentes que as compem: tendncia, sazonalidade, ciclo e rudo. Nos modelos estruturais estas componentes so formalizadas como processos estocisticos. O que ptimo do ponto de vista da previso, pois permite a representao destes modelos em espao de estados, que por sua vez permite a utilizao do filtro de Kalman. Estefiltro um processo de estimao recursivo ptimo que actualiza as estimativas medida que vo surgindo novai observaes. Na decomposio clssica tambm se definem e se constrem as componentes, que so no observveis, permitindo uma certa sistematizao do trabalho. Mas a estimao das componentes est sujeita a alguma arbitrariedade dos mtodos a seguir, justificando-se a sua aplicao pela presena da componente residual com comportamento de rudo branco. Da que teoricamente este mtodo esteja menos explicado que na prtica. A aplicao da metodologia Box-Jenkins apresenta mais rigor que a decomposio clssica, mas menos facilidade em ser executada e interpretada. O rigor da sua aplicao advm do facto de ser sustentada por uma famlia de modelos tericos eventualmente capazes de reproduzir o comportamento da srie. A sua execuo dificultada por exigir algumas condies (e.g., estacionaridade) da srie temporal antes da sua modelizao, e porque o modelo que se obtm no oferece a possibilidade de inferncia imediata das caractersticas da srie. Na partefinaldeste trabalho modelmos a srie do nmero semanal de adultos alojados num hotel, utilizando para tal as trs metodologias referidas. Verificou-se que o modelo de decomposio clssica foi o que apresentou melhor ajustamento srie em termos de varincia residual.
60

Obtivemos as previses para as primeiras dezassete semanas subsequentes s nossas observaes, com o intuito de observar qual o mtodo que conseguia obter melhores resultados Constatmos que o modelo estrutural bsico (MEB) foi o que forneceu melhores previses. Pelo mtodo Holt-Winters (na sequncia da decomposio clssica da srie) tambm se obtiveram boas previses, no tanto quanto pelos modelos estruturais, mas bastante melhores do que as obtidas com o modelo ARIMA (utilizando o mtodo Box-Jenkins). Este ltimo revelou uma quase total falta de aderncia ao comportamento da srie. Como projecto para trabalho futuro serie interessante analisar uma srie semelhante mas com observaes dirias, em que fossem considerados os feriados, osfns-de-semanae outras datas relevantes, pois para a rea da hotelaria, caso se conseguissem resultados animadores, seria um trabalho de grande interesse. Julgamos que considerando estes aspectos num futuro estudo, o trabalho se revelaria muito mais conclusivo e valioso.

61

Bibliografia

Andrews, R L. (,994). Forecasting Performance of S.ruchna, Time Series Models. Journal of Business & Economic Statistics, 12 (1), 129-133 Box, G E. P. & Cox, D. R. (,964). An Analysis of Tnmsfonnarion. Journal of Roya, Statistical Society, Series B, (26), 211 -252. Box, G. E. P., Jemdns, G . M .
& Reinse ,_ Q c

Control. New Jersey: Prentice Hall. Brockwe,,, P. J. *


D a v i s , R . A. ( 1 9 9 1 ) Tiae &rfe

neoiy

amjMeihods

New

York

Springer-Verlag. Brockwe,,, P. ,
& D a v i s , R . A. ( 1 9 9 6 )

fc

York. Springer. Harvey, A. C. (,993). Ti Series Models. New York.- Harvester Wheatsheaf. Harvey, A. C. (,996). Forecasts Saurai Time Series Models and ,ne Kalman Filler.

Cambridge: Cambridge University Press. Hatvey, A. C. (,997). Trends, Cycles and Autoregressions. Vie Economic Journal (,07) h 192-201. ' Makridakis, S, Wheelwright, S. C. * Hyndman, R. ,
(I 998).

Forecasling: Metliods and

Applications. New York: John Wiley & Sons, Inc.. Muer, D. (,997). Como Lidar com as Mudanas de Estruiura em Sries Temporais 7 Textos de Apoio n 10. CEMAPRE. Murteira, B. , F., Maer, D. A. * Tnrkman, Cronolgicas. Lisboa: McGraw-Hill. Welch, G. & Bishop, G.(s/d). An introduction to the Kalman Filter. http://www.cs.unc.edu/~welch/kalman^alman.html (17 Mai. 1999).
62
K. F. (I994)

Anexo I

Testes estatsticos efectuados aos resduos (Brockwell & Davis, 1994 e 1991) Teste de Ljung-Box Portmanteau - Neste teste utilizada a estatstica
A

{n-k)
onde pRk a autocorrelao amostrai dos resduos, no lag k e h deve ser da ordem de a, se o valor observado de O for maior do que o quantil (1-a) da distribuio * ' ^ onde n a dimenso da amostra. Este teste rejeita o modelo ARMA (p, q) proposto, no nvel
-p-q.

Teste de McLeod-Li Portmanteau - Apesar de se basear na mesma estatstica que o teste anterior, este teste em vez de utilizar as autocorrelaes amostrais utiliza as autocorrelaes amostrais dos quadrados dos resduos P^,
h

obtendo-se:

Q =n(n + 2)

2 RRk
1

(ll-k)

A hiptese dos resduos serem normais e i.i.d. ser rejeitada no nvel a, se o valor deQ for maior do que o quantil (l-a) da distribuio xl
-p-q.

Teste baseado nos Pontos de Viragem" (Turning Points) - A estatstica T utilizada no presente teste o nmero de pontos de viragem na sucesso dos resduos. Mostra-se que para uma sucesso i.i.d., T assimptoticamente normal com mdia juT = 2(,;-2)/2 e varincia a2T= (16W-29)/90. A hiptese dos resduos serem uma sucesso de observaes i.i.d. ento rejeitada se \T-^l<yT>0Uaa onde 0^2 o quantil (i-a/2 ) da distribuio standard.

63

Teste Rank - Este um teste muito til para detectar alguma tendncia linear nos resduos. Seja P o nmero de pares (ij) tais que/?, > R,
ej

> i, i = 1,..., n-\. Se os resduos forem

i.i.d., ento a mdia de P & = n(n-l)/4, a varincia a] = n(n - l)(2n+5)/8 e P assimptoticamente normal. A hiptese dos resduos serem uma sucesso de observaes i.i.d. consequentemente rejeitada se \P-^P\lai>0Uaa onde 0^2.

Modelo AR com AICC mnimo - Se os resduos forem compatveis com uma sequncia de observaes i.i.d., ento a autorregresso com AICC mnimo ajustvel aos resduos dever ter ordem p = 0. No ITSM (PEST) atravs das equaes de Yule-Walker so calculados os valores de AICC para modelos AR de ordens 0, 1, ..., 26 ajustados aos resduos, dando-nos depois a ordem p do modelo com AICC mnimo. Um valor dep > 0 sugere a existncia de alguma correlaes nos resduos, contradizendo a hiptese dos resduos serem observaes de um rudo branco.

64

<

es JO
TS

"5 s

+
m O

I s)

ta
o (S

<

cN I

I
&5

+ <

8. s
H
CO

u u
* *

c
o m
TJ

os

03

2q

U o

+
(/]

o o
SB eu

5 I

+ +
2 So

as
i

O CN

tu
a o C

a O

=3

5?

8. s
o O

VI

+
T , T
VI

O c -es

o o a o
CJ -CJ

o u
V VI

a o '5

II

I
en

s
o

s s
t

t?

CJ O es

s;
CJ

GO s s>

_c "C 0. I

+
+ n

E
u o

+ + +
Il II

u
o

8 s
i

o o 73

i
+ o
+

+
-

s
o

II

n u

+
T Il

<

e '5
u

*1
+ o n E

*1
+ o n E *8

o -w

*l

0. es

1
es

a
an

*8

. . 8 c
o

+ 7
n n E

w+ I
- s- o

S
o

n s *8

5 S S

H
II

1t

CJ

'5 rs a II
K CJ

a O o '1?
+
<*v

E
CJ

o et
i^

.-

o CJ o

T3

^ _
i

a o

O CJ

Il |

es o
-03 O O

il
o
es

c
a o 73
es

-o

-O

es

e
an Ci O

es
O
/5

CJ 25

>

<IJ TJ

o o

U S '5 c

VI

3 VI

|
g
a o

o .a

CJ

o U

e e a.

I
to

_o
U

? eu

C O c>

o les a o 73

G
s
r>
es IT)

I
H5
J3 V5
C/J

5
~~ es C3 T 3
CJ

a
c o

.2 S
o u L> J2 73 es a o
CD O

es o

es
<>

O *3
t T3 O

e E

S o , o. u i

S, 73 -S S

'S3

CJ

c s

1 * 1

C cl) T3 C

es
o o

5 o .S u

CJ

H
W

65

Anexo III

Exemplo de Aplicao do Filtro de Kalman Consideremos o modelo em espao de estados yt=st+wt+et st = 0.6s,_,+0.5w,_,+wf wt =0.3M+0.8w,_,+v, onde st ~ N(0.1), ut o N(0, 2), v, n N(0, 3) e cov (ut, vt) = 0.7. Dispomos das observaes^,,y2, ...,yt_x e pretendemos obter j)r+1. Como o modelo 4.3.1 se encontra representado em espaos de estados, temos que
Z=

T=

0.6 0.5 0.3 0.8


\\T-l

R=

" 2 0.7"
0.7 3

h=l. 1 0.5 0.5 1

Supondo que se tem xT

10 e matriz de covarincias estimadas P 1 5 r-iir-i

Previso Atravs do filtro de Kalman temos 0.6 O.5T1O 0.3 0.8 5 8.5 7

rir-i

= 75c

l TP e a matriz de covarincia do erro Prir-i TIT, -=

T-\\T-\T+RR'-

O preditor a um passo dado por j) -Zx

=15 5.

2.670 1.555 1.555 4.314

Se dispomos, agora, de>>f = 16 ento o erro de previso t = yt - yt = 0.5 Actualizao

Recorrendo s equaes de actualizao do filtro de Kalman, a estimativa actualizada V = *nr-i +K\yT


-Z,XT\T-\\-

8.690 0.380 em que KT = 7.265 0.529


66

A matriz de covarincias do erro p

T\T

1.060 -0.675" 0.675 1.210 = 16.75

Finalmente, como pretendamos yT+l = K

67

Anexo IV

Da anlise da representao grfica da srie (Figura 4.2), constatamos que a srie Adultos apresenta tendncia linear. Ajustmos ento uma tendncia linear srie Adultos, efectuando uma regresso linear simples, em que a varivel independente o tempo, que permitiu obter os resultados sumariados na Tabela A. 2. Estimativas 465,27 3,548 Erro Padro 34,793 0,289 Estatstica / 13,373 12,290 Valor-/? 0,000 0,000

Tabela A. 2 - Resultados da regresso linear simples

A partir dos resultados obtidos construmos a srie Adultos sem tendncia, cuja representao grfica pode ser analisada na Figura A. 1.
600

400

200

-200
m

" 5
<j -600

-400

1
12

23 34

45 56

67 78

89

111 100 122

133 144

155 166

177 188

199

Semanas Figura A. 1 - Cronograma da srie Adultos sem tendncia

Esta srie foi posteriormente utilizada para examinar quais as periodicidades, se as houver, que regem a variao dos dados. Para isso calculmos o periodograma da srie Adultos, depois de retirada a tendncia, cuja representao grfica se apresenta na Figura A.2. Como dispomos de 208 observaes, o periodograma consta de 104 ordenadas.
68

5000000

4000000

3000000

2000000

1000000

0 1 7 13 19 25 31 37 43 49 55 61 67 73 79 85 91 97 103

Figura A. 2 - Periodograma da srie Adultos sem tendncia Para avaliar a significncia dos picos observados utilizmos os testes de Walker e de Whittle, cujos resultados apresentamos na Tabela A.3. Perodo 52 26 17,33333 10,4 2,166667 4 4,333333 4,727273 5 , 2 3,714286 Frequncia 0,12083 0,241661 0,362491 0,604152 2,899932 1,570796 1,449966 1,329135 1,208305 1,691627 Periodograma 4564622 1954216 770623,1 549706,6 414140,7 376889,7 337759,4 315144,1 303394,5 297577,9

g*
73,96084 0,236232 0,121968 0,099089 0,082863 0,082223 0,080287 0,081451 0,085368 0,091546

Valor-/? 0,000 0,000 0,000 0,003 0,019 0,022 0,029 0,028 0,020 0,011

Tabela A. 3 - Resultados da regresso linear simples Verificamos que a srie apresenta vrias componentes peridicas bastante significativas, sendo algumas delas mltiplas de outras. Destacam-se, no entanto, as correspondentes aos perodos 52, 26, 17 e 10 semanas.

69

Anexo V

s s s s

1 14 160,1 27 221,8 40 418,3

2 75 131,9 28 157,3 41 315,0

3 75 29 82,9 42

4 77 30 -69,1 43

5 18 57 23,2 44

6 79 32 102,6 45

7 20 33 156,5 46

S 27 34 -3,5 47

9 25,0 22 35 -57,2 48

70 23 36 122,8 49

77 24 -1,1 37 198,6 50

72 25 35 57

73 -33,3 26 39 52

-42,4 -343,1 -343,3 -154,4 -379,6 -307,7 -310,2 -64,1

-158,6 -285,3 -33,7

0 , 9 121,6 263,6 458,8 222,5 245,9 254,0 258,9

151,2 -139,6 378,9 212,5

134,0 -275,9 -257,1

251,4 -284,2 -264,1 -452,5

-1,6 -275,3 -300,5 -233,0

Tabela A.4 - Estimativas normalizadas, " ; 3 dos ndices sazonais

70

Anexo VI

ARMA(p,q) (0,1) (0,2) (0,3)

)
42795,1 42882,5 43090,6 42886,2 41209,6 42205,2 42170,7 40705,8 40235,0 40528,5 40509,6

AIC 2797,3 2798,7 2800,7 2798,8 2794,0 2797,5 2801,3 2792,2 2785,7 2789,2
L

BIC 2803,9 2808,7 2814,1 2808,8 2807,3 2814,2 2821,3 2815,5 2795,7 2805,9 2810,2

Parmetros Significativos* 1 1 2 1 2 3 2 3 3 3 3

0,1) 0,2) 0,3)


(2,3) (3,3) (3,0) (3,1) (3,2)

2790,2

Tabela A.5 - Modelos ARMA testados

71

Anexo VII

Tabela A.6 - Tipos de sazonalidade testados

72

Anexo VIII

Normalidade a) Histograma dos Resduos

Std. Cev = ,96 Mean = ,05 N = 154,00 -2,75 -1,75 -,75 ,25 1,25 2,25 3,25 -2,25 -1,25 -.25 ,75 1,75 2,75 3,75 RESIDUAL

Figura A. 3 - Histograma da componente residual

b) Representao em Papel de Probabilidades Uma das formas mais evidentes para averiguar a normalidade dos resduos fazer a representao em papel de probabilidades. Normal Q-Q Plot of RESIDUAL

-3

-2

Observed Value Figura A. 4 - Representao em papel de probabilidades da componente residual

Varincia Constante e Independncia


<4 '

3'
n

2'
L+l.
M

o a a
a
act

4
a #

no o
D

0.

P a

o a

^ J aU I o
a
KJ

,J

ai o

na
a

r.i

-1 .
a _l

r ft
a
a
D

O a o D a

3
Q W LU

-2-

a a
a

i n

or

-3 200

400

600

800

1000

1200

1400

1600

1800

FIT

Figura A.5 - Componente residual vs. valores estimados

74

Das könnte Ihnen auch gefallen