Beruflich Dokumente
Kultur Dokumente
CDD 624.1
Bibliotecário: João Bosco Dumont do Nascimento – CRB 3/1355
VIVIANE GONÇALVES DIAS
Aprovada em:
BANCA EXAMINADORA
Ao Prof. Dr. Paulo Renato Alves Firmino por me orientar em minha monografia, e
além disso, acompanhar minha jornada acadêmica desde o início e ser sempre tão prestativo ao
me auxiliar a todo momento.
A Profa. Dra. Rosilda Benício de Souza, coorientadora dessa monografia, pela
disponibilidade e atenção ao me ajudar nessa etapa da graduação.
Ao Mestrando em Desenvolvimento Regional Sustentável, Jair Paulino de Sales,
pela apoio em todas as dificuldades que apareceram, pela ajuda com a construção e execução do
código no software R, além da revisão e escrita de vários artigos e dessa monografia, de fato sem
ele a monografia não seria escrita.
Ao Doutorando em Engenharia Elétrica, Ednardo Moreira Rodrigues, e seu assistente,
Alan Batista de Oliveira, aluno de graduação em Engenharia Elétrica, pela adequação do template
utilizado neste trabalho para que o mesmo ficasse de acordo com as normas da biblioteca da
Universidade Federal do Ceará (UFC).
A todos os amigos, especialmente João Emerson, Lucas Benício e Antonio Darlon,
meu muito obrigado. Vocês foram fundamentais para minha formação, por isso merecem o meu
eterno agradecimento.
Aos meus pais, irmãos e sobrinha, que nos momentos de minha ausência dedicados
ao estudo superior, sempre fizeram entender que o futuro é feito a partir da constante dedicação
no presente!
Agradeço ao meu noivo David, que jamais me negou apoio, carinho e incentivo.
Obrigada, amor da minha vida, por aguentar tantas crises de estresse e ansiedade. Sem você do
meu lado esse trabalho não seria possível.
Agradeço a todos os professores por me proporcionar o conhecimento não apenas
racional, mas a manifestação do caráter e afetividade da educação no processo de formação
profissional, por tanto que se dedicaram a mim, não somente por terem me ensinado, mas por
terem me feito aprender.
“O sonho é que leva a gente para frente. Se a
gente for seguir a razão, fica aquietado, acomo-
dado.”
(Ariano Suassuna)
RESUMO
A modelagem estatística oferece suporte racional a decisão em situações que envolvem incerteza,
algo comumente presente em problemas de previsão, avaliação, otimização e controle de sistemas
de produção. Sobre as técnicas voltadas para sistemas dinâmicos, encontram-se na vanguarda da
modelagem estatística formalismos de séries temporais como os modelos individuais ARIMA,
ETS e ANN, além de modelos de combinação como CBF (acrônimo para Copulas-Based
Combined Forecasters), que estendem o método de mínima variância (uma das principais
alternativas da literatura para a combinação de preditores de séries temporais). Sobre as técnicas
voltadas para sistemas dinâmicos, encontram-se formalismos como GRP (do inglês Generalized
Renewal Processes), uma das mais flexíveis ferramentas de modelagem de sistemas reparáveis
(generalizando processos de contagem como o de renovação e de Poisson homogêneo e não-
homogêneo). Ao longo dos anos, a economia nacional passou por diversas mudanças e, com
o tempo, a perspectiva de antever o futuro se tornou de extrema importância, graças a sua
capacidade de propiciar melhor aproveitamento dos benefícios de uma preparação antecipada
de eventos adversos. Na construção civil, a necessidade de antever o futuro e assim intervir no
presente é parte essencial de qualquer empreendimento que venha a ser desenvolvido. Buscou-se
com este trabalho desenvolver ferramentas da modelagem e previsão de séries temporais, a partir
dos estudos realizados sobre CBF e via GRP, utilizando o banco de dados da série temporal
do Índice Nacional de Custo da Construção Civil (INCC), de forma a auxiliar na tomada de
decisão ao inferir sobre os valores futuros da série com o objetivo de sumarizar as dinâmicas
deste fenômeno assim como seus eventos extremos.Para isso, foram utilizados algorítmos que
contemplavam essa abordagens, onde a partir de métricas de desempenho (para os formalismos
de séries temporais) e critérios de informação (para a PRGW) foram escolhidos os melhores
modelos e realizadas as previsões.
Statistical modeling provides rational decision support in situations involving uncertainty, so-
mething commonly found in problems of prediction, evaluation, optimization and control of
systems production. On the techniques for dynamical systems, time series formalisms such as
the ARIMA, ETS and ANN models, as well as combination models such as CBF (acronym for
Copulas-Based Combined Forecasters), which extend the minimum variance method (one of the
main alternatives in the literature for the combination of time series predictors). On the techni-
ques oriented to dynamic systems, are formalisms like GRP (Generalized Renewal Processes),
one of the most flexible tools of modeling of reparable systems (generalizing counting processes
like the one of Renovation and Non-Homogeneous Poisson Process (NHPP) ) . Over the years
the national market has undergone several changes and, over time, the prospect of anticipating
the future has became of extreme importance, thanks to its ability to better exploit the benefits
of early preparedness of adverse events. In civil construction, the need to anticipate the future
and thus intervene in the present is an essential part of any enterprise that may be developed.
This work aimed to develop tools for the modeling and forecasting of time series, based on the
studies carried out on CBF and via RPG, using the time series database of the National Civil
Construction Cost Index (INCC), in order to assist decision making in inferring the future values
of the series in order to summarize the dynamics of this phenomenon as well as its extreme
events.In order to do this, we used algorithms that considered this approach, where from the
metrics of performance (for time series formalisms) and information criteria (for PRGW) the
best models were chosen and the predictions were made.
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2 Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . . . 17
4.1 Índice Nacional de Custo da Construção (INCC) . . . . . . . . . . . . . 17
4.2 Modelos de Previsão de Séries Temporais . . . . . . . . . . . . . . . . . 20
4.2.1 Auto Regressive Integrated Moving Average (Auto Regressive Integrated
Moving Average (ARIMA)) . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2.2 Suavização Exponencial (ETS) . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2.3 Redes Neurais Artificiais (ANN) . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 Combinação de Modelos de Séries Temporais . . . . . . . . . . . . . . . 26
4.3.1 Média Simples (SA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.2 Mediana Simples (SM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.3 Mínima Variância (Mínima Variância (MV)) . . . . . . . . . . . . . . . . 27
4.4 Combinadores baseados em Cópulas . . . . . . . . . . . . . . . . . . . . . 28
4.4.1 Cópulas Arquimedianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4.1.1 Cópula Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4.1.2 Cópula Clayton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.1.3 Cópula Frank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.2 Cópulas Elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.2.1 Cópula Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5 Processos de Renovação Generalizados baseados na Distribuição De Wei-
bull (PRGW) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.6 Métricas de Qualidade de Modelos . . . . . . . . . . . . . . . . . . . . . 35
4.6.1 Critérios de Informação de Akaike . . . . . . . . . . . . . . . . . . . . . . 35
4.6.2 Métricas de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.6.2.1 Mean Square Error - Mean Square Error/ Erro Quadrático Médio (MSE) . . 36
4.6.2.2 Mean Absolute Percentual Error - Mean Absolute Percentual Error (MAPE) 36
4.6.2.3 Theil’s U . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.6.2.4 Average Relative Variance - ARV . . . . . . . . . . . . . . . . . . . . . . . 37
4.6.2.5 Prediction On Change In Direction - Prediction On Change In Direction
(POCID) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6 RESULTADOS E DISCUSSÕES . . . . . . . . . . . . . . . . . . . . . . 42
6.1 Modelando e Prevendo Eventos Extremos . . . . . . . . . . . . . . . . . 44
6.2 Modelando e Prevendo o Índice . . . . . . . . . . . . . . . . . . . . . . . 47
6.3 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
13
1 INTRODUÇÃO
poderosa, visto que possibilitam analisar dados sobre o comportamento de uma determinada
variável no tempo, gerar modelos e indicar cenários (MORETTIN; TOLOI, 2006). Uma série
temporal pode ser entendida em termos gerais como um conjunto de valores acerca de um mesmo
fenômeno, coletados em espaços de tempo igualmente espaçados. Ao conjunto de variáveis que
geraram tais dados, dá-se o nome de processo estocástico.
Além disso, a identificação de padrões da série, como sazonalidade e tendência nas
variáveis de interesse, é de extrema importância para a construção civil, em especial, assim como
em sistemas de produção em geral. A partir de ferramentas de previsão de séries temporais,
Faria (FARIA, L.B., 2016) estimou a tendência da elevação no valor do metro quadrado nos
bairros de Fortaleza. Já Barbosa, Ferreira Irmão e Melo (BARBOSA; IRMÃO, 2015) avaliaram
os impactos do Projeto Minha Casa Minha Vida no Índice de Velocidade de Vendas na região
metropolitana de Recife. Estes trabalhos ilustram o potencial do estudo de séries temporais
e sua contribuição para a avaliação das dimensões econômica e social da sustentabilidade da
construção civil de forma a fornecer a decisão no âmbito da construção civil.
Buscou-se com este trabalho modelar e prever a série temporal do Índice Nacional
de Custo da Construção (Índice Nacional de Custo da Construção (INCC)), bem como o tempo
entre eventos extremos deste índice. Para tanto, formalismos que contemplam o estado da arte da
modelagem e previsão de processos estocásticos em geral e séries temporais em especial foram
considerados.
15
2 JUSTIFICATIVA
A construção civil é uma das atividades econômicas que representam grande parcela
do produto interno bruto de qualquer país e tem efeitos significativos na empregabilidade de
pessoal (AZEVEDO et al., 2011). Tal segmento econômico é uma atividade que envolve
grande investimento, tanto para empresas construtoras quanto para seus clientes. Além disso, na
construção civil, a necessidade de compreender o passado e antever o futuro é parte essencial de
qualquer empreendimento. Para tanto, a análise dos índices correlatos mostra-se indispensável.
Ainda segundo Azevedo (2011), o processo de orçar um empreendimento torna-se
fator crítico para empresas construtoras antes que a edificação seja projetada em detalhes e que os
contratos de venda e de fornecimento sejam firmados. Dessa forma, a partir de uma investigação
de custos criteriosa, pode-se reduzir desvios que impactem na lucratividade do empreendimento
ou até mesmo inviabilizem a continuidade da execução de uma obra (LOPES et al., 2003; TAS;
YAMAN, 2005).
Entre os índices que possuem grande importância na construção civil no Brasil, se
encontra o INCC, cuja divulgação ocorre desde fevereiro de 1944 e permanece até os dias de hoje,
tendo o objetivo de analisar o desempenho dos gastos das construções e aluguéis habitacionais.
Geralmente, ele é cobrado para corrigir contratos na compra de imóveis, enquanto uma obra
ainda está sendo construída, fornecendo assim uma importante ferramenta na tomada de decisão
com relação a investimentos imobiliários.
Com vistas a contribuir para esse contexto em evolução, este projeto traz uma nova
abordagem para lidar com investimentos na construção civil e apresenta um estudo onde o
objetivo é sumarizar as dinâmicas do INCC, bem como prever seus eventos extremos futuros.
Defende-se que tal suporte na tomada de decisão, favorece a otimização e o controle da produção
de empresas do ramo da construção civil. Especificamente, pretende-se modelar a série temporal
do INCC de forma a prevê-lo, bem como o tempo entre ocorrências de seus eventos extremos.
Aqui, compreendam-se eventos extremos como sendo valores elevados desse índice. Para ambas
as etapas, de modelagem e previsão do INCC e dos tempos entre seus eventos extremos, serão
consideradas algumas das principais ferramentas estatístico-computacionais disponíveis, de
forma a promover a minimização dos erros de previsão.
16
3 OBJETIVOS
4 FUNDAMENTAÇÃO TEÓRICA
Nesta seção, são introduzidos aspectos que englobam o INCC, assim como os
modelos de previsão de séries temporais e de processos de renovação generalizados adotados.
o dia 10 do mês de referência) e INCC-M (evolução dos custos entre o dia 21 do mês anterior e
o dia 20 do mês de referência). Este trabalho se dedicará ao INCC-M.
Segundo o Fundação Getúlio Vargas (FGV) Instituto Brasileiro de Economia (IBRE)
(Instituto Brasileiro de Economia) (2016) o INCC é calculado através da conjugação de um
sistema de pesos a um sistema de preços referentes a uma amostra de insumos que vão de merca-
dorias a mão-de-obra, entre outros insumos, com representatividade na indústria da construção
civil. Além da composição geral, o INCC desdobra-se em dois grandes grupos:
• Materiais, equipamentos e serviços;
• Mão-de-obra.
Na escolha da amostra do INCC, são usados orçamentos analíticos de empresas de
engenharia civil, tomando-se como base de cálculo planilhas de composição de custos dos dois
grandes grupos já citados. Além disso, são considerados três padrões de construção:
• H1 – Casa de 1 pavimento com sala, 1 quarto e demais dependências, medindo
em média 30 m2 .
• H4 – Edifício habitacional de 4 pavimentos, constituído por unidades autônomas
de sala, 3 quartos e dependências com área total média de 2520 m2 .
• H12 – Edifício habitacional de 12 pavimentos, composto de apartamentos de
sala, 3 quartos e dependências, com área total média de 6013 m2 .
Como resultado final, têm-se uma amostra com padrões de residências/edifícios
habitacionais de boa qualidade, sem luxo, chegando-se ao total de 723 itens específicos, sendo
659 relativos a materiais, equipamentos e serviços e 64 relacionados a mão-de-obra. Ao todo
os dados obtidos somam 7300 informações, que são provenientes de aproximadamente 1200
informantes.
Na determinação do INCC-M, adotam-se os seguintes procedimentos:
• Calculam-se, inicialmente, em nível municipal, para o período de referência t,
relativos de preços (Eq. 4.1) de variedades de insumos (mercadorias, serviços e
mão-de-obra) .
• Na sequência, obtêm-se relativos médios desses insumos através de média geomé-
trica de relativos (Eq. 4.2). Este é o nível mais elementar em que são divulgados
resultados.
• A agregação para níveis superiores é feita por média aritmética ponderada dos
pesos dos insumos e relativos médios de insumos em cada município (segundo a
19
Eq. 4.3)
• Por fim, estima-se o índice nacional com base na importância relativa de cada
município, que é função da área total edificada segundo as licenças de “habite-se”
(Eq.4.4).
Em termos algébricos, calcula-se o índice geral através das seguintes expressões:
Pt i,v,M
Rt i,v,M = i,M
(4.1)
Pt−1
n 1
i,M
Rt = ( ∏ Rt i,v,M ) n (4.2)
v=1
i,M
ΣWt i,M Rt
IM
j, j−1 = (4.3)
ΣWt i,M
n
It = ∑ QM · I Mj,j−1 (4.4)
M=1
Sendo:
It = o INCC do mês de referência t;
IM
j, j−1 = o índice do município M no mês de referência j em relação ao mês imedia-
tamente anterior j − 1;
QM = peso do município M, de acordo com a Tabela 1, tal que:
n
∑ QM = 1 (4.5)
M=1
de modelos, a relação entre tendência (T), sazonalidade (S) e erro (E) é aditiva (Eq. 4.11),
multiplicativa (Eq. 4.12) ou mesmo com variações (Eq. 4.13).
ut = T + S + E. (4.11)
ut = T · S · E. (4.12)
ut = (T + S) · E. (4.13)
Th = l. (4.14)
Th = l + bh. (4.15)
Th = lbh . (4.17)
2 +...+φ h )
Th = lb(φ +φ , (4.18)
e saídas). A formulação matemática da relação entre as entradas (Ut−1 , ...,Ut−p ) e as saídas (Ut )
é apresentada na Equação 4.19
!
Q P
ut = w0 + ∑ w j g w0 j + ∑ wi, jUt−i + et , (4.19)
j=1 i=1
∑ki=1 xt,i
ût = , (4.20)
k
Para o modelo MV, o valor estimado é calculado por pesos referentes às covariâncias
dos erros de todos os modelos individuais. Envolvendo assim tanto a variância do erro de cada
modelo quanto sua covariância em relação aos demais modelos individuais. Assim, quanto
maiores as covariâncias subjacentes a um determinado erro de modelo, menor é o seu peso.
k
ût = ∑ ωi xt,i , (4.21)
i=1
e
∑kl=1 al j
ωj = , (4.22)
∑kl=1 ∑kj=1 al j
28
σ22 − σ12
ω1 = , (4.23)
σ12 + σ22 − 2σ12
e
σ12 − σ12
ω2 = , (4.24)
σ12 + σ22 − 2σ12
onde σi2 é a variância do erro do modelo i e σi, j é a covariância entre os erros dos modelos Xi
and X j .
O conceito de cópulas foi introduzido por Abe Sklar (SKLAR, 1959) apud (NEL-
SEN, 2007) que destaca que a distribuição conjunta de um conjunto de variáveis dado por
V = (V1 ,V2 , ...,Vk ) pode ser função das distribuições marginais destas variáveis.
A função cópula relaciona duas ou mais distribuições de probabilidade marginais
formando uma distribuição de probabilidade marginal multivariada (conjunta) de forma que não
haja perda de informação. A principal vantagem deste formalismo é a de que a escolha de um
modelo adequado para a dependência entre variáveis, representado pela cópula, pode proceder
independentemente das distribuições marginais das variáveis (GENEST; FAVRE, 2007).
A função cópula, C(·), é uma distribuição acumulada multivariada cujas marginais
são uniformes no intervalo unitário [0, 1]. De forma geral, seja V = (V1 ,V2 , ...,Vk ) um vetor com
k variáveis de tal forma que V ∈ [0, 1]k , então a função cópula é dada pela distribuição acumulada
conjunta de V .
distribuições marginais (YAN, 2007). Neste sentido, considere-se o vetor de k variáveis aleatórias
X = (X1 , X2 , ..., Xk ), com distribuição acumulada conjunta dada por FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) e
distribuições acumuladas marginais dadas por FXi (xi ). Segundo o teorema de Sklar (SKLAR,
1959), no qual o formalismo de cópulas se baseia para modelar distribuições de probabilidade
multivariadas, para qualquer vetor X de variáveis aleatórias, existe uma função acumulada
conjunta FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) tal que:
v j = FX j (x j ) (4.27)
Desta forma, V possui distribuições marginais uniformes no intervalo [0, 1], inde-
pendente das distribuições marginais de X. Assim, as distribuições acumuladas de ambos os
vetores V e X coincidem devido às relações em (4.26) e (4.27).
Sobre a função de densidade de probabilidade conjunta de X, pX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ),
pode-se demonstrar que:
k
∂ k FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk )
pX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = = c[FX1 (x1 ), ..., FXk (xk )] ∏ pX j (x j ) (4.28)
∂ x1 ...∂ xk j=1
∂k
c(v1 , ..., vk ) = C(v1 , ..., vk ) (4.29)
∂ v1 ...∂ vk
Com γ ∈ [1,∞)
31
n 1
C(u1 , ......, un ) = exp(−( ∑ (−(ln ui )γ ) γ ), (4.32)
i=1
1
Φ(u) = (uγ − 1) (4.33)
γ
n −1
−γ
C(u1 , ......, un ) = (1 + ∑ (ui − 1) γ ), (4.34)
i=1
exp(−uγ − 1)
Φ(u) = −ln (4.35)
exp(−γ − 1)
n
−1 −γ −d+1
C(u1 , ......, un ) = ln(1 − (−e ) ∏(1 − exp(−γui))). (4.36)
γ i=1
A cópula normal (ou Gaussiana) faz parte da familia de cópulas elípticas, é simétrica
e não admite dependência em suas extremidades (CORDEIRO, 2009). Ela é obtida de uma
distribuição multivariada, pelo método da inversão, conforme abaixo, para o caso envolvendo
duas variáveis:
de vista matemático, as intervenções sobre o sistema ocorreriam nestes dois extremos: o reparo
perfeito (PR), em que as intervenções levam o sistema a uma condição de “tão bom quanto
novo”, e o reparo mínimo (PNHP), em que o sistema é levado a uma condição de "tão ruim
quanto antes da intervenção"(MODARRES, 2016).
Entretanto, o real efeito de intervenções sobre sistemas dinâmicos normalmente
ocorre fora das situações polarizadas por Processo de Renovação (PR) e Processo Não Homo-
gêneo de Poisson (PNHP). Neste sentido, foram elaborados modelos específicos com destaque
aos que utilizam o conceito de idade virtual, proposto por Kijima e Sumita (KIJIMA; SUMITA,
1986), para os quais a qualidade das intervenções seria modelada a partir de um parâmetro
de rejuvenescimento, q, para o sistema em questão. Este tipo de modelo foi denominado de
Processo de Renovação Generalizado (PRG).
PRG é uma abordagem dedicada a sistemas dinâmicos expostos a intervenções
planejadas ou não planejadas. A modelagem ocorre adicionando-se q ao conjunto de parâmetros
da distribuição de probabilidade subjacente ao tempo até a primeira intervenção ao sistema.
Kijima e Sumita (KIJIMA; SUMITA, 1986) propuseram dois modelos de idade
virtual que buscam retratar o sistema a partir da relação entre q e a real idade do sistema.
Tratam-se dos modelos denominados Kijima Tipo I (KI) e Kijima Tipo II (KII). O primeiro
parte do princípio de que cada intervenção age apenas da condição do sistema estabelecida pela
intervenção prévia, não repercutindo sobre a sua história regressa. O segundo baseia-se na ideia
de que cada intervenção atua sobre toda a história regressa do sistema.
Baseando-se em Ferreira (FERREIRA et al., 2015), a Equação (4.38) apresenta uma
combinação linear de KI e KII, relacionando a idade real do sistema a sua idade virtual, a partir
de uma função de q. Para tanto, sejam (X1 , X2 , ..., Xn ) os tempos entre n intervenções ao sistema.
Para se computar a idade virtual do sistema após a ia intervenção, assume-se θ = 1 via KI e
θ = 0 via KII.
β −1
β x + vi−1
hXi (x + vi−1 |vi−1 , α, β ) = . (4.39)
α α
β
Wi = (Xi +Vi−1 )β −Vi−1 . (4.40)
35
A partir do formalismo a ser adotado, seja para modelagem dos valores do INCC
ou de seus eventos extremos, a identificação do melhor modelo é ainda desafiadora. Cada
formalismo pode oferecer inúmeros modelos. Por exemplo, PRGW pode ser customizado a PR e
PNHP, bem como recorrer a KI e KII. Por sua vez, ARIMA (p, d, q) varia à medida que qualquer
uma destas ordens varia. Dentre as métricas de qualidade de modelos, destacam-se aquelas que
medem parcimônia. Elas envolvem um equilíbrio entre o grau de simplicidade e de assertividade
do modelo.
Segundo Bozdangan (BOZDOGAN, 1987) a partir de um ponto de vista estatístico,
a seleção do modelo apropriado é uma atividade de extrema relevância. Normalmente são
preferidos os modelos parcimoniosos, por serem capazes de explicar o comportamento das
variáveis analisadas, detendo o menor número de parâmetros possível.
Dentre as diversas alternativas utilizadas para este processo avaliativo, os critérios de
informação de Akaike (Akaike Information Criteria (AIC)) (4.41), Akaike Corrigido (Second-
Order Akaike Information Criteria (AICc)) (4.42) e Bayesiano (Bayesian Information Criteria
(BIC)) (4.43) recebem maior destaque. Através do AIC, por exemplo, objetiva-se minimizar a
equação (4.40) (BOZDOGAN, 1987; GERNAND, 2009; AKAIKE, 1974).
2(k + 1)(k + 2)
AICc = AIC + , (4.42)
n−k−2
e
BIC = −2 log(maximum likelihood) + k log(n), (4.43)
et = ut − ût (4.44)
N
∑t=1 (ut − ût )2
MSE = (4.45)
N
100 N ut − ût
MAPE = ∑ ut (4.46)
N t=1
4.6.2.3 Theil’s U
N
∑t=1 (ut − ût )2
T heilU = N
(4.47)
∑t=1 (ut − ut−1 )2
Sendo que se TheilU = 1, o modelo testado tem desempenho igual ao Random Walk;
e quando TheilU > 1, o desempenho é inferior e, se TheilU < 1, o modelo é superior ao Random
Walk. Quanto mais próximo de 0 (zero) o TheilU , melhor o desempenho de um modelo.
N
∑t=1 (ut − ût )2
ARV = N
(4.48)
∑t=1 (ût − ū)2
N
∑t=1 Dt
POCID = 100 (4.49)
N
1, se (ut − ut−1 )(ût − ût−1 ) ≥ 0
Dt = (4.50)
0, caso contrário.
O POCID terá resultado entre 0 (zero) e 100 (cem), e, quanto mais próximo de 100,
melhor será o modelo de previsão. Essa métrica de desempenho é muito importante quando
aplicada ao mercado de ações, pois a correta previsão de subidas e descidas das cotações das
ações afetam diretamente os ganhos e as perdas financeiras.Neste trabalho é utilizado o WPOCID
cujo valor é obtido subtraindo-se 1 do valor do POCID, sendo a interpretação neste caso de que
quando mais próximo a 0, melhor será o modelo de previsão.
39
5 METODOLOGIA
das séries temporais, e com séries dinâmicas como séries econômicas (MUELLER et al., 1996),
demanda de tráfego (LAW; AU, 1999) e até mesmo irradiação solar (MELLIT; PAVAN, 2010).
As combinações de preditores foram usadas neste trabalho para aumentar a acurácia
e a eficiência da previsão, como já foi demonstrado por autores como Newbold (NEWBOLD;
GRANGER, 1974), Winkler (WINKLER; MAKRIDAKIS, 1983) e Bates (BATES; GRANGER,
1969). A técnica que utiliza a SA como método de combinação já foi utilizada em diversos
trabalhos como na previsão de índices de preços (MARQUES, 2005), na previsão de demanda
(HOLLAUER et al., 2008) enquanto a MV foi utilizada em trabalhos como (BATES; GRANGER,
1969), (WEIMER et al., 2003) e a mediana simples em séries financeiras como o valor da inflação
divulgada pelo Banco Central do Brasil (CARVALHO et al., 2009).
42
6 RESULTADOS E DISCUSSÕES
crescimento continuou nos anos de 1993 e 1994, com a implantação do Plano Real, registrando
uma taxa de crescimento do PIB em torno de 5,9%. Essa melhora econômica também trouxe
impactos positivos para a construção civil, assim como a estabilização do INCC.
A partir da Figura 2 , pode-se perceber uma tendência no aumento do valor dos dados
44
da série (trend), assim como uma sazonalidade (seasonal), o que pode influenciar negativamente
o modelo individual ARIMA.
A seguir, análises detalhadas a partir dos formalismos apresentados anteriormente
serão apresentadas.
PRG aos dados sob estudo, o teste sugerido por (OLIVEIRA et al., 2016) foi adotado.
Por último, pode-se realizar a análise das modelagens pretendidas e a obtenção do
modelo que melhor se ajustou ao banco de dados trabalhado, de acordo com os critérios de
informação apresentados anteriormente. De tal modelo, obtiveram-se ainda previsões sobre
eventos extremos não contemplados pela série dedicada à etapa de modelagem.
A análise da série do INCC apresentou os valores da Tabela 3, para os parâmetros de
PRGW, com base nos valores extremos (quantil 85%).
A Tabela 3 apresenta as estimativas de máxima verossimilhança para os parâmetros
α, β e q (digam-se â, b̂, q̂) e resume a qualidade dos modelos ajustados, de acordo com os
critérios de informação previamente introduzidos. Deve-se escolher aquele modelo que possui
os menores índices de AIC, AICc e BIC.
Tabela 3 – Valores de critérios de informação sobre modelos PRGW dedicados à série do INCC,
considerando como eventos extremos valores de ao menos 1.1585%
Formalismo AIC AICc BIC a b q
PR 245.5823 245.89 249.0577 6.36 0.94 0
PNHP 237.9589 238.2666 241.4342 1.0178 0.6675 1
Kijima I 239.3510 239.9826 244.5641 1.140475 0.6072 0.2726
Kijima II 239.9598 240.5904 245.1719 1.017812 0.6675 1
Fonte: O autor
Neste sentido, para o caso em estudo, o modelo que melhor se ajustou ao sistema do
INCC foi o PNHP, o que indica que as intervenções realizadas no sistema não conseguem atuar
na recuperação das falhas decorrentes de todos os intervalos anteriores de exposição, desde a fase
inicial de operação do sistema, somente deixá-lo em uma condição de "tão ruim quanto estava".
Em outros termos, as intervenções econômicas não estariam surtindo por si só tanto efeito
assim. Por outro lado, como tem-se uma estimativa para β , b < 1, pode-se inferir que, devido
a circunstâncias adversas às intervenções, intrínsecas ao próprio sistema, ele tem apresentado
melhorias.
Do teste de aderência sugerido por Oliveira (OLIVEIRA et al., 2016), conclui-se
que os dados originais seguem o PRGW sob um nível de significância de 1%. De fato, o nível de
significância dos dados foi de p-value = 50,9%.
A Figura 4 apresenta, de forma acumulada, os tempos entre as ocorrências de eventos
extremos do INCC. Pode-se notar a existência de uma tendência quase linear na série histórica,
indicando a ausência de aumentos ou diminuições significativas na quantidade de tempo referente
46
conclui-se que, de acordo com o INCC, o Brasil vivencia historicamente períodos de melhora
irrelevantemente atenuados por suas intervenções. Naturalmente, tais argumentos fundamentam-
se apenas no estudo sobre o INCC, mas com grande repercussão sobre outros indicadores
econômicos importantes.
Tabela 5 – Estimativas dos parâmetros para os modelos sob estudo, individuais (ARIMA, ANN
e ETS) e combinados (MV e CB) para a série do INCC.
Metodologia Arquitetura Estimativas de parâmetros
ARIMA (3,1,1) φ̂1 = 0,1027; φ̂2 = 0,1014; φ̂3 =
0,1019; θ̂1 = 0,0542
ETS (M,N,N) φ̂ = 0,5031
ANN (2,3,1) 2 nós de entrada (ut−1 e ut−12 ), 3 nós
na camada oculta e 1 nó de saída (ut )
MV pesos (ω̂1 , ω̂2 , ω̂3 ) =
(0, 991, −0, 0283, 0, 0373)
CB Distribuição dos erros dos modelos ANN, E1 ∼ SNORM(−0.00316, 0.0181)∗ ,
ARIMA e ETS, (E1 , E2 , E3 ), bem como de E2 ∼
sua cópula de dependência, C(v1 , v2 , v3 ) SNORM(0.000908, 0.00871)∗ ,
E3 ∼ SNORM(−0.0162, 0.0193)∗ ,
C ≡ Normal(ρ̂E1 ,E2 =
0.273, ρ̂E1 ,E3 = 0.3, ρ̂E2 ,E3 = 0.825)
∗SNORM(l, s) ≡ Distribuição normal assimétrica, com parâmetros de localização l e de escala s.
Fonte: O autor
Figura 5 – Modelo Individual dedicado à série do INCC representando a série completa, bem
como suas previsões via ARIMA.
49
Figura 6 – Modelo Individual dedicado à série do INCC representando a série completa, bem
como suas previsões via ETS.
Figura 7 – Modelo Individual dedicado à série do INCC representando a série completa, bem
como suas previsões via ANN.
50
A partir da análise dos dados, foram obtidos os valores das métricas de desempenho
para cada tipo de modelagem de forma a serem determinados os melhores modelos para cada
métrica nas etapas de treinamento e teste. Os valores das métricas são apresentados nas tabelas 6
e 7.
51
Tabela 6 – Dados de Treinamento dos modelos individuais (ANN, ARIMA e ETS), bem como
dos combinadores (SA, SM, MV e CB), dedicados à série INCC. Os melhores
resultados estão em negrito
Métricas ANN ARIMA ETS SA SM MV CB
MSE 0,00009 0,00013 0,00013 0,00015 0,00015 0,00011 0,00010
MAPE 0,01563 0,01864 0,01770 0,02108 0,02072 0,01806 0,01652
Theil 0,663 0,983 0,992 1,20E+14 1,21E+14 0,868 0,81127
ARV 9,67E+14 1,86E+14 1,56E+14 3,50E+13 3,22E+14 1,16E+14 1,42E+14
WPOCID 0,54315 0,62944 0,64975 0,58378 0,61081 0,54054 0,59459
Fonte: O autor
Tabela 7 – Dados de Teste dos modelos individuais (ANN, ARIMA e ETS), bem como dos
combinadores (SA, SM, MV e CB), dedicados à série INCC. Os melhores resultados
estão em negrito.
Métricas ANN ARIMA ETS SA SM MV CB
MSE 0,00008 0,00008 0,00010 0,00008 0,00008 0,00007 0,00007
MAPE 0,01577 0,01516 0,01665 0,01546 0,01545 0,01549 0,01481
Theil 0,60622 0,65641 0,75350 0,60051 0,59878 0,56734 0,54141
ARV 8,52E+14 9,46E+14 3,48E+14 4,97E+14 6,88E+14 6,06E+14 8,83E+13
WPOCID 0,657534 0,589041 0,657534 0,520548 0,520548 0,493151 0,561644
Fonte: O autor
De acordo com os dados de teste, o melhor modelo foi CB, isto é, o de combinação
através de cópulas (melhor desempenho para MSE, MAPE, Theil e ARV), sendo esta metodologia
utilizada para a previsão dos dados. Segundo o WPOCID o melhor modelo foi o MV, de forma
análoga aos dados de treinamento. As métricas auxiliam no processo de decisão de qual é o
melhor modelo embora cada uma tenha suas particularidades com relação a qual seria o melhor
modelo.
Enquanto o MSE, MAPE, Theil e ARV se dedicam a calcular o erro associado a
previsão e sua relação com a aleatoriedade e a média, que é o objetivo principal deste trabalho
52
no que diz respeito a cópulas, enquanto o WPOCID analisa a qualidade do modelo sob outros
parâmetros, como os valores previstos e a sua tendência.
A partir do modelo de combinação através de cópulas CB, utilizando a cópula normal,
foi realizada a previsão através da metodologia de one step ahead, isto é, um passo a frente, para
o primeiro semestre de 2018 e feita a comparação da previsão com os dados reais do INCC para
o mesmo período. A previsão, através de cópulas (CB) e os dados observados são mostrados na
tabela 8.
apresenta em estado de melhora, apesar de ações de intervenções ineficazes, além disso, a análise
dos eventos extremos fornece informações sobre o comportamento do INCC mediante a inflação
vigente no país, servindo como indicador não só do setor da construção civil da economia como
um todo.
Devido ao desempenho atraente da PRGW na modelagem dos tempos entre ocor-
rências de valores extremos do INCC, tem-se um bom nível de confiança para previsões do
seu comportamento futuro, possibilitando auxílio para os investimentos imobiliários no país e
mesmo quanto a políticas públicas de intervenção.
Com este trabalho, pode-se perceber também a eficiência da previsão através da
combinação de modelos individuais se comparado a mesma sendo feita através de modelos
individuais, de forma que a metodologia é válida como uma ferramenta na tomada de decisão, e
baseando-se no caso de estudo, se torna uma ferramenta de extrema relevância ( e necessidade)
no âmbito da construção civil, e no ramo imobiliário em geral ao prever um índice de tamanho
impacto nos valores dos imóveis tanto dos em construção como nos respectivos aluguéis.
Da mesma maneira que foi realizado com o INCC, séries temporais de vários âmbitos
(social, econômico, ambiental) poderão ter a acurácia da previsão melhorada através do uso da
combinação através de cópulas, com a continuidade de estudos e o aprofundamento em outros
tipos de cópulas além das que foram abordadas neste trabalho, assim como a melhoria dos
algoritmos que foram a base desse trabalho de forma a obtenção de previsões com erros menores
dos que os apresentados.
Destaca-se a possibilidade da aplicação dos modelos apresentados em outros casos de
estudo, dedicando-se também ao aprofundamento no que se refere a séries temporais, processos
estocásticos, combinação de modelos de previsão e sistemas reparáveis de forma a corroborar
com a gestão e tomadas de decisões de diversos setores.
54
REFERÊNCIAS
ANDERSEN, T. G.; DAVIS, R. A.; KREIß, J.-P.; MIKOSCH, T. Handbook of Financial Time
Series. Berlin: Springer-Verlag, 2009.
BARBOSA, S. K. G.; IRMÃO, J. F. Análise dos impactos gerados pelo programa minha casa
minha vida no índice de velocidade de vendas na região metropolitana do recife. Race: revista
de administração, contabilidade e economia, Editora Unoesc, v. 14, n. 2, p. 825–842, 2015.
BOX, G. E.; JENKINS, G. M. Time series analysis: forecasting and control, revised ed.
[S.l.]: Holden-Day, 1976.
BOZDOGAN, H. Model selection and akaike’s information criterion (aic): The general theory
and its analytical extensions. Psychometrika, Springer, v. 52, n. 3, p. 345–370, 1987.
CHATFIELD, C. et al. Apples, oranges and mean square error. International Journal of
Forecasting, Elsevier, v. 4, n. 4, p. 515–518, 1988.
CHRISTIANSEN, M.; DENUIT, M.; LUCAS, N.; SCHMIDT, J.-P. Projection models for health
expenses. Annals of Actuarial Science, Cambridge University Press, v. 12, n. 1, p. 185–203,
2018.
55
COLLOPY, F.; ARMSTRONG, J. S. Another error measure for selection of the best
forecasting method: the unbiased absolute percentage error. [S.l.]: Wharton School,
University of Pennsylvania, Marketing Department, 1994.
CRYER, J. D.; CHAN, K.-S. Time Series Analysis: With Applications in R. [S.l.]: Springer
Science & Business Media, 2008.
EDIGER, V. Ş.; AKAR, S. Arima forecasting of primary energy demand by fuel in turkey.
Energy Policy, Elsevier, v. 35, n. 3, p. 1701–1708, 2007.
EYMEN, A.; KÖYLÜ, Ü. Seasonal trend analysis and arima modeling of relative humidity and
wind speed time series around yamula dam. Meteorology and Atmospheric Physics, Springer,
p. 1–12, 2018.
FERREIRA, R. J.; FIRMINO, P. R. A.; CRISTINO, C. T. A mixed kijima model using the
weibull-based generalized renewal processes. PloS one, Public Library of Science, v. 10, n. 7, p.
e0133772, 2015.
GAO, G.; LO, K.; LU, J. Risk assessment due to electricity price forecast uncertainty in uk
electricity market. In: IEEE. Universities Power Engineering Conference (UPEC), 2017
52nd International. [S.l.], 2017. p. 1–6.
56
GARDNER, E. S. Exponential smoothing: The state of the art. Journal of forecasting, Wiley
Online Library, v. 4, n. 1, p. 1–28, 1985.
GENEST, C.; FAVRE, A.-C. Everything you always wanted to know about copula modeling but
were afraid to ask. Journal of hydrologic engineering, American Society of Civil Engineers,
v. 12, n. 4, p. 347–368, 2007.
GERNAND, L. Understanding aic and bic in model selection. Handreichungen zum Vortrag
vom, v. 20, p. 1–18, 2009.
GIL, A. C. Como elaborar projetos de pesquisa. São Paulo, v. 5, n. 61, p. 16–17, 2002.
GUBIAN, S.; XIANG, Y.; SUOMELA, B.; HOENG, J. Generalized simulated annealing for
efficient global optimization: the gensa package for r. The R Journal, 2012.
HERNÁNDEZ, N.; CAMARGO, J.; MORENO, F.; PLAZAS-NOSSA, L.; TORRES, A. Arima
as a forecasting tool for water quality time series measured with uv-vis spectrometers in a
constructed wetland. Tecnología y Ciencias del Agua, Instituto Mexicano de Tecnologia de
Agua, v. 8, n. 5, p. 127–139, 2017.
HYNDMAN, R.; KHANDAKAR, Y. Automatic time series forecasting: The forecast package
for r. Journal of Statistical Software, v. 26, n. 3, p. 1–22, 2008.
HYNDMAN, R. J.; KOEHLER, A. B.; SNYDER, R. D.; GROSE, S. A state space framework
for automatic forecasting using exponential smoothing methods. International Journal of
Forecasting, Elsevier, v. 18, n. 3, p. 439–454, 2002.
JR, E. S. G. Exponential smoothing: The state of the art—part ii. International journal of
forecasting, Elsevier, v. 22, n. 4, p. 637–666, 2006.
57
KHASHEI, M.; BIJARI, M. A new class of hybrid models for time series forecasting. Expert
Systems with Applications, Elsevier, v. 39, n. 4, p. 4344–4357, 2012.
LAW, R.; AU, N. A neural network model to forecast japanese demand for travel to hong kong.
Tourism Management, Elsevier, v. 20, n. 1, p. 89–97, 1999.
MELLIT, A.; PAVAN, A. M. A 24-h forecast of solar irradiance using artificial neural network:
Application for performance prediction of a grid-connected pv plant at trieste, italy. Solar
Energy, Elsevier, v. 84, n. 5, p. 807–821, 2010.
MODARRES, M. Risk analysis in engineering: techniques, tools, and trends. [S.l.]: CRC
press, 2016.
MORETTIN, P. A.; TOLOI, C. Análise de séries temporais. In: Análise de séries temporais.
[S.l.: s.n.], 2006.
NELSEN, R. B. An Introduction to Copulas. 2nd ed. ed. New York: Springer, 2006.
NELSEN, R. B. An introduction to copulas. [S.l.]: Springer Science & Business Media, 2007.
NEWBOLD, P.; GRANGER, C. W. Experience with forecasting univariate time series and
the combination of forecasts. Journal of the Royal Statistical Society. Series A (General),
JSTOR, p. 131–165, 1974.
TSAI, C.; WANG, S. Stock price forecasting by hybrid machine learning techniques. In:
Proceedings of the International MultiConference of Engineers and Computer Scientists.
[S.l.: s.n.], 2009. v. 1, n. 755, p. 60.
VERÍSSIMO, A. J.; ALVES, C. da C.; HENNING, E.; AMARAL, C. E. do; CRUZ, A. C. da.
Métodos estatísticos de suavização exponencial holt-winters para previsão de demanda em uma
empresa do setor metal mecânico. Revista Gestão Industrial, v. 8, n. 4, 2013.
WEIMER, D.; OBER, D.; MAYNARD, N.; COLLIER, M.; MCCOMAS, D.; NESS, N.;
SMITH, C.; WATERMANN, J. Predicting interplanetary magnetic field (imf) propagation
delay times using the minimum variance technique. Journal of Geophysical Research: Space
Physics, Wiley Online Library, v. 108, n. A1, 2003.
YAN, J. Enjoy the joy of copulas: With a package copula. Journal of Statistical Software,
v. 21, p. 1–18, 2007. Disponível em: <http://www.jstatsoft.org/v21/i04/paper>.
YAN, J. et al. Enjoy the joy of copulas: with a package copula. Journal of Statistical Software,
Citeseer, v. 21, n. 4, p. 1–21, 2007.
YU, Z.; LEI, G.; JIANG, Z.; LIU, F. Arima modelling and forecasting of water level in the
middle reach of the yangtze river. In: IEEE. Transportation Information and Safety (ICTIS),
2017 4th International Conference on. [S.l.], 2017. p. 172–177.
ZHANG, G. P. Time series forecasting using a hybrid arima and neural network model.
Neurocomputing, Elsevier, v. 50, p. 159–175, 2003.