Modelando e Prevendo o Indice Nacional de Custo Da Construção Civil Via Cópulas

UNIVERSIDADE FEDERAL DO CARIRI
CENTRO DE CIÊNCIAS E TECNOLOGIA

CURSO DE GRADUAÇÃO EM ENGENHARIA CIVIL
VIVIANE GONÇALVES DIAS
MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE

NACIONAL DE CUSTO DA CONSTRUÇÃO
JUAZEIRO DO NORTE - CEARÁ

2018
MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE NACIONAL DE

CUSTO DA CONSTRUÇÃO
Trabalho de Conclusão de Curso apresentado

ao Curso de Graduação em Engenharia Civil do
Centro de Ciências e Tecnologia da Universi-
dade Federal do Cariri, como requisito parcial à
obtenção do grau de Bacharel em Engenharia
Civil.
Orientador: Prof. Dr. Paulo Renato Al-

ves Firmino
Coorientadora: Profa. Dra. Rosilda Bení-

cio de Souza
JUAZEIRO DO NORTE - CEARÁ

2018
Dados Internacionais de Catalogação na Publicação
Universidade Federal do Cariri
Sistema de Bibliotecas
D53m Dias, Viviane Gonçalves.
Modelando e prevendo processos estocásticos do Índice Nacional de Custo da Construção/
Viviane Gonçalves Dias. – 2018.
60 f.: il. color., enc.; 30 cm.
(Inclui bibliografia p. 54-60).
TCC (Graduação) – Universidade Federal do Cariri, Centro de Ciência e Tecnologia, Curso

de Engenharia Civil, Juazeiro do Norte, 2018.
Orientação: Prof. Dr. Paulo Renato Alves Firmino.

Coorientação: Profª. Dra. Rosilda Benício de Souza.
1. Construção civil. 2. Métodos preditivos. 3. Processos de Renovação Generalizados.

4. Combinação de preditores. 5. Cópulas. I. Título.
CDD 624.1
Bibliotecário: João Bosco Dumont do Nascimento – CRB 3/1355
MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE NACIONAL DE

CUSTO DA CONSTRUÇÃO
Trabalho de Conclusão de Curso apresentado

ao Curso de Graduação em Engenharia Civil do
Centro de Ciências e Tecnologia da Universi-
dade Federal do Cariri, como requisito parcial à
obtenção do grau de Bacharel em Engenharia
Civil.
Aprovada em:
BANCA EXAMINADORA
Prof. Dr. Paulo Renato Alves Firmino (Orientador)

Universidade Federal do Cariri (UFCA)
Profa. Dra. Rosilda Benício de

Souza (Coorientadora)
Prof. Me. Dimas de Castro e Silva Neto

Prof. Me. Pedro Ferreira de Lima

Universidade Regional do Cariri (URCA)
AGRADECIMENTOS
Ao Prof. Dr. Paulo Renato Alves Firmino por me orientar em minha monografia, e
além disso, acompanhar minha jornada acadêmica desde o início e ser sempre tão prestativo ao
me auxiliar a todo momento.
A Profa. Dra. Rosilda Benício de Souza, coorientadora dessa monografia, pela
disponibilidade e atenção ao me ajudar nessa etapa da graduação.
Ao Mestrando em Desenvolvimento Regional Sustentável, Jair Paulino de Sales,
pela apoio em todas as dificuldades que apareceram, pela ajuda com a construção e execução do
código no software R, além da revisão e escrita de vários artigos e dessa monografia, de fato sem
ele a monografia não seria escrita.
Ao Doutorando em Engenharia Elétrica, Ednardo Moreira Rodrigues, e seu assistente,
Alan Batista de Oliveira, aluno de graduação em Engenharia Elétrica, pela adequação do template
utilizado neste trabalho para que o mesmo ficasse de acordo com as normas da biblioteca da
Universidade Federal do Ceará (UFC).
A todos os amigos, especialmente João Emerson, Lucas Benício e Antonio Darlon,
meu muito obrigado. Vocês foram fundamentais para minha formação, por isso merecem o meu
eterno agradecimento.
Aos meus pais, irmãos e sobrinha, que nos momentos de minha ausência dedicados
ao estudo superior, sempre fizeram entender que o futuro é feito a partir da constante dedicação
no presente!
Agradeço ao meu noivo David, que jamais me negou apoio, carinho e incentivo.
Obrigada, amor da minha vida, por aguentar tantas crises de estresse e ansiedade. Sem você do
meu lado esse trabalho não seria possível.
Agradeço a todos os professores por me proporcionar o conhecimento não apenas
racional, mas a manifestação do caráter e afetividade da educação no processo de formação
profissional, por tanto que se dedicaram a mim, não somente por terem me ensinado, mas por
terem me feito aprender.
“O sonho é que leva a gente para frente. Se a
gente for seguir a razão, fica aquietado, acomo-
dado.”
(Ariano Suassuna)
RESUMO
A modelagem estatística oferece suporte racional a decisão em situações que envolvem incerteza,
algo comumente presente em problemas de previsão, avaliação, otimização e controle de sistemas
de produção. Sobre as técnicas voltadas para sistemas dinâmicos, encontram-se na vanguarda da
modelagem estatística formalismos de séries temporais como os modelos individuais ARIMA,
ETS e ANN, além de modelos de combinação como CBF (acrônimo para Copulas-Based
Combined Forecasters), que estendem o método de mínima variância (uma das principais
alternativas da literatura para a combinação de preditores de séries temporais). Sobre as técnicas
voltadas para sistemas dinâmicos, encontram-se formalismos como GRP (do inglês Generalized
Renewal Processes), uma das mais flexíveis ferramentas de modelagem de sistemas reparáveis
(generalizando processos de contagem como o de renovação e de Poisson homogêneo e não-
homogêneo). Ao longo dos anos, a economia nacional passou por diversas mudanças e, com
o tempo, a perspectiva de antever o futuro se tornou de extrema importância, graças a sua
capacidade de propiciar melhor aproveitamento dos benefícios de uma preparação antecipada
de eventos adversos. Na construção civil, a necessidade de antever o futuro e assim intervir no
presente é parte essencial de qualquer empreendimento que venha a ser desenvolvido. Buscou-se
com este trabalho desenvolver ferramentas da modelagem e previsão de séries temporais, a partir
dos estudos realizados sobre CBF e via GRP, utilizando o banco de dados da série temporal
do Índice Nacional de Custo da Construção Civil (INCC), de forma a auxiliar na tomada de
decisão ao inferir sobre os valores futuros da série com o objetivo de sumarizar as dinâmicas
deste fenômeno assim como seus eventos extremos.Para isso, foram utilizados algorítmos que
contemplavam essa abordagens, onde a partir de métricas de desempenho (para os formalismos
de séries temporais) e critérios de informação (para a PRGW) foram escolhidos os melhores
modelos e realizadas as previsões.
Palavras-chave: Construção civil. Métodos preditivos. Processos de Renovação Generaliza-

dos.Combinação de preditores. Cópulas.
ABSTRACT
Statistical modeling provides rational decision support in situations involving uncertainty, so-
mething commonly found in problems of prediction, evaluation, optimization and control of
systems production. On the techniques for dynamical systems, time series formalisms such as
the ARIMA, ETS and ANN models, as well as combination models such as CBF (acronym for
Copulas-Based Combined Forecasters), which extend the minimum variance method (one of the
main alternatives in the literature for the combination of time series predictors). On the techni-
ques oriented to dynamic systems, are formalisms like GRP (Generalized Renewal Processes),
one of the most flexible tools of modeling of reparable systems (generalizing counting processes
like the one of Renovation and Non-Homogeneous Poisson Process (NHPP) ) . Over the years
the national market has undergone several changes and, over time, the prospect of anticipating
the future has became of extreme importance, thanks to its ability to better exploit the benefits
of early preparedness of adverse events. In civil construction, the need to anticipate the future
and thus intervene in the present is an essential part of any enterprise that may be developed.
This work aimed to develop tools for the modeling and forecasting of time series, based on the
studies carried out on CBF and via RPG, using the time series database of the National Civil
Construction Cost Index (INCC), in order to assist decision making in inferring the future values
of the series in order to summarize the dynamics of this phenomenon as well as its extreme
events.In order to do this, we used algorithms that considered this approach, where from the
metrics of performance (for time series formalisms) and information criteria (for PRGW) the
best models were chosen and the predictions were made.
Keywords: Civil Construction. Predictive methods. Generalized Renewal Processes. Combining

Predictors. Copulas.
LISTA DE FIGURAS
Figura 1 – Variabilidade do INCC, entre 1944 e 2017 . . . . . . . . . . . . . . . . . . 43

Figura 2 – Decomposição da série (figura no topo) em componentes de tendência (trend),
sazonalidade (seasonal) e aleatoriedade (random). . . . . . . . . . . . . . . 43
Figura 3 – Série temporal do INCC após o Plano Real . . . . . . . . . . . . . . . . . . 44
Figura 4 – Tempos entre ocorrências de eventos extremos do INCC . . . . . . . . . . . 46
Figura 5 – Modelo Individual dedicado à série do INCC representando a série completa,
bem como suas previsões via ARIMA. . . . . . . . . . . . . . . . . . . . . 48
bem como suas previsões via ETS. . . . . . . . . . . . . . . . . . . . . . . 49
bem como suas previsões via ANN. . . . . . . . . . . . . . . . . . . . . . . 49
Figura 8 – Modelos Combinados dedicados à série do INCC representando a série
completa, bem como suas previsões via SA e SM. . . . . . . . . . . . . . . 50
Figura 9 – Modelos Combinados dedicados à série do INCC representando a série
completa, bem como suas previsões via MV e CB. . . . . . . . . . . . . . . 50
LISTA DE TABELAS
Tabela 1 – INCC - Ponderações Municipais . . . . . . . . . . . . . . . . . . . . . . . 20

Tabela 2 – Arquiteturas para o modelo ETS . . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 3 – Valores de critérios de informação sobre modelos PRGW dedicados à série
do INCC, considerando como eventos extremos valores de ao menos 1.1585% 45
Tabela 4 – Tabela de previsão do mês de ocorrência de próximos eventos extremos do
INCC, de acordo com o modelo PNHP. . . . . . . . . . . . . . . . . . . . 47
Tabela 5 – Estimativas dos parâmetros para os modelos sob estudo, individuais (ARIMA,
ANN e ETS) e combinados (MV e CB) para a série do INCC. . . . . . . . . 48
Tabela 6 – Dados de Treinamento dos modelos individuais (ANN, ARIMA e ETS), bem
como dos combinadores (SA, SM, MV e CB), dedicados à série INCC. Os
melhores resultados estão em negrito . . . . . . . . . . . . . . . . . . . . . 51
Tabela 7 – Dados de Teste dos modelos individuais (ANN, ARIMA e ETS), bem como
dos combinadores (SA, SM, MV e CB), dedicados à série INCC. Os melhores
resultados estão em negrito. . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Tabela 8 – Tabela de Previsão do modelo de combinação de cópulas, utilizando a cópula
normal, dedicado à série INCC para o primeiro semestre de 2018. . . . . . 52
LISTA DE ABREVIATURAS E SIGLAS
AIC Akaike Information Criteria

AICc Second-Order Akaike Information Criteria
ANN Artificial Neural Networks
ARIMA Auto Regressive Integrated Moving Average
ARV Average Relative Variance
BIC Bayesian Information Criteria
ETS Exponential Smoothing/ Suavização Exponencial
FGV Fundação Getúlio Vargas
IBRE Instituto Brasileiro de Economia
ICC Índice del Costo de la Construcción
IGP Índice Geral de Preços
INCC Índice Nacional de Custo da Construção
IPCO Índice de Precios de la Construcción
MAPE Mean Absolute Percentual Error
MSE Mean Square Error/ Erro Quadrático Médio
MV Mínima Variância
PNHP Processo Não Homogêneo de Poisson
POCID Prediction On Change In Direction
PR Processo de Renovação
PRG Processos de Renovação Generalizados
SA Simple Average / Média Simples
SM Simple Median / Mediana Simples
SUMÁRIO
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2 Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . . . 17
4.1 Índice Nacional de Custo da Construção (INCC) . . . . . . . . . . . . . 17
4.2 Modelos de Previsão de Séries Temporais . . . . . . . . . . . . . . . . . 20
4.2.1 Auto Regressive Integrated Moving Average (Auto Regressive Integrated
Moving Average (ARIMA)) . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2.2 Suavização Exponencial (ETS) . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2.3 Redes Neurais Artificiais (ANN) . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 Combinação de Modelos de Séries Temporais . . . . . . . . . . . . . . . 26
4.3.1 Média Simples (SA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.2 Mediana Simples (SM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.3 Mínima Variância (Mínima Variância (MV)) . . . . . . . . . . . . . . . . 27
4.4 Combinadores baseados em Cópulas . . . . . . . . . . . . . . . . . . . . . 28
4.4.1 Cópulas Arquimedianas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4.1.1 Cópula Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4.1.2 Cópula Clayton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.1.3 Cópula Frank . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.2 Cópulas Elípticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.4.2.1 Cópula Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5 Processos de Renovação Generalizados baseados na Distribuição De Wei-
bull (PRGW) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.6 Métricas de Qualidade de Modelos . . . . . . . . . . . . . . . . . . . . . 35
4.6.1 Critérios de Informação de Akaike . . . . . . . . . . . . . . . . . . . . . . 35
4.6.2 Métricas de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.6.2.1 Mean Square Error - Mean Square Error/ Erro Quadrático Médio (MSE) . . 36
4.6.2.2 Mean Absolute Percentual Error - Mean Absolute Percentual Error (MAPE) 36
4.6.2.3 Theil’s U . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.6.2.4 Average Relative Variance - ARV . . . . . . . . . . . . . . . . . . . . . . . 37
4.6.2.5 Prediction On Change In Direction - Prediction On Change In Direction
(POCID) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6 RESULTADOS E DISCUSSÕES . . . . . . . . . . . . . . . . . . . . . . 42
6.1 Modelando e Prevendo Eventos Extremos . . . . . . . . . . . . . . . . . 44
6.2 Modelando e Prevendo o Índice . . . . . . . . . . . . . . . . . . . . . . . 47
6.3 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
13
1 INTRODUÇÃO
O desenvolvimento sustentável tem sido avaliado e discutido, a níveis acadêmico,

científico, técnico e político, a partir de três dimensões elementares: a econômica, a social e a
ambiental. Defende-se que este modelo de desenvolvimento só é alcançado quando, de forma
harmoniosa e duradoura, ações em prol destas dimensões são bem sucedidas. Trata-se, assim, de
um problema de planejamento e gestão estratégica, tomando por base a noção de risco, uma vez
que leva em consideração a incorporação de incertezas.
Quanto às dimensões econômica e social do Brasil, por exemplo, o mercado imobiliá-
rio tem passado por diversas mudanças, influenciadas pelo crescente interesse por investimentos
no setor, variações nas taxas de inflação e de juros e nos investimentos governamentais (VALIM,
2013; SCOLESE et al., 2015). De fato, de forma geral, têm sido notórias as políticas monetárias
direcionadas ao controle do governo sobre o desempenho econômico do país, como as trocas de
plano econômico ocorridas na década de 90, além das elevações nas taxas de juros e redução da
disponibilidade no crédito. A expressiva quantidade de mudanças de moeda é um exemplo disso.
Faz-se importante pontuar que a dimensão ambiental também encontra-se intima-
mente ligada ao setor da construção civil, uma vez que essa possui alta demanda por matérias-
primas naturais e também é responsável pela geração de grandes quantidades de resíduos sólidos
(FILHO et al., 2014).
Neste contexto, torna-se relevante o desenvolvimento de ferramentas de modelagem
e previsão, permitindo tanto sumarizar os sistemas dinâmicos subjacentes ao setor imobiliário,
quanto aprimorar planos estratégicos, táticos e operacionais. Isso ocorre pelo fato de que
os investidores tornam-se capazes de analisar o comportamento do mercado e inferir sobre
ocorrências futuras, trazendo luz aos processos de tomada de decisão (ROJO; BERTOLINI,
2015; RODRIGUES et al., 2014). Destaque-se neste sentido construtores como uma categoria
de investidor, também sujeitos a incertezas modeláveis e passíveis de previsão. De fato, um dos
primeiros critérios a serem considerados em um processo decisório referente ao setor imobiliário
é o valor dos custos da construção civil na região onde se deseja empreender (LENCIONI, 2014),
bem como suas projeções.
Entretanto, como o investidor utilizaria esta medida para analisar a viabilidade de um
investimento no futuro? Uma possível resposta seria analisar a movimentação desta variável ao
longo do tempo e, assim, ser capaz de realizar sínteses e previsões. Logo, a análise de processos
estocásticos em geral, e particularmente séries temporais, apresentam-se como uma metodologia
14
poderosa, visto que possibilitam analisar dados sobre o comportamento de uma determinada
variável no tempo, gerar modelos e indicar cenários (MORETTIN; TOLOI, 2006). Uma série
temporal pode ser entendida em termos gerais como um conjunto de valores acerca de um mesmo
fenômeno, coletados em espaços de tempo igualmente espaçados. Ao conjunto de variáveis que
geraram tais dados, dá-se o nome de processo estocástico.
Além disso, a identificação de padrões da série, como sazonalidade e tendência nas
variáveis de interesse, é de extrema importância para a construção civil, em especial, assim como
em sistemas de produção em geral. A partir de ferramentas de previsão de séries temporais,
Faria (FARIA, L.B., 2016) estimou a tendência da elevação no valor do metro quadrado nos
bairros de Fortaleza. Já Barbosa, Ferreira Irmão e Melo (BARBOSA; IRMÃO, 2015) avaliaram
os impactos do Projeto Minha Casa Minha Vida no Índice de Velocidade de Vendas na região
metropolitana de Recife. Estes trabalhos ilustram o potencial do estudo de séries temporais
e sua contribuição para a avaliação das dimensões econômica e social da sustentabilidade da
construção civil de forma a fornecer a decisão no âmbito da construção civil.
Buscou-se com este trabalho modelar e prever a série temporal do Índice Nacional
de Custo da Construção (Índice Nacional de Custo da Construção (INCC)), bem como o tempo
entre eventos extremos deste índice. Para tanto, formalismos que contemplam o estado da arte da
modelagem e previsão de processos estocásticos em geral e séries temporais em especial foram
considerados.
15
2 JUSTIFICATIVA
A construção civil é uma das atividades econômicas que representam grande parcela
do produto interno bruto de qualquer país e tem efeitos significativos na empregabilidade de
pessoal (AZEVEDO et al., 2011). Tal segmento econômico é uma atividade que envolve
grande investimento, tanto para empresas construtoras quanto para seus clientes. Além disso, na
construção civil, a necessidade de compreender o passado e antever o futuro é parte essencial de
qualquer empreendimento. Para tanto, a análise dos índices correlatos mostra-se indispensável.
Ainda segundo Azevedo (2011), o processo de orçar um empreendimento torna-se
fator crítico para empresas construtoras antes que a edificação seja projetada em detalhes e que os
contratos de venda e de fornecimento sejam firmados. Dessa forma, a partir de uma investigação
de custos criteriosa, pode-se reduzir desvios que impactem na lucratividade do empreendimento
ou até mesmo inviabilizem a continuidade da execução de uma obra (LOPES et al., 2003; TAS;
YAMAN, 2005).
Entre os índices que possuem grande importância na construção civil no Brasil, se
encontra o INCC, cuja divulgação ocorre desde fevereiro de 1944 e permanece até os dias de hoje,
tendo o objetivo de analisar o desempenho dos gastos das construções e aluguéis habitacionais.
Geralmente, ele é cobrado para corrigir contratos na compra de imóveis, enquanto uma obra
ainda está sendo construída, fornecendo assim uma importante ferramenta na tomada de decisão
com relação a investimentos imobiliários.
Com vistas a contribuir para esse contexto em evolução, este projeto traz uma nova
abordagem para lidar com investimentos na construção civil e apresenta um estudo onde o
objetivo é sumarizar as dinâmicas do INCC, bem como prever seus eventos extremos futuros.
Defende-se que tal suporte na tomada de decisão, favorece a otimização e o controle da produção
de empresas do ramo da construção civil. Especificamente, pretende-se modelar a série temporal
do INCC de forma a prevê-lo, bem como o tempo entre ocorrências de seus eventos extremos.
Aqui, compreendam-se eventos extremos como sendo valores elevados desse índice. Para ambas
as etapas, de modelagem e previsão do INCC e dos tempos entre seus eventos extremos, serão
consideradas algumas das principais ferramentas estatístico-computacionais disponíveis, de
forma a promover a minimização dos erros de previsão.
16
3 OBJETIVOS
3.1 Objetivo Geral
Modelar e prever o Índice Nacional de Custo da Construção (INCC) através de

Processos de Renovação Generalizados (Processos de Renovação Generalizados (PRG)) e de
formalismos de séries temporais com o intuito de auxiliar no processo de tomada de decisão a
respeito da viabilidade de um empreendimento.
3.2 Objetivos específicos
1. Rever a literatura sobre INCC, processos de renovação generalizados (PRG) e séries

temporais;
2. Identificar os aspectos ligados ao INCC e seu comportamento ao longo dos anos, assim
como suas alterações mediante mudanças na economia do país;
3. Modelar e prever o tempo entre ocorrências de eventos extremos do índice através de PRG
baseados na distribuição de Weibull;
4. Modelar e prever o valor do INCC através da combinação de modelos de previsão de séries
temporais;
5. Analisar os resultados obtidos.
17
4 FUNDAMENTAÇÃO TEÓRICA
Nesta seção, são introduzidos aspectos que englobam o INCC, assim como os
modelos de previsão de séries temporais e de processos de renovação generalizados adotados.
4.1 Índice Nacional de Custo da Construção (INCC)
O Índice Nacional de Custo da Construção (INCC) é um tributo que incide sobre

o valor de compra e venda de imóveis em processo de edificação no Brasil, nos casos onde há
financiamento do imóvel (MAIA; CRIBARI-NETO, 2006). O índice está presente em 99% dos
contratos de compromisso de compra e venda de imóveis nacionais e reflete a evolução dos
custos da construção civil, como mão de obra, materiais e serviços (BOSCARDIN, IVAN, 2018).
O INCC foi criado pela Fundação Getúlio Vargas (FGV) em 1944 como Índice de
Custo da Construção (ICC) e cobria apenas a cidade do Rio de Janeiro. Atualmente, o INCC
representa 10% do Índice Geral de Preços (Índice Geral de Preços (IGP)) e é coletado em sete
capitais brasileiras: São Paulo, Rio de Janeiro, Belo Horizonte, Salvador, Recife, Porto Alegre e
Brasília (MAIA; CRIBARI-NETO, 2006), além de ser utilizado como um importante indicador
da formação de bolhas especulativas no mercado imobiliário (MACHADO et al., 2014).
Com o intuito de auxiliar nos processos de tomada de decisão sobre investimentos
na construção civil, outros países utilizam índices similares ao INCC. Nos Estados Unidos
da América, por exemplo, os índices New-Home Sales e Construction Spending, ambos de
divulgação mensal, possuem impacto significativo no setor da construção civil (STEINER,S,
2009). Já nos países da América Latina, podem ser citados o Índice del Costo de la Construcción
(Índice del Costo de la Construcción (ICC)) que descreve a evolução mensal do custo de
construção de imóveis residenciais, e cujo objetivo é medir as variações mensais experimentadas
pelo custo da construção privada de edifícios para habitação em Buenos Aires (JARA, LUCIANO,
2015), e o Índice de Precios de la Construcción (Índice de Precios de la Construcción (IPCO)),
no Uruguai, que é um indicador que mede a evolução mensal dos preços ao nível do produtor
e/ou do importador de materiais, equipamentos e máquinas de construção (INEC, 2018).
A construção destes indicadores considera variáveis como mão-de-obra e materiais,
além dos serviços de arquitetura e engenharia, semelhante ao caso do INCC. O INCC possui
periodicidade mensal, sendo divulgado em três versões: INCC-DI (evolução dos custos entre o
primeiro e o último dia do mês), INCC-10 (evolução dos custos entre o dia 11 do mês anterior e
18
o dia 10 do mês de referência) e INCC-M (evolução dos custos entre o dia 21 do mês anterior e
o dia 20 do mês de referência). Este trabalho se dedicará ao INCC-M.
Segundo o Fundação Getúlio Vargas (FGV) Instituto Brasileiro de Economia (IBRE)
(Instituto Brasileiro de Economia) (2016) o INCC é calculado através da conjugação de um
sistema de pesos a um sistema de preços referentes a uma amostra de insumos que vão de merca-
dorias a mão-de-obra, entre outros insumos, com representatividade na indústria da construção
civil. Além da composição geral, o INCC desdobra-se em dois grandes grupos:
• Materiais, equipamentos e serviços;
• Mão-de-obra.
Na escolha da amostra do INCC, são usados orçamentos analíticos de empresas de
engenharia civil, tomando-se como base de cálculo planilhas de composição de custos dos dois
grandes grupos já citados. Além disso, são considerados três padrões de construção:
• H1 – Casa de 1 pavimento com sala, 1 quarto e demais dependências, medindo
em média 30 m2 .
• H4 – Edifício habitacional de 4 pavimentos, constituído por unidades autônomas
de sala, 3 quartos e dependências com área total média de 2520 m2 .
• H12 – Edifício habitacional de 12 pavimentos, composto de apartamentos de
sala, 3 quartos e dependências, com área total média de 6013 m2 .
Como resultado final, têm-se uma amostra com padrões de residências/edifícios
habitacionais de boa qualidade, sem luxo, chegando-se ao total de 723 itens específicos, sendo
659 relativos a materiais, equipamentos e serviços e 64 relacionados a mão-de-obra. Ao todo
os dados obtidos somam 7300 informações, que são provenientes de aproximadamente 1200
informantes.
Na determinação do INCC-M, adotam-se os seguintes procedimentos:
• Calculam-se, inicialmente, em nível municipal, para o período de referência t,
relativos de preços (Eq. 4.1) de variedades de insumos (mercadorias, serviços e
mão-de-obra) .
• Na sequência, obtêm-se relativos médios desses insumos através de média geomé-
trica de relativos (Eq. 4.2). Este é o nível mais elementar em que são divulgados
resultados.
• A agregação para níveis superiores é feita por média aritmética ponderada dos
pesos dos insumos e relativos médios de insumos em cada município (segundo a
19
Eq. 4.3)
• Por fim, estima-se o índice nacional com base na importância relativa de cada
município, que é função da área total edificada segundo as licenças de “habite-se”
(Eq.4.4).
Em termos algébricos, calcula-se o índice geral através das seguintes expressões:
Pt i,v,M
Rt i,v,M = i,M
(4.1)
Pt−1
n 1
i,M
Rt = ( ∏ Rt i,v,M ) n (4.2)
v=1
i,M
ΣWt i,M Rt
IM
j, j−1 = (4.3)
ΣWt i,M
n
It = ∑ QM · I Mj,j−1 (4.4)
M=1
Sendo:
It = o INCC do mês de referência t;
IM
j, j−1 = o índice do município M no mês de referência j em relação ao mês imedia-
tamente anterior j − 1;
QM = peso do município M, de acordo com a Tabela 1, tal que:
n
∑ QM = 1 (4.5)
M=1
Onde M(= 1, 2, . . . , n) é o índice do município.

Pt i,M = preço da variedade do insumo i, no município M, no período de referência t;
i,M
Pt−1 = preço da variedade do insumo i, no município M, no período imediatamente
anterior ao de referência t − 1;
Rt i,v,M = Relativo da variedade v do insumo i, no município M, no período de
referência t;
i,M
Rt = Relativo médio do insumo i, no município M, no período de referência t;
Wt i,M = Peso do insumo i, no município M no período de referência t.
20
Tabela 1 – INCC - Ponderações Municipais

Municípios de Capitais Peso (%)
Recife 5,24
Salvador 9,31
Belo Horizonte 11,13
Rio de Janeiro 9,49
São Paulo 43,29
Porto Alegre 11,04
Brasilia 10,50
TOTAL 100
Fonte: FGV - IBRE
4.2 Modelos de Previsão de Séries Temporais
Em processos de tomada de decisão é bastante comum especular cenários futuros.

Uma série temporal é um conjunto de observações sucessivas indexadas em ordem de tempo
(Eq. 4.6). A produção anual de carros e a mensal de calçados são exemplos de séries temporais
discretas, enquanto que a precipitação diária e os preços diários dos índices de ações são exemplos
de séries temporais contínuas (MORETTIN; TOLOI, 2006).
ut = {ut ∈ R | t = 1, 2, 3, ..., n}, n ∈ N, (4.6)
Onde t é o índice cronológico e n o número de observações na amostra analisada.

A partir de uma série temporal, é possível a identificação de padrões como tendência,
sazonalidade e aleatoriedade, a fim de compreender e inferir sobre os fenômenos estudados.
Tendência pode ser definida como um padrão de crescimento/decrescimento da série em um certo
período de tempo, enquanto que a presença de sazonalidade descreve os padrões de repetição em
janelas de tempo semelhantes. A aleatoriedade, por fim, é o componente da série impassível de
modelagem.
Na literatura, é possível encontrar um grande número de métodos focados na mode-
lagem e previsão de séries temporais, sendo a metodologia Box & Jenkins (ou modelos ARIMA)
uma das técnicas mais conhecidas. Esta família de modelos tem um elevado potencial de aplica-
ção, sendo útil para analisar características ambientais (YU et al., 2017; HERNÁNDEZ et al.,
2017; EYMEN; KÖYLÜ, 2018), sociais (PEREIRA, 2017; KLAZOGLOU; DRITSAKIS, 2017;
21
CHRISTIANSEN et al., 2018) e econômicas (FIRMINO et al., 2014).

Outra metodologia importante surge a partir do desenvolvimento de Machine Lear-
ning, as Redes Neurais Artificiais (Artificial Neural Networks (ANN)), que se tornaram mais
úteis devido ao avanço computacional. Os modelos de previsão construídos por ANN têm
um forte apelo prático, apesar de demandar uma grande quantidade de dados, o que pode ser
entendido como um fator de enfraquecimento (KANCHYMALAY et al., 2017; GAO et al.,
2017).
Por sua vez, os modelos de suavização exponencial (Exponential Smoothing/ Su-
avização Exponencial (ETS)) têm sido também importantes, na tarefa de previsão de séries
temporais, e, assim como os outros modelos. Os modelos Holt-Winters são exemplos clássicos
de modelos ETS (HYNDMAN et al., 2002; GARDNER, 1985).
Essas três famílias de modelos individuais (ARIMA, ANN e ETS) serão descritas a
seguir, para logo após serem apresentadas as metodologias de combinação a serem adotadas no
trabalho.
4.2.1 Auto Regressive Integrated Moving Average (ARIMA)
Em um modelo de média móvel integrado autoregressivo, o valor futuro de uma

variável é assumido como uma função linear de várias observações passadas e erros aleatórios
(ZHANG, 2003). Um dos mais importantes e amplamente usados modelos de séries temporais é o
modelo autoregressivo e de média móvel integrados (ARIMA), construído a partir da metodologia
conhecida de Box-Jenkins (BOX; JENKINS, 1976). A popularidade do modelo ARIMA é devido
às suas propriedades estatísticas e simplicidade.
A notação utilizada é ARIMA (p, d, q), sendo p, d, q, respectivamente, o número
de parâmetros autorregressivos (AR), o número necessário de diferenciações para as séries se
tornarem estacionárias (I) e o número de parâmetros relacionado à Média Móvel (MA) (CRYER;
CHAN, 2008). As equações 4.7, 4.8 e 4.9 descrevem, nesta ordem, os modelos autoregressivos
AR (p), modelos de médias móveis MA (q) e modelos autoregressivos de médias móveis ARMA
(p, q).
ut = φ1 ut−1 + ... + φ p ut−p + εt (4.7)

22
ut = µ + ε − θ1 εt−1 − . . . − θq εt−q (4.8)
ut = φ1 ut−1 + ... + φ p ut−p + ε − θ1 εt−1 − ... − θq εt−q (4.9)
Onde φ and θ são, respectivamente, os parâmetros AR(p) e MA(q), e ε é o erro e µ

é a média de Zt .
O uso de modelos ARMA é restrito a séries temporais estacionárias, demandando
um método de estacionarização em muitos casos. Uma série temporal estacionária possui a
propriedade de que suas características estatísticas, como a média e a estrutura de autocorrelação,
são constantes ao longo do tempo. Quando as séries temporais observadas apresentam tendência e
heteroscedasticidade, a diferenciação e a transformação de potência são frequentemente aplicadas
aos dados para remover a tendência e estabilizar a variância antes que um modelo ARMA possa
ser ajustado, uma vez que a maioria das séries temporais envolvendo fenômenos reais são
não-estacionários (ZHANG, 2003). Portanto, a partir da realização de diferenciações, o modelo
ARIMA (p, d, q) foi elaborado (Eq. 4.10).
Wt = φ1Wt−1 + ... + φ pWt−p + ε − θ1 εt−1 − ... − θq εt−q , (4.10)
em que Wt = ut − ut−1 representa a 1a diferenciação (I) no tempo t da série.

Os modelos ARIMA foram aprimorados pela adição de fatores de sazonalidade. Esta
classe de modelos pode ser descrita como ARIMA (p, d, q) (P, D, Q)[s], sendo s o período
de sazonalidade e P, D e Q as ordens autoregressiva, diferenciação e média móvel do modelo
sazonal (WALTER et al., 2013; CRYER; CHAN, 2008).
4.2.2 Suavização Exponencial (ETS)
A suavização exponencial é um método estatístico de previsão que parte de um

procedimento de suavização que utiliza uma ponderação para os valores observados da série
temporal, de modo que valores mais recentes recebam pesos maiores e os pesos formem um
conjunto que decai exponencialmente a partir de valores mais recentes (JR, 2006). Nessa classe
23
de modelos, a relação entre tendência (T), sazonalidade (S) e erro (E) é aditiva (Eq. 4.11),
multiplicativa (Eq. 4.12) ou mesmo com variações (Eq. 4.13).
ut = T + S + E. (4.11)
ut = T · S · E. (4.12)
ut = (T + S) · E. (4.13)
O componente T é uma combinação de um termo de nível (l) e um termo de

crescimento (b), similarmente a uma equação linear. Estes termos podem ser combinados
dando origem a cinco tipos diferentes (nenhum, aditivo, amortecedor aditivo, amortecedor
multiplicativo, multiplicativo)(Eq. 4.14-4.18) (HYNDMAN et al., 2008).
Th = l. (4.14)
Th = l + bh. (4.15)
Th = l + (φ + φ 2 + ... + φ h )b. (4.16)
Th = lbh . (4.17)
2 +...+φ h )
Th = lb(φ +φ , (4.18)
Onde Th é a tendência para o próximo período h e φ é um parâmetro de amorteci-

mento (0 < φ < 1).
24
Finalmente, após a estimação de T, os componentes S (nenhum, aditivo ou multi-

plicativo) e E (aditivo ou multiplicativo) são selecionados. Essa classificação foi proposta por
McCormick (MCCORMICK, 1969) e posteriormente modificada por Gardner (GARDNER,
1985) e Hyndman et al. (HYNDMAN et al., 2008), quando a notação ETS foi introduzida. Um
modelo ETS (A, M, N) possui erro aditivo, tendência multiplicativa e sazonalidade inexistente,
por exemplo.
Depois de escolhido o componente de tendência, pode-se introduzir um componente
sazonal seja ele aditivo ou multiplicativo. Segundo (HYNDMAN; KHANDAKAR, 2008), a
natureza do erro (aditivo ou multiiplicativo) pode ser ignorada uma vez que essa distinção não
interfere na previsão.
O método de suavização exponencial é apropriado quando há uma tendência na série
temporal, mas acredita-se que a taxa de crescimento no final dos dados históricos provavelmente
não continuará mais no futuro. As equações da suavização fazem o que o nome indica: atenuam
a tendência à medida que o horizonte de previsão aumenta. Isso geralmente melhora a precisão
da previsão, principalmente em longos períodos de tempo.
As possíveis combinações dos componentes de tendência e sazonalidade são mos-
trados na tabela 2. Para cada um dos 15 métodos na tabela 2, existem dois modelos espaciais
possíveis, um correspondente a um modelo com erros aditivos e outro para um modelo com
erros multiplicativos. Se os mesmos valores de parâmetro forem usados, estes dois modelos
dão pontos equivalentes de previsão embora se usem intervalos de previsão diferentes. Assim,
existem 30 modelos potenciais descritos neste tipo de classificação.
Tabela 2 – Arquiteturas para o modelo ETS

Componente de Tendência Componente Sazonal
N (Nenhum) A (Aditivo) M (Multiplicativo)
N (Nenhum) NN NA NM
A (Aditivo) AN AA AM
Ad (Aditivo Amortecido) AdN AdA AdM
M (Multiplicativo) MN MA MM
Md (Multiplicativo Amortecido) MdN MdA MdM
Fonte: O autor
25
4.2.3 Redes Neurais Artificiais (ANN)
Redes Neurais Artificiais são estruturas de computação adaptáveis usadas para

modelar problemas não-lineares. Seu desenvolvimento foi inspirado no cérebro humano e hoje
possui um vasto campo de aplicações (por exemplo, problemas de classificação, reconhecimento
de padrões, modelagem de séries temporais) (KHASHEI; BIJARI, 2012; HAYKIN, 2007).
Segundo Haykin (HAYKIN, 2001), uma rede neural é um processador distribuido
paralelamente que é constituído de unidades de processamento simples que armazenam conheci-
mento experimental para torná-lo disponível para uso. A sua semelhança ao cérebro pode ser
resumida em dois aspectos:
1. O conhecimento é adquirido pela rede a partir de seu ambiente através de um processo de
aprendizagem.
2. Forças de conexão entre neurônios, conhecidos como pesos sinápticos, são utilizadas para
armazenar o conhecimento adquirido.
A unidade básica de processamento de informação do sistema nervoso central
humano é o neurônio (diga-se N ), composto em síntese por três elementos: um conjunto de
dentritos (diga-se I ), um corpo celular (diga-se S ) e um axônio (diga-se A ). Em poucos
termos, estes elementos realizam três ações em série, de forma a gerar respostas a dados estímulos
iniciais:
1. I recebe os estímulos (sinais) externos a S (são a camada de entrada de N );
2. S pondera estes estímulos, realizando operações agregativas simples; e
3. A processa a informação entregue por S , a partir de operações eventualmente mais
sofisticadas, gerando as respostas de N aos estímulos recebidos por I .
Naturalmente, as respostas de um neurônio podem ser os estímulos de outro, confi-
gurando assim a rede neural. O processo de aprendizagem da rede neural é realizado através
de um procedimento chamado de algoritmo de aprendizagem, que modifica os pesos sinápticos
da rede de forma ordenada para alcançar um objetivo desejado. Entre os benefícios de uma
rede neural podemos citar a não-linearidade permitindo que mecanismos que não possuam sinal
de entrada linear possam ser trabalhados, o mapeamento de entrada-saída a adaptabilidade
tornando possível que a rede adapte seus pesos sinápticos de acordo com as modificações do
meio ambiente a resposta a evidências e a tolerância a falhas.
Uma das estruturas mais utilizadas para modelagem de séries temporais é o f eed de
camada única oculta, que é caracterizado por uma rede de três camadas (entradas, camada oculta
26
e saídas). A formulação matemática da relação entre as entradas (Ut−1 , ...,Ut−p ) e as saídas (Ut )
é apresentada na Equação 4.19
!
Q P
ut = w0 + ∑ w j g w0 j + ∑ wi, jUt−i + et , (4.19)
j=1 i=1
onde wi, j (i = 0, 1, 2, ..., P, j = 1, 2, ..., Q) e w j ( j = 0, 1, 2, ..., Q) são os pesos entre as conexões,

P e Q são o número de nós de entrada e nós ocultos g é a função de ativação (KHASHEI; BIJARI,
2012).
Em relação à modelagem de séries temporais, o Perceptron Multicamadas (MLP)
e Redes de Função de Base Radial são as modelagens de redes neurais mais comuns (SIMON,
2001). Nesse caso, a entrada é criada com a técnica de janela deslizante/ técnica Sliding −
Window (AHMAD et al., 2018; TSAI; WANG, 2009). Algoritmo de aprendizado, número de
camadas e neurônios ocultos, função de ativação e taxa de aprendizagem são parâmetros que
desempenham um papel importante na construção e desempenho da rede neural (SIMON, 2001).
4.3 Combinação de Modelos de Séries Temporais
Como afirmado por Chatifield (CHATFIELD, 2000a), quase toda a literatura de

séries temporais assume, de forma explícita ou implícita, que existe apenas um modelo único
intrínseco para uma determinada série temporal. No entanto, o autor também enfatiza que,
mesmo considerando a existência de tal modelo único, este modelo único raramente é conhecido
no início e não haverá garantia de que este será selecionado como o melhor modelo para as séries
temporais observadas.
No estudo da incerteza de modelos para análise de séries temporais, a literatura
mostra que a qualidade da previsão pode ser melhorada pela combinação da previsão de modelos
individuais (CLEMEN, 1989). Nesse sentido, pesquisadores recorrem ao uso de modelos
combinados com o objetivo de aumentar a acurácia e a eficiência das previsões. Desta forma,
as funções de combinação linear, Simple Median (Simple Median / Mediana Simples (SM)),
Simple Average (Simple Average / Média Simples (SA)) e Mínima Variância (MV), têm sido as
principais alternativas de agregação na literatura. Por sua vez, cópulas têm ganho cada vez mais
destaque em exercícios de combinação de preditores.
27
4.3.1 Média Simples (SA)
O modelo SA consiste na média aritmética simples dos k modelos individuais usados

para prever a série ût .
∑ki=1 xt,i
ût = , (4.20)
k
onde, no momento t, ût é a estimativa do modelo combinado, k o número de modelos e xt,i é o

valor previsto do ith modelo para ut .
4.3.2 Mediana Simples (SM)
O modelo SM consiste na mediana simples das observações dos k modelos indivi-

duais usados para prever a série ût . Com o uso da mediana, temos a vantagem da previsão ser
menos suscetível a pontos extremos que a média. Devido a essas vantagens, diversos autores
utilizam a mediana nas suas previsões como Kohlscheen (KOHLSCHEEN, 2012) e Carvalho e
Bugarin (CARVALHO et al., 2006).
Carvalho e Minella (CARVALHO et al., 2009) apresentam um estudo detalhado
do poder preditivo da mediana das expectativas de inflação coletadas pelo Banco Central do
Brasil com 12 step ahead. Eles mostram que, no período considerado no estudo, a mediana não
apresenta viés sistemático, indicando assim bom poder preditivo, apesar de não passar em todos
os testes de eficiência.
4.3.3 Mínima Variância (MV)
Para o modelo MV, o valor estimado é calculado por pesos referentes às covariâncias
dos erros de todos os modelos individuais. Envolvendo assim tanto a variância do erro de cada
modelo quanto sua covariância em relação aos demais modelos individuais. Assim, quanto
maiores as covariâncias subjacentes a um determinado erro de modelo, menor é o seu peso.
k
ût = ∑ ωi xt,i , (4.21)
i=1
e
∑kl=1 al j
ωj = , (4.22)
∑kl=1 ∑kj=1 al j
28
Onde al j é o jésimo elemento da i-ésima linha da matriz inversa de covariâncias em

relação aos resíduos dos modelos individuais (OLIVEIRA et al., 2013b). Para calcular o ωi de
dois modelos individuais, por exemplo, Firmino et al. (FIRMINO et al., 2014) usa as equações
4.23 e 4.24
σ22 − σ12
ω1 = , (4.23)
σ12 + σ22 − 2σ12
e
σ12 − σ12
ω2 = , (4.24)
σ12 + σ22 − 2σ12
onde σi2 é a variância do erro do modelo i e σi, j é a covariância entre os erros dos modelos Xi
and X j .
4.4 Combinadores baseados em Cópulas
O conceito de cópulas foi introduzido por Abe Sklar (SKLAR, 1959) apud (NEL-
SEN, 2007) que destaca que a distribuição conjunta de um conjunto de variáveis dado por
V = (V1 ,V2 , ...,Vk ) pode ser função das distribuições marginais destas variáveis.
A função cópula relaciona duas ou mais distribuições de probabilidade marginais
formando uma distribuição de probabilidade marginal multivariada (conjunta) de forma que não
haja perda de informação. A principal vantagem deste formalismo é a de que a escolha de um
modelo adequado para a dependência entre variáveis, representado pela cópula, pode proceder
independentemente das distribuições marginais das variáveis (GENEST; FAVRE, 2007).
A função cópula, C(·), é uma distribuição acumulada multivariada cujas marginais
são uniformes no intervalo unitário [0, 1]. De forma geral, seja V = (V1 ,V2 , ...,Vk ) um vetor com
k variáveis de tal forma que V ∈ [0, 1]k , então a função cópula é dada pela distribuição acumulada
conjunta de V .
C(v1 , ..., vk ) = P(V1 ≤ v1 , ...,Vk ≤ vk ) (4.25)
Combinado ao fato de que qualquer variável contínua pode ser transformada em

uma uniforme no intervalo [0,1] a partir da sua distribuição acumulada marginal, cópulas
podem ser usadas para fornecer uma estrutura de dependência multivariada separadamente das
29
distribuições marginais (YAN, 2007). Neste sentido, considere-se o vetor de k variáveis aleatórias
X = (X1 , X2 , ..., Xk ), com distribuição acumulada conjunta dada por FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) e
distribuições acumuladas marginais dadas por FXi (xi ). Segundo o teorema de Sklar (SKLAR,
1959), no qual o formalismo de cópulas se baseia para modelar distribuições de probabilidade
multivariadas, para qualquer vetor X de variáveis aleatórias, existe uma função acumulada
conjunta FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) tal que:
FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = C(V1 ≤ v1 , ...,Vk ≤ vk ) (4.26)
Onde é possível realizar uma transformação de variáveis (4.26), em que
v j = FX j (x j ) (4.27)
Desta forma, V possui distribuições marginais uniformes no intervalo [0, 1], inde-
pendente das distribuições marginais de X. Assim, as distribuições acumuladas de ambos os
vetores V e X coincidem devido às relações em (4.26) e (4.27).
Sobre a função de densidade de probabilidade conjunta de X, pX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ),
pode-se demonstrar que:
k
∂ k FX1 ,X2 ,...,Xk (x1 , x2 , ..., xk )
pX1 ,X2 ,...,Xk (x1 , x2 , ..., xk ) = = c[FX1 (x1 ), ..., FXk (xk )] ∏ pX j (x j ) (4.28)
∂ x1 ...∂ xk j=1
Onde pX j (x j ) é a função densidade de probabilidade marginal de X j e a função c(·)

representa a densidade de probabilidade de cópula:
∂k
c(v1 , ..., vk ) = C(v1 , ..., vk ) (4.29)
∂ v1 ...∂ vk
Em resumo, a função cópula contém todas as informações da distribuição de proba-

bilidades. Dessa forma, pode-se dizer que as cópulas codificam a dependência entre as variáveis
(OLIVEIRA et al., 2013b). Com esta construção, tem-se que a distribuição conjunta de variáveis
aleatórias pode ser decomposta em distribuições marginais de cada uma das variáveis, que
contém todas as informações sobre cada uma das variáveis e de como as variáveis dependem
umas das outras.
30
4.4.1 Cópulas Arquimedianas
A família de cópulas Arquimedianas tem uma vasta gama de aplicações em proble-

mas do aspecto financeiro e econômico. Isto se deve a sua formação simples e do grande número
de cópulas que fazem parte dessa família. Neste trabalho serão abordadas algumas famílias de
cópulas Arquimedianas, tais como a cópula Gumbel, Frank e Clayton.
Seja ϕ(·) uma função [0,1] → [0,∞) diferenciável duas vezes no intervalo (0,1) com
as seguintes propriedades:
• ϕ(1) = 0
• ϕ 0 (t) < 0 (primeira derivada crescente)
• ϕ 00 (t) > 0 (função convexa)
• ϕ(0) = ∞
A partir da função Φ(·) satisfazendo estas propriedades, define-se a cópula Arquime-
diana, da seguinte forma:
C(u1 , u2 , ..., un ) = Φ−1 (Φ(u1 ) + Φ(u2 ) + ... + Φ(un )) (4.30)
Onde Φ(·) é chamada de função geradora da cópula Arquimediana. A partir de

diferentes funções geradoras, obtêm-se diferentes cópulas.
Ainda segundo Cordeiro (CORDEIRO, 2009) a condição de existência da cópula
obriga que o gerador precisa ser necessariamente uma função monotônica. O gerador único
determina a cópula Arquimediana. (YAN et al., 2007) comenta o que diferencia o tipo de cópulas
Arquimedianas é o gerador.
4.4.1.1 Cópula Gumbel
Para a Cópula Gumbel a função geradora Φ é representada por:
Φ(u) = −(ln u)γ (4.31)
Com γ ∈ [1,∞)
31
E a função cópula de Gumbel multivariada é representada por (SAVU; TREDE,

2010):
n 1
C(u1 , ......, un ) = exp(−( ∑ (−(ln ui )γ ) γ ), (4.32)
i=1
4.4.1.2 Cópula Clayton
Para a Cópula Clayton, a função geradora Φ é representada por:
1
Φ(u) = (uγ − 1) (4.33)
γ
Com γ ∈ [-1,0) ∪ (0,+∞)

E a função cópula de Clayton multivariada é representada por 4.34 (SAVU; TREDE,
2010):
n −1
−γ
C(u1 , ......, un ) = (1 + ∑ (ui − 1) γ ), (4.34)
i=1
4.4.1.3 Cópula Frank
Para a cópula Frank, a função geradora Φ é representada por 4.35:

exp(−uγ − 1)
Φ(u) = −ln (4.35)
exp(−γ − 1)
Com γ ∈ (-∞,0) ∪ (0,+∞)

E a função cópula de Frank multivariada é representada por 4.36 (SAVU; TREDE,
2010):
n
−1 −γ −d+1
C(u1 , ......, un ) = ln(1 − (−e ) ∏(1 − exp(−γui))). (4.36)
γ i=1
4.4.2 Cópulas Elípticas
As classes de distribuições elípticas são uma família que partilham um conjunto de

propriedades importantes com a distribuição Normal multivariada mas que permitem modelar
eventos extremos e dependências de forma diferente da distribuição Normal (SANTOS, 2011).
32
As cópulas elípticas resultam diretamente do Teorema de Sklar onde C é uma

distribuição elíptica, como as distribuições normal e t - Student, e as distribuições marginais
podem ou não ser elípticas.
Seja X = (X1 , X2 , ..., Xn ) um vetor de variáveis aleatórias. X possui distribuição
elíptica multivariada com parâmetros µ, ∑ e Φ, denotada por X En (µ,∑, Φ).
Sendo Φ a função geradora da cópula.
Segundo Vellasco (VELLASCO, 2014) as distribuições elípticas consistem em gene-
ralizações de distribuições normais multivariadas, compartilhando assim das muitas propriedades
importantes das distribuições normais.
4.4.2.1 Cópula Normal
A cópula normal (ou Gaussiana) faz parte da familia de cópulas elípticas, é simétrica
e não admite dependência em suas extremidades (CORDEIRO, 2009). Ela é obtida de uma
distribuição multivariada, pelo método da inversão, conforme abaixo, para o caso envolvendo
duas variáveis:
CN (a, b) = Φρ (Φ−1 (a), Φ−1 (b)) (4.37)
Onde Φρ é o gerador caracteristico da função elíptica e é dado pela função distribui-

ção conjunta de um vetor normal padrão bidimensional com coeficiente de correlação linear ρ
e Φ−1 é a inversa da função distribuição normal univariada. Segundo Cordeiro (CORDEIRO,
2009), a vantagem da modelagem via cópula normal em relação à via distribuição normal
conjunta é que a primeira pode ser combinada com marginais diferentes da normal.
4.5 Processos de Renovação Generalizados baseados na Distribuição De Weibull (PRGW)
No presente trabalho, busca-se recorrer a PRGW para modelar os tempos entre

ocorrências de eventos extremos do INCC. Para tanto, supõe-se que tais eventos extremos levam
a intervenções pontuais sobre o sistema que regula o índice, sejam estas a partir do governo
sejam a partir do próprio mercado. Assim, é possível considerar o problema de modelagem de
tempos entre valores extremos do INCC a partir de formalismos de processos de contagem. Os
modelos comumente utilizados para a contagem de intervenções sobre sistemas são o Processo
de Renovação (PR) e o Processo Não Homogêneo de Poisson (PNHP). De forma ideal, do ponto
33
de vista matemático, as intervenções sobre o sistema ocorreriam nestes dois extremos: o reparo
perfeito (PR), em que as intervenções levam o sistema a uma condição de “tão bom quanto
novo”, e o reparo mínimo (PNHP), em que o sistema é levado a uma condição de "tão ruim
quanto antes da intervenção"(MODARRES, 2016).
Entretanto, o real efeito de intervenções sobre sistemas dinâmicos normalmente
ocorre fora das situações polarizadas por Processo de Renovação (PR) e Processo Não Homo-
gêneo de Poisson (PNHP). Neste sentido, foram elaborados modelos específicos com destaque
aos que utilizam o conceito de idade virtual, proposto por Kijima e Sumita (KIJIMA; SUMITA,
1986), para os quais a qualidade das intervenções seria modelada a partir de um parâmetro
de rejuvenescimento, q, para o sistema em questão. Este tipo de modelo foi denominado de
Processo de Renovação Generalizado (PRG).
PRG é uma abordagem dedicada a sistemas dinâmicos expostos a intervenções
planejadas ou não planejadas. A modelagem ocorre adicionando-se q ao conjunto de parâmetros
da distribuição de probabilidade subjacente ao tempo até a primeira intervenção ao sistema.
Kijima e Sumita (KIJIMA; SUMITA, 1986) propuseram dois modelos de idade
virtual que buscam retratar o sistema a partir da relação entre q e a real idade do sistema.
Tratam-se dos modelos denominados Kijima Tipo I (KI) e Kijima Tipo II (KII). O primeiro
parte do princípio de que cada intervenção age apenas da condição do sistema estabelecida pela
intervenção prévia, não repercutindo sobre a sua história regressa. O segundo baseia-se na ideia
de que cada intervenção atua sobre toda a história regressa do sistema.
Baseando-se em Ferreira (FERREIRA et al., 2015), a Equação (4.38) apresenta uma
combinação linear de KI e KII, relacionando a idade real do sistema a sua idade virtual, a partir
de uma função de q. Para tanto, sejam (X1 , X2 , ..., Xn ) os tempos entre n intervenções ao sistema.
Para se computar a idade virtual do sistema após a ia intervenção, assume-se θ = 1 via KI e
θ = 0 via KII.
Vi = θ (Vi−1 + qXi ) + (1 − θ )q(Vi−1 + Xi ). (4.38)
A literatura dedicada a PRG tem usualmente recorrido à hipótese de que os tempos

entre intervenções seguem uma distribuição Weibull condicionada à idade virtual, originando o
Processo de Renovação Generalizado baseado na distribuição Weibull (PRGW) (FERREIRA et
al., 2015).
34
Por conseguinte, os parâmetros α e β , provenientes desta distribuição, passam a

representar sua escala e forma, respectivamente. A Equação (4.39) decorre da relação entre
a função densidade de probabilidade e a função de confiabilidade do PRGW, representando a
denominada hazard function - função de exposição à ocorrência de intervenções.
β −1
β x + vi−1
hXi (x + vi−1 |vi−1 , α, β ) = . (4.39)
α α
Nos casos de sistemas em deterioração, β > 1 e hXi (·) é diretamente proporcional à

idade do sistema, sendo que quanto melhores as intervenções, menor deve ser a idade virtual.
Já nos casos sistemas em melhoria, β < 1 e hXi (·) é inversamente proporcional à idade, ou seja,
quanto melhores as intervenções, maior a idade virtual. Por fim, para sistemas estáveis, β = 1 e
hXi (·) é constante ao longo do tempo, tornando discussões sobre a idade virtual desnecessárias.
Do exposto, com o intuito de analisar o sistema econômico brasileiro a partir do
INCC, o presente trabalho buscou modelar a série temporal referente ao INCC-M a partir da
abordagem exposta, a qual é comumente empregada para os casos em que se deseja estudar
sistemas físicos reparáveis. Para este sistema, supôs-se que as intervenções podem ocorrer a
partir de medidas governamentais, como a taxa de juros ou políticas monetárias estimuladas por
níveis elevados do INCC, ou a partir da própria dinâmica de mercado imobiliário. Por sua vez,
supôs-se que cada intervenção é estimulada por um evento extremo, caracterizado por um valor
elevado do INCC.
Para verificar a hipótese de que os tempos entre intervenções sobre o INCC seguem
um PRGW, pode-se adotar o teste de hipóteses proposto por (OLIVEIRA et al., 2016). Os autores
sugerem uma transformação do vetor X em outro vetor, diga-se W, que seguiria a distribuição
exponencial se e somente se X for proveniente de um PRGW. Tal transformação é exibida na
Equação (4.40).
β
Wi = (Xi +Vi−1 )β −Vi−1 . (4.40)
35
4.6 Métricas de Qualidade de Modelos
4.6.1 Critérios de Informação de Akaike
A partir do formalismo a ser adotado, seja para modelagem dos valores do INCC
ou de seus eventos extremos, a identificação do melhor modelo é ainda desafiadora. Cada
formalismo pode oferecer inúmeros modelos. Por exemplo, PRGW pode ser customizado a PR e
PNHP, bem como recorrer a KI e KII. Por sua vez, ARIMA (p, d, q) varia à medida que qualquer
uma destas ordens varia. Dentre as métricas de qualidade de modelos, destacam-se aquelas que
medem parcimônia. Elas envolvem um equilíbrio entre o grau de simplicidade e de assertividade
do modelo.
Segundo Bozdangan (BOZDOGAN, 1987) a partir de um ponto de vista estatístico,
a seleção do modelo apropriado é uma atividade de extrema relevância. Normalmente são
preferidos os modelos parcimoniosos, por serem capazes de explicar o comportamento das
variáveis analisadas, detendo o menor número de parâmetros possível.
Dentre as diversas alternativas utilizadas para este processo avaliativo, os critérios de
informação de Akaike (Akaike Information Criteria (AIC)) (4.41), Akaike Corrigido (Second-
Order Akaike Information Criteria (AICc)) (4.42) e Bayesiano (Bayesian Information Criteria
(BIC)) (4.43) recebem maior destaque. Através do AIC, por exemplo, objetiva-se minimizar a
equação (4.40) (BOZDOGAN, 1987; GERNAND, 2009; AKAIKE, 1974).
AIC = −2 log(maximum likelihood) + 2k, (4.41)
Onde o k representa o número de parâmetros utilizados no modelo e maximum

likelihood representa o valor da distribuição conjunta intrínseca ao modelo, fixados os valores
dos parâmetros e das observações.
Há ainda, de forma similar,
2(k + 1)(k + 2)
AICc = AIC + , (4.42)
n−k−2
e
BIC = −2 log(maximum likelihood) + k log(n), (4.43)
Onde n representa o tamanho amostral.

36
4.6.2 Métricas de Desempenho
Métricas de desempenho são formas alternativas de mensurar a qualidade de um

determinado método de previsão, seja considerando um horizonte passado ou futuro da série sob
estudo (MAKRIDAKIS, 1993). As métricas de desempenho foram definidas com base no erro
de previsão, cuja formulação se deu a partir da diferença entre o valor atual da série e o valor
previsto. Assim, foram representadas pela equação:
et = ut − ût (4.44)
Onde ut é o valor da série no tempo t, e ût é sua previsão.

Para o presente estudo, foram utilizadas cinco métricas de desempenho que serão
descritas a seguir.
4.6.2.1 Mean Square Error - MSE
O erro quadrático médio (MSE) é a métrica de desempenho mais comumente usada

para previsão de séries temporais. Sua equação é dada por:
N
∑t=1 (ut − ût )2
MSE = (4.45)
N
Sendo N a quantidade de pontos da série temporal. Quanto melhor a solução

do modelo de previsão, menor deverá ser o resultado do MSE. Embora seja muito utilizado,
autores como (COLLOPY; ARMSTRONG, 1994; FILDES, 1992; CHATFIELD et al., 1988;
CLEMENTS; HENDRY, 1993) afirmam que o MSE não fornece uma visão completa e livre de
dúvidas sobre o desempenho do modelo, se fazendo necessário então o uso de outras métricas.
4.6.2.2 Mean Absolute Percentual Error - MAPE
O MAPE mede a precisão do modelo em um valor percentual, facilitando sua

interpretação, já que métricas como o MSE podem resultar em valores muito altos, dificultando
sua análise. Quanto menor o valor do MAPE, mais próximas as previsões estão do valor
37
correspondente da série. Ele é expresso através da fórmula:
100 N ut − ût

MAPE = ∑ ut (4.46)
N t=1
O MAPE é a medida de acurácia mais usada quando se deseja comparar diferentes

séries temporais mas apresenta a desvantagem de que quando os valores observados são próximos
de zero, o valor MAPE se compromete, impossibilitando a análise para casos extremos (onde
ut = 0).
4.6.2.3 Theil’s U
O Theil’s U estima a relação entre o modelo e a abordagem denominada Random

Walk. Essa métrica se baseia no MSE normalizado (NMSE) dividido pelo erro de um modelo
tipo Random Walk segundo o qual a previsão para ut é o valor da série em seu momento anterior,
ut−1 . Sua equação é dada por:
N
∑t=1 (ut − ût )2
T heilU = N
(4.47)
∑t=1 (ut − ut−1 )2
Sendo que se TheilU = 1, o modelo testado tem desempenho igual ao Random Walk;
e quando TheilU > 1, o desempenho é inferior e, se TheilU < 1, o modelo é superior ao Random
Walk. Quanto mais próximo de 0 (zero) o TheilU , melhor o desempenho de um modelo.
4.6.2.4 Average Relative Variance - ARV
A Average Relative Variance (ARV) avalia o desempenho do modelo em relação à

média da média aritmética dos valores passados da série. Se ARV = 1,00, o modelo proposto é
equivalente à calcular a média da série e utilizar esta média como sendo a previsão. Se ARV
menor (maior) que 1,00, o modelo é melhor (pior) que a média. Em um modelo ideal, ARV deve
tender a 0. Sua equação é dada por:
N
∑t=1 (ut − ût )2
ARV = N
(4.48)
∑t=1 (ût − ū)2
Onde ū é a média dos valores observados de ut .

38
4.6.2.5 Prediction On Change In Direction - POCID
O POCID é uma métrica de desempenho cuja característica é medir o percentual de

acerto quanto à tendência da série. Sua equação é dada por:
N
∑t=1 Dt
POCID = 100 (4.49)
N

 1, se (ut − ut−1 )(ût − ût−1 ) ≥ 0
Dt = (4.50)
 0, caso contrário.
O POCID terá resultado entre 0 (zero) e 100 (cem), e, quanto mais próximo de 100,
melhor será o modelo de previsão. Essa métrica de desempenho é muito importante quando
aplicada ao mercado de ações, pois a correta previsão de subidas e descidas das cotações das
ações afetam diretamente os ganhos e as perdas financeiras.Neste trabalho é utilizado o WPOCID
cujo valor é obtido subtraindo-se 1 do valor do POCID, sendo a interpretação neste caso de que
quando mais próximo a 0, melhor será o modelo de previsão.
39
5 METODOLOGIA
O presente trabalho classifica-se como de pesquisa aplicada, já que objetiva analisar

um problema específico a partir da utilização de modelos teóricos pré-estabelecidos. Quanto aos
níveis, classifica-se como exploratório-descritivo-explicativo em face da necessidade de propiciar
conhecimento mais sofisticado sobre o fenômeno analisado. Por fim, a abordagem utilizada
possui caráter quantitativo, já que está centrada na objetividade e os fatos são apresentados por
meio de linguagem matemática (GERHARDT; SILVEIRA, 2009; GIL, 2002).
O procedimento metodológico para modelagem dos eventos referentes ao INCC
se dividiu em cinco etapas: 1) Pesquisa Documental e Bibliográfica; 2) Coleta de dados;
3) Modelagem matemática do fenômeno e realização da previsão baseada nos seus eventos
extremos via PGRW; 4) Modelagem matemática e realização da previsão baseada na combinação
de modelos individuais de séries temporais; 5) Modelagem matemática e realização da previsão
baseada em cópulas; 6) Análise dos dados.
Inicialmente, buscou-se um suporte teórico por meio de revisão bibliográfica e
documental a respeito do INCC, da modelagem matemática de eventos extremos e de séries
temporais.
Os estudos também foram conduzidos de modo a promover o desenvolvimento e
estabelecimento de combinadores baseados em cópulas (CBF). Neste sentido, o trabalho partiu
de novas revisões da literatura associada a formalismos de modelagem e previsão de processos
estocásticos relacionados a eventos extremos, de combinação de preditores de séries temporais e
de cópulas.
A revisão foi feita baseada na bibliografia disponível a partir da CAPES, relacionada
a palavras-chave como time series forecasting, combined forecasts e copulas, Generalized
Renewal Processes, além de livros como (ANDERSEN et al., 2009; CHATFIELD, 2000b;
NELSEN, 2006) e publicações produzidas pelo grupo de pesquisa que envolve o concluinte,
tais como (FIRMINO; DROGUETT, 2009; FIRMINO et al., 2014; FIRMINO et al., 2015;
OLIVEIRA et al., 2013b; OLIVEIRA et al., 2013a; OLIVEIRA et al., 2013c; OLIVEIRA et al.,
2013a; OLIVEIRA et al., 2016; OLIVEIRA et al., 2017).
Nesta fase, os estudos desenvolvidos englobaram a Distribuição Exponencial, Função
Taxa de Falha, Processos Estocásticos, Processo de Poisson, Processos Não Homogêneos de
Poisson (NHPP), Processos de Renovação (RP), Sistemas Reparáveis, Distribuição Weibull,
além dos modelos individuais de previsão de séries temporais (ARIMA, ETS e RNA) e dos
40
modelos de combinação (Mínima Variância, Média Simples, Simples Mediana e CBF).

Os dados escolhidos para a análise foram referentes ao INCC-M entre os anos de
1944 e 2017 (875 observações) e foram coletados a partir do site do Portal Brasil (PORTAL
BRASIL,FGV, 2018), o qual foi analisado através do so f tware R (TEAM et al., 2013), utilizando
códigos cuja base corresponde ao PRGW (o qual constrói e avalia os modelos RP, NHPP, KI
e KII), códigos cuja a base eram os modelos de combinação e cópulas através dos 3 modelos
individuais abordados, de forma a retornar previsões de valores futuros do INCC. As avaliações
foram baseadas nos critérios AIC, AICc e BIC equações (4.41),(4.42) e (4.43) no que diz
respeito a WGRP, bem como nas métricas de desempenho MSE, MAPE, Theil’s U, ARV, POCID
(equações (4.45), (4.46), (4.47), (4.48), (4.49)).
Em uma etapa de pré-processamento em relação aos modelos PGRW, um algoritmo
de conversão da série temporal do INCC em uma sequência de tempos entre eventos extremos
foi aplicado. Posteriormente, foram aplicados métodos estatísticos de tratamento de dados para
adequá-los ao modelo probabilístico PRGW, transformando-os em uma tabela contendo o tipo
de evento extremo e a quantidade de tempo até a ocorrência desse evento. Foram considerados
como eventos extremos todos aqueles valores do INCC que ultrapassarem ou igualarem o quantil
85% das ocorrências. Por fim, realizou-se a seleção do modelo que melhor se ajustou ao banco
de dados de acordo com os critérios de informação AIC, AICc e BIC. Quanto à aderência de
PRGW aos dados sob estudo, o teste sugerido por Oliveira, Cristino e Firmino (OLIVEIRA et
al., 2016), a partir da transformação em (Eq. 4.40), foi adotado.
A escolha dos modelos individuais aplicados a este trabalho se justifica por diversas
razões. Em relação ao modelo ARIMA pode-se citar a grande diversidade de ramos de aplicação
da metodologia como na previsão de consumo de combustíveis (EDIGER; AKAR, 2007),
previsão de níveis de barragens (SCHEFFER et al., 2014) e previsão da arrecadação do ICMS
(RAMOS et al., 2015). Já relacionado a Suavização Exponencial, seu uso se justifica por esse
tipo de metodologia dar um peso maior aos valores recentes, o que é benéfico em séries que
sofram grandes influências em curtos períodos de tempo como a indústria têxtil (MILNITZ et
al., 2011), ou para fazer previsões de curto prazo como a demanda de vendas (VERÍSSIMO et
al., 2013), além disso, é um modelo de previsão que é simples, possui baixo custo de operação,
boa precisão, capacidade de ajustamento automático e rápido a mudanças na série temporal em
análise. Com relação às Redes Neurais Artificiais, a literatura mostra que os grandes benefícios
de se trabalhar com esse tipo de previsão se deve ao fato conseguir lidar com a não linearidade
41
das séries temporais, e com séries dinâmicas como séries econômicas (MUELLER et al., 1996),
demanda de tráfego (LAW; AU, 1999) e até mesmo irradiação solar (MELLIT; PAVAN, 2010).
As combinações de preditores foram usadas neste trabalho para aumentar a acurácia
e a eficiência da previsão, como já foi demonstrado por autores como Newbold (NEWBOLD;
GRANGER, 1974), Winkler (WINKLER; MAKRIDAKIS, 1983) e Bates (BATES; GRANGER,
1969). A técnica que utiliza a SA como método de combinação já foi utilizada em diversos
trabalhos como na previsão de índices de preços (MARQUES, 2005), na previsão de demanda
(HOLLAUER et al., 2008) enquanto a MV foi utilizada em trabalhos como (BATES; GRANGER,
1969), (WEIMER et al., 2003) e a mediana simples em séries financeiras como o valor da inflação
divulgada pelo Banco Central do Brasil (CARVALHO et al., 2009).
42
6 RESULTADOS E DISCUSSÕES
A série temporal do INCC representada na Figura 1 reflete dois momentos muito

importantes no país. Divulgado desde fevereiro de 1944, as intervenções econômicas sofridas
pelo país são refletidas diretamente na série. Mudanças que incluíram trocas de moeda e de plano
econômico na tentativa de frear a inflação na época, que chegou a valer quase 2000% (inflação
anual) no final da década de 80, só se estabilizaram a partir do plano real em 1994.
Os dados utilizados para análise e previsão envolvem os dados da série do INCC
somente a partir do plano real. A respeito desse período, o INCC possui um valor de média igual
a 0,74% com desvio padrão igual a 0,96%.
A partir da Figura 1, é possível analisar a variabilidade do INCC ao longo dos anos.
Pode-se perceber que o comportamento do fenômeno é heterogêneo, isto é, há períodos de maior
e outros de menor variabilidade do índice.
As maiores variações ocorreram nas décadas de 80 e 90, período marcado pela
redemocratização, pelo fim da ditadura e pela realização de eleições diretas para presidente além
da constituição de 88. Além disso, com a dívida externa e a elevada inflação essa época da
história brasileira ainda é marcada por várias alterações na moeda nacional na tentativa de frear
a inflação e melhorar a economia do país, entre essas alterações podemos citar o Plano Cruzado
de 1986 implantado por José Sarney trocando a moeda nacional de cruzeiro pra cruzado, o Plano
Verão também implantado pelo mesmo presidente trocando o cruzado para o cruzado novo em
1989, entretanto, apesar das tentativas de conter a inflação ao final da década de 80 a taxa de
inflação anual era de quase 2000% ((TEODORO, ; CRIBARI-NETO; CASSIANO, 2005).
Com o mandato de um novo presidente, Fernando Collor de Melo, houve uma nova
mudança na moeda nacional voltando ao cruzeiro em 1990, além disso, as medidas adotadas por
Collor causaram controvérsia deixando seus eleitores insatisfeitos. Políticas como o confisco
dos depósitos da poupança dos brasileiros além de outras medidas extremas culminaram em seu
impeachment.
A fase de depressão do ciclo econômico acabou por sanear a economia dos capitais
mais fracos, fortalecendo assim o capitalismo e abrindo espaço para que novos investimentos
fossem realizados. Dessa forma houve um estímulo à produção e emprego aquecendo a economia
(RIBEIRO; JUNIOR, 2005).
De acordo com o IBGE, a produção industrial cresceu 7,1% em janeiro de 1993, em
relação a janeiro de 1992, representando assim o quarto mês consecutivo de crescimento. Esse
43
crescimento continuou nos anos de 1993 e 1994, com a implantação do Plano Real, registrando
uma taxa de crescimento do PIB em torno de 5,9%. Essa melhora econômica também trouxe
impactos positivos para a construção civil, assim como a estabilização do INCC.
Figura 1 – Variabilidade do INCC, entre 1944 e 2017
Foi realizada a decomposição da série temporal do INCC com o objetivo de se ter

uma análise inicial dos aspectos ligados a ela. Tais aspectos podem ser observados através da
Figura 2:
Figura 2 – Decomposição da série (figura no topo) em componentes de tendência (trend),

sazonalidade (seasonal) e aleatoriedade (random).
A partir da Figura 2 , pode-se perceber uma tendência no aumento do valor dos dados
44
da série (trend), assim como uma sazonalidade (seasonal), o que pode influenciar negativamente
o modelo individual ARIMA.
A seguir, análises detalhadas a partir dos formalismos apresentados anteriormente
serão apresentadas.
6.1 Modelando e Prevendo Eventos Extremos
Para a realização da análise da série temporal do INCC, os autores consideraram

como eventos extremos todos aqueles valores do INCC que ultrapassaram ou igualaram o quantil
85% das ocorrências. Com o auxílio do so f tware R (TEAM, 2017). Tal quantil equivaleu
a 1.1585%. Assim, assumiu-se como eventos extremos, valores do INCC que superaram ou
igualaram o valor de 1.1585%. A Figura 3 exibe a série original do INCC no período posterior
ao Plano Real e o limiar que separa eventos extremos daqueles não extremos.
Figura 3 – Série temporal do INCC após o Plano Real
Elaborou-se um código para a análise de maneira genérica, com o intuito de poder

ser utilizado na aplicação de outros estudos. O código desenvolvido consiste de três partes: a
primeira refere-se ao tratamento estatístico; a segunda consiste na separação e contagem dos
eventos extremos, além da contabilização dos tempos entre suas ocorrências; e a terceira consiste
no ajustamento dos modelos PR, PNHP, KI e KII aos dados, através do método de máxima
verossimilhança, utilizando-se o pacote GenSA. (GUBIAN et al., 2012). Quanto à aderência de
45
PRG aos dados sob estudo, o teste sugerido por (OLIVEIRA et al., 2016) foi adotado.
Por último, pode-se realizar a análise das modelagens pretendidas e a obtenção do
modelo que melhor se ajustou ao banco de dados trabalhado, de acordo com os critérios de
informação apresentados anteriormente. De tal modelo, obtiveram-se ainda previsões sobre
eventos extremos não contemplados pela série dedicada à etapa de modelagem.
A análise da série do INCC apresentou os valores da Tabela 3, para os parâmetros de
PRGW, com base nos valores extremos (quantil 85%).
A Tabela 3 apresenta as estimativas de máxima verossimilhança para os parâmetros
α, β e q (digam-se â, b̂, q̂) e resume a qualidade dos modelos ajustados, de acordo com os
critérios de informação previamente introduzidos. Deve-se escolher aquele modelo que possui
os menores índices de AIC, AICc e BIC.
Tabela 3 – Valores de critérios de informação sobre modelos PRGW dedicados à série do INCC,
considerando como eventos extremos valores de ao menos 1.1585%
Formalismo AIC AICc BIC a b q
PR 245.5823 245.89 249.0577 6.36 0.94 0
PNHP 237.9589 238.2666 241.4342 1.0178 0.6675 1
Kijima I 239.3510 239.9826 244.5641 1.140475 0.6072 0.2726
Kijima II 239.9598 240.5904 245.1719 1.017812 0.6675 1
Fonte: O autor
Neste sentido, para o caso em estudo, o modelo que melhor se ajustou ao sistema do
INCC foi o PNHP, o que indica que as intervenções realizadas no sistema não conseguem atuar
na recuperação das falhas decorrentes de todos os intervalos anteriores de exposição, desde a fase
inicial de operação do sistema, somente deixá-lo em uma condição de "tão ruim quanto estava".
Em outros termos, as intervenções econômicas não estariam surtindo por si só tanto efeito
assim. Por outro lado, como tem-se uma estimativa para β , b < 1, pode-se inferir que, devido
a circunstâncias adversas às intervenções, intrínsecas ao próprio sistema, ele tem apresentado
melhorias.
Do teste de aderência sugerido por Oliveira (OLIVEIRA et al., 2016), conclui-se
que os dados originais seguem o PRGW sob um nível de significância de 1%. De fato, o nível de
significância dos dados foi de p-value = 50,9%.
A Figura 4 apresenta, de forma acumulada, os tempos entre as ocorrências de eventos
extremos do INCC. Pode-se notar a existência de uma tendência quase linear na série histórica,
indicando a ausência de aumentos ou diminuições significativas na quantidade de tempo referente
46
a um novo acontecimento de evento extremo.
Figura 4 – Tempos entre ocorrências de eventos extremos do INCC
Na Figura 4, são exibidos os tempos acumulados observados, séries simuladas a

partir do melhor modelo ajustado aos dados (PNHP) e as respectivas estimativas intervalares
de 95% de confiança para o tempo esperado das intervenções. A linha em azul refere-se às
previsões exatas para o tempo médio entre eventos extremos do INCC, de acordo com a fórmula
analítica apresentada por (FERREIRA et al., 2015), enquanto que a linha tracejada sólida em
preto apresenta uma aproximação, baseada em processos de amostragem via bootstraping. Vale
ressaltar a impossibilidade de computar os valores analíticos a partir do 38o evento extremo.
Isto se dá devido a problemas de cálculo numérico gerados pela necessidade de operar a função
Gamma incompleta, como ressaltado por (FERREIRA et al., 2015). Note-se ainda que a série real
(em linha sólida) esteve contemplada pelos intervalos de confiança mencionados em praticamente
todos os casos. Dessa forma, pode-se inferir que o modelo parece aderir adequadamente aos
eventos extremos subjacentes ao INCC.
Como destacado anteriormente, a partir do que foi abordado sobre os parâmetros
do PRGW pode-se presumir que, como estima-se β < 1, o sistema está em estado de melhora
considerando-se toda a sua história. Por sua vez, como q = 1, conclui-se que as intervenções
realizadas restaurariam minimamente o sistema financeiro em questão. Em termos econômicos,
47
conclui-se que, de acordo com o INCC, o Brasil vivencia historicamente períodos de melhora
irrelevantemente atenuados por suas intervenções. Naturalmente, tais argumentos fundamentam-
se apenas no estudo sobre o INCC, mas com grande repercussão sobre outros indicadores
econômicos importantes.
Tabela 4 – Tabela de previsão do mês de ocorrência de próximos eventos extremos do INCC, de

acordo com o modelo PNHP.
Intervention Intervention 43 44 45 46
Lower 2,5% quantile 173.39 180.98 190.51 198.42
Mean Mean 286.45 296.56 306.85 317.68
Upper 97,5% quantile 438.36 445.89 460.97 470.54
Fonte: O autor
Através do algorítmo, 43 eventos extremos são obtidos e através da Tabela 4 podem-

se ver as previsões para os próximos eventos extremos.
6.2 Modelando e Prevendo o Índice
Para a modelagem e previsão dos valores do INCC, os dados foram separados em 2

partes, uma de treino e uma de teste tanto para os modelos individuais quanto para os combinados.
A partir dessa análise, foram obtidos os modelos individuais para o ARIMA, ETS e ANN e a
partir desses modelos individuais ótimos se originaram as combinações. Os modelos individuais
são mostrados nas Tabelas 5 (parâmetros) junto as Figuras 5, 6, 7, 8 e 9 conforme mostrado a
seguir:
48
Tabela 5 – Estimativas dos parâmetros para os modelos sob estudo, individuais (ARIMA, ANN
e ETS) e combinados (MV e CB) para a série do INCC.
Metodologia Arquitetura Estimativas de parâmetros
ARIMA (3,1,1) φ̂1 = 0,1027; φ̂2 = 0,1014; φ̂3 =
0,1019; θ̂1 = 0,0542
ETS (M,N,N) φ̂ = 0,5031
ANN (2,3,1) 2 nós de entrada (ut−1 e ut−12 ), 3 nós
na camada oculta e 1 nó de saída (ut )
MV pesos (ω̂1 , ω̂2 , ω̂3 ) =
(0, 991, −0, 0283, 0, 0373)
CB Distribuição dos erros dos modelos ANN, E1 ∼ SNORM(−0.00316, 0.0181)∗ ,
ARIMA e ETS, (E1 , E2 , E3 ), bem como de E2 ∼
sua cópula de dependência, C(v1 , v2 , v3 ) SNORM(0.000908, 0.00871)∗ ,
E3 ∼ SNORM(−0.0162, 0.0193)∗ ,
C ≡ Normal(ρ̂E1 ,E2 =
0.273, ρ̂E1 ,E3 = 0.3, ρ̂E2 ,E3 = 0.825)
∗SNORM(l, s) ≡ Distribuição normal assimétrica, com parâmetros de localização l e de escala s.
Fonte: O autor
Figura 5 – Modelo Individual dedicado à série do INCC representando a série completa, bem
como suas previsões via ARIMA.
49
como suas previsões via ETS.
como suas previsões via ANN.
50
Figura 8 – Modelos Combinados dedicados à série do INCC representando a série completa,

bem como suas previsões via SA e SM.
Figura 9 – Modelos Combinados dedicados à série do INCC representando a série completa,

bem como suas previsões via MV e CB.
A partir da análise dos dados, foram obtidos os valores das métricas de desempenho
para cada tipo de modelagem de forma a serem determinados os melhores modelos para cada
métrica nas etapas de treinamento e teste. Os valores das métricas são apresentados nas tabelas 6
e 7.
51
Tabela 6 – Dados de Treinamento dos modelos individuais (ANN, ARIMA e ETS), bem como
dos combinadores (SA, SM, MV e CB), dedicados à série INCC. Os melhores
resultados estão em negrito
Métricas ANN ARIMA ETS SA SM MV CB
MSE 0,00009 0,00013 0,00013 0,00015 0,00015 0,00011 0,00010
MAPE 0,01563 0,01864 0,01770 0,02108 0,02072 0,01806 0,01652
Theil 0,663 0,983 0,992 1,20E+14 1,21E+14 0,868 0,81127
ARV 9,67E+14 1,86E+14 1,56E+14 3,50E+13 3,22E+14 1,16E+14 1,42E+14
WPOCID 0,54315 0,62944 0,64975 0,58378 0,61081 0,54054 0,59459
Fonte: O autor
De acordo com os dados de treinamento, o melhor modelo para a previsão seria a

ANN já que os valores foram mais favoráveis a 3 das 5 métricas de desempenho (métricas MSE,
MAPE e Theil) enquanto que para o ARV e WPOCID os melhores modelos foram o SA e MV
respectivamente.
Tabela 7 – Dados de Teste dos modelos individuais (ANN, ARIMA e ETS), bem como dos
combinadores (SA, SM, MV e CB), dedicados à série INCC. Os melhores resultados
estão em negrito.
Métricas ANN ARIMA ETS SA SM MV CB
MSE 0,00008 0,00008 0,00010 0,00008 0,00008 0,00007 0,00007
MAPE 0,01577 0,01516 0,01665 0,01546 0,01545 0,01549 0,01481
Theil 0,60622 0,65641 0,75350 0,60051 0,59878 0,56734 0,54141
ARV 8,52E+14 9,46E+14 3,48E+14 4,97E+14 6,88E+14 6,06E+14 8,83E+13
WPOCID 0,657534 0,589041 0,657534 0,520548 0,520548 0,493151 0,561644
Fonte: O autor
De acordo com os dados de teste, o melhor modelo foi CB, isto é, o de combinação
através de cópulas (melhor desempenho para MSE, MAPE, Theil e ARV), sendo esta metodologia
utilizada para a previsão dos dados. Segundo o WPOCID o melhor modelo foi o MV, de forma
análoga aos dados de treinamento. As métricas auxiliam no processo de decisão de qual é o
melhor modelo embora cada uma tenha suas particularidades com relação a qual seria o melhor
modelo.
Enquanto o MSE, MAPE, Theil e ARV se dedicam a calcular o erro associado a
previsão e sua relação com a aleatoriedade e a média, que é o objetivo principal deste trabalho
52
no que diz respeito a cópulas, enquanto o WPOCID analisa a qualidade do modelo sob outros
parâmetros, como os valores previstos e a sua tendência.
A partir do modelo de combinação através de cópulas CB, utilizando a cópula normal,
foi realizada a previsão através da metodologia de one step ahead, isto é, um passo a frente, para
o primeiro semestre de 2018 e feita a comparação da previsão com os dados reais do INCC para
o mesmo período. A previsão, através de cópulas (CB) e os dados observados são mostrados na
tabela 8.
Tabela 8 – Tabela de Previsão do modelo de combinação de cópulas, utilizando a cópula normal,

dedicado à série INCC para o primeiro semestre de 2018.
2018 PREVISÃO VIA CB SÉRIE ACERTOU TENDÊNCIA?
JANEIRO 0,6243 0,28 Sim
FEVEREIRO 0,6135 0,14 Sim
MARÇO 0,6675 0,23 Sim
ABRIL 0,6135 0,28 Não
MAIO 0,5270 0,3 Não
JUNHO 0,6459 0,76 Sim
JULHO 0,8405 0,72 Não
AGOSTO 0,5378 0,3 Sim
Fonte: O autor
De acordo com o observado, as previsões associadas ao modelo CB conseguem

prever a tendência de crescimento/decrescimento da série em 62,5% dos casos. Destaque-se
assim a necessidade de maiores estudos para obtenção de melhores resultados. De fato, os
modelos de séries temporais tenderam a apresentar dificuldades diante dos eventos extremos,
objetos de estudo bem absorvidos pelos modelos PRGW (seção anterior).
6.3 Considerações finais
Em virtude dos aspectos analisados, o presente trabalho ilustra a possibilidade da

análise de séries temporais sob aspectos diferentes do ponto de vista da PRGW e cópulas.
Inicialmente a análise se dá pela transformação de Séries Temporais em realizações
de Processos Estocásticos de Contagem. Além disso, observa-se que a transformação realizada
para o caso de estudo pode seguir a PRGW. Desse modo, é possível inferir sobre a dinâmica
do processo do INCC como um sistema reparável quanto a seus valores extremos, o qual se
53
apresenta em estado de melhora, apesar de ações de intervenções ineficazes, além disso, a análise
dos eventos extremos fornece informações sobre o comportamento do INCC mediante a inflação
vigente no país, servindo como indicador não só do setor da construção civil da economia como
um todo.
Devido ao desempenho atraente da PRGW na modelagem dos tempos entre ocor-
rências de valores extremos do INCC, tem-se um bom nível de confiança para previsões do
seu comportamento futuro, possibilitando auxílio para os investimentos imobiliários no país e
mesmo quanto a políticas públicas de intervenção.
Com este trabalho, pode-se perceber também a eficiência da previsão através da
combinação de modelos individuais se comparado a mesma sendo feita através de modelos
individuais, de forma que a metodologia é válida como uma ferramenta na tomada de decisão, e
baseando-se no caso de estudo, se torna uma ferramenta de extrema relevância ( e necessidade)
no âmbito da construção civil, e no ramo imobiliário em geral ao prever um índice de tamanho
impacto nos valores dos imóveis tanto dos em construção como nos respectivos aluguéis.
Da mesma maneira que foi realizado com o INCC, séries temporais de vários âmbitos
(social, econômico, ambiental) poderão ter a acurácia da previsão melhorada através do uso da
combinação através de cópulas, com a continuidade de estudos e o aprofundamento em outros
tipos de cópulas além das que foram abordadas neste trabalho, assim como a melhoria dos
algoritmos que foram a base desse trabalho de forma a obtenção de previsões com erros menores
dos que os apresentados.
Destaca-se a possibilidade da aplicação dos modelos apresentados em outros casos de
estudo, dedicando-se também ao aprofundamento no que se refere a séries temporais, processos
estocásticos, combinação de modelos de previsão e sistemas reparáveis de forma a corroborar
com a gestão e tomadas de decisões de diversos setores.
54
REFERÊNCIAS
AHMAD, W. M. A. W.; NOOR, N. F. M.; YUDIN, Z. B. M.; ALENG, N. A.; HALIM, N. A.

Time series modeling and forecasting of dengue death occurrence in malaysia using seasonal
arima techniques. International Journal of Public Health and Clinical Sciences, v. 5, n. 1, p.
154–163, 2018.
AKAIKE, H. A new look at the statistical model identification. IEEE transactions on

automatic control, Ieee, v. 19, n. 6, p. 716–723, 1974.
ANDERSEN, T. G.; DAVIS, R. A.; KREIß, J.-P.; MIKOSCH, T. Handbook of Financial Time
Series. Berlin: Springer-Verlag, 2009.
AZEVEDO, R. C.; ENSSLIN, L.; LACERDA, R. T. de O.; FRANÇA, L. A.; GONZÁLEZ, C.

J. I.; JUNGLES, A. E.; ENSSLIN, S. R. Avaliação de desempenho do processo de orçamento:
estudo de caso em uma obra de construção civil. Ambiente Construído, SciELO Brasil, v. 11,
n. 1, p. 85–104, 2011.
BARBOSA, S. K. G.; IRMÃO, J. F. Análise dos impactos gerados pelo programa minha casa
minha vida no índice de velocidade de vendas na região metropolitana do recife. Race: revista
de administração, contabilidade e economia, Editora Unoesc, v. 14, n. 2, p. 825–842, 2015.
BATES, J. M.; GRANGER, C. W. The combination of forecasts. Journal of the Operational

Research Society, Springer, v. 20, n. 4, p. 451–468, 1969.
BOSCARDIN, IVAN. INCC (o inimigo silencioso do comprador) e financia-

mento bancário. 2018. Disponível em: <http://mercadanteadvocacia.com/artigo/
incc-o-inimigo-silencioso-do-comprador-e-financiamento-bancario-2/>. Acesso em: 03 de
fevereiro de 2018.
BOX, G. E.; JENKINS, G. M. Time series analysis: forecasting and control, revised ed.
[S.l.]: Holden-Day, 1976.
BOZDOGAN, H. Model selection and akaike’s information criterion (aic): The general theory
and its analytical extensions. Psychometrika, Springer, v. 52, n. 3, p. 345–370, 1987.
CARVALHO, F. A. D.; BUGARIN, M. S.; CÉSPEDES, L. F.; JALIL, M. A. Inflation

expectations in latin america [with comments]. Economía, JSTOR, v. 6, n. 2, p. 101–145, 2006.
CARVALHO, F. A. de; MINELLA, A. et al. Market forecasts in brazil: performance and

determinants. Central Bank of Brazil Working Paper Series, n. 185, 2009.
CHATFIELD, C. Time-series forecasting. [S.l.]: CRC Press, 2000.
CHATFIELD, C. Time-series forecasting. New York: Chapman & Hall/CRC, 2000.
CHATFIELD, C. et al. Apples, oranges and mean square error. International Journal of
Forecasting, Elsevier, v. 4, n. 4, p. 515–518, 1988.
CHRISTIANSEN, M.; DENUIT, M.; LUCAS, N.; SCHMIDT, J.-P. Projection models for health
expenses. Annals of Actuarial Science, Cambridge University Press, v. 12, n. 1, p. 185–203,
2018.
55
CLEMEN, R. T. Combining forecasts: A review and annotated bibliography. International

journal of forecasting, Elsevier, v. 5, n. 4, p. 559–583, 1989.
CLEMENTS, M. P.; HENDRY, D. F. On the limitations of comparing mean square forecast

errors. Journal of Forecasting, Wiley Online Library, v. 12, n. 8, p. 617–637, 1993.
COLLOPY, F.; ARMSTRONG, J. S. Another error measure for selection of the best
forecasting method: the unbiased absolute percentage error. [S.l.]: Wharton School,
University of Pennsylvania, Marketing Department, 1994.
CORDEIRO, F. N. B. Aplicação da Teoria de Cópulas para o cálculo do Value at Risk. Tese

(Doutorado), 2009.
CRIBARI-NETO, F.; CASSIANO, K. M. Uma análise da dinâmica inflacionária brasileira.

Revista Brasileira de Economia, SciELO Brasil, v. 59, n. 4, p. 535–566, 2005.
CRYER, J. D.; CHAN, K.-S. Time Series Analysis: With Applications in R. [S.l.]: Springer
Science & Business Media, 2008.
EDIGER, V. Ş.; AKAR, S. Arima forecasting of primary energy demand by fuel in turkey.
Energy Policy, Elsevier, v. 35, n. 3, p. 1701–1708, 2007.
EYMEN, A.; KÖYLÜ, Ü. Seasonal trend analysis and arima modeling of relative humidity and
wind speed time series around yamula dam. Meteorology and Atmospheric Physics, Springer,
p. 1–12, 2018.
FARIA, L.B. ESTIMATIVA DA VALORIZAÇÃO IMOBILIÁRIA NO MUNICÍPIO DE

FORTALEZA. 2016. Disponível em: <http://www.repositorio.ufc.br/bitstream/riufc/19534/1/
2016_dis_lbfaria.pdf>. Acesso em: 04 de Março de 2018.
FERREIRA, R. J.; FIRMINO, P. R. A.; CRISTINO, C. T. A mixed kijima model using the
weibull-based generalized renewal processes. PloS one, Public Library of Science, v. 10, n. 7, p.
e0133772, 2015.
FILDES, R. The evaluation of extrapolative forecasting methods. International Journal of

FILHO, J. A. P.; DIAS, A. J. G.; CORTES, P. L. Aspectos normativos a respeito de

resíduos de construção civil: uma pesquisa exploratória da situação no brasil e em portugal.
Desenvolvimento e Meio Ambiente, v. 29, 2014.
FIRMINO, P. R.; DROGUETT, E. L. A numerical procedure for handling mixed bayesian

networks. In: European Safety and Reliability Annual Conference. Prague: [s.n.], 2009.
FIRMINO, P. R. A.; NETO, P. S. de M.; FERREIRA, T. A. Correcting and combining time

series forecasters. Neural networks, Elsevier, v. 50, p. 1–11, 2014.
FIRMINO, P. R. A.; NETO, P. S. M.; FERREIRA, T. A. E. Error modeling approach to improve

time series forecasters. Neurocomputing, v. 153, p. 242–254, 2015.
GAO, G.; LO, K.; LU, J. Risk assessment due to electricity price forecast uncertainty in uk
electricity market. In: IEEE. Universities Power Engineering Conference (UPEC), 2017
52nd International. [S.l.], 2017. p. 1–6.
56
GARDNER, E. S. Exponential smoothing: The state of the art. Journal of forecasting, Wiley
Online Library, v. 4, n. 1, p. 1–28, 1985.
GENEST, C.; FAVRE, A.-C. Everything you always wanted to know about copula modeling but
were afraid to ask. Journal of hydrologic engineering, American Society of Civil Engineers,
v. 12, n. 4, p. 347–368, 2007.
GERHARDT, T. E.; SILVEIRA, D. T. Métodos de pesquisa. [S.l.]: Plageder, 2009.
GERNAND, L. Understanding aic and bic in model selection. Handreichungen zum Vortrag
vom, v. 20, p. 1–18, 2009.
GIL, A. C. Como elaborar projetos de pesquisa. São Paulo, v. 5, n. 61, p. 16–17, 2002.
GUBIAN, S.; XIANG, Y.; SUOMELA, B.; HOENG, J. Generalized simulated annealing for
efficient global optimization: the gensa package for r. The R Journal, 2012.
HAYKIN, S. Redes Neurais: Princ?pio e pr?tica. [S.l.]: Bookman, 2001.
HAYKIN, S. Redes neurais: princípios e prática. [S.l.]: Bookman Editora, 2007.
HERNÁNDEZ, N.; CAMARGO, J.; MORENO, F.; PLAZAS-NOSSA, L.; TORRES, A. Arima
as a forecasting tool for water quality time series measured with uv-vis spectrometers in a
constructed wetland. Tecnología y Ciencias del Agua, Instituto Mexicano de Tecnologia de
Agua, v. 8, n. 5, p. 127–139, 2017.
HOLLAUER, G.; ISSLER, J. V.; NOTINI, H. H. Prevendo o crescimento da produção industrial

usando um número limitado de combinações de previsões. Economia Aplicada, SciELO Brasil,
v. 12, n. 2, p. 177–198, 2008.
HYNDMAN, R.; KHANDAKAR, Y. Automatic time series forecasting: The forecast package
for r. Journal of Statistical Software, v. 26, n. 3, p. 1–22, 2008.
HYNDMAN, R.; KOEHLER, A. B.; ORD, J. K.; SNYDER, R. D. Forecasting with

exponential smoothing: the state space approach. [S.l.]: Springer Science & Business Media,
2008.
HYNDMAN, R. J.; KOEHLER, A. B.; SNYDER, R. D.; GROSE, S. A state space framework
for automatic forecasting using exponential smoothing methods. International Journal of
INEC. Índice de Precios de la Construcción. 2018. Disponível em: <http://www.

ecuadorencifras.gob.ec/indice-de-precios-de-la-construccion/>. Acesso em: 05 de Maio de
2018.
JARA, LUCIANO. Índice del Costo de la Construcción. 2015. Disponível em:

<http://www.observatorio.unr.edu.ar/indice-del-costo-de-la-construccion/>. Acesso em: 05 de
Maio de 2018.
JR, E. S. G. Exponential smoothing: The state of the art—part ii. International journal of
forecasting, Elsevier, v. 22, n. 4, p. 637–666, 2006.
57
KANCHYMALAY, K.; SALIM, N.; SUKPRASERT, A.; KRISHNAN, R.; HASHIM, U. R.

Multivariate time series forecasting of crude palm oil price using machine learning techniques.
In: IOP PUBLISHING. IOP Conference Series: Materials Science and Engineering. [S.l.],
2017. v. 226, n. 1, p. 012117.
KHASHEI, M.; BIJARI, M. A new class of hybrid models for time series forecasting. Expert
Systems with Applications, Elsevier, v. 39, n. 4, p. 4344–4357, 2012.
KIJIMA, M.; SUMITA, U. A useful generalization of renewal theory: counting processes

governed by non-negative markovian increments. Journal of Applied Probability, Cambridge
University Press, v. 23, n. 1, p. 71–88, 1986.
KLAZOGLOU, P.; DRITSAKIS, N. Modeling and forecasting of us health expenditures using

arima models. In: SPRINGER. International Conference on Applied Economics. [S.l.], 2017.
p. 457–472.
KOHLSCHEEN, E. Uma nota sobre erros de previsão da inflação de curto-prazo. Revista

Brasileira de Economia, SciELO Brasil, v. 66, n. 3, p. 289–297, 2012.
LAW, R.; AU, N. A neural network model to forecast japanese demand for travel to hong kong.
Tourism Management, Elsevier, v. 20, n. 1, p. 89–97, 1999.
LENCIONI, S. Reestruturação imobiliária: uma análise dos processos de concentração e

centralização do capital no setor imobiliário. EURE (Santiago), SciELO Chile, v. 40, n. 120, p.
29–47, 2014.
LOPES, O.; LIBRELOTTO, L.; AVILA, A. Orçamento de obras. Florianópolis: Universidade

do Sul de Santa Catarina, 2003.
MACHADO, M. E. R.; CERETTA, P. S.; VIEIRA, K. M. A relação entre as variáveis

macroeconômicas e a concessão de crédito no mercado imobiliário brasileiro. Revista de
Gestão, Finanças e Contabilidade, Universidade do Estado da Bahia (UNEB)-Departamento
de Ciências Humanas, v. 4, n. 3, p. 64, 2014.
MAIA, A. L. S.; CRIBARI-NETO, F. Dinâmica inflacionária brasileira: resultados de

auto-regressão quantílica. Revista Brasileira de Economia, SciELO Brasil, v. 60, n. 2, p.
153–165, 2006.
MAKRIDAKIS, S. Accuracy measures: theoretical and practical concerns. International

Journal of Forecasting, Elsevier, v. 9, n. 4, p. 527–529, 1993.
MARQUES, E. B. Combinação de previsões de índices de preços. Tese (Doutorado), 2005.
MCCORMICK, G. P. Communications to the editor—exponential forecasting: Some new

variations. Management Science, INFORMS, v. 15, n. 5, p. 311–320, 1969.
MELLIT, A.; PAVAN, A. M. A 24-h forecast of solar irradiance using artificial neural network:
Application for performance prediction of a grid-connected pv plant at trieste, italy. Solar
Energy, Elsevier, v. 84, n. 5, p. 807–821, 2010.
MILNITZ, D.; MARCHI, J. J.; SAMOHYL, R. W. Previsão de demanda: Uma aplicação

do método de holt winters em uma indústria têxtil de grande porte. XXXI ENCONTRO
NACIONAL DE ENGENHARIA DE PRODUCAO, 2011.
58
MODARRES, M. Risk analysis in engineering: techniques, tools, and trends. [S.l.]: CRC
press, 2016.
MORETTIN, P. A.; TOLOI, C. Análise de séries temporais. In: Análise de séries temporais.
[S.l.: s.n.], 2006.
MUELLER, A. et al. Uma aplicação de redes neurais artificiais na previsão do mercado

acionário. 1996.
NELSEN, R. B. An Introduction to Copulas. 2nd ed. ed. New York: Springer, 2006.
NELSEN, R. B. An introduction to copulas. [S.l.]: Springer Science & Business Media, 2007.
NEWBOLD, P.; GRANGER, C. W. Experience with forecasting univariate time series and
the combination of forecasts. Journal of the Royal Statistical Society. Series A (General),
JSTOR, p. 131–165, 1974.
OLIVEIRA, C. C. F. de; CRISTINO, C. T.; FIRMINO, P. R. A. In the kernel of modelling

repairable systems: a goodness of fit test for weibull-based generalized renewal processes.
Journal of Cleaner Production, Elsevier, v. 133, p. 358–367, 2016.
OLIVEIRA, R. T. A.; FIRMINO, P. R. A.; FERREIRA, T. A. E. Estudando fundamentos de

modelos de cópulas. In: Reunião Anual da Região Brasileira da Sociedade Internacional
de Biometria e o Simpósio de Estatística Aplicada e Experimentação Agronômica. [S.l.:
s.n.], 2013. p. 1–21.
OLIVEIRA, R. T. A.; OLIVEIRA, T. F.; FIRMINO, P. R.; FERREIRA, T. A. E. Combining time

series forecasting models via gumbel-hougaard copulas. In: 1st BRICS Countries Conference
on Computational Intelligence. [S.l.: s.n.], 2013. p. 1–6.
OLIVEIRA, R. T. de; ASSIS, T. F. O. de; FIRMINO, P. R. A.; FERREIRA, T. A.; OLIVEIRA,

A. L. Copulas-based ensemble of artificial neural networks for forecasting real world time series.
In: IEEE. Neural Networks (IJCNN), 2016 International Joint Conference on. [S.l.], 2016.
p. 4089–4096.
OLIVEIRA, R. T. de; ASSIS, T. F. O. de; FIRMINO, P. R. A.; FERREIRA, T. A. Copulas-based

time series combined forecasters. Information Sciences, Elsevier, v. 376, p. 110–124, 2017.
OLIVEIRA, T. F.; FIRMINO, P. R.; FERREIRA, T. A. E. Study of models’ uncertainty by

gumbel copula (in portuguese). In: 58a RBras Reunião Anual da Região Brasileira da
Sociedade Internacional de Biometria. [S.l.: s.n.], 2013. p. 1–13.
OLIVEIRA, T. F.; FIRMINO, P. R. A.; FERREIRA, T. A. Estudo da incerteza de modelos

via cópulas de gumbel. 58o RBras Reuniao Anual da Regiao Brasileira da Sociedade
Internacional de Biometria, p. 1–13, 2013.
OLIVEIRA, T. F.; OLIVEIRA, R. T. A.; FIRMINO, P. R.; NETO, P. S. M.; FERREIRA, T.

A. E. Combination of biased artificial neural network forecasters. In: 1st BRICS Countries
Conference on Computational Intelligence. [S.l.: s.n.], 2013. p. 1–6.
PEREIRA, T. F. B. Modelação e previsão das vendas de medicamentos não sujeitos a

receita médica e produtos de saúde e bem-estar. Tese (Doutorado) — Instituto Superior de
Economia e Gestão, 2017.
59
PORTAL BRASIL,FGV. Índice Nacional de Custo da Construção do Mercado - INCC - M.

2018. Disponível em: <http://www.portalbrasil.net/incc.htm>. Acesso em: 20 de Janeiro de
2018.
RAMOS, P.; SANTOS, N.; REBELO, R. Performance of state space and arima models
for consumer retail sales forecasting. Robotics and computer-integrated manufacturing,
Elsevier, v. 34, p. 151–163, 2015.
RIBEIRO, N. R.; JUNIOR, A. V. de M. O ciclo econômico brasileiro nos anos 90: Uma análise
com vetores auto regressivos. Revista Economia e Desenvolvimento, v. 4, n. 1, 2005.
RODRIGUES, J. L. K.; COELHO, F. A.; SILVA, T. M. D. da. Processo de tomada de decisão na
gestão financeira em empresas de construção civil: Um estudo caso/decision making process
in the financial management in civil construction companies: A case study. Revista FSA
(Faculdade Santo Agostinho), v. 11, n. 2, p. 50–69, 2014.
ROJO, C. A.; BERTOLINI, G. R. F. Decisão de investimento para geração de renda: locação de
imóveis versus fundos de investimentos imobiliários-fiis. Revista Inteligência Competitiva,
v. 5, n. 4, p. 94–111, 2015.
SANTOS, M. F. dos. Aplicação de cópulas na modelação do número de sinistros de grupos de
risco homogéneos no seguro automóvel. 2011.
SAVU, C.; TREDE, M. Hierarchies of archimedean copulas. Quantitative Finance, Taylor &
Francis, v. 10, n. 3, p. 295–304, 2010.
SCHEFFER, D.; SOUZA, A. M.; ZANINI, R. R. Utilização de modelos arima para previsão da
arrecadação de icms do estado do rio grande do sul. XVII Simpósio de Pesquisa Operacional
e Logística da Marinha-SPOLM. Anais... São Paulo, 2014.
SCOLESE, D.; BERGMANN, D. R.; SILVA, F. Lopes da; SAVOIA, J. R. F. Análise de estilo de
fundos imobiliários no brasil. Revista de Contabilidade e Organizações, Universidade de São
Paulo, v. 9, n. 23, 2015.
SIMON, H. Redes Neurais–Princípios e Prática. [S.l.]: Porto Alegre: Bookman, 2001.
SKLAR, A. Fonctions de r?partition ? n dimensions et leurs marges. l’Institut de Statistique
de L’Universit? de Paris, v. 8, p. 229–231, 1959.
STEINER,S. Five economic indicators to watch. 2009. Disponível em: <ttps:
//www.bankrate.com/investing/5-economic-indicators-to-watch/>. Acesso em: 10 de Fevereiro
de 2018.
TAS, E.; YAMAN, H. A building cost estimation model based on cost significant work packages.
Engineering, Construction and Architectural Management, Emerald Group Publishing
Limited, v. 12, n. 3, p. 251–263, 2005.
TEAM, R. C. R: A language and environment for statistical computing. R Foundation for
Statistical Computing, Vienna, Austria. 2016. 2017.
TEAM, R. C. et al. R: A language and environment for statistical computing. Citeseer, 2013.
TEODORO, F. C. Planos econômicos brasileiros. Revista do Direito Público, v. 10, n. 1, p.
229–231.
60
TSAI, C.; WANG, S. Stock price forecasting by hybrid machine learning techniques. In:
Proceedings of the International MultiConference of Engineers and Computer Scientists.
[S.l.: s.n.], 2009. v. 1, n. 755, p. 60.
VALIM, V. Z. Riscos e cuidados com investimentos no mercado imobiliário. Revista

Especialize Online IPOG, v. 6, n. 06, p. 1–15, 2013.
VELLASCO, M. M. B. R. Otimização de Funções Não Convexas utilizando um Algoritmo

de Estimação de Distribuição baseado em Cópulas Multivariadas. Tese (Doutorado) —
PUC-Rio, 2014.
VERÍSSIMO, A. J.; ALVES, C. da C.; HENNING, E.; AMARAL, C. E. do; CRUZ, A. C. da.
Métodos estatísticos de suavização exponencial holt-winters para previsão de demanda em uma
empresa do setor metal mecânico. Revista Gestão Industrial, v. 8, n. 4, 2013.
WALTER, O. M. F. C.; HENNING, E.; MORO, G.; SAMOHYL, R. W. Aplicação de um

modelo sarima na previsão de vendas de motocicletas. Exacta, Universidade Nove de Julho,
v. 11, n. 1, 2013.
WEIMER, D.; OBER, D.; MAYNARD, N.; COLLIER, M.; MCCOMAS, D.; NESS, N.;
SMITH, C.; WATERMANN, J. Predicting interplanetary magnetic field (imf) propagation
delay times using the minimum variance technique. Journal of Geophysical Research: Space
Physics, Wiley Online Library, v. 108, n. A1, 2003.
WINKLER, R. L.; MAKRIDAKIS, S. The combination of forecasts. Journal of the Royal

Statistical Society. Series A (General), JSTOR, p. 150–157, 1983.
YAN, J. Enjoy the joy of copulas: With a package copula. Journal of Statistical Software,
v. 21, p. 1–18, 2007. Disponível em: <http://www.jstatsoft.org/v21/i04/paper>.
YAN, J. et al. Enjoy the joy of copulas: with a package copula. Journal of Statistical Software,
Citeseer, v. 21, n. 4, p. 1–21, 2007.
YU, Z.; LEI, G.; JIANG, Z.; LIU, F. Arima modelling and forecasting of water level in the
middle reach of the yangtze river. In: IEEE. Transportation Information and Safety (ICTIS),
2017 4th International Conference on. [S.l.], 2017. p. 172–177.
ZHANG, G. P. Time series forecasting using a hybrid arima and neural network model.
Neurocomputing, Elsevier, v. 50, p. 159–175, 2003.

Modelando e Prevendo o Indice Nacional de Custo Da Construção Civil Via Cópulas

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Modelando e Prevendo o Indice Nacional de Custo Da Construção Civil Via Cópulas

Hochgeladen von

Copyright:

Verfügbare Formate

UNIVERSIDADE FEDERAL DO CARIRI

CENTRO DE CIÊNCIAS E TECNOLOGIA

VIVIANE GONÇALVES DIAS

MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE

JUAZEIRO DO NORTE - CEARÁ

MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE NACIONAL DE

Trabalho de Conclusão de Curso apresentado

Orientador: Prof. Dr. Paulo Renato Al-

Coorientadora: Profa. Dra. Rosilda Bení-

JUAZEIRO DO NORTE - CEARÁ

TCC (Graduação) – Universidade Federal do Cariri, Centro de Ciência e Tecnologia, Curso

Orientação: Prof. Dr. Paulo Renato Alves Firmino.

1. Construção civil. 2. Métodos preditivos. 3. Processos de Renovação Generalizados.

MODELANDO E PREVENDO PROCESSOS ESTOCÁSTICOS DO ÍNDICE NACIONAL DE

Trabalho de Conclusão de Curso apresentado

Prof. Dr. Paulo Renato Alves Firmino (Orientador)

Profa. Dra. Rosilda Benício de

Prof. Me. Dimas de Castro e Silva Neto

Prof. Me. Pedro Ferreira de Lima

Palavras-chave: Construção civil. Métodos preditivos. Processos de Renovação Generaliza-

Keywords: Civil Construction. Predictive methods. Generalized Renewal Processes. Combining

Figura 1 – Variabilidade do INCC, entre 1944 e 2017 . . . . . . . . . . . . . . . . . . 43

Tabela 1 – INCC - Ponderações Municipais . . . . . . . . . . . . . . . . . . . . . . . 20

AIC Akaike Information Criteria

O desenvolvimento sustentável tem sido avaliado e discutido, a níveis acadêmico,

3.1 Objetivo Geral

Modelar e prever o Índice Nacional de Custo da Construção (INCC) através de

3.2 Objetivos específicos

1. Rever a literatura sobre INCC, processos de renovação generalizados (PRG) e séries

4.1 Índice Nacional de Custo da Construção (INCC)

O Índice Nacional de Custo da Construção (INCC) é um tributo que incide sobre

Onde M(= 1, 2, . . . , n) é o índice do município.

Tabela 1 – INCC - Ponderações Municipais

4.2 Modelos de Previsão de Séries Temporais

Em processos de tomada de decisão é bastante comum especular cenários futuros.

ut = {ut ∈ R | t = 1, 2, 3, ..., n}, n ∈ N, (4.6)

Onde t é o índice cronológico e n o número de observações na amostra analisada.

CHRISTIANSEN et al., 2018) e econômicas (FIRMINO et al., 2014).

4.2.1 Auto Regressive Integrated Moving Average (ARIMA)

Em um modelo de média móvel integrado autoregressivo, o valor futuro de uma

ut = φ1 ut−1 + ... + φ p ut−p + εt (4.7)

ut = µ + ε − θ1 εt−1 − . . . − θq εt−q (4.8)

ut = φ1 ut−1 + ... + φ p ut−p + ε − θ1 εt−1 − ... − θq εt−q (4.9)

Onde φ and θ são, respectivamente, os parâmetros AR(p) e MA(q), e ε é o erro e µ

Wt = φ1Wt−1 + ... + φ pWt−p + ε − θ1 εt−1 − ... − θq εt−q , (4.10)

em que Wt = ut − ut−1 representa a 1a diferenciação (I) no tempo t da série.

4.2.2 Suavização Exponencial (ETS)

A suavização exponencial é um método estatístico de previsão que parte de um

O componente T é uma combinação de um termo de nível (l) e um termo de

Th = l + (φ + φ 2 + ... + φ h )b. (4.16)

Onde Th é a tendência para o próximo período h e φ é um parâmetro de amorteci-

Finalmente, após a estimação de T, os componentes S (nenhum, aditivo ou multi-

Tabela 2 – Arquiteturas para o modelo ETS

4.2.3 Redes Neurais Artificiais (ANN)

Redes Neurais Artificiais são estruturas de computação adaptáveis usadas para

onde wi, j (i = 0, 1, 2, ..., P, j = 1, 2, ..., Q) e w j ( j = 0, 1, 2, ..., Q) são os pesos entre as conexões,

4.3 Combinação de Modelos de Séries Temporais

Como afirmado por Chatifield (CHATFIELD, 2000a), quase toda a literatura de

4.3.1 Média Simples (SA)

O modelo SA consiste na média aritmética simples dos k modelos individuais usados

onde, no momento t, ût é a estimativa do modelo combinado, k o número de modelos e xt,i é o

4.3.2 Mediana Simples (SM)

O modelo SM consiste na mediana simples das observações dos k modelos indivi-