Beruflich Dokumente
Kultur Dokumente
TESIS
PRESENTADA POR:
INGENIERO ESTADÍSTICO
E INFORMÁTICO
PUNO – PERÚ
2012
UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERÍA ESTADÍSTICA E INFORMÁTICA
ESCUELA PROFESIONAL DE INGENIERÍA ESTADÍSTICA E INFORMÁTICA
TESIS
Presentada a la Coordinación de Investigación de la Facultad de Ingeniería
Estadística e Informática de la Universidad Nacional del Altiplano Puno, para
optar el título profesional de Ingeniero Estadístico e Informático.
APROBADA POR:
PRIMER MIEMBRO :
M.Sc. Perez Quispe, Samuel Donato
SEGUNDO MIEMBRO :
Ing. Ramos Calcina, Alcides
DIRECTOR DE TESIS :
M.Sc. Confesor Milan, Vargas Valverde
ASESOR DE TESIS :
Ing. Edgar Pablo Vilca Gonsales
DEDICATORIA
A Dios.
Por haberme permitido llegar hasta este punto y haberme dado salud para lograr
A mi amado hijo Isacc y a mis queridos hermanos, Willian e Ivan y a todas las personas
que siempre me motivaron y apoyaron, pienso que sin el apoyo de ellos no hubiese
A: A mis compañeros de estudios por su amistad y los gratos recuerdos que siempre
predicciones.
Como objetivo general busca, determinar el modelo univariante que mejor predice la
Lampa, periodo 2000 - 2011. Mientras que con los objetivos específicos se pretende:
modelo y con éste pronosticar la serie del número de casos de IRAS en menores de 5
validación del modelo se realizó el análisis de los residuos y de los coeficientes, con lo
que se llega a cumplir que los residuos son compatibles con un ruido blanco, el valor de
Para la predicción de la serie analizada, se hizo uso del mejor modelo estimado. Se
obtuvieron predicciones para los doce periodos siguientes (Enero a Diciembre de 2012)
dando a conocer que en dichos meses, el comportamiento del número de casos de IRAS
los cero grados centígrados. Esta situación provoca graves enfermedades en niños y
fin de reducir la mortalidad de niños y niñas por IRAS. Las consecuencias de las
Las técnicas de pronóstico de series de tiempo permiten llevar a cabo esta labor por
en el caso de que dicho método sea bien aplicado, hasta alcanzar el mejor modelo.
4
II. PLANTEAMIENTO TEÓRICO DE LA
INVESTIGACIÓN
1.1. FORMULACIÓN DEL PROBLEMA.
principales de salud entre los niños menores de cinco años de los países en
desarrollo. En la Región de las Américas, las IRAS se ubican entre las primeras
un año, es decir un promedio de 300 muertes diarias. Noventa y nueve por ciento de
estas muertes ocurre en los países en desarrollo. Otros 40.000 niños mueren
anualmente por neumonía antes de alcanzar los cinco años de edad, lo cual
representa otras 100 muertes diarias por esta causa en todo el hemisferio.
de nuestro país, y Lampa es una de las provincias que presenta un alto índice de
(incluso la muerte). Peor aún si estos niños suelen ser los de menores recursos y,
leve; pero hay que prestarles mucha atención, especialmente cuando el enfermo es
menor de 5 años, debido a que este grupo atareó es causante de la mayor cantidad
5
de consulta en los servicios de salud y por tanto requiere de una mayor inversión de
los programas sociales que dirigen los gobiernos locales en la prevención de las
mismas.
Para poder combatir o por lo menos controlar las IRAS, es primordial tener
años, para hacer, que los gobiernos locales inviertan en lograr reducir o por lo
menos controlar estas condiciones y se pueda prevenir a la niñez contra ese daño.
prevención y de la recuperación de los niños que padecen las IRAS. Por ello el
¿Cuál es el modelo univariante que mejor predice la evolución del número de casos
6
Este grupo de enfermedades son la principal causa de consulta en los servicios de
salud y la que causa más muertes, especialmente en niños menores de 5 años, por
tal razón, es de vital importancia contar con un instrumento que nos permita tomar
precauciones futuras.
a esta situación.
OBJETIVO GENERAL:
2011.
OBJETIVOS ESPECÍFICOS:
7
1.4. HIPÓTESIS.
HIPÓTESIS GENERAL:
integrados.
casos de IRAS, abarcando solo a la provincia de Lampa y solo para los menores de
5 años.
8
I. MARCO TEÓRICO
mejor ajuste con respecto a los modelos No Integrados, y que los Modelos
Modelos Integrados1.
1 NEIRA, Porfirio. (1995). “Modelos Univariantes y Espectros de Series de Tiempo para los pacientes
Hospitalizados por Neumonía Carlos Monje Medrano Juliaca, 1980 – 1993”. [TESIS]. Facultad de Ingeniería
Estadística e Informática-Universidad Nacional del Altiplano, Puno-Perú.
2 DIAZ MAMANI, Nela. (2008). “Pronóstico mediante modelos de series de tiempo para el consumo de agua
potable de la Empresa Municipal de Saneamiento Básico de la ciudad de Puno, periodo 2000-2007”. [TESIS].
Facultad de Ingeniería Estadística e Informática-Universidad Nacional del Altiplano, Puno-Perú.
9
HUACANTARA CHAMBI, Karin Corina. “Modelo Uniecuacional para
las variaciones de los niveles medios mensuales de agua del Lago Titicaca
(sobre los 3810 m.s.n.m.) de la región de Puno, período 1984 – 2008. Concluye
medios de agua del Lago Titicaca del periodo 1984 – 2008. El modelo
2.2.1. PRONÓSTICOS.
decisiones.
3
HUACANTARA CHAMBI, Karin Corina. (2010). “Modelo uniecuacional para describir y predecir el
comportamiento de los niveles medios de agua del Lago Titicaca, periodo 1984 – 2008, Puno”. [TESIS]. Facultad
de Ingeniería Estadística e Informática-Universidad Nacional del Altiplano, Puno-Perú.
10
anteriores continuará ocurriendo en el futuro inmediato. Evidencias
sobre todo cuando las series de tiempo representan una larga historia de las
variables analizadas.
pequeña, pública y privada, utiliza el pronóstico, debido a que casi todas las
pronósticos cruza todas las líneas funcionales, lo mismo que todo tipo de
organizaciones.
4 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 3.
5 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 4.
11
a) TÉCNICAS DE PRONÓSTICO CUALITATIVAS.
Los pronósticos a largo plazo son necesarios para establecer el curso general
mediano plazo abarcan de uno a dos años. Los pronósticos a corto plazo se
12
Las técnicas más complejas de Box-Jenkins resultan apropiadas para
variable en particular9.
modelo clásico para una serie de tiempo, puede ser expresada como suma o
aleatorio.
6 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 117.
7 ANDERSON, Oliver D. (1985). Times Serie Análisis and Forecasting. (1ra Edición).
8 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
13
COMPONENTES DE UNA SERIE TEMPORAL.
a) Tendencia.
parecidas.
10 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 99.
14
relacionado con la época o un periodo particular, por lo general en el
contiguas12.
11 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 99-100.
12 ANDERSON, Oliver D. (1985). Times Serie Análisis and Forecasting. (1ra Edición).
15
establecer la efectividad de medidas que afectan a grupos poblacionales
De acuerdo a Chatfield (1978), son varios los objetivos por los cuales se
principales de la serie.
Predicción: Dada una serie de tiempo se intenta predecir los valores futuros
tiempo.
13 DATA MINING INSTITUTE, “Diccionario estadístico”. [Acceso 7 de Mayo de 2009]. Disponible en Web:
http://www.estadistico.com/dic.html?p=3729
14 SPIEGEL R, Murray, STEPHENS J, Larry. Estadística. (3ra Edición). México: Editorial Mexicana.
15 CHATFIELD, C. (1978). The analysis of time series: theory and practice, Londres: Chapman and Hall.
16
ESTIMACION DE LA TENDENCIA.
Cálculo para b:
n xy x y
b
n x 2 ( x ) 2
Calculo para a:
a
x y x xy
2
n x ( x )
2 2
a Y Xb
Donde:
n: Número de observaciones.
17
y: valores de x que caen en la línea de tendencia.
Método “a mano”.
aleatorias ordenadas.
…, Y1 , Y2 ,........, Yt ,….
temporal.
16 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 24.
18
PROCESO ESTOCÁSTICO ESTACIONARIO.
varía17.
conjunta será
verifica que:
E (Yt ) , t
17 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 27.
19
Por tanto, en un proceso estacionario en media, la esperanza matemática, o
decir:
E (Yt ) 2 2 , t
periodos. Así:
E (Yt k )(Yt ) k , t
Que sería una autocovarianza de orden k, por ser éste el lapso de tiempo
siguiente forma:
20
k
k , donde k ≥ 0
0
de correlograma18.
condiciones:
i) E t 0 t
ii ) E t 2 t
2
2.2.8. ESTACIONALIDAD.
tiempo19. Se dice que una serie de tiempo es estacional cuando los datos
18 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 27-28.
19 DATA MINING INSTITUTE, “Diccionario estadístico”. [Acceso 7 de Mayo de 2009]. Disponible en Web:
http://www.estadistico.com/dic.html?p=3729
21
inferior al año, por ejemplo la repetición del patrón puede ser cada 3 meses,
variable relacionada con otra variable. Es una cantidad que está entre -1 y
expresa:
r R2
n n
R 2 Yˆi E Y / Yi E Y
2 2
i 1 i 1
e2 p1 Yt Yˆt / T k
T 2
22
Donde:
K es el número de estimadores.
e e2
se define como:
𝛾𝑘
𝑝𝑎𝑟𝑎 𝑘 = 1, … , 𝑛 − 1
𝜌𝑘 = { 𝛾0
1 𝑝𝑎𝑟𝑎 𝑘 = 0
Donde:
𝑛
1
𝛾0 = ∑(𝑌𝑡 − 𝑌̅)2
𝑛
𝑡=1
23
𝑛−𝑘
1
𝛾𝑘 = ∑(𝑌𝑡 − 𝑌̅)(𝑌𝑡+𝑘 −𝑌̅)
𝑛
𝑡=1
24
Tipo de
Patrón típico de FAC Patrón típico de FACT
modelo
Disminuye exponencialmente o Picos grandes a los largo
AR(p) con un patrón sinusoidal de los p rezagos.
decrecientes o ambos.
Picos grandes a los largo de los q Decrece
MA(q)
rezagos. exponencialmente.
Decrece exponencialmente. Decrece
ARMA(p,q)
exponencialmente.
2.2.13. MODELO.
comportamiento.
cronológica.
23 G. KENDALL Maurice y BUCKLAND William. (1984). Diccionario de Estadística. Traducido por Eduardo
Morales. (3ra Edición). Ediciones Pirámide.
24 SPIEGEL R, Murray, STEPHENS J, Larry. Estadística. (3ra Edición). México: Editorial Mexicana.
25
2.2.15. MODELO UNIVARIANTE.
más amplio, dentro del cual los modelos ARIMA univariantes son sólo
una parte.
estacionalidad de la serie.
25ANDERSON, Oliver D. (1985). Times Serie Análisis and Forecasting. (1ra Edición).
26 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 61.
26
Los procesos Mixtos Integrados ARIMA(p,d,q), los procesos
SERIE.
LYt = Yt-1
En general: LkYt=Yt-k
27
promedio no cambia a través del tiempo. Este grupo incluye a los modelos
(p,d,q).
27 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 438.
28
Yt C 1Yt 1 2Yt 2 ...... pYt p t
Donde:
Yt : Variable dependiente.
y t ~ (0, 2 ) .
( L)Yt C t
( L) 1 1 L 2 L2 ... p Lp
29
Para que el proceso sea estacionario se requiere que las raíces de la
1 1 L 2 L2 ... p Lp 0
Yt 1Yt 1 t donde 1 1
Para que el proceso AR(1) definido, sea estacionario, la raíz del polinomio
definido por:
Yt 1Yt 1 2Yt 2 t
30
(1 1 L 2 L2 )Yt t
Para que el proceso anterior sea estacionario se requiere que las raíces de
1 1 L 2 L2 0
E (Yt ) 0
Condiciones de estacionariedad
1 1 L 2 L2 ... p Lp 0
31
La estacionalidad de la serie Yt requiere, entre otras condiciones una media
que no varía; es decir que no debe existir una tendencia a lo largo del
tiempo.
( L) 1 1 L 2 L2 ... p Lp
cierto número de valores anteriores reales de Yt, mientras que los modelos
Modelo MA(q).
28 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 438.
29 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A.
32
Donde
Yt : Variable dependiente.
Yt ( L) t
EYt ( L) E ( t ) 0
Yt t 1 t 1 2 t 2 ... q t q
Donde
Yt : Variable dependiente.
33
EYt
Así pues, en los modelos de medias móviles, la media del proceso coincide
Para que un proceso MA(q) sea invertible se requiere que las raíces de la
1 1L 2 L2 ... q Lq 0
tiene:
E (Yt ) E t 1 L t 2 L2 t ... q Lq t
E ( ) E q ( L) t q ( L) E ( t )
V (Yt ) E(Yt 2 ) E t 1 t 1 2 t 2 ... q t2q
2
Modelo MA(1).
Yt t 1 t 1
34
Yt t 1 t 1
Yt (1 1 L) t
Para que la ecuación sea estable se requiere que la raíz del polinomio
1 1 L 0
1
L 1
1
Modelo MA(2).
Yt t 1 t 1 2 t 2 (1 1 L 2 L2 ) t
Para que un proceso MA(2) sea invertible se requiere que las raíces del
1 1 L 2 L2 0
35
Condiciones de estacionariedad e invertibilidad en los Procesos MA
raíces del polinomio de medias móviles caen fuera del círculo unidad, el
t Yt 1 t 1
t 1 Yt 1 1 t 2
t Yt 1 [ yt 1 1 t 2 ]
t Yt 1 yt 1 12 t 2
i 1
Alternativamente:
36
t Yt 1 Yt 1 12Yt 2 .... 1i Yt i .....
1 1
2 i
L 1 L2 ... 1 Li ..... Yt t
AR().
Yt t 1 t 1 (1 1 L) t
1
t Yt
1 - 1 L
MÓVILES (ARMA).
siguiente forma:
37
Utilizando los operadores polinomiales de retardo, el modelo se expresará
( L)Yt ( L) t
( L) 1 1L ... p Lp 0
forma:
( L)
Yt ( L) t
( L) t
Por tanto los coeficientes del operador polinomial (L) , que tiene
( L) ( L) ( L)
(1 1 L)(1 1 L 2 L2 ...) (1 1 L)
38
Para que un modelo ARMA (p,q) sea invertible, se requiere que las
( L) 1 1L ... q Lq 0
Modelo ARMA(1,1)
Yi 1Yt 1 t 1 t 1
1.
E[ t Yt ] 2
39
Y0 1 (1Y0 1 2 ) 2 1 (1 1 ) 2
1 211 12 2
Y0
1 12
Y1 )
(1 11 )(11 )
k 1
Pk 1 211 12
P k 1
1 k 1
(p,d,q).
estacionaria.
40
dispositivos altamente refinados de ajuste de curvas que utilizan valores
tradicional.
30 HANKE John E. (1996). Pronósticos en los negocios. (5ta Edición). México: Editorial Prentice Hall
Hispanoamericana S.A. p. 431.
41
Donde:
Caminata aleatoria
determinada por:
Yt Yt 1 t
42
CASO GENERAL
Dada una serie Yt, que eventualmente corresponde a los logaritmos de los
proceso ARIMA(p,d,q).
la diferenciación.
1 L L
1 2
2
... p Lp Z t 1 1L 2 L2 .... q Lq t
p ( L) Z t q ( L) t
(Y 1) / 0
se define por: Yt t
Ln Yt 0
43
La transformación Box Cox requiere definir el parámetro de la
transformación.
(transformación logarítmica).
original.
igual o inferior al año. El periodo estacional se designa por “s”, así en datos
ARIMA no estacionales.
32 URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 153.
44
autocorrelación (valores que corresponden a los rezagos 4,8,12, … si los
datos son trimestrales y 12, 24, 36, … si los datos son mensuales). De este
modo una serie podría requerir diferencias de orden estacional si los valores
Donde:
P Ls 1 1Ls 2 L2 s ... P LPs
Q Ls 1 1Ls 2 L2 s ... Q LQs
Pr ~
yT k eT ( k )
confianza elegido.
45
DISTRIBUCIONES TEÓRICAS DE LOS COEFICIENTES DE
MÁS COMUNES.
46
Figura Nº 02: Coeficientes de Autocorrelación y de Autocorrelación Parcial de los
47
Figura Nº 03: Coeficientes de Autocorrelación y de Autocorrelación Parcial de un
48
2.2.18. MÉTODOLOGÍA DE BOX-JENKINS.
procesos iterativos33.
procede de inmediato con la etapa (i); caso contrario, la serie debe ser
Nº 04.
fijar el modelo.
33
URIEL JIMENEZ, Ezequiel. (1985). Análisis de Series Temporales. Modelos ARIMA. Madrid-España: Editorial
Paraninfo S.A. p. 431.
49
conocido como test de Dickey–Fuller (Test DF) o Dickey-Fuller Ampliado
Yt 1Yt 1 t
raíz unitaria en una serie que sigue un proceso AR(p), deberá aplicarse el
del modelo:
B
Yt a0 Yt 1 Bi Yt i 1 t
i 2
nula de que:
𝐻0 = 𝜌1 = 𝜌2 = 𝜌3 =…𝜌𝑀 = 0
50
𝐻1 = 𝜌1 = 𝜌2 = 𝜌3 =…𝜌𝑀 > 0
M
Q T k2
k 1
M
Q * T T 2 T k k2
1
k 1
Donde
51
IRAS (Infecciones respiratorias agudas).- Conjunto de infecciones del aparato
52
Ruido blanco.- Es un proceso puramente aleatorio en donde las variables son
entre observaciones.
en el futuro.
53
III. MATERIALES Y MÉTODOS.
I.1. LUGAR DE ESTUDIO.
con la provincia de San Román, por el Este, con la provincias de San Román y
Azángaro y Por el Oeste, con las provincias de Espinar y Canas de la Región Cuzco,
54
I.2. MATERIAL.
2000 - 2011.
I.3.1. POBLACIÓN.
I.3.2. MUESTRA.
Los datos registrados del número de casos de IRAS de la provincia de Lampa, son
Informática de la Dirección Regional de Salud - Puno, para los años 2000 - 2011.
55
I.5. MÉTODOS DE TRATAMIENTO DE DATOS.
estadísticos respectivos.
Box Jenkins, con los denominados modelos ARIMA. Los pasos a seguir en
2) Proceso de identificación.
3) Estimación de parámetros.
4) Proceso de verificación.
5) Procesos de predicción.
56
METODO DE BOX-JENKINS (Teoría de WIENER – KOLMOGOROV).
cuales son:
seleccionados.
predicciones de la variable.
04.
57
METODOLOGIA DEL ENFOQUE BOX-JENKINS
58
FASES DEL MÉTODO DE BOX-JENKINS.
práctica es suficiente tomar una diferencia (d=1), o dos diferencias (d=2) para obtener
número de veces que necesita de una diferencia antes de fijar el modelo. Para esto se
es:
Tu a / s (a0 )
Donde:
59
La regla de decisión a considerar será:
Es estadístico t u sigue una distribución t de Students que se tabuló por Dickey y Fuller.
2º Una vez obtenida una serie estacionaria con algún valor para la diferencia “d”, se
deberá de identificar la forma del modelo a utilizar encontrando los valores apropiados
un modelo alternativo.
Una vez seleccionado el modelo tentativo, habiendo identificado los valores apropiados
mínimos cuadrados no lineales que minimizan la suma de los cuadrados de los residuos.
La finalidad de esta fase consiste en analizar la adecuación entre el modelo y los datos,
blanco.
60
Una de las formas para detectar violaciones a los supuestos es a través del análisis de los
modelo (uso del estadístico de Box Pierce). Conviene señalar que es esencial que se
cumpla el requisito a), pues en caso contrario el modelo debe ser rechazado.
FASE 4: Predicción.
Una vez identificado el modelo adecuado que genera la serie temporal de interés,
PROCESO DE PREDICCION.
Cuya función eficiente de predicción sea z t m / t cumplen con los siguientes supuestos.
t , t 1 ,............., 1
El predictor optimo se constituye de una función lineal de todos los valores conocidos
de t .
zt m / t m* t m* 1 t 1 m* z t z ..........
~
61
Donde: m* : son los coeficientes a estimar, tal que el predictor óptimo tenga un Error
FUNCION DE AUTOCORRELACION.
La función de autocorrelación está conformada por las correlaciones internas entre los
( zt ˆ )( zt k ˆ )
N
cov( zt , zt k ) E ( zt ˆ )( zt k ˆ )
k t k 1
(0) (0) ( zt ˆ ) 2
N
t 1
Donde:
La matriz de Autocorrelaciones para una serie estacionaria de longitud N, esta dado por:
62
1 1 2 N-1
1 1 N-2
PN 1
N-1 N -2 N-3 1
Qk
por: kk
Pk
Donde:
estudiada.
N = Tamaño de la serie conformado por 12 meses x 25 años =300 meses (300 datos en
la serie original) menos el número de diferencias que se tomó hasta ese momento.
QUENOUILLE es la siguiente:
63
IV. RESULTADOS Y DISCUSIÓN.
RESULTADOS DE RECOPILACIÓN DE INFORMACIÓN
Para el análisis de datos, se ha utilizado información del número de casos de IRAS del
muestran los datos originales de los menores de 5 años con casos de IRAS de la
64
SERIE ORGINAL DE CASOS DE IRAS EN MENORES DE 5 AÑOS
1,000
DATOS ORIGINALES
800
600
400
200
0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Tiempo
del proceso ( ˆ 403.4 ), además la desviación estándar es s 170.3 , lo cual indica que
65
Función de autocorrelación estimada
ρ
k
1.0
DATOS ORIGINALES
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Retardos
Gráfico N° 02. Función de Autocorrelación Estimada para la serie original del número de casos
de IRAS en menores de 5 años - Lampa.
decrecimiento geométrico que sería lo más adecuado, se puede observar que la serie
También, podemos ver en la presente gráfica, que los valores más altos, los cuales
de algún orden.
forma significativa al nivel de confianza del 95,0%. Para poder obtener una serie con
66
En el gráfico N° 03 se muestra la Función de Autocorrelación Parcial para la serie
Lampa.
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Retardos
Gráfico N° 03. Función de Autocorrelación Parcial Estimada para la serie original del número
de casos de IRAS en menores de 5 años-Lampa
Como se puede observar, la gráfica presenta una serie con irregularidades, lo que
Haciendo un análisis en la serie original (gráfico Nº 01), se puede observar que tiene
alrededor de la media y las oscilaciones dentro de cada año van siendo cada vez más
Por tanto, para poder lograr que la serie del Número de casos de IRAS en menores de 5
67
0,5 ), para luego realizar una primera diferencia de los datos esto utilizando el
32
DATOS TRANSFORMADOS
28
24
20
16
12
8
00 01 02 03 04 05 06 07 08 09 10 11
Tiempo
caso.
68
Función de autocorrelación estimada (Transf. Box Cox)
ρ
k
1.0 DATOS TRANSFORMADOS
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Retardos
Gráfico N° 05. Función de Autocorrelación Estimada para la serie transformada del número de
casos de IRAS en menores de 5 años-Lampa.
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Retardos
Gráfico N° 06. Función de Autocorrelación Parcial Estimada para la serie transformada del
número de casos de IRAS en menores de 5 años-Lampa.
69
En el gráfico N° 06 se puede apreciar que los retardos 1, 3, 8, 9,10, 13 y 14 de los 36
-2
-4
-6
00 01 02 03 04 05 06 07 08 09 10 11
Tiempo
En el presente gráfico, se puede ver que los datos no presentan tendencia a través del
tiempo.
70
Función de autocorrelación estimada (Transf. Box Cox)
Primera Diferencia No Estacional
ρ
k
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35
Retardos
Se observa que existen autocorrelaciones muy altas en los retrasos 12, 24 y 36, con lo
que se confirma que existe una tendencia entre periodos estacionales sucesivos,
hubiera caído a cero en el retraso 24, se habría concluido que los datos de la primera
Nº 08), se emplea la diferencia de largo plazo (diferencias cuya longitud está separada
por 12 periodos). El gráfico Nº 09 muestra la serie para los datos después de la primera
71
Serie transformada para el número de casos de IRAS en menores de 5 años
Primera Diferencia No Estacional y Primera Diferencia Estacional
-2
-4
-6
-8
00 01 02 03 04 05 06 07 08 09 10 11
Tiempo
largo plazo (primera diferencia estacional). La totalidad de sus valores estimados para
72
Función de autocorrelación estimada (Transf. Box Cox)
Primera Diferencia No Estacional y Primera Diferencia Estacional
ρ
K
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30
Retardos
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30
Retardos
73
Según los gráficos 09, 10 y 11 se observa que la serie ya no presenta tendencia y es
estacionaria en media.
y varianza mediante las fases propuestas por Dolado en la aplicación del contraste
Vamos buscando que el test de A. Dickey-Fuller (ADF Test) nos dé un valor que supere
(en términos absolutos) al 99% (95% y 90%) el valor de tablas para descartar la
existencia de raíz unitaria u orden de integración (si ADF es mayor que valores críticos
En el test hay que incluir el número de retardo que nos lleve a un valor de Durbin
Watson cercano a 2. Cuando se tiene un valor Durbin Watson exigido en esa cifra y un
ADF test superior al valor de tablas al 99% podremos rechazar la hipótesis nula de
Nº 04 (4A).
74
El valor de A. Dickey-Fuller (-20.04914) es superior al de Mckinnon en términos
absolutos al 99% (95% y 90%) por lo que se podría descartar la existencia de raíz
unitaria. Aun así éste punto no se puede confirmar hasta encontrarnos con un modelo en
equivocación del 61.78% cuando rechazo la hipótesis nula de que el parámetro de ésta
estacionariedad.
típica del mismo estimado) es superior en valor absoluto a los valores tabulados por
75
unitaria. Es decir, decimos que la serie es ya ESTACIONARIA EN MEDIA Y VARIANZA
diferentes modelos alternativos a los cuales se les realizó pruebas siguiendo el proceso
de la metodología Box Jenkins, seleccionando luego dos modelos buenos de los cuales
76
En el ANEXO Nº 05: (5A) se muestra los valores estimados de la serie para el
modelo 1, con convergencia rápida, es decir con 6 iteraciones, y los parámetros son
significativos.
(obtenidos del ANEXO Nº 05A y 05B), donde se comparan los dos modelos
mejor modelo.
El modelo que se ajusta mejor, por tener menores valores en los criterios de Akaike
12 Yt 1 0.560460 L12 1 0.5818061 L t
77
Donde:
L: Es el operador de retardos.
Yt : z t : Es la variable transformada.
Para obtener el pronóstico del nivel medio del Lago, se deberá invertir la
que los residuos sigan un proceso ruido blanco, en base al cumplimiento de ciertas
condiciones.
En base a los resultados del mejor modelo que se obtuvo en el paquete estadístico
78
Log likelihood -261.4598 Hannan-Quinn criter. 4.040125
Durbin-Watson stat 1.892661
1
calcula directamente ˆi (Inverted MA roots), si algunos de estos fueran
Li
95%, puesto que los parámetros obtenidos son mayores que el valor 2 del t-
estadístico.
Si |t|<2 indica que el parámetro es cero y puede ser eliminado del modelo.
79
Bondad de Ajuste
Este análisis permite estudiar los coeficientes del modelo seleccionado si son
Para ver si hubo cambio estructural se realizó el contraste Chow con el Software
estadístico Eviews.
WARNING: the MA backcasts differ for the original and test equation.
Under the null hypothesis, the impact of this difference vanishes
asymptotically.
más favorable al ruido blanco cuanto mayor sea el valor de la probabilidad “p”.
80
Si se utiliza el nivel de confianza habitual del 95%, entonces los residuos son
ruido blanco siempre que el p-valor sea superior a 0.05. siendo el estadístico Q,
izquierda de la Grafica N° 12
iguales a cero para distintos valores de m, en concreto m=36. Los residuos son
ruido blanco.
encuentran dentro de los intervalos. Por consiguiente los residuos son ruido
blanco.
81
GRÁFICO Nº 12: Correlograma para la serie de residuos del mejor modelo Estimado
82
3
0
3 -1
2 -2
-3
1
-1
-2
01 02 03 04 05 06 07 08 09 10 11
que dicho modelo es adecuado para modelizar los datos del número de casos de
16
Forecast: IRASF
14 Actual: IRAS
Forecast sample: 2001M01 2011M12
12 Adjusted sample: 2002M02 2011M12
Included observations: 119
10 Root Mean Squared Error 0.729738
Mean Absolute Error 0.593561
8 Mean Abs. Percent Error 5.859790
Theil Inequality Coefficient 0.034780
6 Bias Proportion 0.000735
Variance Proportion 0.005851
4 Covariance Proportion 0.993415
2
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
IRASF ± 2 S.E.
GRÁFICO Nº 14: Ajuste del pronóstico a partir del modelo estimado del número de casos de
IRAS en menores de 5 años-Lampa
83
Como podemos ver en el gráfico Nº 14, el ajuste es bueno, la serie real se ubica
10
7
M12 M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12
2011 2012
PREDICCION ± 2 S.E.
GRÁFICO Nº 15: Ajuste del pronóstico del número de casos de IRAS para el año 2012
en menores de 5 años-Lampa.
16
14
12
10
4
01 02 03 04 05 06 07 08 09 10 11 12
IRASF IRAS
GRÁFICO Nº 16: Serie transformada del número de casos de IRAS y la serie
Predicción
84
predicción de la serie para los datos transformados; pero como nuestro objetivo
Las predicciones que se presentan son para los doce siguientes meses de la serie
de tiempo.
CUADRO Nº 05: Resultados de las predicciones para el año 2012 según meses.
Modelo SARIMA(0,1,1)*(0,1,1)12.
85
V. CONCLUSIONES.
1. Se determino que los modelos univariantes integrados de Box-Jenkins
periodo 2000-2011. Por tal el modelo univariante integrado que mejor se ajusta
12 Yt 1 0.560460 L12 1 0.581806 L t
que se observo que la serie presentaba tendencia, aun así, se siguió observando
86
4. Las predicciones del modelo SARIMA(0,1,1)* (0,1,1)12, son más útiles y
MESES
AÑO
ENE FEB MAR ABR MAY JUN JUL AGO SEPT OCT NOV DIC
2012 385 358 451 346 403 464 600 603 614 519 515 458
87
VI. RECOMENDACIONES
1. En las fases de identificación, estimación, validación y pronóstico no sólo se
adecuados.
88
VII. BIBLIOGRAFÍA CONSULTADA.
Referencias bibliográficas
Edición).
Universitaria S.A.
89
SPIEGEL R, Murray, STEPHENS J, Larry. Estadística. (3ra Edición). México:
Editorial Mexicana.
Tesis
Perú.
Tiempo para los pacientes Hospitalizados por Neumonía Carlos Monje Medrano
Sitios Web
http://ciberconta.unizar.es/LECCION/seriest/100.HTM.
90
GUERRA José, SÁNCHEZ Gustavo y REYES Belkis. “Modelos de series de
Banco
http://www.bcv.org.ve/Upload/Publicaciones/doc13.pdf
http://www.monografias.com/trabajos30/series-de-tiempo/series-de-
tiempo.shtml
http://books.google.com.pe/books?id=aT21YbVLghwC&pg=PA263&lpg=PA26
3&dq=modelo+de+box+jenkins&source=web&ots=TmyPZj8A27&sig=bjWND
s5BmJihMxc9EAOPLwjOTM8&hl=es#PPA263,M1
Web: http://www.monografias.com/trabajos/elabproyec/elabproyec.shtml
91
ANEXOS.
ANEXO Nº 01: Autocorrelaciones estimadas para la serie original del número de casos
92
7 0.0154791 0.0833333 -0.163331 0.163331
8 0.154963 0.0833333 -0.163331 0.163331
9 0.323527 0.0833333 -0.163331 0.163331
10 0.312178 0.0833333 -0.163331 0.163331
11 0.268974 0.0833333 -0.163331 0.163331
12 0.193566 0.0833333 -0.163331 0.163331
13 -0.273244 0.0833333 -0.163331 0.163331
14 -0.171193 0.0833333 -0.163331 0.163331
15 -0.0735293 0.0833333 -0.163331 0.163331
16 -0.00580358 0.0833333 -0.163331 0.163331
17 -0.14861 0.0833333 -0.163331 0.163331
18 -0.113731 0.0833333 -0.163331 0.163331
19 -0.0576916 0.0833333 -0.163331 0.163331
20 -0.0117872 0.0833333 -0.163331 0.163331
21 -0.0533481 0.0833333 -0.163331 0.163331
22 0.138023 0.0833333 -0.163331 0.163331
23 0.00221701 0.0833333 -0.163331 0.163331
24 0.0139776 0.0833333 -0.163331 0.163331
25 -0.0876076 0.0833333 -0.163331 0.163331
26 -0.0533854 0.0833333 -0.163331 0.163331
27 0.0806181 0.0833333 -0.163331 0.163331
28 0.00804314 0.0833333 -0.163331 0.163331
29 0.00587683 0.0833333 -0.163331 0.163331
30 -0.0154423 0.0833333 -0.163331 0.163331
31 0.0373537 0.0833333 -0.163331 0.163331
32 0.000955791 0.0833333 -0.163331 0.163331
33 -0.0313015 0.0833333 -0.163331 0.163331
34 0.0466691 0.0833333 -0.163331 0.163331
35 -0.0635999 0.0833333 -0.163331 0.163331
36 0.00632224 0.0833333 -0.163331 0.163331
Lampa.
93
18 0.0901127 0.249869 -0.489735 0.489735
19 0.0936061 0.250094 -0.490177 0.490177
20 0.161205 0.250338 -0.490654 0.490654
21 0.266019 0.251057 -0.492065 0.492065
22 0.440434 0.253007 -0.495886 0.495886
23 0.521372 0.258277 -0.506214 0.506214
24 0.550297 0.265485 -0.520342 0.520342
25 0.426542 0.273291 -0.535642 0.535642
26 0.274312 0.277876 -0.544628 0.544628
27 0.122322 0.27975 -0.548302 0.548302
28 0.0404987 0.280122 -0.549029 0.549029
29 -0.0109382 0.280162 -0.549109 0.549109
30 -0.0334771 0.280165 -0.549115 0.549115
31 -0.0155694 0.280193 -0.549169 0.549169
32 0.0509151 0.280199 -0.549181 0.549181
33 0.154067 0.280263 -0.549307 0.549307
34 0.303064 0.280851 -0.550458 0.550458
35 0.356816 0.283113 -0.554892 0.554892
36 0.363131 0.286219 -0.560979 0.560979
94
3A: Valores estimados de la Función de Autocorrelación Estimada.
95
13 -0.082765 0.0873704 -0.171243 0.171243
14 0.0225183 0.0873704 -0.171243 0.171243
15 -0.12515 0.0873704 -0.171243 0.171243
16 -0.0425136 0.0873704 -0.171243 0.171243
17 -0.120631 0.0873704 -0.171243 0.171243
18 -0.0556432 0.0873704 -0.171243 0.171243
19 -0.0543192 0.0873704 -0.171243 0.171243
20 -0.11559 0.0873704 -0.171243 0.171243
21 -0.0261803 0.0873704 -0.171243 0.171243
22 -0.118353 0.0873704 -0.171243 0.171243
23 0.0536476 0.0873704 -0.171243 0.171243
24 -0.0804196 0.0873704 -0.171243 0.171243
25 -0.0807381 0.0873704 -0.171243 0.171243
26 -0.12388 0.0873704 -0.171243 0.171243
27 -0.147992 0.0873704 -0.171243 0.171243
28 -0.0582588 0.0873704 -0.171243 0.171243
29 0.0754811 0.0873704 -0.171243 0.171243
30 0.0746512 0.0873704 -0.171243 0.171243
31 0.0379069 0.0873704 -0.171243 0.171243
32 0.00216173 0.0873704 -0.171243 0.171243
33 -0.0394137 0.0873704 -0.171243 0.171243
34 -0.0888213 0.0873704 -0.171243 0.171243
35 0.012971 0.0873704 -0.171243 0.171243
36 -0.113115 0.0873704 -0.171243 0.171243
t-Statistic Prob.*
96
Log likelihood -276.6195 Hannan-Quinn criter. 4.328727
F-statistic 200.9842 Durbin-Watson stat 2.162598
Prob(F-statistic) 0.000000
t-Statistic Prob.*
t-Statistic Prob.*
97
Sample (adjusted): 2001M03 2011M12
Included observations: 130 after adjustments
98
AR(1) -0.442428 0.088460 -5.001467 0.0000
MA(12) -0.567198 0.081651 -6.946649 0.0000
99