Beruflich Dokumente
Kultur Dokumente
Introduccin
La mayora de los procedimientos estadsticos est diseado para ser
aplicados a datos que se originan en una serie de experimentos aleatorios
independientes. Los datos resultantes x1,......., x n son representativos de una cierta
poblacin y el anlisis estadstico realiza inferencias sobre ciertos aspectos de la
poblacin a partir de la muestra x1,......., x n . Con este tipo de datos el orden en
que aparecen los datos es irrelevante. Sin embargo en muchos casos
necesitamos de los pronsticos o predicciones como herramienta esencial en
cualquier proceso de toma de decisiones. Pronosticar supone proyectar la
experiencia pasada hacia el futuro, desde la suposicin que las condiciones que
generaron los datos histricos no sern diferentes de las condiciones futuras. Se
debe tener presente que, la calidad de las predicciones que podemos efectuar
est estrechamente relacionada con la informacin que se puede extraer y utilizar
de los datos que se tengan.
El anlisis de series temporales es un mtodo cuantitativo ampliamente
usado como ayuda a tener una visin con incertidumbre acerca del futuro.
Una serie de tiempo o serie cronolgica es una sucesin de observaciones
y t (t= 1, 2,...,T) realizadas secuencialmente en el tiempo, por ejemplo cada mes.
En este caso el orden en que aparecen los datos es de suma importancia y los
procedimientos clsicos no son directamente aplicables. Las series de tiempo son
comunes en muchos campos. Algunos ejemplos son:
Economa
Meteorologa
Medicina
Fsica
Qumica
(3)
Yt
Tt
Ct
Et
It
.
El modelo que ms se usa para la descomposicin de las series de tiempo es el
modelo multiplicativo, en el que Yt es el producto de cuatro elementos que actan
en combinacin para producir la serie. A fin de ilustrar la descomposicin de una
serie, consideremos el siguiente ejemplo:
Ejemplo 1.1.1: Los datos que se muestran a continuacin corresponden al
nmero de nuevas unidades habitacionales comenzadas en el pas desde el
tercer trimestre de 1984 al segundo trimestre de 1992.
Ao
1984
1985
1986
1987
1988
1989
1990
1991
1992
II
283
274
218
298
336
264
389
510
454
392
382
452
468
399
604
661
III
398
392
290
382
423
387
408
579
IV
352
345
210
340
372
309
396
513
600
500
400
300
200
100
0
III IV
1984
II
1985
III IV
II
1986
III IV
II
1987
III IV
II
1988
III IV
II
1989
III IV
1990
II
III IV
1991
II
III IV
II
1992
1986
1987
1988
1989
1990
1991
1992
Trim
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
III
IV
I
II
Unidades
398
352
283
454
392
345
274
392
290
210
218
382
382
340
298
452
423
372
336
468
387
309
264
399
408
396
389
604
579
513
510
661
Yhat
291.65
298.00
304.34
310.69
317.03
323.38
329.72
336.07
342.41
348.76
355.10
361.45
367.79
374.14
380.48
386.83
393.17
399.52
405.86
412.21
418.55
424.90
431.24
437.59
443.93
450.28
456.62
462.97
469.31
475.66
482.00
488.35
Indice
Estacional
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
107.61
91.09
80.14
121.16
Tendencia
estacional
313.84
271.45
243.9
376.43
341.16
294.57
264.24
407.18
368.47
317.69
284.58
437.93
395.78
340.8
304.92
468.68
423.09
363.92
325.26
499.43
450.4
387.04
345.6
530.18
477.71
410.16
365.94
560.93
505.02
433.28
386.27
591.68
% Irregular
104.43
95.03
102.93
97.75
104.66
98.11
103.64
97.93
89.57
99.95
100.52
102.13
101.8
99.74
98.36
100.43
100.38
103.57
99.36
99.34
98.91
99
95.24
99.62
100.48
102.7
98.3
100.94
97.3
109.37
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
Autos
6.577
5.855
6.939
7.557
8.065
9.314
9.009
8.357
9.404
9.447
Ao
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
Autos
8.388
9.831
10.409
11.351
8.701
8.168
9.752
10.826
10.946
10.357
Ao
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1976
Ao
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1972
Ao
1990
1991
Autos
9.103
8.234
Grficamente
12
11
10
9
8
7
6
1990
1988
1986
1984
1982
1980
1978
1974
1970
1968
1966
1964
1962
1960
Lineal.
Polinmico.
Exponencial
Modelo autorregresivo
Curva de Gompertz.
Observe adems que la serie Zt = Yt Yt-1 dada por (1.2.2) carece de tendencia,
por lo que este procedimiento de generar la serie Zt es un procedimiento habitual
para eliminar la tendencia.
El procedimiento que se usa para encontrar la recta que mejor se ajusta a los
datos observados de la serie de tiempo es el de mnimos cuadrados, el cual
corresponde al mismo procedimiento usado para minimizar SCE en el anlisis de
regresin.
El periodo puede venir expresado en das, semanas, meses, trimestres o
aos por lo que, lo ms practico para trabajar con el periodo en los modelos es
codificarlo de manera correlativa desde 1 a T.
Para el ejemplo 1.1.2, al ao 1960 le corresponde el valor 1, a 1961 el valor 2 y as
sucesivamente. Luego, para este ejemplo, ajustando un modelo lineal simple
usando excel se tiene:
Resumen
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0.52237069
Coeficiente de determinacin R^2
0.27287113
R^2 ajustado
0.2486335
Error tpico
1.18495869
Observaciones
32
ANLISIS DE VARIANZA
Promedio de
los
Suma de
cuadrados
cuadrados
1 15.8078891 15.8078891
30 42.1238127 1.40412709
31 57.9317019
Grados de
libertad
Regresin
Residuos
Total
Intercepcin
Periodo
F
11.2581612
Valor crtico
de F
0.00216301
Superior
95%
8.77796813
0.12245621
Y = 7.901911 + 0.076123(33)
(1.2.3)
Grados de
libertad
Regresin
Residuos
Total
Intercepcin
t
t2
F
13.9594453
Valor crtico
de F
5.6696E-05
De la expresin (1.2.2) vimos que si a una serie de tiempo con tendencia lineal se
le aplica la primera diferencia, desaparece la tendencia.
Siguiendo este procedimiento con una serie de tiempo que presente tendencia
polinmica de segundo grado, para eliminar la tendencia hay que realizar dos
operaciones consecutivas de obtencin de diferencias.
Sea Yt = 0 + 1t + 2 t 2 + t , entonces,
Z t = Yt Yt 1 = 1 2 + 2 2 t + t t 1
la cual es una expresin lineal en t. Obteniendo las segundas diferencias se tiene
que,
Z t Z t 1 = 2 2 + t 2 t 1 + t 2
expresin que ya no tiene tendencia. En general, para eliminar la tendencia
polinmica de grado p, se toman diferencias sucesivas de la serie hasta p veces.
1.2.3 Estimacin de tendencia exponencial.
Yt = ae rt e t
t=1, 2,...,T
(1.2.4)
el problema estadstico consiste en estimar a y r, a partir del conjunto de
observaciones Yt, t=1, 2, ...,T
r>0
r<0
(1.2.5)
10
expresin lineal por lo que, para estimar r se puede usar el mtodo de mnimos
cuadrados, suponiendo para t que satisface los supuestos del modelo de
regresin.
Para eliminar tendencias exponenciales basta con tomar diferencias usando la
expresin (1.2.5). As
lnYt lnYt-1 = r + ut
Donde
u t = t t 1
1.2.4 Modelo Autorregresivo
1 >0
(1.2.6)
1 = 1,5
1 = 1
1 = 0,6
1988
1425
11
2000
1800
1600
1400
1200
1000
800
600
400
200
0
1978
1980
1982
1984
1986
1988
1990
ANLISIS DE VARIANZA
Grados de
libertad
Regresin
Residuos
Total
Intercepcin
Variable Yt-1
Promedio de
los
Suma de
cuadrados
cuadrados
1 1492454.53 1492454.53
7
40472.355
5781.765
8 1532926.89
F
258.131303
Valor crtico
de F
8.7937E-07
12
e rt
(1.2.7)
T*
Y
(100)
Y
(7)
13
YY
C rel = (
)100
(8)
Y
Aplicando este mtodo a nuestros datos de registros de automviles nuevos en
los Estados Unidos, obtenemos los siguientes resultados:.
Ao
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
Registro
Tiempo
Pronstico
6,577
5,855
6,939
7,557
8,065
9,314
9,009
8,357
9,404
9,447
8,388
9,831
10,409
11,351
8,701
8,168
9,752
10,826
10,946
10,357
8,761
8,444
7,754
8,924
10,118
10,889
11,140
10,183
10,398
9,853
9,103
8,234
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
7,978
8,054
8,130
8,206
8,283
8,359
8,435
8,511
8,587
8,663
8,739
8,815
8,892
8,968
9,044
9,120
9,196
9,272
9,348
9,424
9,500
9,577
9,653
9,729
9,805
9,881
9,957
10,033
10,109
10,186
10,262
10,338
Indice
Cclico
Residuo
Cclico Relativo
82,439
72,697
85,351
92,091
97,368
111,425
106,805
98,191
109,514
109,050
95,984
111,526
117,060
126,572
96,207
89,561
106,046
116,760
117,095
109,900
92,221
88,170
80,327
91,726
103,192
110,201
111,881
101,495
102,859
96,731
88,706
79,648
-17,561
-27,303
-14,649
-7,909
-2,632
11,425
6,805
-1,809
9,514
9,050
-4,016
11,526
17,060
26,572
-3,793
-10,439
6,046
16,760
17,095
9,900
-7,779
-11,830
-19,673
-8,274
3,192
10,201
11,881
1,495
2,859
-3,269
-11,294
-20,352
14
130
120
110
100
90
80
1990
1988
1986
1984
1982
1980
1978
1976
1974
1972
1970
1968
1966
1964
1962
60
1960
70
Figura 1.31: Grfico Componente cclica para los registros de automviles nuevos.
En este grfico se muestra a la tendencia como lnea base, representada
por el 100%. La importancia de este tipo de grficos se debe a que permite la
comparacin de la variable de inters con el patrn cclico de otras variables y/o
indicadores de negocio.
Del grfico vemos que la serie registr su valor ms bajo en 1961
(72,697%), despus hubo un crecimiento sostenido hasta alcanzar un valor de un
111,4% por sobre el valor esperado. Los buenos tiempos prevalecieron entre 1966
y 1979 con excepcin los aos 1967, 1970, 1974 y 1975. A partir de 1980 sigui
una disminucin en el registro durante cuatro aos.
1.4) Estudio de la Componente Estacional
15
16
ndice estacional
E=
donde
TECI
(100)
TCI
(9)
E = ndice estacional
TECI = valor real de Y
TCI = promedio centrado de 12 meses
923
Julio
949
Agosto
926
Septiembre
1105
10899
(1)
(2) 21930
(3) 913.75
103.86 (4)
22094
920.58
100.59
22047
918.63
120.29
21938
914.08
106.45
21914
913.08
90.68
22009
917.04
92.58
22083
920.13
99.23
22036
918.17
89.53
11031
11063
10984
Octubre
973
10954
Noviembre
828
10960
Diciembre
849
11049
1986
Enero
913
11034
Febrero
822
11002
17
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
Marzo
848
22048
918.67
92.31
22067
919.46
98.54
21933
913.88
100.45
21877
911.54
111.02
11046
Abril
906
11021
Mayo
918
10912
Junio
1012
10965
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
934
894
1149
948
719
902
El paso siguiente es determinar un ndice estacional para cada mes. Como este
ejemplo contena pocos datos no determinaremos el ndice estacional. Para lograr
una mayor comprensin de este mtodo, veamos el siguiente ejemplo.
Ejemplo 1.4.2:Los datos que se muestran a continuacin, representan el nmero
de husped registrados en cada trimestre durante los ltimos cinco
aos:
TRIMESTRE
Ao
1988
1989
1990
1991
1992
I
1.861
1.921
1.834
1.837
2.073
II
2.203
2.343
2.154
2.025
2.414
III
2.415
2.514
2.098
2.304
2.339
IV
1.908
1.986
1.799
1.965
1.967
Trimestre
Nmero
Husped
1988
I
II
1.861
2.203
III
2.415
Total Mvil
4 trimestres
Total Mvil
de 2 aos
Promedio
Mvil
centrado 4
trimestres
ndice
Estacional
8.387
16.834
2.104,250
114,8
17.034
2.129,250
89,6
8.447
IV
1.908
18
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
8.587
1989
1.921
17.273
2.159,125
89,0
17.450
2.181,250
107,4
17.441
2.180,125
115,3
17.165
2.145,625
92,6
16.560
2.070,000
88,6
15.957
1.994,625
108,0
15.773
1.971,625
106,4
15.647
1.955,875
92,0
15.724
1.965,500
93,5
16.096
2.012,000
100,6
16.498
2.062,250
111,7
17.123
2.140,375
91,8
17.547
2.193,375
94,5
17.584
2.198,000
109,8
8.686
II
2.343
8.764
III
2.514
8.677
IV
1.986
8.488
1990
1.834
II
2.154
8.072
7.885
III
2.098
7.888
IV
1.799
7.759
1991
1.837
7.965
II
2.025
III
2.304
8.131
8.367
IV
1.965
8.756
1992
2.073
8.791
II
2.414
8.793
III
IV
2.339
1.967
Una vez obtenidos los ndices estacionales, estos se organizan por trimestres
segn se indica ms abajo
Tabla 1.4.2.2: Organizacin de los ndices estacionales obtenidos en tabla 1.4.2.1
TRIMESTRE
Ao
1988
1989
1990
1991
1992
II
89,0
88,6
93,5
94,5
107,4
108,0
100,6
109,8
III
114,8
115,3
106,4
111,7
IV
89,6
92,6
92,0
91,8
Observar que la tabla 1.4.2.2 muestra cuatro ndices estacionales para cada
trimestre. Para el trimestre I los valores son 89,0, 88,6, 93,5 y 94,5.
19
II
89.0
88.6
93.5
94.5
91.4
91.25
3.03
3.32
107.4
108.0
100.6
109.8
106.45
107.7
4.03
3.79
III
114.8
115.3
106.4
111.7
IV
89.6
92.6
92.0
91.8
112.05
113.25
4.09
3.65
91.5
91.9
1.31
1.43
91,4
106,45
112.05
91,5
X
X
X
X
Constante de
Ajuste
0,99651
0,99651
0,99651
0,99651
Total
Indice
Temporal
91.08
106.08
111.66
91,18
400,0
1989
1990
1991
1992
Nmero
Trimestre Husped
I
1,861
II
2,203
III
2,415
IV
1,908
I
1,921
II
2,343
III
2,514
IV
1,986
I
1,834
II
2,154
III
2,098
IV
1,799
I
1,837
II
2,025
III
2,304
IV
1,965
I
2,073
II
2,414
III
2,339
IV
1,967
Indice Temp.
100
0.9108
1.0608
1.1166
0.9118
0.9108
1.0608
1.1166
0.9118
0.9108
1.0608
1.1166
0.9118
0.9108
1.0608
1.1166
0.9118
0.9108
1.0608
1.1166
0.9118
Ocupacin
Desestacionalizada
2043
2077
2163
2093
2109
2209
2251
2178
2014
2031
1879
1973
2017
1909
2063
2155
2276
2276
2095
2157
21
2,700
2,500
2,300
2,100
1,900
1,700
1,500
I
II
III IV
II
III IV
II
Serie1
III IV
II
III IV
II
III IV
Serie2
La lnea indicada como serie 1 en esta figura representa los valores observados,
en cambio la lnea punteada indicada como serie 2, representa los valores
obtenidos por el mtodo razn de promedios mvil para cada trimestre.
La figura 1.5.1, muestra cmo el promedio mvil ha suavizado las cimas y
valles de la serie de tiempo original.
22
2700
2500
2300
2100
1900
1700
1500
I
II
III IV
II
III IV
II
III IV
Serie1
II
III IV
II
III IV
Serie2
La lnea indicada como serie 1 en esta figura representa los valores observados,
en cambio la lnea punteada indicada como serie 2, representa los valores de la
serie ya desestacionalizados.
Procedamos ahora a estimar la lnea de tendencia desestacionalizada, para
ello aplicamos el mtodo de mnimos cuadrados. Recordar codificar la variable
tiempo, en este caso se codific de 1 a 20
El modelo a ajustar es:
= 0 + 1X
Y
donde
representa los valores ajustados de la serie desestacionalizada
Y
0 y 1 son los parmetros estimados del modelo.
X es el periodo
23
Grados de
libertad
Regresin
Residuos
Total
Intercepcin
X
F
0.14648573
Valor crtico
de F
0.7063986
Y = 2080.5263 + 1.7022 X
A partir de esta lnea de tendencia podemos hacer proyecciones hacia el futuro,
por ejemplo, realicemos un pronstico para el cuarto trimestre de 1993, el cual
corresponde a un tiempo de 24 de acuerdo a la variable codificada, as
Y = 2080.5263 + 1.7022( 24)
=2.121 personas
Conocida esta prediccin debemos tomar en consideracin el efecto de las
estaciones, para ello debemos multiplicar
la ocupacin
promedio
desestacionalizada predicha 2.121 por el ndice temporal correspondiente al
cuarto trimestre, expresado como fraccin de 100, para obtener de este modo una
estimacin estacionalizada, as
2.121 x 0.9118=1.934 personas.
Veamos ahora un ejemplo completo que nos permitir estudiar todas las
componentes.
Ejemplo: Suponga que deseamos predecir las ventas de una compaa que se
especializa en la produccin de equipos para recreacin.
24
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
Tabla 1.5.2: Ventas trimestrales de equipos para recreacin entre 1988 y 1992.
Ao
1988
1989
1990
1991
1992
I
16
15
17
17
18
Como los datos de la tabla 1.5.2 estn por trimestres, como primer paso
debemos desestacionalizar la serie temporal. Primero calculamos los promedios
mviles por el mtodo razn de promedio mvil, para luego obtener el ndice
estacional., estos se muestran en la tabla siguiente:
Tabla 1.5.3: Procedimiento para la determinacin del ndice estacional:
Ao
1988
Trimestre
Ventas
I
II
16
21
III
Total Mvil
4 trimestres
Total Mvil
de 8 trim.
Promedio
Mvil (1)
ndice
Estacional
64
127
15.875
56.7
125
15.625
115.2
125
15.625
96.0
126
15.750
127.0
128
16.000
62.5
134
16.750
107.5
141
17.625
96.5
148
18.500
129.7
152
19.000
68.4
153
19.125
115.0
152
19.000
89.5
149
18.625
134.2
63
IV
18
62
1989
15
63
II
20
III
10
63
65
IV
18
17
69
1990
72
II
24
III
13
76
76
IV
22
17
77
1991
75
II
25
74
25
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
III
11
149
18.625
59.1
151
18.875
111.3
155
19.375
92.9
162
20.250
128.4
75
IV
21
76
1992
18
II
26
79
83
III
IV
14
25
II
96
96.5
89.5
92.9
93.725
94.45
3.236
3.452
127
129.7
134.2
128.4
129.825
129.05
3.118
2.402
III
56.7
62.5
68.4
59.1
IV
115.2
107.5
115
111.3
61.675
60.8
5.076
8.230
112.25
113.15
3.639
3.242
Media
Modificada
93,725
129,825
61.675
112.25
X
X
X
X
Constante de
Ajuste
1,006352
1,006352
1,006352
1,006352
Total
Indice
Temporal
94,32
130,65
62,07
112,96
400
26
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
1989
1990
1991
1992
Indice Temp.
100
0.9432
1.3065
0.6207
1.1296
0.9432
1.3065
0.6207
1.1296
0.9432
1.3065
0.6207
1.1296
0.9432
1.3065
0.6207
1.1296
0.9432
1.3065
0.6207
1.1296
Trimestre Ventas
I
16
II
21
III
9
IV
18
I
15
II
20
III
10
IV
18
I
17
II
24
III
13
IV
22
I
17
II
25
III
11
IV
21
I
18
II
26
III
14
IV
25
Ventas
Desestacionalizada
16.96
16.07
14.50
15.93
15.90
15.31
16.11
15.93
18.02
18.37
20.94
19.48
18.02
19.14
17.72
18.59
19.08
19.90
22.56
22.13
Grados de
libertad
Regresin
Residuos
Total
Intercepcin
X
F
40.260856
Valor crtico
de F
5.6017E-06
27
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
28
Apuntes preparados por el profesor Sr. Rosamel Sez Espinoza con fines de Docencia
30
25
20
15
10
5
0
I
1988
III
I
1989
III
I
1990
III
Ventas
I
1991
III
I
1992
III
I
1993
III
Estimacin
Para finalizar con esta primera parte, se dejar el siguiente ejercicio para su
anlisis.
Ejercicio: Los datos que a continuacin se muestran corresponden a registros
mensuales de automviles nuevos
ene
feb
mar
abr
may
jun
jul
ago
sep
oct
nov
dic
1985
1986
1987
1988
1989
1990
1991
781
790
927
936
912
923
949
926
1105
973
828
849
913
822
848
906
918
1012
934
894
1149
948
719
902
800
671
829
895
830
963
899
903
955
819
718
901
774
810
919
852
874
981
883
901
937
807
764
896
733
722
833
843
885
950
830
880
956
800
666
694
619
657
773
751
819
858
779
777
825
787
683
683
599
590
669
675
744
792
755
675
737
692
610
628
29