Sie sind auf Seite 1von 17

PROYECTO FINAL ESTADISTICA III

ING. MANUEL CAMPUZANO

OSCAR OSPINO AYALA KEVIN BRUZON GRANADOS ANDREA IGLESIAS PARDO

UNIVERSIDAD DEL MAGDALENA FACULTAD DE INGENIERIA INGENIERIA INDUSTRIAL SANTA MARTA 2013

Contenido
INTRODUCCIN ................................................................................................................... 3 OBJETIVOS ............................................................................................................................ 4 GENERALES ...................................................................................................................... 4 ESPECFICOS.................................................................................................................... 4 REVISIN BIBLIOGRFICA ................................................................................................ 5 METODOLOGA BOX JENKINS ............................................................................. 5 Identificacin: .............................................................................................................. 6 Estimacin de Parmetros ........................................................................................ 6 Verificacin de el modelo .......................................................................................... 6 Uso del modelo ........................................................................................................... 7 MODELOS ESTADSTICOS .................................................................................... 7 Modelo de Auto regresin (AR)................................................................................ 7

Condiciones de estacionariedad ....................................................................................... 8 Condiciones de invertibilidad ............................................................................................. 8 Modelo de medias mviles MA(q) .................................................................................... 9 Condicin de estacionariedad. ......................................................................................... 9 Condicin de invertibilidad. ............................................................................................... 9 Modelo autoregresivo integrado de media mvil (ARIMA) ................................... 10 Algunas Propiedades de un modelo ARIMA ptimo .................................................. 11 Parsimonia (Parquedad) ..................................................................................... 11 Estacionariedad .................................................................................................... 11 Buenos coeficientes estimados.............................................................................. 12 Los residuos son ruido blanco................................................................................ 12 Debe ajustarse bien a los datos............................................................................. 12 Debe dar buenas predicciones .............................................................................. 13

ANALISIS CRTICO ............................................................................................................. 13 CONCLUSION .................................................................................................................. 15

INTRODUCCIN Desde sus principios se ha visto que el hombre, y su mentalidad competitiva a buscado siembre sobresalir ante las personas que lo rodean; de aqu nace su curiosidad por anticiparse a los eventos que estn por suceder, y as poder tomar decisiones eficientes. Con el pasar de los aos los conocimientos de la humanidad fueron creciendo y una parte de ellos se fue enfocando este inters en particular y se fueron mesclando con otras ramas del conocimiento como la probabilidad, hasta llegar a lo que hoy conocemos como modelos de series de tiempos. Las series de tiempo se han convertido en una herramienta fundamental para el desarrollo empresarial, eso se puede ver reflejado y ejemplificado en las predicciones realizadas que determinan las ventas influyen sustancialmente en el funcionamiento de los departamentos que conforman las empresas, ya que dependiendo de la proyeccin se deber aumentar o disminuir la produccin para poder cumplir con las demandas establecida al mismo tiempo que se minimizan los costos. Denotar al tiempo como una variable de independiente representa la base del estudio de las series temporales, ya que a medida que el tiempo avanza los cambios dentro de la variable que se ha denominado como dependiente se hacen cada vez ms comunes: la variacin en un precio en determinado momento del ao obligado a un cambio en la demanda o tal vez por acto de algn agente externo, son consideraciones que se deben tomar en cuenta ya que existe una gran cantidad de variables que pueden afectar un anlisis de seres de tiempos. Con el pasar de los aos se ha visto un gran avance en este rea del conocimiento hasta el punto en las ltimas dcadas se han desarrolla varias metodologas que permiten hacer pronsticos con un alto grado de exactitud como lo es la metodologa a metodologa de Box-Jenkins, nombrada as en honor a los estadsticos George Box y Gwilym Jenkins, la cual se aplica a los modelos autorregresivos de media mvil ARMA o a los modelos autorregresivo integrados de media mvil para encontrar el mejor ajuste de una serie temporal de valores, a fin de que los pronsticos sean ms acertados. El inters de este trabajo es netamente acadmico y busca profundizar mas en temticas que si bien son difciles de tratar en las aulas de clases no deben estar distantes al contenido eje terico de un profesional en formacin.

OBJETIVOS

GENERALES Analizar los distintos modelos de series de tiempo a travs de su implementacin para resolver problemas de la vida cotidiana.

ESPECFICOS Recopilar informacin precisa haciendo uso de las distintas bases de datos que la Universidad del Magdalena brinda. Indagar acerca de la correcta eleccin y adecuacin de los modelos utilizados en la investigacin consultada. Describir las metodologas implementadas por los investigadores en el desarrollo de su trabajo.

REVISIN BIBLIOGRFICA
METODOLOGA BOX JENKINS

Esta metodologa diseada en 1970, por box y Jenkins propone estrategia para la construccin de modelos, los cuales no solo deben ser adecuados para representar el comportamiento de los datos observados, sino que la eleccin debe ser sugerida para los datos mismos, lo que se contrapone en el enfoque tradicional, que simplemente busca lograr el mejor ajuste de modelos segn los datos que se manejen. La estrategia para construccin de modelos para serie de tiempo desarrollado por Box y Jenkins consta de cuatro etapas: 1. 2. 3. 4. Identificacin Estimacin Verificacin Uso del modelo

La unin de estas etapas da origen a un proceso iterativo, el cual es ilustrado en el siguiente esquema:
ETAPA 1 ETAPA 2 ETAPA 3

Identificacin del modelo

Estimacin de los parmetros

Verificacin

No Es adecuado el modelo

Si

ETAPA 4

Uso de modelo

Identificacin: El objetivo principal es determinar si es necesario realizar transformacin a los datos para estabilizar la varianza (si lo requiere), es decir convertirla en una serie estacionaria. Para verificar si realmente la serie es estacionaria o no, es utilizada la prueba DickeyFuller o races unitarias que tiene como hiptesis a aceptar, las siguientes: Ho: El proceso es no estacionario. Hi: El Proceso es estacionario Para la determinacin del modelo es necesario mirar el correlograma y la variable de diferencia (d), en caso de que lo requiere, para verificar si el modelo seleccionado cumple con las especificaciones se debe de realizar la prueba de Box Pierce la cual corrobora dicha eleccin. Estimacin de Parmetros Despus de la eleccin del modelo se pasa a buscar el valor de los parmetros a travs de tcnica de estimaciones no lineales, con el objetivo que el modelo represente apropiadamente a la serie. Una de las tcnicas para la realizacin de lo anteriormente mencionado es el mtodo de GaussNewton. Verificacin de el modelo Antes de la utilizacin del modelo con fines de predicciones, se debe de someter a pruebas partiendo de que todo modelo es errneo puesto que son representaciones de la realidad. La forma de aprobar el modelo es a travs del anlisis de los residuales(at) debido a que son estos los que no son explicados por l, plantendose 8 supuestos donde los primeros cincos hacen referencia a los trminos del error y los otros a los coeficientes. Supuesto 1: La serie de lo at debe tener media cero. Supuesto 2: La serie de lo at debe tener varianza constante. Supuesto 3: La variaciones aleatorias son independientes Supuesto 4: Los at se destruye normalmente par toda t Supuesto 5: No puedes existir observaciones aberrantes Supuesto 6: El modelo es parsimonioso Supuesto 7: El modelo es admisible Supuesto 8: El modelo es estable en los parmetros.

Uso del modelo Al verificar que el modelo es adecuado se procede hacer los pronsticos, el control y darle explicacin al fenmeno de estudio.

MODELOS ESTADSTICOS

Los modelos ARIMA tratarn de expresar la evolucin de una variable Yt de un proceso estocstico en funcin del pasado de esa variable o de impactos aleatorios que esa variable sufri en el pasado. Para ello, se utilizarn dos tipos de formas funcionales lineales sencillas: los modelos AR (Modelos Autoregresivos), y los modelos MA (de Medias Mviles).

Modelo de Auto regresin (AR)

Definimos un modelo AR (autoregresivo) como aquel en el que la variable endgena de un perodo t es explicada por las observaciones de ella misma correspondientes a perodos anteriores (parte sistemtica) ms un trmino de error ruido blanco (innovacin). Los modelos autoregresivos se abrevian con la palabra AR tras la que se indica el orden del modelo: AR (1) si es de primer orden y as sucesivamente. El orden del modelo expresa el nmero de observaciones retasadas de la serie temporal analizada que intervienen en la ecuacin. As, por ejemplo, un modelo AR (1) tendra la siguiente expresin:
Y t = 0 + 1 Y t -1 + at

La expresin genrica de un modelo autoregresivo, no ya de un AR(1) sino de un AR(p) sera la siguiente:

Y t = 0 + 1 Y t -1 + 2 Y t -2 + ...... + p Y t - p + at
Donde at son las variables aleatorias independientes las cuales son denominadas como ruido blanco. Esta forma funcional se acompaa de una serie de restricciones conectadas con importantes hiptesis analticas: El proceso no debe ser anticipante (hiptesis de recursividad temporal); lo que quiere decir que los valores de una variable en un momento t no dependern de los que esta misma tome en t+j. La correlacin entre una variable y su pasado va reducindose a medida que nos alejamos ms en el tiempo (proceso ergdico). La magnitud de los coeficientes est limitada en valor absoluto: as, por ejemplo, en el caso de un AR(1), el coeficiente autoregresivo de un proceso estocstico estacionario ha de ser inferior a 1 en valor absoluto; en el caso de un Ar(2), es la suma de los dos coeficientes la que no puede exceder la unidad. Estas restricciones expresadas en los coeficientes conectan con las propiedades de estacionalidad del proceso analizado o, dicho de otro modo: slo los modelos cuyos coeficientes respetan una serie de condiciones (que dependen del orden p del modelo) representan procesos estocsticos estacionarios y, por tanto, tienen utilidad analtica.

Condiciones de estacionariedad El requisito de estacionariedad en varianza para un modelo AR es que las races del polinomio caracterstico, en mdulo, sean menores que la unidad. Con el fin de comprobar si el modelo es estacionario en varianza se calcula las races del polinomio caracterstico del modelo. Condiciones de invertibilidad La condicin de invertibilidad en los modelos autoregresivos de un nmero finito de trminos se cumple siempre de forma automtica.

Modelo de medias mviles MA(q)

Un modelo de los denominados de medias mviles es aquel que explica el valor de una determinada variable en un perodo t en funcin de un trmino independiente y una sucesin de trminos de error, de innovaciones correspondientes a perodos precedentes, convenientemente ponderados. Estos modelos se denotan normalmente con las siglas MA, seguidos, como en el caso de los modelos autoregresivos, del orden entre parntesis. As, un modelo con q trminos de error MA (q) respondera a la siguiente expresin:

Y t = + at + 1 at -1 + 2 at -2 + ....+ q at -q

Donde at son las variables aleatorias independientes las cuales son denominadas como ruido blanco. A su vez puede abreviarse utilizando el polinomio de retardos (como en el caso de los modelos AR):
Y t = q (L) at +

Este modelo se caracteriza por ser un proceso estacionario, invertible con cuando su secuencia es constante. Condicin de estacionariedad. La modelizacin de una serie a travs de un modelo MA exige que el modelo sea estacionario en media y varianza. La condicin de estacionariedad en media exige que la a(Yt) no sea funcin del tiempo y, adems, la a(Yt) debe ser finita y determinada. El requisito de estacionariedad en varianza para un modelo MA finito se cumple automticamente ya que la varianza de un MA finito ser siempre finita.

Condicin de invertibilidad. Invertir un modelo MA consiste en transformarlo en su modelo AR equivalente. El requisito para que se pueda invertir un modelo MA es que las races del polinomio caracterstico, en mdulo, sean menores que la unidad.

Con el fin de comprobar si el modelo es invertible se calculan las races del polinomio caracterstico del modelo.

Modelo autoregresivo integrado de media mvil(ARIMA)

En 1970, Box y Jenkins desarrollaron un cuerpo metodolgico destinado a identificar, estimar y diagnosticar modelos dinmicos de series temporales en los que la variable tiempo juega un papel fundamental. Una parte importante de esta metodologa est pensada para liberar al investigador de la tarea de especificacin de los modelos dejando que los propios datos temporales de la variable a estudiar nos indiquen las caractersticas de la estructura probabilstica subyacente. A partir de una misma estructura, con el modelo ARIMA (p;d;q) se pueden obtener infinitas realizaciones. Un modelo autoregresivo integrado de media mvil o ARIMA es un modelo estadstico que utiliza variaciones y regresiones de datos estadsticos con el fin de encontrar patrones para una prediccin hacia el futuro. Se trata de un modelo dinmico de series temporales, es decir, las estimaciones futuras vienen explicadas por los datos del pasado y no por variables independientes. Los modelos ARIMA se construyen a partir de los modelos ARMA, pero considerando que la serie en estudio para que sea estacionaria en media tendr que diferenciarse una serie de veces. Un modelo ARIMA (p,d,q) es un modelo ARMA(p,q) sobre la serie diferenciada d veces.

El comportamiento de un modelo ARIMA, se puede definir como un modelo de regresin lineal mltiple, donde la variable dependiente es la propia serie (diferenciada o no) y las variables independientes son valores de la serie y valores de los errores de ajuste retrasados hasta unos rdenes p y q, respectivamente. Una vez identificado el modelo, que equivale a identificar los rdenes p, q y el orden de diferenciacin (si es requerido), la determinacin de los p+q parmetros usados en el modelo (s y s) se

realiza de igual forma que en el caso de la regresin mltiple, es decir, mediante minimizacin del error cuadrtico. La gran ventaja de los modelos ARIMA con respecto a los ARMA es la incorporacin de esta diferenciacin dentro del modelo, dentro de la parte de integracin.

Algunas Propiedades de un modelo ARIMA ptimo A continuacin se vern las caractersticas generales que ha de tener un buen modelo ARIMA. Estas caractersticas nos servirn para posteriormente poder identificar, estimar y verificar el comportamiento de un modelo ARIMA que ha sido optimizado. Parsimonia (Parquedad)

Box y Jenkins ponen nfasis en que la clave de un buen modelo ARIMA es que cumpla el principio de parsimonia, que significa sencillez. As, un modelo se dice que esparsimonioso si se ajusta a la serie de forma adecuada sin usar coeficientes innecesarios. Por ejemplo, si un modelo AR(1) y un modelo AR(2) se comportan de forma prcticamente idntica, elegiremos el modelo AR(1) ya que as tendremos que estimarun coeficiente menos. El principio de parsimonia es importante porque, en la prctica, un modelo parsimonioso suele generar mejores predicciones. La idea de la parsimonia nos da una fuerte orientacin prctica a la hora de modelar e identificar una modelo ARIMA. As, no tendremos que buscar el proceso ARIMA que realmente genera la serie temporal, sino que nos conformaremos con encontrar un modelo que se aproxime correctamente, Estacionariedad

Otra condicin de gran importancia para lograr un buen modelo ARIMA es que la serie sea estacionaria. Asumir que una serie sea estacionaria nos permite desarrollar un marco de trabajo bastante simple y usar herramientas estadsticas de muestreo de gran potencia. As, si la media de un proceso es constante, podremos usar N observaciones para estimarla, mientras que sera mucho ms complicado si la media no fuese estacionaria. Las tcnicas ms comunes para conocer si una serie temporal es estacionaria son los contrastes de existencia de races unidad. Si una serie

no es estacionaria podemos modificar dicha serie para convertirla en estacionaria.

Buenos coeficientes estimados

Que un modelo tenga unos buenos coeficientes estimados, est relacionado con dos vertientes distintas. La primera es que los coeficientes, tanto los de la componente autoregresiva (s) como los de la componente de media mvil (s) sean significativamente distintos de cero. Esto se realiza mediante contrastes de hiptesis. La segunda es que las estimaciones de los coeficientes s y s no deben estar altamente correladas entre s. Si estn muy correladas, tienden a ser inestables, incluso siendo estadsticamente significativos. Los residuos son ruido blanco

Esta proposicin es muy importante a la hora de verificar un modelo ARIMA, una vez se han realizado las etapas de identificacin y ajuste. La hiptesis crtica es la de incorrelacin. Para comprobar esta hiptesis se utilizan distintos mtodos de inferencia estadstica (tpicamente contrastes t y chi cuadrado) aplicados a cada coeficiente de la funcin de autocorrelacin y a la funcin de autocorrelacin completa. Debe ajustarse bien a los datos

Que un modelo se ajuste todo lo bien posible a los datos de los que es generado, es una hiptesis asumible y lgica. Esta bondad del ajuste se mide en trminos de error. Distintas medidas de error son computables en la etapa de ajuste y se han analizado previamente. Los mrgenes asumibles del valor de estos errores de ajuste dependen, ciertamente, de la naturaleza de la serie, por lo que no hay un criterio unvoco de comprobacin de la adecuacin del ajuste

Debe dar buenas predicciones

Aunque el modelo haya sido ajustado y prediga el pasado de una forma suficientemente correcta, lo que realmente se requiere de cualquier modelo de prediccin es que realice predicciones satisfactorias. La evaluacin de un modelo segn este criterio se debe realizar mediante el uso durante un periodo de prueba o de verificacin ANALISIS CRTICO Time Series Analysis Forecasting in Sugar Cane Production The study by Juan Ruiz -Ramirez , Gabriela Erendira Hernandez - Zuleta Rodriguez and Ramon Rodriguez , in his research "Time Series Analysis Forecasting in Sugar Cane Production" will implement the methodology BOXJENKINS as a strategy for obtaining model would be adjusted effective and efficient in determining the production of sugar cane harvest in Mexico during the years (2006-2007) , for this took the monthly figures of production volume between years (1949-2006) , with to optimize and plan the use of technical, human and financial , for adequate investment . The purpose for conducting this research was the importance of economic resources to the processing of sugar cane in the agricultural sector contributes , as this causes 0.5% of Mexican GDP , which at the time one of the activities that generates employment more . It is for this reason that it was necessary to know how was the behavior of the sugar colle cts in Mexico , to minimize the maximum factors that could have negative effects in this production area. In the past certain investigations were not sufficient to achieve production determine future dates, because studies revolved around variables as such gave no explanation of this behavior , which could not provide quantitative predictions about the making of the cane sugar . In response to the aforesaid problem , the authors decided to use the modeling methodology proposed by Box and Jenkins 1970 , starting with Step 1, the identification of the model reaching ARIMA model selection . The choice of this model was the most accurate decision because they were facing a non-stationary series , which would not let him get to get really specific predictions due to the variability of the variance and its mean.

Through this transformation model achievement data passing from one series to a stationary non-stationary , which was based on a logarithmic transformation with two degrees of differentiation ln ( x ) D (-1 ), D (-1 ) , havingwith the values of the mean and standard deviation with predictions maximum and minimum values of the average faraway not obtained , thus allowing stabilization of variance , making obtaining a simpler and more accurate model , complying with the principle of parsimony . Proceeding with the other stages of this methodology corroborate that the selection was correct because the postulated model was appropriate because it could comply with the following assumptions: constant variance of the residuals , independence of residuals , normality of the residuals , observations not aberrant , the model is parsimonious , the model is admissible and the model is stable . Taking even more certain to obtain precise predictions and actual production harvests. Certainty that was ratified by taking forecasts on production volumes sugar cane in recent months previously known , which allow us to observe whether it was good model fit in time. When this process was found that point forecasts over the past almost fit of actual , giving as evidence that equation modeling was very good , with a level of explanation of the total variance of 94%. From this methodology was able to obtain precise predictions for sugar cane crops in the years desired , noting that planting sugar harvests diminished year after year , implying expected low demand for this . One reason why the results obtained may be due to the fact that 6% have ignored for other factors such as price , supplies and other not measured , though this is a very significant percentage for the explanation of this process manufacturing . Moreover it makes the treatment to be less labor intensive to implement , unless corrective action is taken , which is a very significant analysis because it offers a forecast that gives optimal solutions suited to the production of sugar in future years

CONCLUSION

Es fcil ver cmo avanza el mundo a pasos agigantados, por las sendas del conocimiento y de la mano del desarrollo, esto ha trado grandes beneficios para el rea industrial lo cual se puede ver fcilmente reflejado en el planteamiento de nuevos modelos o series de tiempos que ayudan a hacer predicciones y pronsticos cada da ms puntuales y cercanos a la realidad. Dichos modelos tienen la particularidad de poder ser utilizados en cualquier mbito de la economa como lo es el enfoque financiero, agrcola, demogrfico entre otros. El tiempo es un recurso que siempre es nombrado como uno de los tres recursos de toda empresa, pero muchas veces es tomado como un tpico de relevancia por ser tomado como solo un patrn de medidas. El las series de tiempo y predicciones esto no es as ya que en estas temticas juega un papel sumamente importante en la que muchas veces es considerado como la variable independiente, dando muestra de que es su valor el que condiciona a las predicciones. En este ejercicio acadmico no fue la excepcin ya que se pudo observar cmo, a travs del tiempo las cosechas de una empresa que se dedicaba al cultivo de caa de azcar iban decayendo; el investigador pudo llegar a esta conclusin llevando a cabo los

distintos mtodos y procedimientos estadsticos para poder dar con los pronsticos adecuado. Es importante resaltar que todos estos pronsticos se dan a travs de una adecuada ejecucin del modelo ARIMA el cual permite la estabilizacin de la varianza debido a la aplicacin del operador de diferencia, logrando as tener un modelo ms simple y preciso; este modelo pudo ser escogido gracias a la metodologa box- jenkins. El anterior trabajo fue muy enriquecedor para cada uno de los estudiantes ya que se pudo confrontar cada una de las teoras consignadas por los autores con la realidad, comprobando as su veracidad y eficiencia. Adems es la muestra de que si es posible un aprendizaje autnomo yendo mas halla de los conocimientos impartidos en clase, donde se resalta la importancia del ingeniero industrial como agente de mejoramiento en la industria.

BIBLOGRAFA

Damodar No. Gujarate: Econometra. Segunda edicin. Mc Graw Hill, Colombia, 1990. Guerrero Vctor, M: Anlisis Estadstico de series de tiempo econmicas. Coleccin BI-Mxico, 1991. Harvey Andrews: The econometrics analysis on time series. Segundaedicin, The Mit Press, Cambridge, Massachusetts, 1990. Jonhnston I: Econometrics Methods. Mc. Graw Hill, Third Edition, 1984. Bruce L. Bowerman, Richard T. O'Connell. Pronstico, Series de tiempo y regression, un enfoque aplicado. CengageLearning Editores. 4ta Edicin. 2007. Rodrguez Rodrguez, Concepcin. Modelos Box-Jenkins: aplicacin de su metodologa a la produccin de azcar en Cuba. Economa y Desarrollo. V.128 n.1. 2001. Cuba: Editorial Universitaria, 2007. p 2. Juan Ruiz-Ramrez, Gabriela Erndira Hernndez-Rodrguez y Ramn Zulueta-Rodrguez, Concepcin. Modelos Box-Jenkins: Time Series AnalysisForecasting in SugarCaneProduction (2006-2007), Facultad de Ciencias Agrcolas. Universidad Veracruzana..p.1.

WEBGRAFIA Pilar Gonzlez Casimiro. (Producer). (2007, 27 de febrero de 2010). Anlisis de Series Temporales: Modelos ARIMA; www.sarrikoonline.com/cas/fichas/2009/04-09.pdf

Santiago de la Fuente Fernndez (Producer). (2008, 27 de febrero de 2010). series temporales: modelo arimawww.uam.es/ana.delsur/pdf/BoxJenkins.PDF

Das könnte Ihnen auch gefallen