Beruflich Dokumente
Kultur Dokumente
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
1 2
Porqu es importante los mtodos predictivos? Introduccin Regresin Simple Regresin Simple La linea de mnimos cuadrados que mejor se ajusta Estimaciones puntuales de mnimos cuadrados Coeciente de determinacin y correlacin simple Intrvalo de conanza para un valor individual de y Prueba F global
Regresin Mltiple Introduccin Enfoque matricial Coeciente de determinacin mltiple R 2 Prueba F global Prueba T Regresin Cuadrtica Introduccin Ejemplo
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Captulo 1:
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Porqu es importante los mtodos predictivos? La nalidad de los modelos predictivos es la obtencin de pronsticos acerca de la evolucin futura de determinadas variables. Es importante en muchas empresas y entidades ya que las predicciones de hechos futuros se pueden incorporar al proceso de toma de decisiones. La intuicin no necesariamente da los mejores resultados. Mejora la planeacin y competitividad.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
El anlisis de regresin es una tcnicca estadstica para investigar y modelar la relacin entre variables. Son muchas las aplicaciones y las hay en casi cualquier campo: ingeniera, ciencias, fsicas y qumicas, economa, administracin, biologa y en las ciencias sociales, de hecho, puede ser que el anlisis de regresin sea la tcnica estadstica ms usada (Montgomery et al., 2007).
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Pronsticos Las predicciones de hechos y condiciones futuros se llaman pronsticos. Se analiza los datos para poder identicar un patrn que se pueda utilizar para describirlo. Luego, este patrn se extrapola, o se ampla, hacia el futuro con el objeto de preparar un pronstico. Se apoya en el supuesto de que el patrn que se identic sigue siendo el mismo en el futuro. No se puede esperar que una tcnica de prediccin d buenas predicciones a menos que esta hiptesis sea vlida.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una serie de tiempo es una sucesin cronolgica de observaciones de una variable en particular.
Poblacin de la ciudad de Puno con respecto al tiempo. ndice de percepciones de corrupcin en Per, del 2000 al 2010.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Partes de una serie de tiempo: Tendencia. Ciclo. Variaciones estacionales. Fluctuaciones irregulares.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Medicin de los errores de pronstico et = yt yt yt valor real de la variable de inters en el periodo de tiempo t. yt el valor predicho. et error de pronstico para un pronstico particular yt . Con frecuencia un examen de los errores de pronstico en el tiempo indica si la tcnica de prediccin va de acuerdo o no con el patrn. Por ejemplo: si una tcnica de prediccin predice exctamente la tendencia, la variacin estacional o el componente cclico que estn presentes en una serie de tiempo, los errores de pronstico reejarn slo el componente irregular.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
yt |
n t=1 (yt
yt )2
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una manera de medir el error de pronstico que facilita la comparacin de diferentes series de tiempo con valores de distintas magnitudes es dividir las desviaciones absolutas entre el valor real yt y luego multiplicarlo por 100. Error absoluto de porcentaje EAP: |yt yt | |et | (100) = (100) yt yt Error absoluto de porcentaje medio EAPM:
n t=1 EAPt
100
|yt yt | n t=1 yt
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Los modelos de regresin en los que se emplea una variable dependiente y una variable independiente se denominan modelos de regresin lineal (o de una recta) simple. Modelo de regresin lineal simple y = uy ;x + = 0 + 1 x + uy ;x es el valor medio de la variable dependiente y cuando el valor de la variable independiente es x. Recta de medias. 0 es la ordenada al origen. 0 es el valor medio de y cuando x es igual a cero. 1 es la pendiente, es el cambio (incremento o decremento) en el valor medio de y asociado con un incremento de una unidad de x. es un trmino de error que describe los efectos sobre y de todos los otros factores que no son los valores de la variable independiente x.
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
y Variable dependiente Variable respuesta Variable Ejm: Consumo de combustible por semana
x Variable independiente Variable predictora Variable Ejm: Temperatura promedio por hora durante la semana
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
El mtodo de mnimos cuadrados fue descrito primero por Carl Friedrich Gauss alrededor 1794. El da de Ao Nuevo de 1801, el astrnomo italiano Giuseppe Piazzi descubri el planeta Ceres. Fue capaz de seguir su rbita durante 40 das. Durante el curso de ese ao, muchos cientcos intentaron estimar su trayectoria con base en las observaciones de Piazzi. La mayora de evaluaciones fueron intiles; el nico clculo sucientemente preciso, que permiti al astrnomo Franz Xaver von Zach, reencontrar a Ceres al nal del ao fue el mtodo Gauss.
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Escoge 0 y 1 de tal manera que para un conjunto de datos, la 2 suma de residuos al cuadrado et sea lo mas pequeo posible.
2 et =
(yt yt )2 =
xt + 1
xi2
0 = y 1 x
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
yi n
yx=
xi n
xi2
SSxy SSxx
La estimacin puntual de los mnimos cuadrados de la ordenada al origen 0 es: 0 = y 1 x Con objeto de simplicar la notacin, con frecuencia se omiten los lmites de la sumatoria. Es decir usamos en lugar de n i=1
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Suposiciones para el modelo de regresin La media de la poblacin de los valores potenciales del trmino de error es igual a cero. Suposicin de la varianza constante (homoscedasticidad) : La varianza de la poblacin de los valores potenciales del trmino de error no depende del valor de x. La varianza constante se denota como 2 . Suposicin de normalidad: La poblacin de los valores potenciales del trmino de error tiene una distribucin normal. Suposicin de independencia: Un valor cualquiera del trmino de error es estadsticamente independiente de cualquier otro valor de .
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Variacin total: Suma de los errores de prediccin al cuadrado que se obtiene cuando no empleamos la variable predictora x. Mide la cantidad total de variacin que muestran los valores observados de y . 2 ( n=1 yi ) i SSyy = n (yi y )2 = n yi2 i=1 i=1 n Variacin inexplicada: Suma de los errores de prediccin al cuadrado que se obtiene cuando usamos la variable predictora x (otro nombre para SSE). SSE = n (yi yi )2 i=1 Variacin explicada: n 2 i=1 (yi y )
n i=1
(yi y)2 =
i=1
(yi yi )2 +
i=1
(yi y )2
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Coeciente de determinacin simple r 2 El coeciente de determinacin simple: Es una medida de utilidad del modelo de regresin lineal simple. r2 = variacion explicada variacion total
r 2 es la proporcin de la variacin total en los n valores observados de la variable dependiente que explica el modelo de regresin lineal simple. Tambin se puede calcular utilizando la frmula: r2 =
2 1 n 2 i=1 (xi x ) n 2 i=1 (yi y)
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Coeciente de correlacin simple r Coeciente de correlacin simple: Medida de relacin entre dos variables y y x, varia entre -1 y 1. Un valor cercano a cero quiere decir que hay una pequea relacin lineal entre y y x. Un valor de r cercano a 1 signica que y y x tienen una fuerte tendencia a desplazarse juntas en una forma lineal con una pendiente positiva (correlacin positiva, no signica que exista una relacin causa efecto). r = + r 2 si la pendiente es positiva r = r 2 si la pendiente es negativa Coeciente de correlacin simple tambin se puede calcular usando la frmula que da automticamente el signo (+ o -): r= SSxy SSxx SSyy
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Para efectuar las pruebas de hiptesis cuando se aplica el modelo de regresin lineal, es necesario calcular las estimaciones puntuales 2 y (la varianza constante y la desviacin estndar de las diferentes poblaciones de trminos de error) Error cuadrtico medio y error estndar Una estimacin puntual de 2 es el error cuadrtico medio: s2 = SSE n2
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
El valor de la distancia para la regresin lineal simple Para un valor particular x0 de x es: Valor de distancia = 1 (x0 x)2 + n SSxx
Intrvalo de conanza para un valor individual de y Si se sustentas las suposiciones de regresin, un intrvalo de prediccin
(n2) [ t[/2] s 1 + valor de distancia] y
Introduccin a MP
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
30
60
65
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una prueba F para el modelo de regresin lineal simple Una manera de evaluar la utilidad del modelo de regresin es probar la signicancia de la relacin de regresin entre y y x. Probamos la hiptesis nula: H0 : 1 = 0 Es decir, que la relacin de regresin entre y y x no es signicante. Contra: Ha : 1 = 0 Lo cual quiere decir que la relacin entre y y x es signicante. Si se puede rechazar H0 al nivel de signicancia , entonces se dice que el modelo de regresin lineal simple es signicante en el nivel de signicancia .
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una prueba F para el modelo de regresin lineal simple Denamos la estadstica F global como F (modelo) = Variacion explicada (Variacion inexplicada)/(n 2)
Tambin denimos el valor p relacionado con F(modelo) como el rea bajo la curva de distribucin F(con 1 y n 2 grados de libertad) a la derecha de F(modelo). Se puede aceptar Ha : en el nivel de signicancia si se mantiene algunas de las condiciones siguientes:
F(modelo) > F[] valor p <
Donde el punto F[] se basa en 1 grados de libertad para el numerador y n 2 para el denominador.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Captulo 3:
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Los modelos de regresin en los que se emplean ms de una variable independiente se denominan modelos de regresin mltiple. Para expresar una variable dependiente en funcin de cualquier cantidad de variables independientes. Modelo de regresin mltiple y = uy ;x1,x2 , ,xk + = 0 + 1 x1 + 2 x2 + + k xk + . uy ;x1,x2 , ,xk es el valor medio de la variable dependiente y cuando los valores de la variables independientes son x1 , x2 , , xk .
es un trmino de error que describe los efectos sobre y de todos los otros factores que no son los valores de las variables independientes x1 , x2 , , xk .
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Interpretacin de los parmetros de regresin: y = 0 + 1 x1 + 2 x2 + Consumo de combustible = f(temperatura horaria promedio , ndice de enfriamiento) Los parmetros relacionan la media de la variable dependiente con las variables independientes en un sentido global. 0 : ordenada al origen. 1 : cambio en el consumo medio de combustible a la semana que se asocia con el incremento de un grado en la temperatura promedio cuando no cambia el ndice de enfriamiento. 2 : cambio en el consumo medio de combustible a la semana que se asocia con el incremento de una unidad en el ndice de enfriamiento cuando no cambia la temperatura horaria promedio.
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
La media de la poblacin de los valores potenciales del trmino de error es igual a cero.
Suposicin de la varianza constante: La varianza de la poblacin de los valores potenciales del trmino de error no depende de la combinacin de valores de x1 , x2 , , xk . La varianza constante se denota como 2 . Suposicin de normalidad: La poblacin de los valores potenciales del trmino de error tiene una distribucin normal. Suposicin de independencia: Un valor cualquiera del trmino de error es estadsticamente independiente de cualquier otro valor de .
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Hay k variables regresoras y n observaciones y el modelo que relaciona las variables regresoras con la variable de repuesta es: yi = 0 + 1 xi1 + 2 xi2 + + k xik + i , para i = 1, 2, , n Este es un modelo de n ecuaciones que en notacin matricial puede expresarse como: Y = X + donde:
Y =
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Y =
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
SSyy =
i=1
(yi y)2 =
i=1
yi2
2 n i=1 yi )
Variacin inexplicada:
n n
SSE =
i=1
(yi yi )2 =
i=1
yi2 X Y
Variacin explicada: ( X Y
2 n i=1 yi )
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Para efectuar las pruebas de hiptesis cuando se aplica el modelo de regresin lineal, es necesario calcular las estimaciones puntuales 2 y (la varianza constante y la desviacin estndar de las diferentes poblaciones de trminos de error) Error cuadrtico medio y error estndar Una estimacin puntual de 2 es el error cuadrtico medio: s2 = SSE n (k + 1)
Introduccin a MP
Regresin Simple
2
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Variacin total: SSyy = Variacin inexplicada: SSE = n (yi yi )2 = i=1 Variacin explicada:
n i=1 (yi
y)2 = X Y
n 2 i=1 yi
2 n y i =1 i
n 2 i=1 yi
n i=1 (yi
( y )2 = X Y
2 n y i =1 i
variacion explicada variacion total Coeciente de correlacin mltiple: R = R 2 Coeciente de determinacin mltiple ajustado (R 2 ajustado): R2 = R2 k n1 n1 n (k + 1)
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una prueba F para el modelo de regresin lineal Una manera de evaluar la utilidad del modelo de regresin es probar la signicancia de la relacin de regresin entre y y x1 , x2 , , xk (k+1 parmetros). Probamos la hiptesis nula: H0 : 1 = 2 = = k = 0 La cual establece que ninguna de las variables independientes est relacionado signicativamente con y (la relacin de regresin no es signicante). Ha : por lo menos uno de 1 , 2 , , k no es igual a cero. Lo cual quiere decir que por lo menos una de las variables independientes est signicativamente relacionado con y .
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una prueba F para el modelo de regresin lineal Denamos la estadstica F global como F (modelo) = (Variacion explicada)/k (Variacion inexplicada)/[n (k + 1)]
Tambin denimos el valor p relacionado con F(modelo) como el rea bajo la curva de distribucin F que tiene k y [n (k + 1)] grados de libertad a la derecha de F(modelo). Se puede aceptar Ha : en el nivel de signicancia si se mantiene algunas de las condiciones siguientes:
F(modelo) > F[] valor p <
Donde el punto F[] se basa en k grados de libertad para el numerador y n (k + 1) para el denominador.
Introduccin a MP Prueba T
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Prueba de la signicancia de la variable independiente xj Cules variables independientes afectan signicativamente a y ? (individualmente). Para probar la signicancia de xj probamos la hiptesis nula contra la hiptesis alternativa: H0 : j = 0 Ha : j = 0 La estadstica de prueba. t= j j = Sbj S cjj
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Seccin 3.2:
Regresin Cuadrtica
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Una forma til del modelo de regresin lineal es la que se denomina modelo de regresin cudrtica. Modelo de regresin cuadrtica y = 0 + 1 x + 2 x 2 + . Donde 0 + 1 x + 2 x 2 es uy ;x es el valor medio de la variable dependiente y cuando es valor de la variable independiente es x. 0 , 1 , 2 son parmetros de regresin (desconocidos) que relacionan el valor medio de y con x. es un trmino de error que describe los efectos sobre y de todos los otros factores que no son x y x 2 .
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Ejemplo Una compaia desea mejorar la cantidad de kilmetros recorridos por galn de gasolina en los automviles que usan su gasolina. Los qumicos de la compaa recomiendan un aditivo (Cripton19) se mezcle con la gasolna. Determinar la cantidad de unidades de aditivo que se debe mezclar con la gasolina para maximizar las millas recorridas. A la compaa le gustara predecir la cantidad mxima de millas recorridas por galn que se puede alcanzar utilizando el aditivo.
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Y = Cantidad de millas recorridas 25.8 26.1 25.4 29.6 29.2 29.8 32.0 31.4 31.7 31.7 31.5 31.2 29.4 29.0 29.5
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
scatter y x, title("Millas Recorridas segn aditivo") subtitle("Petroleos S.A.") caption("Fuente: Elaboracin propia") scheme(sj)
Millas Recorridas segn aditivo
Mtodos Predictivos 2010
32 24 0 26 Millas recorridas 28 30
2 Aditivo
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Cantidad de aditivo que maximiza los kilmetros recorridos Ecuacin de prediccin de mnimos cuadrados orginarios: y = 25,71524 + 4,976191x 1,019048x 2 Cantidad de unidades de aditivo que maximiza los kilmetros recorridos: Usamos clculo diferencial: di(25.71524 + 4.976191*x - 1.019048*x*x , x , 1); 4.976191 - 2.038096*x solve( %,x),oat; x = 2.44 unidades de aditivo. La cantidad predicha de kilometros recorridos por galn: ev(25.71524 + 4.976191*x - 1.019048*x*x , x=2.44 ); 31.7901 kilmetros por galn.
Introduccin a MP Ejemplo
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Introduccin a MP Introduccin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin
Seccin 3.3:
Interaccin
Introduccin a MP Fin
Regresin Simple
Regresin Mltiple
Regresin Cuadrtica
Interaccin