You are on page 1of 9

Estadstica Aplicada

Ingeniera En Industrias Alimentarias IAM-0511 4 Anlisis de Regresin Lineal Simple, n Lineal ! M"ltiple
4.1 Introduccin al Anlisis de Regresin 4.2 Diagramas de Dispersin 4.3 Correlacin; Medicin de la intensidad y direccin de la asociacin entre las aria!les 4.4 "igni#icacin de la R de $earson 4.% &ipos de Modelos de Regresin 4.' Desarrollo del Modelo de Regresin (ineal "imple 4.) M*todo de los M+nimos Cuadrados y su Interpretacin 4., Desarrollo del Modelo de Regresin M-ltiple 4.. Coe#iciente de Determinacin M-ltiple y su Interpretacin 4.1/ $rediccin de la aria!le Dependiente e Independiente 4.11 Desarrollo del Modelo de Regresin 01ponencial y su Interpretacin 4.12 Desarrollo del Modelo de Regresin (ogar+tmica y su Interpretacin

4.' Desarrollo del Modelo de Regresin (ineal "imple

Concepto El establecimiento de una correlacin entre dos variables es importante, pero esto se considera un primer paso para predecir una variable a partir de la otra. (U otras, en el caso de la regresin mltiple.) Claro est, si sabemos que la variable X est muy relacionada con , ello quiere decir que podemos predecir a partir de X. Estamos ya en el terreno de la prediccin. (Evidentemente si, X no est relacionada con , X no sirve como predictor de .)
!ota" Emplearemos los t#rminos $regresin% y $prediccin% como casi sinnimos. (&a ra'n del uso del t#rmino $regresin% es antigua, y se (a mantenido como tal.)

Concepto ())
El tema bsico en regresin (con ) variables) es a*ustar los puntos del diagrama de dispersin de las variables X e . +ara simpli,icar, nos centraremos especialmente (por simplicidad) en el caso de que la relacin entre X e sea lineal.

rendimiento

inteligencia

Claro est, el tema a(ora es cmo conseguir cul es la $me*or% l-nea que parece unir los puntos. !ecesitamos para ello un criterio. .i bien (ay otros criterios, el ms empleado comnmente, y el que veremos aqu-, es el criterio de mnimos cuadrados.

Criterio de m-nimos cuadrados" Es aquel que minimi'a las distancias cuadrticas de los puntos con la l-nea.

/epaso de la ecuacin de una recta


0123X 1 es la ordenada en el origen (es donde la recta corta el e*e ) 3 es la pendiente (observa que en el caso de las relaciones positivas, 3 ser positivo4 en el caso de las relacin negativas, 3 ser negativo4 si no (ay relacin, 3 ser apro5imadamente 6)

rendimiento inteligencia

.i queremos predecir a partir de X, necesitamos calcular (en el caso de relacin lineal) la recta de regresin de sobre (a partir de) X.

REGRESION
.e puede de,inir a la /egresin, como una correlacin matemtica basada en la ecuacin de la recta modi,icada. E5isten varios tipos de regresin y todos se basan en modi,icaciones de la ,ormula de regresin lineal " Y = a + b . X (ecuacin matemtica de la recta) Y es la variable dependiente (de estudio) y X la variable independiente. a y b son ,actores derivados de la ecuacin matemtica de la recta. 3sicamente, por medio de la regresin se pretende predecir el valor de una variable llamada gen#ricamente $Y%, a trav#s de otra variable llamada $X%. &a regresin se representa mediante un coe,iciente / que oscila entre 7 8 y 2 8. Cuando la variable dependiente aumenta ante incrementos de la variable independiente X , el / es positivo y oscila entre 6 y 8. 1 su ve' cuando disminuye ante incrementos de X el / es negativo, entre 6 y 98. :eamos algunos e*emplos para una me*or comprensin "

El gr,ico muestra la relacin e5istente entre sumatoria de puntos del .istema 1pac(e ;; a las )< (oras del ingreso y la probabilidad de mortalidad en terapia intensiva. El valor de / es 6,=> para un nivel de p ? 6.668. El valor de /) es 6.=@. El /) es un coe,iciente importante en regresin. .e deduce de la elevacin al cuadrado de / y es representativo del grado de relacin entre variables. Un /) de 6.=@, signi,ica que el valor de la probabilidad de mortalidad podr ser predecido en un =@A de las veces por el valor del 1pac(e ;;.

.i anali'amos la +robabilidad de sobrevida en UB; con respecto al valor del 1pac(e ;;, obtenemos una curva de regresin similar pero negativa, con un / 0 7 6,=> y nuevamente un /) de 6.=@. +or lo tanto el valor de R2 indica el porcenta*e de variabilidad de los valores de que pueden ser e5plicadas en ,uncin de la variabilidad de los valores de X.

&os modelos de regresin no siempre son lineales y se basan en la ecuacin pura de la recta. E5isten tambi#n modi,icaciones de esta ecuacin de tal manera que se pueden practicar anlisis de regresin cuadrtica, cbica, logar-tmica, log-stica, etc. 1dems la regresin puede ser simple o mltiple, constituyendo un tipo de anlisis multivariado. http://www.medal.org.ar/stadhelp/Std00015.htm Regresin lineal simple. Biene como ob*eto estudiar cmo los cambios en una variable, no aleatoria, a,ectan a una variable aleatoria, en el caso de e5istir una relacin ,uncional entre ambas variables que puede ser establecida por una e5presin lineal, es decir, su representacin gr,ica es una lnea recta. Cuando la relacin lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresin lineal simple. &a respuesta aleatoria al valor x de la variable controlada se designa por Yx y, segn lo establecido, se tendr

Ce manera equivalente, otra ,ormulacin del modelo de regresin lineal simple ser-a" si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviacin aleatoria de Yi . Estimacin de los parmetros de la recta de regresin. El primer problema a abordar es obtener los estimadores de los parmetros de la recta de regresin , partiendo de una muestra de tamaDo n, es decir, n pares (x1 Y1! , (x2 Y2!, ..., (xn Yn!4 que representan nuestra intencin de e5traer para cada xi un individuo de la poblacin o variable Yi . Una ve' reali'ada la muestra, se dispondr de n pares de valores o puntos del plano (x1 y1! , (x2 y2!, ..., (xn yn!. El m#todo de estimacin aplicable en regresin, denominado de los m-nimos cuadrados, permite esencialmente determinar la recta que Eme*orE se a*uste o me*or se adapte a la nube de n puntos. &as estimaciones de los parmetros de la recta de regresin obtenidas con este procedimiento son"

+or tanto la recta de regresin estimada ser"

"n e#emplo. &a recta de regresin representada corresponde a la estimacin obtenida a partir de )6 pares de observaciones" x representa la temperatura ,i*ada en un recinto cerrado e Y el ritmo card-aco de un vertebrado.

RE$RE%&'(
F F F F F F .e puede de,inir a la /egresin, como una correlacin matemtica basada en la ecuacin de la recta modi,icada. E5isten varios tipos de regresin y todos se basan en modi,icaciones de la ,ormula de regresin lineal" Y = a + b. X (ecuacin matemtica de la recta) Y es la variable dependiente (de estudio) y X la variable independiente a y b son ,actores derivados de la ecuacin matemtica de la recta. 3sicamente, por medio de la regresin se pretende predecir el valor de una variable llamada gen#ricamente $Y%, a trav#s de otra variable llamada $X%. &a regresin se representa mediante un coe,iciente / que oscila entre 7 8 y 2 8. Cuando la variable dependiente aumenta ante incrementos de la variable independiente X, el / es positivo y oscila entre 6 y 8. 1 su ve' cuando disminuye ante incrementos de X el / es negativo, entre 6 y 98. :eamos algunos e*emplos para una me*or comprensin"

El gr,ico muestra la relacin e5istente entre sumatoria de puntos del .istema 1pac(e ;; a las )< (oras del ingreso y la probabilidad de mortalidad en terapia intensiva. El valor de / es 6,=> para un nivel de p ? 6.668. El valor de /) es 6.=@. El /) es un coe,iciente importante en regresin. .e deduce de la elevacin al cuadrado de / y es representativo del grado de relacin entre variables. Un /) de 6.=@, signi,ica que el valor de la probabilidad de mortalidad podr ser predecido en un =@A de las veces por el valor del 1pac(e ;;.

.i anali'amos la +robabilidad de sobrevida en UB; con respecto al valor del 1pac(e ;;, obtenemos una curva de regresin similar pero negativa, con un / 0 7 6,=> y nuevamente un /) de 6.=@. +or lo tanto el valor de R2 indica el porcenta*e de variabilidad de los valores de que pueden ser e5plicadas en ,uncin de la variabilidad de los valores de X. &os modelos de regresin no siempre son lineales y se basan en loa ecuacin pura de la recta. E5isten tambi#n modi,icaciones de esta ecuacin de tal manera que se pueden practicar anlisis de regresin cuadrtica, cbica, logar-tmica, log-stica, etc. 1dems la regresin puede ser simple o mltiple, constituyendo un tipo de anlisis multivariado.

F Esta es la llamada ERecta de regresin de dependencia de 5 respecto a y slo (abr-a que cambiar en la e5presin de la recta 5 por y, obteni#ndose la recta regresin de 5 sobre y. F En la imagen siguiente se muestra la recta de regresin de y (peso) sobre 5 (talla) . En este caso se supone que represente cmo depende el peso de una persona de su talla.

.i recordamos que entre la talla y el peso dec-amos que e5ist-a una dependencia directa, la recta de regresin lo con,irma ya que su pendiente es positiva" a medida que aumenta la talla aumenta el peso. +or tanto" Cependencia directa 7 +endiente de la recta positiva 7 Guncin creciente.

F E#emplo ).7 &a recta de regresin de la variable y (talla) sobre 5 (peso) ser la recta" F 7 que pasa por el punto (8@),H 4 HH,I) F 7 tiene de pendiente" JJ,I) K J6,@8 0 8,6=6= F /ecta" y 7 HH,I 0 8,6=6= (5 7 8@),H) que operando y simpli,icando queda" F y = 1 *+*+x , 121 + F El valor del peso que supon-amos apro5imado para una talla de 8>J cm ser-a" +eso 8.6=6= L 8>J 7 8)8,= 0 -+.+ F Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones (ec(as con la recta de regresin no son e5actas.