Sie sind auf Seite 1von 8

UNIVERSIDAD NACIONAL DE TRUJILLO

Curso : Estadstica y Probabilidad Escuela : Agrcola Docente: Dra. Mara T. Rojas Garca

Regresin Lineal Simple


Se dispone de una muestra de observaciones formadas por pares de variables: (x1, y1), (x2, y2), .., (xn, yn)

A travs de esta muestra, se desea estudiar la relacin existente entre las dos variables X e Y. Ahora asumiremos que si hay una relacin de causalidad de la variable X (causa) hacia la variable Y (efecto). Adems, se sabe que esa relacin es de tipo lineal, dentro del rango de los datos. Estableceremos un modelo para explicar la causa (Y) en trminos del efecto (X), del tipo siguiente:

+ ei
Donde: Y: Variable dependiente a : Ordenada en el origen

; con

el menor error posible entre

e Y,

(explicada, pronosticada, regresando o variable respuesta) (punto en que la lnea intercepta o corta al eje y)

X: Variable independiente (explicativa, predictora o regresora) b : Pendiente de la Ecuacin ( magnitud de cambio del incremento o decremento de la variable Y por cada unidad de incremento de X) e: Error aleatorio: con E(e)= O ; V( e) = 2 Los errores aleatorios u observaciones diferentes son v.a. no correlacinadas a y b son los parmetros de la ecuacin de regresin La regresin tambin puede ser de la forma:

+ ei
de forma que sea una variable que toma valores prximos a cero.

Por tanto:

Si b>0, las dos variables aumentan o disminuyen a la vez; R.L.Positiva o Directa Si b<0, cuando una variable aumenta, la otra disminuye ; R.L. Negativa o inversa Si b = 0, no existe relacin lineal entre las variables.

b>0

b<0

b=0 El problema que se plantea es entonces el de cmo calcular las cantidades a y b a partir de un conjunto de n observaciones

de forma que se minimice el error. Las etapas en que se divide el proceso que vamos a desarrollar son de forma esquemtica, las que siguen: 1. Regresin Lineal de Dadas dos variables X, Y, sobre las que definimos:

medimos el error que se comete al aproximar Y mediante calculando la suma de las diferencias entre los valores reales y los aproximados al cuadrado (para que sean positivas y no se compensen los errores):

2. Una aproximacin de Y, se define a partir de dos cantidades a y b. Vamos a calcular aquellas que minimizan la funcin por el Mtodo de Mnimos Cuadrados

3. Posteriormente encontraremos frmulas para el clculo directo de a y b que sirvan para cualquier problema.

1. Regresin de Y sobre X :

+ ei

Para calcular la recta de regresin de Y sobre X nos basamos en la figura 3.9.

Figura : Los errores a minimizar son las cantidades

Estimacin de los Parmetros: Una vez que tenemos definido el error de aproximacin mediante la relacin , las cantidades que lo minimizan se calculan derivando con respecto a ambas e igualando a cero (procedimiento de los mnimos cuadrados:

Las ecuaciones normales. La primera se escribe como

Sustituyendo se tiene que

Lo que nos da las relaciones buscadas, determinndose los parmetros de la ecuacin de regresin:

La cantidad b se denomina coeficiente de regresin de Y sobre X. Donde:

Sxy = Yi X i - ( Y i ) ( X i ) n Sx2 = Sxx = X i - ( X i ) n


2. Regresin de X sobre Y
Las mismas conclusiones se sacan cuando intentamos hacer la regresin de X sobre Y, pero atencin!: Para calcular la recta de regresin de X sobre Y es totalmente incorrecto despejar de

Pues esto nos da la regresin de X sobre hace aproximando X por , del modo

, que no es lo que buscamos. La regresin de X sobre Y se

donde :

Con: Sy2 = Syy = Y i - ( Y i ) n pues de este modo se minimiza, en el sentido de los mnimos cuadrados, los errores entre las cantidades xi y las (figura 3.10.)

Figura: Los errores a minimizar son las cantidades

3. Supuestos del modelo Supuesto 1: E(e ) = 0 Es decir la media de lso errores a lo largo de una serie infinitamente larga de experimentos es 0 para cada valor de xi Supuesto 2: V( e ) = 2 para todo valor de x Supuesto 3: Los errores asociados a cualquiera de dos observaciones distintas son independientes. 4. Error estndar de Estimacin (Se) Medida de error tpico que expresa el grado de dispersin de los valores de Yi alrededor de la recta de regresin.
Se = CME (1)

Pero: CME = SCE n -2 (2)

Donde: SCE = Syy

(Sxy) Sxx

..(3)

Si Se = 0; indica que existe una relacin lineal perfecta entre las variables.

5. Coeficiente de Correlacin Muestral Mide el grado de asociacin lineal entre las variables x, y en la muestra. Donde:

Nos gustara tener que r=1, pues en ese caso ambas variables tendran la misma varianza, pero esto no es cierto en general. Todo lo que se puede afirmar, como sabemos, es que

Por ello:

Si el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y viceversa). Si el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y viceversa). r -1 el ajuste es bueno (Y se puede calcular de modo bastante aproximado a partir de X y viceversa). Si las variables X e Y no estn relacionadas (linealmente al menos), por tanto no tiene sentido hacer un ajuste lineal. Sin embargo no es seguro que las dos variables no posean ninguna relacin en el caso r=0, ya que si bien el ajuste lineal puede no ser procentente, tal vez otro tipo de ajuste s lo sea.

r 1

r -1

r0

r0

Figura: es lo mismo que decir que las observaciones de ambas variables estn perfectamente alineadas. El signo de r, es el mismo que el de , por tanto nos indica el crecimiento o decrecimiento de la recta.

6. Coeficiente de Determinacin ( R2 ) Sirve para determinar la bondad del ajuste de Y en funcin de X o viceversa), representan adems la proporcin de varianza explicada por la regresin lineal.

Donde:

0 < R2 < 1

Propiedades del coeficiente de Correlacin

Ejemplo 1: Se tiene una muestra ala azar de las mediciones de altura de plantas de SOYA de una parcela , con las siguientes observaciones: X: Edad en semanas X: 1 Y: 5 a) b) c) d) e) f) 2 3 4 5 6 7 Y: Altura (cn)

13 16 23 33 38 40 Determine el modelo de regresin lineal Grafique los datos nube de puntos y la ecuacin de regresin. Determine como es la relacin entre la edad y la altura de las plantas de soya Estime la altura de un planta de soya que tiene 10 13 semanas de edad Halle el error estndar de estimacin

g) Halle el coeficiente de correlacin lineal. Interprete h) Encuentre el coeficiente de determinacin. Interprete.

2. Se prepararon 9 muestras de suelo con cantidades variables de fsforo. Las plantas de maz que se cultivaron en cada suelo fueron cosechadas al trmino de 38 das y se analizaron para determinar su contenido de fsforo. X: Fsforo orgnico en suelo (ppm) ; Y: Fsforo aprovechable por la planta (ppm) X: 1 4 5 Y: 64 71 54 9 13 81 93 11 76 23 77 23 95 28 109

Realice el anlisis de regresin lineal con los tems del ejemplo 1 3. Se tiene el porcentaje de frutas atacadas por polilla en rboles de cosecha, con los siguientes datos: X: Tamao de cosecha en rbol (cientos de frutas) X: 8 6 11 22 14 17 45 18 43 24 42 19 39 23 26 38 30 ; 40 27 Y: Porcentaje de frutas infestadas

Y: 59 58 56 53 50

Realice el anlisis de regresin lineal con los tems del ejemplo 1 LABORATORIO SEMANA4 Se tiene la conductividad trmica de las frutillas a -25 C si su conductividad enW/m K a diferentes temperaturas es: T (C) -40 k(W/m K) 1.489 -34 1.450 -30 1.413 -24 1.375 -20 1.388 -15 1.299 -10 1.255 -5 1.183

1.

3. Determine la ecuacin de la recta de regresin para los datos de la tabla que sigue que representan la cantidad de -caroteno (mg) extrado de granos de maz (kg). Grafique la f u n c in tabular variacin. Maz (kg) -caroteno (mg) 0,1 0,61 0,4 0,92 0,5 0,99 0,7 1,52 0,8 1,47 0,9 2,03 bular y el ajuste. Calcule la media, desviacin estndar y el coeficiente de

Das könnte Ihnen auch gefallen