Sie sind auf Seite 1von 48

LA REGRESIN

Vocablo, introducido por, Sir Francis Galton (1822-1911), en su libro Natural inheritance (1889). En este se hace referencia a la ley de la regresin universal que establece que cada rasgo fsico de un hombre tiende a ser heredado por sus hijos en un promedio menor y con tendencia a regresar a la media aritmtica del rasgo en la poblacin (regresin a la media).

Por ejemplo los padres con estatura alta, tienden a tener hijos con estatura alta, aunque tienen tendencia a acercarse (regresar) a la media de la estatura de la poblacin. Lo mismo puede decirse de los padres con estatura muy baja y la estatura de los hijos.

SE LE LLAMA REGRESIN AL MTODO EMPLEADO PARA PREDECIR (EN EL SENTIDO ESTADSTICO) EL VALOR DE UNA VARIABLE EN FUNCIN DE LOS VALORES DADOS A LA OTRA VARIABLE

DE MODO GENERAL, DIREMOS QUE EXISTE REGRESIN DE LOS VALORES DE UNA VARIABLE CON RESPECTO A LOS DE OTRA, CUANDO HAY ALGUNA LNEA, LLAMADA RECTA DE REGRESIN QUE SE AJUSTA MS O MENOS AL CONJUNTO DE PUNTOS

SI EXISTE REGRESIN, A LA ECUACIN QUE NOS DESCRIBE LA RELACIN ENTRE LAS DOS VARIABLES LA DENOMINAMOS ECUACIN DE REGRESIN.

SE LE LLAMA ECUACIN DE REGRESIN A AQUELLA QUE EXPRESA LA RELACIN LINEAL ENTRE DOS VARIABLES

EN UN UN DIAGRAMA DE DISPERSIN, AL TRAZAR LA LNEA, ESTA SER TRAZADA DE DIFERENTE FORMA POR PERSONAS DISTINTAS. EN EL SIGUIENTE DIAGRAMA DE DISPERSIN SE HAN TRAZADO VARIAS LNEAS POSIBLES AJUICIO DE VARIAS PERSONAS BUSCANDO LAS TENDENCIAS DE LOS PUNTOS EN EL EJE CARTESIANO COMO SE VE EN LA FIGURA. AQU SE VE EL CRITERIO DE VARIAS PERSONAS, ALGUNAS RECTAS PARECEN CORRECTAS, MIENTRAS QUE OTRAS NO (POR EJEMPLO LA RECTA L NO PARECE RAZONABLE). CADA RECTA SE HA TRAZADO A JUICIO DE LA PERSONA QUE LA HACE (SUBJETIVAMENTE). ESTA SUBJETIVIDAD DESAPARECE SI SE UTILIZA EL PRINCIPIO DE LOS MNIMOS CUADRADOS

VER LA FIGURA EN EL PIZARRON

EL PRINCIPIO DE LOS MNIMOS CUADRADOS PERMITE ENCONTRAR UNA ECUACIN DE REGRESIN A PARTIR DE DATOS EXPERIMENTALES. ESTA ECUACIN MINIMIZA LA SUMA DE LOS CUADRADOS DE LAS DISTANCIA VERTICALES ENTRE LOS DATOS REALES DE LA VARIABLE DEPENDIENTE (Y) Y LOS VALORES PRONOSTICADOS DE ESTA MISMA VARIABLE

ANTERIORMENTE ESTABLECIMOS QUE LA LNEA RECTA EST DEFINIDA POR LA ECUACIN

y = a + bx
LA ECUACIN DE LA REGRESIN LINEAL ES UNA LNEA RECTA, POR LO QUE LA DEFINIMOS COMO:

ECUACION DE LA REGRESION LINEAL

Y = a +bx
X : VALOR DE LA VARIABLE INDEPENDIENTE Y : ESTIMADO DE LA VARIABLE Y PARA UN VALOR DE X a : VALOR DE Y CUANDO X = 0 b : PENDIENTE DE LA RECTA DE REGRESIN a, Y LA INTERSECCIN CON EL EJE Y, ES DECIR a.

PENDIENTE DE LA RECTA DE REGRESIN b=r


DONDE b = PENDIENTE DE LA RECTA DE REGRESIN, r = COEFICIENTE DE CORRELACIN, SX = DESVIACIN ESTNDAR DE X, SY = DESVIACIN ESTNDAR DE Y

INTERSECCIN CON EL EJE Y, ES DECIR VALOR DE Y CUANDO x = 0 a = y - bx DONDE a = VALOR DE y CUANDO x = 0, y = MEDIA ARITMTICA DE LA VARIABLE DEPENDIENTE, x = MEDIA ARITMTICA DE LA VARIABLE INDEPENDIENTE

DETERMINE UNA ECUACIN LINEAL QUE EXPRESE LA RELACIN ENTRE LAS CALIFICACIONES DE MATEMTICAS Y FSICA DE LA TABLA QUE SE COPIA A EN LA SIGUIENTE DIAPOSITIVA. CUL ES LA CALIFICACIN ESPERADA EN FSICA PARA UN ALUMNO QUE OBTUVO 75 PUNTOS EN MATEMTICA.

Alumno

Matemtica

56

60

70

75

80

85

90

95

98

99

Fisica

40

60

65

70

85

50

90

93

95

95

SOLUCIN. PARA ENCONTRAR LA ECUACIN DE REGRESIN LINEAL ES NECESARIO CALCULAR PREVIAMENTE LA PENDIENTE DE LA RECTA DE REGRESIN DE MNIMOS CUADRADOS. A LA TABLA MENCIONADA YA LE HABAMOS CALCULADO EL COEFICIENTE DE CORRELACIN, LAS MEDIAS ARITMTICAS Y LAS DESVIACIONES ESTNDAR DE LA VARIABLES ASI:

X = 80.8 Y = 74.3 r = 0.82 SY = 20.12 SX = 15.38 LA PENDIENTE ES ENTONCES:


b=r

= 0.82

. .

= 1.0727

EN SEGUIDA SE ENCUENTRA EL VALOR DE a PARA EL VALOR DE b (b = PENDIENTE CALCULADA = 1.0727) a = Y bX

= 74.3 1.0727 (80.8)


= 74.3 86.67 = -12.37

LA ECUACIN DE REGRESIN ES ENTONCES: Y = a + bx SUSTITUYENDO VALORES: Y = - 12.37 + 1.0727 X

ENTONCES LA CALIFICACIN ESPERADA EN FSICA PARA UN ALUMNO QUE OBTUVO 75 PUNTOS EN MATEMTICA ES: Y = - 12.37 + 1.0727 X = - 12.37 + 1.0727 (75)

Y = -12.37 + 80.45 = 68.08

POR LO TANTO SI UN ALUMNO, OBTIENE 75 PUNTOS EN MATEMTICA, SE ESPERA QUE TENGA UN RESULTADO DE 68 PUNTOS EN FSICA.

CUL ES LA CALIFICACIN TERICA ESPERADA EN FSICA PARA UN ALUMNO QUE PUDIESE HABER OBTENIDO 68 PUNTOS EN LA TABLA DEL EJEMPLO ANTERIOR

SE SUSTITUYE EL PUNTEO 68 EN LA ECUACIN DE REGRESIN ENCONTRADA. AQU X = 68 Y = - 12.37 + 1.0727 X Y = - 12.37 + 1.0727 (68) Y = - 12.37 + 72.94 = 60.57 61 PUNTOS

LA ECUACIN DE REGRESIN PARA CADA PAR DE VARIABLES, PERMITE ENCONTRAR CUALQUIER VARIABLE DEPENDIENTE DADA LA VARIABLE INDEPENDIENTE. EN EL CASO ANTERIOR, PARA UNA CALIFICACIN PARTICULAR DE MATEMTICA, PODEMOS ENCONTRAR LA CALIFICACIN ESPERADA DE FSICA APLICANDO LA ECUACIN DE REGRESIN PARA ESTE CASO Y = - 12.37 + 1.0727 X.

EN UNA CLNICA DE NUTRICIN REGISTRAN LA EDAD Y EL PESO EN LIBRAS DE 5 NIOS COMO SE MUESTRA EN LA SIGUIENTE TABLA
Nino Edad X Peso Y

A
B C

2
3 5

33
45 68

D
E

7
8

95
99

ENCUENTRE UNA ECUACIN LINEAL (ECUACIN DE REGRESIN) QUE EXPRESE LA RELACIN ENTRE LA EDAD Y EL PESO DE LOS NIOS. CUL ES EL PESO APROXIMADO DE UN NIO DE 4 AOS Y DE UNO DE 6 AOS?

LA SECUENCIA ES LA SIGUIENTE: SE CALCULAN LAS MEDIAS Y LAS DESVIACIONES ESTNDAR SE CALCULA EL COEFICIENTE DE CORRELACIN SE CALCULA LA PENDIENTE SE CALCULA EL VALOR DE a PARA LA PENDIENTE b SE CALCULA LA ECUACIN DE REGRESIN

se calcula la ecuacin de regresin

Nio

Edad X

Peso y

Xx

Yy

(X x) (Y y)

(X x)2 (Y y)2

A B C D E

2 3 5 7 8 25

33 45 68 95 99 340

-3 -2 0 2 3

-35 -23 0 27 31

105 46 0 54 93 298

9 4 0 4 9 26

1225 529 0 729 961 3444

MEDIA DE X

X =

25 5

= 5

MEDIA DE Y
Y =

340 5

= 68

CALCULAMOS LA DESVIACIN ESTNDAR DE CADA VARIABLE:


SX =
(

= 6.5 = 2.54

SY =

= 861 = 29.34

PARA ENCONTRAR EL COEFICIENTE DE CORRELACION APLICAMOS LA FORMULA CORRESSPONDIENTE r=


()

(.)(.)

= 0.999

PARA LA ECUACIN DE REGRESIN NECESITAMOS CALCULAR LA PENDIENTE:


b=r

= 0.999

. .

= 11.539

EN SEGUIDA SE ENCUENTRA EL VALOR DE a PARA EL VALOR DE b (b = PENDIENTE CALCULADA = 11.53)

a = Y bX = 68 11.539 (5)
= 68 57.69 = 10.31

LA ECUACIN DE REGRESION ES ENTONCES: Y = a + bx , POR LO TANTO, Y = 10.31 + 11.39X ENTONCES EL PESO ESPERADA PARA UN NIO DE 4 AOS ES: Y = 10.31 + 11.39 X = 10.31 + 11.39 ( 4) Y = 10.31 + 45.56 = 55.87 EL PESO ESPERADA PARA UN NIO DE 6 AOS ES:

Y = 10.31 + 11.39 X = 10.31 + 11.39 ( 6)


Y = 10.31 + 68.34 = 78.65

LA ECUACIN DE MNIMOS CUADRADOS O RECTA DE REGRESIN ES UTIL PARA DIBUJAR UN DIAGRAMA DE DISPERSION MAS EXACTO QUE LOS QUE HEMOS DIBUJADO ANTERIORMENTE YA QUE NOS PRESENTA PUNTOS APRECIABLES DE LA RECTA

nio A B C 2 3 5

X 33 45

Y = 10.31 + 11.39x Y = 10.31 + 11.39 (2) = 10.31 + 22.78 = 33.09 =

44.98
68 67.26 =

D
E

7
8

95
90.04 99 101.43

=
=

TOMANDO DOS PUNTOS DE LA TABLA AANTERIOR (X,Y) PODEMOS CALCULAR LA RECTA DE REGRESION. POR EJEMPLO

(3, 44.98) Y (7, 90.04), PODEMOS TRAZAR LA RECTA VER EL PIZARRON

ERROR ESTNDAR DE ESTIMACIN CONSIDEREMOS DE NUEVO EL EJEMPLO QUE RELACIONA LAS CALIFICACIONES DE MATEMTICA Y FSICA. SU ECUACIN DE REGRESIN ES Y = -12.37 + 1.0727 X. SI SUSTITUIMOS EN LA ECUACIN DE REGRESIN LOS VALORES DE X ESTIMADOS ESPERADAS DE FSICA, COMO SE VE EN LA TABLA

Alumno

A B C D E F G H I J

Matemati ca X 56 60 70 75 80 85 90 95 98 99

Fisica Y 40 60 65 70 85 50 90 93 95 95

Calificacione estimadas de Fisica y = -12.37 +1.0727 x -12.37 +1.0727 (56) = 47.70 -12.37 +1.0727 (60) = 51.99 -12.37 +1.0727 (70) = 62.72 12.37 +1.0727 (75) = 68.08 -12.37 +1.0727 (80) =85.81 -12.37 +1.0727(85)= 78.81 12.37 +1.0727 (90) = 84.17 -12.37 +1.0727 (95) = 89.53 -12.37 +1.0727 (98) = 92.75 -12.37 +1.0727 (99) = 93.82

EN LA TABLA ANTERIOR PODEMOS VER QUE LOS VALORES ESTIMADOS DE Y NO SON IGUALES A LOS VALORES ORIGINALES DE Y.

ES FCIL VER QUE CUANTO MAYOR SEA EL COEFICIENTE DE CORRELACIN, MENORES SERN LAS DIFERENCIAS ENTRE LOS VALORES ORIGINALES DE Y Y SUS VALORES ESTIMADOS

SI QUEREMOS CALCULAR EL GRADO DE DISPERSIN QUE TIENEN LAS DIFERENCIAS ENTRE LAS CALIFICACIONES ORIGINALES DE FSICA Y LAS ESTIMADAS ACUDIMOS A LA MEDIDA LLAMADA ERROR ESTNDAR DE ESTIMACIN

SE LE LLAMA ERROR ESTNDAR DE ESTIMACIN A LA MEDIDA DE LA DISPERSIN DE LOS VALORES OBSERVADOS RESPECTO DE LA RECTA DE REGRESIN. SE REPRESENTA CON LA LETRA E.

EL ERROR ESTNDAR DE ESTIMACIN SE CALCULA CON LA SIGUIENTE FORMULA:

E=

CALCULAR EL ERROR ESTNDAR DE ESTIMACIN DE LA EDAD Y EL PESO EN LIBRAS DE 5 NIOS DEL EJEMPLO ANTERIOR
Nino A B C D E Edad X 2 3 5 7 8 Peso Y 33 45 68 95 99

LE AGREGAMOS A LA TABLA LAS COLUMNAS NECESARIAS PARA APLICAR LA FORMULA


Nino Edad X Peso Y y = 10.31 + 11.39 x Y y (y y)2

A B C D E

2 3 5 7 8

33 45 68 95 99

33.09 44.48 67.26 90.04 101.43

-0.09 0.2 0.74 4.96 -2.43

0.008 0.04 0.54 24.60 5.90 31.08

PARA ESTE CASO, LA ECUACIN DE REGRESIN ES Y = 10.31 + 11.39 X, QUE NOS PERMITE CALCULAR LA COLUMNA Y. PARA CSALCULAR EL ERROR ESTNDAR DE ESTIMACIN APLICAMOS LA FORMULA XX E= E=
2 2 31.08 52

31.08 3

= 10.36 = 3.22

CALCULAR EL ERROR ESTNDAR DE ESTIMACIN DE LAS CALIFICACIONES DE MATEMTICA Y SU CORRELACION CON LAS CALIFICACIONES DE FISICA DEL EJEMPLO XX.

Alumno

Matematic a X

Fisica Y

Y y

(y y)2

A B C D E F G H I J

56 60 70 75 80 85 90 95 98 99

40 60 65 70 85 50 90 93 95 95

47.70 51.99 62.72 68.08 85.81 78.81 84.17 89.53 92.75 93.82

-7.7 8.01 2.28 1.92 -0.81 -28.81 5.83 3.47 2.25 1.18

59.29 64.16 5.19 3.68 0.65 830.01 33.98 12.04 5.06 1.39

1015.44

APLICAMOS A LA TABLA ANTERIOR LAS COLUMNAS NECESARIAS PARA CALCULAR EL ERROR ESTNDAR DE ESTIMACIN. EL CUAL RESOLVEMOS CON LA FORMULA
2 2

E=

1015.44 2 102

E=

1015.44 8

= 126.93 = 11.26

Das könnte Ihnen auch gefallen