Sie sind auf Seite 1von 25

UNIDAD 4 Anlisis de Regresin Lineal Simple, no Lineal y Mltiple.

4.1 Introduccin al anlisis de Regresin. 4.2 Diagrama de Dispersin. 4.3 Correlacin; Medicin de la intensidad y direccin de la asociacin entre Variables. 4.4 Significacin de la R de Pearson. 4.5 Tipos de Modelo de Regresin. 4.6 Desarrollo de Modelos de Regresin Lineal Simple. 4.7 Mtodo de mnimos cuadrados y su interpretacin. 4.8 Desarrollo del Modelo de Regresin Mltiple. 4.9 Coeficiente de Determinacin Mltiple y su interpretacin. 4.10 Prediccin de la Variable Dependiente e Independiente. 4.11 Desarrollo del Modelo de Regresin Exponencial y su Interpretacin. 4.12 Desarrollo del Modelo de Regresin Logartmica y su interpretacin.
ING. NADIA PUENTES- ESTADISTICA APLICADA

INTRODUCCIN AL ANALISIS DE REGRESIN


Si existe una relacin entre dos variables que se estn considerando, tambin sera deseable determinar la fuerza de esa relacin o dependencia y el valor de una variable a partir del valor de la otra. Donde los mtodos empleados para manejar este tipo de problemas se conocen como tcnicas de regresin y correlacin. Dos o mas variables pueden estar involucradas en el anlisis de regresin y correlacin. Si solamente estn involucradas dos variables se dice que la tcnica es una regresin o correlacin simple. Cuando estn implicada tres o mas variables se trata se una regresin o correlacin mltiple. La tcnica de regresin se refiere al procedimiento de obtener una ecuacin con fines de estimacin o prediccin.

ING. NADIA PUENTES- ESTADISTICA APLICADA

DIAGRAMA DE DISPERSIN
Un diagrama de dispersin proporciona una imagen visual del tipo de relacin involucrada y sugiere el tipo de ecuacin que mejor se ajustar a los datos . La forma usual de construir un diagrama de dispersin es localizar los valores de las variables independientes X sobre el eje horizontal y los de las variable dependientes Y sobre el eje vertical; as se forma un plano bidimensional con X y Y. EJEMPLO:
Se desea estimar la relacin de los PPC (promedios de puntos de calificacin) de bachillerato y universidad . Supngase que se obtiene una muestra aleatoria de 20 estudiantes . El objetivo es ver si es posible predecir el valor de Y a partir de los valores conocidos de X. Primero se localizarn los datos en un diagrama de dispersin.

ING. NADIA PUENTES- ESTADISTICA APLICADA

DIAGRAMA DE DISPERSIN
Sugiere claramente una relacin lineal positiva entre X y Y, esto es, el PPC de un estudiante de la universidad tiende a variar directamente de acuerdo a su PPC en bachillerato y se obtiene como resultado una lnea recta.

PPC de PPC de Bachillerato Universidad Estudiante (X) (Y) 1 3 5 2 2 4 3 4 4 4 12 9 5 11 8 6 8 9 7 9 7 8 7 8 9 6 5 10 5 6 11 4 8 12 8 4 13 3 7 14 12 6 15 9 8 16 8 5 17 11 10 18 7 7 19 8 6 20 10 5

12

10

0 0 2 4 6 8 10 12 14

ING. NADIA PUENTES- ESTADISTICA APLICADA

CORRELACIN, MEDICIN DE LA INTENSIDAD Y DIRECCIN DE LA ASOCIACIN ENTRE VARIABLES.


El objetivo principal del anlisis de correlacin lineal es medir la intensidad de la correlacin entre dos variables. Si no existe un cambio definido en los valores de Y conforme aumentan los valores de X, se dice que no hay correlacin o que no existe relacin entre X e Y. En cambio , si al aumentar X hay una modificacin definida de los valores de Y. Si tanto los valores de X como los de Y tienden a seguir una direccin recta, existe una correlacin lineal. Si los datos forman una recta vertical u horizontal no existe correlacin, pues una variable no tiene efecto sobre la otra.

No hay correlacin

Correlacin Positiva

Correlacin Perfecta Positiva

ING. NADIA PUENTES- ESTADISTICA Correlacin Negativa APLICADA

Correlacin Perfecta Negativa

El coeficiente de correlacin r es la medida de la intensidad de la relacin lineal entre dos variables. El coeficiente refleja el grado de relacin o efecto que tiene el cambio de una variable sobre otra. El grado de exactitud de la prediccin depende de la cercana de la relacin entre X e Y, lo cual tambin se conoce como grado de correlacin entre las dos variables. La medida usual del grado de correlacin basndose en una muestra de n pares de observaciones es el coeficiente de correlacin, comnmente denotado r. El coeficiente de correlacin lineal r siempre tiene un valor entre -1 y +1. Un valor igual a +1, o bien a -1 indica una correlacin positiva o correlacin negativa perfecta.
ING. NADIA PUENTES- ESTADISTICA APLICADA

Si la correlacin entre X e Y es dbil, muy poco de la variabilidad de Y puede atribuirse a su relacin con X y r ser cercano a 0. Cuando r=0, indica que no existe correlacin; esto es nada de variabilidad de Y puede atribuirse a su relacin con X. Cuando r est entre 0 y 1, existe una correlacin positiva entre las dos variables X e Y. Si estas tienen una correlacin positiva, los valores de X e Y tienden a moverse en la misma direccin. El valor de la variable tiende a variar directamente con el valor de la otra. Cuando r est entre -1 y 0, existe una correlacin negativa entre X e Y. Entonces los valores de X e Y tienden a moverse en direccin opuesta; cuando uno aumenta, el otro tiende a disminuir y viceversa.
ING. NADIA PUENTES- ESTADISTICA APLICADA

MOMENTO PRODUCTO DE PEARSON


( x) SC ( x) x n
2 2

SC ( y )

( y ) 2 y n

SC ( xy ) SC ( x ) SC ( y )

SC ( xy ) xy

( x)( y ) n

ING. NADIA PUENTES- ESTADISTICA APLICADA

CONTINUACIN DE EJEMPLO 1
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 TOTAL
PPC de Bach. PPC de Univ. (X) (Y) 3 2 4 12 11 8 9 7 5 4 4 9 8 9 7 8 X2 9 4 16 144 121 64 81 49 Y2 25 16 16 81 64 81 49 64 XY 15 8 16 108 88 72 63 56

SUSTITUCIN
SC ( x)

( x) n

SC(x)= 1261 -

21,609 = 20

180.55

SC ( y )

( y ) y n
2

SC(y)= 921 -

17,161 = 20

62.95

6
5 4 8 3 12 9 8 11 7 8 10

5
6 8 4 7 6 8 5 10 7 6 5

36
25 16 64 9 144 81 64 121 49 64 100

25
36 64 16 49 36 64 25 100 49 36 25

30
30 32 32 21 72 72 40 110 49 48 50

SC ( xy ) xy

( x)( y ) n

SC(x y)= 1012 -

19,257 = 20

49.15

RESULTADO
r SC ( xy ) SC ( x ) SC ( y )

r =

49.15 = 0.46 106.61

147

131

1,261

921

1,012

ING. NADIA PUENTES- ESTADISTICA APLICADA

ECUACIONES DE PREDICCIN

y b0 b x 1

Lineal

y a bx cx

Cuadrtica

y a(b )

Exponencial

y a log b x
ING. NADIA PUENTES- ESTADISTICA APLICADA

Logartmica

Se condujo a un experimento para estudiar la relacin existente entre rendimiento de maz y e la cantidad de fertilizante aplicada por parcela.
80

PROBLEMA 1
70

60

50

40

30

20

10

0.5 1.0 1.5 2.0 2.5 3.0 3.5

ING. NADIA PUENTES- ESTADISTICA APLICADA

Se condujo a un experimento para estudiar la relacin existente entre rendimiento de maz y e la cantidad de fertilizante aplicada por parcela.
Cantidad de Estudio de la fertilizante relacin entre Aplicada por Rend. rendimiento de parcela del maz maz fertilizante (X) (Y) 1 2 1.3 2.5 60 72

PROBLEMA 1

SC(x)=
X2 2 6 Y2 3,600 5,184 XY 78 180

28.08

129.96 5

= 2.09

3
4 5 TOTAL 11 .40

1.8
3.1 2.7

61
70 68 331

3
10 7 28.08

3,721
4,900 4,624 22,029

110
217 184 768.40

SC(y)= 22,029.00 - 109,561.00 = 116.80 5

SC(xy)=

768.40

3,773.40 = 13.20 5

r= 13.72

= 0.88

15.62

ING. NADIA PUENTES- ESTADISTICA APLICADA

DESARROLLO DE MODELOS DE REGRESIN MTODO DE MNIMOS CUADRADOS Y SU

LINEAL SIMPLE. INTERPRETACIN.

El anlisis de regresin calcula una ecuacin que produce valores de Y para valores dado de X. Uno de los principales objetivos del anlisis de regresin es hacer predicciones. Generalmente no se predice el valor exacto de Y . Se acepta por lo general si las predicciones estn razonablemente cercanas a los valores reales. El estadstico busca una ecuacin que le permita expresar la relacin entre los datos variables. La ecuacin que se elige es aquella que se ajusta mejor al diagrama de dispersin. La relacin entre las dos variables ser una expresin algebraica que describe la relacin matemtica entre X e Y.

ING. NADIA PUENTES- ESTADISTICA APLICADA

DESARROLLO DE MODELOS DE REGRESIN MTODO DE MNIMOS CUADRADOS Y SU

LINEAL SIMPLE. INTERPRETACIN.

Si parece apropiada una relacin definida por una recta, la recta de mejor ajuste se encuentra utilizando el mtodo de mnimos cuadrados . El criterio de mnimos cuadrado implica que la recta elegida para ajustar los puntos del diagrama de dispersin sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y la recta sea lo mas pequea posible. Es la ecuacin de la recta del valor predicho de Y que corresponde a un valor particular de X.

ING. NADIA PUENTES- ESTADISTICA APLICADA

DESARROLLO DE MODELOS DE REGRESIN MTODO DE MNIMOS CUADRADOS Y SU

LINEAL SIMPLE. INTERPRETACIN.

Pendiente

SC ( xy ) b1 SC ( x)
Ordenada en el Origen

Ecuacin de la recta del mejor ajuste

y b0 b1 x

1 b0 ( y b1 x) n

ING. NADIA PUENTES- ESTADISTICA APLICADA

DESARROLLO DE MODELOS DE REGRESIN MTODO DE MNIMOS CUADRADOS Y SU


CONTINUACIN DE EJEMPLO 1

LINEAL SIMPLE. INTERPRETACIN.

b1 =

49.15 = 0.27 180.55

b0 =

4.56

y 4.56 0.27 x

ING. NADIA PUENTES- ESTADISTICA APLICADA

*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .

La regresin mltiple se define como el procedimiento estadstico en virtud del cual algunas variables se usan para predecir a otra variable.

El objetivo del anlisis de regresin mltiple consiste en dar a conocer


aquellas variables que son de utilidad en la prediccin del valor de una variable dependiente. Cuando existe una variable que no resulta de ayuda

en la prediccin del anlisis, esta variable puede ser eliminada del modelo
de regresin mltiple y as resultara un modelo mas fcil de utilizar.

ING. NADIA PUENTES- ESTADISTICA APLICADA

*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .

La principal ventaja del anlisis, es que permite utilizar un parte mayor de la

informacin que disponemos para estimar la variable dependiente.


El uso de regresin mltiple en cualquier tipo de problema, se puede pronosticar una variable en trmino de otra con mucha precisin. El anlisis de regresin mltiple se utiliza en situaciones donde se tiene mas de un factor (variables de regresin) afecten en el resultado observado (Variable de respuesta).

ING. NADIA PUENTES- ESTADISTICA APLICADA

*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .
Ejemplos de situaciones en las que se utiliza regresin mltiple.

Variables Dependientes Cosecha

Variables Independientes Cantidad de fertilizante, lluvia, tipo de suelo.

Salario anual
Dureza de acero Volumen de Ventas Demanda de la carne de pollo

Aos en la compaa, escolaridad.


Tiempo de recorrido, cantidad de carbono, ndice de enfriamiento Gasto de publicidad, precio. Precio de carne de res, de cerdo, de pollo.

ING. NADIA PUENTES- ESTADISTICA APLICADA

ECUACIONES NORMALES DE DOS VARIABLES INDEPENDIENTES.

y nb
1 0

b1 ( x1 ) b2 ( x2 )
Ecuacin

x y b ( x ) b ( x ) b ( x x )
2 1 1 1 2 1 2

y b0 b1 x1 b2 x2
Resultado DETERMINANTE

x y b ( x ) b ( x x ) b ( x )
2 2 0 2 1 1 2 2 2

ING. NADIA PUENTES- ESTADISTICA APLICADA

EJEMPLO 2
Los datos siguientes presentan el nmero de dormitorios, el nmero de baos y los precios a que se vendieron recientemente ocho casas unifamiliares en cierta comunidad:
Nmero de dormitorios x1 3 2 4 2 3 2 5 4 Nmero de Baos x2 2 1 3 1 2 2 3 2 Precio (en dlares) y 78,800 74,300 83,800

74,200
79,700 74,900 88,400 82,900

Encuentre la ecuacin lineal que nos permita pronosticar el precio de venta promedio de una casa unifamiliar en la comunidad de referencia en trminos del nmero de baos y dormitorios.
ING. NADIA PUENTES- ESTADISTICA APLICADA

PROBLEMA TAREA
Los siguientes datos sobre las edades y los ingresos de una muestra aleatoria de cinco ejecutivos para una compaa multinacional grande y el nmero de aos que cada uno asisti a la universidad:
Edad X1 38 46 39 43 32 Aos de Universidad X2 4 0 5 2 4 Ingresos (en dlares) Y 81,700 73,300 89,500 79,800 69,900

Encuentre la ecuacin lineal que nos permita pronosticar el ingreso promedio de los ejecutivos. Avale cada una de las frmulas que nos permitirn realizar la determinarte para evaluar un de las xs.
ING. NADIA PUENTES- ESTADISTICA APLICADA

DESARROLLO DEL MODELO DE REGRESIN EXPONENCIAL Y LOGARTMICA


SC ( x)

( x) n

Ecuacin curva exponencial

SC ( xY )

y a b

( x)( Y) xY n

b1

Ecuacin logartmica

SC ( xY ) SC ( x )

log y log a x(log b)

b0 Y b1 x

Y log y b0 b1 x
ING. NADIA PUENTES- ESTADISTICA APLICADA

EJEMPLO 3
Los datos siguientes son los beneficios netos de una compaa de una compaa durante el primero de seis aos que ha operado:
1000

Ao

Beneficio neto (miles de dlares)

900 800 700 600 500 400 300 200 100 0

1 2 3 4 5 6

112 149 238 354 580 867

ING. NADIA PUENTES- ESTADISTICA APLICADA

EJEMPLO 4
Los siguientes datos relacionados con el crecimiento de una colonia de bacterias en un medio de cultivo:
700

Das desde la inocula_ci n

Beneficio neto (miles de dlares)

600
500 400

2 4 6

112 148 241

300
200 100

8
10

363
585

0
ING. NADIA PUENTES- ESTADISTICA APLICADA

Das könnte Ihnen auch gefallen