Beruflich Dokumente
Kultur Dokumente
4.1 Introduccin al anlisis de Regresin. 4.2 Diagrama de Dispersin. 4.3 Correlacin; Medicin de la intensidad y direccin de la asociacin entre Variables. 4.4 Significacin de la R de Pearson. 4.5 Tipos de Modelo de Regresin. 4.6 Desarrollo de Modelos de Regresin Lineal Simple. 4.7 Mtodo de mnimos cuadrados y su interpretacin. 4.8 Desarrollo del Modelo de Regresin Mltiple. 4.9 Coeficiente de Determinacin Mltiple y su interpretacin. 4.10 Prediccin de la Variable Dependiente e Independiente. 4.11 Desarrollo del Modelo de Regresin Exponencial y su Interpretacin. 4.12 Desarrollo del Modelo de Regresin Logartmica y su interpretacin.
ING. NADIA PUENTES- ESTADISTICA APLICADA
DIAGRAMA DE DISPERSIN
Un diagrama de dispersin proporciona una imagen visual del tipo de relacin involucrada y sugiere el tipo de ecuacin que mejor se ajustar a los datos . La forma usual de construir un diagrama de dispersin es localizar los valores de las variables independientes X sobre el eje horizontal y los de las variable dependientes Y sobre el eje vertical; as se forma un plano bidimensional con X y Y. EJEMPLO:
Se desea estimar la relacin de los PPC (promedios de puntos de calificacin) de bachillerato y universidad . Supngase que se obtiene una muestra aleatoria de 20 estudiantes . El objetivo es ver si es posible predecir el valor de Y a partir de los valores conocidos de X. Primero se localizarn los datos en un diagrama de dispersin.
DIAGRAMA DE DISPERSIN
Sugiere claramente una relacin lineal positiva entre X y Y, esto es, el PPC de un estudiante de la universidad tiende a variar directamente de acuerdo a su PPC en bachillerato y se obtiene como resultado una lnea recta.
12
10
0 0 2 4 6 8 10 12 14
No hay correlacin
Correlacin Positiva
El coeficiente de correlacin r es la medida de la intensidad de la relacin lineal entre dos variables. El coeficiente refleja el grado de relacin o efecto que tiene el cambio de una variable sobre otra. El grado de exactitud de la prediccin depende de la cercana de la relacin entre X e Y, lo cual tambin se conoce como grado de correlacin entre las dos variables. La medida usual del grado de correlacin basndose en una muestra de n pares de observaciones es el coeficiente de correlacin, comnmente denotado r. El coeficiente de correlacin lineal r siempre tiene un valor entre -1 y +1. Un valor igual a +1, o bien a -1 indica una correlacin positiva o correlacin negativa perfecta.
ING. NADIA PUENTES- ESTADISTICA APLICADA
Si la correlacin entre X e Y es dbil, muy poco de la variabilidad de Y puede atribuirse a su relacin con X y r ser cercano a 0. Cuando r=0, indica que no existe correlacin; esto es nada de variabilidad de Y puede atribuirse a su relacin con X. Cuando r est entre 0 y 1, existe una correlacin positiva entre las dos variables X e Y. Si estas tienen una correlacin positiva, los valores de X e Y tienden a moverse en la misma direccin. El valor de la variable tiende a variar directamente con el valor de la otra. Cuando r est entre -1 y 0, existe una correlacin negativa entre X e Y. Entonces los valores de X e Y tienden a moverse en direccin opuesta; cuando uno aumenta, el otro tiende a disminuir y viceversa.
ING. NADIA PUENTES- ESTADISTICA APLICADA
SC ( y )
( y ) 2 y n
SC ( xy ) SC ( x ) SC ( y )
SC ( xy ) xy
( x)( y ) n
CONTINUACIN DE EJEMPLO 1
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 TOTAL
PPC de Bach. PPC de Univ. (X) (Y) 3 2 4 12 11 8 9 7 5 4 4 9 8 9 7 8 X2 9 4 16 144 121 64 81 49 Y2 25 16 16 81 64 81 49 64 XY 15 8 16 108 88 72 63 56
SUSTITUCIN
SC ( x)
( x) n
SC(x)= 1261 -
21,609 = 20
180.55
SC ( y )
( y ) y n
2
SC(y)= 921 -
17,161 = 20
62.95
6
5 4 8 3 12 9 8 11 7 8 10
5
6 8 4 7 6 8 5 10 7 6 5
36
25 16 64 9 144 81 64 121 49 64 100
25
36 64 16 49 36 64 25 100 49 36 25
30
30 32 32 21 72 72 40 110 49 48 50
SC ( xy ) xy
( x)( y ) n
19,257 = 20
49.15
RESULTADO
r SC ( xy ) SC ( x ) SC ( y )
r =
147
131
1,261
921
1,012
ECUACIONES DE PREDICCIN
y b0 b x 1
Lineal
y a bx cx
Cuadrtica
y a(b )
Exponencial
y a log b x
ING. NADIA PUENTES- ESTADISTICA APLICADA
Logartmica
Se condujo a un experimento para estudiar la relacin existente entre rendimiento de maz y e la cantidad de fertilizante aplicada por parcela.
80
PROBLEMA 1
70
60
50
40
30
20
10
Se condujo a un experimento para estudiar la relacin existente entre rendimiento de maz y e la cantidad de fertilizante aplicada por parcela.
Cantidad de Estudio de la fertilizante relacin entre Aplicada por Rend. rendimiento de parcela del maz maz fertilizante (X) (Y) 1 2 1.3 2.5 60 72
PROBLEMA 1
SC(x)=
X2 2 6 Y2 3,600 5,184 XY 78 180
28.08
129.96 5
= 2.09
3
4 5 TOTAL 11 .40
1.8
3.1 2.7
61
70 68 331
3
10 7 28.08
3,721
4,900 4,624 22,029
110
217 184 768.40
SC(xy)=
768.40
3,773.40 = 13.20 5
r= 13.72
= 0.88
15.62
El anlisis de regresin calcula una ecuacin que produce valores de Y para valores dado de X. Uno de los principales objetivos del anlisis de regresin es hacer predicciones. Generalmente no se predice el valor exacto de Y . Se acepta por lo general si las predicciones estn razonablemente cercanas a los valores reales. El estadstico busca una ecuacin que le permita expresar la relacin entre los datos variables. La ecuacin que se elige es aquella que se ajusta mejor al diagrama de dispersin. La relacin entre las dos variables ser una expresin algebraica que describe la relacin matemtica entre X e Y.
Si parece apropiada una relacin definida por una recta, la recta de mejor ajuste se encuentra utilizando el mtodo de mnimos cuadrados . El criterio de mnimos cuadrado implica que la recta elegida para ajustar los puntos del diagrama de dispersin sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y la recta sea lo mas pequea posible. Es la ecuacin de la recta del valor predicho de Y que corresponde a un valor particular de X.
Pendiente
SC ( xy ) b1 SC ( x)
Ordenada en el Origen
y b0 b1 x
1 b0 ( y b1 x) n
b1 =
b0 =
4.56
y 4.56 0.27 x
*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .
La regresin mltiple se define como el procedimiento estadstico en virtud del cual algunas variables se usan para predecir a otra variable.
en la prediccin del anlisis, esta variable puede ser eliminada del modelo
de regresin mltiple y as resultara un modelo mas fcil de utilizar.
*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .
*DESARROLLO DEL MODELO DE REGRESIN MLTIPLE. *COEFICIENTE DE DETERMINACIN MLTIPLE Y SU INTERPRETACIN. *PREDICCIN DE LA VARIABLE DEPENDIENTE E INDEPENDIENTE .
Ejemplos de situaciones en las que se utiliza regresin mltiple.
Salario anual
Dureza de acero Volumen de Ventas Demanda de la carne de pollo
y nb
1 0
b1 ( x1 ) b2 ( x2 )
Ecuacin
x y b ( x ) b ( x ) b ( x x )
2 1 1 1 2 1 2
y b0 b1 x1 b2 x2
Resultado DETERMINANTE
x y b ( x ) b ( x x ) b ( x )
2 2 0 2 1 1 2 2 2
EJEMPLO 2
Los datos siguientes presentan el nmero de dormitorios, el nmero de baos y los precios a que se vendieron recientemente ocho casas unifamiliares en cierta comunidad:
Nmero de dormitorios x1 3 2 4 2 3 2 5 4 Nmero de Baos x2 2 1 3 1 2 2 3 2 Precio (en dlares) y 78,800 74,300 83,800
74,200
79,700 74,900 88,400 82,900
Encuentre la ecuacin lineal que nos permita pronosticar el precio de venta promedio de una casa unifamiliar en la comunidad de referencia en trminos del nmero de baos y dormitorios.
ING. NADIA PUENTES- ESTADISTICA APLICADA
PROBLEMA TAREA
Los siguientes datos sobre las edades y los ingresos de una muestra aleatoria de cinco ejecutivos para una compaa multinacional grande y el nmero de aos que cada uno asisti a la universidad:
Edad X1 38 46 39 43 32 Aos de Universidad X2 4 0 5 2 4 Ingresos (en dlares) Y 81,700 73,300 89,500 79,800 69,900
Encuentre la ecuacin lineal que nos permita pronosticar el ingreso promedio de los ejecutivos. Avale cada una de las frmulas que nos permitirn realizar la determinarte para evaluar un de las xs.
ING. NADIA PUENTES- ESTADISTICA APLICADA
( x) n
SC ( xY )
y a b
( x)( Y) xY n
b1
Ecuacin logartmica
SC ( xY ) SC ( x )
b0 Y b1 x
Y log y b0 b1 x
ING. NADIA PUENTES- ESTADISTICA APLICADA
EJEMPLO 3
Los datos siguientes son los beneficios netos de una compaa de una compaa durante el primero de seis aos que ha operado:
1000
Ao
1 2 3 4 5 6
EJEMPLO 4
Los siguientes datos relacionados con el crecimiento de una colonia de bacterias en un medio de cultivo:
700
600
500 400
2 4 6
300
200 100
8
10
363
585
0
ING. NADIA PUENTES- ESTADISTICA APLICADA