Beruflich Dokumente
Kultur Dokumente
1
)1)11O) 1^T1
Mg. Hosnc Mutu H
2Ul4
29/04/2014 Rosmeri Mayta H. 1
/)/11 I1 (O))1/(1O) )1)11O)
1)1/
Objetivo:
Hacer un diagrama de dispersin
Calcular el coeficiente de Pearson
Calcular e interpretar el Coeficiente de Correlacin,
coeficiente de Determinacin y no determinacin.
Calcular el coeficiente de correlacin de rango.
En este capitulo se ver la relacin que existe entre dos
variables, se usaran medidas para medir el grado de
relacin como el coeficiente de determinacin y el
coeficiente de correlacin
29/04/2014 Rosmeri Mayta H. 2
Prueba de hiptesis de los coeficientes
Calcular los intervalos de confianza y de
prediccin.
Estudiar las tcnicas de anlisis de
influencia
29/04/2014 Rosmeri Mayta H. 3
/)/11 I1 (O))1/(1O)
Anlisis de correlacin.- Es el conjunto de tcnicas
estadsticas empleado para medir la intensidad de la
relacin que existe entre dos variables. Para esto,
normalmente, el primer paso es mostrar los datos en un
0lA6RAHA 0F 0lSPFRSl0t.
Permitir predecir la variable dependiente Y con base
en la variable independiente X. Grfica que representa
la relacin entre dos variables.
La variable dependiente se representa en la escala del
eje Y, y es la variable que se estima, predice o calcula.
29/04/2014 Rosmeri Mayta H. 4
Diagrama de dispersin
, ,
Min Y - Y
i
Error= -6
Lnea de
estimacin
.
.
Y
X
Y
Error= 2
2 4 6 8 10 12 14
10
8
6
4
2
Error= -6
Lnea de
estimacin
.
.
Y
5 , 2 3 X =
42 4 XY=
3 , 126
2
X =
1,576X 7,479 Y
+ =
29/04/2014 Rosmeri Mayta H. 14
De las ecuaciones normales se obtiene las
siguientes relaciones
Pendiente de la regresin lineal (b
1
): Indica la
magnitud del cambio en Y por cada unidad de cambio
de X
Constante de la regresin lineal (b
o
).- Punto donde se
intercepta con el eje Y, se calcula asi:
, ,
=
2
2
X X n
Y X XY n
b
n
X b
n
Y
a
=
29/04/2014 Rosmeri Mayta H. 15
Error estndar de estimacin.- Mide la dispersin de
los valores observados, con respecto a la lnea de
regresin. Tiene las siguientes caractersticas:
Est en las mismas unidades que la variable
dependiente.
Se basa en las desviaciones al cuadrado respecto de la
recta de regresin.
. Se calcula as:
2
2 n
Y
- Y ) (
=
yx
S
=
+ =
=
=
=
=
= = =
29/04/2014 Rosmeri Mayta H. 49
ANLISIS DE INFLUENCIAS EN
REGRESIN SIMPLE
Se estudiara 3 mtodos que miden la
influencia de ciertos datos:
1)Los mtodos de la matriz sombrero hi.
2)Los residuales eliminados de student t*i
3)El estadstico de distancia de cook Di.
29/04/2014 Rosmeri Mayta H. 50
DIAGNSTICO DE LA REGRESIN :
ANLISIS DE LA INFLUENCIA
PROBLEMA
Se supone que el decano de un colegio de administracin de empresas quera
predecir el aprovechamiento de los estudiantes ( de acuerdo a sus ndices de
calificacin) en un programa de maestra de administracin de empresas (MBA). se
selecciono una muestra aleatoria de 20 estudiantes que haban tomado por lo menos
30 crditos en el programa , con el fin de desarrollar un modelo estadstico para
predecir su ndice de calificaciones. Al desarrollar el modelo as se podran tomar en
cuenta muchas variables explicatorios. Estas incluyen variables cuantitativas como el
resultado de la prueba de aptitud para graduados en administracin (GMAT) y el
ndice de calificaciones de no graduados, as como las variables cualitativas como la
especializacin del graduado y si la persona esta o no registrada como estudiante
graduado de tiempo completo
Para fines pedaggicos se iniciar el estudio con un modelo de regresin simple en el
cual se usa una sola variable explicatorio cuantitativa para predecir los valores de
una variable dependiente. Por lo tanto se desarrollara un modelo para predecir el
ndice de calificaciones ( la variable dependiente Y) basado en el resultado GMAT (
la variable explicatorio) o independiente X). En las siguiente tabla se encuentra los
datos. Hacer un diagnostico de regresin: Anlisis de residuales
Tabla 1
29/04/2014 Rosmeri Mayta H. 51
Clculos con minitab
29/04/2014 Rosmeri Mayta H. 52
I1/)OI1(O I1 / )1)11O) /)/11
I1 1)I+1)(1/
Se aplica tres tcnicas
Segn HOAGLIN WELCH
1) Los elementos matriz sombrero, hi
Cada hi refleja la influencia de cada Xi sobre el modelo de
regresin ajustado. Si existen esos puntos de influencia quizs sea
necesario evaluar de nuevo la necesidad de mantenerlo en el
modelo. Se sugiere la siguiente regla de decisin
Si hi > 4/n , entonces Xi es un punto de influencia y se puede
considerar candidato a ser retirado del modelo.
, ,
, ,
+ =
n
x
x
x x
n
h
i
i 2
2
2
1
29/04/2014 Rosmeri Mayta H. 53
Para los datos de desempeo del
estudiante , puesto que n = 20, los
criterios deben ser destacar cualquier i
superior a 4/20= 0.2.
En la tabla se encuentra que h20 = 0.3049
Es un candidato potencial a ser removido,
pero tomaremos en cuenta otros criterios
29/04/2014 Rosmeri Mayta H. 54
Rosmery Mayta 29/04/2014
10
2) Para los residuales de Student eliminados, ti*
Si se cumple que