Beruflich Dokumente
Kultur Dokumente
Unidad 6
Lectura 4
Anlisis de Regresin y
Correlacin
Unidad 6: Anlisis de
Regresin y Correlacin
Introduccin a la Inferencia Estadstica
Bibliografa Bsica La idea de poder predecir cierto valor de una variable a partir del
conocimiento del valor de otra que la determina o influye ha llevado a
Para cumplir con los desarrollar las tcnicas que presentamos en este mdulo.
objetivos de la Unidad 6
del programa, es necesario
profundizar en los temas
desarrollados en el En particular, la idea es detectar si existe una relacin lineal entre dos
Captulo 17 y 18 del variables, una que llamaremos dependiente que es condicionada por los
texto de Berenson &
valores de otra que denominamos independiente o explicatoria.
Levine (1996),
relacionndolo con los
comentarios, ejemplos y
recomendaciones de las
lecturas del mdulo.
Diagrama de dispersin
Captulos: 17 (Apartados
17.1, 17.2, 17.3, 17.4, 17.5,
17.6, 17.7, 17.8, 17.9), 18
(Apartados 18.1 y 18.2) Como siempre en Estadstica, un primer anlisis exploratorio grfico
posibilita un avance en el conocimiento sobre un fenmeno, aunque no
de manera concluyente.
Un grfico da la posibilidad de visualizar rpidamente la posible
existencia de una relacin entre las variables de inters.
El diagrama de dispersin, de amplia aplicacin en el caso del
anlisis de regresin, consiste en la representacin de puntos en un
sistema de ejes cartesianos, donde los valores de la variable dependiente
se indican en las ordenadas y los de la variable independiente en las
abscisas. Cada punto del grfico corresponde con las coordenadas del
mismo representado como par ordenado (x, y). El conjunto de
puntos que quedan ilustrados recibe el nombre de nube de puntos.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|2
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|3
Actividad:
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|4
Yi = 0 + 1 X i + i
Donde:
1 = la pendiente poblacional
i = error aleatorio en Y para la i-sima observacin
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|5
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|6
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|7
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|8
La ecuacin de la recta
Yi = b0 + b1 X i
Mtodo de Mnimos que mejor ajusta la nube de puntos del grfico de dispersin es la
Cuadrados que minimiza la suma de los cuadrados de los residuos.
Es el mtodo matemtico
que permite encontrar los
Esta manera de obtener los valores de b0 y b1, permite seleccionar
valores de b0 y b1 que
hacen mnimas la una de todas las posibles rectas (algunos ejemplos pueden
sumatoria del observarse en la figura siguiente) que podran ser utilizadas para
cuadrado de las describir la relacin. El mtodo de mnimos cuadrados aporta un
diferencias entre los criterio para determinar esa recta. Este criterio corresponde a
valores observados y el determinar la recta en la cual los valores reales y los valores
obtenido mediante la recta predichos tienen la mnima distancia. Como puede observarse en la
de regresin.
figura previa, la recta de mnimos cuadrados, es la que tiene las
menores distancias totales (ej: la distancia vertical indicada en la
figura). En cuanto a si las diferencias (ej) entre la recta de regresin
y los valores observados, no interesa si las diferencias son por exceso
o por defecto, por lo tanto, se trabaja con la suma de desvos
elevados al cuadrado.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|9
Ecuacin I:
Y i = n.b0 + b1 . X i
Ecuacin II:
X Y i i = b0 X i + b1 . X i2
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|10
Pendiente:
b1 . =
X Y nXY
i i
X nX
i
2 2
Ordenada:
bo . = Y b1 X
Ejercicio:
Los siguientes datos corresponden a informacin sobre pautas de
consumo de individuos adultos de una ciudad metropolitana.
La variable X indica la edad del individuo (medida en aos),
mientras que la variable Y seala la cantidad de veces que salieron a
comer fuera de su casa, en ocasiones de esparcimiento, en el ltimo
ao. Los datos consideran una muestra reducida de individuos de la
ciudad, por tratarse de un estudio piloto.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|11
60 23
62 23
61 25
55 25
53 26
60 26
63 29
53 30
52 30
48 32
49 33
53 31
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|12
b) Tabla auxiliar
X Y X2 XY
60 23 3600 1380
62 23 3844 1426
61 25 3721 1525
55 25 3025 1375
53 26 2809 1378
60 26 3600 1560
63 29 3969 1827
53 30 2809 1590
52 30 2704 1560
48 32 2304 1536
49 33 2401 1617
53 31 2809 1643
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|13
b1 . =
X Y nXY
i i
X nX
i
2 2
18417 12.27,75.55,75
b1 . =
37595 12.(55,75) 2
18417 18564,75
b1 . =
37595 37296,75
b1 . = 0,495
Tal como esperbamos de analizar el grfico de la nube de puntos, la
pendiente de la recta de regresin es negativa.
bo . = 27,75 (0,495)55,75
bo . = 55,37
Yi = 55,37 0,495. X i
Yi = 55,37 0,495.50
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|14
Cuando X=3,65, Y
predicho ser 3,19
Cuando X=4,35, Y
predicho ser 3,61
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|15
X Y Yi Yi Yi (Yi Yi ) 2
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|16
(Y i Yi ) 2
sYX = i =1
n2
61,047
sYX =
10
sYX = 2,47
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|17
n
SST = (Yi Y ) 2
i =1
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|18
n
SSE = (Yi Yi ) 2
i =1
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|19
Para ello, completemos la tabla que tenamos, con los desvos que
necesitamos y las respectivas sumas de desvos al cuadrado:
X Y Yi Yi Yi (Yi Yi ) 2 Yi Y (Yi Y ) 2
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|20
SSR = 73,195
SSE = 61,067
La suma de cuadrados total:
n
SST = (Yi Y ) 2
i =1
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|21
SST = 134,25
El coeficiente de determinacin:
SSR
R2 =
SST
73,195
R2 =
134,25
R 2 = 0,545
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|22
r = R2
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|23
El grado de relacin es
inferior.
La correlacin negativa
es menos intensa.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|24
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|25
La correlacin es algo
mayor que en los casos
anteriores.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|26
Y, finalmente, una
correlacin positiva
perfecta entre las
variables.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|27
Opcin 1:
(X i X )(Yi Y )
r= i =1
n n
(X
i =1
i X )2 . (Y
i =1
i Y )2
Opcin 2:
n
X Y i i nX .Y
r= i =1
n n
X i2 nX 2 .
i =1
Y
i =1
i
2
n.Y 2
Los supuestos en este caso, son similares a los que mencionamos para el
ANOVA.
1. Normalidad
Es necesario que los valores de Y se distribuyan de manera normal
para cada valor de X. No obstante, el anlisis de regresin es
bastante robusto en cuanto a este supuesto, en tanto la distribucin
no sea demasiado asimtrica.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|28
2. Homocedasticidad
Para cada nivel de la variable X, la variabilidad o dispersin de los
valores de Y debe ser la misma. Es muy importante el cumplimiento
de este supuesto para la aplicacin del mtodo de mnimos
cuadrados ordinarios. Este supuesto es ms frecuentemente
vulnerado en los estudios de corte transversal.
3. Independencia de error
Los residuos o errores (diferencia entre el valor observado y el
predicho) no debe estar correlacionado con el valor de X. Este
supuesto se ve afectado con frecuencia en los estudios de series de
tiempo.
4. Linealidad
La relacin entre X e Y es lineal.
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|29
Ejercicios
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|30
Actividades:
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|31
X Y
1 1
2 4
3 9
4 16
5 25
-5 25
-4 16
-3 9
-2 4
-1 1
Actividades:
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|32
X Y
1 2
2 4
3 6
4 8
5 10
6 12
7 14
8 16
9 18
10 20
Actividades:
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|33
X Y
4 5
4 6
4 4
4 5
4 6
4 7
4 4
4 3
4 5
10 15
Actividades:
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|34
1 5 6
2 10 6
3 4 3
4 7 8
5 6 6
6 5 3
7 4 5
8 4 9
9 4 10
10 3 9
Actividades
(X X ) (Y Y ) (X X )(Y Y ) = 300
2 2
X = 6, Y = 7, = 360, = 240,
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|35
Y = 10 + 0,05 X
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|36
Renta Nmero de
habitaciones
230 2
190 1
450 3
310 2
218 2
185 2
340 2
245 1
125 1
350 2
280 1
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|37
10 25
7 20
5 16
6 17
7 19
6 18
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|38
250 340
260 140
420 480
340 320
100 260
210 290
190 200
191 40
170 42
272 53
155 35
280 56
173 39
234 48
116 30
153 37
178 40
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|39
Bibliografa Lectura 4
Berenson & Levine (1996). Estadstica para administracin y
economa. Sexta Edicin. Ed. Prentice Hall Hispanoamericana. Mxico.
www.uesiglo21.edu.ar
Materia:HerramientasMatemticasV(EstadsticaII)
Profesora:Mgter.VernicaHerrero|40