Sie sind auf Seite 1von 21

UNIVERSIDAD JOSE CARLOS MARIATEGUI

Pg. 182
CAPITULO 8


REGRESIN Y CORRELACIN MULTIPLE



OBJETI VOS
1. Construir un model o utili zando dos o ms
vari abl es expli cati vas.
2. Probar una hi ptesi s para aceptar l a vali dez de
un model o de regresi n mlti pl e
3. Reali zar pruebas de hi ptesi s i ndi vi dual es para
descartar aquell as vari abl es no si gnificati vas en
un model o de regresi n mlti pl e
4. Cal cul ar en i nterpretar medi das de asoci aci n
mlti pl es.
Al fi nali zar l a Sesi n 8, el parti ci pante ser capaz de:



5. Entender l a i mportanci a de l os resi duos en el
anli si s de regresi n.

UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 183


CONTENI DO
1. El model o de regresi n mlti pl e
2. Deducci n de l a ecuaci n de regresi n
mlti pl e.
3. La computadora y l a regresi n mlti pl e
4. Inferenci as sobre parmetros de l a
pobl aci n.
5. Tcni cas de model ado




8.1 El model o
La regresi n mlti pl e y el anli si s de correl aci n
mlti pl e consi ste en esti mar una vari abl e
dependi ente, utili zando dos o ms vari abl es
independi entes.
El model o genri co ser
,....) X , X , X (

3 2 1
f Y =
Vari abl e
dependi ente
Vari abl es
i ndependi entes




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 184


Ej empl os
1. La canti dad de paci entes de enfer medades
respiratori as, dependen de l a vari aci n del
cli ma, el ni vel nutri ci onal del paci ente y de l a
cali dad de sus vi vi endas entre otros factores.
2. La duraci n de l a hospitali zaci n depende del
ti po de afecci n, de l a gravedad de l a afecci n,
de l a presenci a de compli caci ones, del sexo, de
la edad y peso del paci ente, entre otros
factores.
3. El ni vel de col esterol de un paci ente podra ser
expli cado por l a edad, el peso, el ni vel de
hemogl obi na y el per metro abdomi nal.




Per mit e utili zar ms i nfor maci n di sponi bl e para
esti mar l a vari abl e dependi ente de una maner a
confi abl e.
La ventaja




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 185


Proceso
En el proceso de regresi n y correl aci n mlti pl e,
se debe:
1. Descri bir l a ecuaci n de regresi n mlti pl e.
2. Exami nar el error estndar de regresi n
mlti pl e de l a esti maci n.
3. Utili zar l a ecuaci n de regresi n para
det er mi nar qu tan bi en descri be l os datos
observados.




Al cance
1. Per mit e aj ustar l os datos tanto a curvas como a
rectas.
2. Se puede i ncl uir vari abl es cualitativas,
haci endo uso de l as vari abl es fi cti ci as.




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 186


La for ma si mbli ca de l a ecuaci n li neal con dos
vari abl es i ndependi entes:
donde:
: Val or esti mado correspondi ente a l a vari abl e
dependi ente
: i ntersecci n con el ej e Y.
: val ores de l as dos vari abl es i ndependi entes.
: pendi entes asoci adas con X
1
y X
2
respecti vamente
8.2 La ecuacin de regresin mltiple
2 2 1 1 0
X b X b b Y

+ + =
Y

2 1
X y X
2 1
y b b
0
b




Vi sualizaci n: se puede represent ar una
ecuaci n de regresi n mlti pl e con dos
vari abl es, como un pl ano



UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 187


El probl ema consi ste en deci dir cul de l os pl anos
posi bl es que podemos di buj ar, ser el que mej or se
aj uste
El mt odo de m ni mos cuadrados garanti za que l a
suma de l os cuadrados de l os errores es m ni mo. Las
ecuaci ones nor mal es sern



+ + =
+ + =
+ + =
2
2 2 2 1 1 2 0 2
2 1 2
2
1 1 1 0 1
2 2 1 1 0
X b X X b X b Y X
X X b X b X b Y X
X b X b nb Y
Donde b
o
, b
1
y b
2
son l os coefi ci entes de regresi n
esti mados.
El mtodo de m ni mos cuadrados




Aplicacin
14.5 68 52 190
12.5 120 80 285
14 95 61 205
13.5 75 55 210
12.5 122 94 350
11.6 70 50 200
12.1 72 61 220
13.5 80 76 250
HEMOGLOBI NA CI NTURA PESO COLESTEROL
En el si gui ente caso, i nteresa construir un model o
para deter mi nar l os ni vel es de col esterol,
conoci endo el peso (en Kg), el di metro de l a
ci ntura (en cms) y el ni vel de hemogl obi na (en grs.)




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 188


Al apli car l as ecuaci ones nor mal es a l os datos
obt enemos l os si gui entes coefi ci entes de regresi n:
b
o
= 121,704 b
1
= 2,949
b
2
= 0,276 b
3
= -7,843
Construyendo l a si gui ente ecuaci n de regresi n:
Y

=
121, 704 + 2, 949 X
1
+ 0, 276X
2
- 7,843X
3




Es una medi da de di spersi n l a
esti maci n se hace ms preci sa
confor me el grado de di spersi n
alrededor del pl ano de regresi n se
hace mas pequeo.
8.3 El error estndar de la regresin
mltiple (S
yx
)




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 189


Para medirl a se utiliza l a formul a:
1 k n
) Y

Y (
S
2
yx


=

Y
n
Y

k
: Val ores observados en l a muestra
: val ores esti mados a partir a partir de l a
ecuaci n de regresi n
: nmero de datos
: nmero de vari abl es i ndependi entes
donde:
En l os resultados de Excel se ll ama error tpi co y para el
caso de col esterol que se vi ene desarroll ando es 14,89




Interpretaci n: El 95% de l os cambi os en el ni vel
de col esterol de un paci ente puede ser explicado
por el peso, per metro abdomi nal y ni vel de
hemogl obi na.
8.4 El coeficiente de determi nacin
mltiple (r
2
)
Mi de l a tasa porcentual de l os cambi os de Y
que pueden ser expli cados por X
1
, X
2
y X
3
si multneamente.
SCtotal
n SCregresi
r
2
=
95 , 0
5 , 20837
57 , 19950
r
2
= =




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 190


Coeficiente de deter mi naci n mltiple ajustado (r
2
a
)
Hay personas que prefi eren aj ustar el r
2
de acuerdo a:
n = nmero de datos
k = nmero de vari abl es i ndependi entes
( )
1 k n
1 n
r 1 1 r
2 2
a

=
( ) 9125 , 0
1 3 8
1 8
95 , 0 1 1 r
2
a
=


=




De acuerdo al val or de r podemos afirmar que
las vari abl es peso, per metro abdomi nal y
hemogl obi na se encuentran asoci adas en for ma
directa, de una manera muy fuerte.
Coeficiente de correlaci n: r
2
r r =
Para el caso de col esterol, tenemos:
9746 , 0 95 , 0 r = =




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 191


8 Observaci ones
14.89 Error tpi co
0.92 R
2
aj ustado
0.95 Coefi ci ente de deter mi naci n R
2
0.97 Coefi ci ente de correl aci n ml ti pl e
Estadsticas de la regresin
r
S
yx
r
2
a
r
2
Los resultados de Excel nos da l a si gui ente
infor maci n:




8.5 La prueba global del model o
No se debe perder de vi sta que como
trabaj amos con una muestra, sl o tendremos
esti maci ones de l os parmetros.
El model o de l a muestra es
Para el ej empl o ser:
que esti ma al model o de l a pobl aci n:
2 2 1 1 0
X b X b b Y

+ + =
Y =
o
+
1
X
1
+
2
X
2
+
3
X3
Y

=121, 704 + 2, 949 X


1
+ 0, 276X
2
- 7,843X
3




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 192


1. For mul acin de hiptesis
Hp :
1
=
2
=
3
= 0
Ha :
1

2

3
0
Si se acepta l a hi ptesi s pl anteada, si gnifi ca
que ni nguno de l os factores (X
1
, X
2
y X
3
) son
rel evantes para explicar l os cambi os en Y.
2. Deter mi nacin del nivel de significacin
= 0,10




Se reali za a partir del Anli si s de Vari anza de l a
Regresi n y ti ene como obj eto aceptar o rechazar
la vali dez del model o.
3. Selecci n de la prueba estadstica:
s CMeresiduo
n CMeregresi
F =
4. Deter mi nacin el criterio de decisi n
El val or de F tabul ar se deter mi na con 3
y 4 grados de li bertad y /2 = 0,05
Si F
c
es > 6,59 se rechaza l a Hp
/2=0,01
(1 -
)
0,95
2
F

6,59





UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 193


20837. 5 7 Total
221. 73 886. 926 4 Resi duos
0. 003 29.99 6650. 19 19950. 57 3 Regresi n
p-val or F
cal cul ado
CMe SC GL
99 , 29
73 , 221
19 , 6650
F
c
= =
5. Clculos
Lo que se puede verifi car con l a sali da de Excel.
El p-val or es 0,003 y como es menor al val or del
ni vel de si gnifi caci n, por l o tanto se rechaza l a Hp.
Resultado en Excel




6. Concl usiones
A. Se rechaza l a hi ptesi s pl anteada, se acepta l a
alternante a un ni vel de si gnifi caci n de 0,10. La
prueba result ser si gnificati va.
B. Hay evi denci a muestral sufici ente para rechazar
la hi ptesi s pl anteada
C. Probabl ement e al menos uno de l os factores
sel ecci onados (peso, di metro de l a ci ntura y
hemogl obi na) expli can el ni vel de col esterol en
un paci ente.




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 194


Una vez que se reali za l a prueba gl obal del
model o, y se concl uye que al menos uno de
los factores ti ene efecto si gnifi cati vo sobre Y
(ni vel de col esterol), se deber a probar
cada uno de l os factores, a fi n de deter mi nar
cul o cual es factores per manecen en el
model o, y cual es son descartados.
8.6 Hiptesis sobre parmetros en la
ecuacin de regresin




(A) Hi ptesis acerca de una pendiente
individual: B
1
Pr ocedi mi ento
1) Pl anteo de hi ptesi s
Hp :
1
= 0
Ha :
1
0
2) Ni vel de si gnifi caci n
= 0,10




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 195


3) Prueba estadsti ca
donde
: pendi ente de l a regresi n aj ustada
(muestra)
: pendi ente real hi poti zada para l a pobl aci n
: error estndar del coefi ci ente de regresi n
1 b
1 1
c
S
B b
t

=
con l os supuestos
a) l a pobl aci n nor mal con ,
2
b) l a muestra fue sel ecci onada al azar
i
b
io
B
i
b
S




4) Criteri os de deci si n
Si 1,94318 t
c
-1,94318 se acepta H
p
, en caso
contrari o se rechaza
t con Gl = n - k - 1
= 8 - 3 - 1 = 6
= 0,10
-1, 94318
1, 94318




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 196


5) Cl cul os
1 b
10 1
c
S
B b
t

=
( )
=

2
2
yx
1 b
x n X
S
S
8. 06 -23. 74 8. 06 -23. 74 0. 24 -1. 37 5. 73 -7. 843 HEMOGLO
BI NA
1. 646 -1. 095 1. 646 -1. 095 0. 607 0. 558 0. 49 0. 276 CI NTURA
4. 904 0. 995 4. 904 0. 995 0. 014 4. 189 0. 70 2. 949 PESO
352. 161 -108. 752 352. 161 -108. 752 0. 216 1. 466 83. 00 121. 704 Int ercepci n
Superi or
95. 0%
Inferi or
95. 0%
Superi or
95%
Inferi or 95% Probabili dad Estad sticot Error tpi co Coefi ci ent es
0,704
Resultados en Excel




704 , 0
0 949 , 2
t
c

=
189 , 4 t
c
=
Reempl azando en l a ecuaci n:




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 197


6) Concl usi ones
A. Se rechaza l a hi ptesi s pl anteada. Se acepta
la hi ptesi s nul a.
B) Exi ste una diferenci a sufi ci entemente grande
entre el val or del esti mador b
1
= 2,949 y el val or
hi poti zado del parmetro
1
= 0 y que nos
per mite concl uir que el factor X
1
(peso del
paci ente) afecta si gnifi cati vament e a Y (ni vel
de col esterol).
C) La vari abl e X
1
(peso) ser consi derada en el
model o de regresi n mlti pl e.




(B) Hi pt esis acerca del coefici ent e de
correl aci n pobl aci onal: (rho)
1. Pl anteo de hi ptesi s
Hp : = 0
Ha : 0
2. Ni vel de si gnificaci n
= 0,05




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 198


3. Criteri o de deci si n:
Si 1,94318 t
c
-1,94318 se acepta H
p
, en
caso contrari o se rechaza
-1, 94318
1, 94318




4. Prueba estadstica
2
c
r 1
2 n r
t

=
5. Cl cul os
( )
66 , 10
9746 , 0 1
2 8 9746 , 0
t
2
c
=


=




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 199


6. Conclusi ones
A) Se rechaza l a hi ptesi s pl anteada, se
acepta l a hi ptesi s alternante a un ni vel de
si gnificaci n de 0,10. La prueba fue
si gnificati va.
B) La evi denci a empri ca per mite afirmar que
exi ste una alta correl aci n entre l os factores
peso, per metro abdomi nal y hemogl obi na.




8.7 Anlisis de residuos
Multicolinealidad: Vari as X ti enen alta
asoci aci n entre ell as.
Homoscedastici dad: Resi duos constantes
a l o l argo de toda l a data.




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 200


HOJA DE COMPROBACI N
1. La ventaj a pri nci pal de l a regresi n mul ti pl e con repecto a l a
regresi n si mpl e consi st e en que l a pri mera nos permi t e usar ms
de l a i nf ormaci n di sponi bl e para esti mar l a vari abl e dependi ente
2. Suponga que en l a ecuaci n de regresi n
ml ti pl e es el peso (en li bras) y X
2
es l a edad (en aos). Por cada
ao adi ci onal en l a edad, ent onces, se puede esperar que el peso
aumente en 24. 4 li bras
3. Aunque t eri camente posi bl e hacer cl cul os de regresi n ml ti pl e
a mano, muy pocas veces l o hacemos.
Y X X Y

, 8 . 6 6 . 5 4 . 24

2 1
+ + =




4. Suponga que usted est i nt ent ando formar un i nterval o de
confi anza para un val or de Y de una ecuaci n de regresi n
ml ti pl e. Si exi sten 20 el ementos en l a muestra y se utili zan
cuat ro vari abl es i ndependi ent es en l a regresi n, deber usar 16
grados de li bert ad cuando obt enga un val or de l a tabl a t
5. El error est ndar del coefi ci ente b
2
en una regresi n ml ti pl e se
denot a con S
2
6. Suponga que deseamos probar si l os val ores de Y en una
regresi n ml ti pl e real ment e dependen de l os val ores de X
1
. La
hi ptesi s nul a para nuest ra prueba ser B
1
= 0
7. Para det ermi nar si una regresi n es si gni fi cati va como un t odo, se
cal cul a un val or observado de F y se l e compara con un val or
obt eni do de una t abl a



UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 201


8. Si uno conoce l a suma t otal de cuadrados y l a suma de regresi n
de cuadrados para una regresi n ml ti pl e, l a suma de error de
cuadrados puede cal cul arse si empre rpi dament e
9. Ci ert os pat rones en l os si gnos de l os resi duos de un model o de
regresi n de segundo grado i ndi can que deberi amos utili zar mej or
un model o li neal
10. Las regresi ones si mpl es de Y si bre X
1
y de Y sobre X
2
muest ran
que X
1
y X
2
son ambas vari abl es expli cati vas si gnifi cati vas de Y.
Pero una regresi n ml ti pl e de Y sobre X
1
y X
2
nos di ce que ni X
1
ni X
2
son vari abl es expl i cati vas si gni fi cati vas para Y. Cl aramente,
st e es un caso de mul ti coli neali dad




11.Las vari abl es fi cti ci as son una tcni ca que puede utili zarse para
i ncorporar datos cuali tati cos en l as regresi ones ml ti pl es
12. Cuando se utili za una vari abl e fi cti ci a con val ores 0 y 1, es muy
i mportante asegurarse de que l os ceros y l os unos se usen de
acuerdo con l a prcti ca est ndar. El i nverti r l a codi fi caci n
destrui r compl et amente l os resul tados de l a regresi n ml ti pl e
13. Podemos formar un model o de regresi n de segundo grado si
mul ti pli camos por dos l os val ores observados de una vari abl e
i ndependi ente
14.El agregar vari abl es adi ci onal es a una regresi n ml ti pl e si empre
reduci r el error estndar de l a esti maci n




UNIVERSIDAD JOSE CARLOS MARIATEGUI



Pg. 202


15. Suponga que una regresi n ml ti pl e ha produci do l a si gui ent e
ecuaci n: Si X
1
, X
2
y X
3
ti enen val or
de cero, ent onces se esperar a que Y tuvi era el val or de 5. 6.
16. El anli si s de resi duos en un model o de regresi n lneal se hace
para det ermi nar el val or correct o de S
e
17. A pesar de que es posi bl e hacer i nf erenci as acerca de l a
regresi n como un todo, no es posi bl e hacer i nferenci as acerca
de l os coefi ci ent es de regresi n esti mados.
18.Si exi ste un al to ni vel de correl aci n entre vari abl es expli cati vas,
por l o general es posi bl e separar l as cont ri buci ones de t al es
vari abl es en una regresi n
. 6 . 5 9 . 3 8 . 2 6 . 5

3 2 1
X X X Y + + =




19. El error est ndar de l os dat os de l a pobl aci n se denot a con S
e
20. Si una regresi n i ncl uye a todos l os factores expl i cati vos
rel evant es, l os resi duos sern al eat ori os
21. Una rel aci n l neal entre vari abl es expli cati vas con t oda
seguri dad produci r mul ti coli neali dad en el model o de regresi n