Sie sind auf Seite 1von 12

REGRESIN LOGSTICA

Y REGRESIN LOGSTICA CONDICIONAL


Francisco J. Daz, Ph.D.
Universidad Nacional de Colombia
Medelln

DATOS SIN PROCESAR SOBRE FACTOR DE RIESGO Y ENFERMEDAD.

Valor del
factor de riesgo
x1
x2
.
.
.
xn

Enfermedad?
S
No
.
.
.
No

DATOS AGRUPADOS SOBRE VALORES DEL FACTOR DE RIESGO Y LA


ENFERMEDAD
Valor del
factor de
riesgo

x1

Nmero
de individuos
enfermos

e1

Nmero
total

n1

Proporcin Odds
con la
enfermedad

r1

r1
1 r1

r1

log e
1 r1

r2
1 r2

r
log e 2
1 r2

rm
1 rm

r
log e m
1 rm

x2

e2

n2

r2

xm

em

nm

Logit

rm

RELACIN ENTRE EL ODDS


Y EL RIESGO (O PROBABILIDAD)
r

Odds=

1 r

Odds
r= 1 + Odds

CUANDO EL NMERO DE ESTRATOS ES GRANDE EN


RELACIN AL NMERO DE INDIVIDUOS POR ESTRATO,
EL MTODO DE MXIMA VEROSIMILITUD NO PRODUCE
RESULTADOS TILES. ESTO SE DEBE A QUE EN ESE
CASO HAY MUCHOS PARMETROS PARA ESTIMAR EN
RELACIN AL NMERO DE INDIVIDUOS.

CUANDO SE TIENEN DATOS ALTAMENTE


ESTRATIFICADOS, SE DEBE USAR REGRESIN
LOGSTICA CONDICIONAL, LA CUAL ESTIMA LOS
PARMETROS USANDO EL MTODO DE MXIMA
VEROSIMILITUD CONDICIONAL.
ESTE MTODO SLO ESTIMA LOS EFECTOS DE LAS
COVARIABLES. ES DECIR, NO ESTIMA LOS
PARMETROS CORRESPONDIENTES A LAS
COVARIABLES QUE DEFINEN LOS ESTRATOS,
AUMENTANDO LA EFICIENCIA PARA ESTIMAR LOS
EFECTOS DE LAS COVARIABLES.

El ejemplo ms extremo de datos altamente estratificados es


proporcionado por el diseo caso-control pareado uno a uno.
En este caso, si se tienen, por ejemplo, 50 parejas caso control y 4
covariables, tendramos que estimar 54 parmetros, usando slo
100 individuos.

Otro ejemplo de datos altamente estratificados: Se quiere saber el


efecto del ambiente familiar sobre el buen desempeo acadmico
(buen desempeo, y=1; falta de buen desempeo, y=0) en nios de
enseanza primaria. Se toman muestras de nios en 1000 escuelas.
De cada escuela se toma una muestra de 25 nios. Cada escuela es
un estrato que puede tener su propio efecto sobre el desempeo
acadmico.
Si se miden 4 variables de ambiente familiar, se necesitaran
estimar 1004 parmetros!!!!

El mtodo de mxima verosimilitud es ptimo slo con muestras


grandes en relacin al nmero de parmetros. Por esta razn este
mtodo no es recomendable con datos altamente estratificados. (En
el diseo pareado caso- control. El nmero de parmetros crece a
la misma velocidad con que crece el tamao muestral).

RECORDAR: Los parmetros estimados mediante regresin


logstica condicional, se interpretan de manera exactamente igual
que si se estimaran mediante regresin logstica no condicional.
La expresin regresin logstica condicional se refiere a una
forma distinta de estimar los parmetros del modelo de regresin
logstica. NO se refiere a una forma distinta de interpretar los
parmetros.

Si se miden 4 variables de ambiente familiar, se necesitaran


estimar 1004 parmetros!!!!

Das könnte Ihnen auch gefallen