Beruflich Dokumente
Kultur Dokumente
Regresión Logística
Conceptos y definiciones
Es un modelo clásico de regresión lineal simple o múltiple, pero
donde la variable dependiente es binaria o dicotómica.
X3
X5
X1
X4
X2
ÉXITO
FRACASO
En Economía
* Podemos querer distinguir entre riesgo de crédito alto y
bajo.
* Empresa rentable o no rentable.
* Empresa bajo riesgo financiero o no.
* Éxito de Ventas frente a fracaso en ventas.
* Compradores (consumidores) frente a no
compradores.
• En Veterinaria:
V. Dependiente (alcanza, no alcanza el peso al
destete)
V. Independientes: Raza, Peso al Nacer, Ganancia de
peso, Indice de Quetelet.
Odds Ratio:
P
Odds _ Ratio
Q
probabilid ad _ éxito
Odds _ Ratio
1 probabilid ad _ éxito
0,50
Odds _ Ratio
1 0,50
1 O un éxito es a un fracaso (1 a 1)
Odds _ Ratio
0,75
3 O tres éxitos por un fracaso (3 a 1)
1 0,75
Regresión logística
140
Ve)nt
Razón d(eE
Odds s
ajae
Odds( E ) e
e
OR e
e
ln OR ( OR )
p
ln bo b1 X 1 b2 X 2 ... bk X k
1 p
p
ln b0 b1 X 1 b2 X 2 b3 ( X 1 * X 2 ) b4 X 22
1 p
141
Curva Logística
Ejemplo de aplicación
Los datos que se dan a continuación pertenecen a 79 niños
afectados de enfermedad hemolítica neonatal, de los cuales 63
sobrevivieron y 16 murieron. En cada niño se registró la
concentración de hemoglobina en el cordón umbilical, X (medida en
gramos por cien mililitros) y la concentración de bilirrubina, Y
142
1 17.8 2.7
1 15.3 2.0
1 17.8 2.5
1 15.3 2.0
1 17.6 4.1
1 15.1 3.2
1 17.6 3.2
1 14.8 1.8
1 17.6 1.0
1 14.7 3.7
1 17.5 1.6
1 14.7 3.0
1 17.4 1.8
1 14.6 5.0
1 17.4 2.4
1 14.3 3.3
1 12.2 3.5
1 14.1 3.7
1 12.2 2.4
1 14.0 5.8
1 12.0 2.8
1 13.9 2.9
1 12.0 3.5
1 13.8 3.7
1 11.8 2.3
1 13.6 2.3
1 11.8 4.5
1 13.5 2.1
1 11.6 3.7
2 8.8 5.6
2 7.6 4.7
2 7.4 6.8
2 7.1 5.6
2 6.7 5.9
2 5.7 6.2
2 5.5 4.8
2 5.3 4.8
144
Predictor Wald
Variables Coefficient Std Error Coef/SE P
Constant -2.36928 2.47984 -0.96 0.3394
BILI -0.49530 0.35580 -1.39 0.1639
Hb 0.53762 0.15534 3.46 0.0005
Deviance 40.06
P-Value 0.9999
Degrees of Freedom 78
sobrevivencia 0 1 Bili 2 Hb
Modelo Saturado:
Es aquel que tiene tantos parámetros como puntos de datos
Wald=Coef/SE P
Constant -0.96 0.3394
BILI -1.39 0.1639
Hb 3.46 0.0005
Observe que hay dos puntos negros del lado de los sobrevivientes
Éstos son dos neonatos mal clasificados por la función, pero en
términos generales la función de discriminante se comporta bien.