Sie sind auf Seite 1von 36

El modelo Logit

1) El modelo logit surge cuándo para representar


la probabilidad de que un individuo escoja la
opción Y = 1, se utiliza la función de distribución
logística
Pi = Prob(Y =1) = ez/ 1+ ez
donde Zi = B0 + B1 Xi + . . . +ui
2) Pi representa la probabilidad de que un
individuo efectué una elección determinada
conociendo Xi
2) La grafica de la función de distribución logística es:
Es una función monótona creciente ( en los extremos la
tasa de crecimiento es menor)

P
FDA

-∞ 0 ∞ X
3) Deducción del modelo Logit
Pi = 1/ (1+ e-z )
pi ( 1+e-z) = 1
Pi + Pi e-z = 1
Pi e-z = 1- Pi
e-z = 1- Pi / Pi
Hallando la inversa en ambos miembros de la ecuación:
ez = Pi / 1-Pi
Tomando logaritmos neperianos en ambos miembros
de la ecuación:
Ln ez = Ln(Pi / 1-Pi) =>Z = Ln (Pi / 1-Pi)
Li = Ln (Pi / 1-Pi)= B1 + B2 X2i + B3 X3i+ . . . + ui
Li (se denomina logit)
Interpretación del modelo logit
En el modelo logit: Ln(Pi / 1-Pi)= B0 + B1 X1i + ui
1) Ln(Pi / 1-Pi) : es el logaritmo de la razón de probabilidades
2) B0: es el valor que toma, Ln(Pi / 1-Pi) cuando X1i = 0
3) Interpretación de B1:
∂ Ln(Pi / 1-Pi)/ ∂Xi = B1
∆ Ln(Pi / 1-Pi)/ ∆Xi = B1
∆ Ln(Pi / 1-Pi)= B1 ∆Xi
Si ∆Xi =1 => ∆ Ln(Pi / 1-Pi)= B1
B1 mide el cambio en Ln(Pi / 1-Pi), ocasionado por un
cambio unitario en X1
4) Pero: ∆ Ln(Pi / 1-Pi)= ∆Pi / Pi (1 – Pi) = B1
5) => ∆P = B1 Pi (1-Pi)
La ratio P/1-P
1)Se llama ratio de probabilidades al cociente entre
la probabilidad de que ocurra un hecho, o de que
se elija la opción 1, frente a la probabilidad de
que no suceda el fenómeno, o de que se elija la
opción 0
2)Su interpretación es la “ventaja” o preferencia de
la opción 1 frente a la 0, es decir, el número de
veces que es más probable que ocurra el
fenómeno frente a que no ocurra.
3) El interés de esta medida adquiere sentido cuando se
comparan las ventajas para distintos valores de la
variable explicativa, calculándose el cociente entre
odds. Así, si
se compara la situación de la observación “i” con la de
la observación “j” (que suele ser la de referencia) El cociente
entre ODDS mide cuanto mas es mas probable que
se de la alternativa 1 en “i” que en “j”
.
4) Si el valor obtenido es mayor a la unidad, la
probabilidad de ocurra la alternativa 1 en la
observación “i” es mayor que en la observación “j”,
mientras que si el valor obtenido es inferior a uno, la
probabilidad de ocurrencia de la alternativa 1 es
superior en la observación “j” que en la “i”. Si el
valor obtenido es igual a la unidad significa que las
probabilidades en ambas observaciones son
iguales.
Ejemplo
 Para el ejemplo de la propiedad de la vivienda para datos
agrupados:
 ¿Cuánto mas es mas probable que las familias que ganan
30000 tengan casa propia que las familias que ganan 25000?
 Solución
 1) para x=25000 => Pj /1-Pj = 1.50
 2) Para: x= 30000=> pi /1-pi = 1.94
 3) Pi /1-Pi / Pj / 1-Pj = 1.94/ 1.50= 1.29
 1.29 es mas probable que tengan casa propia las familias que
ganan 30000 que las que ganan 25000
Estimación del modelo logit
I. Estimación del modelo logit con información
dada en forma agrupada
II. Estimación del modelo logit con información
dada en forma individual
Estimación del modelo logit con
información dada en forma agrupada
a. En este caso el modelo logit se estima por el método de
MCO, se agrupa la información porque viene en forma
repetida, por ello es necesario agruparlo
b. El procedimiento de estimación es el siguiente:
 Primero se calculan las frecuencias relativas(pi)
correspondientes a cada Xi
pi = ni / Ni
Ni = # de individuos con atributo Xi
ni = # de individuos con atributo Xi que tienen respuesta si
pi = frecuencia relativa
Luego se calculan los logit Li para cada grupo
 y se estima el modelo logit:
Ln(Pi / 1-Pi)= B0 + B1 X1i + ui
 Pero en este modelo ui tiene varianza
heteroscedastica por ello es necesario corregir
dicha heteroscedasticidad,
 Ui para grandes muestras tiene una distribución
normal con media 0 y varianza [ 1/ Ni Pi (1-Pi)]
es decir: µi ~ N [ 0, 1/ Ni Pi (1-Pi )]
=>Var(ui )= [ 1/ Ni Pi (1-Pi)]
Para remediar la heteroscedasticidad en el modelo logit
cuando se estima el modelo por el método MCO se
tiene que dividir el modelo original entre la raíz
cuadrada de la varianza de ui
 Como: σ2 = [ 1/ Ni Pi (1-Pi)] => σ = √ [ 1/ Ni Pi (1-Pi)]
= √1/ √ [ Ni Pi (1-Pi)] = 1 / √ [ Ni Pi (1-Pi)]

 Si : Ni Pi (1-Pi) = wi =>σ = 1/ √ wi
 Modelo logit con heteroscedasticidad :
Li = Ln(Pi / 1-Pi)= B0 + B1 X1i + ui
 Corrigiendo la heteroscedasticidad
Li/ (1/√w) = B0 / (1/√w) + B1X1i / 1/√w + ui / (1/√w)
 => el modelo logit corregido de
heteroscedasticidad es:
Li √ wi = B0 √ wi + B1 X1i√ wi + vi
Ejemplo de aplicación
 Se cuenta con la siguiente información: Xi= Ingreso familiar
en miles de $), Ni= #de familias con ingreso Xi ; ni= # de
familias con ingreso Xi que poseen casa propia
Xi Ni ni
6 40 8
8 50 12
10 60 18
13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20
X N n p 1-p p/1-p

6 40 8 0.20 0.80 0.25


8 50 13 0.24 0.76 0.32
10 60 18 0.30 0.70 0.43
13 80 28 0.35 0.65 0.54
15 100 45 0.45 0.55 0.82
20 70 36 0.51 0.49 1.04
25 65 39 0.60 0.40 1.50
30 50 33 0.66 0.34 1.94
35 40 30 0.75 o.25 3.00
40 25 20 0.80 0.20 4.00
Li =Ln(p/1-P) Wi = NP(1-P) √Wi =√NP(1-P) L i√Wi Xi √Wi

-1.3863 2.5298 -3.5071 15.1788


-1.1526 3.0199 -3.4807 24.1592
-0.8472 3.5496 -3.0072 35.4960
-0.6190 4.2661 -2.6407 55.4593
-0.2007 4.9749 -0.9985 74.6235
0.0400 4.1825 0.1673 83.6506
0.4054 3.9497 1.6012 98.7425
0.6633 3.3496 2.2218 100.4880
1.0986 2.7386 3.0086 95.8405
1.3863 2.0000 2.7726 80.0000
 El modelo estimado corregido de heteroscedasticidad:
 Li √w = -1.59474√w + 0.07862 Xi √w
1) ¿ Cual será la probabilidad de tener casa propia para una familia
cuyo ingreso familiar es de $ 10 000 ?
 Ln(Pi / 1-Pi) √w = -1.59474√w + 0.07862 Xi √w
 Dividiendo la ecuación anterior entre √w
 Ln(Pi / 1-Pi) = -1.59474 + 0.07862 Xi
 Ln(Pi / 1-Pi) = -1.59474 + 0.07862 (10)= -0.80854
 => (Pi / 1-Pi) = e-0.8085= 0.4455
 => P = 0.4455(1-P) = 0.4455- 0.4455P
 => P = 0.4455/ 1.4455 = 0.3082=> P = 30.82%
2)¿Cuál es la probabilidad de tener casa propia para una familia
cuyos ingresos son de $18000?
Ln(Pi / 1-Pi) √w = -1.59474√w + 0.07862 Xi √w
t => (-14.43619) (14.56675)
Dividiendo la ecuación entre √w
Ln(Pi / 1-Pi) = -1.59474+ 0.07862 Xi
Ln(Pi / 1-Pi) = -1.59474 + 0.07862 (18)=-0.17958
=> (Pi / 1-Pi)= -0.17958=> (Pi / 1-Pi) = e-0.17958= 0.83562
=>(Pi / 1-Pi)= 0.83562 => P = 45.52%
3)Calcular el cambio en la probabilidad de tener casa propia
por efecto de un cambio unitario en el ingreso familiar
∆ Ln(Pi / 1-Pi)/ ∆Xi = B1 => ∆ Ln(Pi / 1-Pi) = B1∆X
si ∆X = 1=> ∆ Ln(Pi / 1-Pi)= B1
=> pero: ∆ Ln(Pi / 1-Pi)= ∆ Pi / Pi (1-Pi) = B1
=> ∆Pi = B1 Pi ( 1-Pi)
Para cada nivel de ingreso el cambio en la probabilidad por efecto de un cambio
unitario en el ingreso ( por cada $1000) es diferente: así tenemos:
 Si X =6=>P=0.2454=>∆P=0.0786(0.2454)(0.7546)=0.01456
 Si X=8 =>P= 0.2757=>∆P=0.0786(0.2757)(0.7243)=0.01570
 Si x=10=>P=0.3082=>∆P=0.0786(0.3082)(0.6918)=0.01676
 Si X=13=>P=
 Si X= 15=>P=
 Si X=20=>P=
 Si X=25=>P=
 Si X=30=>P=
 Si X=35=>P=
 Si X=40=>P=
 Si X=45=>P=
 El modelo logit estimado sin corrección de
heteroscedasticidad: Li = -1.6587 + 0.0792 Xi
t=> ( -17.32) (19.11)
Estimación del modelo logit con
información individual
1) Si quisiéramos estimar el modelo logit con información
dada en forma individual por el método de MCO
tendríamos el problema siguiente:
2) Si P= 1 => ln(P/1-P) = ln(1/1-1)= ln(1/0) = ∞
Si P=0=> ln(p/1-P) = Ln(0/1-0)= ln(0/1) = ∞
En ambos casos no se podría calcular los logit Li
Debido a la consideración anterior el modelo logit con
información dada en forma individual se estima por el
método de máxima verosimilitud, además los estimadores
de MV no son heteroscedasticos.
La bondad de ajuste en el modelo
Logit
Existen varias medidas de la bondad de ajuste en
el modelo así tenemos:
a) El R2 de conteo
b) La R2 de Mc fadden
Un Test equivalente a la prueba F
1) En los modelos que no son con variable
dependiente binaria la prueba F, sirve para
probar si todos los coeficientes del modelo son
diferentes de cero, es decir la prueba F, nos
dirá, si todas las variables tomados en conjunto
explican o no a la variable dependiente.
1) A fin de probar la hipótesis nula respecto a que todos
los coeficientes de pendiente son simultáneamente
iguales a cero, el equivalente de la prueba F en el
modelo logit es el LR estadístico. El LR estadístico es
usado para probar la significancia total del modelo
2) Dada la hipótesis nula, el estadístico LR sigue la
distribución X2 con (m) Grados de libertad, donde m=
# de variables explicativas del modelo
Ejemplo de aplicación
1) Si tenemos el modelo Logit:
Ln( Pi /1-Pi) = B0 +B1 IFi + B2 HUi + B3 PPi + ui
Donde:
a) Y =(1 si la familia tiene una PC en su casa; 0: si la familia no
tiene una PC en su casa)
b) Variables explicativas:
IF: ingreso familiar
HU=(1: tienen hijos universitarios,=: si no tiene hijos
universitarios)
PP=( 1: si los padres son profesionales, 0: si los padres no
son profesionales)
Ejemplo de aplicación
El modelo Logit estimado:

Ln (P/1-P)= - 5.852594 + 0.000494 IF + 4.107827 HU + 3.170859 PP


a) Calcular la probabilidad de que una familia tenga un PC en su hogar si
IF=5000; HU= 1 y PP=1.
b) Que significa (P/1-P) en este caso
c) Calcular el R2 de conteo
d) Probar la hipótesis nula de que todos los
coeficientes de pendiente son simultáneamente
iguales a cero
e) En cuanto se incrementa la probabilidad de tener
una PC para las familias profesionales de IF = 3000
que tienen hijos universitarios en relación a los que
no tienen hijos universitarios
Solución:
a) IF= 5000, HU= 1: PP=1
Ln(p/1-P) = 3.896092 =>
=>P/1-P= e3.896092= 49.209761
=>P/1-P=49.2097
=> P= 98%
b) P/1-P = 40.209761, significa que 49.2 veces es
mas probable que se de la alternativa 1 que la
alternativa 0
c)R2 = # de predicciones correctas / # total de observaciones
d)
 H 0: B 1 = B 2= B 3 = 0
H A : B 1 ≠ B 2≠ B 3 ≠ 0
 LR= 35.39342
 Para 3 Grados de libertad X2= 0.352
 Como LR= 35.39=> X2 = 0.352 => se rechaza la H0 y se
acepta la HA , eso significa que las variables IFi, HUi y PPi
tomadas en conjunto explican las variaciones de la variable
Yi

Das könnte Ihnen auch gefallen