15 Logit

Capítulo 15 Modelos de regresión de respuesta cualitativa 555
es decir, L, el logaritmo de la razón de las probabilidades, no es sólo lineal en X, sino también

(desde el punto de vista de estimación) lineal en los parámetros.18 L se llama logit, y de aquí el
nombre modelo logit para modelos como (15.5.6).
Observe estas características del modelo logit.
1. A medida que P va de 0 a 1 (es decir, a medida que Z varía de −∞ a +∞, el logit L va de
−∞ a +∞. Es decir, aunque las probabilidades (por necesidad) se encuentran entre 0 y 1, los
logit no están acotados en esa forma.
2. Aunque L es lineal en X, las probabilidades en sí mismas no lo son. Esta propiedad con-
trasta con el MLP (15.5.1), en donde las probabilidades aumentan linealmente con X.19
3. Aunque en el modelo anterior incluimos sólo una variable X, o regresora, podemos añadir
tantas regresoras como indique la teoría subyacente.
4. Si L, el logit, es positivo, significa que cuando se incrementa el valor de la(s) regresora(s),
aumentan las posibilidades de que la regresada sea igual a 1 (lo cual indica que sucederá algo de
interés). Si L es negativo, las posibilidades de que la regresada iguale a 1 disminuyen conforme
se incrementa el valor de X. Para expresarlo de otra forma, el logit se convierte en negativo y se
incrementa en gran medida conforme la razón de las probabilidades disminuye de 1 a 0; además,
se incrementa en gran medida y se vuelve positivo conforme la razón de las probabilidades au-
menta de 1 a infinito.20
5. De manera más formal, la interpretación del modelo dado en (15.5.6) es la siguiente: β2,
la pendiente, mide el cambio en L ocasionado por un cambio unitario en X, es decir, dice cómo
cambia el logaritmo de las posibilidades en favor de tener una casa propia a medida que el ingreso
cambia en una unidad, por ejemplo, $1 000. El intercepto β1 es el valor del logaritmo de las po-
sibilidades en favor de tener una casa propia si el ingreso es cero. Al igual que la mayoría de las
interpretaciones de los interceptos, esta interpretación puede no tener significado físico alguno.
6. Con un nivel determinado de ingreso, por ejemplo, X *, si de verdad deseamos estimar la
probabilidad misma de tener una casa propia, y no las posibilidades en favor de tener una casa
propia, podemos hacerlo directamente a partir de (15.5.3) una vez que dispongamos de las es-
timaciones de β1 y β2. Pero esto plantea la pregunta más importante: ¿cómo estimar β1 y β2 en
primer lugar? La respuesta está en la siguiente sección.
7. Mientras que el MLP supone que Pi está linealmente relacionado con Xi, el modelo logit
supone que el logaritmo de la razón de probabilidades está relacionado linealmente con Xi.
15.6 Estimación del modelo logit

Para fines de estimación, escribimos (15.5.6) de la siguiente manera:
Pi
L i = ln = β1 + β2 X i + u i (15.6.1)
1 − Pi
En breve analizaremos las propiedades del término de error estocástico ui.
18
Recuerde que el supuesto de linealidad de MCO no requiere que la variable X sea necesariamente lineal.
Así, podemos tener X 2, X 3, etc., como regresoras en el modelo. Para nuestro propósito, lo crucial es la linea-
lidad en los parámetros.
19
Mediante cálculo, se demuestra que dP/dX = β2P (1 − P), lo cual muestra que la tasa de cambio de la pro-
babilidad respecto de X contiene no sólo a β2, sino también al nivel de probabilidad a partir del cual se mide
el cambio (véase más al respecto en la sección 15.7). A propósito, observe que el efecto de un cambio uni-
tario en Xi sobre P es máximo cuando P = 0.5 y mínimo cuando P está cercano a 0 o a 1.
20
Esta observación la hizo David Garson.
16_Maq. Cap. 15_Gujarati.indd 555 12/19/09 11:16:24 PM

556 Parte Tres Temas de econometría
Para estimar (15.6.1), además de Xi, necesitamos los valores de la regresada, o del logit, Li.
Esto depende del tipo de datos que se analicen. Éstos se clasifican en dos categorías: 1) datos de
nivel individual, o micro, y 2) datos agrupados o duplicados.
Datos de nivel individual

Si disponemos de datos sobre familias individuales, como en la tabla 15.1, no es factible la esti-
mación de (15.6.1) por MCO, lo cual es fácil de ver. En términos de los datos proporcionados en
la tabla 15.1, Pi 1 si una familia es dueña de una casa y Pi 0 si no tiene casa propia. Pero si
colocamos estos valores directamente en el logit Li, obtenemos
1
L i = ln si una familia es dueña de una casa
0
0
L i = ln si una familia no es dueña de una casa
1
Obvio, estas expresiones no tienen sentido. Por consiguiente, si la información disponible está en
un nivel micro o individual, no podemos estimar (15.6.1) mediante la rutina de MCO estándar.
En esta situación quizá debamos recurrir al método de máxima verosimilitud (MV) para estimar
los parámetros. Aunque analizamos los rudimentos de este método en el apéndice del capítulo
4, su aplicación, en el presente contexto, se presenta en el apéndice 15A, sección 15A.1, como
consideración a los lectores que deseen aprender más sobre él.21 Programas como MICROFIT,
EViews, LIMDEP, SHAZAM, PC-GIVE, STATA y MINITAB tienen rutinas internas para esti-
mar el modelo logit en el nivel individual. Ilustraremos el método de VM más adelante en este
capítulo.
Datos agrupados o duplicados

Ahora considere los datos de la tabla 15.4. Esta tabla proporciona datos agrupados o duplicados
(observaciones repetidas) sobre diversas familias, de acuerdo con el nivel de ingreso y el número
de familias que tienen casa propia en cada nivel de ingreso. Correspondiente a cada nivel de in-
greso Xi, hay Ni familias, de las cuales ni tienen casa propia (ni ≤ Ni). Por consiguiente, si ahora
calculamos
ni
P̂i = (15.6.2)
Ni
TABLA 15.4 X
Datos hipotéticos sobre (miles de dólares) Ni ni
Xi (ingreso), Ni (número
de familias con ingreso 6 40 8
Xi) y ni (número de fa- 8 50 12
milias que tienen casa 10 60 18
propia) 13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20
21
Para un análisis de máxima verosimilitud comparativamente sencillo en el contexto del modelo logit,
véase John Aldrich y Forrest Nelson, op. cit., pp. 49-54. Véase también Alfred Demaris, Logit Modeling: Practi-
cal Applications, Sage, Newbury Park, California, 1992.

es decir, frecuencia relativa, podemos utilizarla como una estimación de la verdadera Pi corres-
pondiente a cada Xi. Si Ni es relativamente grande, P̂i será una estimación razonablemente buena
de Pi.22 Con la Pi estimada, podemos obtener el logit estimado como
P̂i
L̂ i = ln = β̂1 + β̂2 X i (15.6.3)
1 − P̂i
lo cual será una estimación relativamente buena del verdadero logit Li, si el número de observa-
ciones Ni en cada nivel Xi es razonablemente grande.
En resumen, con la información agrupada o replicada (observaciones repetidas), como la de
la tabla 15.4, podemos obtener información sobre la variable dependiente, los logit, para estimar
el modelo (15.6.1). ¿Podemos entonces aplicar MCO a (15.6.3) y estimar los parámetros en la
forma usual? La respuesta es: aún no, pues hasta el momento no hemos dicho nada sobre las pro-
piedades del término de perturbación estocástico. Puede demostrarse que si Ni es relativamente
grande, y si cada observación en una clase de ingreso dado Xi está distribuida en forma indepen-
diente como una variable binomial, entonces
1
u i ∼ N 0, (15.6.4)
Ni Pi (1 − Pi )
es decir, ui sigue una distribución normal con media cero y varianza igual a 1/[Ni Pi (1 − Pi)].23
Por consiguiente, como en el caso del MLP, el término de perturbación en el modelo logit
es heteroscedástico. Así, en lugar de MCO, debemos utilizar mínimos cuadrados ponderados
(MCP). Para fines empíricos; sin embargo, reemplazaremos la Pi desconocida por P̂i y utilizare-
mos
1
σ̂ 2 = (15.6.5)
Ni P̂i (1 − P̂i )
como estimador de σ 2.
Ahora describiremos los diversos pasos en la estimación de la regresión logit (15.6.1):
1. Para cada nivel de ingreso X, calcule la probabilidad estimada de tener una casa propia como
P̂i = n i /Ni .
2. Por cada Xi, obtenga el logit mediante24
L̂ i = ln [ P̂i /(1 − P̂i )]
3. Para resolver el problema de heteroscedasticidad, transforme (15.6.1) de la siguiente ma-

nera:25
√ √ √ √
wi L i = β1 wi + β2 wi X i + wi u i (15.6.6)
22
De la estadística elemental recuerde que la probabilidad de un evento es el límite de la frecuencia relativa
a medida que el tamaño de la muestra se hace infinitamente grande.
23
Como se demuestra en la teoría de probabilidad elemental, P̂i , la proporción de éxitos (en este caso, la
propiedad de una casa), sigue la distribución binomial con media igual a la verdadera Pi y varianza igual a
Pi (1 − Pi)/Ni ; y a medida que Ni aumenta indefinidamente, la distribución binomial se aproxima a la distri-
bución normal. Las propiedades distributivas de ui dadas en (15.6.4) se desprenden de esta teoría básica.
Hay mayores detalles en Henry Theil, “On the Relationships Involving Qualitative Variables”, American Jour-
nal of Sociology, vol. 76, julio de 1970, pp. 103-154.
24
Como P̂i = ni /Ni , Li se expresa alternativamente como L̂ i = ln ni /(Ni − ni ). A propósito, debe resaltarse que
para evitar que P̂i tome el valor de 0 o de 1, en la práctica L̂ i se mide como L̂ i = ln (ni + 12 )/(Ni − ni + 12 ) =
ln ( P̂i + 1/2Ni )/(1 − P̂i + 1/2Ni ). Se recomienda, como regla práctica, que Ni sea por lo menos 5 para cada
valor de Xi. Hay mayores detalles en D.R. Cox, Analysis of Binary Data, Methuen, Londres, 1970, p. 33.
25
Si estimamos (15.6.1) sin tener en cuenta la heteroscedasticidad, los estimadores, aunque sean insesga-
dos, no serán eficientes, como sabemos por el capítulo 11.

que escribimos como

√
L i∗ = β1 wi + β2 X i∗ + vi (15.6.7)
donde las ponderaciones wi = Ni P̂i (1 − P̂i ); L i∗ = transformada o ponderada Li; X i∗ Xi

transformada o ponderada, y vi término de error transformado. Es fácil verificar que el tér-
mino de error transformado vi es homoscedástico, sin olvidar que la varianza de error original
es σu2 = 1/[Ni Pi (1 − Pi )].
4. Estime (15.6.6) mediante MCO; recuerde que MCP es MCO aplicado sobre los datos trans-
formados. Observe que en (15.6.6) no hay término de intercepto introducido explícitamente
(¿por qué?). Por consiguiente, se tendrá que estimar (15.6.6) mediante el procedimiento de
regresión a través del origen.
5. Establezca intervalos de confianza y/o pruebas de hipótesis dentro del marco usual de MCO,
pero tenga en mente que todas las conclusiones serán válidas en estricto sentido si la muestra
es razonablemente grande (¿por qué?). Por consiguiente, en muestras pequeñas, los resultados
estimados deben interpretarse con cautela.
15.7 Modelo logit agrupado (glogit): ejemplo numérico

Para ilustrar la teoría que acabamos de analizar, utilizaremos los datos de la tabla 15.4. Como
están agrupados, el modelo logit que se basa en tales datos se llamará modelo logit agrupado, o
glogit, para abreviar. Los datos necesarios y otros cálculos pertinentes necesarios para instrumen-
tar el modelo glogit se dan en la tabla 15.5. Los resultados de la regresión con mínimos cuadrados
ponderados (15.6.7) que se basa en los datos de la tabla 15.5 son los siguientes: observe que no
hay intercepto en la ecuación (15.6.7); por consiguiente, en este caso resulta apropiado el proce-
dimiento de regresión a través del origen.
√
L̂ i∗ = −1.59474 wi + 0.07862X i∗
ee = (0.11046) (0.00539) (15.7.1)
t = (−14.43619) (14.56675) R = 0.9642
2
R2 es el coeficiente de correlación al cuadrado entre la L i∗ verdadera y la estimada. L i∗ y X i∗ son la

Li y la Xi ponderadas, como se muestra en (15.6.6). Aunque presentamos los cálculos del modelo
logit agrupado en la tabla 15.5 por razones pedagógicas, esto se efectúa fácilmente si se pulsa el
comando glogit (logit agrupado) en STATA.
Interpretación del modelo logit estimado

¿Cómo interpretamos (15.7.1)? Hay diversas formas, algunas intuitivas y otras no, a saber:
Interpretación Logit
Como lo muestra (15.7.1), el coeficiente de pendiente estimado indica que para un incremento
unitario ($1 000) en el ingreso ponderado, el logaritmo ponderado de las posibilidades en favor
de tener casa propia aumenta en alrededor de 0.08. Esta interpretación mecánica no resulta muy
atractiva.
Interpretación de las probabilidades

Recuerde que Li ln [Pi /(1 − Pi)]. Por consiguiente, al tomar el antilogaritmo del logit esti-
mado, se tiene Pi /(1 − Pi), es decir, la razón de las probabilidades. En consecuencia, al tomar el
antilog de (15.7.1), obtenemos:

16_Maq. Cap. 15_Gujarati.indd 559
TABLA 15.5 Datos para estimar el modelo logit sobre la propiedad de vivienda
√
X P̂ i P̂ i wi L̂ *i X̂ *i
Ni P̂ i (1 − P̂ i ) √
(miles de L̂ i ln √ √
dólares) Ni ni P̂ i 1 − P̂ i 1 − P̂ i
( 1 − P̂ )i wi Ni P̂ i (1 − P̂ i ) Lˆi wi X̂i wi
√
(1) (2) (3) (4) (3) ÷ (2) (5) (6) (7) (8) (9) (8) (10) (7)(9) (11) (1)(9)
6 40 8 0.20 0.80 0.25 −1.3863 6.40 2.5298 −3.5071 15.1788
8 50 12 0.24 0.76 0.32 −1.1526 9.12 3.0199 −3.4807 24.1592
10 60 18 0.30 0.70 0.43 −0.8472 12.60 3.5496 −3.0072 35.4960
13 80 28 0.35 0.65 0.54 −0.6190 18.20 4.2661 −2.6407 55.4593
15 100 45 0.45 0.55 0.82 −0.2007 24.75 4.9749 −0.9985 74.6235
20 70 36 0.51 0.49 1.04 0.0570 17.49 4.1816 0.1673 83.6506
25 65 39 0.60 0.40 1.50 0.4054 15.60 3.9497 1.6012 98.7425
Capítulo 15
30 50 33 0.66 0.34 1.94 0.6633 11.20 3.3496 2.2218 100.4880

35 40 30 0.75 0.25 3.0 1.0986 7.50 2.7386 3.0086 95.8405
40 25 20 0.80 0.20 4.0 1.3863 4.00 2.000 2.7726 80.0000
Modelos de regresión de respuesta cualitativa
559
12/19/09 11:16:26 PM
P̂i √
wi +0.07862X i∗
= e−1.59474
1 − P̂i (15.7.2)
√
−1.59474 wi 0.07862X i∗
=e ·e
Mediante una calculadora se verifica con facilidad que e0.07862 1.0817. Lo cual significa que,
para un incremento unitario en el ingreso ponderado, las posibilidades (ponderadas) en favor de
ser propietario de una casa aumentan en 1.0817, o alrededor de 8.17%. En general, si se toma
el antilogaritmo del coeficiente de la j-ésima pendiente (en caso de que haya más de una regre-
sada en el modelo), se resta uno de este valor y se multiplica el resultado por 100, se obtendrá
el cambio porcentual en las posibilidades en favor por una unidad de incremento en la j-ésima
regresora.
Por cierto, si desea llevar a cabo el análisis en términos del logit no ponderado, sólo necesita
√
dividir el L i∗ estimado entre wi . La tabla 15.6 proporciona el logit ponderado estimado y el no
ponderado para cada observación, así como algunos otros datos que analizaremos en breve.
Cálculo de probabilidades
Como el lenguaje del logit y de la razón de probabilidades puede ser extraño para algunos, siem-
pre podemos calcular la probabilidad de que una familia con cierto nivel de ingreso posea una
casa propia. Suponga que deseamos calcular esta probabilidad para X 20 (20 000). Al insertar
√
este valor en (15.7.1), obtenemos L̂ i∗ −0.09311, y al dividir lo anterior entre wi 4.1816
(véase la tabla 15.5), obtenemos L̂ i −0.02226. En consecuencia, con un nivel de ingreso de
$20 000, tenemos
P̂i
−0.02199 = ln
1 − P̂i
Por tanto,
P̂
= e−0.02199 = 0.97825
1 − P̂i
Al resolver para
e−0.02199
P̂i =
1 + e−0.02199
TABLA 15.6 Probabilidad, Cambio en la

Lstar, Xstar, Lstar
Lstar Xstar ELstar Logit P̂ probabilidad†
estimada, probabilidad
y cambio en la probabi- −3.50710 15.1788 −2.84096 −1.12299 0.24545 0.01456
lidad* −3.48070 24.15920 −2.91648 −0.96575 0.27572 0.01570
−3.48070 35.49600 −2.86988 −0.80850 0.30821 0.01676
−2.64070 55.45930 −2.44293 −0.57263 0.36063 0.01813
−0.99850 74.62350 −2.06652 −0.41538 0.39762 0.01883
0.16730 83.65060 −0.09311 −0.02226 0.49443 0.01965
1.60120 98.74250 1.46472 0.37984 0.59166 0.01899
2.22118 100.48800 2.55896 0.76396 0.68221 0.01704
3.00860 95.84050 3.16794 1.15677 0.76074 0.01431
2.77260 80.00000 3.10038 1.55019 0.82494 0.01135
* Lstar y Xstar se tomaron de la tabla 15.5. ELstar es Lstar estimado. Logit es el logit no ponderado. Probabilidad es la probabilidad esti-
mada de ser propietario de una casa. Cambio en la probabilidad es el cambio por unidad de cambio en el ingreso.
†
Calculado con base en β̂2 P̂(1 − P̂) 0.07862 P̂(1 − P̂).

FIGURA 15.3 0.020

Cambio en la probabilidad
0.019
en relación con el ingreso.
Cambio en la probabilidad
0.018
0.017
0.016
0.015
0.014
0.013
0.012
0.011
5 10 15 20 25 30 35 40 45
X, ingreso, miles de dólares
el lector puede percatarse de que la probabilidad estimada es 0.4945. Es decir, con el ingreso de
$20 000, la probabilidad de que una familia sea dueña de una casa es de casi 49%. La tabla 15.6
muestra las probabilidades así calculadas para diversos niveles de ingreso. Como se ve en dicha
tabla, la probabilidad de que una familia tenga casa propia se incrementa, pero no de manera
lineal como en el modelo MLP.
Cálculo de la tasa de cambio de la probabilidad

Como se corrobora en la tabla 15.6, la probabilidad de tener una casa propia depende del nivel
de ingreso. ¿Cómo podemos calcular la tasa de cambio de las probabilidades conforme varía el
ingreso? Como vimos en la nota 19, eso depende no sólo de la pendiente estimada del coeficiente
β2, sino también del nivel de la probabilidad con que se mida el cambio; desde luego, esto último
depende del ingreso con que se calcula la probabilidad.
Para ilustrar lo anterior, suponga que deseamos medir el cambio en la probabilidad de ser
propietario de una casa con un nivel de ingreso de $20 000. Así, de acuerdo con la nota 19, el
cambio en la probabilidad correspondiente al incremento en una unidad del ingreso para el nivel
20 (miles) es: β̂(1 − P̂) P̂ 0.07862(0.5056)(0.4944) 0.01965.
Como ejercicio, el lector demostrará que, con un nivel de ingreso de $40 000, el cambio en
la probabilidad es de 0.01135. La tabla 15.6 suministra el cambio en la probabilidad de ser pro-
pietario de una casa con diversos niveles de ingreso; dichas probabilidades también se ilustran
en la figura 15.3.
Para concluir el análisis de los modelos logit, presentamos a continuación los resultados de
la regresión basados en MCO, o regresión no ponderada, para el ejemplo de propiedad de vi-
vienda:
L̂ i = −1.6587 + 0.0792X i
ee = (0.0958) (0.0041) (15.7.3)
t = (−17.32) (19.11) r 2 = 0.9786
Se deja al lector la tarea de comparar esta regresión con la de mínimos cuadrados ponderados
presentada en la ecuación (15.7.1).
15.8 El modelo logit para datos no agrupados o individuales

A fin de establecer el contexto, considere los datos de la tabla 15.7. Sea Y 1, si la calificación
final de un estudiante en un curso intermedio de microeconomía fue A, y Y 0 si esa califica-
ción final fue B o C. Spector y Mazzeo utilizaron el GPA (promedio de puntos de calificación),

TABLA 15.7 Datos sobre el efecto del Sistema de Enseñanza Personalizada (PSI, por sus sigas en inglés) sobre las
calificaciones
Califi- Califi- Califica- Califi- Califi- Califica-

Observa- cación cación Califi- ción con Observa- cación cación Califi- ción con
ción GPA TUCE PSI cación letra ción GPA TUCE PSI cación letra
1 2.66 20 0 0 C 17 2.75 25 0 0 C
2 2.89 22 0 0 B 18 2.83 19 0 0 C
3 3.28 24 0 0 B 19 3.12 23 1 0 B
4 2.92 12 0 0 B 20 3.16 25 1 1 A
5 4.00 21 0 1 A 21 2.06 22 1 0 C
6 2.86 17 0 0 B 22 3.62 28 1 1 A
7 2.76 17 0 0 B 23 2.89 14 1 0 C
8 2.87 21 0 0 B 24 3.51 26 1 0 B
9 3.03 25 0 0 C 25 3.54 24 1 1 A
10 3.92 29 0 1 A 26 2.83 27 1 1 A
11 2.63 20 0 0 C 27 3.39 17 1 1 A
12 3.32 23 0 0 B 28 2.67 24 1 0 B
13 3.57 23 0 0 B 29 3.65 21 1 1 A
14 3.26 25 0 1 A 30 4.00 23 1 1 A
15 3.53 26 0 0 B 31 3.10 21 1 0 C
16 2.74 19 0 0 B 32 2.39 19 1 1 A
Notas: Calificación Y 1 si la calificación final fue A
Y 0 si la calificación final fue B o C
TUCE calificación en un examen presentado al comienzo del curso para evaluar los conocimientos previos de macroeconomía
PSI 1 con el nuevo método de enseñanza
0 en otro caso
GPA promedio de puntos de calificación inicial
Fuente: L. Spector y M. Mazzero, “Probit Analysis and Economic Education”, Journal of Economic Education, vol. 11, 1980, pp. 37-44.
TUCE y PSI (Sistema de Enseñanza Personalizada) de Estados Unidos como predictores de la

calificación. El modelo logit en este caso se expresa como:
Pi
L i = ln = β1 + β2 GPAi + β3 TUCEi + β4 PSIi + u i (15.8.1)
1 − Pi
Como vimos en la sección 15.6, no podemos poner simplemente Pi 1 si una familia es pro-
pietaria de una casa y cero si no lo es. En esta situación, no resultan útiles los MCO ni los MCP.
Tenemos que recurrir a procedimientos de cálculo no lineales con el método de máxima verosi-
militud. Los detalles de tal método se proporcionan en el apéndice 15A, sección 15A.1. En vista
de que el software estadístico más moderno cuenta con rutinas para estimar los modelos logit
con base en datos no agrupados, presentaremos los resultados del modelo (15.8.1), que utiliza los
datos de la tabla 15.7, y mostraremos la manera de interpretar dichos resultados, mismos que se
presentan en la tabla 15.8 en forma tabular. Obtuvimos estos resultados con EViews 6. Antes de
interpretarlos debemos tener en cuenta las siguientes observaciones generales:
1. Como empleamos el método de máxima verosimilitud, que en general es para muestras
grandes, los errores estándar estimados son asintóticos.
2. Como resultado, en vez del estadístico t para evaluar la importancia estadística de un co-
eficiente, empleamos el estadístico (normal estandarizado) Z, por lo que las inferencias se basan
en la tabla normal. Recuerde que si el tamaño de la muestra es razonablemente grande, la distri-
bución t converge a la distribución normal.
3. Como ya mencionamos, la medida convencional de la bondad de ajuste, R2, no es particu-
larmente significativa para los modelos con regresada binaria. Existen diversas medidas similares

TABLA 15.8
Resultados de la re- Variable dependiente: Calificación
gresión de la ecuación Método: Logit binario MV
(15.8.1) Convergencia lograda después de 5 iteraciones
Variable Coeficiente Error estándar Estadístico Z Probabilidad

C -13.0213 4.931 -2.6405 0.0082
GPA 2.8261 1.2629 2.2377 0.0252
TUCE 0.0951 0.1415 0.67223 0.5014
PSI 2.3786 1.0645 2.2345 0.0255
R2 McFadden = 0.3740 Estadístico RV (3 gl) = 15.40419
a R2, llamadas pseudo R2.26 EViews presenta una de esas medidas, la R2 McFadden, denotada
como R2McF, cuyo valor para el ejemplo presente es de 0.3740.27 Al igual que R2, R2McF también
varía entre 0 y 1. Otra medida de ajuste comparativamente simple es la cuenta R2, que se define
como:
número de predicciones correctas
Cuenta R2 = (15.8.2)
número total de observaciones
Como la regresada en el modelo logit toma el valor de 1 o de 0, si la probabilidad pronosticada
es mayor que 0.5, se clasifica como si fuese 1, pero si es menor que dicho valor, se considera 0.
Así, se cuenta el número de predicciones correctas y se calcula R2 como la dada en (15.8.2). En
breve ilustraremos esto.
Debe notarse que, sin embargo, en los modelos con regresada binaria, la bondad del ajuste
tiene una importancia secundaria. Lo que interesa son los signos esperados de los coeficientes de
la regresión y su importancia práctica y/o estadística.
4. A fin de probar la hipótesis nula respecto de que todos los coeficientes de pendiente son
simultáneamente iguales a cero, el equivalente de la prueba F en el modelo de regresión lineal es
el estadístico de la razón de verosimilitud (RV). Con la hipótesis nula, el estadístico RV sigue
la distribución χ2 con gl igual al número de variables explicativas, tres para el presente ejemplo.
(Nota: Excluya el término del intercepto para el cálculo de los gl.)
Ahora interpretemos los resultados de la regresión dados en (15.8.1). En esta ecuación, cada
coeficiente de pendiente es un coeficiente de pendiente parcial y mide el cambio en el logit esti-
mado correspondiente a una unidad de cambio del valor de la regresada dada (con las demás re-
gresoras constantes). Por tanto, el coeficiente del GPA igual a 2.8261 significa que, mientras las
demás variables se mantengan constantes, si el GPA se incrementa en una unidad, en promedio
el logit estimado aumenta casi 2.83 unidades, lo cual indica una relación positiva entre ambos.
Como se aprecia, todas las demás regresoras tienen un efecto positivo en el logit, a pesar de que
en términos estadísticos el efecto de TUCE no es importante. No obstante, todas las regresoras
en conjunto tienen un impacto importante en la calificación final, pues el estadístico RV es igual
a 15.40, cuyo valor p es de casi 0.0015, el cual resulta muy pequeño.
Como dijimos antes, una interpretación más significativa se da en términos de las posibili-
dades en favor, las cuales se obtienen al tomar el antilogaritmo de los diversos coeficientes de
pendiente. En consecuencia, si tomamos el antilogaritmo del coeficiente de PSI, igual a 2.3786,
26
Para un análisis comprensible, véase J. Scout Long, Regression Models for Categorical and Limited Dependent
Variables, Sage, Newbury Park, California, 1997, pp. 102-113.
27
Técnicamente, esto se define como: 1 − (FLVir/FLVr ), donde FLVir es la función logaritmo de verosimilitud
irrestricta, para la cual se incluyen en el modelo todas las regresoras, y FLVr es la función logaritmo de ve-
rosimilitud restringida para la cual sólo se incluye el intercepto en el modelo. Conceptualmente, FLVir es el
equivalente de la SCR y FLVr es el equivalente de la SCT del modelo de regresión lineal.

TABLA 15.9 Observación Real Ajustado Residuo Gráfico de residuos

Valores reales y ajusta-
dos con base en la regre- 1 0 0.02658 −0.02658
sión de la tabla 15.8 2 0 0.05950 −0.05950
3 0 0.18726 −0.18726
4 0 0.02590 −0.02590
5 1 0.56989 0.43011
6 0 0.03486 −0.03486
7 0 0.02650 −0.02650
8 0 0.05156 −0.05156
9 0 0.11113 −0.11113
10 1 0.69351 0.30649
11 0 0.02447 −0.02447
12 0 0.19000 −0.19000
13 0 0.32224 −0.32224
*14 1 0.19321 0.80679
15 0 0.36099 −0.36099
16 0 0.03018 −0.03018
17 0 0.05363 −0.05363
18 0 0.03859 −0.03859
*19 0 0.58987 −0.58987
20 1 0.66079 0.33921
21 0 0.06138 −0.06138
22 1 0.90485 0.09515
23 0 0.24177 −0.24177
*24 0 0.85209 −0.85209
25 1 0.83829 0.16171
*26 1 0.48113 0.51887
27 1 0.63542 0.36458
28 0 0.30722 −0.30722
29 1 0.84170 0.15830
30 1 0.94534 0.05466
*31 0 0.52912 −0.52912
*32 1 0.11103 0.88897
* Predicciones incorrectas.
obtendremos 10.7897 (≈ e2.3786). Esto indica que los estudiantes expuestos al nuevo método de
enseñanza son por encima de 10 veces más propensos a obtener una A que quienes no están ex-
puestos al nuevo método, en tanto no cambien los demás factores.
Suponga que deseamos calcular la probabilidad real de que un estudiante obtenga una cali-
ficación de A. Considere al estudiante 10 de la tabla 15.7. Al introducir los datos reales de este
estudiante en el modelo logit estimado, dado en la tabla 15.8, puede verificar que el valor logit
estimado para dicho estudiante es igual a 0.8178. Con la ecuación (15.5.2) puede verificar con
facilidad que la probabilidad estimada es 0.69351. Como la calificación final real del estudiante
fue A y el modelo logit asigna una probabilidad de 1 a un estudiante que obtiene una A, la proba-
bilidad estimada de 0.69351 no es exactamente 1, pero se le aproxima.
Recuerde la cuenta R2 ya definida. La tabla 15.9 proporciona los valores reales y pronostica-
dos de la regresada para el ejemplo ilustrativo. En esta tabla se observa que, de las 32 observa-
ciones, hubo 6 pronósticos incorrectos (estudiantes 14, 19, 24, 26, 31 y 32). Por tanto, el valor
de la cuenta R2 es 26/32 0.8125, en tanto que el valor R2 McFadden es 0.3740. Aunque estos
dos valores no se pueden comparar de manera directa, dan una idea de los órdenes de magnitud.
Además, no se debe sobrevalorar la importancia de la bondad de ajuste en modelos para los que
la regresada es dicótoma.

EJEMPLO 15.5 Ya estudiamos los resultados del modelo lineal de probabilidad (MLP) aplicado a los datos de
¿Quién tiene tarjeta tarjetas de débito bancarias, por lo que ahora aplicaremos el modelo logit. Los resultados son
como sigue:
de débito? Análisis
logit Variable dependiente: DÉBITO
Método: Logit binario MV (ascenso de colina cuadrático)
Muestra: 1-60
Observaciones incluidas: 60
Convergencia lograda después de 4 iteraciones
Matriz de covarianza calculada con segundas derivadas
Variable Coeficiente Error estándar Estadístico z Probabilidad

C -0.574900 0.785787 -0.731624 0.4644
Saldo 0.001248 0.000697 1.789897 0.0735
Cajero automático -0.120225 0.093984 -1.279205 0.2008
Interés -1.352086 0.680988 -1.985478 0.0471
R cuadrada McFadden 0.080471 Media de la variable dependiente 0.433333

Desviación estándar de la variable Error estándar de la regresión 0.486274
dependiente 0.499717 Suma de cuadrados residual 13.24192
Criterio de información de Akaike 1.391675 Log verosimilitud -37.75024
Criterio de Schwarz 1.531298 Log verosimilitud restr. -41.05391
Criterio de Hannan-Quinn 1.446289 Promedio log verosimilitud -0.629171
Estadístico RV 6.607325
Probabilidad (estadístico RV) 0.085525
Obs. con Dep = 0 34 Total de obs. 60

Obs. con Dep = 1 26
El signo positivo de Saldo y los signos negativos de Cajero automático e Interés se asemejan a
los del MLP, aunque no podemos establecer una comparación directa entre los dos. La inter-
pretación de los coeficientes en el modelo logit difiere de la del MLP. En este caso, por ejemplo,
si la tasa de interés aumenta un punto porcentual, el logit disminuye alrededor de 1.35, si las
demás variables permanecen constantes. Si tomamos el antilogaritmo de −1.352086, obtene-
mos casi 0.2587. Esto significa que si se paga una tasa de interés sobre los saldos de las cuentas,
es probable que, en promedio, sólo alrededor de uno de cada cuatro clientes tenga una tarjeta
de débito.
Con base en el estadístico RV estimado, observamos que, en conjunto, las tres variables son
estadísticamente significativas en el nivel aproximado de 8.5%. Si usamos el nivel convencional
de significancia de 5%, estas variables son sólo marginalmente significativas.
El valor R2 McFadden es muy bajo. Con los datos, el lector podrá averiguar el valor de la
cuenta R2.
Como ya señalamos, a diferencia del MLP, los coeficientes de pendiente no dan la tasa de
cambio de la probabilidad por cada unidad de cambio en la regresora. Es necesario calcularlos
como se muestra en la tabla 15.6. Por fortuna, esta tarea manual no es necesaria, pues hay
programas estadísticos, como el STATA, que lo hacen de forma rutinaria. En este ejemplo los
resultados son los siguientes:
Efectos marginales después de logit:
Y Pr(débito)(pronóstico)
.42512423
Variable dy/dx Error estándar z p > |z| [ 95% C. I. ] x
Saldo | .000305 .00017 1.79 0.073 -.000029 .000639 1 499.87

Interés* | -.2993972 .12919 -2.32 0.020 -.552595 -.046199 .266667
Cajero automático | -.0293822 .02297 -1.28 0.201 -.074396 .015631 10.3
* dy/dx representa el cambio discreto de la variable dicótoma de 0 a 1.

(continúa)

15 Logit

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

15 Logit

Hochgeladen von

Copyright:

Verfügbare Formate

Capítulo 15 Modelos de regresión de respuesta cualitativa 555

es decir, L, el logaritmo de la razón de las probabilidades, no es sólo lineal en X, sino también

15.6 Estimación del modelo logit

16_Maq. Cap. 15_Gujarati.indd 555 12/19/09 11:16:24 PM

Datos de nivel individual

Datos agrupados o duplicados

16_Maq. Cap. 15_Gujarati.indd 556 12/19/09 11:16:24 PM

L̂ i = ln [ P̂i /(1 − P̂i )]

3. Para resolver el problema de heteroscedasticidad, transforme (15.6.1) de la siguiente ma-

16_Maq. Cap. 15_Gujarati.indd 557 12/19/09 11:16:25 PM

que escribimos como

donde las ponderaciones wi = Ni P̂i (1 − P̂i ); L i∗ = transformada o ponderada Li; X i∗ Xi

15.7 Modelo logit agrupado (glogit): ejemplo numérico

R2 es el coeficiente de correlación al cuadrado entre la L i∗ verdadera y la estimada. L i∗ y X i∗ son la

Interpretación del modelo logit estimado

Interpretación de las probabilidades

16_Maq. Cap. 15_Gujarati.indd 558 12/19/09 11:16:26 PM

30 50 33 0.66 0.34 1.94 0.6633 11.20 3.3496 2.2218 100.4880

TABLA 15.6 Probabilidad, Cambio en la

16_Maq. Cap. 15_Gujarati.indd 560 12/19/09 11:16:27 PM

FIGURA 15.3 0.020

Cálculo de la tasa de cambio de la probabilidad

15.8 El modelo logit para datos no agrupados o individuales

16_Maq. Cap. 15_Gujarati.indd 561 12/19/09 11:16:27 PM

Califi- Califi- Califica- Califi- Califi- Califica-

TUCE y PSI (Sistema de Enseñanza Personalizada) de Estados Unidos como predictores de la

16_Maq. Cap. 15_Gujarati.indd 562 12/19/09 11:16:28 PM

Variable Coeficiente Error estándar Estadístico Z Probabilidad

R2 McFadden = 0.3740 Estadístico RV (3 gl) = 15.40419

16_Maq. Cap. 15_Gujarati.indd 563 12/19/09 11:16:29 PM

TABLA 15.9 Observación Real Ajustado Residuo Gráfico de residuos

16_Maq. Cap. 15_Gujarati.indd 564 12/19/09 11:16:29 PM

Variable Coeficiente Error estándar Estadístico z Probabilidad

R cuadrada McFadden 0.080471 Media de la variable dependiente 0.433333

Obs. con Dep = 0 34 Total de obs. 60

Variable dy/dx Error estándar z p > |z| [ 95% C. I. ] x

Saldo | .000305 .00017 1.79 0.073 -.000029 .000639 1 499.87

* dy/dx representa el cambio discreto de la variable dicótoma de 0 a 1.

16_Maq. Cap. 15_Gujarati.indd 565 12/19/09 11:16:30 PM

Das könnte Ihnen auch gefallen