Beruflich Dokumente
Kultur Dokumente
Modelo de elecci
on Cualitativa
Los modelos de elecci
on cualitativa son muy u
tiles porque pueden ser usadas a partir de
simples respuestas como un si o un no. Podemos mencionar por ejemplo la decision de una
empresa de si va a distribuir sus utilidades a sus accionistas o no, o votar por un candidato
poltico o no, o si un individuo viene a trabajar o no. Estos son distintos de los modelos
tradicionales. El objetivo de los modelos de eleccion cualitativa es encontrar la probabilidad
de que algo ocurra.Por ello los modelos de eleccion cualitativa son conocidos tambien como
modelos de probabilidad.
2.
Modelo Logit
Logit se ajusta a un modelo logit para una respuesta binaria por maxima verosimilitud ;
2.1.
x1
x2
Uso B
asico
Logit arregla la m
axima probabilidad con un modelo de variable dependiente dicotomica
entre 0 y 1. Para los datos agrupados o datos en forma binomial.
2.1.1.
Ejemplo
Vamos a estimar la probabilidad de que los coches sean extranjeros sobre la base de su
peso, y el kilometraje, para eso partimos del modelo logit:
La variable foreign toma dos valores u
nicos , 0 y 1. El valor 0 significa coche es nacional , y
1 denota un coche extranjero . El modelo que se desea es encajar
P rob(f oreign = 1) = F (B0 + B1 weight + B2 mpg)
2
donde: F (z) =
ez
1 + ez
Nos encontramos con que los coches mas pesados son menos propensos a ser extranjeros y
que los coches que producen mejor rendimiento de combustible son tambien menos probable
que sea extranjera , al menos manteniendo el peso del carro constante.
Digitando estat class prestamos atencion a los datos de valores correctamente clasificados, podemos afirmar que en general el modelo provee 79.73 por ciento de las
observaciones correctamente.
Analisis de variables:
2.1.2.
Nota t
ecnica
Stata interpreta un valor de 0 como un resultado negativo (fallo) y trata a todos los
dem
as valores (excepto desaparecidos ) como resultados positivos (exitos ). As, si la variable
dependiente toma los valores 0 y 1 , a continuacion, 0 se interpreta como el fracaso y el 1
como el exito . Si la variable dependiente toma los valores 0 , 1 , 2 y , a continuacion, 0 se
sigue interpretarse como falta , pero ambos 1 y 2 son tratados como exitos . Si se prefiere
una formulaci
on matem
atica m
as formal , cuando se tipea logit y x , Stata ajusta el modelo:
P rob(yj 6=| xj ) =
3.
eXj B
1 + eXj B
COEFICIENTE DE GINI
3.1.
Definiciones previas
CURVA DE LORENZ
Curva que relaciona el porcentaje acumulado de la poblacion, con el porcentaje acumulado del ingreso que posee esa poblacion. Esta curva permite representar graficamente la
concentraci
on del ingreso de una region en un perodo determinado.
Se calcula ordenando la informacion de los individuos en cuanto a ingreso de forma ascendente, posteriormente se establece el porcentaje del ingreso que le corresponde al X
porcentaje con ingreso m
as bajo de la poblacion. El porcentaje acumulado de la poblacion
se gr
afica en el eje horizontal y el porcentaje de ingreso acumulado para esa poblacion se
gr
afica en el eje vertical.
Si dos curvas de Lorenz (cada una para una poblacion diferente o para un periodo diferente) se cruzan, no es posible determinar cual de las dos poblaciones tiene una distribucion
menos o m
as concentrada del ingreso.
Con base en esta curva, es posible calcular el coeficiente de Gini para medir la concentraci
on del ingreso.
3.2.
COEFICIENTE DE GINI
Debemos tomar en cuenta que el coeficiente de Gini no mide el bienestar de una sociedad.
Tampoco permite, solo por s solo, determinar determinar la forma como esta concentrado
el ingreso; ni indica la diferencia en mejores condiciones de vida en un pas u otro.
El ndice de Gini es el coeficiente de Gini expresado en referencia a 100 como maximo, en
vez de como 1, y es igual al coeficiente de Gini multiplicado por 100. Una variacion de dos
centesimas del coeficiente de Gini (o dos unidades del ndice) equivale a una distribucion de
un 7 por ciento de riqueza del sector mas pobre de la poblacion (por debajo de la mediana)
al m
as rico (por encima de la mediana).
Aunque el coeficiente de Gini se utiliza sobre todo para medir la desigualdad en los
ingresos, tambien puede utilizarse para medir la desigualdad en la riqueza. Este uso requiere
que nadie disponga de una riqueza neta negativa.
3.3.
M
etodo de c
alculo
En la pr
actica una f
ormula usual para calcular el coeficiente de Gini (G) es la siguiente:
Donde:
i: indexa a las personas o grupos de personas.
n: es el n
umero de personas o estratos de ingreso
u: indica el ingreso medio
Yi: el ingreso de la persona o estrato i.
3.4.
Importancia
3.5.
Consideraciones
4.
R2 DE MCFADENN
Los modelos de regresi
on logstica se ajustaron utilizando el metodo de maxima vero-
similitud, es decir, las estimaciones de los parametros son los valores que maximizan la
probabilidad de que los datos que se han observado. R al cuadrado de McFadden se define
como:
faden 1.png
5.
en las colas de las distribuciones. En cambio de esto, es bastante potente para hipotesis
alternativas que implican bultos o agrupacion en los datos. Las hipotesis direccionales se
eval
uan con las estadsticas
1.png
D
onde F(x) y G(x) son las funciones de distribucion empricas para la muestra que se estan
comparando. El estadstico combinado es:
Los primeros cinco terminos forman la aproximacion Pa utilizado por Stata. El valor exacto
de p se calcula mediante un algoritmo de conteo.
5.1.
Sintaxis:
10
debe asumir dos valores distintos. La distribucion de varname para el primer valor de groupvar se compara con la de la segunda valor.
Ejemplos:
Ejemplo 1: Prueba de dos muestras
Decimos que tenemos datos de x que resulto de dos experimentos diferentes, etiquetados
como grupo = 1 y el grupo = 2. Nuestros datos contienen
Deseamos utilizar el test de dos muestras de Kolmogorov - Smirnov para determinar si hay
diferencias en la distribuci
on de x para estos dos grupos:
ksmirnov X, by(group) Two-sample Kolgomorov Smirnov test for equality of
distribution functions
La primera lnea pone a prueba la hipotesis de que x para el grupo 1 contiene valores
menores que para el grupo 2. La mayor diferencia entre las funciones de distribucion es de
0,5. El p - valor asint
otico aproximado de esto es 0,424, lo cual no es significativo.
La segunda lnea a prueba la hipotesis de que x para el grupo 1 contiene valores mayores
que en el grupo 2. La mayor diferencia entre las funciones de distribucion en esta direccion
es 0,1667. El p - valor asint
otico aproximado para esta peque
na diferencia es 0.909.
Por u
ltimo, el valor de p asint
otica aproximado para la prueba combinada es de 0.785. El
p- valores aproximados ksmirnov calcula se basan en la aproximacion de cinco plazo de las
distribuciones asint
oticas derivados por Smirnov (1933). Estas aproximaciones no son buenas para muestras peque
nas (n 50). Son demasiado conservador.
11