Beruflich Dokumente
Kultur Dokumente
1.1. CONTEXTO
1.1. PREBLEMATICA
1.2. JUSTIFICACION
1.3. OBJETIVOS
1.4. HIPÓTESIS
1.3. MODELOS
Variables a estudiar
VARIBLE DEPENDIENTE
TIPO DE
VARIABLE NOMBRE MEDICION
VARIABLE
Probabilidad de Dicotómica,
Anemia 𝑎𝑛𝑒𝑚𝑖𝑎
tener anemia (y=1) cualitativa ordinal.
Fuente: elaboración propia
VARIBLES INDEPENDIENTES
TIPO DE
VARIABLE NOMBRE MEDICION
VARIABLE
Cuantitativa,
Peso 𝑝𝑒𝑠𝑜 kilogramos (1 dec.)
continua.
Centímetros (1 Cuantitativa,
Talla 𝑡𝑎𝑙𝑙𝑎
dec.) continua.
Con educación,
Educación de la Dicotómica,
𝐸𝐷𝑈𝐶 (x=1)
madre cualitativa ordinal.
sin educación (x=0)
Nivel de Cuantitativa,
𝐻ℎ𝑒𝑚𝑜𝑔𝑙𝑜 (g/dl - 1 decimal)
hemoglobina continua.
Hombre (x=1), Dicotómica,
Genero 𝑔𝑒𝑛𝑒𝑟𝑜
mujer (x=0) cualitativa nominal.
Fuente: elaboración propia
a) Modelo económico
Donde:
b) Modelo econométrico
Donde:
𝛽0: Estimador que evalúa la probabilidad de tener anemia cuando las demás variables
son nulas o cero.
𝛽1: es el estimador que evalúa el efecto de la influencia del peso sobre la probabilidad
de tener anemia
𝛽2: es el estimador que evalúa el efecto de la influencia de la talla sobre la probabilidad
de tener anemia
𝛽3: es el estimador que evalúa el efecto de la influencia de la educación de la madre y la
probabilidad de tener anemia
𝛽4 : es el estimador que evalúa el efecto de la influencia del nivel de hemoglobina sobre
la probabilidad de tener anemia
𝛽5 es el estimador que evalúa el efecto de la influencia del genero sobre la probabilidad
de tener anemia
𝜀𝑡 : es la perturbación estocástica.
1.4. METODOLOGIA
1.7.1. POBLACIÓN
1.7.2. MUESTRA
Las muestras del estudio provienen de instituciones ENDES que brindan información
con respecto a nuestro tema de estudio por ende tomamos como muestra a la anemia,
peso, talla, educación de la madre, el nivel de hemoglobina y el género de niños
menores de 5 periodo 2017, siendo un total de 22483 niños, lo cuales hubieron
encuestas pérdidas de 1532, obteniendo así un total 20951 datos.
1.7.3. MÉTODOS
El Método Deductivo
El Método inductivo
1
ESTEBAN, Efraín (2009). Metodología de la investigación económica y social, p. 226
Consiste en el estudio de la realidad de lo particular a lo general; es decir que a partir
de la investigación de hechos o fenómenos particulares avanza hacia las
generalizaciones.
Maxima verisimilitud
Para el análisis deben cumplirse para llevar a cabo una regresión de logit-probit
de las variables y cumplir con los supuestos:
1. Prueba de Pearson
2. Prueba de Hosmer-Lemeshov
3. Estadística de clasificación
4. La Curva Roc
1.7.4. TECNICAS
Instrumentos:
1. Guía de análisis
2. La medición estadística.
4. Sofware stata 13
5. Prueba de sustento el Chi^2.
CAPITULO III VERIFICACION DE LA HIPOTESIS
GENERO
. tab genero
Cuadro n°
NIVEL DE ANEMIA
. tab Nanemia
nivel de
anemia Freq. Percent Cum.
Cuadro n°
Cuadro n°
nivel
educativo
mas alto de
la madre Freq. Percent Cum.
Cuadro n°
MODELO LOGISTIC
Robust
Anemia Coef. Std. Err. z P>|z| [95% Conf. Interval]
Interpretación:
β1 =si toda las demás variables se mantienen constantes, un incremento de una unidad del
peso hará disminuir las posibilidades de tener anemia en 0.0164%.
β2 =si toda las demás variables se mantienen constantes, un incremento de una unidad de la
de la talla hará disminuir la posibilidad de tener anemia en 0.00053%
β3 =el impacto que tiene la educación de la madre en la posibilidades de que su hijo tenga
anemia, indica la disminución de la posibilidades de que su hijo tenga anemia es de
0.012%
β4 =si toda las demás variables se mantienen constantes, un incremento de una unidad de la
del nivel de hemoglobina hará disminuir la posibilidad de tener anemia en -0.098%
Cuadro n°
Robust
Anemia Coef. Std. Err. z P>|z| [95% Conf. Interval]
MODELO PROBIT:
Cuadro n° 4
EFECTOS MARGINALES
Robust
Anemia dF/dx Std. Err. z P>|z| x-bar [ 95% C.I. ]
obs. P .3667128
pred. P .3287189 (at x-bar)
Interpretación:
β1 =por un aumento de una unidad del peso, la probabilidad de tener anemia se reduce en
0.00365%.
β2 =por un incremento de una unidad de la de la talla, la probabilidad de tener anemia se
reduce en -0.0000877%.
β3 =el impacto que tiene la educación de la madre en la probabilidad de que su hijo tenga
anemia, indica la disminución de la probabilidad de que su hijo tenga anemia es de -
0.00127%
β5 = el impacto que tiene la el género en la probabilidad de que su hijo(a) tenga anemia, indica
la probabilidad de que su hijo(a) tenga anemia es de 0.044%
COMPROBACIÓN DE SUPUESTOS
PRUEBA DE PEARSON
El estadístico de Pearson es una prueba de bondad de ajuste que se distribuye chi2 con grados
de libertad igual al número de patrones de covariables menos el número de parámetros.
Cuadro n°
PRUEBA DE PEARSON
Valor-p= 0.000<0.05
Los resultados señalan que la hipótesis nula se rechaza y por lo tanto, el modelo no presenta
un buen nivel de ajuste a los valores actuales. La principal consecuencia de este resultado, es
que no se puede utilizar el modelo para hacer inferencias acerca de la relación entre las
variables explicativas y la probabilidad de tener anemia.
PRUEBA DE HOSMER-LEMESHOV(H-L)
Al igual que la prueba de Pearson, el estadístico de Hosmer Lemeshov es una prueba de
bondad de ajuste que permite comparar el valor original de los datos con el valor estimado
por grupos de observación. Para definir el número de particiones de las observaciones que
generalmente son 100 grupos iguales, por lo cual asumimos tomar 100.
Cuadro n°
PRUEBA DE HOSMER-LEMESHOV(H-L)
Bajo la hipótesis nula de que el modelo presenta un buen nivel de ajuste, el estadístico de H
-L sigue una distribución chi2 con G-2 grados de libertad. Al comparar las frecuencias
observadas y estimadas a través del estadístico de H-L y analizar el p-valor asociado a la
prueba, se rechaza la hipótesis nula. Una vez más, el modelo de participación de la anemia
falló una prueba de bondad de ajuste.
ESTADÍSTICAS DE CLASIFICACIÓN
Otra prueba de bondad de ajuste de la regresión probit es la capacidad predictiva del modelo
para clasificar correcta o incorrectamente los valores originales. A partir del pronóstico de la
variable dependiente, el modelo clasifica como “1” los valores que tienen mayor probabilidad
de ocurrencia y que son superiores a un punto de corte, en caso contrario los valores se
clasifican como “0”. En general, se asume que el punto de corte es igual a 0.5.
clasificación así:
Cuadro n°
ESTADÍSTICAS DE CLASIFICACIÓN
True
Classified D ~D Total
El resultado general de esta prueba es que el 79.63% de los valores originales están
clasificados correctamente. De la tabla de clasificación también se puede analizar la
siguiente información:
El primer cuadro de la tabla realiza una comparación entre los valores observados y
los pronosticados por el modelo. Las filas corresponden a los valores “1” (+) y “0”(-
) clasificados por el modelo, y las columnas corresponden a los valores observados
(D=1 y ~D=0).
La sensibilidad mide el porcentaje de los valores “1” que fueron clasificados
correctamente. En nuestro ejemplo el 65.85% de la población que hace parte de la
Población que tienen anemia fue clasificada correctamente por el modelo.
La especificidad corresponde al porcentaje de “0” que fueron pronosticados
correctamente por el modelo. En el ejemplo, el 87.62% de los “0” observados ó la
población que no tiene anemia fueron clasificados correctamente por el modelo.
La predicción de los valores positivos o negativos mide el porcentaje de valores
pronosticados que acertaron correctamente en la clasificación de “1” o “0”. En el caso
de los “1” (+), el 75.48% de los datos pronosticados corresponden a los verdaderos
valores de “1”, En caso contrario, el 81.58% de los valores “0” pronosticados
equivalen a los valores originales de los “0”.
Los errores de clasificación miden el porcentaje de valores observados que fueron
incorrectamente clasificados. En el caso, el 12.38% de los valores “0” observados
fueron clasificados incorrectamente por el
Una interpretación similar se realiza para el caso de los unos. El 34.15% de los valores
“1” ó de la población que en la muestra hace parte de la población que tiene anemia,
fueron clasificados como 0 por la predicción del modelo.
La tasa de falsos unos (ceros) corresponde al porcentaje de valores “1” (“0”)
pronosticados que en realidad son valores “0”. En el ejemplo, el 24.52% de las
personas que fueron clasificadas en la población sin anemia por el modelo, no hacen
parte de este grupo.
De manera análoga, el 18.42% de las personas que el modelo clasificó como “0” o
que no hacían parte de la población que tenía anemia, corresponden a valores “1” que
debieron pronosticarse como parte de la población con anemia.
CURVAS ROC
Las Curvas ROC (Receiver Operating Characteristic) son una representación gráfica de todos
los pares posibles (1-especificidad, sensibilidad) que se generan con distintos puntos de corte.
A medida que se incrementa el valor del punto de corte, el porcentaje de “1” clasificados
correctamente por el modelo aumenta (sensibilidad), al tiempo que el porcentaje de “0”
clasificados como “1” también se incrementa (falsos positivos).
Grafica n°
Curvas ROC
La mayor precisión del modelo para pronosticar un estado o un evento correspondería al
punto (0,1). Por lo tanto, cuanto más cercanas se encuentren las curvas a este punto, mejor
es la capacidad predictiva del modelo. La forma más práctica de realizar esta prueba es
calcular el área bajo la curva ROC, que puede tomar valores entre 0,5 y 1.
En nuestro ejemplo, el área bajo la cuerva ROC (0.70) estaría indicando que el modelo tiene
alguna capacidad predictiva.
3.3 RESULTADOS
Formulación de hipótesis general
Podemos evaluar el valor ch2 que nos proporciona el cuadro n° 4 el cual es 0.000 es menor
al 5% de significancia, entonces se rechaza la hipótesis nula y se acepta la hipótesis
alternativa. Entonces La probabilidad de tener anemia está relacionada con el peso, talla, la
educación de la madre, el nivel de hemoglobina y el género.
Regla de decisión
Valor-p= 0.000<0.05
En nuestro caso podemos ver el valor-p del cuadro n° la cual es 0.000, es menor que el 5%
de significancia por tanto se rechaza la hipótesis nula (H0), y se acepta la hipótesis alterna,
es decir: La probabilidad de tener anemia está relacionado con el peso.
Para la talla
Regla de decisión
Valor-p= 0.288<0.05
En nuestro caso podemos ver el valor-p del cuadro n°4 la cual es 0.288, es menor que el 5%
de significancia por tanto se acepta la hipótesis nula (H0), y se rechaza la hipótesis alterna,
es decir: La probabilidad de tener anemia está no relacionado con la talla.
Regla de decisión
Valor-p= 0.789<0.05
En nuestro caso podemos ver el valor-p del cuadro n°4 la cual es 0.789, es menor que el 5% de
significancia por tanto se acepta la hipótesis nula (H0), y se rechaza la hipótesis alterna, es decir La
probabilidad de tener anemia no está relacionado con la educación de la madre.
Para el nivel de hemoglobina
Regla de decisión
Valor-p= 0.000<0.05
En nuestro caso podemos ver el valor-p del cuadro n°4 la cual es 0.000, es menor que el 5% de
significancia por tanto se rechaza la hipótesis nula (H0), y se acepta la hipótesis alterna, es decir,
La probabilidad de tener anemia está relacionado con la hemoglobina.
Para el genero
Regla de decisión
Valor-p= 0.000<0.05
En nuestro caso podemos ver el valor-p del cuadro n° la cual es 0.000, es menor que el 5% de
significancia por tanto se rechaza la hipótesis nula (H0), y se acepta la hipótesis alterna, es decir La
probabilidad de tener anemia está relacionado con la genero.
Posibles titulos
La influencia de la anemia en los niños menores de 5 años y su relación con el peso, talla,
la educación de la madre, nivel de hemoglobina y género en el Perú para el periodo 2017.
Conclusión