Sie sind auf Seite 1von 10

3.

Estadísticas descriptivas por grupo

ttest ocupado_jefe, by(D)

Empleamos la prueba paramétrica t-student para la variable binaria (ocupado_jefe) o jefe de


hogar empleado, 1 si está ocupado, 0 caso contrario (ocupado_jefe), respecto a la variable
categórica (D); es decir, grupo de tratamiento, para comparar la variable en estas dos muestras
diferentes, por tanto, estamos pidiendo a stata que nos calcule la prueba t para dos muestras con
varianzas iguales, si son distintas entonces no podemos usar esa prueba. El resultado nos muestra
a los dos grupos, tratados y no tratados, así como la cantidad de observaciones, sus medias, sus
errores estándar, desviaciones estándar, la probabilidad del 95 % de confianza de que la media se
encuentra entre esos rangos, así como las diferencias de sus medias, errores estándar e intervalos.

Finalmente, y más importante las probabilidades que nos indicarán si tienen medias iguales o no,
para ello tenemos a la hipótesis nula que nos indica que la diferencia de las medias es igual a
cero; es decir, que las medias son iguales, así mismo, a la hipótesis alterna que nos señala que la
diferencia de las medias es distinta de cero, también nos muestra otras hipótesis alternas como
cuando la diferencia es menor a cero y cuando es mayor a cero.
Entonces, fijándonos en la probabilidad de la hipótesis alterna Pr (T >/t/= /t/)=0.6090, nos
damos cuenta de que es insignificante, por tanto rechazamos la hipótesis alterna y aceptamos la
hipótesis nula; es decir, que ambas medias son iguales

4. regresión con "D" siendo la única variable explicativa

a) reg ha_nchs D

Tenemos la regresión de la variable de resultado, talla para la edad (ha_nchs) con la variable de
tratamiento (D), en ella nos muestra al lado izquierdo superior, a la tabla ANOVA (análisis de la
variación), al lado derecho, el ajuste del modelo, y en la parte inferior, la estimación de los
parámetros. En la tabla ANOVA nos indica la fuente en que se descompone la varianza total, una
por parte de las variables de control y el otro por el término de error, también nos muestra la
suma de cuadrado de cada fuente (SS), los grados de libertad (df) y la desviación media (MS),
que se obtiene dividiendo la suma de los cuadrados con los grados de libertad.

Luego tenemos a las medidas de ajuste del modelo, que nos indica el número de observaciones
(4000), el estadístico F de Fisher que muestra los grados de libertad del ANOVA asociado con la
división de las desviaciones estándar entre el modelo y el residual (1, 3998), también nos muestra
al valor “p” asociado al estadístico F (Prob > F), que sirve para testear la hipótesis nula de que
todos los parámetros del modelo (coeficientes) son iguales a cero, así mismo al R cuadrado (R-
squared), que mide la bondad de ajuste del modelo, varía entre 0 y 1, donde 0 es la ausencia de
ajuste y 1 el ajuste perfecto de la recta estimada, se calcula con la división de SS modelo/SS total,
entonces inferimos que el valor aumenta a medida que se incluyen más variables en el modelo, en
nuestro caso es de 0.0085, que estaría indicando que la variable “D”, explica casi nada a nuestra
variable de resultado, también tenemos al R cuadrado ajustado (Adj R squared), que es el
estimador de ajuste que penaliza la inclusión de nuevos regresores; es decir, no aumenta
necesariamente e incluso podría disminuir, se obtiene dividiendo la desviación media del modelo
con la desviación media total (MS modelo/MS total), en nuestro ejemplo es de 0.0083,
necesitamos más regresores para ver la evolución, por último tenemos a la raíz del Error
Cuadrático Medio (Root MSE), que representa la desviación estándar del término de error y se
obtiene como la raíz cuadrada de la desviación media residual (√2 MSresidual ¿.

Finalmente tenemos a la estimación de los parámetros, donde encontramos en la primera


fila/columna a la variable dependiente, a los coeficientes estimados, al error estándar del
coeficiente, al estadístico t para la hipótesis nula de coeficiente igual a cero, a p>/t/, que es el p-
valor asociado al test y el 95 % como nivel de confianza de los intervalos. Entonces podemos
decir que, el efecto del programa es 0.2343 desviaciones estándar y es estadísticamente
significativo al 1% de confianza porque el p-valor (p>/t/) es menor que 0.01. Una desviación
estándar de la estatura entre los 0 y los 5 años de edad es de entre 3y 5 centímetros dependiendo
de la edad exacta del niño, lo cual implica que el efecto del programa está entre 0.6 y 1
centímetro de estatura, esto podría considerarse como un efecto cuantitativamente importante; sin
embargo, es necesario añadir más variables de control para no sobreestimar el resultado.

b) reg ha_nchs D baja orden_n ocupado_jefe educa_jefe personas ingresos_hogar_jefe


hombre
De igual forma tenemos los mismos indicadores que en la tabla anterior, al lado izquierdo
superior, a la tabla ANOVA (análisis de la variación), al lado derecho, el ajuste del modelo, y en
la parte inferior, la estimación de los parámetros El resultado muestra que, al agregar diversos
controles, el efecto de Canasta es de 0,2305 desviaciones estándar, lo cual es bastante parecido a
los resultados que habíamos obtenido anteriormente. Además, algunas de las variables incluidas
están significativamente asociadas con la estatura según la edad de los niños. En particular,
retomemos el ejemplo donde existen dos grupos o “razas” en la población, altos y bajos, en esta
estimación, pertenecer a la raza baja está asociado con una estatura según la edad de 0.3218
desviaciones estándar más baja con respecto a los de raza alta. La disminución en los errores
estándar asociados con el impacto del programa de 0.0399 en el resultado anterior a 0.03918 en el
resultado actual, tiene que ver con la ganancia en eficiencia de la estimación al incluir las
variables explicativas adicionales.
c) reg ha_nchs D baja orden_n ocupado_jefe educa_jefe personas ingresos_hogar_jefe
hombre D_baja

Si Canasta mejora la nutrición de manera más eficiente en los altos que en los bajos, por sus
predisposiciones genéticas, es deseable calcular los efectos diferenciales del programa entre las
dos razas. Para esto se introduce una interacción entre el indicador de tratamiento, Di y el
indicador de raza baja.

Tenemos la misma estructura, al lado izquierdo superior, a la tabla ANOVA (análisis de la


variación), al lado derecho, el ajuste del modelo, y en la parte inferior, la estimación de los
parámetros estimación del impacto de Canasta con controles adicionales y efectos heterogéneos.
La intervención tiene efectos diferenciales sobre los individuos dependiendo de la raza a la que
pertenecen. En particular, aumenta 0.3258 desviaciones estándar de la estatura por edad para el
grupo alto, u 0,1351 (0.3258-01906) para los bajos. El primer efecto se lee directamente de la
regresión, pues es el coeficiente que acompaña el tratamiento, mientras que el segundo se calcula
como la suma del coeficiente del tratamiento y el de la interacción del tratamiento con el
indicador de raza, D_baja, Así, el efecto del Programa de 0,2305 calculado en el resultado
anterior, no es más que el promedio ponderado de los efectos heterogéneos entre las dos razas
5. regresion adicionando variables explicativas

ssc install outreg2


global X "personas hombre orden_n baja ocupado_jefe educa_jefe ingresos_hogar_jefe"
reg ha_nchs D $X

Si asumimos que el programa no ha sido asignado de manera aleatoria, sino que la participación
es voluntaria; entonces, el estimador de MCO es un estimador sesgado del impacto del programa.
Definimos entonces un vector global X de características observables de los individuos para
ganar eficiencia en la estimación al incluir las variables explicativas adicionales, que incluyen: el
número de personas que viven en el hogar, una variable binaria: 1 si el género es hombre, 0 de lo
contrario, el orden de nacimiento del niño, otra variable binaria, 1 si la raza es baja, 0 en otros
casos, otra variable binaria, 1 si el jefe del hogar está empleado, 0 caso contrario, educación del
jefe del hogar y los ingresos mensuales del jefe del hogar.

En este caso el estimador de MCO indica que el programa está asociado con un aumento en la
estatura según la edad de acerca de 0,25 desviaciones estándar y el efecto es estadísticamente
significativo al 1 % de confianza

11. outreg2
a) reg ha_nchs D $X

Como ya hemos obtenido estos resultados en el número 5 y que consta en introducir más
variables de controles para tener una estimación menos sesgada, diremos lo mismo; es decir, que
si asumimos que el programa no ha sido asignado de manera aleatoria, sino que la participación
es voluntaria; entonces, el estimador de MCO es un estimador sesgado del impacto del programa.
Definimos entonces un vector global X de características observables de los individuos para
ganar eficiencia en la estimación al incluir las variables explicativas adicionales, que incluyen: el
número de personas que viven en el hogar, una variable binaria: 1 si el género es hombre, 0 de lo
contrario, el orden de nacimiento del niño, otra variable binaria, 1 si la raza es baja, 0 en otros
casos, otra variable binaria, 1 si el jefe del hogar está empleado, 0 caso contrario, educación del
jefe del hogar y los ingresos mensuales del jefe del hogar.

En este caso el estimador de MCO indica que el programa está asociado con un aumento en la
estatura según la edad de acerca de 0,25 desviaciones estándar y el efecto es estadísticamente
significativo al 1 % de confianza

outreg2 using "D:\BRYAM\tics\resultados_1.xls", excel


outreg2 using "D:\BRYAM\tics\resultados_1.doc"
Con estos comandos guardamos nuestros resultados estimados tanto en Excel como en Word en
la carpeta especificada.

b) reg ha_nchs D $X D_baja

De

igual forma este resultado ya lo hemos obtenido en el ejercicio número 4 inciso c) por tanto
daremos la misma explicación; es decir, si Canasta mejora la nutrición de manera más eficiente
en los altos que en los bajos, por sus predisposiciones genéticas, es deseable calcular los efectos
diferenciales del programa entre las dos razas. Para esto se introduce una interacción entre el
indicador de tratamiento, Di y el indicador de raza baja.

Tenemos la misma estructura, al lado izquierdo superior, a la tabla ANOVA (análisis de la


variación), al lado derecho, el ajuste del modelo, y en la parte inferior, la estimación de los
parámetros estimación del impacto de Canasta con controles adicionales y efectos heterogéneos.
La intervención tiene efectos diferenciales sobre los individuos dependiendo de la raza a la que
pertenecen. En particular, aumenta 0.3258 desviaciones estándar de la estatura por edad para el
grupo alto, u 0,1351 (0.3258-01906) para los bajos. El primer efecto se lee directamente de la
regresión, pues es el coeficiente que acompaña el tratamiento, mientras que el segundo se calcula
como la suma del coeficiente del tratamiento y el de la interacción del tratamiento con el
indicador de raza, D_baja, Así, el efecto del Programa de 0,2305 calculado en el resultado
anterior, no es más que el promedio ponderado de los efectos heterogéneos entre las dos razas

Das könnte Ihnen auch gefallen