Sie sind auf Seite 1von 13

UNIVERSIDAD AUTONOMA DE

SANTO DOMINGO
(UASD)
FACULTAD DE ECONOMIA Y CIENCIAS SOCIALES

PRIMERA PRACTICA

Econometría

MAESTRO

Francisco Ramírez

ALUMMNO

Wilmel Terrero Sepúlveda

Mat. 100152275

27/09/2019
Econometría Práctica I

Ejercico I: Enumere los supuestos del modelo de regresión clásico y explique


cuidadosamente la importancia de cada supuesto.

1. (Linealidad de los parámetros)Modelo de regresión lineal.


El modelo de regresión es lineal en los parámetros Yi=β1 + β2xi+ui.En
el modelo poblacional la variable dependiente, Y, está relacionada con
la variable independiente X, y con el error (perturbación) u donde β1 y
β2 representan los parámetros poblacionales, del intercepto y pendiente,
respectivamente.

2. (Muestreo aleatorio) Se cuenta con una muestra aleatoria de tamaño n,


{(xi,yi): i 1, 2, ..., n}, que sigue el modelo poblacional de la ecuación. Yi=β0
+ β1xi+ui. i = 1, 2, ..., n,.

3. (Variación muestral de la variable explicativa) No todos los valores


muéstrales de x, a saber {xi, i = 1, ..., n}, son iguales, es decir, no todos tienen
el mismo valor. Este es un supuesto muy débil ciertamente poco útil de
destacar, pero necesario de cualquier manera. Si x varía en la población,
entonces las muestras aleatorias típicamente mostrarán variación en x, a
menos que la variación poblacional sea mínima o el tamaño de la muestra sea
muy pequeño. Una sencilla inspección de los estadísticos de las xi indicará si
el supuesto se satisface o no: si la desviación estándar muestral de las xi es
cero, entonces el supuesto no se satisface; si no es así, este supuesto se
satisface.

4. (Media condicional cero) Para todo valor de la variable explicativa, el valor


esperado del error u es cero. Es decir, E(u/x) = 0.En una muestra aleatoria,
este supuesto implica que E(ui/xi) = 0, para toda i 1, 2, ..., n. Además de
restringir la relación que hay en la población entre u y x, el supuesto de media
condicional cero junto con el supuesto del muestreo aleatorio permite una
conveniente simplificación técnica. En particular, es posible obtener las
propiedades estadísticas de los estimadores de MCO como condicionales
sobre los valores de xi en la muestra.

5. (Homocedasticidad) El error u tiene la misma varianza para cualquier valor


de la variable explicativa. En otras palabras, Var(u/x) =El error u tiene la
misma varianza para cualquier valor de la variable explicativa. En otras
palabras, Var(ux) =Ϭ2 Hay que señalar que el supuesto de homocedasticidad
es totalmente distinto al de media condicional cero, E(u/x) = 0. El supuesto se
refiere al valor esperado de u, mientras que está relacionado con la varianza de
u (ambos condicionales sobre x).

Ejercico 2: Explique la relación entre las distribuciones normal estándar, chi


cuadrada, t de student y distribución de F de Fisher.

La distribución de Fisher se emplea para probar si dos muestras provienen de dos


poblaciones que poseen varianzas iguales, la cual es útil para determinar si una
población tiene una mayor variación que la otra. La distribución T- studentes menor en
la media y más alta en los extremos que una distribución normal, tiene
proporcionalmente mayor parte de su área en los extremos que la distribución normal.
La distribución chi- cuadrada tiene un solo parámetro llamado grado de libertad y está
relacionada con la teoría del modelo pequeño n>30. En los términos como distribución
de muestreo, análisis de varianza de esta distribución.

Ejercicio 3: Explique en detalle el significado del término constante en un modelo


de regresión lineal.

La constante de un modelo de regresión lineal son los parámetros β1 y β2. A su vez


estos son conocidos como el origen y la pendiente del modelo respectivamente. En
conjunto reciben el nombre de coeficiente de la ecuación de regresión.

Ejercicio 4: Sea niños la cantidad de hijos que ha tenido una mujer, y educ los años
de educación que tiene esta mujer. Un modelo sencillo para relacionar fertilidad
con años de educación es: niños = β0 +β1educ+u donde u es el error no observado.’

4.1 ¿Qué tipo de factores son los contenidos en u? ¿Es posible que estos factores
están correlacionados con el nivel de educación?

4.1.1 Los factores que pueden estar contenido en U son los siguientes: nivel de
ingresos , antecedentes familiares, sector de residencia, acceso al sistema
de salud, etc.

4.1.2 Si están correlacionado, en el caso del salario se pudiera hacer un modelo


de regresión simple que explique la relación entre el salario y que percibe
una mujer de acuerdo a sus años de educación.
4.2 ¿Es posible que con un análisis de regresión simple se halle el efecto de
educación sobre fertilidad? Explique.

Sí es posible, sin embargo, la única manera de obtener valores que optimicen el


problema es haciendo una suposición que restrinja la manera en que la variable no
observable u esté relacionada con la variable explicativa educación. Como u y educ
son variables aleatorias antes de hacer una suposición acerca de la relación entre
ellas podemos suponer que el valor promedio de u en la población es cero.
#Ejercicio 5: La base de datos 401K.CSV es un subconjunto de los datos
analizados por Papke (1995) para estudiar la relación entre la participación en un
plan de pensión y la generosidad del plan. La variable prate es el porcentaje de
trabajadores que están inscritos en el plan y que tienen cuenta activa; esta es la
variable que se quiere explicar. La medida de la generosidad es la tasa de
contribucián (de la empresa) al plan, mrate. Esta variable es la cantidad promedio
con la que la empresa contribuye al plan de cada trabajador por cada peso que
aporte el trabajador. Por ejemplo, si mrate = 0.50, entonces a una contribución de
1 del trabajador corresponde una contribución de 50 centavos de la empresa.

#Importando base de datos.

bd<-read.csv(C:/Users/Mayelin Adriana/Downloads/401K.csv)

# Encuentre el promedio de la tasa de participación y el promedio de la tasa de


contribución para la muestra.

#promedio de la tasa de participación:

SumPrate<-X401K$PRATE #le asigne un nombre a la sumatoria de Prate.

PTP<-sum(SumPrate)/1534 # realice la operacion de sumatoria/cat.obsvaciones para


calcular la media y el resulato fue 87.3

#promedio de la tasa de contribución para la muestra:

sumMrate<-X401K$MRATE #le asigne un nombre a la sumatoria de Mrate.

sum(sumMrate)/1534 #realice la operacion de sumatoria/cat.obsvaciones para calcular


la media y el resultado fue 0.73

PTC<-sum(sumMrate)/1534

# Ahora, estime el modelo. prate = β0 +β1mrate+u


P5<-lm(SumPrate~sumMrate, X401K)

summary(P5)

stargazer(modelo1,type = "text" )

# Interprete el intercepto de la ecuación. Interprete también el coeficiente de


mrate.

#respuesta: por cada incremento de 0.50 centavos de contribuccion de la empresa al


plan mrate se espera que el porcentaje de trabajadores inscritos en el plan aumente en
promedo 5.86%.

#Determine la prate que se predice para mrate = 3.5. ¿Es razonable esta predicción?
Explique qué ocurre aquí.

prate=83.27+(5.86(3.5)= 103.78 #no es razonable esta prediccion por que excede el


porcentaje de trabajadores que posee la empresa.

#¿Qué tanto de la variación en prate es explicada por mrate? En su opinión, ¿es mucho?

#respuesta: la variacion en prate depende mucho de que tanto pueda cambiar mrate,
#Ejercicio 6. Un problema de interés para los funcionarios de salud(y para otros)es
determinar los efectos que el fumar durante el embarazo tiene sobre la salud
infantil. Una medida de la salud infantil es el peso al nacer; un peso demasiado
bajo puede ubicar al niño en riesgo de contraer varias enfermedades. Ya que es
probable que otros factores que afectan el peso al nacer están correlacionados con
fumar, deben considerarse. Por ejemplo, un nivel de ingresos más alto en general
da como resultado el acceso a mejores cuidados prenatales y a una mejor nutrición
de la madre. Una ecuación que reconoce estos factores es:

#bwght = β0 +β1cigs+β2faminc+u

#¿Cuál es el signo más probable para β2?

#Respuesta: El signo más probable para β2 es que sea positivo.

# ¿Cree que cigs y faminc están correlacionados? Explique por qué la correlación
puede ser positiva o negativa.

#Respuesta: si están correlaciona, la correlacion puede ser positiva porque a medida que
aumente los ingresos de una persona mayor seria la demanda de cigs. Puede ser
negativa por que pudiera ver otro factores que influya en la demanda del cigs.

#Ahora, calcule la ecuación con y sin faminc utilizando los datos del archivo
BWGHT.CSV. Dé los resultados en forma de ecuación incluyendo el tamaño de la
muestra y la R cuadrada. Explique sus resultados enfocándose en si el añadir
faminc modifica de manera sustancial el efecto esperado de cigs sobre bwght.

#creando dataset.

data<-read.csv(C:/Users/Mayelin Adriana/Downloads/BWGHT.csv)

data<-BWGHT
#creando variables.

pesolb<-data$bwght

cigarros<-data$cigs

faminc1<-data$faminc

#creando los modelos

modelomw<-lm(pesolb~cigarros+faminc1)

modelomw2<-lm(data$bwght~data$cigs+data$faminc)

modelomw3<-lm(data$bwght~data$cigs)
#viendo los resultados del Modelomw2 con faminc

summary(modelomw2)

stargazer(modelomw2,type = "text")
#Ejercicio 7 El modelo siguiente puede usarse para estudiar si los gastos de
campaña afectan los resultados de las elecciones:

voteA = β0 +β1expendA+β2expendB +β3prtysstrA+u donde voteA es el porcentaje


de votos recibidos por el candidato A, expendA y expendB son los gastos de
campaña del candidato A y del candidato B y prtystrA es una medida de la
fortaleza del partido del candidato A (el porcentaje de votos que obtuvo el partido
de A en la elección presidencial más reciente).

# ¿Cuál es la interpretación de β1?

#respuesta: manteniendo todas las variables constantes por cada unidad de incremento
en expendA se espera que el porcentaje de los votos en (voteA) aumente en β1%.

#Use los datos en VOTE1.csv y Estime el modelo e interprete los coeficientes y la


bonda de ajuste.

data1<-read.csv(C:/Users/Mayelin Adriana/Downloads/VOTE1.csv

data1<-VOTE1

#crear variables

votoA<- data1$VOTEA

gastoA<-data1$EXPENDA

gastoB<-data1$EXPENDB

Ep<-data1$PRTYSTRA
#crear modelo

modeloE1<-lm(votoA~gastoA+gastoB+Ep)

modeloE2<-
lm(data1$VOTEA~data1$EXPENDA+data1$EXPENDB+data1$PRTYSTRA)

summary(modeloE2)

stargazer(modeloE2,type = "text")

#interpretación de los coeficientes.

#para β0: se estima que el porcentaje de votos promedio del partido A es de 33.26%,
cuando el gasto del partido A, el partido B y el porciento de votos del partido A en las
pasadas elecciones son igual a cero simultáneamente.

#para β1: manteniendo las demás variables constates, se espera que por cada unidad de
incremento en el gasto del partido A el porcentaje de los votosA aumenten en promedio
a 0.035%

#para β2: manteniendo las demás variables constantes, se espera que por cada unidad de
incremento en el gasto del partido B el porcentaje de los votosA disminuye en promedio
a 0.035%
#para β3: manteniendo las demasvariabes contantes, se espera que por cada por ciento
de votos obtenidos en la eleccion pasada, el porcentaje de los votos del partido A
aumente en promedio 0.34%

#Ejercicio 8 Para este ejercicio emplee los datos del archivo WAGE2.CSV.
Considere la ecuación estándar para salario

wage = β0 +β1educ+β2exper +β3tenure+u

bs2<-read.csv(C:/Users/Mayelin Adriana/Downloads/WAGE2.csv)

sal<- WAGE2

#Interprete los coeficientes del modelo.

#para β1: manteniendo las demas variables constantes, se espera que por cada año de
educacion de un individuo el salario sea mayor.

#para β2: manteniendo las demas variables constantes, se espera que por cada año de
experiencia de un individuo el salario aumenta.

#para β3: manteniendo las demas variables constantes, se espera que por cada año de
trabajo en la empresa el salario de un individuo aumente.

#Estime el modelo e interprete los coeficientes estimados.

#crear variables

salario<-sal$WAGE

educacion<-sal$EDUC

expe<-sal$EXPER

ae<-sal$TENURE

#crear modelo

modeloW<-lm(salario~educacion+expe+ae)
modeloM<-lm(sal$WAGE~sal$EDUC+sal$EXPER+sal$TENURE)

summary(modeloM)

stargazer(modeloM,type = "text")

# interprete los coeficientes estimados.

#para β0: se estima que el salario promedio de un individuo es de -276.24, suponiendo


que los años de educación, experiencia y de trabajo en la empresa sean cero
simultáneamente.

#para β1: manteniendo las demás variables constante, se estima que por cada año de
educacion de un individuo el salario aumenta en promedio 74.4%.

#para β2: manteniendo las demás variables constante, se estima que por cada año de
experiencia de un individuo el salario aumenta en promedio 14.8%

#para β3: manteniendo las demás variables constante, se estima que por cada año de
trabajo en la empresa, el salario aumenta en promedio 8.2%

Das könnte Ihnen auch gefallen