Sie sind auf Seite 1von 9

Universidad Industrial de Santander

Escuela de Economía y Administración


Econometría I
Grupo A1
Taller 2
2150148 – Henry Andrés Gómez Ramírez
2150033- David Parra Bohórquez

1)

1 X1
T 1 1… 1
( X T X ) β=X T Y ( X X )= X X … X ∗
1 2 n
1 X 2 = 1+1+1+… n X 1 + X 2 +…+ X i
⋮ ⋮
1 Xi
( )
X 1 + X 2 +…+ X i X 21 + X 22 +… + X 2i
( )( )
n

( )
n ∑ Xi
( X T X )= i=1
n n

∑ X i ∑ X 2i
i=1 i=1

n n

( ) ( )
n ∑ Xi β1 n β1 + β 2 ∑ X i
( X T X )∗β=
n
i=1
n
2
( )

β2
=
n
i=1

β1 ∑ X i + β 2 ∑ X 2i
n

∑ Xi ∑ X i
i=1 i=1 i=1 i=1

n β1 +n X́ β 2
( X T X )∗β=
( n X́ β1 + β 2 ∑ X 2i
n

i =1
)
Y1 n

XT Y = 1 1 … 1 ∗ Y 2 =
(
X1 X 2… Xn ⋮
Yn
Y 1+Y 2+ …+Y n
X 1 Y 1 + X 2 Y 2 …+ X n Y n
=
) () ( ) ( )
∑Yi
n
i=1

∑ XiY i
i=1

n Ý
XT Y =
( ) n

∑ Xi Y i
i=1

n β 1 +n X́ β 2 n Ý
( X T X ) β=X T Y →
( n X́ β 1 + β 2 ∑ X 2i

n β 1+ n X́ β2 =n Ý → β 1+ X́ β 2=Ý → β 1=Ý − X́ β 2
n

i=1
)( )
= n

∑ XiY i
i=1

n n n n
n X́ β 1+ β2 ∑ X 2i =∑ X i Y i → n X́ ( Ý − X́ β 2)+ β 2 ∑ X 2i =∑ X i Y i
i=1 i=1 i=1 i=1
n

n n ∑ X i Y i −n XY
´
β2 (∑ i=1
2 2
) ´ → β2 = i=1
X −n X́ =∑ X i Y i−n XY
i
i=1
n

∑ X 2i −n X́ 2
i=1

2)

Si en la ecuación u^ =ui−( ^
β0 −β 0) −( ^
β1 −β1 ) x i se determina el promedio sobre todas las i y se
usa el hecho de que el promedio de los residuales de MCO es cero dando así:

0=úi−( ^
β 0−β 0 )−( ^
β 1−β 1) x́ i

Restando de la primera ecuación obtenemos

u^ =( ui−ú )−( ^
β1− β1 ) (xi −x́)

Elevando al cuadrado y realizando la factorización


2 2 2
u^ =( ui−ú ) −( β^1−β 1 ) ( x i−x́ ) −2 ( u− úi ) ( ^
β 1−β 1) ( x i−x́)

Aplicando factor suma


n n n n
2
2 2
^ ∑ ( u i−ú ) −( ^
∑ u= β 1−β 1) ∑ ( xi −x́ ) −2 ( ^
β 1−β 1) ∑ ui (xi −x́)
i=1 i=1 i=1 i=1

Por último, para primar la insesgamiento, aplicamos la esperanza matemática


n n n n
2 2 2
E ⌈ ∑ u^ ⌉ =E ⌈ ∑ ( ui−ú ) ⌉ + E ⌈ ( ^
β 1−β 1 ) ∑ ( xi −x́ ) ⌉−E ⌈ 2 ( ^
β 1−β 1 ) ∑ ui (x i−x́)⌉
i=1 i=1 i =1 i=1

n
σ2 2 σ2 2
E ⌈ ∑ u^ ⌉ =( ( n−1 ) σ 2 ) +
i=1 ( S2x
∗S x −
)(
2
S 2x
∗S x
)
n
E ⌈ ∑ u^ ⌉ =( n−1 ) σ 2−σ 2 → n σ 2−2 σ 2 → ( n−1 ) σ 2
i=1

Despejando
n

∑ u^
i=1
=σ 2
( n−1 )

El cual es un estimador insesgado.


3)
Asumiendo una regresión simple, el nuevo modelo se presenta:

𝑎𝑣𝑔𝑝𝑟𝑜𝑑=𝛽1+𝛽2𝑎𝑣𝑔𝑡𝑟𝑎𝑖𝑛+ 𝜀
Siguiendo los supuestos de Gauss-Markov

*E i  0 para todo


Agregamos las subvenciones (Sb) al nuevo modelo
𝑎𝑣𝑔𝑝𝑟𝑜𝑑=𝛽1+(𝛽2+ Sb)𝑎𝑣𝑔𝑡𝑟𝑎𝑖𝑛+ 𝜀

Procedemos a estimar la esperanza


En esta demostración, los valores esperados son condicionales sobre los valores muestrales de
la variable independiente. Como STCx y di son funciones sólo de las xi, no son aleatorias
bajo el condicionamiento. Por tanto, de acuerdo con la ecuación
n

∑ ( xi −x́ )∗(ui) 1
n
^
β 2=β 2 + i:1
STC x
=β 2 +
STC x ( )∑ ( d )∗( u )
i :1
i i

n
2
Sea:STC x =∑ ( x i− x́ ) y ui=( y i− ý )
i: 1

Y manteniendo implícito el condicionamiento sobre { x 1, x 2, ..., x n } y agregando a β 2 la


subvención dada por el gobierno se tiene
n
1
E⌊^
β2 ⌋=E ⌊ β 2 ⌋ + E
[( STC x )∑ ( d )∗(u )+ Sb]+ E [ ε ]
i:1
i i i

n
1
E⌊^
β2 ⌋=β 2 + E
[( STC x )∑ ( d )∗(u )]+ E [ Sb] + E [ ε ]
i:1
i i i

n
1
E⌊^
β2 ⌋=β 2 +
( STC x )∑ ( d )∗(u )+ Sb+0
i :1
i i

n
1
E⌊^
β2 ⌋=β 2 +
( STC x )∑ ( d )∗( 0)+ Sb+ 0
i :1
i

E⌊^
β2 ⌋=β 2 +Sb

Por tanto, con la agregación de una subvención por parte del gobierno, el nuevo estimador de
^
β 2 es sesgado de β 2.

De acuerdo a los supuestos y a lo que nos está planteando el modelo β2 > 0, y por supuesto,
Corr(x1,x2) < 0. Por lo tanto, hay un sesgo negativo en β1: E ( ^
β 1) < β1. Esto significa que, en
promedio, el estimador de regresión simple subestima el efecto del programa de
~
entrenamiento. Incluso es posible que E( β ¿ ¿ 1)¿ es negativo, aunque β 1> 0

4)
a)
𝑝𝑟𝑒𝑐𝑖𝑜𝑖̂=−14.47+0.976𝑣𝑎𝑙𝑒𝑠𝑡𝑖
(16.27) (0.049)
n = 88, SRC = 165644.51 R2 = 0.820

*H0: 𝛽1=0
−14.47
T= =−0.88936
16.27

* H0: 𝛽2=1
0.976−1
T= =−0.48979
0.049
Al 2.5% de confianza y con n-k (88-2) grados de libertad el valor critico es l1.9879l lo que
implica que ambos estimadores estadísticamente toman ambos el valor que describe el
modelo; lo que a su vez implica y que según lo establecido es un avaluó racional si 𝛽0=1 y
𝛽1=0.
b)
SRC R =¿209448.99.

SRC NR =165644.51

n = 88
k=2
(SRC R −SRC NR )
k
F=
SRC NR
n−k

(209448.99−165644.51)
2
F= =1.1383
165644.51
88−2
F(2, 86; 0.05) = 3.10255,
c)

H0: 𝛽3=0, 𝛽4=0 y 𝛽5=0

R2 R=0.829

R2 NR=0.820
N=88
K=3

( R2R −R2NR )
k
F=
1−R 2R
n−k
(0.829−0.820)
3 86
F= = =1.5087
1−0.829 57
86

F(3, 83; 0.05) = 2.71457


d) Si esta situación sucede, la agregación de más variables al modelo, permite que este tenga
un ajuste más cercano de la varianza al poblacional, determina que el modelo del apartado c
ha mejorado.
5)
a) Queremos tener un modelo de semi-elasticidad constante, por lo que una ecuación de
salario estándar con el uso de marihuana incluido sería

log(Salario) = β0 + β1 *(Uso) + β2 *(Educ)+ β3 *(exper) + β4 * (exper)2 + β5 *(femenino) +


u.
Entonces 100*β1 es el cambio porcentual aproximado en el salario cuando el uso de
marihuana aumenta una vez por mes.
b) Agregaríamos un término de interacción entre la mujer y el uso de marihuana:
2
log(Salario) = β0+ β1 *(Uso)+ β2 *(educ) + β3 *(exper )+ β4 (exper) + β5 (femenino)
+ β *(uso femenino )+ u.

Para probar que el consumo femenino de drogas es distinto la contraparte masculina, es


necesario hacer una prueba de hipótesis, en donde el consumo femenino no tendría efecto si
su estimador es cero; por lo tanto la hipótesis nula de que el efecto del consumo de marihuana
no difiere por sexo es H0: β6 = 0.
c) Tomamos el grupo base como no usuario. Entonces necesitamos variables dummy para los
otros tres grupos: consumidores ligeros (CL), Moderados (M) y empedernidos (EM), los que
no consumen, se supone que no afectan el salario, y están agregados en las otras variables.
Suponiendo que no hay ningún efecto interactivo con el género, el modelo sería:
log(salario) = β0 + δ1* (CL) + δ2 *(M) + δ3 *(EM) + β2 *(educ) + β3 *(exper)
+ β4 *(exper)2 + β5 *(femenino) + u.
d) La hipótesis nula es H0: δ1 = 0, δ2 = 0, δ3 = 0, para un total de q = 3 restricciones. Si
n es el tamaño de la muestra, el grado de libertad en el modelo no restringido – el grado de
libertad del denominador en la distribución de F - es n - 8. Entonces obtendríamos el valor
crítico de la distribución de F(q, n-8).
C.4.10
(i) Necesitamos calcular la estadística F para el significado general de la regresión con
n = 142 y
k -1 = 4
0.395
∗137
1−0.395
F= =1.41
4

El valor crítico del 5% con 4 grados de libertad de numerador y usando 120 para la grados de
libertad para el numerador, es 2.45. Que está muy por encima del valor de F. Por lo tanto, no
podemos rechazar H0: 1β = 2β = 3β = 4β = 0 al nivel de 5 ni mucho menos 10%. Ninguna
variable explicativa es individualmente significativa al nivel del 5%. El estadístico t absoluto
más grande está en dkr, Tdkr ≈ 1.60, que no es significativo al nivel del 5% contra una
alternativa bilateral.
0.0330
∗137
(ii) La estadística F (con el mismo grado de libertad) es ahora 1−0.0330
F= =1.17
4

que es incluso menor que en la parte (i). Ninguna de las estadísticas t es significativa a un
nivel razonable.
(iii)
Parece muy débil. No hay estadísticas significativas al nivel del 5% (frente a una alternativa
bilateral), y las estadísticas F son insignificantes en ambos casos. Además, menos del 4% de
la variación en el rendimiento se explica por las variables independientes.
(iv) En todos los casos vistos, el modelo ha sido muy débil, la correlación de este, observando
las pruebas de hipótesis tanto general como individual, se nota que los estimadores que se han
obtenido no explican los cambios de la variable explicada
C.6.1
i) El efecto causal (o ceteris paribus) de la distancia sobre el precio significa que β1 ≥ 0 Todos
los demás factores relevantes iguales, es mejor tener un hogar más lejos del incinerador. La
ecuación estimada es
log(precio)= 8.05 + .365 log(dist)
(0.65) (0.066)

n=142 , R2 =.180 , Ŕ2 =.174 ,


Lo que significa un aumento del 1% en la distancia desde el incinerador se asocia con un
precio predicho que es aproximadamente 0.37% más alto.
(ii)
Cuando se agregan a la regresión las variables log (inst), log (área), log (tierra), habitaciones,
baños y edad, el coeficiente en log (dist) se vuelve aproximadamente .055 (se ≈ .058). El
efecto es mucho más pequeño ahora, y estadísticamente insignificante. Esto se debe a que
hemos controlado explícitamente varios otros factores que determinan la calidad de un hogar
(como su tamaño y número de baños) y su ubicación (distancia a la interestatal). Esto es
consistente con la hipótesis de que el incinerador estaba situado cerca de hogares menos
deseables para empezar; se encuentra que aunque tanto en el caso (i) como en el (ii) el modelo
logra explicar estadísticamente la situación; en el caso (i) la variable log(dist) tiene un
coeficiente mucho mayor que la misma en el caso (ii) lo cual se puede deber a que en el
primer caso esta misma variable puedo haber estado inflada debido a que el efecto de las
otras variables también puedo estar explicando el comportamiento del β de las distancia.
(iii)

Cuando se agrega [log (inst )]2a la regresión en la parte (ii), obtenemos (con los resultados sólo
parcialmente informados)

price) = –3.32 + 0.185 log(dist) + 2.073 log(inst) – 0.1193 [log(inst)]2 + K


log( ^

(2.65) (0.062) (0.501) (.0282)

n = 142, R2= 0.778, Ŕ2= 0.764.


El coeficiente en log (dist) es ahora muy estadísticamente significativo, con una estadística t
de aproximadamente tres. Los coeficientes de log (inst) y [log (inst )]2son ambos muy
estadísticamente significativos, cada uno con estadística t por encima de cuatro en valor
absoluto. Sólo agregar [log(inst )]2ha tenido un efecto muy grande en el coeficiente
importante para los propósitos de la política. Esto significa que ahora la distancia del
incinerador y la distancia de la interestatal están correlacionadas de alguna manera no lineal
que también afecta el precio de la vivienda.
Podemos encontrar el valor de log (inst) donde el efecto en log (precio) en realidad se
convierte en negativo:
2.073
=8.69
2(0.1193)

Cuando exponenciamos esto obtenemos unos 5,943 pies de la interestatal. Por lo tanto, lo
mejor es tener su hogar lejos de la interestatal para distancias de menos de un poco más de
una milla. Después de eso, moviéndose más lejos de la interestatal disminuye la predicción
del precio de la vivienda
(iv)

El coeficiente de [log(dist )]2, cuando se añade al modelo estimado en la parte (iii), es de


alrededor de -0.0365, pero su estadística t es sólo de -33 Por lo tanto, no es necesario añadir
esta complicación.
E.4.2

(𝑃𝐸𝑆𝑂)̂=−99,41+3,94Altura R2=0,81 𝜎2̂=10,22


A)
^
Peso=−99,41+3,94∗70=176,3 9
^
Peso=−99,41+3,94∗74=192,15
B)
∆ Peso=3,94∗∆ Altura→ ∆ Peso=3,94∗1,5=5,9 1

De acuerdo a la regresión se puede calcular el cambio promedio del peso en función de la


altura multiplicando la pendiente por el cambio que sufrió la respectiva variable.

C)

1 1
1 Lb=0,453592 Kg→ Lb=1 Kg1∈¿ 2,54 Cm → ∈¿ 1Cm
0,453592 2,54

Peso∗¿ w1∗Peso→ w 1=0.453592

Altura∗¿ w 2∗Altura→ w 2=2.54

w1
^
β 2∗¿ ∗ β^
w2 2
^
β 1∗¿ w 1∗^
β1

^ 0.453592
β 2∗¿ ∗3.94=0.7036033
2.54
^
β 1∗¿ 0.453592∗−99.41=−45,09158072

Nuevo modelo es:

Peso=−45,09158072+0,7036033∗Altura R =0,81 σ^ =10,2


2 2 2
^

70∈→177,8 ^
Peso=−45,09158072+0,7036033∗177,8→ ^ Peso=80,009093
74∈→ 187,96 Peso=−45,09158072+ 0,7036033∗187,96 → ^
^ Peso=87,157703
El cambio de la relación de la regresión peso-longitud de libras-pulgadas a kilogramos-
centímetros se realiza a través del cambio en las cantidades de conversión. Las variaciones no
modifican los parámetros de la regresión (σ^2 , R2) ya que, se modificó solamente su forma de
medir.

Das könnte Ihnen auch gefallen