Beruflich Dokumente
Kultur Dokumente
Econometría
Pablo Lavado , Gonzalo Rivera , Claudia Lisboa, Luciana Velarde, Óscar Jara
Junio del 2014
De este modo, el objetivo de este libro es justamente ser una guía práctica de resolución
de ejercicios de econometría básica. Así, este documento permitirá al estudiante
contrastar los conocimientos teóricos con ejercicios prácticos, ayudándolo a internalizar
de una mejor manera los conceptos y la intuición que hay detrás de ellos; así como de los
modelos aplicados en trabajos de investigación aplicados a la realidad.
Pablo Lavado
Gonzalo Rivera
Glosario de términos
MCG: Mínimos Cuadrados Generalizados
MCGF: Mínimos Cuadrados Generalizados Factibles
MCO: Mínimos Cuadrados Ordinarios
MELI: Mejor Estimador Lineal Insesgado
MLG: Modelo Lineal General
MV: Máxima Verosimilitud
PGD: Proceso Generador de Datos
PMC: Propensión Marginal a Consumir
SCE: Suma de Cuadrados Explicados
SCR: Suma de Cuadrados Residuales
SCT: Suma de Cuadrados Totales
TLC: Teorema del Límite Central
VI: Variables Instrumentales
Índice
INTRODUCCIÓN ............................................................................................................... 1
1. MODELO LINEAL GENERAL: MÍNIMOS CUADRADOS ORDINARIOS ..................... 5
2. INFERENCIA ............................................................................................................ 69
3. MÁXIMA VEROSIMILITUD ..................................................................................... 104
4. ERRORES NO ESFÉRICOS: HETEROCEDASTICIDAD ....................................... 128
4.1 HETEROCEDASTICIDAD ........................................................................................... 131
4.2 AUTOCORRELACIÓN ............................................................................................... 151
5. ENDOGENEIDAD................................................................................................... 167
6. BIBLIOGRAFÍA ....................................................................................................... 181
1. Modelo Lineal General: Mínimos Cuadrados Ordinarios
Problema 1.1
>
Solución
= − >0
Problema 1.2
Solución
Problema 1.3
Solución
Problema 1.4
Solución
Falso. Existe la posibilidad de tener un estimador con menor varianza al de MCO (siempre
que no se cumplan algunos supuestos) aunque estos sean sesgados (como el MCG).
Puede que el sesgo de un estimador sea tan grande que, a pesar de tener la menor
varianza, sea menos preferible que otro estimador sesgado. Esto dependerá
exclusivamente del propósito de la investigación.
Problema 1.5
El teorema del límite central (TLC) establece que la distribución de cualquier variable
aleatoria debe tener una distribución para que, en el límite, cuando el número de
observaciones tienda a infinito, converja a una distribución normal.
Solución
̅ [ ̅]
Falso. El TLC indica que todo promedio muestral estandarizando se distribuye
!"#[ ̅ ]
aproximadamente normal estándar, si el tamaño de muestra es lo suficientemente grande.
Problema 1.6
Solución
Problema 1.7
Solución
Problema 1.8
Si el estimador MCO cumple con distribuirse normalmente con media y varianza
& ′ cuando el tamaño de muestra tiende a infinito, entonces será un estimador
eficiente. Comente. Cambia su respuesta si no tiene media , ni varianza & ′ , pero
sigue distribuyéndose normal. Justifique.
Solución
Sin embargo, para que el estimador sea eficiente, es necesario verificar los siguientes
supuestos:
Ahora, en el caso de que no se cumpla que ()*+ ∼ - , & ′ , esto implica que no
se cumplen los supuestos de no contemporaneidad y homocedasticidad. Por lo tanto, el
comente continúa siendo falso.
Problema 1.9
Se desea calcular los determinantes del salario por hora para lo que se ha planteado la
siguiente regresión: 2343567 = 83ñ72 :; ;: <3<6ó> + + donde es la matriz del resto
de explicativas del modelo (asuma una correcta especificación del mismo).
Solución
Solución
Problema 1.10
Donde los valores de son determinísticos, =0y = & para todo 6. Obtenga
el estimador MCO de , diga si es insesgado y encuentre su varianza.
Solución
= −
F F
E =E −
G G
F F
min E =E − D
K
G G
0=E − D
G
F F
L
0=E −E D
G G
F F
D= E ′ E = ′ ′
G G
Para analizar el insesgamiento, se reemplaza = + :
F F
D= E ′ E +
G G
F F
D= + E ′ E
G G
D = + E ′ E
G G
Dado que =0
D =
D = [ D− D D− D ′]
D = [ D− D− ′]
F F F F
L L
D = [ME N E E ME N ]
G G G G
D = E ′ OE ′P E ′
G G G
D = E ′ OE ′P E ′
G G G
D =& E ´
G
Problema 1.11
Sea una variable que se distribuye normalmente con media $ y varianza & . Suponga
que se han obtenido independientemente dos muestras aleatorias simples a partir de ,
de tamaños / y / , y con medias S y S respectivamente.
a. Un investigador pretende estimar $ y propone como estimadores alternativos:
S + S / S +/ S
$̂ = ; $V =
2 / +/
Comparar las propiedades finitas de ambos: ¿los estimadores son insesgados? ¿Cuál de
ellos tiene menor varianza?
Solución
+ + ⋯+ Y 1 /$
S = W Z= [ + + ⋯+ \ Y ]^ = =$
/ / /
+ +⋯ Y_ −/$
[S − S ] = S −$ = W Z
/
1
S −$ = [ −$ + − $ + ⋯+ Y −$ ^
/
[ −$ + @ −$ ^ = −$ + @ −$ +2 [ −$ @ − $ ]
Dado que
[ −$ @ −$ ]= @ − $ − $ @ + $
[ −$ @ − $ ] = $ − 2$ + $ = 0
Con este resultado en mente, se obtiene que la varianza del promedio muestral es
1 /& &
S −$ = ` −$ + ⋯+ \ Y − $] a = =
/ / /
Sesgo
S + S 2$
$̂ = = =$
2 2
Varianza
S + S S −$ + S −$
35 $̂ = [$̂ − $̂ ] = i − $j = i j
2 2
1
35 $̂ = S −$ + S −$ +2 [ S −$ S −$ ]
4
Por lo tanto,
/ S +/ S − / +/ $
35 $V = i j
/ +/
1
35 $V = [/ S −$ +/ S −$ ]
/ +/
Y_d h d Ydd h d
Y_
+ Yd &
35 $V = = / +/ … 2
/ +/ / +/
/ +/ = / + / + 2/ /
/ +/ − 4/ / = / − / >0
Entonces,
/ +/ > 4/ / , si / l /
Por lo tanto,
35 $̂ > 35 $V , si / l /
¿Estos estimadores son sesgados? ¿Si es así, cuál de ellos presenta un menor sesgo?
Solución
Para mn :
p
m = S S = S S =$
Para mn :
S + S 1
mn = i j = [ S + S +2 S S ]
2 4
hd hd
q;2r7 mn = mn −$ =s +Y
Y_ d
Para mn :
hd hd
q;2r7 mn = mn −$ = +Y
Y_ d
Problema 1.12
=1+2 +
Donde tiene una distribución normal con media igual a 0 y varianza igual a 1. Además,
toma los valores: 1, 2, 3, 4, 5 y 6. El investigador simula 6 observaciones de con la
distribución asumida y obtiene:
= 0.464 s = −0.160
= 0.060 u = 1.022
= −1.500 w = 0.200
Otro investigador B solo tiene acceso a los datos de e generados por el investigador A
(pero no conoce el modelo verdadero) y a partir de ellos trata de obtener una estimación
del coeficientede la variable en el modelo verdadero, para lo cual utiliza dos
estimadores:
1 ∑ − S −S
x= w + u − − ; ( =
100 ∑ − S
Se pide:
Solución
= 1 + 2 1 + 0.464 = 3.464
= 1 + 2 2 + 0.060 = 5.060
= 1 + 2 3 − 1.5 = 5.500
s = 1 + 2 4 − 0.160 = 8.840
u = 1 + 2 5 + 1.022 = 12.022
u = 1 + 2 6 + 0.200 = 13.200
− ̅ −S − ̅ −S − ̅
1 1
x= w + u − − = 16.698 = 0.17
100 100
∑ − S −S 34.45
(= = = 2.08
∑ − S 17.5
Solución
( =
& &
}35\ ( ] = =
∑ − S 17.5
Sobre el estimador x :
1
\ x] = [ w + u − − ]
100
1 8
\ x] = w + u − − = = 0.08
100 100
\ x] − = 0.08 − = −0.92
Sobre su varianza:
1 4& &
}35\ x ] = [}35 w + }35 u + }35 + }35 ]= =
100 10000 2500
Solución
& 1
•€\ ( ] = 0 + }35\ ( ] = = = 0.05714.
17.5 17.5
&
•€\ x ] = [2;2r7 x ] + }35\ x ] = −0.92 + = 3.3856 + 0.0004 = 3.386
2500
Problema 1.13
= ‚ + +
se plantea la regresión:
∗ ∗ ∗ ∗
= ‚ + +}
con
∗ −S ∗ − ̅
= ; =
2ƒ 2
∑F −S ∑F − ̅
2ƒ = „ G ;2 = „ G
> >
∗ ∗ ∗
a) Tomando en cuenta las definiciones de y , interprete .
Solución
Solución
Nótese que:
F F F
∗ − ̅ 1
E =E = E − ̅ =0
2 2
G G G
∑FG ∗
̅∗ = =0
>
Por lo tanto,
(‚∗ = S ∗ − ( ∗ ̅ ∗ = 0
…
c) Muestre que ( ∗ = …† ( .
‡
Solución
∑FG ∗ ∗
(∗ =
∑FG \ ∗ ]
∑FG ∗ ∗ ∑FG − ̅ −S 2
…† …‡
(∗ = = = (
∑FG \ ∗ ] 2ƒ
b… f ∑FG − ̅
†
Solución
1 1 1
ˆ∗ = \( − ( ̅] = \ ˆ − (‚ − S + (‚ ] = ˆ −S
2ƒ 2ƒ 2ƒ
Además,
∗ −S ˆ −S −ˆ ˆ
}ˆ = − ˆ∗ = − = =
2ƒ 2ƒ 2ƒ 2ƒ
…†
e) Muestre que ;;\ ( ∗ ] = ;;\ ( ]. (Recordar que ;; denota “error estándar” y es nuestro
…‡
estimador de la desviación estándar del coeficiente MCO estimado).
Solución
!ˆ ∗
d Œd
‹
∑FG W… Z ∑FG F 2
;;\ ( ∗ ] = ‰ F
= i j ;; (
‡
=Š
∑FG ∗ 2ƒ
b… f ∑FG − ̅
†
F Œd
‹
2 ‰ ∑G F 2
( ∗
;;\ ] = i j = i j ;; (
2ƒ ∑FG − ̅ 2ƒ
Problema 1.14
Suponga que en el modelo de regresión lineal
Donde xŽ > 0 es una variable aleatoria escalar y se cumplen los supuestos S1* y S2*:
∑FG
D=
∑FG
F
∗∗
1
D = ∙E
>
G
Muestre que estos estimadores son consistentes, encuentre sus distribuciones asintóticas
y establezca cuál de ellos es asintóticamente más eficiente.
Solución
Consistencia de D
F F F F
∑FG
D= F = OE P OE + P= + OE P OE P
∑G
G G G G
Se aplica ‘46’:
F F
F F
1 1
‘46’ D = + ‘46’ O E P O E P
> >
G G
F
1 “
O E P →
>
G
1 “
” E •→
>
Entonces,
‘46’ D = +
‘46’ D = ⟺ =0
Distribución asintótica de D
∑FG F F
D= = ”E • `E + a= + ”E • `E a
∑FG G G
1 F 1
√- D − =” E • ” E •
- G √-
F
1 “
O E P →
>
G
Por TLC:
1 ˜
” E • → - , 35
√-
˜
√- D − → -\0, &™ ]
Consistencia D ∗∗
F F F
∗∗
1 1 + 1
D = E = E = + E
> > >
G G G
F
∗∗
1
‘46’ D = ‘46’ + ‘46’ E
>
G
F
∗∗
1
‘46’ D = + ‘46’ E
>
G
Entonces,
‘46’ D ∗∗ = +
‘46’ D ∗∗ = ⟺ = 0.
Distribución asintótica D ∗∗
F F F
∗∗
1 1 + 1
D = E = E = + E
> > >
G G G
F
∗∗
1
√- D − =O E P
√- G
Por TLC:
F
1 ˜
O E P → - W Z , 35 W Z
√- G
˜ 1
√- D ∗∗ − → - 0, &™
Comparación de varianzas
1 1
› W Z
Problema 1.15
∑œ•_ ƒ
En relación al estimador MCO D = ∑œ•_ d
, considerar un estimador alternativo como:
∑FG − ̅ −S
D∗ = F
∑G − ̅
Solución
∑FG − ̅ + − ̅− ̅
D∗ =
∑FG − ̅
∑FG − ̅ − ̅ + − ̅
D∗ =
∑FG − ̅
∑FG − ̅ ∑FG − ̅ − ̅
D∗ = F +
∑G − ̅ ∑FG − ̅
∑FG − ̅ − ̅
D∗ = + F
∑G − ̅
∑FG − ̅ ∑FG − ̅ ̅
D∗ = + −
∑FG − ̅ ∑FG − ̅
D∗ =
D∗ − D Ÿ0
& &
− Ÿ0
∑FG − ̅ ∑FG
∑FG − ∑FG − ̅
Ÿ0
∑FG F
− ̅ ∑G
∑FG − +2 ̅− ̅
Ÿ0
∑FG − ̅ ∑FG
2 ̅ ∑FG −> ̅
F Ÿ0
∑G − ̅ ∑FG
2> ̅ − > ̅
Ÿ0
∑FG − ̅ ∑FG
> ̅ Ÿ0
Solución
Se parte de recordar la definición de covarianza entre dos estimadores:
• D, D∗ = \ D − D∗ − ]
F F F F
• D, D∗ = ¢£ME N E ¤ £ME − ̅ N E − ̅ ¤¥
G G G G
F F
1 1
• D, D∗ = M E E − ̅ N
∑FG ∑FG − ̅
G G
F F
1 1
• D, D∗ = £ ME\ ] − ̅ E\ ]N¤
∑FG ∑FG − ̅
G G
F F
1 1
• D, D∗ = M & E − ̅E N
∑FG ∑FG − ̅
G G
F F
1 1
• D, D∗ = M & E ME − ̅ NN
∑FG ∑FG − ̅
G G
E − ̅ =E − ̅ − ̅
G G
F F F
E − ̅ − ̅ =E − ̅ −E − ̅ ̅
G G G
F F F F
E − ̅ −E − ̅ ̅=E − ̅ − ̅ ME − > ̅N
G G G G
E − ̅ =E − ̅
G G
&
• D, D∗ = i j= D
∑FG
Se propone el estimador:
D∗∗ = λb + 1 − λ D∗
D∗∗ = λ D + 1−λ D∗ + 2λ 1 − λ • D, D∗
D∗∗ = λ + 2λ − 2λ D + 1−λ D∗
D∗∗ = 2λ − λ D + 1−λ D∗
¦ D∗∗
= D 2 − 2λ + 2 1 − λ −1 D∗ = 0
¦λ
¦ D∗∗
= 2 D 1−λ −2 1−λ D∗ = 0
¦λ
2 1−λ D − D∗ =0
Problema 1.16
∑œ•_ ƒ
Considere un estimador alternativo a MCO (D = ∑œ•_ d
) como:
∑F G
D° =
∑FG
Solución
• D, D° = \ D − D° − ]
F F
∑F G
• D, D° = ¨£ME N E ¤i j©
∑FG
G G
F
1 ∑F G
• D, D° = £ E i j¤
∑FG ∑FG
G
&
• D, D° = = D
∑FG
D°° , = λ V b + 1 − λ D° + 2λ 1 − λ • D, D°
D°° , = λ V b + 1 − λ D° + 2λ 1 − λ D
D°° , = λ + 2λ − 2λ V b + 1 − λ D°
D°° , = 2λ − λ V b + 1 − λ D°
Para hallar el valor de λ que minimiza la varianza de este estimador alternativo, se halla:
¦ D°°
= b 2 − 2λ + 2 1 − λ −1 D° = 0
¦λ
b 1−λ − 1−λ D° = 0
1−λ \ b − D° ] = 0
Problema 1.17
Se define:
∑FG − ̅ −S
D∗ =
∑FG − ̅
∑F G
D° =
∑FG
Solución
• D∗ , D° = \ D∗ − D° − ]
∑FG − ̅ ∑F G
• D∗ , D° = Mi ji jN
∑FG − ̅ ∑FG
2
Revisar problemas 1.13 y 1.14 para contextualizarse mejor en el problema.
F
1 1
• D∗ , D° = M & E − ̅ N
∑FG ∑FG − ̅
G
• D∗ , D° = 0
Dc , = λ V D∗ + 1 − λ D° + 2λ 1 − λ • D∗ , D°
Dc , = λ V D∗ + 1 − λ D°
Para hallar el valor de λ que minimiza la varianza de este estimador alternativo, se halla:
¦ Dc
= D∗ 2λ + 2 1 − λ −1 D° = 0
¦λ
λV D∗ = 1 − λ D°
& >&
λ = 1−λ
∑FG − ̅ ∑FG
F F
λE = 1 − λ > ME −> ̅ N
G G
F F F
Entonces,
> ̅ > ̅
Dc = 1 − D∗ + D°
∑FG ∑FG
Problema 1.18
Solución
Se tiene:
•€ D ∗∗ , = D ∗∗ + D ∗∗ −
& ∑FG ž+ +
•€ D ∗∗ , = +M i − jN
∑FG ∑FG
& ∑FG ž
•€ D ∗∗ , = +i j
∑FG ∑FG
•€ D, = D + D−
& ∑FG − ̅ −S
•€ D, = +M i − jN
∑FG − ̅ F
∑G − ̅
& ∑FG − ̅ ž + + − žS − ̅ − ̅
•€ D, = +M i − jN
∑FG − ̅ ∑FG − ̅
& ∑FG − ̅ − ̅ + − ̅
•€ D, = +M i − jN
∑FG − ̅ ∑FG − ̅
& ∑FG − ̅ + − ̅ − ̅
•€ D, = +M i − jN
∑FG − ̅ ∑G F
− ̅
& ∑FG − ̅
•€ D, = +M i jN
∑FG − ̅ ∑FG − ̅
&
•€ D, = = D
∑FG − ̅
Entonces,
•€ D ∗∗ , < •€ D,
1 1 \∑FG ]
ž <& i − j F
∑FG − ̅ ∑FG ∑G
> ̅ \∑FG ]
ž <& i j
∑FG − ̅ ∑FG > ̅
∑FG
ž <& i j
> ∑FG − ̅
Luego, se tiene que una forma alternativa para encontrar el estimador del intercepto es:
3 = S − ̅D
Entonces,
3 = S − ̅D − 3
3 = S − ̅D − ž
3 = ž + ̅ + ̅ − ̅D − ž
3 = ̅ −D + ̅
3 = ̅ −D +2 ̅ −D ̅+ ̅
3 = ̅ −D +2 ̅ −D ̅ + ̅
3 = ̅ −D + ̅
& &
3 = ̅ +
∑FG − ̅ >
& ∑FG
3 =
> ∑FG − ̅
•€ D ∗∗ , < •€ D,
Si y solo si:
∑FG
ž <& i j= 3
> ∑FG − ̅
Problema 1.19
Una condición suficiente para que el estimador mínimo cuadrático sea insesgado es que
los errores sean independientes en media de la matriz . Por otro lado, para garantizar
consistencia no debe existir correlación contemporánea entre las variables explicativas y
el término de error.
Solución
Problema 1.20
Solución
• = + (Modelo Teórico)
• = ( + ; (Modelo Empírico)
Por lo tanto,
‘46’ ; − =0
‘46’\ − ( − − ]=0
‘46’\ − (] = 0
‘46’\ − ( ]=0
[‘46’ ][‘46’\ − ( ]] = 0
[‘46’ ][ − ‘46’ ( ] = 0
Asumiendo que se cumplen los supuestos del MLG (modelo lineal general) se sabe que el
estimador MCO de es consistente, lo cual implica que: ‘46’ « = . Finalmente:
[‘46’ ]∅ = 0
0=0
Problema 1.21
Una variable está determinada por una variable . La relación tiene la forma de
= + +
Donde es la perturbación que satisface los supuestos del modelo. Los valores de las
son tomados aleatoriamente de una población con varianza & . Un investigador comete
un error y regresiona sobre ajustando el modelo = : + : + , donde :( =
∑œ•_ ̅ ƒ ƒS
∑œ•_ ƒ ƒS d
.
Cuando se nota su error, el investigador señala la relación original puede ser escrita como
1 1
=− + −
Solución
3 El teorema de Slutsky señala que el límite probabilístico de un producto puede ser expresado
∑FG − ̅ −S
:( = F
∑G −S
∑FG b −- − - S + - Sf −S
-
:( = d d d d
∑FG −S
∑FG b −S − −S f −S
- -d
:( = d
∑FG −S
∑FG −S − ∑FG −S −S
-d -d
:( =
∑FG −S
∑FG −S − F ∑FG −S −S
F -d -d
:( =
∑FG −S
F
-d
}35 − - <7} ,
‘46’ :( = d
}35
1 1 <7} ,
‘46’ :( = −
}35
Problema 1.22
Solución
∑FG ∑ − ̅ −S ∑FG ∑ − ̅ −S
‘46’ ( = ‘46’ F = ‘46’ ³ + F ´
∑G ∑ − ̅ ∑G ∑ − ̅
•7} , •7} ,− ® +
‘46’ ( = + = +
& &
∗
•7} , ® •7} + ® ,®
‘46’ ( = − =−
& &
&° &°
‘46’ ( = − = ³1 − ´
& &
Problema 1.23
= +$ = + +$
Se pide:
Solución
Obteniendo µ
c
µ= − = − ¶ +
Sus propiedades:
µ = [ − ¶ + ]= − ¶ l0
µµ L = ·[ − ¶ + ][ L
− ¶ L + ]¸
µµ L = − ¶ L
− ¶ L + & ¹Y
L
`\µ − µ ]\µ − µ ] a = & ¹Y
Solución
(c = L L
= c
+ ′ L
µ
(c = c
+ L L[
− ¶ + ]= c
+ L L
(c = c
[ (c − c (c − c
′] = & ′
Problema 1.24
= ‚ + + +
&ƒ 5 ƒ − 5 5 ƒ
( =
& 1−5
Solución
Entonces se plantea:
( = VL € V VL €
Donde € = ¹ − V VL V VL
( = V ′ V − VL V VL V VL V VL − V ′ V V ′V V ′
&ƒ 5 ƒ − 5 5 ƒ
( =
& 1−5
Problema 1.25
Solución
= ( +;
= +
= n+
= −;+
;=
Recordar que una pendiente igual a 1 (en el caso que no haya intercepto en el modelo)
implica un ajuste perfecto (determinístico) entre la variable dependiente y la
independiente. Al regresionar contra su valor predicho n , se llega a que ; = . De ello,
se desprende que la regresión original a partir de la cual se obtuvo n y la nueva regresión
planteada se encuentran superpuestas. No obstante, la pendiente de la nueva regresión
no será exactamente uno en tanto exista un término de error reconocido en el modelo.
Problema 1.26
Se quiere regresionar una variable versus una variable » (la explicativa). Halle el
estimador MCO, si se sabe que » es el doble de .
Solución
= »+;
Por tanto, el estimador MCO de » sería (tomando en cuenta que solo hay una variable):
∑½G ¼
)*+ = »L» »L =
∑½G ¼
∑½G 2 2 ∑½G 1
)*+ = = =
∑½G 2 4 ∑½G 2
Este resultado es evidente ya que el valor esperado de la variable y siempre será la mitad
del que tome la variable Z; por construcción de esta última.
= ¾ + »+;
∑½G ¼ − ¼̅ −S ∑½G 2 − S −S 1
¿À¾ = ½ = ½ =
∑ G ¼ − ¼̅ ∑G 4 −S 2
En este segundo caso, el estimador MCO del intercepto resultará ser aproximadamente
cero.
Problema 1.27
Sean y dos variables aleatorias con varianzas finitas y positivas. Si se quiere predecir
a partir de una función lineal de la forma ž + , muestre que la elección de ž y que
* ,ƒ
minimiza el •€ ,ž + es = g
yž= − . Encuentre además el error
cuadrático medio de este predictor lineal.
Considere ahora el predictor de que se obtiene a partir de la combinación lineal de un
vector aleatorio . En particular, muestre que el vector que minimiza el •€ , L es
= ′ .
Solución
•€ ,ž + = \ − ž+ ]
€6> •€ ,ž +
€6> \ − ž + ]
¦Á
= b2\ − ž + ] − f=0
¦
¦Á
= −2 + 2ž + 2 =0
¦
¦Á
= − +ž + =0
¦
¦Á
=− +ž + =0
¦
−ž
=
Reemplazando ž = −
−\ − ]
=
− +
=
−
− =
−\ ] = −
−
=
−\ ]
• ,
=
L
Ahora, se muestra que el vector que minimiza el •€ , es =
′ :
•€ , ′ = − ′
€6> •€ , ′
€6> − ′
¦Á L
= 2 − − =0
¦
¦Á
= 2 −2 ′ =0
¦
− ′ =0
= ′
Problema 1.28
Demostrar qué ocurre con el estimador de mínimos cuadrados ordinarios cuando se omite
una variable relevante. ¿Qué pasa cuando se incluye una variable irrelevante?
Solución
Para ver qué es lo que ocurre ante estos dos casos, es necesario analizar cómo se ven
afectadas las propiedades del estimador MCO: insesgadez y eficiencia.
= +» + (M1)
= +; (M2)
Para analizar el efecto sobre las propiedades del estimador, se debe comparar los
resultados obtenidos bajo ambas especificaciones:
L L
(M1): = €Â ′€Â vs (M2): = ′
Sesgo
A priori, se puede ver que el estimador obtenido omitiendo una variable relevante se
encuentra sesgado. Para confirmar esta impresión, se procede a analizar si dicho
estimador es insesgado:
L L L L
,)*+ = = +» +
L L L
,)*+ = + ′» + L ′
Ahora, tomando el valor esperado de y reduciendo la expresión se llega a:
[ ,¿À¾ / , »] = [ L L
/ , »] + [ L L
» / , »] + [ L ′ / , »]
[ ,¿À¾ / , »] = + L L
» + L
′ [ / , »]
Eficiencia:
En segundo lugar, para analizar la varianza de MCO, se debe comparar la varianza bajo
ambas especificaciones:
L L
(M1): 35 / ,» = & €Â vs (M2): 35 / ,» = &
Al comparar ambas expresiones, es claro ver que la varianza del estimador del segundo
modelo es menor. Esto se puede apreciar si se diferencia los denominadores de ambas
expresiones; obteniendo que el del segundo modelo es mayor; y por tanto, dicho
estimador tendrá una menor varianza:
L L L L
− €Â = ¶Â = ¶Â ′¶Â > 0
L L
(M1): 35 / ,» = & €Â > (M2): 35 / ,» = &
= + (M3)
= +» +; (M4)
Al igual que el caso anterior, se analizará si el estimador MCO del M4 presenta un sesgo:
,)*+ = L €Â L
€Â = L €Â L
€Â +» +
L L
,)*+ = €Â €Â + L €Â ′€Â » + L €Â ′€Â
Recordar que el producto del “hacedor de residuos”, €, de una variable y ella misma es
cero (€Â » = 0 . De esta manera, simplificando, se llega a:
L
,¿À¾ = + €Â ′€Â
[ ,¿À¾ / , »] =
Eficiencia:
Problema 1.29
Solución
( = ′ ′ + +
( = + ′ ′ ′ + ′ ′
( = + ′ ′ ′ + ′ ′
( = + ′ ′ ′
Por otro lado, el estimador usual de la varianza del error está dado por:
;′;
2 =
>
; ′;
2 =
>
Donde ; = − ( . Entonces,
; = + + − (
L L L
; = + + − + ′ + ′
L L L L
; = + − ′ +
; = + –¶ +¶
; = ¹−¶ + ¹−¶
; =€ +€
; ′; = ′€ ′€ + ′€ ′€ + ′€ ′€ + ′€ €
; ′; = ′€ + ′€ + ′€ + ′€
; ′; = ′ − ′ ′ ′ + ′ − ′ ′ ′ + ′
− ′ ′ ′ + ′ − ′ ′ ′
Tomando esperanzas y teniendo en cuenta que los errores son ortogonales a las :
; ′; = ′ − ′ ′ ′ +&
; ′; = ′€ +& ¹
Problema 1.30
Recuerde que los modelos que estima van cambiando según agrega o quita variables,
así que debe de especificar con qué modelo final está trabajando y que
transformaciones le haría a la data de ser conveniente.
Solución
El modelo teórico considera aquellas variables que son parte del proceso generador
de datos. Así, el modelo teórico es el siguiente:
+ w 2; 7+ Ê: + Ë: + Ì: , + ‚ :5@ +
Donde las características del hogar y la vivienda seleccionadas son: nivel educativo
del jefe de hogar, ingreso del hogar, material del hogar, tipo de alumbrado y fuentes
de comunicación como radio y televisión. •ÇÁ está compuesto por indicadores de
número promedio de alumnos por aula en los colegios, material predominante en el
colegio, años de experiencia promedio de los profesores y si es el colegio es
multigrado y si tiene más de un turno.
En este caso, desde que se cuenta con toda la información disponible observable es
posible en principio estimar el modelo. El problema radica en que no se puede
incluir el efecto individual debido ya que no es observable (como es un corte
transversal tampoco se puede hacer un modelo de efectos aleatorios). Es decir, el
modelo usado al momento de la estimación no tendría problemas si no fuera por el
ž, el cual lleva un estimador sesgado pero consistente.
El punto principal radica en que no exista correlación entre los ž y los errores. En
segunda instancia, que la variable dependiente sea comparable entre los distintos
colegios y que no se presente error de medición en ningún regresor por lo difícil de
estandarizar la data a nivel nacional.
Solución
Tales supuestos son poco realistas en la medida que en el error existan factores
idiosincráticos como el esfuerzo de los padres por educar a sus hijos o
institucionales relativos a cada comunidad y centro escolar. Es decir, debe
observarse si existe alguna correlación entre el ž y las .
Problema 1.31
pero, por diversas razones, realiza una regresión de "q343567" sobre ";:3:" y "3ñ72_;: <"
únicamente. Respecto a los estimadores de mínimos cuadrados del modelo estimado
¿serán consistentes? ¿es posible que uno de ellos sea consistente y el otro no? Explique.
Solución
En tanto existe una variable relevante omitida, la consistencia de los estimadores puede
verse afectada. El estimador de será consistente si y solo si = 0. Ello, sin
embargo, no implica que el otro estimador sea también consistente, lo cual se dará si
= 0 ya que la variable formaría parte del error en el modelo estimado.
Problema 1.32
Solución
b. ¿Por qué log >7 y 577’2 pueden estar negativamente correlacionados? Y ¿en
qué caso, la regresión simple de log ‘56<; sobre log >7 produce un estimador de
con sesgo al alza o a la baja?
Solución
Si se realiza la regresión solo entre log ‘56<; y log >7 , se estaría omitiendo una
variable relevante. Sobre la base de la tabla 1.2, se puede decir que, debido a que
4 También podría darse el caso en el que las variables estén correlacionadas positivamente si se
asume que a mayor número de cuartos existe un mayor nivel de contaminación dado que existe un
mayor número de personas dentro de la vivienda, lo cual implica una mayor cantidad de
desperdicios generados.
<755 , <0 y > 0, el estimador ( podría tener un sesgo negativo. Sin
embargo, como < 0, esto implicaría que se estaría sobrestimando el efecto
negativo de la polución; es decir, existe un sesgo positivo.
log ‘5Ó<;
Ô = 11.71 − 1.043 log >7 , > = 506, Õ = 0.264.
log ‘5Ó<;
Ô = 9.23 − 0.718 log >7 + 0.306577’2, > = 506, Õ = 0.514.
Solución
Problema 1.33
Solución
Problema 1.34
Ö?˜ = ž + ¶? + ?
Ö?¾ = × + 8¶? + $?
Ö?˜ = Ö?¾
Solución
Ö?˜ = Ö?¾ = Ö?
Ö? = ž + ¶? + ?
Sin embargo, se sabe que tanto las cantidades y los precios son determinados casi de
manera simultánea; por lo que otra ecuación relevante sería de la forma:
× Ö? $?
¶? = − + −
8 8 8
Problema 1.35
Solución
Para ver qué ocurre cuando se modifican las explicativas en un modelo, es necesario
comparar los estimadores de ambos modelos. El estimador MCO del modelo inicial es:
L L
,¿À¾ = €‚ €‚
Ahora es necesario hallar el estimador del otro modelo y tratar de expresarlo en términos
del inicial. El primer caso es en el que se multiplica por una constante a los valores de ;
por lo que se debe definir la variable:
∗
=Ø
( =\ ∗L ∗ ∗L
€‚ ] €‚
∗
Reemplazando el valor de :
( = Ø L €‚ Ø Ø L €‚
( =Ø L
€‚ L
€‚
( =Ø ,)*+
Es decir, cuando se multiplica a las explicativas por una misma constante, el estimador
original queda multiplicado por la inversa de dicha constante.
Reemplazando y reagrupando:
= ¾ + +8 +
= ¾+ 8 + +
= ž + + ; :7>:; ž = ¾+ 8
p=[ ∗∗
− SSSSS
∗∗ L ∗∗
− SSSSS
∗∗ ] [ ∗∗
− SSSSS
∗∗ ′ −S ]
En efecto, se puede observar que sumarle una constante a las explicativas no afecta el
estimador relacionado a las pendientes.
Problema 1.36
Un investigador desea hallar los determinantes del consumo de helados. Para eso, ha
estimado una ecuación de la forma:
n = 20 + 100•
Õqq = 1020
Õ = 0.90
Qué pasaría con los siguientes componentes de la regresión si en vez de usar grados
Celsius se hubiera utilizado grados Fahrenheit ( ). Explique matemáticamente (Recuerde
que = 1.8• + 32 .
• El coeficiente estimado de
• El estimador del intercepto
• La suma de errores al cuadrado (SCR)
Solución
Ù
• A partir de = 1.8• + 32, se tiene que • = . Con esto, se reemplaza en la
.Ë
Ù
ecuación principal tal que n = 20 + 100 b f = −1757.7 + 55.5 . Entonces, el
.Ë
coeficiente estimado de es 11.1.
• El estimador del intercepto es: -1757.7.
• Luego, como el n no ha cambiado y la q•Õ = ∑FÚG − n , se tiene que la SCR
tampoco ha cambiado y sigue siendo 1020.
Problema 1.37
Solución
En primer lugar, se debe notar que, de acuerdo con la forma en la que está planteada la
regresión, se trata claramente de una regresión particionada. En este caso, se está
dividiendo a las variables explicativas en dos grupos: el intercepto y las variables de
interés. Tomando esto en cuenta, se puede definir las matrices “¶” y “€” (hacedor de
estimados y residuos respectivamente) como:
66′ 66′
¶‚ = 6 6 L 6 6L = €‚ = ¹ − ¶‚ = ¹ −
- -
Donde 6 representa un vector de (> >) lleno de unos. De esta manera, se puede ver que
multiplicando por €‚ al modelo inicial, se obtiene el modelo original pero con las variables
desviadas de su media:
€‚ = €‚ 6′ ‚ + €‚ + €‚ ;
−S = − S +;
Por tanto, se puede ver que el estimador MCO de en ambos modelos resulta ser el
mismo. Por otro lado, el teorema de Frisch-Waugh establece que el estimador MCO de
de una regresión particionada ( = + + ;) será el mismo que el estimador MCO
de ž en la siguiente regresión de residuos: ; Ûd = ž; _
d
+ }, donde } = € ;.
ž = ; _ ′ ; _
; _ ′; Û
L
ž = \ €‚ €‚ ] €‚ ′€‚
L
ž = \ €‚ €‚ ] €‚ ′€‚
∑ −S − S
ž= =
∑ − S
Por lo tanto, dicho modelo con intercepto sí tiene una relación con el teorema de Frisch-
Waugh.
Problema 1.38
En la siguiente regresión:
=ž+ +;
Solución
Para evaluar qué sucede en los tres casos que se plantean en el problema, se tiene:
∗
= −S
∗
= − ̅
Entonces, si se transforman e :
∗ ∗
= +;
(= ∗
′ ∗ ∗ ∗
(=\ − ̅ − ̅ ] − ̅ −S
(= ′€‚ ′€‚
Si se transforma solo :
∗
= +;
(= ∗
′ ∗ ∗
(=\ − ̅ − ̅ ] − ̅
(= ′€‚ ′€‚
Si se transforma solo :
∗
= +;
(= ′ ′ ∗
(= ′ ′ −S
(= ′ €‚
Entonces, en el primer y segundo caso, se obtienen los mismos resultado; sin embargo, si
se desvía solo respecto de su media, esto no ocurre. Como €‚ es idempotente al
limpiar a del efecto de su media, se está limpiando a de la suya, pero al revés no
ocurre lo mismo.
Problema 1.39
∑FG − ̅ −S ∑FG − ̅
D= = F
∑FG − ̅ ∑G − ̅
3 = S − ̅D
∑œ•_ ƒ ∑œ•_
Donde S = F
y ̅= F
son los promedios muéstrales de y respectivamente.
Compare estos resultados con el caso general sin intercepto.
Solución
F F
L
D = ME N E
G G
F
Þ > E á
F F
1 Ý à
G
E L
= E” •=Ý F F
à
G G
Ý à
ÝE E à
ÜG G ß
F F F
Þ > E á ÞE á
F −E
Ý à 1 Ý à
G
ME N =Ý F F
à = Ý GF G à
Ý à > ∑FG − ∑FG Ý à
G
ÝE E à Ý− E > à
ÜG G ß Ü G ß
Donde
F F F
F F F
F F F
F F F
>E − ME N = > OE − ̅ − ̅ P
G G G
F F F
Entonces,
∑FG ∑FG
F Þ − á
L Ý ∆ ∆ à
ME N =Ý ̅ 1 à
G Ý− F à
Ü [∑ G − ̅ ^ [∑FG − ̅ ^ß
En segundo lugar, para este caso particular, se evalúa la forma que toma: ∑FG
F
Þ E á
F F
1 Ý à
E = E” • = Ý FG à
G G
Ý à
ÝE à
ÜG ß
Entonces,
F
∑FG ∑FG Þ á
Þ − áÝ E à
ž ∆ ∆
= ` a = ÝÝ ̅ 1
àÝ G
àÝ F à
Ý− F à à
Ü [∑ G − ̅ ^ [∑FG − ̅ ^ß ÝE à
ÜG ß
Donde
F F
∑FG ∑FG
ž= E − E = S − ̅D
∆ ∆
G G
F F
̅ 1
=− E − E
[∑FG − ̅ ^ [∑FG − ̅ ^
G G
Problema 1.40
Solución
Dado que el modelo posee intercepto, el modelo puede ser expresado como desviaciones
con respecto a la media:
−S= − ̅ +
∑FG − ̅ −S
( =
F
∑G − ̅
Reemplazando − S , se obtiene
∑FG − ̅
( = + F
∑G − ̅
∑FG − ̅
[( ã ]= ³ + ä ´
∑FG − ̅
∑FG − ̅ [ | ]
= + F
∑G − ̅
m ∑FG − ̅
= +
∑FG − ̅
Dado que m es constante, se puede sacar de la sumatoria. Luego, se usa el hecho que
∑FG − ̅ = 0. Así,
[ ( ã ] =
[ (‚ ã ] = [ S − ( ̅ ã ^
Sustituyendo S = ‚ + ̅ + S,
[ (‚ ã ] = [ ‚ +\ − ( ] ̅ + Sã ^
[ (‚ ã ] = ‚ + [\ − ( ]ã ^ ̅ + [S| ]
Dado que [ ( ] = .
∑FG
[ (‚ ã ] = ‚+ ³ ä ´
>
∑FG [ | ]
[ (‚ ã ] = ‚+
>
[ (‚ ã ] = ‚ +m
Problema 1.41
Solución
Se define:
3 = [1 … 0]
F
1
̅= E
>
G
L
1
̅=
>
L
1
S=
>
3L L
D = 3L L
L L
3 D= 3
1 LD = 1
̅ LD = S
3L L ;
=0
>
3 L;
=0
>
1L ;
=0
>
;̅ = 0
Problema 1.42
Solución
| = +
L L
D = € €
L L
De la definición € = ¹ − ,
Donde 6 = [1 … 1]
Entonces,
L ´
D = ¹ − 6 6L6 6L ¹ − 6 6L6 6L
D = ′ − ′6 6 L 6 6L ′ − ′6 6 L 6 6L
′6 6′ ′6 6′
D =i ′ − j i ´ − j
> >
F F
∑FG ∑FG ∑FG
D = ME − N ME − N
> >
G G
F
> > ∑FG
D = i> − j ME − N
> >
G
>S − >S
D =W Z
>−>
>S − >S
D =W Z
>
D =S −S
D = S−D ̅
D = S− S − S ̅
Se sabe que
F
>
̅ =E =
>
G
Entonces,
>
D = S− S − S
>
>S − S > + S >
D =
>
> SSS + > SSS − SSS> + SSS>
D =
>
> SSS + SSS>
D =
>
D = SSS
Problema 1.43
Dadas las siguientes expresiones del modelo lineal: n = ( y $̂ = − ( . Se pide:
Solución
Y
Ö=E − ‚ − − ⋯− ç ç
G
Solución
E =E n +Eˆ
G G G
E =En
G G
c) Demostrar que n L n = ( L ′ .
Solución
n L n = \ ( ]L ( = ( L (= ( L L L
= (′ ′
d) Demostrar que $̂ L $̂ = L
− (L ′ .
Solución
ˆL ˆ = \ L
− (L L
]\ − (] = L
− L ( − «′ L
+ ( ′ (
Y al ser ( ′ L
un escalar, se puede escribir igual que su traspuesta ′ (
ˆL ˆ = L
− 2 «′ L
+ (L L (= L
− 2 (L L
+ (L L L L
= L
− 2 (L L
+ (L L
= L
− (′ ′
1 0 1 2 1
2 2 0 -1 0
2 2 5 10 5
Solución
Ordenando matricialmente, se tendría luego:
5 3 3
L L
= O3 7 −4P ; | | = 19;
3 −4 9
L
1 47 −39 −33 L
24
= O−39 36 29 P ; = M 28 N
19
−33 29 26 −2
1 −1 2 24 1.2631
Þ1 0 2 á 102/19 Þ 38 á Þ 2 á
1 Ý
n= ( = Ý1 1 à
0 à M 14/19 N =
à Ý à
116à = Ý6.1052à
Ý 19 Ý
Ý1 2 −1à −32/19 Ý162à Ý 8.263 à
Ü1 1 0ß Ü116ß Ü6.1052ß
Y Y
En =E = 24
‚
Problema 1.44
Se supone que se ha estimado la siguiente ecuación utilizando MCO (con las variables
medidas en logaritmos):
? = ‚ + ? + ? + $? , è = 1, … … 17.
Se pide:
Solución
L
La varianza de los estimadores está dada por la expresión & , donde & es
un escalar cuyo estimador insesgado viene dado por:
ˆ′
&ˆ =
/−Å
L
Conocida solo falta estimar ˆ′ ˆ
ˆ= − (= − L L
ˆL = [ L
− L L L ][
− L L ]
L L L L L L L L L
= − − + ′ ′ ′
L L L L L [¹ L L]
= − = − = 0.0028
Entonces
0.0028
&ˆ = = 0.0002
17 − 3
Problema 1.45
Un investigador ha estimado el siguiente modelo con una muestra de 5 observaciones:
? = + ? + ?
Una vez realizada la estimación extravía toda la información de que disponía excepto la
que aparece en la tabla 1.4.
Núm. Xt uˆ t
obs.
1 1 2
2 3 -3
3 4 0
4 5 ¿?
5 6 ¿?
Con la información anterior el investigador debe calcular una estimación de la varianza de
las perturbaciones aleatorias ¿Cómo debe proceder?
Solución
El primer problema que se debe resolver es hallar los valores de los residuos para las
observaciones número 4 y 5. Para ello, se considera que las dos ecuaciones normales de
los coeficientes imponen restricciones sobre los residuos, ya que:
Y
E ˆ? = 0
?G
E ˆ? ? =0
?G
Entonces,
ˆ + ˆ + ˆ + ˆs + ˆu = 0
ˆ +ˆ +ˆ + ˆs s + ˆu u =0
2 − 3 + 0 + ˆs + ˆu = 0
2 1 − 3 3 + 0 4 + 5 ˆs + 6 ˆu = 0
Es decir,
ˆs + ˆu = 1
5 ˆs + 6 ˆu = 7
Resolviendo el sistema:
ˆ s = −1
ˆu = 2
∑Y?G ˆ ?
&ˆ™ =
/−2
Aplicando la fórmula:
∑u?G ˆ ? 2 + −3 + 0 + −1 +2
&ˆ™ = = =6
5−2 3
Problema 1.46
Solución
¿À¾ =\ − S L
− S ] − S ′ −S
L
¿À¾ = \ €‚ €‚ ] €‚ ′ €‚
L
¿À¾ = \ €‚ €‚ ] €‚ ′
Por tanto, se puede concluir que el modelo arroja el mismo estimador si se transforma
tanto la dependiente y las explicativas como si sólo se transforma las explicativas. El
último caso es:
∗
(iii) El modelo con sólo Y transformada: = + ;:
∗
¿À¾ = ′ ′
¿À¾ = L
′ −S
L
¿À¾ = ′€‚ … (3)
Problema 1.47
El teorema de Gauss Markov sostiene que MCO es el MELI. El estimador ( de este
ejercicio corresponde al Mejor Estimador Lineal de , esto es, el estimador que minimiza
el ECM dentro del grupo de todos los estimadores lineales (sean estos sesgados o
insesgados).
∑FG
(=
hd
∑FG + -d
Solución
Ahora, se halla el valor de < que minimiza esta función •€ <´ , tal que:
8 •€ <´ ,
= 2& < + 2 <´ −1 = 0, ∀6
8<
F
<&
= 1 − E< ´
G
F
<
= 1 − E< ´ , ∀6
&
G
F
< < @
= 1−E @
&
@G
F
< <
= 1− E @
&
@G
F
< <
= 1− E @
&
@G
F
< &
£ +E @ ¤=1
@G
< = hd
-d
+ ∑F@G @
Solución
∑FG
\ (] = hd
l
∑FG +
-d
∑FG
\ (] − = hd
−
∑FG + -d
hd
∑FG − ∑FG − -
\ (] − = hd
∑FG + -d
hd
-
\ (] − =− hd
∑FG + -d
Solución
•€\ ( , ] = (−
∑FG +
•€\ ( , ] = hd
−
∑FG + -d
hd
∑FG + − ∑FG −
-
•€\ ( , ] = hd
∑FG + -d
hd
∑FG − -
•€\ ( , ] = hd
∑FG + -d
F
1 &
•€\ ( , ] = E & −i j
hd
b∑FG + -d f G
F
& &
•€\ ( , ] = E −
hd
b∑FG + f G
-d
hd
Entonces, como -d > 0, se tiene que:
& &
•€\ ( , ] = < = •€ D)*+ ,
∑FG +
hd ∑FG
-d
Problema 1.48
Si al trabajar con el logaritmo de las variables del modelo obtengo un R2 mayor que al
trabajar con las variables en niveles, ¿puede concluir que el modelo en logaritmos es
“mejor”?
Solución
En primer lugar, hay que notar que cuando se aplican logaritmos a las variables se está
modificando la escala de la regresión. En particular, lo que ocurre es que se reduce la
dispersión de los datos. Esto conlleva a obtener una menor Suma de Cuadrados Totales
(SCT), y; por ende, un mayor R2.
Problema 1.49
Una regresión del residuo MCO sobre los regresores del modelo que los generó dará por
construcción un R2 igual a cero.
Solución
Los coeficiente de una regresión de los residuos contra los X que los generan son por
L L« « = 0 (de las ecuaciones
definición iguales a cero: ñ = 0, dado que L ñ
normales). Ahora, esto implica que el R será igual a cero puesto que: (1) cada valor
2
ajustado de esta regresión será igual a cero, y (2) que el promedio de los residuos es
igual a cero – ambos puntos implican que la SEC (suma explicada de cuadrados) de esta
regresión será cero. Luego basta recordar:
∑FG ˆ − S q•
Õ = =
∑FG −S q•/
Problema 1.50
Considere tres variables -, É e , con media cero y varianzas unitarias. Una cuarta
variable es creada como • = - + É. Se sabe que (i) en una regresión de • contra , se
obtiene que el coeficiente es 0.8, (ii) en una regresión de • contra -, se obtiene que el
coeficiente es 0.5 y (iii) en una regresión de É contra , el coeficiente obtenido es 0.4. ¿A
cuánto equivale la suma de cuadrados residuales (SCR) en una regresión de C contra D?
Considere que hay 21 observaciones.
Solución
Ahora, primero veamos que es lo que se necesita obtener para obtener la SCR. Sabemos
que esta suma equivale a:
•7} •; É
q•Õ = > − 1 E ; = E < − D: = E< − D : = • −i j É
É
•7} •; É
q•Õ = > − 1 ò • −i j É ó
É
Como sabemos que las varianzas son unitarias; lo único que debemos hallar es la
covarianza entre C y D; y la covarianza entre N y D.
Dado que las variables tienen media cero, los coeficientes proporcionados nos
proporcionan en general la covarianza entre la varianza. Sin embargo, como la varianza
de cada variable es unitaria; en general, los coeficientes que nos dan nos están diciendo
las covarianzas entre las variables relacionadas.
•7} É; = 0.4
• = 2\1 + −0.5 ] = 1
0.5
q•Õ = 21 − 1 ô1 − W Z 1õ = 15
1
Problema 1.51
Considere una regresión lineal bajo los supuestos de homocedasticidad del término de
error y dado y el de distribución normal del término de error dado también.
Considere, además estimadores de & de la forma:
;′;
2¿ =
’
Solución
El primer paso consiste en hallar la función a optimizar, que tal y como se solicita, es la
siguiente:
;′; ;′;
35r’6>¿ −& −& ′
’ ’
;′;
35r’6>¿ −&
’
ÍLÍ
¦ −& ;′; ;′;
¿
= i2 i − & j −1 j=0
¦’ ’ ’
;′; ;′;
Mi −& j N= 0
’ ’
; L; ; L ; ;′;
i j−& i j=0
’ ’
; L ; ; L;
i j=& ;′;
’
= −
Se tiene que:
; L; + ;L;
=& ;′;
’
; L; + ;L;
=’
& ;′;
; L; ;L;
’= +
& ;′; &
2& s > − Å
’= + >−Å
& ;′;
2& > − Å
’= + >−Å
; L;
2& > − Å
’= F ç
+ >−Å
hd
’ =2+ >−Å
Problema 1.52
Muestre que si D es el estimador MCO de la regresión de sobre y si < es cualquier otro
vector de Å 1, se cumple lo siguiente:
Solución
Primero se llega a la expresión planteada en la pregunta. Para ello, se define las
siguientes ecuaciones:
= D+;
= D+
′ = − D ′ − D + <−D ′ ′ <−D
Si se reemplaza ;:
Problema 2.1
Solución
Falso. El nivel de significancia refleja la probabilidad de cometer Error Tipo 1, esto es, la
probabilidad de rechazar ù¾ dado que la ù¾ es verdadera. Para una muestra, existe un
nivel determinado de trade-off entre la probabilidad de cometer Error Tipo I y II. Para
reducir el error tipo II sin incrementar el Error Tipo I es necesario incrementar el tamaño
de la muestra.
Problema 2.2
¿Qué es el nivel de potencia de una prueba de hipótesis y cuál es la relación que tiene
con el nivel de significancia?
Solución
Problema 2.3
En una prueba de significancia individual, siempre que el è calculado (èÀ"ú ) sea menor al è
de tabla puedo asegurar que la variable es no significativa.
Solución
Problema 2.4
Solución
«
ã- -ã
Hipótesis nula de no significancia recae en el èÀ"ú = . Si disminuye la varianza del
hû
«
estimador, entonces el èÀ"ú aumenta. Considerando que se trabaja con el valor absoluto,
el objetivo de la prueba è es conocer si el coeficiente de ( es estadísticamente
significativo (proviene de una distribución en la cual el valor más probable, el parámetro,
es diferente de cero) o si el valor obtenido toma su valor debido a la varianza (el
coeficiente efectivamente proviene de una distribución centrada en cero pero por un tema
de varianza, aleatoriedad, el valor del coeficiente resultó diferente de cero). Es por ello
que se divide entre la desviación estándar y se compara con el è de tabla. Así, ante un
mayor èÀ"ú , se disminuye la posibilidad de aceptación de la hipótesis nula. Por lo tanto, el
comente es falso, sin importar si el coeficiente sea positivo o negativo.
Problema 2.5
Si existe evidencia estadística suficiente para rechazar que solo uno de los regresores
incluidos en un determinado modelo es distinto de cero (es decir que todos los demás
regresores son no significativos), entonces es probable que la prueba de significancia
conjunta lleve a no rechazar la ù‚ .
Solución
Problema 2.6
Solución
Problema 2.7
A medida que la correlación entre las variables explicativas tiende a uno, la potencia de la
prueba de hipótesis de no significancia individual crece.
Solución
35 ( = &™ L
۟
35 ( = &™ L
¹ − ¶ü
35 ( = &™ L
− ′¶ü
L
&™ ¶ü
35 ( = L i1 − L j
&™
35 ( = L
1−Õ
Problema 2.8
Solución
1
Á ,λ = − ´ − + λ´ Õ − 5
2
A partir de (1):
Õ´λ ´ − ´
´ Õ´λ ´ ´ −
Además, se premultiplica por Õ para poder encontrar una forma cuadrada que se pueda
invertir:
Õ ´ Õ´λ ÕD)*+ − Õ
Õ ´ Õ´ Õ ´ Õ´λ Õ ´ Õ´ ÕD)*+ − Õ
λ Õ ´ Õ´ ÕD)*+ − 5
D)*+ − ´ Õ´ Õ ´ Õ´ ÕD)*+ − 5
Õ ÕD)*+ − ÕD)*+ − 5
Õ 5
Problema 2.9
()* ()*+ − L
ÕL Õ L
ÕL Õ ()*+ 5
Solución
Además,
;# #
e# b ()*+ L
ÕL Õ L
ÕL \Õ ()*+ 5]f
e# e…# + ( L
ÕL Õ L
ÕL \Õ ()*+ 5]
ù ( L
ÕL Õ L
ÕL \Õ ()*+ 5]
Entonces:
\Õ ()*+
L
eL# e# eL…# e…# + b ( L
ÕL Õ L
ÕL 5]f
b ( L
ÕL Õ L
ÕL \Õ ()*+ 5]f
\Õ ()*+
L
eL# e# eL…# e…# + b L
ÕL Õ L
ÕL 5]f
b L
ÕL Õ L
ÕL \Õ ()*+ 5]f
(iii) Cada año adicional de estudios lleva a un incremento del orden del 7.5% en el
ingreso mensual.
Solución
‚
‘;5 se calcula como la edad menos los
expresa el valor promedio del logaritmo del ingreso mensual cuando los valores de
las demás variables son iguales a cero.
años de educación. Cabe señalar también que, en la práctica, los modelos presentan
cierto grado de colinealidad o multicolinealidad, las variables explicativas no son del
todo ortogonales. Sin embargo, es posible permitir cierto grado de multicolinealidad
lineal de otras. Por su parte, : < busca introducir en el modelo el hecho que el
ya que el objetivo es que ninguna variable se pueda definir como una combinación
Solución
Problema 2.11
Así, se le pide que verifique las hipótesis siguientes sabiendo que è‚.‚ u 1.96:
a) Verifique la hipótesis de que las elasticidades del capital y trabajo son idénticas.
Solución
ù¾ : ž 0
ù¾ : ž − ≠ 0
(0.632 − 0.452)
èÀ"ú = = 2.842498
(0.257) + (0.219) + 2(0.055)
Solución
ù¾ : ž + 1
ù¾ : ž + ≠1
(0.632 + 0.452) − 1
èÀ"ú = = 0.177478
(0.257) + 0.219) + 2 0.055)
Problema 2.12
Se le pide que comente la siguiente regresión de Mincer5 y analice de manera detallada
Solución
nula. Si ‘ − }34 ; > 5% (valor de significancia que se fija), entonces se acepta la hipótesis
nula. Si ‘ − }34 ; < 5% entonces se rechaza la hipótesis nula. Notar que, en este caso,
dado que la hipótesis nula es que el = 0, lo que se busca es que se rechace dicha
hipótesis.
El Õ2 es una medida de bondad de ajuste, que en este caso indica que el modelo, como
prueba de significancia global. En este caso dicho ‘ − }34 ; es menor al 5%, por ende, se
está planteado, no está explicando la variabilidad de la dependiente. La prueba es una
rechaza la ù¾ de la prueba (ù¾ de la prueba es que todos los betas son iguales a
cero).
Problema 2.13
5 Se conoce como regresión de Mincer a aquellas ecuaciones que buscan explicar el salario de las
47r ¶
(0.26)
0.24
47r
(0.62)
2.35
(0.30)
Solución
è de
47r ¶ (se define como 8 ) es (0.24)/(0.62) < 1.96, por lo que no se rechaza
El test de significancia individual para el coeficiente
si se realiza otro test t teniendo como hipótesis nula, por ejemplo, 8 = 0.01,
b) Suponga que el gobierno impone un impuesto que incrementa el precio del vino en
10%. ¿Qué efecto tendrá este impuesto sobre el consumo de vino? Dé una
respuesta numérica.
Solución
Se consideran dos respuestas correctas, aunque una es más precisa que la otra.
¶° ¦• ¦ log •
= =δ
• ¦¶° ¦ log ¶°
exacto, se asume que un cambio de ∆¶° en el precio del vino ocasiona un cambio
cuenta con un cambio potencialmente grande (10%). Para calcular el efecto
Se obtiene:
∆• ∆¶°
log W1 + Z 1.34 log W1 + Z
• ¶°
∆• ∆¶° . s
W1 + Z 1 = (1 + 10%) . s
− 1 = −11.2%
• ¶°
c) Alguien sugiere que la demanda debería depender de los precios pero relativos al
ingreso. Es decir, se sugiere que el modelo debería ser:
¶° ¶
log • ‚ + log W Z + log W Z + +ñ
¿Qué valores de los coeficientes obtendría si estima este modelo por MCO?
Solución
¶° ¶
log • ‚ + log W Z + log W Z + log + ñ
d) Alguien más le sugiere que debería incluir los precios relativos del vino y la
cerveza. Es decir, se sugiere que el modelo debería ser:
¶°
log • + log ¶° + log ¶ + log + +ñ
‚
¶ s
Solución
6 . 47rÈ log È
Este modelo exhibe colinealidad perfecta pues se tiene que log b ² f
log ¶° log ¶ . Por lo tanto, no puede ser estimado.
Solución
La figura muestra un patrón entre los residuos y los valores ajustados: los residuos
tienden a ser negativos en los bordes, y positivos en el centro. Esto es una
indicación de que existiría alguna relación no lineal entre las X y la Y que no está
siendo capturada por nuestra regresión lineal.
Problema 2.14
ventas (‘57 ’35r), el número de años del individuo en la compañía (<7’è;>) y el número
de las empresas (’Åè}34), los beneficios netos de las empresas como porcentaje de las
47r 234;2
Independientes
0.224 0.158 0.188
47r ’Åè}34
(0.27) (0.40) (0.40)
-- 0.112 0.100
‘57 ’35r
-- (0.05) (0.049)
-- -0.0023 -0.0022
<;7è;>
-- (0.022) (0.0021)
-- -- 0.0171
<7’è;>
-- -- (0.0055)
-- -- -0.0092
<7>2è3>è;
-- -- (0.0033)
4.94 4.62 4.57
(0.20) (0.25) (0.57)
Observaciones 177 177 177
R2 0.281 0.304 0.353
SCR 46.49 45.03 41.86
a) Analice el efecto de ‘57 ’35r sobre el sueldo de los gerentes. Es decir, responda
a las preguntas, si el ‘57 ’35r aumenta en 1(%), ¿en cuánto cambiaría el sueldo
de los gerentes? ¿Es este efecto económico o estadísticamente significativo?
Solución
Solución
El valor de mercado sí parece tener un efecto significativo (el valor del estadístico è
en las columnas 2 y 3 es mayor a 1.96). Analizando la columna 3 (que tiene un
mayor número de controles y es menos probable que sufra de variable relevante
omitida), se observa que el efecto es relativamente pequeño: un cambio de 10%
generaría un incremento de 1% en el salario de los gerentes.
Solución
Solución
El signo negativo puede deberse a lo que se llama efecto “super estrella”. Las
compañías que contratan CEOs de fuera de la empresa tienden a buscar los
mejores candidatos posibles, con salarios potencialmente altos. Si una persona ha
sido muchos años un empleado normal (no CEO) de una compañía significa que
no es probablemente considerado una súper estrella.
Problema 2.15
Considere una ecuación para explicar los sueldos de los directores generales en términos
de las ventas anuales de la empresa, el rendimiento sobre capital (57;, en forma de
porcentaje), y el rendimiento de las acciones de la empresa (572, en forma de porcentaje):
a) Establezca la hipótesis nula de que controlando por };>è32 y 57;, 572 no tiene
efecto en el sueldo de los directores generales. Establecer la alternativa de que un
mejor desempeño de las acciones de la empresa incrementa el suelo de los
directores.
Solución
ù : >0
Solución
Se debe notar que, como el modelo está en logaritmos y 572 está expresado en
Por tanto, para calcular el aumento del salario ante un incremento de 572 en 50
porcentaje; el coeficiente estimado para ros en el modelo anterior es una elasticidad.
c) Pruebe la hipótesis nula que 572 no tiene efecto sobre 2343567 contra la hipótesis
alternativa de que 572 tiene un efecto positivo. Realice la prueba al 10% de
significancia.
Solución
ù‚ : 0
ù : >0
ž = 0.1
( −
è= ~èF
;;\ ( ]
ç
Se acepta ù‚ si è › 1.282.
0.00024
èÀ"ú = = 0.444
0.00054
d) Explique si incluiría 572 en el modelo final que explica las compensaciones de los
directores en términos del desempeño de la empresa.
Solución
Las evidencias muéstrales indican que la variable 572 no tiene ningún efecto sobre
la variable independiente, por lo que de existir algún sesgo por omitir esta variable
sería muy pequeño.
Problema 2.16
a) ¿Tienen las variables >7è‘5‘7>, >7è3< y š7532 los efectos esperados? ¿Cuáles
de estas variables son estadísticamente significativas al 5%? ¿Importa qué error
estándar se use?
Solución
En general, todas tienen el signo esperado. Por ejemplo, è;’‘ tiene un coeficiente
negativo lo que era de esperarse ya que si el estudiante practica algún deporte
tendrá menos tiempo para estudiar y por ende tendrá notas más bajas.
Todos los efectos calculados (tanto con los estadísticos t usuales como los
robustos a la heterocedasticidad) son estadísticamente significativos excepto los
de š7532.
Solución
Solución
Problema 2.17
Un investigador está interesado en estimar el efecto que tiene una serie de factores sobre
la productividad agrícola de los productores de papa en la Sierra del Perú. Gracias a su
grupo de ayudantes, pudo estimar una serie de regresiones que se muestran a
continuación:
Regresión 1
R-Squared: 0.318516
Prob (F-Statistic): 0.000000
Regresión 2
R-Squared: 0.295559
Prob (F-Statistic): 0.000000
Regresión 3
R-Squared: 0.493302
Prob (F-Statistic): 0.000000
Regresión 4
R-Squared: 0.226759
Prob (F-Statistic): 0.000000
Regresión 5
R-Squared: 0.493072
Prob (F-Statistic): 0.000000
Donde:
Además, se sabe que la variable ¶57: <<6ó> está expresada en Nuevos soles.
Especifique para cada hipótesis: i) La regresión con la que cree que es más pertinente
trabajar, ii) La(s) hipótesis nula(s), iii) la prueba estadística correspondiente y iv) qué
resultados/valores le permiten concluir que la hipótesis efectivamente se cumple o no.
Trabaje con un nivel de confianza de 95%.
Solución
Regresión 2
ù‚ : 3.5 = 25
ù : 3.5 l 25
( − u
/À"úÀ = .u
qè:. 5575
36.46 − 7.14
/À"úÀ = = 9.06
3.24
Se rechaza ù‚ .
b. Realizar otras actividades diferentes de la agricultura durante una hora más por día
reducirá la producción en 13%.
Solución
Regresión 4
ù‚ : = −0.13
ù : l −0.13
( + 0.13
/À"úÀ =
qè:. 5575
0.02
/À"úÀ = = 0.28
0.07
No se puede rechazar ù‚ .
Solución
Regresión 3
Ho: = 15
H1: l 15
( − 15
/À"úÀ =
qè:. 5575
27.09 − 15
/À"úÀ = = 0.48
25
No se puede rechazar ù‚ . Sin embargo, hay que observar también que esta
variable no es significativa, por lo cual también se aceptaría la hipótesis de que
tener más integrantes en la familia no afecta a la producción.
Solución
Si -7_ù;43:3 no fuese significativa:
Considere lo siguiente:
• Earnings: representa el salario por hora y que la muestra está compuesta solo por
individuos de razas blanca y negra.
• Ethblack: es una dummy que indica si el individuo es de raza negra,
• Male: es una dummy que indica si el individuo es hombre,
• S: representa los años de educación,
• Sblack: es una variable creada multiplicando las dummies “S” y “Ethblack”
• MB: es la multiplicación de las dummies “Male” y “Ethblack”.
Especifique para cada hipótesis: i) La regresión con la que cree que es más pertinente
trabajar, ii) La(s) hipótesis nula(s), iii) la prueba estadística correspondiente y iv) qué
resultados/valores le permiten concluir que la hipótesis efectivamente se cumple o no.
Regresión 1
R-Squared 0.178038
Prob (F-statistic) 0.000000
Regresión 2
Dependent Variable: LNEARNINGS
R-Squared 0.213735
Prob (F-statistic) 0.000000
Regresión 3
Regresión 4
R-Squared 0.014904
Prob (F-statistic) 0.017742
Regresión 5
R-Squared 0.092702
Prob (F-statistic) 0.000000
Solución
a. Se debe de trabajar con la regresión 2 porque al estar en logaritmos medirá el
cambio porcentual y porque el coeficiente asociado a “q” es el que mide el
efecto de los años de educación, sin importar la raza.
ù‚ : = 11
ù : l 11
( − 11
/À"úÀ =
qè:. 5575
11 − 11
/À"úÀ = =0
0.01
No se rechaza ù‚ .
ù‚ : = −3
ù: l −3
( +3
/À"úÀ =
qè:. 5575
−0.49
/À"úÀ = = −0.02
1.84
No se rechaza Ho.
ln( ) = (‚ + ( + ( q + ( q ∗ 1 + ;
ln( ) = (‚ + ( + ( ( + ( )q + ;
q6 ;èšD43<Å = 0 → ln( ) = (‚ + ( q + ;
ù‚ : ›0
ù: >0
( −0
/À"úÀ =
qè:. 5575
/À"úÀ = 1.27
No se rechaza Ho.
ù‚ : + Ÿ0
ù: + ~0
( + )−0
/À"úÀ =
qè:. 5575 + qè:. 5575 + 2•7}( ( ; ( )
d
g. Se roma todas las hipótesis como si fueran con una regresión que contiene a
todas las variables cuyos betas se van a evaluar:
‚ •7>2è3>è;
èšD43<Å
¹>r
q
s qD43<Å
u €34;
w €È
ù‚ : Õ = ø
0 0 0 1 0 0 0
Õ = £0 1 0 0 0 0 0¤
0 0 0 1 0 0 0
0 0 1 0 0 0 1
= ‚ s u w
ø = 11 − 3 0 0
Problema 2.19
Tres investigadores se encuentran analizando los determinantes de los ingresos por hora
con una data proveniente de una muestra de 104 trabajadores (todos varones) en EEUU
en 2006. Las variables incluidas son las siguientes:
El investigador 2 define una nueva variable q•ÇÕ , como el promedio entre - ’ y ;5D.
Él estima la siguiente ecuación:
El investigador 3 estima:
Á>¹>r = 2.02 + 0.063 ∗ : < + 0.0088 ∗ q•ÇÕ − 0.0018 ∗ ;5D; Õqq = 2 000
(1.81) (0.007) (0.0022) (0.0012)
Solución
;5D + - ’
2
Solución
Se tiene el modelo 1:
De donde puede decirse que entre dos, más del modelo 3 debería ser
igual al del modelo 1. Y del modelo uno, debería de ser igual a del
modelo tres entre 2. Esto se puede comprobar comparando los valores de
los betas obtenidos en las estimaciones de cada modelo.
Problema 2.20
Sobre la base de esta información, el MIDIS está interesado en verificar las siguientes
hipótesis:
(i) “El acceso a la educación secundaria por parte del jefe de hogar tiene un
impacto positivo sobre la decisión de enviar a los hijos al colegio”.
(ii) “La decisión de enviar a los hijos al colegio de un hogar cuyo jefe tiene
instrucción superior será similar a la de un hogar cuyo jefe tiene sólo
instrucción secundaria”.
(iii) “La falta de acceso a instrucción secundaria por parte del jefe de hogar puede
ser compensada si es que el hogar en cuestión tiene un jefe mujer”.
a. Propón un modelo econométrico teórico que permita, sobre la base de información
provista, analizar cuáles son los determinantes de la decisión de enviar a los hijos
al colegio. Propón un conjunto de variables relevantes y discute su pertinencia.
Discute cuáles son los principales supuestos sobre los que se sustentan las
técnicas de estimación e inferencia que utilizarás.
Solución
Los controles pueden ser una serie de variables diferentes que respondan a
características relevantes. Podrían ser:
e. Interacciones : < ∗ q; 7
Los signos esperados de las variables principales son positivos para ¶Õ¹€, q • y
qñ¶. Para la variable q Ç va a depender de la percepción del alumno. En
principio, podría esperarse que tenga un efecto negativo por la misma definición de
esta variable dummy. Es decir, se puede esperar que en promedio las mujeres
(como jefe de hogar) estén más preocupadas por mandar al colegio a sus hijos.
Sobre algunos supuestos, los básicos son el supuesto de normalidad y
homocedasticidad si se busca hacer inferencia en muestras pequeñas.
Solución
Primera hipótesis:
ù‚ : >0
ù: ›0
Segunda hipótesis:
ù‚ : =
ù: l
Tercera hipótesis:
Una posible interpretación pasa por reconocer que el efecto de tener primaria y a la
vez ser mujer es equivalente al efecto de tener secundaria y ser hombre. En este
caso, es importante definir que el efecto de ser hombre impacta negativamente
sobre la asistencia al colegio. Así, podría compararse el impacto de ser jefe del
hogar hombre con secundaria versus solamente el hecho de ser mujer. Esto, no
obstante, es complicado por la definición de la variable dummy SEXO (1 si es
hombre, 0 de otro modo).
La hipótesis sería:
ù‚ : = + w
ù : l + w
Se asume que w es negativo bajo la percepción de que ser hombre impacta
negativamente a la asistencia al colegio con respecto a si el jefe del hogar es
mujer. Ceteris paribus:
Asist
Sec + mujer
Educ
Problema 2.21
Una función de consumo que tiene diferentes propensiones marginales a consumir (PMC)
de corto y de largo plazo puede escribirse como:
ln •? = ž + 4> ? + Ø4>•? + ?
En este modelo, la PMC de corto plazo es igual a ; mientras que la de largo plazo
equivale a 8 = /(1 − Ø).
Un investigador decidió estimar este modelo; pero olvidó incluir la variable dependiente
rezagada en la regresión (•? ). Sin embargo, dijo que no importaba demasiado,
argumentando que muchos estudios previos afirmaban que este parámetro era igual a
0.9. Los resultados que obtuvo de este modelo fueron los siguientes:
ln •? = 0.004132 + 0.126434> ? + ?
, Õ = 0.67845
. (0.01560) . (0.03157) . .
Solución
-
La hipótesis nula en este caso es ù‚ : 8 = ( = 1. Por tanto, lo que se debe
‚.Ì)
probar es que:
ù‚ : = 0.1
Dado que se trata de una prueba a dos colas, el valor crítico del estadístico t es
1.96. Como el è calculado es menor al è crítico al 95% de confianza, no se puede
rechazar la hipótesis nula de que la PMC de LP es igual a 1.
0.0008254 −0.0008207
35[ ( ; Ø̂^ = ` a
−0.0008207 0.0008173
Solución
Ahora, no se conoce el valor de gamma; sino que se estima. La hipótesis nula es:
ù‚ : 8 = =1
(1 − Ø)
En este caso, se trata de una única restricción; por lo que el estadístico se puede
expresar como:
Õ(m) − ø
= ~ (Ä)
35(m)
Por lo tanto, dado que una chi-cuadrado es una normal al cuadrado; el estadístico
se distribruye como una normal estándar bajo la hipótesis nula:
Õ(m) − ø
¼= ~-(0,1)
qÉ(m)
35\8( ] = L
35[ ( ; Ø̂^
1
Þ á
1 ( 0.0008254 −0.0008207 Ý (1 − Ø̂) à
35\8( ] = ³ − ´` a
(1 − Ø̂) (1 − Ø̂) −0.0008207 0.0008173 ÝÝ ( à
à
−
Ü (1 − Ø̂) ß
35\8( ] = 0.0002585
0.99403 − 1 0.99403 − 1
¼= = = −0.37131
√0.0002585 0.016078
ù‚ : +Ø =1
( + Ø̂ − 1
è=
qÉ( ( + Ø̂)
Problema 3.1
¿Cuál es la intuición detrás del estimador de MV? ¿Cuál es el valor al que deben ser
igualadas las condiciones de primer y segundo orden de la maximización de MV?
Solución
= {54,53,49,61,58}
Problema 3.2
Solución
Solución
mn ∼ - m‚ , ·¹(m‚ )¸ ] ¹(m‚ ) =
[: 4>Á/:m‚ :m‚ ]. Como se observa, la varianza del estimador termina
ii) Normalidad asintótica: donde
L
Problema 3.4
Solución
Problema 3.5
Comente la siguiente afirmación: “Es lo mismo estimar un parámetro a partir de la función
de verosimilitud que a partir de la función de log-verosimilitud ya que el valor máximo de
ambas funciones, que se obtiene con el parámetro hallado, es el mismo”
Solución
Problema 3.6
Solución
En caso quisiera hallarse estimados de MV de las dos distribuciones de las que provienen
las observaciones, se debe proceder a estimar por separado usando realizaciones solo de
una u otra distribución (en caso sea posible identificar que vienen de alguna determinada
distribución).
Problema 3.7
Solución
Problema 3.8
Solución
√2 &
Por otro lado, la función de log verosimilitud de una muestra independiente de >
observaciones es igual al logaritmo de la función de densidad conjunta de las variables
aleatorias observadas. Asimismo, para una muestra aleatoria, la función de densidad
conjunta sería el producto del logaritmo de la función de densidad individual (contribución
> > 1
individual):
4>Á( , & | , 4>& 4>2 E( L
) ]
2 2 2& @
> > 1
Lo cual puede expresarse en forma matricial como:
4>Á( , & | , ) = 4>& 4>2 [( )′( )]
2 2 2&
> > 1
4>Á( , & | , ) = 4>& 4>2 [ L 2 L + L L
2 2 2&
Derivando respecto a :
:4>Á 1 :[ L
2 L
+ L L
: 2& :
:4>Á 1
[ 2 L
+2 L
: 2&
:4>Á 1 L L
]
: &
1 L
Con el fin de maximizar, se iguala el gradiente a cero,
L ]=0
&
L
= L
( L ) ′
Derivando respecto a σ :
:4>Á > 1
[( )′( )]
:& 2& 2& s
> 1
Con el fin de maximizar, se iguala el gradiente a cero,
− [( )L ( )] = 0
2& 2& s
1 >
[( )L ( )] =
2& s 2&
1
)L ( )] = >
&
1
Dado que ya se halló el valor de , se reemplaza dicha expresión,
)L ( )] = >
&
1
ˆ L ˆ >
&
1
;′;] = >
&
; L;
&p =
>
Problema 3.9
Solución
()*+ = ( L ) L
Reemplazando se obtiene:
()*+ − =( L ) L
1 √>
√>( ()*+ − ) = W L
Z L
> >
→ -[0, &" ( )]
√F L L
F
Por TLC:
Por tanto,
Problema 3.10
; ƒ
¶[ | ]=
$
#
!
Solución
; ƒ
Á
$
#
!
Función de verosimilitud:
F F
; ƒ
&Á &³ ´
$
#
!
G G
Solución
F
; ƒ
Á7rÁ = E Á7r ³ ´
$
#
!
G
F
; Í û_ 'ûd ( )‡
; (-_ c-d )ƒ
Á7rÁ E Á7r O P
!
G
Á7rÁ E ; -_ c-d )
+ + ) − log ( !
G
F
¦47rÁ
E ; -_ c-d )
]
¦
G
F
¦47rÁ
= E[ ; (-_ c-d )
]
¦
G
Para demostrar que las contribuciones al Score son cero, se usará el dato
que provee el enunciado. Si se evalúa los estimadores en los parámetros y
se toman expectativas condicionales en :
F
=E # −E # = 0
Solución
¦ ln Á)
; (-_ c-d )
¦
¦ ln Á)
; (-_ c-d )
¦ ¦
½ ½
Þ á
E# E
Ý à
#
35( ; ¹ ; Ý ½G G à
Ý ½
à
ÝE # E #à
ÜG G ß
Problema 3.11
La UP ha decidido regalar un carro a cada alumno del salón de Econometría I (el salón
está compuesto por 14 alumnos). Cada alumno puede elegir el color del carro que recibe.
Solución
Si se tratara de un problema en que existieran dos posibilidades (éxito y fracaso),
la función de verosimilitud seria:
LŽ π+ 1 π +
Dado que el problema plantea tres opciones (rojo, negro y blanco), la función de
verosimilitud, la función de verosimilitud es:
LŽ Pr y 0 .
Pr y 1 /
Pr y 2 0
(1 y 2
donde A = ; B 2 y y; C 1
y
2
A B
b) Asuma que los 14 carros elegidos por los alumnos de la sección B del curso de
Solución
Á ž F45ð56 Fœ78456
1 ž s F45ð56 Fœ78456
Á ž Ê
1 ž s
¦Á>Á 3
0
4
¦ž 1 ž
≡ −
ž
¦Á>Á 7
0
4
¦ 1 ž
≡
ž
Ê Ê
-
>
;
3 4
1 ž ž
ž Ê
3 4
1 ž
ž ‚
10
3 W1 − žZ 4ž
3
3 − 10ž 4ž
3 14ž
Ê s
ž∗ ; ∗
; 8∗
s s s
Problema 3.12
| ∼- , ?)
( = 35r’6>K ( D)L ? ( D)
Solución
1 1
; ‘ B− ( $ ′@ ( $ C
2
A
d |@|
_
d
2
1
Á D < ( D)′? ( D)
2
b) Muestre que:
( = ( L? ) ′?
Solución
( 35r’6>K D)L ? ( D)
( L
? ) ′?
c) Halle la varianza de ( .
Solución
Ya que ( L
? ) ′? , se extrae la varianza de los dos lados de la
expresión:
35 ( | ) = ( L ? ) ′? 35( | )? ( L? )
35( ( | ) = ( L ? )
Solución
insesgado, ya que:
( ( | ) = ( L? ) ′? ( | )
( ( | ) = ( L? ) ′?
( (| ) =
Solución
1: Á 1
¹( ) = i− j= W− L
Z
- : : ′ -
?
35( ( ) = [( L ? ) ]
Lo que implica que ( generalmente no alcanza la Cota Inferior de Cramér-
Rao ya que generalmente [( L ? ) ] l ( L? )] .
| ∼- , ?)
| ∼- , @)
Solución
x = ( L@ ) ′@
35\ x ã ] = ( L @ ) LF E_
35( | )@ ( L@ )
35( x | ) = ( L @ ) ′@ ?@ ( L@ )
35\ x ã ] = ( L @ ) LF E_
?@ ( L@ ) > L
@ ) = 35\ ( ã ]
Problema 3.13
en el cual las observaciones son 66: y | ∼ -(0,1 . Además, asuma que ( y Ø̂ son los
estimadores de MV de y Ø, respectivamente.
,…, F ).
estimaría ( y Ø̂ en la práctica?
a) Escriba la función de log-verosimilitud (condicional a ¿Cómo
Solución
½
1 1( L
D)
Á(D, <) = E 4> ; ‘ ô− õ
√2 ; ‘ ( ′<) 2 ; ‘\2 L <]
G
al argumento y muestre como ello implica que ( puede ser escrito como
b) Escriba la condición de primer orden del problema de maximización respecto
Se halla la CPO:
½
:Á D, <) ( L
D)
=E
: ; ‘\2 L <]
G
Por lo tanto,
:Á\ ( , Ø̂] L (
½
\ ]
=E
: ; ‘\2 L Ø̂]
G
Lo cual conlleva a:
½ ½
1 1
( = ME ′N E
; ‘\2 L Ø̂] ; ‘\2 L Ø̂]
G G
Solución
La derivada cruzada:
½
: Á D, <)
= −2 E( L
D) ; ‘(−2 L < L
: :Ø′
G
Por lo cual
: Á( , Ø)
i j=0
: :Ø′
ya que ( | ) = 0.
WÍ “\ å H]
L
Z
-
Problema 3.14
+ ؼ +
= 8¼ + }
: ( |¼
K( , Ø, 8) =
:¼
Solución
Reemplazando la ecuación de educación en la ecuación de salarios se
obtiene que
8+Ø ¼ + } +
( |¼ 8+Ø ¼
De manera que:
K , Ø, 8) = ( 8 + Ø
asume diagonal:
&
Œ -« 0 0
@n ¨ 0 &
Œ HŒ 0 ©
0 0 &
Œ L«
Solución
(
√- ¨£ Ø̂ ¤ − M Ø N© → - W0, ‘46’ -@n Z
˜
8( 8 ½→M
:K :K :K
W Z = (8 1
: :Ø :8
8
√- K( K → - £0, (8 1 ”‘46’ -@n • M 1 N¤
˜ ½→M
Solución
Bajo ù‚ , se distribuye .
Solución
( 8( + Ø̂
€ ∼ - 0,1
8( & Œ HŒ + ( &
Œ -« + & Œ L«
Problema 3.15
Pedro inventa un juego, similar al “Bingo”, que consta de una caja que contiene canicas,
donde cada canica representa a un número. Los números considerados como elegibles
son consecutivos y pertenecen a un rango determinado. En particular, Pedro decide incluir
números consecutivos, no repetidos, contenidos en el rango 5, 15 . Quien dirige el juego
elige en cada ronda una canica de la caja a manera de muestreo con reemplazo, es decir,
en cada ronda se elige una canica y anuncia el número correspondiente, tras lo cual se
vuelve a incluir dicha canica en el “pool” de canicas elegibles. Cada jugador tiene una
cartilla con números. Un jugador puede marcar un número en su cartilla si quien dirige el
juego anuncia dicho número como elegido en alguna determinada ronda. Quien llene la
cartilla primero gana.
Juan, muy ansioso, desea descifrar cómo ganar el juego antes de que Pedro le explique
cómo jugar. Juan deduce que todas las canicas tienen la misma probabilidad de ser
elegidas y que lo único que necesita para determinar dicha probabilidad es el intervalo al
que pertenecen los números elegibles en el juego. Así, logra descifrar que la distribución
de números elegibles corresponde a una distribución uniforme y recuerda que los
parámetros característicos de este tipo de distribución son el límite inferior y el límite
superior del rango al que pertenecen los números.
Solución
?, ) = 0 26 ? <
1
?, )= 26 › ? ›
?, ) = 0 26 ? >
Solución
1
Á &
1
Á F
47rÁ , ) = −>47r( − )
Solución
( − ) sea la menor posible. Así, se busca que
En este caso, la manera de maximizar la verosimilitud es que la diferencia
sea lo mayor posible y
sea lo menor posible. No obstante, no puede ser mayor que el menor valor
observado de ? ni menor al mayor valor observado de ? , ya que de otro
modo la función de verosimilitud sería igual a 0. Por tanto, los estimadores de
MV deben ser:
( min ?
( max ?
Problema 3.16
Solución
Realizando el proceso de maximización, se sabe que los estimados obtenidos para los
parámetros son:
∑ ;′; ∑FG ( ′ )
(=( ′ ) L
= &p = =
∑ - -
> ;′;
ln Á = − ³1 + 4> 2 + 4> i j´
2 -
> q•/ 1 Õ
ln Á = − ³1 + 4> 2 + 4> i j´
2 -
> q•/
ln Á = − ”1 + 4> 2 + 4> W Z + 4> 1 Õ •
2 -
¦ ln Á) > 1
=− ” • 1 >0
¦Õ 2 1 Õ
Problema 3.17
( )=ž -
; > û
; Ÿ 0, ž, >0
Solución
4 ž -
; > û
Á = &4 = &ž -
; > û
G G
Aplicando logaritmos:
F
F F
G G
b) Halle las condiciones de primer orden y obtenga una ecuación implícita para .
Solución
F F
¦(ln Á) >
+ E 4> ) − ž E 4>( ) -
=0
¦
G G
estimadores?
Solución
¦ ln Á) >
= −
¦ž ž
F
¦ (ln Á) >
ž E 4> ) -
¦
G
F
¦ (ln Á)
E 4> ) -
¦ž¦
G
Solución
F F
¦(ln Á) >
³ ´ + OE 4>( )P − ž OE 4>( ) -
P=0
¦
G G
1 [4>( ) - ^
+ [4>( )] − =0
[ -]
[ -
^ [ -
^
+ [ -
^ [4>( )] − [4>( ) -
^ = 0 →
= [4>( ) -
^− [ -
^ [4>( )]
1
•7}[ln ; -
^
ž
Problema 3.18
Solución
F
¦ ln Á) >
= −E ′ 8) = 0
¦P
P
P
G
∑FG
8 = P( ′ ) L
= PD
∑FG
P
F
>
= PE ′ D)
P
G
F
>
P = > QE ′ D) =
;′;
G
F /
8 O>QE ′ D)P ∗D
G
F
¦ ln Á) >
= − −E
¦P P
G
F
¦ ln Á)
=E
¦8¦P
G
Luego, se debe obtener el esperado de cada una de las segundas derivadas. Se debe
tomar en cuenta que [ | ] = D= Por lo tanto, [ | ] = 8′ ) + Rd (dado que
å
L L
Rd
.
R
los términos cruzados son cero). Agregando para todos los términos se reemplaza en la
segunda derivada con respecto a P. En términos matriciales, la matriz de información se
construye a partir de:
¦ (ln Á)
³ | ´ = − ′
¦8
¦ (ln Á) 1
³ | ´= ′ 8)
¦8¦P P
1
′ ′ 8)
35(8, P) = ê ï
1 2> >
P
− ′ 8) 8′ ′ 8)
P P P
Problema 3.19
Considere una muestra (de > observaciones) obtenida a partir de una distribución normal
multivariada con media $ = ($ ; $ ; … ; $) y matriz de covarianzas escalar (& ¹ . La
función log-verosímil es de la forma:
F
−>€ >€ 1
ln Á = ln(2 ln(& ) − E( $ ′( $
2 2 2&
—
G
a) Obtenga los estimadores para $̂ y &ˆ .
Solución
Solución
¦ (ln Á) >
El esperado de estas derivadas es:
³ ´ = − ¹
¦$¦$′ &
¦ (ln Á)
³ ´=0
¦$¦&
F
¦ (ln Á) >€ 1 >€ >€ >€
³ ´= s E €&
¦& ¦& 2& &w 2& s &s &s
G
Así, la matriz de covarianzas será la inversa del negativo de la matriz de
información; es decir:
>
¹ 0
&
35 $, & ) = ê >€ï
0
&s
4. Errores no esféricos: Heterocedasticidad
Problema 4.1
Solución
es:
35\ ( ] = `( − ( ))\ − ( )] | a
L
Problema 4.2
¿Qué se debe hacer para obtener un estimador eficiente cuando la matriz de varianzas y
covarianzas no es escalar?
Solución
= +
donde ( L ) = & Ω. Para transformar el modelo, se debe multiplicar por una matriz,
llámese ¶ que haga que el nuevo error tenga una matriz de varianzas y covarianzas
escalar:
¶ =¶ +¶
De este modo, aplicando MCO al nuevo modelo transformado, se obtiene el estimador por
MCG:
()*U = ( ′Ω ) ′Ω
Problema 4.3
( − ( )′ Ω ()
Solución
€6> « ′ Ω «
€6> ′Ω − « ′ ′Ω − ′Ω « + « ′ ′Ω «
′Ω − ( ′Ω )′ + 2 ′Ω « ∅
2 ′Ω + 2 ′Ω « ∅
« ′Ω ) ′Ω
Problema 4.4
Solución
= +$
Donde [$$L | ] = & Ω. Pre-multiplicando el modelo por la matriz ¶ que convierte a los
errores en esféricos, se obtiene:
¶ =¶ + ¶$
∗ ∗
+
Donde ahora [ ′| ] = [¶$$′¶′| ] = ¶& Ω¶L = & I. Por tanto, se cumple que ¶Ω¶L = ¹;
es decir, que Ω = ¶′¶.
« ′Ω ) ′Ω =( ∗
′ ∗) ∗
′ ∗
Para analizar la eficiencia, se debe hallar la varianza de )*U . Se sabe que este
estimador es insesgado (tarea) dado que las perturbaciones no esféricas sólo afectan la
eficiencia del estimador, mas no le incluyen un sesgo.
[ x| ^ = ∗
+ [ | ]
35\ x | ] = [ ′ ]=& ′
De esta forma, la varianza del nuevo estimador lineal insesgado puede escribirse como:
¶ ( ′Ω ) − ( ′Ω ) ′¶′¶ ( ′Ω )
¹( ′Ω ) − ( ′Ω ) ′Ω ( ′Ω )
( ′Ω ) − ( ′Ω ) =∅
De esta forma:
De esta manera, la diferencia entre ambas varianzas siempre dará una matriz semi-
definida positiva; por lo que se concluye que el estimador MCG es el estimador de menor
varianza trabajando sobre el modelo transformado.
Problema 4.5
¿Cuáles son los casos en los que existe una matriz de varianzas y covarianzas no
escalar?
Solución
4.1 Heterocedasticidad
Problema 4.6
Solución
X ⋯ 0
Ω O ⋮ ⋱ ⋮ P
0 ⋯ X½
Como se puede ver, al multiplicar al modelo por la matriz ¶, se está ponderando a cada
Problema 4.7
Solución
-Õ ~ ç ; donde k es el
corre una regresión entre los errores al cuadrado de la regresión y las explicativas; así
como sus productos cruzados. El estadístico que evalúa es
número de regresores. Si se acepta la hipótesis nula, la prueba indica que hay no hay
heterocedasticidad; por lo que se puede utilizar MCO. De lo contrario, se debe corregir el
modelo.
pensar como si estas características son las que forman el X señalado en la pregunta
características individuales; lo cual haría que justamente sea heterocedástico. Se puede
anterior.
características individuales explican la varianza del error; lo que conlleva a que el X sea
De este modo, si el ajuste de la regresión auxiliar es bueno; quiere decir que las
Una gran limitación de esta prueba es que asume que el modelo está bien especificado.
Si el modelo no está bien especificado, la prueba puede indicar que hay
heterocedasticidad cuando en realidad no hay; es decir, es poco potente. Por ello, se
pueden utilizar otras pruebas como la prueba de Goldfeld y Quant o la de Breusch Pagan.
La primera compara los residuos recursivos en una submuestra al inicio y otra al final; y si
la SCR es muy distinta, entonces indica que hay heterocedasticidad. Por otro lado, la
prueba de Breusch-Pagan asume que hay una relación únicamente lineal entre los
regresores y la varianza del error. Por ello, corre una regresión de los errores al cuadrado
contra los regresores y utiliza la prueba F de significancia global para evaluar si los
coeficientes son cero. Si se acepta, entonces la prueba indica que no hay
heterocedasticidad. El estadístico es el mismo que le de la prueba de White.
Problema 4.8
Solución
Para ello, lo que se hace es correr los errores al cuadrado de la regresión contra algunas
variables que uno considere puedan ser la causa de heterocedasticidad. Por ejemplo, en
una regresión donde la dependiente es el nivel educativo, el ingreso podría ser una
variable escala útil. Una vez realizada la regresión, se estima la varianza del error:
&ˆ ;̂ ž̂
1
Þ ⋯ 0 á
Ý ž̂ à
«=Ý ⋮
P ⋱ ⋮ à
Ý 1 à
Ý 0 ⋯ à
Ü ž̂ ½ ß
35\ ( ] = & ( ′ ) bE ; L
f( L )
Es decir, se utiliza esta varianza a la hora de realizar inferencia una vez hecho el modelo.
Problema 4.9
Solución
Falso. MCG se prefiere cuando existe evidencia de que el error del modelo no tiene una
varianza homogénea ya que es más eficiente que MCO. Por otro lado, omitir una variable
importante del modelo genera estimadores sesgados e inconsistentes tanto en MCG
como en MCO.
Problema 4.10
Solución
El problema que acarrea esto es que MCO ya no es eficiente. La segunda parte del
comente es falsa dado que utilizar esa matriz de White no corrige el problema, ya que
simplemente indica que se tomará en cuenta dicha varianza para realizar la inferencia.
Problema 4.11
¿Cuál de las siguientes causas pueden hacer que los estadísticos è de MCO no sean
válidos, es decir que no tengan una distribución è bajo ù¾ ?
a) Heterocedasticidad
Solución
Solución
«
estandarizados W ÍÍ\-« ~èF ç Z.
\- -]
]
Solución
Omisión de variable explicativa importante: La omisión de una variable
Problema 4.12
‚ + + +
[ 0
35[ ] = &™
homocedástica. ¿Qué implicancia tiene que dicha matriz contenga o no el parámetro &™ ?
varianzas escalar y demuestre que el modelo transformado presenta una varianza
¿Por qué?
Solución
1
Þ ⋯ 0 á
Ý√ à
¶=Ý ⋮ ⋱ ⋮ à
Ý 0 1 à
⋯
Ü √ ½ß
1 1
‚W Z+ W Z+ + W Z
Así, la matriz ¶ contiene &™ porque desde que este término es constante no es necesario
controlar por tal variable al momento de ponderar a las observaciones.
Problema 4.13
depende de una potencia distinta de dos (de ç ); entonces los Õ del modelo sin
corregir y el modelo corregido con la matriz ¶ no serán comparables”.
Solución
Problema 4.14
Solución
White tiene la gran limitación de que va a trabajar desde el modelo (a partir de su
regresión extra). De esta forma, puede haber heterocedasticidad a partir del análisis
visual, pero White puede rechazarlo ya que esta heterocedasticidad puede que sea
explicada desde el error mismo y no desde las ’s.
Por otro lado, el estimador consistente de White no construye ?, sino que ajusta a MCO
para poder utilizarlo con la posibilidad de hacer inferencia más acotada.
Problema 4.15
Solución
mayores, y se rechazarían más veces la hipótesis nula que en otros casos, aumentando
la probabilidad de cometer error tipo 1 (ž).
Problema 4.16
1? ?´ + ?
Para esto, propone las regresiones:
2? ¼? ´Ø + $?
Solución
Para ver si están ocurriendo estos problemas, se debería correr el test de White
para verificar la presencia de heterocedasticidad. La hipótesis nula de esta prueba
es la ausencia de heterocedasticidad.
Por otro lado, para analizar la presencia de quiebre estructural, existen dos tipos
de pruebas: las recursivas y las estructurales. Las primeras son aquellas que te
ayudan a encontrar el momento del quiebre; dentro de las cuales se encuentra la
prueba de residuos recursivos (arriba), CUSUM y CUSUM cuadrado. Luego, con la
fecha de quiebre obtenida de estas pruebas, se puede realizar las estructurales,
que consiste principalmente en la prueba de Chow. Su hipótesis nula es que no
existe quiebre en el periodo colocado como input. Esta prueba se basa en la de
errores residuales entre el modelo restringido (que los betas no cambien) y el
modelo sin restringir (que los betas si son diferentes):
- Å ; ′; − (; ′; + ; ′; )
W Zi j
Ä ; ′; + ; ′;
c) Si se tiene que el modelo mostrado del lado derecho presenta los siguientes
resultados:
•
Variable Prob.
1
0.43987
0.19876
1
2
0.37875
2
0.14523
0.08765
Solución
A partir de lo obtenido tras correr el test de White se confirma que este test es muy
sensible ante cambios en la especificación, por lo cual puede llevar a rechazar la
hipótesis nula aún en ausencia de heterocedasticidad si es que el modelo está
incorrectamente especificado.
Problema 4.17
Donde • indica el gasto de consumo en soles, ¶È¹ es el producto bruto interno real y - es
la población total. No obstante, es probable que las variables incluidas en el modelo estén
altamente correlacionadas ya que aumentan con el tiempo. Ante ello, se puede solucionar
este problema expresando todo el modelo en términos per-cápita; la cual usualmente
reduce la colinealidad en las variables:
•? 1 ¶È¹? 1
‚W Z+ W Z+ + W Z
-? -? -? ?
-?
Solución
El principal problema que ocasiona este modelo es que genera heterocedasticidad, dado
Problema 4.18
< ž‚ + ž + ; ~- 0, &™ )
De cada uno de ellos se obtiene el consumo y la renta disponible agregados para cada
subgrupo poblacional •@ ∑ Gð < y ∑ Gð . Note que: ∑çG - -.
½ ½
@
a) Lamentablemente, sólo cuenta con los promedios para cada subgrupo de la
; S@
*ð Ûð
población (<̅@ ½ð ½ð
). Por tanto, estima el siguiente modelo:
<̅@ Ø‚ + Ø S@ +
¿Cuál es la relación existente entre los parámetros del primer modelo (ž‚ , ž ) y
los del nuevo modelo (Ø‚ , Ø )? Demuestre analíticamente la forma de la varianza
del error este nuevo modelo.
Solución
•@ ∑ Gð ž‚ + ž + ∑ Gð
½ ½
<̅@ ž‚ + ž S@ +
-@ -@ -@
\ð
∑ •_ ™
Por tanto, ž‚ y ž , serán iguales a Ø‚ , Ø y = ½ð
. La varianza del nuevo error
será:
½ð
∑ Gð
½
1 1 &™
}35( ) = }35 M N= E }35 -@ ∗ &™
-@ -@ -@ -@
G
de la matriz ? y de la matriz ¶.
realizaría a los modelos anteriores para corregirlos. En particular, indique la forma
Solución
1
Þ ⋯ 0á
Ý- à
Ý⋮ ⋱ ⋮ à
1à
?
Ý0 ⋯
Ü -ç ß
- ⋯ 0
¶ ¢ ⋮ ⋱ ⋮ ¥
0 ⋯ -ç
Esto indica que cuando se trabaja con promedios de datos agrupados, hay
heterocedasticidad.
Problema 4.19
= 5 + ; ~- 0,4
¼ $ ; $ ~- 0, & ); & 5
Al correr una regresión de sobre y aplicar el test de White, obtiene que no tiene
distintos valores de &. Para cada uno de ellos, genera los datos, corre una regresión y
suficiente evidencia para rechazar la hipótesis nula. Contrariado, decide probar con
aplica la prueba de White 100 veces. La tabla 4.1 muestra el porcentaje de veces que se
rechazó la hipótesis nula en cada caso:
Explique al investigador los resultados obtenidos. ¿Qué otra prueba se aplicaría para
detectar de manera correcta la heterocedasticidad?
Solución
El problema aquí es que a medida que aumenta sigma; quiere decir que hay una menor
correlación entre el error y el regresor . Por tanto, esto indica que mientras peor
especificado esté el modelo (medido a través de la correlación entre el error y el regresor);
la prueba de White aceptará más veces. Esto refleja la poca potencia que tiene este test.
Problema 4.20
Solución
Donde
∗
;;
6>< 6><
Y se cumple que:
[ ]
[;] = =0
6><
35[ ]
35[;] = =&
6><
Problema 4.21
Donde ˆ son los residuos MCO y las ˆ son los valores ajustados de MCO. Después se
prueba la significancia conjunta de , , … , ç y ˆ incluyendo un intercepto.
Solución
b) Explique por qué el Õ de la regresión indicada arriba siempre era por lo menos
tan grande como el Õ de la regresión BP y del caso especial de la prueba de
White.
Solución
c) Explique porque el inciso b) implica que con la nueva prueba siempre se obtiene
un valor-p menor que el estadístico BP o que el del caso especial del estadístico
White.
Solución
No necesariamente, hay que ver los grados de libertad.
Solución
Problema 4.22
Solución
35 &]
35\} ,Í ] = &!
•7}\ , } ,Í ] = 0
Solución
•7}\} ,Í , } ,^ ] = 0
•7}\ ,Í , ,^ ] = •7}\ + } ,Í , + } ,^ ]
Solución
¿
S =’ E ,Í
ÍG
35(S ) = ’ E 35\ ,Í ]
ÍG
¿ ¿
1
35(S ) = •7}(S , S ) = E E •7}\ ,Í , ,^ ]
’
ÍG ^G
1
35(S ) = \’ &] + ’ &! ]
’
1 &!
35 S ) = \’ &] + ’ &! ] &] +
’ ’
costumbre.
Solución
Problema 4.23
3. Muestre que:
½ ½
plim ME L
N E = ž
½→M
G G
Solución
1. Sea:
ž L
… 0
M 0 … 0 N
0 … ½ ž
L
½ ½
1 1 1 1
()*U L ) L
M E L L
N E L
- ž - ž
G G
½
1 1 1
plim -( L ) = plim M E L L
N = M[ i L
jN
½→M - ž ž
L
½→M
G
½ ½
1 1
plim M E L
N E = \[( L
)] [\ ]
½→M - -
G G
Así, como:
[\ ] = [ [\ ã )) = [( L
) ž
½ ½
1 1
plim M E L
N E = ž
½→M - -
G G
Problema 4.24
[ | )= , 35 | ) = & ¹½
1 1
∗
E , ∗
E ,
@
>@ @
>@
" @ " @
Se construye un vector ∗
de Jx1 y una matriz ∗
de JxK.
1. Muestre que:
[( ∗ | ∗ ∗
, 35 ∗| ∗
& ɽ
Donde
&
0 0
e> h
d0
ɽ d … 0g g
&
0 0
c >` f
Solución
Se tiene:
∗
€ ∗
€ .
1 1
… … 0 … 0
e> > h
0 … 0 … 0 … 0
€=d … … … … …g
d… … g
1 1
0 … 0 … …
c >` >` f
Entonces:
+
Donde [( | ) = 0. Por lo tanto: ∗ ∗
+ € ,[( | ∗
[ |€ ) = 0, asi
[(€ | ∗ 0 y:
[( ∗ | ∗ ∗
+ 0.
Así,
35( ∗ | ∗
€ 35 ∗| ∗
€L & ɽ
2. Muestre que:
` `
()*U £E >@ @ @ ¤
∗ ∗L
E >@ ∗ ∗
@ @
@G @G
Interprete.
Solución
Se tiene.
` `
()*U ∗L
ɽ ∗ ∗L
ɽ ∗
£E >@ @∗ @∗L ¤ E >@ ∗ ∗
@ @
@G @G
Problema 4.25
[( | , 35 | ) = & ¹ ½,
por dos individuos. Se observa @∗ y @∗ , Ä 1, … , -, los cuales son los valores promedios
observa información tomada a nivel de hogar. Se asume que cada hogar está compuesto
Se regresiona @∗ contra ∗
@ mediante MCO y se usa formula estándar para computar el
error estándar.
∗| ∗
a) Dé el valor de 35 , donde ∗
es un vector de Nx1 compuesto por los ∗
@ y
∗
es una matriz de NxK compuesta por los ( ∗ L
@ , como función de & .
Solución
1
∗
\ + ](@) ],
@
2 ¿(@
Por lo tanto:
∗
€ ∗
€ .
1 1 1 0 0 … 0 0
€ = M0 0 1 1 … 0 0N,
2
0 0 0 0 … 1 1
Entonces
[( ∗ | ∗ [ [ ∗| | ∗
,
[ €[ | )| ∗
,
[ € | ∗ ,
= [( ∗ | ∗
,
= ∗
35( ∗| ∗
35 ∗ | ∗
+[ 35 € | )| ∗
,
35( ∗| ∗
0 + [ € 35 | )€L | ∗
,
35( ∗| ∗
[ €& ¹ ½ €L | ∗
,
35( ∗| ∗
& €€′
Por lo tanto:
1/2 0 0 … 0
0 1/2 0 … 0
35( ∗ | ∗
& ¨ … … 1/2 … … ©
0 0 0 … 1/2
Solución
Es consistente debido a que el modelo es homocedástico. En un modelo
homocedástico el estimador MCG y el MCO son idénticos.
Problema 4.26
Solución
Ω L L
Ω
D)*U L
Ω ) L
Ω + i j
> >
F
L
Ω 1
= E →[W Z
> > š(¼ ) š(¼ )
G
L
Ω L
Ω
D)*U = ( L Ω ) L
Ω + i j → + ÖS 0 =
> >
Con lo cual se tiene que el estimador es consistente. Para que este proceso se pueda dar
es necesario que exista independencia en media condicional de la perturbación del
modelo y los regresores. Un caso más débil surge cuando la varianza del error no
depende de los regresores del modelo. Así, solo será necesario que la correlación entre la
perturbación y las ’s sea nula para obtener la consistencia.
8
El teorema de Slutsky señala que el límite probabilístico de un producto puede ser expresado
como el producto de los límites probabilísticos.
Problema 4.27
Solución
D)*U = ( L Ω ) L
Ω
D)*UÙ «
\ LΩ ] L«
Ω
L
? L
?
√> D)*U i j
> √>
L
?n L
√>(D)*UÙ − ) = i j
> √>
Donde D)*UÙ tendrá la misma distribución asintótica que D)*U , es decir serán
asintóticamente equivalente si se cumple que:
L
? L
?n
− →0
> >
L
? L
?n
− →0
√> √>
å iE_
F
La primera expresión no hace sino asegurar que pueda ser efectivamente
« E_
reeplazada cuando > tienda a infinito por
åi
F
. Por otro lado, la segunda expresión
« E_ "
puede ser reemplazado por
å iE_ " åi
√F √F
implica que en el límite .
4.2 Autocorrelación
Problema 4.28
Solución
? = E ×… ? …
?G
&‹
}35( ? ) =
1−×
&‹
<7}( ? ; ×ç
? ç
1−×
1 × ⋯ ×½
× 1 ⋯ ×½ ï
Ω=ê ⋮
⋮ ⋱ ⋮
×½ ×½ ⋯ 1
Problema 4.29
Solución
Otra prueba muy utilizada es la de Breusch Godfrey. Esta prueba consiste en regresionar
el error sobre sus “p” propios rezagos:
? = ž‚ + ž ? + ⋯ + ž“ ? “ + + $?
Se obtiene el Õ de este modelo auxiliar. La hipótesis nula es que todos los coeficientes ž
-Õ ~ (“) . Si el ajuste de la regresión es alto, quiere decir que, en efecto, el error depende
sean cero; lo cual implica que el error es un ruido blanco. El estadístico de la prueba es
de sus rezagos; por lo que se rechaza la nula afirmando que existe autocorrelación de
orden p.
Finalmente, se podría utilizar el correlograma y aplicar la prueba de Ljung-Box; la cual
consiste evalúa de manera secuencial el orden de la autocorrelación.
Problema 4.30
Solución
? ? + ?
? × ? ? −× ? ) + ? × ?
? × ? ? −× ? ) + ?
estimado de ×.
Se tiene una base de series de tiempo que contiene las variables Y, X1 y X2. Se le pide
que corra una regresión entre las mismas, donde Y es la variable dependiente y analice
los residuos de dicha regresión. En particular se quiere determinar si dichos residuos
presentan autocorrelación o no. Analice e intérprete de manera particular el estadístico de
Durbin-Watson, el correlograma de los residuos así como el estadístico de Ljung-Box.
Dependent Variable: Y
Method: LeastSquares
Sample: 1 100
Includedobservations: 100
-
R-squared 0.353531 Mean dependentvar 0.023485
Es necesario analizar el comportamiento de los residuos. Para ello, se puede ver los
siguientes estadísticos
nota que, en el primer rezago existe un estadístico Ö alto. Esto indica que los residuos
Analizando el correlograma (ver que el partialcorrelation o correlación parcial –PAC-) se
Problema 4.32
Dependent Variable: Y
Method: Least Squares
Sample: 1 1000
-4
-8
-12
250 500 750 1000
Test Equation:
Coefficie
Variable nt Std. Error t-Statistic Prob.
-
C 0.046787 0.121288 -0.385753 0.6998
Solución
Solución
Solución
Problema 4.33
Solución
Verdadero. Dado que MCGF transforma el modelo tal que la matriz de varianzas y
covarianzas del modelo transformado sea escalar, lo que hace que posea la mínima
varianza al compararlo con cualquier otro estimador lineal insesgado aplicado sobre el
modelo transformado. Por tanto, MCGF es MELI.
Problema 4.34
Solución
errores, se debe realizar la primera cuasi-diferencia del modelo; es decir, restarle × por el
No necesariamente. Para corregir la autocorrelación, asumiendo un AR(1) para los
MCGF. El comente sería cierto sólo si el × obtenido (ya sea conocido o calculado por
Cochrane y Orcutt. Una vez calculado, se realiza la primera cuasi-diferencia. Esto es
MCGF) es igual a 1.
Problema 4.35
Dos investigadores están discutiendo los resultados de una estimación que acaban de
hacer con series de tiempo. El primero de ellos dice que como el Durbin Watson es
cercano a 2, entonces pueden estar tranquilos porque su ecuación no tiene problemas de
autocorrelación; sin embargo el segundo investigador no está convencido y cree que
deben hacer más pruebas. ¿Qué deberían hacer?
Solución
Ambas no deberían estar completamente seguras dado que el Durbin Watson sólo mide
autocorrelación de primer orden en el error; es decir, que el error sea AR(1). Para ver
autocorrelacion de mayor orden, deben realizar pruebas adicionales como la de Breusch-
Godfrey o ver el correlograma de Box-Pierce.
Problema 4.36
Dada la evidencia mostrada en la regresión anterior, ¿se puede afirmar que el estimador
es eficiente? Ante esto, se plantea aplicar el procedimiento iterativo de Cochrane-Orcutt y
transformar las variables involucradas en su modelo utilizando el resultado de este
procedimiento.
• “No creo que los estimados obtenidos en esta segunda regresión correspondan a
los que interesa estimar en primera instancia dado que estás trabajando con
transformaciones de las variables originales. Además, no veo qué ventaja hay en
utilizar las dos pendientes estimadas en esta segunda regresión en lugar de las
obtenidas en el primer modelo.”
• “En lugar de usar este segundo modelo, me parece que sería mejor usar el
siguiente.”
a) Responder la primera observación. Para reforzar el argumento, se debe mostrar
analíticamente si el investigador independiente está o no en lo cierto respecto a la
primera parte de su primer su comentario.
Solución
= +
¶ ¶ +¶
∗ ∗
+$
Solución
Investigador independiente
? ž‚ + ž ? +ž ? +ž ,? + žs ,? + žu ,? + $?
Investigador:
? × ? ‚ 1 − ×) + \ ? −× ,? ]+ \ ? −× ,? ]+ ?
? ‚ 1 − ×) + × ? + ? − × ,? + ? − × ,? + ?
‚ 1 − ×) = ž‚ ; × ž ; ž ; žs ; ž ×; žu ×
0 Ø̂ Ø̂ 1 0 0
• W Z
0 Ø̂s 0 0 Ø̂ 1
129.7305 −159.1379
•[ 35(Ø̂)]• L = b f
−159.1379 6725.706
Ìu%, 5.99
Solución
Sin embargo, antes se reemplaza para dejarlo en función de los alfas (del modelo
Reemplazando, se obtiene: ž + ž ž 0 y žu + ž žs 0.
del compañero) dado que la inferencia se realiza sobre el mismo modelo.
= [Õ( )]′ • 35 L
Õ ~ (Ä)
Ya se cuenta con la matriz de varianzas y covarianzas; por lo que falta R(D). Esta
matriz contiene a las hipótesis no lineales. En este caso, es de la forma:
ž +ž ž
Õ(ž) = `ž + ž ž a
u s
Para obtener esta matriz, simplemente se reemplaza los valores estimados del
modelo del compañero; de acuerdo con los parámetros que se han colocado en la
parte b). La matriz C mostrada arriba es simplemente la derivada de R( ) con
respecto a B; que sirve para hallar la matriz de varianzas y covarianzas.
Se ve que es menor al crítico; por lo que se aceptan las hipótesis nulas; es decir,
se acepta la hipótesis de que ambos modelos son equivalentes. De manera
adicional se podrían realizar las demás hipótesis, utilizando simples pruebas T
para verificar si son iguales.
Problema 4.37
? ? + ?
? × ? + ?
? = ž ? + }?
}? ∼ - 0; &!
Sample: 1 1000
-
R-squared 0.890279 Mean dependentvar 0.127131
Regresión 2:
Dependent Variable: Y_STAR
Method: LeastSquares
-
R-squared 0.947295 Mean dependentvar 0.076318
Regresión 3:
Method: LeastSquares
-
R-squared 0.971660 Mean dependentvar 0.011710
jY = −× ? ?
=
? × ?
= ? − (× + ž
jY
_ ?
= ? ×+ž
jY
jY _ ?
Solución
jY _ = ? − (× + ž ? + מ ?
jY _ = ? ×+ž ? + מ ?
? ž ? × ? ž ? + }?
? ×+ž ? + מ ? ? − (× + ž ? + מ ? ) + }?
Solución
Problema 5.1
(gÚ »′ ) »′
Solución
(gÚ \ nL ] nL
(gÚ L
¶Â ) L
¶Â
(gÚ = ( L »(» L ») »′ ) L
»(» L ») »′
(gÚ » L ) » L »( L ») ( L »)(» L ») »′
(gÚ »′ ) »′
Solución
(gÚ »′ ) »′
(gÚ »′ ) »L( +
(gÚ + »′ ) »L
1 1 L
‘46’ (gÚ + ‘46’ W » L Z »
> >
‘46’ (gÚ + (» L ) (» L )
consistencia de (gÚ .
de la derecha tiende en probabilidad a cero. Con ello, se demuestra la
‘46’ (gÚ
Problema 5.2
ù3D646:3: ;: < + ¼ L Ø +
Õ;>:6’;>è7 5;>:‘57’ + L Ø + $
i.
Á7rq343567 ;: <‘57’ + ® L Ø + X
ii.
iii.
9
El teorema de Slutsky señala que el límite probabilístico de un producto puede ser expresado
como el producto de los límites probabilísticos.
10 Ley Débil de Grandes Números.
Solución
Solución
Problema 5.3
a. Plantee la expresión matemática para este modelo, indique la forma que tiene el
estimador MCO, halle su límite en probabilidad, e indique por qué es que éste
podría diferir del parámetro.
Solución
Õ ,@ = ž‚ + ž Õ‘57’@ + ž » ,@ + ,@
ž − ž̂ L ) L
‘46’ ž ž̂ [( L )] [ L
]
En este caso ‘46’ ž ž̂ ≠ 0 ya que [ L ] l 0; es decir, se rompe el supuesto
de ausencia de correlación contemporánea entre los regresores y el error. Es
sencillo pensar en factores no observables que influyen tanto en el rendimiento de
un alumno y del rendimiento promedio de sus compañeros de aula. Aun cuando la
nota del propio alumno no esté incluida en dicho promedio, cualquier variable que
capture características del entorno (del aula), de los docentes a cargo del aula, etc.
influyen tanto en el alumno en cuestión como en sus compañeros de aula. Ello se
traduce en correlación contemporánea entre el regresor y el término de error de la
ecuación.
Solución
Solución
Para acceder a este programa, el único requisito es que algún miembro de la familia se
presente físicamente en alguna agencia del Gobierno, haga la solicitud de participar en el
programa y demuestre su condición de pobreza. Sabe además que el sistema para
determinar si un individuo es pobre no presenta fallas; es decir, no hay gente que se
pueda hacer pasar como pobre para recibir el programa si no lo es realmente.
la estatura de los niños por edad. Así, se corrió una regresión de la variable š3_><š2
impacto. Como el objetivo del programa es la nutrición, se eligió como medida de impacto
(variable que mide la diferencia entre la altura de un niño de x años y la altura que debería
tener a esa edad, en desviaciones estándar) sobre una dummy (D) que toma el valor de 1
si el individuo recibió el programa y 0 de otro modo; y otros controles relevantes. A
continuación se presentan los resultados de esta regresión.
Test de Hausman
Instrumental variables (2SLS) regression Number of obs = 4000
Wald chi2(6) = 32.03
Prob > chi2 = 0.0000
R-squared = 0.0548
Root MSE = .53914
chi2(5) = (b-B)'[(V_b-V_B)^(-1)](b-B)
= 0.16
Prob>chi2 = 0.9994
(V_b-V_B is not positive definite)
Solución
Solución
Problema 5.5
Solución
Haussman rechazara que el DÚg sea consistente y D)*+ no lo sea. La prueba indicaría
la matriz de instrumentos propuesta sigue sin ser exógena (por ejemplo), el test de
que ambos son igual de inconsistentes (lo cual podría confundirse con que no existe
problema de endogeneidad, es decir, con que no existe correlación contemporánea entre
los regresores y el error del modelo).
Problema 5.6
De aceptarse la hipótesis nula del test de Haussman, puede concluirse que tanto el
estimador de mínimos cuadrados ordinarios como el de variables instrumentales son
igualmente consistentes. Por lo mismo, esto será evidencia a favor del hecho de que se
ha elegido un buen conjunto de instrumentos.
Solución
Falso. El test de Haussman es una prueba de Wald que contrasta si dos estimadores son
asintóticamente equivalentes. Intenta comparar las propiedades del estimador MCO y del
estimador VI (generalizado) bajo homocedasticidad.
Bajo ù‚ tanto D)*+ como bkl son consistentes. Sin embargo, D)*+ es más eficiente (seria
obstante, la prueba de Haussman parte del supuesto de que los instrumentos utilizados
previamente son buenos; es decir, son tanto relevantes (alta correlación con la variable
endógena) como exógenos (correlación de cero con el error).
Al evaluar la diferencia asintótica entre ambos estimadores, es posible que ambos sean
igual de inconsistentes lo cual podría sugerir (erróneamente) que se estarían utilizando
un conjunto inadecuado de instrumentos (ya que VI no representa una ganancia respecto
a MCO).
Problema 5.7
Un alumno le dice que a otro que bajo ningún motivo el (jv será igual al ( , el estimador
MCO ecuación por ecuación. El otro alumno, preocupado por tal afirmación contesta
rápidamente que estos dos estimadores serán iguales solo cuando los regresores sean
iguales. Comente y demuestre de ser el caso si alguno de ellos tiene razón.
Solución
La solución de este ejercicio pasa por contar como dos los casos en los cuales ambos
estimadores son iguales.
Cuando los regresores son los mismos en todas las ecuaciones, entonces aplicar MCO a
cada ecuación es equivalente a aplicar SUR al sistema.
Problema 5.8
Solución
Solución
Falso. A medida que la correlación entre los errores crece, la ganancia en eficiencia es
mayor para el estimador SUR, debido a que aprovecha justamente esa correlación
usando las estructurar que existen entre las unidades de observación en el tiempo. Dicho
de otro modo, a mayor correlación entre los errores, el problema de ineficiencia de MCO
crece; por lo que al utilizar el estimador SUR, la ganancia en eficiencia es cada vez
mayor.
Problema 5.10
0
` a=” •” •+` a
0
&#…
D…,jv = D…,)*+ + … …)
L L
&…… … #
Solución
Djv L
? ) L
?
′ 0 &S &S 0
=” •” &S • ” 0 •
L
0 ′ &S
?
&S L
&S L
=” •
&S L
&S L
&S L
0
=” •
0 &S L
L
0 &S &S
” • ”&S
&S • ` a
L
0 L
?
&S L
&S L
&S L
+ &S L
=” •` a = ” •
&S L
&S L
&S L
+ &S L
& L ) 0 &S L
+ &S L
Djv ³ ´” •
0 & ( L ) &S L
+ &S L
L ) L
+ & &S L ) L
³ ´
& &S L ) L
+ L ) L
L ) L
& &S L ) L
³ ´+³ ´
L ) L
& &S L ) L
&S#…
D…jv D…,)*+ + … …)
L L
&S…… … #
b) Encuentre D…,jv )
Solución
&S#…
D…jv = D…,)*+ + … …)
L L
&S…… … #
&S#…
Djv D…,)*+ + … …) …( # # +
L L
&S…… #
&S#…
Djv D…,)*+ + … …) … #( …′ # = 0)
L L
&S……
&S#… &#…
•7’7
&S…… &##
&#…
Djv D…,)*+ − ( … …)
L L
&## … #
&#…
(Djv ) = (D…,)*+ ) − W Z ( … …)
L
… &## … ( … … )
L L
&##
&#…
(Djv ) = &…… ( … …)
L
− ( … …)
L
&##
Solución
(Djv ) (&…… − ×) ∑ …)
=
(D)*+ ) &…… (∑ … )
(Djv ) (&…… − ×)
=
(D)*+ ) &……
6. Bibliografía
Kennedy, P.; 1993. A Guide to Econometrics. The MIT Press, tercera edición.