Sie sind auf Seite 1von 14

Econometría básica

Ejercicio 1

Enunciado a: Cov(aX,c+bY)=abCov(X,Y)

La covarianza (Cov) tiene dos definiciones matemáticas:

∑n ̅
i=1(Xi −X)(Yi −Y)
Definición 1: n

∑n
i=1 Xi Yi
Definición 2: − X̅ Y
̅
n

Para dar solución a este enunciado se usará la definición 2.

∑ni=1 aXi (c + bYi )


Cov(aX, c + bY) = ̅̅̅)(c̅̅̅̅̅̅̅̅
− (aX + bY)
n

a ∑ni=1 Xi (c + bYi ) ∑ni=1 aXi ∑ni=1(c + bYi )


= −( )( )
n n n

a ∑ni=1(cXi + bXi Yi ) cn + b ∑ni=1 Yi


= ̅
− aX ( )
n n

c ∑ni=1 Xi + b ∑ni=1 Xi Yi
= a( ̅(c + bY
) − aX ̅)
n

b ∑ni=1 Xi Yi ∑ni=1 Xi Yi
̅+
= a (cX ̅ ̅ ̅
) − aXc − abX Y = ab ̅̅
− abX Y
n n

∑ni=1 Xi Yi
= ab ( −̅
X̅Y) = abCov(X, Y)
n

Enunciado b: Y=b0+b1ln(X)+u

Un modelo de este tipo se conoce como lin-log y permite encontrar el cambio absoluto en

Y debido a un cambio porcentual en X. La pendiente (b1) viene dada por:


Cambio en Y
b1 =
Cambio en ln X

Puesto que un cambio en el logaritmo de un número es un cambio relativo:

Cambio en Y
b1 =
Cambio relativo en X

∆Y
Simbólicamente: b1 = ∆X⁄
X

Donde ∆ denota un pequeño cambio. De la última expresión se desprende que:

∆X
b1 = ∆Y
X

Esto planeta que el cambio absoluto en Y (∆Y) es igual a la pendiente (b1) multiplicada por

∆X
el cambio relativo en X ( X ). Si este último se multiplica por 100, entonces la expresión

∆X
b1 = ∆Y da el cambio absoluto en Y ocasionado por un cambio porcentual en X.
X

Así se demuestra que si X cambia en 1%, el cambio absoluto en Y es 0.01 b1.

Ejercicio 2

Enunciado a: ¿Cuál de estos experimentos mide un efecto causal de la

reforma en el precio de la casa?

Experimento iv: Selecciona aleatoriamente una muestra de viviendas y divídela

en dos grupos: aquellas que aleatoriamente tú decides reformar, y aquellas que

tú dejas sin reformar. Para poder analizar el fenómeno (la reforma) es

necesario que se elija una muestra aleatoria de viviendas donde se aplique la

reforma, y luego comparar el precio medio de venta en el grupo de viviendas

reformadas con aquel grupo donde no se hizo reforma.


Esto último se hace mediante una prueba de hipótesis paramétrica de

diferencia de medias como la prueba t de Student para datos independientes.

Otra forma es la estimación de intervalos de confianza o de un modelo que

mida la causalidad existente entre la reforma y el precio de la vivienda.

Enunciado b: ¿Cuál es el efecto que aumentar el número de habitaciones

tiene sobre el precio de la vivienda?

El modelo estimado es:

l_pricei=a0+ a1roomsi+ a2bathsi+ a3l_Hsizei+ a4l_Lsizei+ui (i denota la vivienda)

El coeficiente a1 mide el cambio proporcional constante o relativo en el precio

de la vivienda para un cambio absoluto dado en el valor del número de

habitaciones, ceteris paribus (los demás factores constantes).

Cambio relativo en el precio


a1 =
Cambio absoluto en el número de habitaciones

Si multiplicamos el cambio relativo en el precio por 100, la expresión anterior

dará el cambio porcentual o la tasa de crecimiento, en el precio ocasionada por

un cambio absoluto en el número de habitaciones. En otras palabras, 100 por

a1 da como resultado la tasa de crecimiento en el precio de la vivienda

(semielasticidad del precio respecto del número de habitaciones). Dado que

a1=0.0407, entonces ante un aumento de una habitación, el precio de la

vivienda aumenta 4.07%. La expresión “verificar si dicha estimación es

estadísticamente significativa” es incorrecta, puesto que con una prueba de

significancia individual lo que se busca comprobar es si la variable asociada a

dicho coeficiente (en este caso el número de habitaciones) contribuye a la

explicación de la variable dependiente (el logaritmo del precio).


La estructura de dicha prueba es la siguiente:

H0: a1=0

H1: a1≠0

Cuya regla de decisión es rechazar H0 si │t│> tα/2,n-5. Además:

â1
t=
Sâ1

Donde Sâ1 es el error estándar estimado del estimador. Así, se tiene:

│t│=│0.0407/0.0281=1.449│

tα/2,n-5= t0.10/2,142-5= t0.05,137=1.65

Entonces como │t=1.449│< tα/2,n-5= 1.65, se acepta H0, es decir, el número de

habitaciones no es una variable estadísticamente significativa para explicar el

logaritmo del precio de las viviendas.

Enunciado c: ¿Cuál es el efecto estimado de transformar una habitación

en un baño en el precio de la vivienda?

Al transformar una habitación en un baño, el número de este último aumenta

pero el del primero disminuye, y esto tendría un efecto conjunto sobre el precio

de la vivienda. Esto se traduce en la siguiente prueba de hipótesis sobre los

coeficientes que acompañan a dichas variables:

H0: a2-a1=0

H1: a2-a1≠0

En este caso el estadístico t se define como sigue:


â2 − â1 â2 − â1
t= =
Sâ−a
2 ̂1 √Var(â)
2 + Var(â1 ) − 2Cov(â1 , a
̂)2

Reemplazando valores:

0.2580 − 0.0407 0.22


t= = = 4.50
√0.00105 + 0.00079 − 2(−0.000245) 0.05

t α⁄2,n−5 = t 0.025,137 = 1.98

Como │t=4.50│> tα/2,n-5= 1.98, se rechaza H0.


Enunciado d: ¿Cuál es el l_price predicho por el modelo para la vivienda

media que tiene el número medio de habitaciones y baños, así como el

l_Hsize y l_Lsize medios?

Predecir el valor de l_price es imposible pues no se tiene información alguna

sobre las variables incluidas como explicativas en el modelo.

Enunciado e: Interprete a3 como el efecto de Hsize sobre price

Se tiene que:

Cambio relativo en el precio


a3 =
Cambio relativo en el tamaño de la vivienda

∆Precio⁄
= Precio
∆Tamaño de la vivienda⁄
Tamaño de la vivienda

∆Precio Tamaño de la vivienda


= .
∆Tamaño de la vivienda Precio

Así a3 puede interpretarse como la elasticidad del precio de la vivienda

respecto al tamaño de esta: Si el tamaño de la vivienda aumenta 1%, en

promedio, el precio de la vivienda se incrementará en 0.24%.

Enunciado f: Contraste de regresión

Para probar la hipótesis de significancia global o conjunta de los coeficientes de

regresión se plantean las siguientes hipótesis:

H0: a1=a2=a3=a4=0

H1: a1≠a2≠a3≠a4≠0

Para esta prueba se utiliza el estadístico F, el cual puede ser definido como:
SCE⁄
F= k − 1 ~F
SCR⁄ α,(k−1),(n−k)
n−k

R2⁄
F= k−1 ~Fα,(k−1),(n−k)
(1 − R2 )⁄
n−k

Donde: SCE=Suma Cuadrática Explicada, SCR=Suma Cuadrática Residual

Si F>Fα,(k−1),(n−k) , se rechaza H0.

Con la información de la estimación se calcula:

0.72⁄
(5 − 1)
F= = 89.44
(1 − 0.72)
⁄(142 − 5)

Fα,(k−1),(n−k) = F0.05,4,137 = 2.44

Como F=89.44>Fα,(k−1),(n−k) = 2.44, se rechaza H0. Es decir, el modelo es

significativo globalmente (todas las variables incluidas como explicativas son

estadísticamente significativas).
Ejercicio 3

Enunciado a: Interpreta el coeficiente estimado para STR en A

El modelo especificado es: TestScoresi=c0+c1STRi+ui

El coeficiente c1 es el efecto marginal de la nota media por distrito en el test

respecto al ratio alumnos por profesor. De acuerdo con la estimación, al

aumentar en una unidad el ratio alumnos por profesor, la nota media cae en

1.72 puntos. Si se omite c0, el modelo TestScoresi=c1STRi+ui se conoce como

regresión a través del origen, en este caso la estimación vía MCO de c1 es:

∑220
i=1 STR i TestScoresi
ĉ1 = 2
∑220
i=1 STR i

En contraste, del modelo TestScoresi=c0+c1STRi+ui la estimación de c1 es:

∑220
i=1 stri testscoresi
ĉ1 =
∑220
i=1 stri
2

Siendo stri y testscoresi las desviaciones de dichas variables respecto a su

media: (STR i − ̅̅̅̅̅


STR) y (TestScoresi − ̅̅̅̅̅̅̅̅̅̅̅̅̅̅
TestScores), respectivamente.

Las diferencias entre estos dos conjuntos de fórmulas son obvias: en el modelo

sin término de intercepto se utilizan sumas de cuadrados simples y productos

cruzados, pero en el modelo con intercepto, se utilizan sumas de cuadrados

ajustadas (de la media) y productos cruzados. El diagrama de dispersión que

muestra el ajuste de los datos a una regresión a través del origen es:
Enunciado b: ¿Qué ocurre con el efecto estimado de STR si no

controlamos las variables PctLunch o PctEL?

En vez del modelo TestScoresi=c0+c1STRi+c2PctELi+c3PctLunchi+ui, el

investigador especifica TestScoresi=c0+c1STRi+ei. Esto constituye un error de

especificación que consiste en la omisión de dos variables relevantes (PctEL i y

PctLunchi). Por tanto, el término de error ei en el segundo modelo es:

ei= c2PctELi+c3PctLunchi+ui

La omisión de variables relevantes lleva a un subajuste del modelo. El sesgo

de las variables omitidas que corresponde al coeficiente de la pendiente para la

variable incluida STRi es:

E(ĉ1 ) = c1 + ∑ cl bl1
l=2

Siendo bl1 es el coeficiente de la pendiente de STRi en la regresión auxiliar de

las variables excluidas (PctELi y PctLunchi) sobre todas las variables

explicativas incluidas en el modelo:

PctELi=d0+b21 STRi+ui
PctLunchi =d1+b31 STRi+ui

Por lo general, la amplitud del sesgo depende del término ∑3l=2 cl bl1. Por

ejemplo, si cl es positiva (es decir, PctELi y PctLunchi tienen un efecto positivo

sobre TestScoresi) y bl1 es positiva (es decir, STRi y PctELi, y STRi y PctLunchi

están positivamente correlacionadas), ĉ1 en promedio sobreestimará a la

verdadera c1 (es decir, al sesgo positivo). Este resultado no es sorprendente

puesto que representa no solo su efecto directo sobre sino también su efecto

indirecto (a través de PctELi y PctLunchi) sobre TestScoresi. En resumen, STRi

obtiene relevancia por la influencia que debe atribuirse a PctELi y PctLunchi, sin

permitir que estas últimas muestren su efecto explícitamente porque no se les

permiten ingresar al modelo.

Enunciado c: Contrasta conjuntamente en C si el efecto del tamaño de la

clase en las notas es no lineal.

Del modelo: TestScoresi=c0+c1STRi+c2STRi2+c3STRi3+c4PctELi+c5PctLunchi+ui

Se busca probar la hipótesis:

H0: c2-c3=0

H1: c2-c3≠0

En este caso el estadístico F se define como sigue:

(R2 nueva − R2 vieja )



Número de regresoras nuevas
F=
(1 − R2 nueva )
⁄n − Número de parámetros en el nuevo modelo

La distribución F se distribuye como sigue:


Fα,Número de regresoras nuevas,Número de parámetros en el nuevo modelo

Los modelos “nuevo” y “viejo” son respectivamente:

TestScoresi=c0+c1STRi+c2STRi2+c3STRi3+c4PctELi+c5PctLunchi+ui

TestScoresi=c0+c1STRi+c2PctELi+c3PctLunchi+ui

Reemplazando datos se tiene:

(0.687 − 0.686)⁄
F= 2 = 0.34
(1 − 0.687)
⁄(220 − 6)

Puesto que F=0.34<F0.05,2,214=3.04, se acepta H0 es decir, el efecto del tamaño

de la clase en las notas es no lineal.

Enunciado d:

Si en los distritos, ningún alumno es elegible para beca de comedor, la variable

PctLunchi tomaría valores nulos (puesto que representa el porcentaje de

alumnos elegibles para recibir beca de comedor) y por tanto sería incorrecta

incluirla en el modelo. El modelo sería entonces:

TestScoresi=c0+c1STRi+c2HiELi+ c3HiELi STRi +ui

Sabiendo que la variable HiELi es dicotómica (1 en caso afirmativo y 0 en caso

negativo), entonces el efecto del tamaño de la clase (STRi) en las notas será:

TestScoresi=(c0+ c2)+(c1+ c3)STRi =(759.9-12.6)+(-1.02+0.80)STRi

=747.3-0.22STRi si HiELi =1

TestScoresi=c0+c1STRi=759.9-1.02 STRi=si HiELi =0


Gráficamente lo anterior puede visualizarse como sigue:

Enunciado e: Estimación del efecto de reducir STR de 20 a 18

Para la selección de modelos existen varios criterios: la bondad de ajuste (R 2),

el R2 ajustado, los criterios de información (Akaike, Schwarz y Hannan-Quinn),

criterio Cp de Mallows y el pronóstico ji cuadrada (ꭕ ²). A partir del R2 se escoge

el modelo C pues posee el mayor valor:

TestScoresi=c0+c1STRi+c2STRi2+c3STRi3+c4PctELi+c5PctLunchi+ui

Cabe señalar que este criterio posee varias desventajas: mide la bondad de

ajuste dentro de la muestra (no hay garantía de que pronosticará bien las

observaciones fuera de la muestra) y al agregar variables al modelo se

incrementa su valor pero también aumenta la varianza del error de predicción.

Puesto que desea conocer el efecto de reducir el valor de STR de 20 a 18, las

variables PctELi y PctLunchi pierden importancia. La estimación del efecto es:

TestScoresi=665.5+12.4(20)-0.68(202)+0.011(203)=729.5 si STRi =20

TestScoresi=665.5+12.4(18)-0.68(182)+0.011(183)=732.5 si STRi =18


Δ TestScoresi=732.5-729.5=3.03:

Al disminuir STRi en 2 unidades, TestScoresi aumenta 3.03 puntos.

Enunciado f: Calcula el R2 corregido para los modelos B y D

El R2 ajustado o corregido viene definido por:

̅̅̅ n−1
R2 = 1 − (1 − R2 )
n−k

Para los modelos B y D se tiene, respectivamente:

̅̅̅ 220 − 1
R2 Modelo B = 1 − (1 − 0.686) ( ) = 0.682
220 − 4

̅̅̅ 220 − 1
R2 Modelo D = 1 − (1 − 0.685) ( ) = 0.679
220 − 5

De acuerdo con este criterio, debe elegirse el modelo B (mayor ̅̅̅


R2 ).

Enunciado g:

Del modelo TestScoresi=c0+c1STRi+c2PctELi+c3PctLunchi+ui, se desea un

intervalo de confianza para c1 al 99% de confianza: ĉ1 ± t α⁄2,n−k Sĉ1

Este intervalo es: −0.64 ± 2.60 (0.27) =< −1.34, 0.06 >

La forma adecuada de estimar el intervalo de confianza para el verdadero valor

de TestScoresi dado un valor de STRi consiste en calcular:

ĉ0 + ĉ1 STR 0 ± t α⁄2,n−k STestScores


̂ i

Donde STR 0 es un valor dado de STR y STestScores


̂ I
es el error estándar del valor

predicho de TestScores, el cual viene definido como:


̅̅̅̅̅ 2
̂2 1 (STR 0 − STR) ]
̂ i = √σ [ +
STestScores
n ∑ STR i 2

No obstante, los datos de este ejercicio no permiten calcular el intervalo. La

respuesta puede venir por el hecho de que un supuesto de los estimadores

MCO es que estos son fijos en el tiempo, lo cual quiere decir que para

cualquier valor de STRi el coeficiente c1 es el mismo.

Das könnte Ihnen auch gefallen