Sie sind auf Seite 1von 6

CAPTULO 5

Errores de especicaci
on

Estrictamente hablando, un error de especicaci on es el incumplimiento de cualquiera


de los supuestos b asicos del modelo lineal general. En un sentido m as laxo, esta expre-
sion hace referencia al supuesto implcito de que la matriz de dise no X est a correcta-
mente especicada; dicho de otro modo, que las variables explicativas incluidas en la
matriz X son las verdaderamente relevantes en la explicaci on de y. En una aplicaci on
practica, al dise
nar la matriz X podemos cometer dos tipos de errores especicaci on:
omision de variables relevantes (infraespecicacion) e inclusion de variables irrelevantes
(sobreespecicaci on). En este captulo, se estudian las consecuencias que se derivan de
estos dos errores de especicaci on sobre las propiedades estadsticas del estimador de
mnimos cuadrados ordinarios.

5.1. Omisi
on de variables relevantes

Supongamos que el modelo correcto para explicar la variable dependiente y es, en


forma particionada,
y = Xr r + Xs s + u
(n1) (n r)(r 1) (n s)(s 1) (n1)
pero por error especicamos el modelo incorrecto

y = Xr r +

en donde hemos omitido las variables Xs . Estas variables engrosar an la lista de factores
omitidos que recoge el nuevo termino de error, = Xs s + u, cuya esperanza claramente
es distinta de un vector de ceros, E() = Xs s .

Proposicio n 51. El estimador de mnimos cuadrados b r de r en el modelo incor-


recto es, en general, un estimador sesgado, siendo el sesgo B(br ) = (X Xr )1 X Xs s .
r r

n. El estimador de mnimos cuadrados en el modelo incorrecto es


Demostracio
r = (X Xr )1 Xr y
b r

Para estudiar las propiedades estadsticas de este estimador, reemplazamos y por su


expresi
on en el modelo correcto. As,
r = (X Xr )1 Xr [Xr r + Xs s + u] = r + (X Xr )1 X Xs s + (X Xr )1 X u
b r r r r r

Tomando esperanza matem


atica
r ) = r + (X Xr )1 X Xs s
E(b r r
77
78 5.1. Omision de variables relevantes

vemos que el estimador de r en el modelo incorrecto es sesgado, siendo el sesgo (bias,


en ingles)
B(b r ) = (X Xr )1 X Xs s
r r


n 43. El sesgo causado por la omisi
Definicio on de variables relevantes se denomina
on, y recoge la inuencia de Xs sobre y que estamos atribuyendo a
sesgo de especicaci
Xr .

Proposicio n 52. El estimador de r en el modelo incorrecto ser


a insesgado cuando
las variables omitidas y las variables incluidas sean ortogonales.

Demostracio n. Las columnas de la matriz (Xr Xr )1 Xr Xs de orden rs contienen


las pendientes estimadas en la regresion de cada variable explicativa omitida sobre las
variables explicativas incluidas. Estas pendientes ser
an iguales a cero u nicamente en el

caso especial en que las matrices Xs y Xr sean ortogonales, Xr Xs = 0.

Observacion 31. El estimador de r en el modelo incorrecto tambien ser


a insesgado
cuando s = 0s , es decir, cuando no se comete ning
un error de especicacion.

Proposicio n 53. El estimador de r en el modelo incorrecto es m


as ecienteque
el estimador de mnimos cuadrados de r en el modelo correcto.

Demostracio n. Vamos a demostrar que la diferencia entre las matrices de varian-


zas y covarianzas de estos dos estimadores de r es una matriz semidenida negativa.
En el modelo incorrecto
  
r ) =E [b
V (b r E(br )][b
r E(b
r )] = E (Xr Xr )1 Xr uu Xr (Xr Xr )1
 
=(Xr Xr )1 Xr E uu Xr (Xr Xr )1 = u2 (Xr Xr )1
  
2I
u n

mientras que en el modelo correcto

V (r ) = u2 (Xr Ms Xr )1

En lugar de comparar estas dos matices, comparamos las inversas


)1 = 2 X Xr 2 X Ms Xr = 2 X [In Ms ]Xr = 2 X [Xs (X Xs )1 X ]Xr
r )1 V (
V (b r u r u r u r u r s s

Deniendo C = Xs (Xs Xs )1 Xs Xr , obtenemos la matriz semidenida positiva


)1 = 2 C C
r )1 V (
V (b r u

a una matriz nula cuando Xs Xr = 0.


que ser
n 54. El estimador de u2 en el modelo incorrecto
Proposicio
y Mr y

= =
nr nr
es sesgado, siendo el sesgo no negativo.

Demostracio n. La suma de cuadrados de los residuos en el modelo incorrecto,


y Mr y,puede escribirse como

y Mr y = [Xr r + Xs s + u] Mr [Xr r + Xs s + u]
Prof. Dr. Jos
e Luis Gallego G
omez Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Departamento de Economa. Universidad de Cantabria Material publicado bajo licencia Creative Commons
5. Errores de especicacion 79

en donde se ha reemplazando y por su expresi


on en el modelo correcto. Como Mr Xr = 0,
tenemos

y Mr y = [Xs s + u] Mr [Xs s + u] = s Xs Mr Xs s + u Mr us + 2 s Xs Mr u

en donde hemos usado el resultado u Mr Xs s = s Xs Mr u.


Tomando ahora esperanza matem atica

E(y Mr y) = s Xs Mr Xs s + E(u Mr u) + 2E( s Xs Mr u) = s Xs Mr Xs s + (n r)u2

De aqu,
E(y Mr y) 1
2 ) =
E( = u2 + X Mr Xs s
nr nr s s
El sesgo s Xs Mr Xs s /(n r) 0 es una forma cuadr atica semidenica porque la

matriz Xs Mr Xs es del tipo C C con C = Mr Xs .

Observaci on 32. Cuando las variables en Xr y Xs son ortogonales, Xr Xs = 0, el


2 es s Xs Xs s /(n r) siendo Xs Xs una matriz semidenida positiva, si hay
sesgo de
multicolinealidad exacta entre las variables explicativas omitidas, o denida positiva, si
no la hay.

La soluci
on al problema de la omisi on de variable relevante parece simple: incluirlas
en el modelo. Sin embargo, cuando especicamos un modelo econometrico seguimos las
indicaciones de la teora economica y de nuestro sentido com un, y no somos conscientes
de que nos estamos olvidando de ciertas variables. Para empeorar las cosas, la omisi on
de variables relevantes puede confundirse con otras violaciones de los supuestos b asicos,
que requieren tratamientos muy diferentes. Si, por ejemplo, las variables omitidas est an
correlacionadas con las incluidas, entonces Xr y E() = Xs s tambien est an correla-
cionados y no podemos mantener el supuesto de regresores jo. Por otra parte, con datos
de series temporales, la perturbacion E() presentar a autocorrelaci
on. Estudiaremos es-
tos errores de especicaci on en captulos posteriores.

5.2. Inclusi
on de variables irrelevantes

Suponemos, ahora, que el modelo correcto es

y = Xr r + u

pero incluimos err


oneamente un conjunto de variables explicativas irrelevantes

y = Xr r + Xs s +

Vamos a estudiar las propiedades estadsticas de los estimadores de r y s en el modelo


incorrecto o sobreespecicado.

Proposicio n 55. Los estimadores de los par


ametros asociados a variables relevantes
son insesgados, mientras que los estimadores de los par ametros asociados a variables
irrelevantes tienen un valor esperado nulo.

n. Los estimadores de mnimos cuadrados de r y s son


Demostracio
r = (X Ms Xr )1 X Ms y
b y s = (X Mr Xs )1 X Mr y
b
r r s s
Prof. Dr. Jos
e Luis Gallego G
omez Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Departamento de Economa. Universidad de Cantabria Material publicado bajo licencia Creative Commons
80 5.2. Inclusion de variables irrelevantes

y pueden escribirse, reemplazando y por su expresi


on en el modelo correcto, como
r =(Xr Ms Xr )1 Xr Ms [Xr r + u] = r + (Xr Ms Xr )1 Xr Ms u
b
s =(X Mr Xs )1 X Mr [Xr r + u] = (X Mr Xs )1 X Mr u
b s s s s

Tomando esperanza matem


atica
r ) = r + (Xr Ms Xr )1 Xr Ms E(u) = r
E(b
s ) =(Xs Mr Xs )1 Xs Mr E(u) = 0
E(b

Proposicio n 56. El estimador de r en el modelo sobreespecicado es menos e-


ciente que el estimador de r en el modelo correcto.

Demostracio n. Ya hemos demostrado que al a nadir nuevas variables a un modelo


de regresi
on la eciencia de los estimadores puede disminuir, pero nunca aumentar.

Proposicio n 57. El estimador de mnimos cuadrados de la varianza del error u2


en el modelo sobreespecicado es insesgado.

n. En el modelo incorrecto
Demostracio
y My

= =
nk nk
La suma de cuadrados de los residuos y My puede escribirse como

y My = [Xr r + u] M[Xr r + u]

en donde se ha reemplazando y por su expresi


on en el modelo correcto. Como MX =
M[Xr |Xs ] = 0, tenemos
y My = u Mu
Tomando esperanza matem
atica

E(u Mu) = (n k)u2

De aqu,
E(y My)
2 ) =
E( = u2
nk

Comparando las dos tipos de errores de especicaci on vemos que la consecuencia nal
es la misma: los estadsticos t y F est
an distorsionados. En el modelo sobreespecicado la
distorsi
on proviene de la sobreestimaci on de las varianzas. Si el estimador es consistente,
esta varianza tiende a cero cuando el tama no muestral tiende a innito. Parece, por
tanto, razonable pensar que la distorsi on en varianza sera mayor en muestras peque nas
y menor en muestras muy grandes. En el caso del modelo infraespecicado la distorsi on
ademas proviene del sesgo del estimador, que depende de la relaci on entre variables
incluidas y omitidas. Esta relaci on no tiene porque disminuir con el tama no muestral.
A modo de conclusi on, si el tama no muestral es sucientemente grande, parece menos
grave cometer errores de especicaci on por exceso que por defecto.
Prof. Dr. Jos
e Luis Gallego G
omez Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Departamento de Economa. Universidad de Cantabria Material publicado bajo licencia Creative Commons
5. Errores de especicacion 81

5.3. Forma funcional incorrecta

on estadstica entre dos variables Yt y Xt viene dada por la


Imaginemos que la relaci
regresion polinomial

Yt = 0 + 1 Xt + 2 Xt2 + + k Xtk + ut

pero por error especicamos la regresi


on lineal simple

Yt = 0 + 1 Xt + t

En este modelo, la omision de las k 1 variables relevantes puede interpretarse como un


error en la especicaci
on de la forma funci on: estamos especicando una relaci on lineal
entre Yt y Xt , cuando la relaci
on entre ambas es no lineal
Ramsey propuso un contraste muy simple para detectar este error de especicaci on,
el test RESET (del ingles, REgression Epecication Error Test). Los pasos son los sigu-
ientes:

1. Estimar la regresi on simple de Yt sobre Xt , calcular el coeciente de determi-


on, digamos R02 , y generar los valores ajustados Yt .
naci
2. Estimar la regresi on de Yt sobre 1, Xt , Yt2 , ..., Ytr y calcular el coeciente de
determinacion, R12 .
3. Calcular el estadstico F
(R12 R02 )/(k 1)
F =
(1 R12 )/(n k 1)
4. El modelo esta err
oneamente especicado si F > c, en donde c es el valor crtco
tal que P rob(Fk1,nk1 > c) = .

Resumen

1. Las consecuencias de la omisi on de variables relevantes son:


a) los estimadores de los par ametros asociados a las variables incluidas son
sesgados,
b) la matriz de varianzas y covarianzas de estos estimadores es menorque
la que se obtendra en el modelo correcto,
c) la varianza de las perturbaciones est a sobreestimada,
d) los contrastes de hipotesis basados en los estadsticos t y F no son v
alidos.
La inclusion de variables irrelevantes tiene las siguientes consecuencias:
a) los estimadores de los par ametros asociados a las variables relevantes son
insesgados, mientras que los de las variables irrelevantes tienen un valor
esperado nulo,
b) la matriz de varianzas y covarianzas de los estimadores par ametros rele-
vantes en el modelo sobreespecicado es mayorque la correspondiente
en el modelo verdadero,
c) la varianza del error es insesgada,
d) los contrastes de hipotesis basados en los estadsticos t y F est
an sesgados
hacia la no signicaci
on.
Prof. Dr. Jos
e Luis Gallego G
omez Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Departamento de Economa. Universidad de Cantabria Material publicado bajo licencia Creative Commons
82 5.3. Ejercicios

Palabras clave
Matriz de dise
no
Error de especicacion Sobreespecicaci
on
Omision de variable relevante Sesgo de especicaci
on
Forma funcional incorrecta
Inclusi
on de variable irrelevante
Infraespecicaci
on Test RESET

Ejercicios

1. Discuta la siguiente proposici


on: cuando el tama no muestral es muy grande, es
menos grave la inclusion de variables irrelevantes que la omision de variables
relevantes.
2. Obtenga el sesgo del estimador de la varianza residual en un modelo de regresi
on
con omision de variables relevantes.
3. Sea la ecuaci
on de demanda

qi = + pi + ri + ui , i = 1, . . . , N

donde las variables explicativas precio pi y renta ri se consideran no estoc


asticas
y el termino de error ui cumple las propiedades siguientes

E(ui ) = 0, E(u2i ) = 2 , E(ui uj ) = 0 i = j.

a) Demuestre que si esta ecuaci


on se estima sin la variable relevante renta,
entonces la esperanza matematica del estimador MCO del par ametro es
N
= + i=1 pi ri
E() N
2i
i=1 p
donde pi = pi p y ri = ri r.
b) Demuestre que si esta ecuaci on se estima con la variable relevante renta,
entonces
= 2
V () N
i=1 p 2i (1 2pr )
donde pr es el coeciente de correlaci on simple entre las variables precio
y renta.

Prof. Dr. Jos


e Luis Gallego G
omez Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Departamento de Economa. Universidad de Cantabria Material publicado bajo licencia Creative Commons

Das könnte Ihnen auch gefallen