Sie sind auf Seite 1von 28

Fichero: capitulo 9 nuevo.

doc

CAPTULO 9
HETEROCEDASTICIDAD.

1. CAUSAS MUESTRALES Y ESTRUCTURALES

Como sabemos, la heterocedasticidad consiste en que las observaciones


2

muestrales tienen varianzas del error diferentes entre s: var(Ui)= i, i=1,2,...n.


Viola la hiptesis clsica de homocedasticidad, o igual varianza de los n errores
aleatorios, y es un caso particular, junto a la autocorrelacin, de perturbaciones no
esfricas. Las figuras 9.1 y 9.2 presentan los casos de perturbaciones
homocedsticas y heterocedsticas respectivamente.

______________________________________
Manual de Econometra. Captulo 9, pgina 1 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

A lo largo de este captulo se abordan las siguientes cuestiones: cundo y por qu


surge; cules son las consecuencias de estimar por MCO un modelo
heterocedstico; cmo hacer un diagnstico correcto del problema, es decir, qu
contrastes ponen a prueba la hiptesis de homocedasticidad frente a la evidencia
de los datos muestrales; y por ltimo, cmo estimar un modelo heterocedstico, y
cmo evitar que surja la heterocedasticidad, eliminndola, si llega el caso.
La heterocedasticidad puede surgir por causas estructurales o muestrales, es
decir, su presencia puede ser sugerida por la teora o por el propio diseo muestral
y plan de muestreo en la recogida de la informacin para estimar el modelo.
Las causas estructurales o tericas suelen darse en modelos de corte transversal
con unidades muestrales de diferente "tamao". Consideremos, por ejemplo, un
modelo de decisiones de gasto en vivienda de las familias en funcin de la renta
familiar y de otras caractersticas. Podemos suponer que el grado de aleatoriedad
del gasto de las familias crece con los ingresos; las familias de ingresos bajos son
muy homogneas entre s, es decir, gastarn cantidades similares, ya que su
margen de maniobra para tomar decisiones de gasto es reducido. En cambio, las
familias de renta alta tendrn pautas de gasto ms heterogneas entre s. La
variabilidad del gasto entre familias "ricas" es mucho mayor que entre familias
"pobres". En este ejemplo, la propia teora sugiere la forma o pauta de la
heterocedasticidad: la varianza del error depende positivamente de la renta.
Otros ejemplos donde posiblemente surja el problema de la heterocedasticidad
'estructural' son los siguientes: un modelo que explica el reparto de dividendos (en
millones de ptas.) de una sociedad en funcin de los beneficios obtenidos en el
ejercicio (tambin en millones de ptas.) y de otras variables como el tamao de la
sociedad; un modelo de gastos en publicidad de diferentes marcas comerciales en
______________________________________
Manual de Econometra. Captulo 9, pgina 2 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

funcin de sus ventas y otras variables; un modelo que explica las ventas de una
compaa en funcin de su marketing-mix. Ntese que en todos los ejemplos los
datos muestrales son transversales, las unidades muestrales tienen diferente
"tamao" (familias de bajos y altos ingresos, empresas de dimensin reducida y
grande, etc.) y que la variable dependiente se mide en trminos absolutos
(millones de ptas. por ejemplo). Un hecho frecuente es que la dispersin absoluta
sea mayor en las unidades de mayor volumen precisamente por este motivo
'estructural', si bien es posible que la dispersin relativa sea ms homognea. As,
aunque los dividendos distribudos por las sociedades grandes estn muy
dispersos en torno al valor esperado, es posible que el ratio dividendos distribudos
sobre beneficios, dados los beneficios y dems caractersticas de la sociedad,
tenga una dispersin similar, independiente del tamao de las sociedades.
Los errores de especificacin de la forma funcional tambin pueden producir
1

heterocedasticidad . As, si el verdadero modelo, homocedstico, es doble-log y


estimamos un modelo lineal, las perturbaciones de ste son heterocedsticas,
como demostramos en el apndice 9.1.
Hay un tipo de modelos heterocedsticos con datos temporales que est
despertando creciente inters por su potencial de aplicacin en econometra
financiera, con series de cotizaciones o de rendimientos de valores. Son los
modelos ARCH, o GARCH, de varianza condicionada heterocedstica, en los que
el riesgo condicional de un valor (varianza de sus rendimientos en el da t, dada
toda la informacin disponible hasta ese da) va variando a lo largo del tiempo. A
diferencia de las situaciones anteriores, en las que la heterocedasticidad se
consideraba un 'problema' a evitar o tratar, en este caso es una fuente de
informacin que mejora sensiblemente la capacidad predictiva del modelo.
1

Para los alumnos de Bea: ya nos hemos encontrado un caso en la prctica 1

______________________________________
Manual de Econometra. Captulo 9, pgina 3 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

La heterocedasticidad puede surgir tambin por causas muestrales, en el sentido


de que el propio diseo de recogida de informacin o plan de muestreo genera
perturbaciones con varianzas distintas. Por ejemplo, cuando trabajamos con datos
agregados o medios procedentes de distintas submuestras, siendo variable el
tamao de las mismas. Supongamos un modelo lineal que explica el gasto en
publicidad de las empresas en funcin de las ventas del ao anterior y de otras
variables que omitimos por simplicidad. Supongamos tambin que el modelo
desagregado es homocedstico:

Y i = 0 + 1 X i + U i ; (i = 1,2,...n); var( U i ) =

(9.1)

donde Yi y Xi representan respectivamente los gastos de publicidad y las ventas


desfasadas un ao de la empresa i-sima, y Ui es el error aleatorio y
homocedstico del modelo.
Supongamos que solamente tenemos datos medios por zonas, obtenidos a partir
de muestras de empresas de cada una de las J zonas. El plan de muestreo ha sido
una estratificacin por zonas con afijacin proporcional, es decir, en cada estrato
(zona) se tom una muestra proporcional al nmero de empresas radicadas en la
misma, resultando J submuestras de empresas de tamao nj (j=1,2,...J), de
forma que nj=n. Nuestro modelo explica el gasto medio en publicidad en cada
zona en funcin de las ventas del ao previo. El modelo se estima con J
observaciones:
Y j = 0 + 1 X j +U j ; (j = 1,2,...J)

Los errores Uj de este modelo son la media de los nj errores de las empresas de la
zona j. Tienen esperanza nula y son por construccin heterocedsticos, ya que la
______________________________________
Manual de Econometra. Captulo 9, pgina 4 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

varianza de la media es la varianza de la poblacin dividida entre el tamao


muestral. En nuestro caso, la varianza del error de cada observacin es
inversamente proporcional al nmero de empresas en la muestra de la zona:
U j=

in=1j U i
; (j = 1,2,...J)
nj

E( U j ) = 0 j = 1,2,...J

(9.2)

Var( U j ) = ; (j = 1,2,...J)
nj
2

Ejercicio 9.1.- Si en el ejemplo anterior los J datos son valores agregados en vez
de medios (ventas y gastos en publicidad totales de las nj empresas del grupo)
obtenga la expresin de las varianzas de las perturbaciones

Heterocedasticidad por grupos. En ocasiones, la heterocedasticidad aparece en


modelos de datos agrupados. Pongamos a ttulo de ejemplo la ecuacin de salarios
de licenciados universitarios que propusimos en el captulo 6. El logaritmo del
salario depende de los aos de experiencia laboral (EXPER), con una relacin
cuadrtica, es decir, como explicativas inclumos la experiencia y su cuadrado.
Adems, el modelo hipotetiza que hay diferencias sistemticas entre los hombres
y las mujeres, y entre las cuatro titulaciones (Humanidades, Economa, Medicina e
Ingeniera). La muestra, de 600 licenciados, se reparte entre las titulaciones con
n1(Humanidades) =

172; n2(Ingeniera) =

345; n3(Medicina) = 148;

n4(Economa) = 335; El modelo que proponamos en el captulo 6 era el siguiente,


en el que se supona que las perturbaciones eran independientes, con media cero y
varianza constante:
______________________________________
Manual de Econometra. Captulo 9, pgina 5 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Y i = Log ( Salarioi ) = 1 + 2 S i + 3 T 1i + 4 T 2i + 5 T 3i + 6 E i + 7 E 2 i + u i ;
S i = MUJERi ; T 1i = Dummy de Medicina; T 2 i = Dummy de Economa T 3i = Dummy de Ingeniera;
E = exp eriencia laboral

Ahora supongamos que la varianza del error aleatorio difiere entre las titulaciones.
2

A la titulacin j (j=1,...4) corresponde una varianza j. Esto puede ocurrir porque,


por ejemplo,

los salarios de los de Humanidades, para un nivel dado de

experiencia, son muy homogneos, al trabajar en su mayora como enseantes,


mientras que los ingenieros presentan un abanico salarial mayor dependiendo del
puesto de trabajo y las funciones desempeadas.

En este ejemplo, hay

heterocedasticidad por grupos. El modelo contiene tantas varianzas del error


desconocidas, a estimar, como grupos y hay un nmero suficientemente grande
de observaciones en cada grupo para estimarlas, basndose en las sumas de
cuadrados de los respectivos errores.

Ms adelante veremos un contraste de

homocedasticidad por grupos.

2.

FORMAS

FUNCIONALES.

HETEROCEDASTICIDAD

ADITIVA

MULTIPLICATIVA.
Hemos visto que cuando la heterocedasticidad es un problema producido por el
plan de muestreo o por la agregacin de variables, generalmente conocemos,
excepto por un factor de escala, las varianzas de los errores de cada una de las
observaciones, que dependen del nmero de unidades muestrales desagregadas
contenido en cada observacin agregada. Conocemos, pues, la matriz y el
mtodo de MCG puede aplicarse sin dificultad, obteniendo estimadores ELIO como
se indicaba en la leccin anterior. El nico parmetro a estimar, aparte de los
2

coeficientes de regresin, es , el factor de escala en la expresin (UU') =V =


______________________________________
Manual de Econometra. Captulo 9, pgina 6 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

.
Pero cuando la heterocedasticidad obedece a otras causas, que hemos llamado
'estructurales' o bien es consecuencia de una especificacin incorrecta de la
forma funcional, las varianzas de los n errores son desconocidas. Si no hay
autocorrelacin, la matriz V es diagonal y contiene n valores desconocidos. Con
una muestra de tamao n no se pueden estimar libremente esas n varianzas y los
K parmetros de regresin por falta de grados de libertad. Pero para aplicar MCGF
es preciso tener, como sabemos, una estimacin consistente de la matriz V ( o ,
ya que en este caso podemos considerarlas equivalentes). Una posibilidad es
2
i.

parametrizar el comportamiento de las varianzas

La propia teora, el tipo de

variables, la experiencia previa o la propia voz de los datos pueden sugerir un


determinado esquema funcional de comportamiento. Por ejemplo, en el modelo
explicativo del gasto familiar en turismo y ocio una hiptesis tericamente
plausible y avalada por diversos estudios previos sugiere que la varianza del error
del gasto es proporcional a la renta familiar. Las siguientes son algunas formas
funcionales posibles para la varianza de las perturbaciones:
1)Var( U i ) = Z i ; ( > 0); i = 1,2,...N
2)Var( U i ) = Z i2 ; > 0; i = 1,2,...N
3)Var( U i ) = 0 + 1 Z i ; ( 1 > 0); i = 1,2,...N

(9.3)

0+ 1 Z i ; i = 1,2,...N

4)Var( U i ) = e

5)Var( U i ) = 12 ; (i = 1,2,... n1 )
= 22 ;

(i = n1 + 1,...N )

donde Zi representa alguna variable explicativa del modelo u otra ajena al mismo.
En las formas 1) y 2) la varianza del error es directamente proporcional a la
______________________________________
Manual de Econometra. Captulo 9, pgina 7 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

variable Z y a su cuadrado respectivamente. En 2) se evita la posibilidad absurda


de

tener

varianzas

negativas.

El

esquema

3)

recibe

el

nombre

de

heterocedasticidad aditiva, ya que la varianza de los errores es una funcin lineal


de Z, con trmino constante. La forma 4) se llama heterocedasticidad
multiplicativa. En ella, la varianza de los errores es una funcin exponencial de Z.
En ambos casos, se puede generalizar para incluir varias variables Zp (p=1,2,...P).
El caso 5) indica que la muestra contiene dos submuestras diferentes en cuanto a
la dispersin de las perturbaciones, y admite tambin una generalizacin a ms de
dos submuestras. Por ejemplo, con datos trimestrales podra ocurrir que la
varianza del error fuera homognea dentro de cada trimestre pero diferente para
los cuatro trimestres del ao; en ese caso, tendramos cuatro submuestras. En
otras ocasiones tendremos menos suerte, y no seremos capaces de encontrar una
2
i

especificacin adecuada para

compatible con los datos. An en este caso,

como veremos en el apartado 4, podremos estimar el modelo por MCGF


estimando consistentemente mediante los residuos de la regresin por MCO.

3. DIAGNSTICO DE LA HETEROCEDASTICIDAD. CONTRASTES


En este apartado se resean varios mtodos, incluyendo, de menor a mayor
formalizacin, desde la inspeccin visual de algunos grficos hasta los contrastes
cuya hiptesis nula es la homocedasticidad del modelo, frente a la hiptesis
alternativa de heterocedasticidad, en alguna de sus mltiples formas.
El tipo de datos y de problema nos previene sobre la posible presencia de
heterocedasticidad. En general, cuando trabajemos con datos transversales y
unidades de "tamaos" diferentes, debemos estar prevenidos. Por otra parte,
como vimos en el primer apartado, si los datos son agregados o medias de
______________________________________
Manual de Econometra. Captulo 9, pgina 8 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

distintas submuestras sabemos que el modelo es heterocedstico.

El anlisis visual de algunos grficos har que aumente o disminuya nuestra


______________________________________
Manual de Econometra. Captulo 9, pgina 9 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

sospecha, e incluso nos puede ayudar a detectar las variables (Z) responsables de
los cambios de varianza entre observaciones. En abscisas se representan las
posibles Z (generalmente, los regresores, uno cada vez), o los valores ajustados de
Y. En ordenadas, los residuos de la regresin MCO en valor absoluto o sus
cuadrados. Veamos algunos ejemplos: La figura 9.3 representa una situacin
homocedstica: los errores son independientes de los valores de Y ajustados, y
por tanto, podemos pensar que tambin lo son del conjunto de regresores. En la
figura 9.4, los errores cuadrticos crecen linealmente con Xr (una de las variables
explicativas del modelo): sospechamos una forma 1) de heterocedasticidad, donde
Zi es Xri. En la figura 9.5, la relacin parece ser cuadrtica (heterocedasticidad de
la forma 2).
Existen mltiples test estadsticos para detectar la heterocedasticidad, cuya
hiptesis nula es siempre que los errores son homocedsticos.
Uno de los contrastes clsicos es el de Goldfeld y Quandt (1972), adecuado
cuando sospechamos que dos o ms submuestras o grupos de individuos
perfectamente identificables pueden diferenciarse en la varianza de sus
respectivos errores. Es el caso 5) del apartado anterior. Por ejemplo, supongamos
que para explicar el precio de los coches en Espaa se recurre a un conjunto de
variables de prestacin: velocidad mxima, potencia del motor, etc.. La muestra
abarca una amplia gama de modelos incluyendo los pequeos utilitarios y los
familiares. Es posible que el grupo de modelos base, los ms pequeos, baratos y
sencillos de cada marca, tengan desviaciones respecto al precio esperado, dadas
sus caractersticas, que los modelos familiares, ms grandes y de mayor precio.
Supongamos, pues, un modelo con heterocedasticidad de la forma 5), es decir,
hay dos submuestras independientes de tamaos respectivos n1 y n2, con n1>k y
2
1

n2>k y n1+n2 = n, con varianzas del error

2
2

respectivamente. Podramos

______________________________________
Manual de Econometra. Captulo 9, pgina 10 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

estimar dos modelos de regresin independientes, uno para cada submuestra:


2
Y 1 = X 1 1 + U 1 ; U 1 ~ N(0; 1 I 1 )

(9.4)
2
Y 2 = X 2 2 + U 2 ; U 2 ~ N(0; 2 I 2 )

Como sabemos, en cada regresin se verifica que la suma de cuadrados de los


residuos MCO dividida entre la varianza de la perturbacin aleatoria sigue una
2

distribucin y ambas son independientes:

SCERR1

S1

~ n 1-k
2

(9.5)

SCERR2

2
2

S2

2
2

~ n 2- k
2

Para contrastar la hiptesis nula de homocedasticidad:


2
1

H0:

2
2

construimos una distribucin F a partir de las dos distribuciones, como cociente


2

entre ambas distribuciones , cada una de ellas dividida entre sus grados de
libertad. Si se cumple H0, se verifica que:

S2
n2 - k ~
F n 2 - k,n 1- k
S1
n1 - k

(9.6)

Si el estadstico de prueba [9.6] calculado para nuestro problema es mayor que el


valor crtico de la F, decidimos rechazar la hiptesis nula.
______________________________________
Manual de Econometra. Captulo 9, pgina 11 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Este contraste es exacto para muestras finitas admitiendo la posibilidad de que los
coeficientes de regresin de ambas submuestras sean diferentes. Para el modelo
restringido (coeficientes iguales), solamente es vlido asintticamente.
Este contraste de Goldfeld y Quandt puede extenderse al caso de g grupos, y
muestra de tamao n. La hiptesis nula de homocedasticidad es:

H 0 : 12 = 22 = ... = g2 = 2
E (uu ' ) = V = I n
2

(9.7)

La hiptesis alternativa de heterocedasticidad es:

12 I n

0
E (uu ' ) = V =
M

0
22 I n
M
0

...
0
...
0
O
M
... g2 I n

(9.8)

El contraste, basado en el proncipio del ratio de verosimilitudes, consiste en


estimar por MV el modelo restringido (bajo la hiptesis nula) y el no restringido
(permitiendo varianzas diferentes entre grupos). El estadstico de prueba y su
distribucin asinttica bajo la hiptesis nula es:
g

RV = n Ln 2 ni Ln i2 ~ 2 g 1
2

(9.9)

i =1

Goldfeld y Quandt partieron de los resultados anteriores para disear un contraste


de heterocedasticidad que no valiera solamente para aplicar a dos submuestras
______________________________________
Manual de Econometra. Captulo 9, pgina 12 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

previamente identificables sino tambin para esquemas de dependencia funcional


desconocida. Supongamos un modelo en que la varianza del error es proporcional
a una variable Zi conocida, que generalmente ser alguno de los regresores. La
idea es formar dos submuestras, una con los individuos para los que Zi presenta
los valores ms pequeos y otra de individuos con Zi mayor, estimar el modelo
para ambas muestras por separado y hacer el contraste [9.6]. Los pasos a seguir
son: 1) ordenar la muestra en orden creciente de valores de Zi; 2) eliminar las h
observaciones centrales; 3) Estimar el modelo para las dos submuestras extremas,
ambas de igual tamao (N-h)/2; 4) Realizar el contraste [9.6]. El estadstico de
prueba es S2/S1 porque las dos submuestras tienen el mismo tamao. La eleccin
del nmero de datos centrales a descartar, h, debe garantizar que las dos
muestras extremas resulten bastante 'separadas' pero a la vez que tengan un
tamao

suficiente

para

estimar

el

modelo.

Es

recomentable

descartar

aproximadamente un tercio de la muestra.


Un segundo tipo de contrastes se basa en hacer una regresin de los residuos
mnimocuadrticos de la regresin (en valor absoluto o al cuadrado) contra un
conjunto de variables Z que se suponen conjuntamente causantes de la
heterocedasticidad.

Supongamos,

por

ejemplo,

una

pauta

lineal

de

heterocedasticidad:
Var( U i ) = E( U i2 ) = i2 = 0 + 1 Z 1i + ...+ p Z p i ; i = 1,2,...n
Aproximando el cuadrado de las perturbaciones, desconocidas, mediante el
cuadrado de los residuos MCO, se estima por regresin la ecuacin que 'explica'
linealmente el cuadrado de los residuos MCO en funcin de las Z:

ei = d 0 + d 1 Z 1 i + ...+ d p Z p i + vi ; (i = 1,2,...n)
La hiptesis nula de homocedasticidad es la de nulidad conjunta de los
coeficientes d, excluyendo el trmino independiente, que se pone a prueba con el
______________________________________
Manual de Econometra. Captulo 9, pgina 13 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

estadstico F:
H 0 : d 1 = d 2 = ... = d p = 0
Esta es la base de una prolfica familia de contrastes, entre los cuales el ms
destacado representante es el de Breusch y Pagan.
El contraste de Breusch y Pagan, que ya se ha presentado en el captulo 5,
detecta incluso pautas no lineales de comportamiento de la varianza de la
perturbacin:

i2 = f ( 0 + 1 Z 1 i + ...+ p Z p i )
La hiptesis nula, de homocedasticidad, es que todos los coeficientes excepto 0
son nulos:
H 0 : 1 = 2 = ... = p = 0
Para realizar el test se siguen los siguientes pasos: 1) se estima el modelo original
por MCO y se calculan los residuos MCO; 2) se calcula la serie eN de residuos
tipificados, restando a cada uno la media y dividiendo entre la desviacin tpica. Si
el modelo tiene constante, la media de los residuos es cero y en este caso tipificar
es simplemente dividir entre la desviacin tpica (
N^2

serie e

e' e
).
n

Se calcula tambin la

de residuos tipificados al cuadrado; 3) se hace la regresin lineal de


N^2

estos ltimos, e

contra el conjunto de variables Z, incluyendo una constante y

se calcula la suma de cuadrados explicada; 4) si la hiptesis nula es cierta, la


mitad de la suma de cuadrados explicada se distribuye asintticamente como una
2

con p grados de libertad. Si el valor del estadstico de prueba supera el valor


crtico tabulado, dado el nivel de significacin elegido, rechazamos la hipteis nula
decidiendo que el modelo presenta heterocedasticidad.
______________________________________
Manual de Econometra. Captulo 9, pgina 14 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

El contraste de White es el ms general. Es un contraste asinttico que no


necesita especificar la lista de variables responsables de la heterocedasticidad. Se
estima una regresin auxiliar en la que los cuadrados de los residuos
minimocuadrticos vienen explicados

por una constante, cada una de las

variables explicativas, sus respectivos cuadrados y todos los productos cruzados


entre cada dos variables explicativas. Bajo la hiptesis nula de homocedasticidad,
el estadstico

nR 2 ~ 2 (q ) ,

donde R es el coeficiente de determinacin de la

regresin auxiliar y q es el nmero de variables explicativas de dicha regresin


auxiliar, excluyendo la constante. La ventaja de este contraste es que es muy
flexible, detectando heterocedasticidad bajo condiciones muy generales. Su
principal problema es que, en caso de detectarla, no nos da pista alguna sobre la
forma de la heterocedasticidad o la lista de variables responsables de la misma.
Una dificultad adicional, si la muestra no es muy grande, es el escaso nmero de
grados de libertad que quedan, ya que la lista de regresores es tan ampli.
Ejercicio 9.2. Si en el modelo original, del que queremos averiguar si hay o no heterocedasticidad,
hay K=6 variables explicativas, incluyendo la constante, y la muestra es de tamao 100, calcula el
nmero de grados de libertad de la regresin auxiliar para el test de White.

Otros contrastes basados en regresiones auxiliares de los residuos o sus


cuadrados, son los de Glejser y de Park. Puedes consultar detalles en los manuales
de econometra.

4. TRATAMIENTO DE LA HETEROCEDASTICIDAD. ESTIMACION DE UN MODELO


HETEROCEDASTICO O TRANSFORMACIN DEL MODELO
Al ser un caso particular de perturbaciones no esfricas, ya conocemos los
______________________________________
Manual de Econometra. Captulo 9, pgina 15 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

efectos de la estimacin por MCO de un modelo heterocedstico: los estimadores


de MCO son insesgados y consistentes, pero no eficientes. Los estimadores de
MCG son ptimos o eficientes, es decir, los de varianza mnima. Adems,
recordemos que si estimamos por MCO el modelo suponiendo homocedasticidad
cometemos un sesgo en la estimacin de la matriz de covarianzas de
2

-1

estimadores, ya que calcularemos (X'X)

los

cuando en realidad su matriz de

covarianzas es [7.3].
Recordemos tambin que las medidas de bondad del ajuste y los contrastes de
significacin y de restricciones sobre los parmetros pueden ser engaosas debido
a la mala estimacin de la precisin de los estimadores, sin que a priori pueda
conocerse la direccin del sesgo.
En el caso concreto de un modelo heterocedstico pero sin autocorrelacin, los
estimadores de MCG son de hecho estimadores de mnimos cuadrados
ponderados porque, la transformacin [7.10] consiste en ponderar a cada
individuo de la muestra inversamente a la desviacin tpica de su respectiva
perturbacin. En efecto, en este caso la matriz V= es diagonal de forma que la
matriz C de [7.5] es la matriz identidad y P es tambin diagonal:

______________________________________
Manual de Econometra. Captulo 9, pgina 16 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

V = = ; C = I n ; P = - 2 = V - 2

12

2
V =

...

*
ri

de forma que Y i = Yi/i y X

1
2
1

P=

22

...

1
2n

= Xri/i. La funcin a minimizar es ahora la suma de

cuadrados de los residuos ponderada segn la fiabilidad de cada dato: si la variaza


de la perturbacin de un individuo es grande, el dato muestral de la variable
dependiente de ese individuo tiene un intervalo de confianza grande, no debemos
asignar demasiado peso a los individuos poco fiables. Piense en la situacin
opuesta: si supiramos que la perturbacin de un individuo tiene varianza casi
nula, esto significa que el dato de su endgena es (casi) exactamente la funcin
de regresin poblacional, o sea, el valor esperado de Y dadas las X. Al ser una
estimacin muy fiable de un punto de la FRP, es lgico que asignemos a ese
individuo mucho peso.
Ejercicio 9.3.- Un modelo de gastos en vivienda
Queremos estimar un modelo con datos de N=20 familias que explique el gasto
anual en vivienda de cada una (Y) en funcin de la renta (X). El modelo es:
Y i = + X i +U i ; (i = 1,2,...20)
donde Yi son los gastos anuales en vivienda de la familia i-sima en miles de
unidades monetarias, y Xi son sus ingresos anuales expresados en las mismas
unidades. Los datos muestrales son los siguientes:
______________________________________
Manual de Econometra. Captulo 9, pgina 17 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

GR
UP
O
DE
FA
MIL
IAS

INGRESOS
NETOS/A
O (Millones
de ptas.)

GASTOS EN VIVIENDA/AO (MILES DE PTAS.)


Y

Gasto
medio de
las
familias
del grupo

Varianza
del gasto
dentro del
grupo
S2y

210

220

230

235

240

0.8

227

116

405

415

450

540

580

478

4866

650

600

790

820

900

752

12296

550

700

1020

1200

980

890

54560

a) Estimar por MCO el modelo de regresin lineal.


b) Suponiendo que la varianza de las perturbaciones sea proporcional al cuadrado
de la renta, reestimar el modelo por mnimos cuadrados ponderados.

Solucin:
a) La estimacin del modelo por MCO es la siguiente:
Y i = 186 . 648 + 125 . 9694 X

(t

= 0 . 7486 ;

= 7 . 3220

F = 53 . 61

b) La transformacin adecuada para convertir el modelo en homocedstico


consiste en dividir cada variable del modelo entre la renta disponible Xi. El modelo
resultante, estimado por MCO, es:
Y
X
R

= 154 . 9167
i

+ 110 . 5

(t
= 0 . 6289 ;

1
Xi

= 5 . 5227

F = 30 . 50067

Si la pauta de heterocedasticidad es como hemos supuesto, estos ltimos


estimadores son los de varianza mnima (ptimos) y las medidas de bondad del
ajuste del modelo original estn basadas en una estimacin errnea de la matriz de
______________________________________
Manual de Econometra. Captulo 9, pgina 18 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

covarianzas de U. Por tanto, los R de ambos modelos no pueden compararse.


Han cambiado mucho los resultados de la estimacin (coeficientes estimados)?
Observacin: para contestar esta pregunta, piensa qu coeficientes de ambos
modelos son comparables entre s.

Ejercicio 9.4.- Para el modelo de regresin lineal siguiente:


Y i = 1 + 2 X 2 i + 3 X 3 i +U i

a) i2 = 2 X 2i
b) i2 = 2 X 22i
c) i2 = 2 X 1i2 X 22i
d) i2 = 2 X 1i X 2i

indicar cul es el modelo (homocedstico) transformado en cada uno de los


siguientes casos:
Solucin:
a)

Yi
X

= 1
2i

1
X

2i

X
1
b) Y i =
+ 2 + 3
1
X 2i
X 2i
X

c)

2i

3i
2i

X 3i
X 2i

Ui
X 2i

Yi
Ui
1
1
1
= 1
+ 2
+ 3
+
X 2 i X 3i
X 21 X 3 i
X 3i
X 2 i X 2 i X 3i

EL MTODO DE MCGF. CMO ESTIMAR CONSISTENTEMENTE LA MATRIZ


Como sabemos, para aplicar MCG es preciso estimar previamente la matriz de
2

covarianzas de los errores , es decir, determinar los pesos wi por los que
ponderar a cada individuo de la muestra. Hay dos posibilidades para determinar
dichos pesos. La primera consiste en admitir alguna hiptesis especfica acerca de
______________________________________
Manual de Econometra. Captulo 9, pgina 19 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

la forma funcional de la heterocedasticidad, como en el ejercicio anterior y aplicar


mnimos cuadrados
ponderados, estimando el modelo transformado :

wiY i = wi 1+ wi 2 X

+ ... + w i
1
con w i =
i
2i

Ki

Observe que en general el modelo resultante no tiene trmino independiente, por


lo que las medidas de bondad del ajuste basadas en la frmula habitual de
descomposicin de la varianza pierden validez.
Pero hay ocasiones en las que no tenemos base terica ni emprica para apostar
por una determinada hiptesis en este sentido. En este caso, podramos estimar
2

i mediante e i, es decir, el cuadrado del residuo MCO correspondiente a cada


observacin. El modelo a estimar sera, pues:
Y i = 1 + X 2i + ...+ X Ki + U i
1
2
K
ei
e1
ei
ei
ei

Ejercicio 9.5. Qu desventajas tiene esta propuesta?, Cmo ser el ajuste?.


Aplquelo con E-Views a un ejemplo concreto
Como se advirti en el captulo anterior, las propiedades en muestras pequeas de
los estimadores de MCGF son desconocidas y en la prctica es posible que,
cuando trabajamos con muestras pequeas, sea incluso preferible estimar el
modelo por MCO que al menos proporciona estimadores insesgados. En este caso,
______________________________________
Manual de Econometra. Captulo 9, pgina 20 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

si la muestra es grande, conviene emplear la correccin de White para estimar sus


varianzas.

Los estimadores de White de las varianzas de los estimadores MCO


Si optamos por el mtodo de MCO, hay, como sabemos, un problema adicional.
La matriz de varianzas covarianzas de los estimadores MCO, como sabemos, es
2

[7.3], frmula que contiene las varianzas desconocidas i. White (1980) demostr
2
i

que [7.3] se puede estimar consistentemente sustituyendo en ella

por e i,

siendo como de costumbre ei el residuo minimocuadrtico de la observacin isima. Todos los paquetes economtricos dan la opcin de calcular los
estimadores consistentes de White, o la correccin de White de la s varianzas
de los estimadores. Con esos trminos, se estn refiriendo a la estimacin de la
matriz de varianzas-covarianzas de los estimadores MCO que acabamos de
presentar.
Ejemplo. Observa atentamente y comenta los siguientes resultados, del modelo
explicativo del salario de 600 licenciados universitarios con el que ya hemos
trabajado en el captulo 6. Qu se ha hecho en cada estimacin y por qu?

Estimacin 1
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Sample: 1 600
Included observations: 600
______________________________________
Manual de Econometra. Captulo 9, pgina 21 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO

12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638

0.016769
0.002316
9.23E-05
0.013384
0.016136
0.013465
0.009081
0.016143
0.009881

750.3996
7.503810
-7.706221
14.11378
9.023679
6.970193
-10.04968
12.11571
3.202046

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0014

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.476313
0.469224
0.110915
7.270516
472.5676
1.944500

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000

Estimacin 2
Dependent Variable: LOG(SALARIO)
Method: Least Squares
Date: 10/28/01 Time: 18:25
Sample: 1 600
Included observations: 600
Weighting series: 1/RESID
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO

12.58582
0.017251
-0.000705
0.187151
0.141893
0.091417
-0.091320
0.193591
0.032478

0.002295
0.000291
1.03E-05
0.001405
0.001816
0.001488
0.000286
0.002048
0.000723

5484.304
59.25447
-68.17610
133.1850
78.13480
61.43859
-318.7607
94.54385
44.90079

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

Weighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

1.000000
1.000000
0.017002
0.170843
1597.819

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic

12.79008
211.6233
-5.296063
-5.230109
22658.27

______________________________________
Manual de Econometra. Captulo 9, pgina 22 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Durbin-Watson stat

0.028731

Prob(F-statistic)

0.000000

0.476236
0.469146
0.110923
1.942783

Mean dependent var


S.D. dependent var
Sum squared resid

12.75184
0.152242
7.271588

Unweighted Statistics
R-squared
Adjusted R-squared
S.E. of regression
Durbin-Watson stat

Estimacin 3

Dependent Variable: LOG(SALARIO)


Method: Least Squares
Sample: 1 600
Included observations: 600
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
EXPER
EXPER^2
INGENIERO
MEDICINA
ECONOMIA
MUJER
HARVARD
POSGRADO

12.58346
0.017376
-0.000711
0.188897
0.145605
0.093852
-0.091262
0.195579
0.031638

0.017261
0.002524
0.000100
0.012327
0.015941
0.012654
0.009088
0.020375
0.011118

729.0193
6.885542
-7.113170
15.32370
9.133909
7.416805
-10.04158
9.598800
2.845817

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0046

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.476313
0.469224
0.110915
7.270516
472.5676
1.944500

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

12.75184
0.152242
-1.545225
-1.479271
67.19209
0.000000

OTRAS FORMAS DE AFRONTAR LA HETEROCEDASTICIDAD: LAS SOLUCIONES


AD HOC
______________________________________
Manual de Econometra. Captulo 9, pgina 23 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Se han sugerido otras soluciones prcticas para eliminar la heterocedasticidad,


mediante ciertas transformaciones del modelo, entre las que destacan:
a) Estimar el modelo con las variables en logaritmos
b) Tomar valores relativos (porcentaje de gasto sobre la renta en lugar de la
cifra de gasto en unidades monetarias)
c) Emplear deflactores cuando los datos son temporales y corresponden a
series largas
d) Dividir la muestra en submuestras ms homogneas en cuanto al
'tamao' de sus individuos y estimar por separado.
Esos son procedimientos 'ad hoc' cuya justificacin estadstica se encuentra
fcilmente. Por ejemplo, podra ocurrir que el modelo 'verdadero' fuera doble-log y
la heterocedasticidad provocada por la especificacin incorrecta de la relacin, de
ah que al tomar logaritmos se corrija el problema. (Est el lector capacitadopara
descubrir en qu casos las transformaciones b), c) y d) sugeridas pueden eliminar
la heterocedasticidad?).

5. LOS MODELOS ARCH DE HETEROCEDASTICIDAD CONDICIONAL


AUTOREGRESIVA
Engle (1982) propuso una clase de modelos llamados genricamente ARCH
(Autoregressive Conditional Heterocedasticity) que han demostrado ser muy tiles
para explicar el comportamiento de muchas series financieras, como las
cotizaciones burstiles o los tipos de cambio de las monedas y en general los

______________________________________
Manual de Econometra. Captulo 9, pgina 24 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

precios en mercados especulativos . Se trata de modelos para datos temporales


que por construccin tienen varianzas condicionadas variables a lo largo del
perodo muestral. El trmino 'condicional' se refiere al conjunto de informacin
disponible en el momento t, es decir, a los datos histricos previos observados.
Un modelo ARCH sencillo es el ARCH(1):

Y t = Y t -1 + X t + U t ; U t ~ N(0, ht )
Var( U t ) = ht = 0 + 1 U t2-1
La variable endgena depende de su propio valor con un retardo, en una regresin
de Y contra s misma por lo que recibe el nombre autoregresivo y de alguna/s
exgenas. En este modelo, la varianza de la perturbacin aleatoria en el momento
t condicionada a la informacin disponible hasta el perodo anterior, depende del
cuadrado de la propia perturbacin en t-1 (de ah que el orden de este sencillo
modelo ARCH sea 1) y por tanto el modelo es heterocedstico, en la medida en
que U va variando a lo largo del tiempo tambin lo hace la varianza ht. Los
modelos ARCH se estiman por procedimientos iterativos de estimacin no lineal.
La propia existencia de efectos ARCH, es decir, de heterocedasticidad condicional,
puede contrastarse mediante contrastes especficos que se pueden encontrar
descritos en la literatura especializada.

Caso .- Un modelo ARCH para los rendimientos de la bolsa de Madrid


A ttulo ilustrativo, se presenta la salida de una estimacin GARCH de los rendimientos de las
acciones en la bolsa de Madrid. Los datos corresponden a cotizaciones diarias al IBEX35 desde el
28-03-96 al 21-09-99. El alumno puede consultar la ayuda el E-Views para interperetar esos
resultados

Estos modelos se han generalizado a los GARCH, como el del ejemplo

______________________________________
Manual de Econometra. Captulo 9, pgina 25 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

CAPTULO 9. RESUMEN

La heterocedasticidad consiste en que las varianzas de las perturbaciones


difieren entre unidades muestrales o 'individuos'.
Generalmente, surge en muestras transversales: a) cuando los individuos son
agregados o promedios de unidades muestrales homocedsticas; b) cuando los
individuos tienen 'tamao' muy diferente (grandes empresas y PYMES en la
misma muestra); c) cuando por error de especificacin se ha estimado
incorrectamente la forma funcional. Un caso frecuente ocurre cuando el
modelo es doble-log y se estima una ecuacin lineal.
Surge tambin en modelos de precios en mercados especulativos, para datos
temporales. En los modelos ARCH, que explican satisfactoriamente el
comportamiento de cotizaciones burstiles y tipos de cambio, la varianza de la
perturbacin Ut condicionada a la informacin disponible hasta t-1 depende de
2
______________________________________
U t-1 y por tanto, al variar a lo largo de la muestra,
es heterocedstica.
Manual de Econometra. Captulo 9, pgina 26 .
1

Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)


1
heterocedasticidad existen diversos
contrastes.
Su Pompeu
hiptesis
Catedrtico
Universidad
Fabra
2
Universidad
de Las Palmasque
de GC
homocedasticidad y difieren Catedrtica
en la hiptesis
alternativa,

Para detectar la
nula siempre es
puede ser ms o menos general. Hemos estudiado los test de Goldfeld y
Quandt y sus extensiones, el de Breusch y Pagan y el de White

Los estimadores MCO de un modelo heterocedsticos son insesgados pero no


ptimos. Para estimar su matriz de varianzas-covarianzas es recomendable
emplear el estimador consistente de White, que aplica [7.3] sustituyendo los
2
elementos de por los cuadrados de los residuos MCO e i.

APENDICE 9.1

Si el verdadero modelo es log-lineal y se estima un modelo lineal, ste es


heterocedstico.
Demostracin:
El modelo verdadero, log-lineal, suponiendo sin prdida de generalidad un solo
regresor, es:
2

Y i = X i eu i ; ui _N (0, )

ln Y i = + ln X i + ui

con = ln

El modelo estimado es lineal en x. Queremos demostrar que su error, vi, es


heterocedstico:
Y i = 0 + 1 X i + vi
i
Puesto que ui es normal, eu sigue una distribucin log-normal, con:
1

E( eu ) = e 2
i

Var( eu ) = e ( e - 1)
de forma que la esperanza del error del modelo estimado, vi, es:
E( vi ) = E( Y i - 0 - 1 X i ) =
E( X i eui - 0 - 1 X i )
1

= X i e 2 - 0 - 1 X i
2

y su varianza resulta ser:

______________________________________
Manual de Econometra. Captulo 9, pgina 27 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Var( vi ) = E[ vi - E( vi ) ] 2
1

= E[ X i eui - 0 1 X i - X i e 2 + 0 1 X i ]
1

= E[ X i ( eui - e 2 ) ] 2
2

= 2 X i2 e ( e - 1)
2

Vemos que vi es heterocedstica, ya que su varianza depende de los datos


muestrales de la variable exgena Xi. Concretamente, si >0 es una funcin
creciente y si <0 es una funcin decreciente de Xi.

______________________________________
Manual de Econometra. Captulo 9, pgina 28 .
1
2
Carlos Murillo Fort y Beatriz Gonzlez Lpez-Valcrcel (2000)
1
Catedrtico Universidad Pompeu Fabra
2
Catedrtica Universidad de Las Palmas de GC

Das könnte Ihnen auch gefallen