Heterocedasticidade

1
Bibliografia:
GREENE, W.H. Econometric Analysis, 5a. edição,

Macmillian Publishing Company, 2003.
GUJARATI, D. N. e PORTER, C. P. Econometria Básica.

5ª edição, McGraw-Hill e Artmed. 2011.
PINDYCK, R.S.; RUBINFELD, D. L. Econometria. Rio de

Janeiro: Elsevier, 2004.
WOOLDRIDGE, J.M. Introductory Econometrics. A

Modern Approach. 2nd ed. Ed. Thomson. 2010.
2
Homocedasticidade é quando as
perturbações ui possuem a mesma
variância.
3
E (u )  
2
i
2
i = 1, 2, ..., n.
 2 0 0  0
 
 0  2
0  0
E (uu `)   0 0 2  0
 
    
0 0 0   2 

4
Na figura a seguir, observa-se
que a variância de ui, permanece a
mesma, independentemente dos
valores assumidos pela variável
X.
5
Homocedasticidade 6
Heterocedasticidade é quando a
variância do erro não é constante
para todos os valores da variável
independente.
7
E (u )  
2
i i
2
i = 1, 2, ..., n.
 12 0 0  0 
 
0  22 0  0 
E (uu `)   0 0  32  0 
 
    
0   n2 
 0 0
8
Na Figura seguinte, mostra
que a variância de ui varia à
medida que X aumenta,
caracterizando a presença de
Heterocedasticidade.
9
Heterocedasticidade
10
11
1– Despesa com alimentação
em famílias com rendas
diferentes.
12
2 – Salários em função
dos anos de estudos.
13
3 – Poupança das
famílias em função
da renda.
14
4 – Taxa de rentabilidade
sobre o tamanho da
empresa.
15
A dispersão dos erros na
presença da
heterocedasticidade pode ser
representado como nos
gráficos a seguir:
16
17
18
19
20
 Vejamos um exemplo de
presença de
heteroscedasticidade
21
Considere os dados na tabela abaixo de 19 trabalhadores e os anos de estudo de cada um.
Salários Anos de
estudo
410 1
508,9 2
857,7 3
551,3 4
789,2 5
935,5 6
1529,3 7
1497,5 8
2317,7 9
2169,5 10
2596,8 11
2844,6 12
3391 13
2671,2 14
2653,8 15
2939,1 16
3437 17
4583,3 18 22
Salário estimado e resíduos
Salários Anos Y previsto Resíduos
410 1 192,08 217,92
508,9 2 409,4368 99,46316
857,7 3 626,7937 230,9063
551,3 4 844,1505 -292,851
789,2 5 1061,507 -272,307
935,5 6 1278,864 -343,364
1529,3 7 1496,221 33,07895
1497,5 8 1713,578 -216,078
2317,7 9 1930,935 386,7653
2169,5 10 2148,292 21,20842
2596,8 11 2365,648 231,1516
2844,6 12 2583,005 261,5947
3391 13 2800,362 590,6379
2671,2 14 3017,719 -346,519
2653,8 15 3235,076 -581,276
2939,1 16 3452,433 -513,333
3437 17 3669,789 -232,789
4583,3 18 3887,146 696,1537
23
3559,3 19 4104,503 -545,203
Variável X 1 Plotagem de resíduos
800
600
400
200
Resíduos
0 5 10 15 20 25
-200
-400
-600
-800
Variável X 1 24
25
1 – Modelos de
aprendizagem do erro
26
27
2 – À medida que a renda
aumenta, as pessoas têm
maior renda discricionária
28
3 – Empresas com maiores
lucros geralmente mostram
maior variabilidade em suas
políticas de dividendos
29
4 – Uma melhora ou
aperfeiçoamento das técnicas
de coleta de dados,
provavelmente diminui a
variância.
30
5 –Observações discrepantes
ou outliers.
31
32
6 – Erros de Especificação
(omissão de variáveis
relevantes)
33
7 – Assimetria na distribuição de um ou
mais regressores incluídos no modelo.
Exemplo: variáveis como renda,

riqueza e educação.
A distribuição de renda e riqueza é

desigual, pertencendo a uma parcela
mínima da população.
34
8 - Transformação incorreta
de dados
35
9 - Formas funcionais
incorretas
36
O problema da
heterocedasticidade é mais
comum em dados de corte
do que em séries
temporais.
37
38
O que acontecerá aos estimadores
de MQO e suas variâncias se
introduzirmos heterocedasticidade?
39
Continuarão à serem lineares,
não viesados, com a menor
variância (eficientes) e
consistentes?
40
Seja a equação: Yi  1   2 X i  ui
A variância homocedástica é:
ˆ  2
var(  2 ) 
x 2
i
A variância heterocedástica é:
var( ˆ 2 )
 x 2
i i
2
( x )2 2
i
41
var( ˆ 2 )
 x
2
i i
2
( x )
2 2
i
Anexo
42
Na presença da
heterocedasticidade, o
ˆ
estimador 2 é ainda linear, não
viesado e consistente?
43
Prova da linearidade na heterocedasticidade:
Yi  1   2 X i  ui
̂ 2   kiYi
44
Prova da inexistência de viés na heterocedasticidade:
Yi  1   2 X i  ui
̂ 2   kiYi
ˆ2   ki (1  2 X i  ui )
ˆ2  1  ki  2  ki X i   kiui
se k i 0 e k Xi i 1
45
se k i 0 e k X
i i 1
ˆ2  2   kiui
E (ˆ2 )  2   ki E (ui )
se
E (ui )  0
E (ˆ2 )   2
46
Assim, dos slides anteriores,
ˆ
tem-se que 2 é um estimador
linear e não viesado apesar da
heterocedasticidade.
47
ˆ 2 é um estimador consistente
apesar da heterocedasticidade?
48
A condição de suficiência para a
consistência é que ˆ2 seja não
viesado e que sua variância tenda
para zero à medida que o
tamanho da amostra n, tende para
o infinito.
49
 xi2 . i2
var( ˆ 2 ) 
  2 2
xi
Dividindo o numerador e o denominado r por n :

 xi2 i2
var( ˆ 2 )  n
(  xi2 ) 2
n
  xi2 i2 
 
lim var( ˆ 2 )  lim n 0
n 
 ( x 2 ) 2 
 i

 n 
n 
50
 Como n tende para o
infinito,  xi2 i2
n
tende a zero,
pois  é um número finito.
i
2
51
Admitindo que ˆ 2 seja linear, não
viesado e consistente, ele ainda é eficiente
ou o melhor estimador?
52
53
Porque o estimador de M.Q.O usual
de  2 dado em (2.1) não é eficiente ou
o melhor estimador, embora ainda seja
não tendencioso?
54
 O método usual dos M.Q.O confere igual
peso ou importância a cada observação.
 Já o método dos mínimos quadrados

generalizados (M.Q.G) leva tal
informação em conta e, portanto, é
capaz de produzir estimadores que
sejam MELNV.
55
Para ver isso, seja o modelo de duas variáveis:
Yi  1   2 X i  ui
que para manipular algebricamente, escrevemos como:
Yi  1 X 0i   2 X i  ui (1)
em que X 0i  1 para cada i .
56
 2
Suponha agora que as variâncias heterocedasticas i sejam
conhecidas.
Dividindo (1) por i :
Yi  X 0i   Xi   ui 
 1     2     
i  i   i  i 
que, para facilitar, escrevemos como:
Yi   X   X  u
* *
1
*
0i
*
2
*
i
*
i
57
 Qual a finalidade de
transformar o modelo
original?
58
2
 ui 
var(u )  E (u )  E 
* * 2

i
i i

1
var(u )  E (u ) 
* * 2
E (ui2 ) pois  i2 é conhecido.

i i 2
i
1
var(u )  E (u ) 
* * 2
( i2 ) pois E (ui2 )   i2

i i 2
i
var(u )  E (u )  1 (é uma constante)

*
i
* 2
i
59
Observe agora que, os  *
1 e
 2* estimados por M.Q.G são
MELNV e não os estimadores
de M.Q.O ˆ1 e ˆ 2 .
60
Esse método de transformar as
variáveis originais de modo que as
variáveis transformadas satisfaçam as
hipóteses do modelo clássico, para em
seguida aplicar os M.Q.O, é conhecida
como método dos mínimos quadrados
generalizados.
61
Nos M.Q.G, o peso atribuído a cada
observação é inversamente
proporcional a seu  i .
62
Para perceber claramente a diferença entre M.Q.O e M.Q.G, considere o diagrama de
dispersão hipotético da figura.
Y C
û
Yî  ˆ1  ˆ2 X i
A
û û B
X
Figura - Diagrama de dispersão hipotético.
63
64
Originalmente, o modelo tratado é:
Y  X   (1)
As hipóteses básicas em relação ao termo

aleatório são:
E ( )  0 (2)
E ( ' )   I n
2
(3)
 tem distribuição normal (4)

65
O método de Mínimos Quadrados
Generalizados relaxará apenas a hipótese
E ( ' )   I n , que passará a ser:
2
E ( ' )   
2
(5)
sendo Ω uma matriz definida positiva.
66
O objetivo do método é estimar os
parâmetros do modelo, assim como
anteriormente, considerando,
entretanto, que há uma nova
configuração da matriz de variância e
covariância dos resíduos.
67
O princípio desse método segue,
portanto, o mesmo padrão dos
procedimentos adotados para a
correção dos problemas de
autocorrelação e de
68
Assim, será necessário encontrar a
forma mais adequada para transformar
o modelo original, de modo a gerar
termo aleatório não
autocorrelacionado e homocedástico.
69
Com esse objetivo, tomaremos uma matriz T, não
singular (matriz com um determinante cujo valor é
diferente de zero), chamada matriz de transformação, e
faremos a seguinte operação no modelo original:
Y  X  
TY  TX  T (6)
Anexo B
70
71
 A primeira delas refere-se ao fato de
que, para que esse método possa ser
aplicado, é essencial que a matriz Ω
seja conhecida.
 Em termos práticos, isso não ocorre

com freqüência.
 Sendo assim, será necessária uma

estimativa de Ω.
72
Aqui, esbarramos em outra dificuldade,
pois Ω é uma matriz de dimensão n x n,
com n(n + 1)/2 termos desconhecidos,
sendo n o número de elementos da
amostra.
Dessa forma, verificamos a impossibilidade

de estimar todos os parâmetros da matriz
com base nas n observações existentes.
73
Essa estimação somente será possível
se for possível reduzir o número de
parâmetros a ser estimado.
Isso pode ser obtido por meio da

imposição de restrições sobre o
padrão da matriz Ω.
74
No caso da heterocedasticidade, a matriz Ω é
diagonal, tal como:
 12 0 0  0
 
 0 2 0
2
 0
E ( `)   2    0 0 3 
2
0
 
    
0   2
 0 0 n
75
Por último, é importante notar
que, para a estimação do modelo, é
necessário encontrar a matriz T, tal
-1
que T`T = Ω .
76
-1
Se a matriz Ω é diagonal, Ω também o é:
 1 
 2 0 0  0 
 1 
 0 1
0  0 
  2
2

 1  1 
 0 0  0 
  2
3 
    
 1 
 0 0 0 
  n2 
77
 Feito isso, basta transformar o modelo
TY  TX  T
 E a solução explícita de MQG será:
ˆ 
  X ´ X 1
1 1
X ´ y
78
79
ˆ
 * ˆ

Tanto 2 como 2 são estimadores
lineares não tendenciosos.
Yi  1 X 0i   2 X i  ui
ˆ
 *
Mas sabemos que 2 é eficiente, isto
é, tem a menor variância.
Yi   X   X  u
* *
1
*
0i
*
2
*
i
*
i
80
O que acontecerá com o intervalo
de confiança e os testes t e F,
quando usamos os M.Q.O e o
estimador ˆ 2 desconsiderando a
heterocedasticidade?
81
Quando calculamos uma regressão pelos
M.Q.O padrão, ignorando a
var( ˆ

heterocedasticidade, a 2 ) será:
ˆ  2
var(  2 ) 
x 2
i
, que é um estimador viesado da
var( ˆ 2 ) 
 i i
x  2
( x ) 2 2
i
82
O viés decorre do fato de que a
variância residual estimada, não é mais
um estimador não tendencioso quando
a heterocedasticidade se faz presente.
ˆ 
2  uˆ 2
i
(n  2)
83
ˆ  2
var(  2 ) 
Na média, x 2
i
superestima
var( ˆ )
 x i i
2
( x )
2
ou subestima 2 2
i
.
84
Em geral, não podemos dizer se o viés é
positivo (superestimação) ou negativo
(subestimação), porque isso dependerá da natureza
da relação entre 
2
i e os valores assumidos pela
variável explanatória X, como se vê na
var( ˆ 2 ) 
 i i
x 2 2
( xi2 ) 2
85
var( ˆ ) 
 x2
i i
2
( x )
2 2 2
Dada a equação i
substituindo
   ki , nessa equação, tem-se:

i
2 2
ˆ
var(  2 ) 

2
 x 2
k
i i

 2
x k2
i i
( x )
2 2
i  xi
2
x i
2
86
Observe que o primeiro termo à
esquerda é a variância homocedástica,
como se pode observar:
ˆ  2
var(  2 ) 
x 2
i
87
x k2
i i
1
Portanto, se x i
2
, então a
variância heterocedástica dada é maior

que a homocedástica.
88
2
Nesse caso, var( ˆ2 )  ,
 i
x 2
subestimará a heterocedásticidade,
levando as estatísticas t e F a inflarem.
89
Em conseqüência, não podemos mais
confiar nos cálculos dos intervalos de
confiança e nos testes de t e F
empregados convencionalmente.
90
Portanto, se usarmos M.Q.O na
presença de heterocedasticidade, a
conclusão a que chegamos ou as
inferências que fizermos, poderão ser
bastante enganosas.
91
 Consequências da
Heterocedasticidade – uma
visão matricial
92
Consideramos o seguinte modelo:
Y  X   ,
com
E ( )  0 (1)
 12 0 0  0 
 
 0  2
2 0  0 
E ( `)   0 0  32  0  (2)
 
    
0 0 0 0  n2 

93
O vetor dos estimadores dos parâmetros é o seguinte:
b    ( X `X )1 X `
E (b)    ( X `X )1 X È ( )
E (b)    ( X `X ) 1 X È ( )
Conforme (1):
E ( )  0
Assim:
E (b)   (3)
94
A matriz da variância e covariância de b é:
E(b   )(b   )`  E[( X `X )1 X ` `X ( X `X )1 ]
E(b   )(b   )`  ( X `X )1 X È( `) X ( X `X )1
Conforme (2):
E ( `)   (2)
Temos então:
E(b   )(b   )`  ( X `X )1 X `X ( X `X )1
var  cov(b)  ( X `X ) 1 X `X ( X `X ) 1 (4)
95
Devemos observar que a expressão (4),
assim como ocorre no caso da existência
de autocorrelação, é diferente de
var  cov(  )   2 ( X `X ) 1 , que é o estimador
utilizado no cálculo das variâncias e

covariâncias dos parâmetros estimados por
mínimos quadrados ordinários (MQO).
96
Conforme visto anteriormente, isso
implica que, apesar de os estimadores dos
parâmetros serem não viesados, existem
problemas nas conclusões tiradas com base
nos testes de hipótese.
97
Conclusão:
1. Estimadores dos parâmetros (β) são não

viesados, mas ineficientes.
2. As variâncias estimadas dos parâmetros

são viesadas, gerando problemas com os
testes de hipóteses, ou seja, incorreções
dos testes de t e F e nos intervalos de
confiança.
98
99
 Não existe uma regra firme e
segura para detectar a
heterocedasticidade, somente
algumas regras práticas.
10
0
 Como o economista não tem controle
das variáveis, encontrar
heterocedasticidade pode ser uma
questão de intuição, conjectura,
experiência empírica anterior ou pura
especulação.
10
1
10
2
1- Natureza do Problema
Anatureza do problema que está
sendo considerado sugere se é
provável a presença de
10
3
Consumo sobre a renda, envolvendo famílias
com rendas diferentes.
Investimento em relação às vendas, tx de

juros, etc. no caso de empresas de pequeno,
médio e grande porte serem amostradas
conjuntamente.
 Normalmente em dados de corte transversal

que envolvam unidades heterogêneas, a
heterocedasticidade pode ser mais a regra do
que exceção.
10
4
2 - Método Gráfico
10
5
 Se não existem informações a priori
ou empíricas sobre a natureza da
heterocedasticidade, na prática
podemos fazer a análise de regressão
supondo que não há
heterocedasticidade e depois fazer um
exame dos resíduos elevados ao
quadrado, para ver se eles apresentam
algum padrão sistemático.
10
6
10
7
10
8
10
9
11
0
Park formaliza o método gráfico ao sugerir que
 i2 é alguma função da variável explicativa Xi .
A forma funcional sugerida por ele foi:

   Xi e
i
2 2 vi
ou
ln   ln    ln X i  vi
i
2 2
(5.1)
11
1
 2
Como i geralmente não é conhecido, Park sugere
uˆ 2
usar i como uma proxy e rodar a seguinte regressão:
ln uî2  ln  2   ln X i  vi
ln ui     ln X i  vi
ˆ 2
(5.2)
em que: H 0 :  12   22   32  ...   n2 Homocedasticidade

H 0 :  12   22   32  ...   n2 Heterocedasticidade
11
2
Se  for estatísticamente significativo
 presença de heterocedaticidade
Se  for não estatísticamente significativo

 homocedasticidade.
Pode-se usar o teste de Park como um método

estritamente exploratório.
11
3
11
4
Após obter os resíduos, û i , de uma
regressão de MQO, Glejser sugere fazer
uma regressão dos valores absolutos de û i
contra a variável X que se considera
estreitamente associada a  i2 .
11
5
Neste experimento, Glejser empregou as seguintes
formas funcionais:
uî  1   2 X i  vi
uî  1   2 X i  vi
1
uî  1   2  vi
Xi
1
uî  1   2  vi
Xi
11
6
 Quando houver mais de uma variável
independente, o teste de Park e Glejser pode
ser trabalhado da seguinte forma:
 Teste de Park: uˆ  1   2Yî  vt

2
i
 Teste de Glejser: ûi  1   2Yî  wi
11
7
11
8
Aidéia básica do teste é verificar
se existe diferença entre a
variância dos resíduos estimados,
localizados nas proximidades do
intercepto, e aqueles que se
encontram a uma distância maior.
11
9
12
0
Para simplificar, considere um modelo:
Yi  1   2 X i  ui
Suponha que  i
2
se relacione positivamente com X i
como:
  X
i
2 2
i
2
(5.10)
12
1
12
2
1) Ordene as observações pela
magnitude da variável explanatória
Xi, começando pelo valor mais baixo
de X ;
12
3
2) Omita as observações centrais, c,
em que c é especificado a
princípio, e divida as ( n  c)
observações restantes em dois
grupos, cada um com (n  c) 2

observações.
12
4
12
5
3) Ajuste as distintas regressões por M.Q.O às primeiras ( n  c) 2
observações e às últimas (n  c) 2 observações;
Obtenha as respectivas somas de quadrados dos resíduos, SQR1 e

SQR2 , sendo que SQR1 , representa a SQR da regressão
correspondente aos menores valores de X i (o grupo com pequena

variância) e;
SQR2 representa a SQR correspondente aos maiores valores X i ( o

grupo com grande variância);
12
6
Cada uma das SQR tem:
n  c   k  n  c  2k 
  gl
2 ou  2 
em que k é o número de parâmetros a serem estimados

incluindo o intercepto.
12
7
4) Calcule a razão:
SQR2 GL

SQR1 GL (5.11)
12
8
Admitindo que ui distribui-se
normalmente, e que a hipótese de
homocedasticidade é válida, então se
pode mostrar que  de (5.11) segue a
 n  c  2k 
F gl  
distribuição com de  2  no
numerador e no denominador (Fc).
12
9
Se  ( F )calculado  Fc , rejeita-se a
hipótese de homocedasticidade, ou seja:
H0: Homocedasticidade
HA: Heterocedasticidade
13
0
A omissão das observações
centrais ( c ) serve para acentuar a
diferença entre o grupo de pequena
variância ( SQR1 ) e o grupo de grande
variância (SQR2 ) .
13
1
 Goldfeld e Quandt sugerem:
n = 30; c=8
n = 60; c = 16
 Judge et al sugerem:
n = 30; c=4
n = 60; c = 10
Nesse teste, se omitirmos muitas observações,

podemos diminuir sua performance.
13
2
 No caso de mais de uma variável
independente , a ordenação das
observações, o primeiro passo do
teste, pode ser feita de acordo
com qualquer uma delas.
13
3
 Se não estivermos seguros a
princípio sobre qual variável é
apropriada, podemos realizar o
teste sobre cada uma das
variáveis , ou realizarmos teste de
Park sobre cada variável.
13
4
O sucesso do teste de Goldfeld-
Quandt depende não só do valor
de c, mas também de identificar a
variável X correta com a qual se
colocam as observações em
ordem.
13
5
 Observar que os erros devem ter
distribuição normal
13
6
13
7
Consiste em regredir o quadrado dos
resíduos (uî ) sobre o quadrado dos valores
estimados da variável dependente (Yî ) :
2 ˆ
uˆ  1   2 (Yi )  vi
2
i
13
8
O teste da estimativa do parâmetro  2 pela
estatística t ou F revela a significância ou
não da relação e, consequentemente, a do
grau de heterocedasticidade.
H0: homocedasticidade
H1: heterocedasticidade
13
9
O teste KB é aplicável mesmo
quando o termo de erro do
modelo original não é distribuído
normalmente.
14
0
14
1
Seja um modelo de regressão:
Yi  1  2 X 2i  3 X 3i  ui
14
2
Etapa 1: com os dados pertinentes, estime
Yi  1  2 X 2i  3 X 3i  ui e obtenha os
resíduos, û i ;
14
3
Etapa 2: É feita uma regressão auxiliar
em que a variável dependente é o resíduo
ao quadrado e os regressores são os
próprios regressores da regressão original,
seus quadrados e os produtos cruzados.
14
4
Ou seja:
uˆ   1   2 X 2i   3 X 3i   4 X   5 X   6 X 2i X 3i  i
2
i
2
2i
2
3i
2
Obtenha o R desta regressão auxiliar.
Um R 2 elevado nessa regressão auxiliar é um

indício de que há heterocedasticidade.
14
5
Etapa 3: Calcule
n.R  
2 2
gl
onde gl é igual ao número de regressores da

regressão auxiliar.
H0: Homocedasticidade
HA: Heterocedasticidade
14
6
Etapa 4. Se o valor de qui-quadrado
obtido anteriormente for superior ao valor
crítico de qui-quadrado no nível de
significância selecionada, conclui-se que
há heterocedasticidade.
14
7
 Em casos em que o teste estatístico de
White é estatisticamente significativo,
não necessariamente a causa será a
heterocedasticidade, mas erros de
especificação.
14
8
 Seno procedimento do teste não
estiverem presentes termos de
produtos cruzados, então, ele é
um teste de heterocedasticidade
pura.
 Seesses termos estiverem

presentes, ele é um teste de
heterocedasticidade e viés de
especificação.
14
9
Algumas limitações do teste de White:
 1 – Utiliza muitos graus de liberdade
 2 – O teste ajuda pouco na

identificação dos fatores ou variáveis
que causam heterocedasticidade
15
0
Algumas vantagens do teste de White:
 1 – Não requer a hipótese de

normalidade dos erros
 2 – O teste é fácil de aplicar
15
1
 Como o teste de White pode
consumir muitos graus de
liberdade se houver vários
regressores e se todos eles, bem
como seus quadrados e seus
produtos cruzados, forem
incluídos, pode-se fazer um
atalho para o referido teste.
15
2
Em lugar de estimar regressões com muitas
variáveis independentes, pode-se estimar:
ˆ ˆ
uˆ  1   2Yi   2Yi  vi
2 2
i
Yˆ
onde i são os valores do Y estimado (isto é, o
regressando) de qualquer modelo.
15
3
2
Obtenha o valor de R e empregue a
equação abaixo para testar a hipótese de que
não há heterocedasticidade.
n R  
2 2
15
4
15
5
 Considere um modelo de regressão linear
com k variáveis explicativas:
Yi  1  2 X 2i  ...  k X ki  ui
15
6
Suponha que a variância do erro  seja
2
 i
descrito como:
  f (1   2 Z 2i  ...   m Z mi )
i
2
ou seja, é uma função linear das variáveis

não estocásticas Z;
 Alguns ou todos os X’s podem servir como 

Z’s.
15
7
 Especificamente, suponha que:
  1   2 Z 2i  ...   m Z mi
i
2
Ou seja,  é uma função linear dos Z.

2

i
 Se  2   3  ...   m  0
   1 , que é uma constante.
i
2
15
8
 Portanto, para testarmos se é
homocedástico, podemos testar a
hipótese de que .
15
9
O teste BPG é assintótico e para
grandes amostras.
 Para pequenas amostras o teste é

sensível à hipótese de que os erros
sejam normalmente distribuídos.
16
0
1 – calcule a equação
por MQO e obtenha os resíduos

uˆ1 , û2 ,...,ûn .
Yi  1   2 X 2 i  ...   k X ki  ui
16
1
û 2
 2 – Obtenha  
~ 2 i
 3 – Construa variáveis pi definidas como:
2
û
pi  ~ i
 2
16
2
 4 – Faça a regressão de pi assim
construída sobre os Z’s como:
pi  1   2 Z 2i     m Z mi  vi
16
3
5 - Obtenha SQE da equação
1
e defina:   ( SQE )
2
pi  1   2 Z 2 i     m Z mi  vi
▶ Observe que m é o número de
parâmetros da equação acima.
16
4
 Supondo que os ui sejam normalmente
distribuídos, pode-se mostrar que se há
homocedasticidade e se o tamanho da
amostra n aumenta indefinidamente, então:

 ass 2
m 1
16
5
 Portanto, se em uma aplicação o     2

calculado for maior que o valor crítico  2
no nível escolhido de significância,

poderemos rejeitar a hipótese de
homocedasticidade; caso contrário, esta não
será rejeitada.
16
6
16
7
 Como vimos, a heterocedasticidade
não destrói as propriedades de não
tendenciosidade e de consistência dos
estimadores de MQO; mas eles
deixam de ser eficientes, mesmo
assintoticamente (isto é, em grandes
amostras).
16
8
Correção de
Heterocedasticidade quando
σi2 não é conhecido
16
9
17
0
 White mostrou que suas estimativas
podem ser feitas de tal modo que
possam ser tiradas inferências
estatísticas assintoticamente válidas
(isto é, para grandes amostras) sobre
os verdadeiros valores dos
parâmetros.
17
1
Imagine o modelo de regressão com
duas variáveis.
Yi  1   2 X i  ui
var(ui )   i
2
var( ˆ 2 )
 x 2
i i
2
( x ) 2 2
i
17
2
Como os  não são diretamente observáveis,
2
i
White sugere adotar uˆ , os resíduos elevados ao

2
i
 2
quadrado para cada i, em lugar de i e estimar a
var( ˆ2 ) do seguinte modo:
var( ˆ ) 
 x uˆ
2 2
i i
( x )
2 2 2
i
17
3
var( ˆ2 ) 
 xi2uî2
White demonstrou que ( x2 2
i )
é
um estimador consistente de
var( ˆ2 ) 
 xi2 i2
( x2 2
i )
Porém, ele não proporciona as estimativas

mais eficientes dos parâmetros.
17
4
O valor de ûi2 da equação var( ˆ2 )  
xi2uî2
 é
(  xi2 ) 2
obtido estimando primeiro a
regressão de MQO e obtendo os
resíduos.
17
5
 Além de ser um procedimento para
grandes amostras, uma desvantagem
do procedimento de White é que os
estimadores que geram podem não
ser tão eficientes quanto aqueles que
transformam os dados para refletir
tipos específicos de
17
6
Hipóteses plausíveis
sobre o padrão de
heterocedasticidade
17
7
 Seja
o modelo de regressão de
duas variáveis:
Yi  1   2 X i  ui
17
8
 Vamos considerar várias
pressuposições sobre o
padrão de
17
9
Pressuposição 1:
2
A variância do erro é proporcional a X i .
Dessa forma: E (u )   X
2
i
2
i
2
(6.5)
18
0
18
1
Se acreditamos, em função de métodos
gráficos “especulativos” ou das abordagens de
Park e Glejser, que a variância de ui é
proporcional ao quadrado da variável
explanatória X, podemos transformar o modelo
como a seguir.
18
2
Dividimos o modelo original por Xi:
Yi 1 ui
  2 
Xi Xi Xi
Yi 1
 1   2  vi
Xi Xi (6.6)
18
3
ui 2
E (vi2 )  E ( )
Xi
1
E (vi2 )  2
E (u 2
i )
Xi
Usando (6.5) E (ui2 )   2 X i2
E (vi2 )   2
Consequentemente, a variância de vi agora é

homocedástica e podemos continuar aplicando os MQO à
equação transformada (6.6), fazendo a regressão de Yi/Xi
contra 1/Xi. 18
4
Pressuposição 2:
A variância do erro é proporcional a Xi.
Dessa forma, E (u )   X i
2
i
2
(6.7)
18
5
18
6
Se acreditamos que a variância de ui,
em lugar de ser proporcional ao quadrado
de Xi, é proporcional ao próprio Xi, então o
modelo original pode ser transformado
como se segue.
18
7
Yi 1 ui
  2 X i 
Xi Xi Xi
Yi 1
 1   2 X i  vi
Xi Xi (6.8)
ui
vi 
onde Xi e onde Xi > 0.
18
8
2
 ui 
E (v )  E 
2 
i  X 
 i 
1
E (v ) 
2
i  E (ui )
2
Xi
se
E (u )   X i
2
i
2
1 2
E (v )   X i
2
i
Xi
E (v )  
2
i
2
18
9
Pressuposição 3:
A variância do erro é proporcional ao

quadrado do valor médio de Y.
E (u )   [ E (Yi )]
2
i
2 2
(6.9)
19
0
û2
Yˆ
Figura - Padrões hipotéticos de quadrados dos resíduos estimados.
19
1
Portanto, se transformamos a equação original do
seguinte modo:
Yi 1 Xi ui
  2 
E (Yi ) E (Yi ) E (Yi ) E (Yi )
Yi  1  Xi
 1     2  vi (6.10)
E (Yi )  E (Yi )  E (Yi )
ui
onde v  E ( v 2
)   2
E (Yi ) , podemos ver que , isto é, os
i i
termos de erro vi são homocedásticos. 19

2
2
 ui 
E (v )  E 
2
i

 E (Yi ) 
1
E (v ) 
2
i 2
 E (ui )
2
E (Yi )
se E (u )   E (Yi )
2
i
2 2
1
E (v ) 
2
i 2
 E (Yi )
2 2
E (Yi )
E (v )  2
i
2
19
3
 Na prática, teremos:
Yi 1  Xi 
 1     2    vi
Yî ˆ
 i
Y ˆ
 i 
Y
 Essa transformação será benéfica se o

tamanho da amostra for
razoavelmente grande.
19
4
Pressuposição 4:
Uma transformação logarítmica como
ln Yi  1   2 ln X i  ui (6.12)
19
5
Essa transformação muitas vezes reduz a
heterocedasticidade em comparação com a
regressão linear ( Yi  1   2 X i  ui )
Isso ocorre porque a transformação logarítmica

comprime as escalas em que as variáveis são
medidas.
19
6
Pressuposição 5 –
Mínimos quadrados Generalizados
Factível
19
7
 Na maioria dos casos, a forma exata de
heterocedasticidade não é óbvia.
 Vamos presumir que:
varu | X    2 exp  0  1 X1   2 X 2  ...   k X k  (1)
19
8
 Sob a hipótese (1), podemos escrever:
u 2   2 exp  0  1 X1   2 X 2  ...   k X k v
em que v tem uma média igual à

unidade, condicional
em X = (X1, X2, ..., Xk).
19
9
 Se presumirmos que v é realmente
independente de X podemos escrever:
ln(u )   0  1 X1   2 X 2  ...   k X k  ei
2
i
em que ei tem média zero e é

independente de X.
20
0
 Substituindo o u por û, tem-se:
ln(û )   0  1 X1   2 X 2  ...   k X k  ei
i
2
O que necessitamos dessa regressão

são os valores estimados da variável
dependente, digamos ĝ .
20
1
 Assim:
var u | X    hî
2
hî  exp( gˆ )
20
2
 Agora estime a equação:
Yi  1   2 X 2  ...   k X k  ui
1
 Utilize os MQP, usando pesos
ĥi
20
3
 Pode-se encontrar de outra forma:
ˆ ˆ
ln(u )   0  1Yi   2Yi  ei
2 2
i
var ui | X i    hî

2
hˆ  exp( gˆ )
20
4
 Agora estime a equação:
Yi  1   2 X 2  ...   k X k  ui
1
 Utilize os MQP, usando pesos
ĥi
20
5
 Há alguns problemas adicionais
relativos às transformações vistas
que devemos ter em mente:
20
6
1 – Quando vamos além do modelo
com duas variáveis, podemos não
saber a priori qual das variáveis X
deve ser escolhida para
transformar os dados.
20
7
Contudo, em termos práticos,
podemos representar
graficamente contra cada variável
e decidir qual das variáveis X deve
ser usada para transformar os
dados.
20
8
2- A transformação logarítmica
examinada na pressuposição 4
não é aplicável se alguns dos
valores de Y e X forem
negativos ou zeros.
20
9
3 – Há, ainda, o problema da
correlação espúria. Este termo, se
refere à situação em que a correlação
está presente nas razões das variáveis
mesmo que as variáveis originais não
estejam correlacionadas ou sejam
aleatórias.
21
0
Por exemplo, se X1, X2 e X3 não
registram correlação mútua,
r12 = r13 = r23 = 0 e verificamos que
os valores das razões X1/X3 e X2/X3
estão correlacionados, então existe
uma correlação espúria.
21
1
Assim, no modelo Yi  1   2 X i  ui , Y e X
podem não estar correlacionados, mas muitas
vezes verificamos que no modelo
Yi 1 Yi 1
transformado  1   2  vi , e
Xi Xi Xi Xi
apresentam correlação.
21
2
4 – Quando não conhecemos diretamente
 i
2
e o estimamos mediante uma ou mais
das transformações já vistas, todos os
nossos procedimentos de teste, seja t ou F
etc. só são, falando rigorosamente, válidos
para grandes amostras.
21
3
21
4
 De acordo com MANKIW, N. Gregory. “A quick
refresher course in macroeconomics.” Journal
of Economic Literature, dez. 1990. v. XXVII,
p. 1648.
 “a heterocedasticidade nunca foi razão para

descartar-se um modelo que, sob outros
aspectos, é considerado bom” .
21
5
 De acordo com FOX, John. Applied regression
analysis, linear models, and related methods.
Califórmia: Sage Publications, 1997. p.306.
 [...] vale corrigir variâncias desiguais do erro somente quando

o problema for grave.
O impacto da variância do erro não constante sobre a
eficiência do estimador de mínimos quadrados e na validade
da eficiência dos mínimos quadrados depende de vários
fatores, inclusive do tamanho da amostra, do grau de
variação no σi2, da configuração dos valores de X e da relação
entre a variância dos erros e os X. Portanto, não é possível
chegar a conclusões gerais aplicáveis a respeito dos danos
produzidos pela heterocedasticidade.
21
6
 Devemos lembrar também que, apesar
da heterocedasticidade, os
estimadores de MQO são lineares, não
tendenciosos e em condições gerais
têm distribuição normal
assintoticamente (em grandes
amostras)
21
7
 No entanto, a advertência dada parece
ser adequada como regra geral, caso
contrário, podemos exagerar.
21
8
Bibliografia:
GREENE, W.H. Econometric Analysis, 5a. edição,

Macmillian Publishing Company, 2003.
GUJARATI, D. N. e PORTER, C. P. Econometria Básica.

5ª edição, McGraw-Hill e Artmed. 2011.
PINDYCK, R.S.; RUBINFELD, D. L. Econometria. Rio de

Janeiro: Elsevier, 2004.
WOOLDRIDGE, J.M. Introductory Econometrics. A

Modern Approach. 2nd ed. Ed. Thomson. 2010.
21
9

Heterocedasticidade

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Heterocedasticidade

Hochgeladen von

Copyright:

Verfügbare Formate

1

GREENE, W.H. Econometric Analysis, 5a. edição,

GUJARATI, D. N. e PORTER, C. P. Econometria Básica.

PINDYCK, R.S.; RUBINFELD, D. L. Econometria. Rio de

WOOLDRIDGE, J.M. Introductory Econometrics. A

Exemplo: variáveis como renda,

A distribuição de renda e riqueza é

Dividindo o numerador e o denominado r por n :

 Já o método dos mínimos quadrados

que para manipular algebricamente, escrevemos como:

em que X 0i  1 para cada i .

Dividindo (1) por i :

que, para facilitar, escrevemos como:

var(u )  E (u )  1 (é uma constante)

As hipóteses básicas em relação ao termo

 tem distribuição normal (4)

sendo Ω uma matriz definida positiva.

 Em termos práticos, isso não ocorre

 Sendo assim, será necessária uma

Dessa forma, verificamos a impossibilidade

Isso pode ser obtido por meio da

   ki , nessa equação, tem-se:

variância heterocedástica dada é maior

E(b   )(b   )`  E[( X `X )1 X ` `X ( X `X )1 ]

E(b   )(b   )`  ( X `X )1 X `E( `) X ( X `X )1

E(b   )(b   )`  ( X `X )1 X `X ( X `X )1

var  cov(b)  ( X `X ) 1 X `X ( X `X ) 1 (4)

utilizado no cálculo das variâncias e

1. Estimadores dos parâmetros (β) são não

2. As variâncias estimadas dos parâmetros

Investimento em relação às vendas, tx de

 Normalmente em dados de corte transversal

A forma funcional sugerida por ele foi:

em que: H 0 :  12   22   32  ...   n2 Homocedasticidade

Se  for não estatísticamente significativo

Pode-se usar o teste de Park como um método

 Teste de Park: uˆ  1   2Yˆi  vt

 Teste de Glejser: ûi  1   2Yˆi  wi

grupos, cada um com (n  c) 2

observações e às últimas (n  c) 2 observações;

Obtenha as respectivas somas de quadrados dos resíduos, SQR1 e

correspondente aos menores valores de X i (o grupo com pequena

SQR2 representa a SQR correspondente aos maiores valores X i ( o

em que k é o número de parâmetros a serem estimados

Nesse teste, se omitirmos muitas observações,

Um R 2 elevado nessa regressão auxiliar é um

onde gl é igual ao número de regressores da

 Seesses termos estiverem

 1 – Utiliza muitos graus de liberdade

 2 – O teste ajuda pouco na

 1 – Não requer a hipótese de

 2 – O teste é fácil de aplicar

ou seja, é uma função linear das variáveis

 Alguns ou todos os X’s podem servir como 

Ou seja,  é uma função linear dos Z.

 Para pequenas amostras o teste é

por MQO e obtenha os resíduos

 3 – Construa variáveis pi definidas como:

distribuídos, pode-se mostrar que se há

amostra n aumenta indefinidamente, então:

no nível escolhido de significância,

White sugere adotar uˆ , os resíduos elevados ao