Sie sind auf Seite 1von 219

1

Bibliografia:

GREENE, W.H. Econometric Analysis, 5a. edição,


Macmillian Publishing Company, 2003.

GUJARATI, D. N. e PORTER, C. P. Econometria Básica.


5ª edição, McGraw-Hill e Artmed. 2011.

PINDYCK, R.S.; RUBINFELD, D. L. Econometria. Rio de


Janeiro: Elsevier, 2004.

WOOLDRIDGE, J.M. Introductory Econometrics. A


Modern Approach. 2nd ed. Ed. Thomson. 2010.

2
Homocedasticidade é quando as
perturbações ui possuem a mesma
variância.

3
E (u )  
2
i
2
i = 1, 2, ..., n.

 2 0 0  0
 
 0  2
0  0
E (uu `)   0 0 2  0
 
    
0 0 0   2 

4
Na figura a seguir, observa-se
que a variância de ui, permanece a
mesma, independentemente dos
valores assumidos pela variável
X.

5
Homocedasticidade 6
Heterocedasticidade é quando a
variância do erro não é constante
para todos os valores da variável
independente.

7
E (u )  
2
i i
2
i = 1, 2, ..., n.

 12 0 0  0 
 
0  22 0  0 
E (uu `)   0 0  32  0 
 
    
0   n2 
 0 0

8
Na Figura seguinte, mostra
que a variância de ui varia à
medida que X aumenta,
caracterizando a presença de
Heterocedasticidade.
9
Heterocedasticidade
10
11
1– Despesa com alimentação
em famílias com rendas
diferentes.

12
2 – Salários em função
dos anos de estudos.

13
3 – Poupança das
famílias em função
da renda.

14
4 – Taxa de rentabilidade
sobre o tamanho da
empresa.

15
A dispersão dos erros na
presença da
heterocedasticidade pode ser
representado como nos
gráficos a seguir:

16
17
18
19
20
 Vejamos um exemplo de
presença de
heteroscedasticidade

21
Considere os dados na tabela abaixo de 19 trabalhadores e os anos de estudo de cada um.
Salários Anos de
estudo
410 1
508,9 2
857,7 3
551,3 4
789,2 5
935,5 6
1529,3 7
1497,5 8
2317,7 9
2169,5 10
2596,8 11
2844,6 12
3391 13
2671,2 14
2653,8 15
2939,1 16
3437 17
4583,3 18 22
Salário estimado e resíduos
Salários Anos Y previsto Resíduos
410 1 192,08 217,92
508,9 2 409,4368 99,46316
857,7 3 626,7937 230,9063
551,3 4 844,1505 -292,851
789,2 5 1061,507 -272,307
935,5 6 1278,864 -343,364
1529,3 7 1496,221 33,07895
1497,5 8 1713,578 -216,078
2317,7 9 1930,935 386,7653
2169,5 10 2148,292 21,20842
2596,8 11 2365,648 231,1516
2844,6 12 2583,005 261,5947
3391 13 2800,362 590,6379
2671,2 14 3017,719 -346,519
2653,8 15 3235,076 -581,276
2939,1 16 3452,433 -513,333
3437 17 3669,789 -232,789
4583,3 18 3887,146 696,1537
23
3559,3 19 4104,503 -545,203
Variável X 1 Plotagem de resíduos
800

600

400

200
Resíduos

0 5 10 15 20 25
-200

-400

-600

-800
Variável X 1 24
25
1 – Modelos de
aprendizagem do erro

26
27
2 – À medida que a renda
aumenta, as pessoas têm
maior renda discricionária

28
3 – Empresas com maiores
lucros geralmente mostram
maior variabilidade em suas
políticas de dividendos

29
4 – Uma melhora ou
aperfeiçoamento das técnicas
de coleta de dados,
provavelmente diminui a
variância.

30
5 –Observações discrepantes
ou outliers.

31
32
6 – Erros de Especificação
(omissão de variáveis
relevantes)

33
7 – Assimetria na distribuição de um ou
mais regressores incluídos no modelo.

Exemplo: variáveis como renda,


riqueza e educação.

A distribuição de renda e riqueza é


desigual, pertencendo a uma parcela
mínima da população.

34
8 - Transformação incorreta
de dados

35
9 - Formas funcionais
incorretas

36
O problema da
heterocedasticidade é mais
comum em dados de corte
do que em séries
temporais.

37
38
O que acontecerá aos estimadores
de MQO e suas variâncias se
introduzirmos heterocedasticidade?

39
Continuarão à serem lineares,
não viesados, com a menor
variância (eficientes) e
consistentes?

40
Seja a equação: Yi  1   2 X i  ui
A variância homocedástica é:

ˆ  2
var(  2 ) 
x 2
i

A variância heterocedástica é:

var( ˆ 2 )
 x 2
i i
2

( x )2 2
i

41
var( ˆ 2 )
 x
2
i i
2

( x )
2 2
i

Anexo

42
Na presença da
heterocedasticidade, o
ˆ
estimador 2 é ainda linear, não
viesado e consistente?

43
Prova da linearidade na heterocedasticidade:

Yi  1   2 X i  ui

̂ 2   kiYi

44
Prova da inexistência de viés na heterocedasticidade:

Yi  1   2 X i  ui

̂ 2   kiYi

ˆ2   ki (1  2 X i  ui )

ˆ2  1  ki  2  ki X i   kiui

se k i 0 e k Xi i 1
45
se k i 0 e k X
i i 1

ˆ2  2   kiui

E (ˆ2 )  2   ki E (ui )

se
E (ui )  0

E (ˆ2 )   2

46
Assim, dos slides anteriores,
ˆ
tem-se que 2 é um estimador
linear e não viesado apesar da
heterocedasticidade.

47
ˆ 2 é um estimador consistente
apesar da heterocedasticidade?

48
A condição de suficiência para a
consistência é que ˆ2 seja não
viesado e que sua variância tenda
para zero à medida que o
tamanho da amostra n, tende para
o infinito.

49
 xi2 . i2
var( ˆ 2 ) 
  2 2
xi

Dividindo o numerador e o denominado r por n :


 xi2 i2
var( ˆ 2 )  n
(  xi2 ) 2
n
  xi2 i2 
 
lim var( ˆ 2 )  lim n 0
n 
 ( x 2 ) 2 
 i

 n 
n 
50
 Como n tende para o
infinito,  xi2 i2
n
tende a zero,
pois  é um número finito.
i
2

51
Admitindo que ˆ 2 seja linear, não
viesado e consistente, ele ainda é eficiente
ou o melhor estimador?

52
53
Porque o estimador de M.Q.O usual
de  2 dado em (2.1) não é eficiente ou
o melhor estimador, embora ainda seja
não tendencioso?

54
 O método usual dos M.Q.O confere igual
peso ou importância a cada observação.

 Já o método dos mínimos quadrados


generalizados (M.Q.G) leva tal
informação em conta e, portanto, é
capaz de produzir estimadores que
sejam MELNV.

55
Para ver isso, seja o modelo de duas variáveis:

Yi  1   2 X i  ui

que para manipular algebricamente, escrevemos como:

Yi  1 X 0i   2 X i  ui (1)

em que X 0i  1 para cada i .

56
 2
Suponha agora que as variâncias heterocedasticas i sejam
conhecidas.

Dividindo (1) por i :

Yi  X 0i   Xi   ui 
 1     2     
i  i   i  i 

que, para facilitar, escrevemos como:

Yi   X   X  u
* *
1
*
0i
*
2
*
i
*
i

57
 Qual a finalidade de
transformar o modelo
original?

58
2
 ui 
var(u )  E (u )  E 
* * 2

i
i i

1
var(u )  E (u ) 
* * 2
E (ui2 ) pois  i2 é conhecido.

i i 2
i

1
var(u )  E (u ) 
* * 2
( i2 ) pois E (ui2 )   i2

i i 2
i

var(u )  E (u )  1 (é uma constante)


*
i
* 2
i

59
Observe agora que, os  *
1 e
 2* estimados por M.Q.G são
MELNV e não os estimadores
de M.Q.O ˆ1 e ˆ 2 .

60
Esse método de transformar as
variáveis originais de modo que as
variáveis transformadas satisfaçam as
hipóteses do modelo clássico, para em
seguida aplicar os M.Q.O, é conhecida
como método dos mínimos quadrados
generalizados.
61
Nos M.Q.G, o peso atribuído a cada
observação é inversamente

proporcional a seu  i .

62
Para perceber claramente a diferença entre M.Q.O e M.Q.G, considere o diagrama de
dispersão hipotético da figura.

Y C
û
Yˆi  ˆ1  ˆ2 X i

A
û û B

X
Figura - Diagrama de dispersão hipotético.
63
64
Originalmente, o modelo tratado é:

Y  X   (1)

As hipóteses básicas em relação ao termo


aleatório são:

E ( )  0 (2)

E ( ' )   I n
2
(3)

 tem distribuição normal (4)


65
O método de Mínimos Quadrados
Generalizados relaxará apenas a hipótese
E ( ' )   I n , que passará a ser:
2

E ( ' )   
2
(5)

sendo Ω uma matriz definida positiva.

66
O objetivo do método é estimar os
parâmetros do modelo, assim como
anteriormente, considerando,
entretanto, que há uma nova
configuração da matriz de variância e
covariância dos resíduos.

67
O princípio desse método segue,
portanto, o mesmo padrão dos
procedimentos adotados para a
correção dos problemas de
autocorrelação e de
heterocedasticidade.

68
Assim, será necessário encontrar a
forma mais adequada para transformar
o modelo original, de modo a gerar
termo aleatório não
autocorrelacionado e homocedástico.

69
Com esse objetivo, tomaremos uma matriz T, não
singular (matriz com um determinante cujo valor é
diferente de zero), chamada matriz de transformação, e
faremos a seguinte operação no modelo original:

Y  X  

TY  TX  T (6)

Anexo B

70
71
 A primeira delas refere-se ao fato de
que, para que esse método possa ser
aplicado, é essencial que a matriz Ω
seja conhecida.

 Em termos práticos, isso não ocorre


com freqüência.

 Sendo assim, será necessária uma


estimativa de Ω.

72
Aqui, esbarramos em outra dificuldade,
pois Ω é uma matriz de dimensão n x n,
com n(n + 1)/2 termos desconhecidos,
sendo n o número de elementos da
amostra.

Dessa forma, verificamos a impossibilidade


de estimar todos os parâmetros da matriz
com base nas n observações existentes.

73
Essa estimação somente será possível
se for possível reduzir o número de
parâmetros a ser estimado.

Isso pode ser obtido por meio da


imposição de restrições sobre o
padrão da matriz Ω.

74
No caso da heterocedasticidade, a matriz Ω é
diagonal, tal como:

 12 0 0  0
 
 0 2 0
2
 0
E ( `)   2    0 0 3 
2
0
 
    
0   2
 0 0 n

75
Por último, é importante notar
que, para a estimação do modelo, é
necessário encontrar a matriz T, tal
-1
que T`T = Ω .

76
-1
Se a matriz Ω é diagonal, Ω também o é:

 1 
 2 0 0  0 
 1 
 0 1
0  0 
  2
2

 1  1 
 0 0  0 
  2
3 
    
 1 
 0 0 0 
  n2 

77
 Feito isso, basta transformar o modelo

TY  TX  T
 E a solução explícita de MQG será:

ˆ 
  X ´ X 1
1 1
X ´ y

78
79
ˆ
 * ˆ

Tanto 2 como 2 são estimadores
lineares não tendenciosos.
Yi  1 X 0i   2 X i  ui

ˆ
 *
Mas sabemos que 2 é eficiente, isto
é, tem a menor variância.
Yi   X   X  u
* *
1
*
0i
*
2
*
i
*
i

80
O que acontecerá com o intervalo
de confiança e os testes t e F,
quando usamos os M.Q.O e o
estimador ˆ 2 desconsiderando a
heterocedasticidade?

81
Quando calculamos uma regressão pelos
M.Q.O padrão, ignorando a
var( ˆ

heterocedasticidade, a 2 ) será:

ˆ  2
var(  2 ) 
x 2
i
, que é um estimador viesado da

var( ˆ 2 ) 
 i i
x  2

( x ) 2 2
i

82
O viés decorre do fato de que a
variância residual estimada, não é mais
um estimador não tendencioso quando
a heterocedasticidade se faz presente.

ˆ 
2  uˆ 2
i

(n  2)
83
ˆ  2
var(  2 ) 
Na média, x 2
i
superestima

var( ˆ )
 x i i
2

( x )
2
ou subestima 2 2
i
.

84
Em geral, não podemos dizer se o viés é
positivo (superestimação) ou negativo
(subestimação), porque isso dependerá da natureza
da relação entre 
2
i e os valores assumidos pela
variável explanatória X, como se vê na

var( ˆ 2 ) 
 i i
x 2 2

( xi2 ) 2

85
var( ˆ ) 
 x2
i i
2

( x )
2 2 2
Dada a equação i
substituindo

   ki , nessa equação, tem-se:


i
2 2

ˆ
var(  2 ) 

2
 x 2
k
i i

 2
x k2
i i

( x )
2 2
i  xi
2
x i
2

86
Observe que o primeiro termo à
esquerda é a variância homocedástica,
como se pode observar:

ˆ  2
var(  2 ) 
x 2
i

87
x k2
i i
1
Portanto, se x i
2
, então a

variância heterocedástica dada é maior


que a homocedástica.

88
2
Nesse caso, var( ˆ2 )  ,
 i
x 2

subestimará a heterocedásticidade,
levando as estatísticas t e F a inflarem.

89
Em conseqüência, não podemos mais
confiar nos cálculos dos intervalos de
confiança e nos testes de t e F

empregados convencionalmente.

90
Portanto, se usarmos M.Q.O na
presença de heterocedasticidade, a
conclusão a que chegamos ou as
inferências que fizermos, poderão ser
bastante enganosas.

91
 Consequências da
Heterocedasticidade – uma
visão matricial

92
Consideramos o seguinte modelo:

Y  X   ,

com

E ( )  0 (1)

 12 0 0  0 
 
 0  2
2 0  0 
E ( `)   0 0  32  0  (2)
 
    
0 0 0 0  n2 

93
O vetor dos estimadores dos parâmetros é o seguinte:

b    ( X `X )1 X `

E (b)    ( X `X )1 X `E ( )

E (b)    ( X `X ) 1 X `E ( )

Conforme (1):

E ( )  0

Assim:

E (b)   (3)

94
A matriz da variância e covariância de b é:

E(b   )(b   )`  E[( X `X )1 X ` `X ( X `X )1 ]

E(b   )(b   )`  ( X `X )1 X `E( `) X ( X `X )1

Conforme (2):

E ( `)   (2)
Temos então:

E(b   )(b   )`  ( X `X )1 X `X ( X `X )1

var  cov(b)  ( X `X ) 1 X `X ( X `X ) 1 (4)

95
Devemos observar que a expressão (4),
assim como ocorre no caso da existência
de autocorrelação, é diferente de
var  cov(  )   2 ( X `X ) 1 , que é o estimador

utilizado no cálculo das variâncias e


covariâncias dos parâmetros estimados por
mínimos quadrados ordinários (MQO).
96
Conforme visto anteriormente, isso
implica que, apesar de os estimadores dos
parâmetros serem não viesados, existem
problemas nas conclusões tiradas com base
nos testes de hipótese.

97
Conclusão:

1. Estimadores dos parâmetros (β) são não


viesados, mas ineficientes.

2. As variâncias estimadas dos parâmetros


são viesadas, gerando problemas com os
testes de hipóteses, ou seja, incorreções
dos testes de t e F e nos intervalos de
confiança.
98
99
 Não existe uma regra firme e
segura para detectar a
heterocedasticidade, somente
algumas regras práticas.

10
0
 Como o economista não tem controle
das variáveis, encontrar
heterocedasticidade pode ser uma
questão de intuição, conjectura,
experiência empírica anterior ou pura
especulação.

10
1
10
2
1- Natureza do Problema
Anatureza do problema que está
sendo considerado sugere se é
provável a presença de
heterocedasticidade.

10
3
Consumo sobre a renda, envolvendo famílias
com rendas diferentes.

Investimento em relação às vendas, tx de


juros, etc. no caso de empresas de pequeno,
médio e grande porte serem amostradas
conjuntamente.

 Normalmente em dados de corte transversal


que envolvam unidades heterogêneas, a
heterocedasticidade pode ser mais a regra do
que exceção.
10
4
2 - Método Gráfico

10
5
 Se não existem informações a priori
ou empíricas sobre a natureza da
heterocedasticidade, na prática
podemos fazer a análise de regressão
supondo que não há
heterocedasticidade e depois fazer um
exame dos resíduos elevados ao
quadrado, para ver se eles apresentam
algum padrão sistemático.

10
6
10
7
10
8
10
9
11
0
Park formaliza o método gráfico ao sugerir que
 i2 é alguma função da variável explicativa Xi .

A forma funcional sugerida por ele foi:


   Xi e
i
2 2 vi

ou
ln   ln    ln X i  vi
i
2 2
(5.1)
11
1
 2
Como i geralmente não é conhecido, Park sugere
uˆ 2
usar i como uma proxy e rodar a seguinte regressão:

ln uˆi2  ln  2   ln X i  vi

ln ui     ln X i  vi
ˆ 2
(5.2)

em que: H 0 :  12   22   32  ...   n2 Homocedasticidade


H 0 :  12   22   32  ...   n2 Heterocedasticidade

11
2
Se  for estatísticamente significativo
 presença de heterocedaticidade

Se  for não estatísticamente significativo


 homocedasticidade.

Pode-se usar o teste de Park como um método


estritamente exploratório.
11
3
11
4
Após obter os resíduos, û i , de uma
regressão de MQO, Glejser sugere fazer
uma regressão dos valores absolutos de û i
contra a variável X que se considera
estreitamente associada a  i2 .

11
5
Neste experimento, Glejser empregou as seguintes
formas funcionais:

uˆi  1   2 X i  vi

uˆi  1   2 X i  vi

1
uˆi  1   2  vi
Xi

1
uˆi  1   2  vi
Xi
11
6
 Quando houver mais de uma variável
independente, o teste de Park e Glejser pode
ser trabalhado da seguinte forma:

 Teste de Park: uˆ  1   2Yˆi  vt


2
i

 Teste de Glejser: ûi  1   2Yˆi  wi

11
7
11
8
Aidéia básica do teste é verificar
se existe diferença entre a
variância dos resíduos estimados,
localizados nas proximidades do
intercepto, e aqueles que se
encontram a uma distância maior.

11
9
12
0
Para simplificar, considere um modelo:

Yi  1   2 X i  ui

Suponha que  i
2
se relacione positivamente com X i
como:

  X
i
2 2
i
2
(5.10)

12
1
12
2
1) Ordene as observações pela
magnitude da variável explanatória
Xi, começando pelo valor mais baixo
de X ;

12
3
2) Omita as observações centrais, c,
em que c é especificado a
princípio, e divida as ( n  c)
observações restantes em dois

grupos, cada um com (n  c) 2


observações.
12
4
12
5
3) Ajuste as distintas regressões por M.Q.O às primeiras ( n  c) 2

observações e às últimas (n  c) 2 observações;

Obtenha as respectivas somas de quadrados dos resíduos, SQR1 e


SQR2 , sendo que SQR1 , representa a SQR da regressão

correspondente aos menores valores de X i (o grupo com pequena


variância) e;

SQR2 representa a SQR correspondente aos maiores valores X i ( o


grupo com grande variância);

12
6
Cada uma das SQR tem:

n  c   k  n  c  2k 
  gl
2 ou  2 

em que k é o número de parâmetros a serem estimados


incluindo o intercepto.

12
7
4) Calcule a razão:

SQR2 GL

SQR1 GL (5.11)

12
8
Admitindo que ui distribui-se
normalmente, e que a hipótese de
homocedasticidade é válida, então se
pode mostrar que  de (5.11) segue a
 n  c  2k 
F gl  
distribuição com de  2  no
numerador e no denominador (Fc).
12
9
Se  ( F )calculado  Fc , rejeita-se a
hipótese de homocedasticidade, ou seja:

H0: Homocedasticidade
HA: Heterocedasticidade

13
0
A omissão das observações
centrais ( c ) serve para acentuar a
diferença entre o grupo de pequena
variância ( SQR1 ) e o grupo de grande
variância (SQR2 ) .

13
1
 Goldfeld e Quandt sugerem:
n = 30; c=8
n = 60; c = 16

 Judge et al sugerem:
n = 30; c=4
n = 60; c = 10

Nesse teste, se omitirmos muitas observações,


podemos diminuir sua performance.

13
2
 No caso de mais de uma variável
independente , a ordenação das
observações, o primeiro passo do
teste, pode ser feita de acordo
com qualquer uma delas.

13
3
 Se não estivermos seguros a
princípio sobre qual variável é
apropriada, podemos realizar o
teste sobre cada uma das
variáveis , ou realizarmos teste de
Park sobre cada variável.

13
4
O sucesso do teste de Goldfeld-
Quandt depende não só do valor
de c, mas também de identificar a
variável X correta com a qual se
colocam as observações em
ordem.

13
5
 Observar que os erros devem ter
distribuição normal

13
6
13
7
Consiste em regredir o quadrado dos
resíduos (uˆi ) sobre o quadrado dos valores
estimados da variável dependente (Yˆi ) :

2 ˆ
uˆ  1   2 (Yi )  vi
2
i

13
8
O teste da estimativa do parâmetro  2 pela
estatística t ou F revela a significância ou
não da relação e, consequentemente, a do
grau de heterocedasticidade.

H0: homocedasticidade
H1: heterocedasticidade
13
9
O teste KB é aplicável mesmo
quando o termo de erro do
modelo original não é distribuído
normalmente.

14
0
14
1
Seja um modelo de regressão:

Yi  1  2 X 2i  3 X 3i  ui

14
2
Etapa 1: com os dados pertinentes, estime
Yi  1  2 X 2i  3 X 3i  ui e obtenha os

resíduos, û i ;

14
3
Etapa 2: É feita uma regressão auxiliar
em que a variável dependente é o resíduo
ao quadrado e os regressores são os
próprios regressores da regressão original,
seus quadrados e os produtos cruzados.

14
4
Ou seja:

uˆ   1   2 X 2i   3 X 3i   4 X   5 X   6 X 2i X 3i  i
2
i
2
2i
2
3i

2
Obtenha o R desta regressão auxiliar.

Um R 2 elevado nessa regressão auxiliar é um


indício de que há heterocedasticidade.

14
5
Etapa 3: Calcule

n.R  
2 2
gl

onde gl é igual ao número de regressores da


regressão auxiliar.

H0: Homocedasticidade
HA: Heterocedasticidade
14
6
Etapa 4. Se o valor de qui-quadrado
obtido anteriormente for superior ao valor
crítico de qui-quadrado no nível de
significância selecionada, conclui-se que
há heterocedasticidade.

14
7
 Em casos em que o teste estatístico de
White é estatisticamente significativo,
não necessariamente a causa será a
heterocedasticidade, mas erros de
especificação.

14
8
 Seno procedimento do teste não
estiverem presentes termos de
produtos cruzados, então, ele é
um teste de heterocedasticidade
pura.

 Seesses termos estiverem


presentes, ele é um teste de
heterocedasticidade e viés de
especificação.

14
9
Algumas limitações do teste de White:

 1 – Utiliza muitos graus de liberdade

 2 – O teste ajuda pouco na


identificação dos fatores ou variáveis
que causam heterocedasticidade

15
0
Algumas vantagens do teste de White:

 1 – Não requer a hipótese de


normalidade dos erros

 2 – O teste é fácil de aplicar

15
1
 Como o teste de White pode
consumir muitos graus de
liberdade se houver vários
regressores e se todos eles, bem
como seus quadrados e seus
produtos cruzados, forem
incluídos, pode-se fazer um
atalho para o referido teste.

15
2
Em lugar de estimar regressões com muitas
variáveis independentes, pode-se estimar:

ˆ ˆ
uˆ  1   2Yi   2Yi  vi
2 2
i


onde i são os valores do Y estimado (isto é, o
regressando) de qualquer modelo.
15
3
2
Obtenha o valor de R e empregue a
equação abaixo para testar a hipótese de que
não há heterocedasticidade.

n R  
2 2

15
4
15
5
 Considere um modelo de regressão linear
com k variáveis explicativas:

Yi  1  2 X 2i  ...  k X ki  ui

15
6
Suponha que a variância do erro  seja
2
 i

descrito como:

  f (1   2 Z 2i  ...   m Z mi )
i
2

ou seja, é uma função linear das variáveis


não estocásticas Z;

 Alguns ou todos os X’s podem servir como 


Z’s.
15
7
 Especificamente, suponha que:

  1   2 Z 2i  ...   m Z mi
i
2

Ou seja,  é uma função linear dos Z.


2

i

 Se  2   3  ...   m  0
   1 , que é uma constante.
i
2

15
8
 Portanto, para testarmos se é
homocedástico, podemos testar a
hipótese de que .

15
9
O teste BPG é assintótico e para
grandes amostras.

 Para pequenas amostras o teste é


sensível à hipótese de que os erros
sejam normalmente distribuídos.

16
0
1 – calcule a equação

por MQO e obtenha os resíduos


uˆ1 , û2 ,...,ûn .
Yi  1   2 X 2 i  ...   k X ki  ui
16
1
û 2
 2 – Obtenha  
~ 2 i

 3 – Construa variáveis pi definidas como:

2
û
pi  ~ i

 2

16
2
 4 – Faça a regressão de pi assim
construída sobre os Z’s como:

pi  1   2 Z 2i     m Z mi  vi

16
3
5 - Obtenha SQE da equação

1
e defina:   ( SQE )
2
pi  1   2 Z 2 i     m Z mi  vi
▶ Observe que m é o número de
parâmetros da equação acima.

16
4
 Supondo que os ui sejam normalmente

distribuídos, pode-se mostrar que se há

homocedasticidade e se o tamanho da

amostra n aumenta indefinidamente, então:


 ass 2
m 1

16
5
 Portanto, se em uma aplicação o     2

calculado for maior que o valor crítico  2

no nível escolhido de significância,


poderemos rejeitar a hipótese de
homocedasticidade; caso contrário, esta não
será rejeitada.

16
6
16
7
 Como vimos, a heterocedasticidade
não destrói as propriedades de não
tendenciosidade e de consistência dos
estimadores de MQO; mas eles
deixam de ser eficientes, mesmo
assintoticamente (isto é, em grandes
amostras).

16
8
Correção de
Heterocedasticidade quando
σi2 não é conhecido

16
9
17
0
 White mostrou que suas estimativas
podem ser feitas de tal modo que
possam ser tiradas inferências
estatísticas assintoticamente válidas
(isto é, para grandes amostras) sobre
os verdadeiros valores dos
parâmetros.

17
1
Imagine o modelo de regressão com
duas variáveis.

Yi  1   2 X i  ui
var(ui )   i
2

var( ˆ 2 )
 x 2
i i
2

( x ) 2 2
i

17
2
Como os  não são diretamente observáveis,
2
i

White sugere adotar uˆ , os resíduos elevados ao


2
i

 2
quadrado para cada i, em lugar de i e estimar a
var( ˆ2 ) do seguinte modo:

var( ˆ ) 
 x uˆ
2 2
i i

( x )
2 2 2
i

17
3
var( ˆ2 ) 
 xi2uˆi2
White demonstrou que ( x2 2
i )
é

um estimador consistente de

var( ˆ2 ) 
 xi2 i2
( x2 2
i )

Porém, ele não proporciona as estimativas


mais eficientes dos parâmetros.
17
4
O valor de ûi2 da equação var( ˆ2 )  
xi2uˆi2
 é
(  xi2 ) 2
obtido estimando primeiro a
regressão de MQO e obtendo os
resíduos.

17
5
 Além de ser um procedimento para
grandes amostras, uma desvantagem
do procedimento de White é que os
estimadores que geram podem não
ser tão eficientes quanto aqueles que
transformam os dados para refletir
tipos específicos de
heterocedasticidade.
17
6
Hipóteses plausíveis
sobre o padrão de
heterocedasticidade

17
7
 Seja
o modelo de regressão de
duas variáveis:

Yi  1   2 X i  ui

17
8
 Vamos considerar várias
pressuposições sobre o
padrão de
heterocedasticidade.

17
9
Pressuposição 1:

2
A variância do erro é proporcional a X i .

Dessa forma: E (u )   X
2
i
2
i
2
(6.5)

18
0
18
1
Se acreditamos, em função de métodos
gráficos “especulativos” ou das abordagens de
Park e Glejser, que a variância de ui é
proporcional ao quadrado da variável
explanatória X, podemos transformar o modelo
como a seguir.

18
2
Dividimos o modelo original por Xi:

Yi 1 ui
  2 
Xi Xi Xi

Yi 1
 1   2  vi
Xi Xi (6.6)

18
3
ui 2
E (vi2 )  E ( )
Xi

1
E (vi2 )  2
E (u 2
i )
Xi

Usando (6.5) E (ui2 )   2 X i2

E (vi2 )   2

Consequentemente, a variância de vi agora é


homocedástica e podemos continuar aplicando os MQO à
equação transformada (6.6), fazendo a regressão de Yi/Xi
contra 1/Xi. 18
4
Pressuposição 2:

A variância do erro é proporcional a Xi.

Dessa forma, E (u )   X i
2
i
2
(6.7)

18
5
18
6
Se acreditamos que a variância de ui,
em lugar de ser proporcional ao quadrado
de Xi, é proporcional ao próprio Xi, então o
modelo original pode ser transformado
como se segue.

18
7
Yi 1 ui
  2 X i 
Xi Xi Xi

Yi 1
 1   2 X i  vi
Xi Xi (6.8)

ui
vi 
onde Xi e onde Xi > 0.

18
8
2
 ui 
E (v )  E 
2 
i  X 
 i 

1
E (v ) 
2
i  E (ui )
2

Xi

se
E (u )   X i
2
i
2

1 2
E (v )   X i
2
i
Xi

E (v )  
2
i
2
18
9
Pressuposição 3:

A variância do erro é proporcional ao


quadrado do valor médio de Y.

E (u )   [ E (Yi )]
2
i
2 2
(6.9)

19
0
û2


Figura - Padrões hipotéticos de quadrados dos resíduos estimados.
19
1
Portanto, se transformamos a equação original do
seguinte modo:

Yi 1 Xi ui
  2 
E (Yi ) E (Yi ) E (Yi ) E (Yi )

Yi  1  Xi
 1     2  vi (6.10)
E (Yi )  E (Yi )  E (Yi )

ui
onde v  E ( v 2
)   2
E (Yi ) , podemos ver que , isto é, os
i i

termos de erro vi são homocedásticos. 19


2
2
 ui 
E (v )  E 
2
i

 E (Yi ) 
1
E (v ) 
2
i 2
 E (ui )
2

E (Yi )

se E (u )   E (Yi )
2
i
2 2

1
E (v ) 
2
i 2
 E (Yi )
2 2

E (Yi )

E (v )  2
i
2

19
3
 Na prática, teremos:

Yi 1  Xi 
 1     2    vi
Yˆi ˆ
 i
Y ˆ
 i 
Y

 Essa transformação será benéfica se o


tamanho da amostra for
razoavelmente grande.

19
4
Pressuposição 4:

Uma transformação logarítmica como

ln Yi  1   2 ln X i  ui (6.12)

19
5
Essa transformação muitas vezes reduz a
heterocedasticidade em comparação com a
regressão linear ( Yi  1   2 X i  ui )

Isso ocorre porque a transformação logarítmica


comprime as escalas em que as variáveis são
medidas.

19
6
Pressuposição 5 –
Mínimos quadrados Generalizados
Factível

19
7
 Na maioria dos casos, a forma exata de
heterocedasticidade não é óbvia.

 Vamos presumir que:

varu | X    2 exp  0  1 X1   2 X 2  ...   k X k  (1)

19
8
 Sob a hipótese (1), podemos escrever:

u 2   2 exp  0  1 X1   2 X 2  ...   k X k v

em que v tem uma média igual à


unidade, condicional
em X = (X1, X2, ..., Xk).

19
9
 Se presumirmos que v é realmente
independente de X podemos escrever:

ln(u )   0  1 X1   2 X 2  ...   k X k  ei
2
i

em que ei tem média zero e é


independente de X.

20
0
 Substituindo o u por û, tem-se:

ln(û )   0  1 X1   2 X 2  ...   k X k  ei
i
2

O que necessitamos dessa regressão


são os valores estimados da variável
dependente, digamos ĝ .

20
1
 Assim:

var u | X    hˆi
2

hˆi  exp( gˆ )

20
2
 Agora estime a equação:

Yi  1   2 X 2  ...   k X k  ui

1
 Utilize os MQP, usando pesos
ĥi

20
3
 Pode-se encontrar de outra forma:

ˆ ˆ
ln(u )   0  1Yi   2Yi  ei
2 2
i

var ui | X i    hˆi


2

hˆ  exp( gˆ )
20
4
 Agora estime a equação:

Yi  1   2 X 2  ...   k X k  ui

1
 Utilize os MQP, usando pesos
ĥi

20
5
 Há alguns problemas adicionais
relativos às transformações vistas
que devemos ter em mente:

20
6
1 – Quando vamos além do modelo
com duas variáveis, podemos não
saber a priori qual das variáveis X
deve ser escolhida para
transformar os dados.

20
7
Contudo, em termos práticos,
podemos representar
graficamente contra cada variável
e decidir qual das variáveis X deve
ser usada para transformar os
dados.
20
8
2- A transformação logarítmica
examinada na pressuposição 4
não é aplicável se alguns dos
valores de Y e X forem
negativos ou zeros.

20
9
3 – Há, ainda, o problema da
correlação espúria. Este termo, se
refere à situação em que a correlação
está presente nas razões das variáveis
mesmo que as variáveis originais não
estejam correlacionadas ou sejam
aleatórias.

21
0
Por exemplo, se X1, X2 e X3 não
registram correlação mútua,
r12 = r13 = r23 = 0 e verificamos que
os valores das razões X1/X3 e X2/X3
estão correlacionados, então existe
uma correlação espúria.

21
1
Assim, no modelo Yi  1   2 X i  ui , Y e X
podem não estar correlacionados, mas muitas
vezes verificamos que no modelo
Yi 1 Yi 1
transformado  1   2  vi , e
Xi Xi Xi Xi

apresentam correlação.

21
2
4 – Quando não conhecemos diretamente
 i
2
e o estimamos mediante uma ou mais
das transformações já vistas, todos os
nossos procedimentos de teste, seja t ou F
etc. só são, falando rigorosamente, válidos
para grandes amostras.

21
3
21
4
 De acordo com MANKIW, N. Gregory. “A quick
refresher course in macroeconomics.” Journal
of Economic Literature, dez. 1990. v. XXVII,
p. 1648.

 “a heterocedasticidade nunca foi razão para


descartar-se um modelo que, sob outros
aspectos, é considerado bom” .

21
5
 De acordo com FOX, John. Applied regression
analysis, linear models, and related methods.
Califórmia: Sage Publications, 1997. p.306.

 [...] vale corrigir variâncias desiguais do erro somente quando


o problema for grave.
O impacto da variância do erro não constante sobre a
eficiência do estimador de mínimos quadrados e na validade
da eficiência dos mínimos quadrados depende de vários
fatores, inclusive do tamanho da amostra, do grau de
variação no σi2, da configuração dos valores de X e da relação
entre a variância dos erros e os X. Portanto, não é possível
chegar a conclusões gerais aplicáveis a respeito dos danos
produzidos pela heterocedasticidade.

21
6
 Devemos lembrar também que, apesar
da heterocedasticidade, os
estimadores de MQO são lineares, não
tendenciosos e em condições gerais
têm distribuição normal
assintoticamente (em grandes
amostras)

21
7
 No entanto, a advertência dada parece
ser adequada como regra geral, caso
contrário, podemos exagerar.

21
8
Bibliografia:

GREENE, W.H. Econometric Analysis, 5a. edição,


Macmillian Publishing Company, 2003.

GUJARATI, D. N. e PORTER, C. P. Econometria Básica.


5ª edição, McGraw-Hill e Artmed. 2011.

PINDYCK, R.S.; RUBINFELD, D. L. Econometria. Rio de


Janeiro: Elsevier, 2004.

WOOLDRIDGE, J.M. Introductory Econometrics. A


Modern Approach. 2nd ed. Ed. Thomson. 2010.

21
9

Das könnte Ihnen auch gefallen