Beruflich Dokumente
Kultur Dokumente
Bibliografia:
2
Homocedasticidade é quando as
perturbações ui possuem a mesma
variância.
3
E (u )
2
i
2
i = 1, 2, ..., n.
2 0 0 0
0 2
0 0
E (uu `) 0 0 2 0
0 0 0 2
4
Na figura a seguir, observa-se
que a variância de ui, permanece a
mesma, independentemente dos
valores assumidos pela variável
X.
5
Homocedasticidade 6
Heterocedasticidade é quando a
variância do erro não é constante
para todos os valores da variável
independente.
7
E (u )
2
i i
2
i = 1, 2, ..., n.
12 0 0 0
0 22 0 0
E (uu `) 0 0 32 0
0 n2
0 0
8
Na Figura seguinte, mostra
que a variância de ui varia à
medida que X aumenta,
caracterizando a presença de
Heterocedasticidade.
9
Heterocedasticidade
10
11
1– Despesa com alimentação
em famílias com rendas
diferentes.
12
2 – Salários em função
dos anos de estudos.
13
3 – Poupança das
famílias em função
da renda.
14
4 – Taxa de rentabilidade
sobre o tamanho da
empresa.
15
A dispersão dos erros na
presença da
heterocedasticidade pode ser
representado como nos
gráficos a seguir:
16
17
18
19
20
Vejamos um exemplo de
presença de
heteroscedasticidade
21
Considere os dados na tabela abaixo de 19 trabalhadores e os anos de estudo de cada um.
Salários Anos de
estudo
410 1
508,9 2
857,7 3
551,3 4
789,2 5
935,5 6
1529,3 7
1497,5 8
2317,7 9
2169,5 10
2596,8 11
2844,6 12
3391 13
2671,2 14
2653,8 15
2939,1 16
3437 17
4583,3 18 22
Salário estimado e resíduos
Salários Anos Y previsto Resíduos
410 1 192,08 217,92
508,9 2 409,4368 99,46316
857,7 3 626,7937 230,9063
551,3 4 844,1505 -292,851
789,2 5 1061,507 -272,307
935,5 6 1278,864 -343,364
1529,3 7 1496,221 33,07895
1497,5 8 1713,578 -216,078
2317,7 9 1930,935 386,7653
2169,5 10 2148,292 21,20842
2596,8 11 2365,648 231,1516
2844,6 12 2583,005 261,5947
3391 13 2800,362 590,6379
2671,2 14 3017,719 -346,519
2653,8 15 3235,076 -581,276
2939,1 16 3452,433 -513,333
3437 17 3669,789 -232,789
4583,3 18 3887,146 696,1537
23
3559,3 19 4104,503 -545,203
Variável X 1 Plotagem de resíduos
800
600
400
200
Resíduos
0 5 10 15 20 25
-200
-400
-600
-800
Variável X 1 24
25
1 – Modelos de
aprendizagem do erro
26
27
2 – À medida que a renda
aumenta, as pessoas têm
maior renda discricionária
28
3 – Empresas com maiores
lucros geralmente mostram
maior variabilidade em suas
políticas de dividendos
29
4 – Uma melhora ou
aperfeiçoamento das técnicas
de coleta de dados,
provavelmente diminui a
variância.
30
5 –Observações discrepantes
ou outliers.
31
32
6 – Erros de Especificação
(omissão de variáveis
relevantes)
33
7 – Assimetria na distribuição de um ou
mais regressores incluídos no modelo.
34
8 - Transformação incorreta
de dados
35
9 - Formas funcionais
incorretas
36
O problema da
heterocedasticidade é mais
comum em dados de corte
do que em séries
temporais.
37
38
O que acontecerá aos estimadores
de MQO e suas variâncias se
introduzirmos heterocedasticidade?
39
Continuarão à serem lineares,
não viesados, com a menor
variância (eficientes) e
consistentes?
40
Seja a equação: Yi 1 2 X i ui
A variância homocedástica é:
ˆ 2
var( 2 )
x 2
i
A variância heterocedástica é:
var( ˆ 2 )
x 2
i i
2
( x )2 2
i
41
var( ˆ 2 )
x
2
i i
2
( x )
2 2
i
Anexo
42
Na presença da
heterocedasticidade, o
ˆ
estimador 2 é ainda linear, não
viesado e consistente?
43
Prova da linearidade na heterocedasticidade:
Yi 1 2 X i ui
̂ 2 kiYi
44
Prova da inexistência de viés na heterocedasticidade:
Yi 1 2 X i ui
̂ 2 kiYi
ˆ2 ki (1 2 X i ui )
ˆ2 1 ki 2 ki X i kiui
se k i 0 e k Xi i 1
45
se k i 0 e k X
i i 1
ˆ2 2 kiui
E (ˆ2 ) 2 ki E (ui )
se
E (ui ) 0
E (ˆ2 ) 2
46
Assim, dos slides anteriores,
ˆ
tem-se que 2 é um estimador
linear e não viesado apesar da
heterocedasticidade.
47
ˆ 2 é um estimador consistente
apesar da heterocedasticidade?
48
A condição de suficiência para a
consistência é que ˆ2 seja não
viesado e que sua variância tenda
para zero à medida que o
tamanho da amostra n, tende para
o infinito.
49
xi2 . i2
var( ˆ 2 )
2 2
xi
51
Admitindo que ˆ 2 seja linear, não
viesado e consistente, ele ainda é eficiente
ou o melhor estimador?
52
53
Porque o estimador de M.Q.O usual
de 2 dado em (2.1) não é eficiente ou
o melhor estimador, embora ainda seja
não tendencioso?
54
O método usual dos M.Q.O confere igual
peso ou importância a cada observação.
55
Para ver isso, seja o modelo de duas variáveis:
Yi 1 2 X i ui
Yi 1 X 0i 2 X i ui (1)
56
2
Suponha agora que as variâncias heterocedasticas i sejam
conhecidas.
Yi X 0i Xi ui
1 2
i i i i
Yi X X u
* *
1
*
0i
*
2
*
i
*
i
57
Qual a finalidade de
transformar o modelo
original?
58
2
ui
var(u ) E (u ) E
* * 2
i
i i
1
var(u ) E (u )
* * 2
E (ui2 ) pois i2 é conhecido.
i i 2
i
1
var(u ) E (u )
* * 2
( i2 ) pois E (ui2 ) i2
i i 2
i
59
Observe agora que, os *
1 e
2* estimados por M.Q.G são
MELNV e não os estimadores
de M.Q.O ˆ1 e ˆ 2 .
60
Esse método de transformar as
variáveis originais de modo que as
variáveis transformadas satisfaçam as
hipóteses do modelo clássico, para em
seguida aplicar os M.Q.O, é conhecida
como método dos mínimos quadrados
generalizados.
61
Nos M.Q.G, o peso atribuído a cada
observação é inversamente
proporcional a seu i .
62
Para perceber claramente a diferença entre M.Q.O e M.Q.G, considere o diagrama de
dispersão hipotético da figura.
Y C
û
Yˆi ˆ1 ˆ2 X i
A
û û B
X
Figura - Diagrama de dispersão hipotético.
63
64
Originalmente, o modelo tratado é:
Y X (1)
E ( ) 0 (2)
E ( ' ) I n
2
(3)
E ( ' )
2
(5)
66
O objetivo do método é estimar os
parâmetros do modelo, assim como
anteriormente, considerando,
entretanto, que há uma nova
configuração da matriz de variância e
covariância dos resíduos.
67
O princípio desse método segue,
portanto, o mesmo padrão dos
procedimentos adotados para a
correção dos problemas de
autocorrelação e de
heterocedasticidade.
68
Assim, será necessário encontrar a
forma mais adequada para transformar
o modelo original, de modo a gerar
termo aleatório não
autocorrelacionado e homocedástico.
69
Com esse objetivo, tomaremos uma matriz T, não
singular (matriz com um determinante cujo valor é
diferente de zero), chamada matriz de transformação, e
faremos a seguinte operação no modelo original:
Y X
TY TX T (6)
Anexo B
70
71
A primeira delas refere-se ao fato de
que, para que esse método possa ser
aplicado, é essencial que a matriz Ω
seja conhecida.
72
Aqui, esbarramos em outra dificuldade,
pois Ω é uma matriz de dimensão n x n,
com n(n + 1)/2 termos desconhecidos,
sendo n o número de elementos da
amostra.
73
Essa estimação somente será possível
se for possível reduzir o número de
parâmetros a ser estimado.
74
No caso da heterocedasticidade, a matriz Ω é
diagonal, tal como:
12 0 0 0
0 2 0
2
0
E ( `) 2 0 0 3
2
0
0 2
0 0 n
75
Por último, é importante notar
que, para a estimação do modelo, é
necessário encontrar a matriz T, tal
-1
que T`T = Ω .
76
-1
Se a matriz Ω é diagonal, Ω também o é:
1
2 0 0 0
1
0 1
0 0
2
2
1 1
0 0 0
2
3
1
0 0 0
n2
77
Feito isso, basta transformar o modelo
TY TX T
E a solução explícita de MQG será:
ˆ
X ´ X 1
1 1
X ´ y
78
79
ˆ
* ˆ
Tanto 2 como 2 são estimadores
lineares não tendenciosos.
Yi 1 X 0i 2 X i ui
ˆ
*
Mas sabemos que 2 é eficiente, isto
é, tem a menor variância.
Yi X X u
* *
1
*
0i
*
2
*
i
*
i
80
O que acontecerá com o intervalo
de confiança e os testes t e F,
quando usamos os M.Q.O e o
estimador ˆ 2 desconsiderando a
heterocedasticidade?
81
Quando calculamos uma regressão pelos
M.Q.O padrão, ignorando a
var( ˆ
heterocedasticidade, a 2 ) será:
ˆ 2
var( 2 )
x 2
i
, que é um estimador viesado da
var( ˆ 2 )
i i
x 2
( x ) 2 2
i
82
O viés decorre do fato de que a
variância residual estimada, não é mais
um estimador não tendencioso quando
a heterocedasticidade se faz presente.
ˆ
2 uˆ 2
i
(n 2)
83
ˆ 2
var( 2 )
Na média, x 2
i
superestima
var( ˆ )
x i i
2
( x )
2
ou subestima 2 2
i
.
84
Em geral, não podemos dizer se o viés é
positivo (superestimação) ou negativo
(subestimação), porque isso dependerá da natureza
da relação entre
2
i e os valores assumidos pela
variável explanatória X, como se vê na
var( ˆ 2 )
i i
x 2 2
( xi2 ) 2
85
var( ˆ )
x2
i i
2
( x )
2 2 2
Dada a equação i
substituindo
ˆ
var( 2 )
2
x 2
k
i i
2
x k2
i i
( x )
2 2
i xi
2
x i
2
86
Observe que o primeiro termo à
esquerda é a variância homocedástica,
como se pode observar:
ˆ 2
var( 2 )
x 2
i
87
x k2
i i
1
Portanto, se x i
2
, então a
88
2
Nesse caso, var( ˆ2 ) ,
i
x 2
subestimará a heterocedásticidade,
levando as estatísticas t e F a inflarem.
89
Em conseqüência, não podemos mais
confiar nos cálculos dos intervalos de
confiança e nos testes de t e F
empregados convencionalmente.
90
Portanto, se usarmos M.Q.O na
presença de heterocedasticidade, a
conclusão a que chegamos ou as
inferências que fizermos, poderão ser
bastante enganosas.
91
Consequências da
Heterocedasticidade – uma
visão matricial
92
Consideramos o seguinte modelo:
Y X ,
com
E ( ) 0 (1)
12 0 0 0
0 2
2 0 0
E ( `) 0 0 32 0 (2)
0 0 0 0 n2
93
O vetor dos estimadores dos parâmetros é o seguinte:
b ( X `X )1 X `
E (b) ( X `X )1 X `E ( )
E (b) ( X `X ) 1 X `E ( )
Conforme (1):
E ( ) 0
Assim:
E (b) (3)
94
A matriz da variância e covariância de b é:
Conforme (2):
E ( `) (2)
Temos então:
95
Devemos observar que a expressão (4),
assim como ocorre no caso da existência
de autocorrelação, é diferente de
var cov( ) 2 ( X `X ) 1 , que é o estimador
97
Conclusão:
10
0
Como o economista não tem controle
das variáveis, encontrar
heterocedasticidade pode ser uma
questão de intuição, conjectura,
experiência empírica anterior ou pura
especulação.
10
1
10
2
1- Natureza do Problema
Anatureza do problema que está
sendo considerado sugere se é
provável a presença de
heterocedasticidade.
10
3
Consumo sobre a renda, envolvendo famílias
com rendas diferentes.
10
5
Se não existem informações a priori
ou empíricas sobre a natureza da
heterocedasticidade, na prática
podemos fazer a análise de regressão
supondo que não há
heterocedasticidade e depois fazer um
exame dos resíduos elevados ao
quadrado, para ver se eles apresentam
algum padrão sistemático.
10
6
10
7
10
8
10
9
11
0
Park formaliza o método gráfico ao sugerir que
i2 é alguma função da variável explicativa Xi .
Xi e
i
2 2 vi
ou
ln ln ln X i vi
i
2 2
(5.1)
11
1
2
Como i geralmente não é conhecido, Park sugere
uˆ 2
usar i como uma proxy e rodar a seguinte regressão:
ln uˆi2 ln 2 ln X i vi
ln ui ln X i vi
ˆ 2
(5.2)
11
2
Se for estatísticamente significativo
presença de heterocedaticidade
11
5
Neste experimento, Glejser empregou as seguintes
formas funcionais:
uˆi 1 2 X i vi
uˆi 1 2 X i vi
1
uˆi 1 2 vi
Xi
1
uˆi 1 2 vi
Xi
11
6
Quando houver mais de uma variável
independente, o teste de Park e Glejser pode
ser trabalhado da seguinte forma:
11
7
11
8
Aidéia básica do teste é verificar
se existe diferença entre a
variância dos resíduos estimados,
localizados nas proximidades do
intercepto, e aqueles que se
encontram a uma distância maior.
11
9
12
0
Para simplificar, considere um modelo:
Yi 1 2 X i ui
Suponha que i
2
se relacione positivamente com X i
como:
X
i
2 2
i
2
(5.10)
12
1
12
2
1) Ordene as observações pela
magnitude da variável explanatória
Xi, começando pelo valor mais baixo
de X ;
12
3
2) Omita as observações centrais, c,
em que c é especificado a
princípio, e divida as ( n c)
observações restantes em dois
12
6
Cada uma das SQR tem:
n c k n c 2k
gl
2 ou 2
12
7
4) Calcule a razão:
SQR2 GL
SQR1 GL (5.11)
12
8
Admitindo que ui distribui-se
normalmente, e que a hipótese de
homocedasticidade é válida, então se
pode mostrar que de (5.11) segue a
n c 2k
F gl
distribuição com de 2 no
numerador e no denominador (Fc).
12
9
Se ( F )calculado Fc , rejeita-se a
hipótese de homocedasticidade, ou seja:
H0: Homocedasticidade
HA: Heterocedasticidade
13
0
A omissão das observações
centrais ( c ) serve para acentuar a
diferença entre o grupo de pequena
variância ( SQR1 ) e o grupo de grande
variância (SQR2 ) .
13
1
Goldfeld e Quandt sugerem:
n = 30; c=8
n = 60; c = 16
Judge et al sugerem:
n = 30; c=4
n = 60; c = 10
13
2
No caso de mais de uma variável
independente , a ordenação das
observações, o primeiro passo do
teste, pode ser feita de acordo
com qualquer uma delas.
13
3
Se não estivermos seguros a
princípio sobre qual variável é
apropriada, podemos realizar o
teste sobre cada uma das
variáveis , ou realizarmos teste de
Park sobre cada variável.
13
4
O sucesso do teste de Goldfeld-
Quandt depende não só do valor
de c, mas também de identificar a
variável X correta com a qual se
colocam as observações em
ordem.
13
5
Observar que os erros devem ter
distribuição normal
13
6
13
7
Consiste em regredir o quadrado dos
resíduos (uˆi ) sobre o quadrado dos valores
estimados da variável dependente (Yˆi ) :
2 ˆ
uˆ 1 2 (Yi ) vi
2
i
13
8
O teste da estimativa do parâmetro 2 pela
estatística t ou F revela a significância ou
não da relação e, consequentemente, a do
grau de heterocedasticidade.
H0: homocedasticidade
H1: heterocedasticidade
13
9
O teste KB é aplicável mesmo
quando o termo de erro do
modelo original não é distribuído
normalmente.
14
0
14
1
Seja um modelo de regressão:
Yi 1 2 X 2i 3 X 3i ui
14
2
Etapa 1: com os dados pertinentes, estime
Yi 1 2 X 2i 3 X 3i ui e obtenha os
resíduos, û i ;
14
3
Etapa 2: É feita uma regressão auxiliar
em que a variável dependente é o resíduo
ao quadrado e os regressores são os
próprios regressores da regressão original,
seus quadrados e os produtos cruzados.
14
4
Ou seja:
uˆ 1 2 X 2i 3 X 3i 4 X 5 X 6 X 2i X 3i i
2
i
2
2i
2
3i
2
Obtenha o R desta regressão auxiliar.
14
5
Etapa 3: Calcule
n.R
2 2
gl
H0: Homocedasticidade
HA: Heterocedasticidade
14
6
Etapa 4. Se o valor de qui-quadrado
obtido anteriormente for superior ao valor
crítico de qui-quadrado no nível de
significância selecionada, conclui-se que
há heterocedasticidade.
14
7
Em casos em que o teste estatístico de
White é estatisticamente significativo,
não necessariamente a causa será a
heterocedasticidade, mas erros de
especificação.
14
8
Seno procedimento do teste não
estiverem presentes termos de
produtos cruzados, então, ele é
um teste de heterocedasticidade
pura.
14
9
Algumas limitações do teste de White:
15
0
Algumas vantagens do teste de White:
15
1
Como o teste de White pode
consumir muitos graus de
liberdade se houver vários
regressores e se todos eles, bem
como seus quadrados e seus
produtos cruzados, forem
incluídos, pode-se fazer um
atalho para o referido teste.
15
2
Em lugar de estimar regressões com muitas
variáveis independentes, pode-se estimar:
ˆ ˆ
uˆ 1 2Yi 2Yi vi
2 2
i
Yˆ
onde i são os valores do Y estimado (isto é, o
regressando) de qualquer modelo.
15
3
2
Obtenha o valor de R e empregue a
equação abaixo para testar a hipótese de que
não há heterocedasticidade.
n R
2 2
15
4
15
5
Considere um modelo de regressão linear
com k variáveis explicativas:
Yi 1 2 X 2i ... k X ki ui
15
6
Suponha que a variância do erro seja
2
i
descrito como:
f (1 2 Z 2i ... m Z mi )
i
2
1 2 Z 2i ... m Z mi
i
2
Se 2 3 ... m 0
1 , que é uma constante.
i
2
15
8
Portanto, para testarmos se é
homocedástico, podemos testar a
hipótese de que .
15
9
O teste BPG é assintótico e para
grandes amostras.
16
0
1 – calcule a equação
2
û
pi ~ i
2
16
2
4 – Faça a regressão de pi assim
construída sobre os Z’s como:
pi 1 2 Z 2i m Z mi vi
16
3
5 - Obtenha SQE da equação
1
e defina: ( SQE )
2
pi 1 2 Z 2 i m Z mi vi
▶ Observe que m é o número de
parâmetros da equação acima.
16
4
Supondo que os ui sejam normalmente
homocedasticidade e se o tamanho da
ass 2
m 1
16
5
Portanto, se em uma aplicação o 2
calculado for maior que o valor crítico 2
16
6
16
7
Como vimos, a heterocedasticidade
não destrói as propriedades de não
tendenciosidade e de consistência dos
estimadores de MQO; mas eles
deixam de ser eficientes, mesmo
assintoticamente (isto é, em grandes
amostras).
16
8
Correção de
Heterocedasticidade quando
σi2 não é conhecido
16
9
17
0
White mostrou que suas estimativas
podem ser feitas de tal modo que
possam ser tiradas inferências
estatísticas assintoticamente válidas
(isto é, para grandes amostras) sobre
os verdadeiros valores dos
parâmetros.
17
1
Imagine o modelo de regressão com
duas variáveis.
Yi 1 2 X i ui
var(ui ) i
2
var( ˆ 2 )
x 2
i i
2
( x ) 2 2
i
17
2
Como os não são diretamente observáveis,
2
i
2
quadrado para cada i, em lugar de i e estimar a
var( ˆ2 ) do seguinte modo:
var( ˆ )
x uˆ
2 2
i i
( x )
2 2 2
i
17
3
var( ˆ2 )
xi2uˆi2
White demonstrou que ( x2 2
i )
é
um estimador consistente de
var( ˆ2 )
xi2 i2
( x2 2
i )
17
5
Além de ser um procedimento para
grandes amostras, uma desvantagem
do procedimento de White é que os
estimadores que geram podem não
ser tão eficientes quanto aqueles que
transformam os dados para refletir
tipos específicos de
heterocedasticidade.
17
6
Hipóteses plausíveis
sobre o padrão de
heterocedasticidade
17
7
Seja
o modelo de regressão de
duas variáveis:
Yi 1 2 X i ui
17
8
Vamos considerar várias
pressuposições sobre o
padrão de
heterocedasticidade.
17
9
Pressuposição 1:
2
A variância do erro é proporcional a X i .
Dessa forma: E (u ) X
2
i
2
i
2
(6.5)
18
0
18
1
Se acreditamos, em função de métodos
gráficos “especulativos” ou das abordagens de
Park e Glejser, que a variância de ui é
proporcional ao quadrado da variável
explanatória X, podemos transformar o modelo
como a seguir.
18
2
Dividimos o modelo original por Xi:
Yi 1 ui
2
Xi Xi Xi
Yi 1
1 2 vi
Xi Xi (6.6)
18
3
ui 2
E (vi2 ) E ( )
Xi
1
E (vi2 ) 2
E (u 2
i )
Xi
E (vi2 ) 2
Dessa forma, E (u ) X i
2
i
2
(6.7)
18
5
18
6
Se acreditamos que a variância de ui,
em lugar de ser proporcional ao quadrado
de Xi, é proporcional ao próprio Xi, então o
modelo original pode ser transformado
como se segue.
18
7
Yi 1 ui
2 X i
Xi Xi Xi
Yi 1
1 2 X i vi
Xi Xi (6.8)
ui
vi
onde Xi e onde Xi > 0.
18
8
2
ui
E (v ) E
2
i X
i
1
E (v )
2
i E (ui )
2
Xi
se
E (u ) X i
2
i
2
1 2
E (v ) X i
2
i
Xi
E (v )
2
i
2
18
9
Pressuposição 3:
E (u ) [ E (Yi )]
2
i
2 2
(6.9)
19
0
û2
Yˆ
Figura - Padrões hipotéticos de quadrados dos resíduos estimados.
19
1
Portanto, se transformamos a equação original do
seguinte modo:
Yi 1 Xi ui
2
E (Yi ) E (Yi ) E (Yi ) E (Yi )
Yi 1 Xi
1 2 vi (6.10)
E (Yi ) E (Yi ) E (Yi )
ui
onde v E ( v 2
) 2
E (Yi ) , podemos ver que , isto é, os
i i
E (Yi )
se E (u ) E (Yi )
2
i
2 2
1
E (v )
2
i 2
E (Yi )
2 2
E (Yi )
E (v ) 2
i
2
19
3
Na prática, teremos:
Yi 1 Xi
1 2 vi
Yˆi ˆ
i
Y ˆ
i
Y
19
4
Pressuposição 4:
ln Yi 1 2 ln X i ui (6.12)
19
5
Essa transformação muitas vezes reduz a
heterocedasticidade em comparação com a
regressão linear ( Yi 1 2 X i ui )
19
6
Pressuposição 5 –
Mínimos quadrados Generalizados
Factível
19
7
Na maioria dos casos, a forma exata de
heterocedasticidade não é óbvia.
19
8
Sob a hipótese (1), podemos escrever:
u 2 2 exp 0 1 X1 2 X 2 ... k X k v
19
9
Se presumirmos que v é realmente
independente de X podemos escrever:
ln(u ) 0 1 X1 2 X 2 ... k X k ei
2
i
20
0
Substituindo o u por û, tem-se:
ln(û ) 0 1 X1 2 X 2 ... k X k ei
i
2
20
1
Assim:
var u | X hˆi
2
hˆi exp( gˆ )
20
2
Agora estime a equação:
Yi 1 2 X 2 ... k X k ui
1
Utilize os MQP, usando pesos
ĥi
20
3
Pode-se encontrar de outra forma:
ˆ ˆ
ln(u ) 0 1Yi 2Yi ei
2 2
i
hˆ exp( gˆ )
20
4
Agora estime a equação:
Yi 1 2 X 2 ... k X k ui
1
Utilize os MQP, usando pesos
ĥi
20
5
Há alguns problemas adicionais
relativos às transformações vistas
que devemos ter em mente:
20
6
1 – Quando vamos além do modelo
com duas variáveis, podemos não
saber a priori qual das variáveis X
deve ser escolhida para
transformar os dados.
20
7
Contudo, em termos práticos,
podemos representar
graficamente contra cada variável
e decidir qual das variáveis X deve
ser usada para transformar os
dados.
20
8
2- A transformação logarítmica
examinada na pressuposição 4
não é aplicável se alguns dos
valores de Y e X forem
negativos ou zeros.
20
9
3 – Há, ainda, o problema da
correlação espúria. Este termo, se
refere à situação em que a correlação
está presente nas razões das variáveis
mesmo que as variáveis originais não
estejam correlacionadas ou sejam
aleatórias.
21
0
Por exemplo, se X1, X2 e X3 não
registram correlação mútua,
r12 = r13 = r23 = 0 e verificamos que
os valores das razões X1/X3 e X2/X3
estão correlacionados, então existe
uma correlação espúria.
21
1
Assim, no modelo Yi 1 2 X i ui , Y e X
podem não estar correlacionados, mas muitas
vezes verificamos que no modelo
Yi 1 Yi 1
transformado 1 2 vi , e
Xi Xi Xi Xi
apresentam correlação.
21
2
4 – Quando não conhecemos diretamente
i
2
e o estimamos mediante uma ou mais
das transformações já vistas, todos os
nossos procedimentos de teste, seja t ou F
etc. só são, falando rigorosamente, válidos
para grandes amostras.
21
3
21
4
De acordo com MANKIW, N. Gregory. “A quick
refresher course in macroeconomics.” Journal
of Economic Literature, dez. 1990. v. XXVII,
p. 1648.
21
5
De acordo com FOX, John. Applied regression
analysis, linear models, and related methods.
Califórmia: Sage Publications, 1997. p.306.
21
6
Devemos lembrar também que, apesar
da heterocedasticidade, os
estimadores de MQO são lineares, não
tendenciosos e em condições gerais
têm distribuição normal
assintoticamente (em grandes
amostras)
21
7
No entanto, a advertência dada parece
ser adequada como regra geral, caso
contrário, podemos exagerar.
21
8
Bibliografia:
21
9