Beruflich Dokumente
Kultur Dokumente
1
O M odelo T erminologia
Y: variável dependente, variável explicada,
O (MLRM) Modelo Linear de variável de resposta, variável prevista,
Regressão Múltipla é dado pela seguinte regressando, saída, efeito.
efeito.
Xi: variáveis independentes, variáveis
equação::
equação
explicativas, variáveis de controle, preditores,
preditores,
Y = β0 + β1 X 1 + β2 X 2 + L + βk X k + U regressores,, entradas, causas.
regressores causas.
U: erro, distúrbio ou ruído.
ruído.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
2
A descrição do modelo de regressão
múltipla é normalmente apresentado de Y 1 X 11 X 12 ... X 1k β0 U 1
Y X X ... X β U
forma matricial. Y= 2
X= 21 22 2k
β= 1
U =
2
... ... ... ... ... ... ...
A equação anterior pode ser escrita
como: Y n X n1 X n 2 ... X nk β k U n
Y = Xβ + U
Y → ( nx 1 ) X → (nxk) β → kx1 U → (nx1)
Onde:
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Note-se que cada linha da matriz X As hipóteses vistas para a regressão linear
representa um conjunto de valores das variações simples podem ser colocadas na forma
independentes referentes a uma observação,
observação ao matricial da seguinte forma:
passo cada coluna representa um conjunto de
U ~ N ( 0 ,Σ )
valores de uma variável independente nas n
Onde “0” é um vetor-coluna de zeros e Σ é
observações amostrais. A primeira coluna de X é
uma matriz nxn.
composta inteiramente de valores iguais a um.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
3
Estimação dos Parâmetros
Da mesma forma que na regressão linear Diferenciando Φ em relação aos parâmetros de
simples os estimadores de mínimos quadrados regressão: β1, β2, ..., βk, tem-se:
dos coeficientes de regressão podem ser n
∂Φ
= −2 ∑ ( Y i − β0 − β1 X 1 i − L − βk X ki )
obtidos, minimizando a soma dos quadrados ∂ β1 i =1
n
dos resíduos, isto é: ∂Φ
= −2 ∑ X 1i ( Y i − β0 − β1 X 1i − L − βk X ki )
∂ β2 i =1
n n ... ... .... ....
Φ= ∑Ui2 = ∑ ( Y i − β0 − β1 X 1 i − L − βk X ki ) 2 ∂Φ n
i =1 i =1 = −2 ∑ X ki ( Y i − β0 − β1 X 1i − L − βk X ki )
∂ βk i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
4
Estimação dos Parâmetros Estimação dos Parâmetros
mY 1 m 12
mY 2 m 22 m Y 1m 22 − m12 m Y 2
Estas equações podem ser resolvidas β̂1 = =
m11 m 12 m 11m 22 − m 12m 12
para β̂1 , β̂2 , .., β̂k. A solução é simples, m 12 m 22
m 11 mY 1
porém trabalhosa. Se K = 2, isto é, para o m12 m Y 2 m Y 2 m 11 − m Y 1m 12
β̂2 = =
caso de duas variáveis, tem-se: m11 m 12 m 11m 22 − m 12m 12
m 12 m 22
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo Um
Q (kg) Preço (R$) Investimento (R$ mil)
Considere os dados como sendo das 55 100 550
70 90 630
variáveis: Y = Quantidade vendida de um 90 80 720
100 70 700
produto, X1 = Preço do produto e X2 = Gasto 90 70 625
105 70 735
com a divulgação do produto. Determinar a 80 70 560
110 65 715
equação de regressão de Y em função de X1 e 125 60 750
115 60 690
de X2. 130 55 715
130 50 650
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Y X1 X2 Y2 X 12 X 22 Y X1 YX2 X1 X2
55 100 550
70 90 630
Onde:
90 80 720
100 70 700
Y = 100 m 11 = 2250 mY1 = −3550
90 70 625
105 70 735
X 1 = 70 m 22 = 49000 mY 2 = 125 ,75
m 12 = −5400 mYY = 6300
80 70 560
110 65 715 X 2 = 670
125 60 750
115 60 690
130 55 715
130 50 650
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
5
Então: Assim a equação procurada, será:
6
Forma Matricial
Onde:
As equações normais do método dos
mínimos quadrados podem (e devem) ser ∑Y i n X i2 ... X ik β̂ 0
apresentadas em notação matricial, da ∑ X Y X X X
... X i 2 X ik
X' Y =
i1 i
X' X =
i1 i 2 i2 β̂ = β̂ 1
seguinte forma: ... ... ... ... ... ...
X Y
∑ ik i
X ... X ik X ik
X ik X i 2 ik β̂ k
X ' Y = ( X ' X ) ˆβ
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Y X1 X2
Substituindo os valores temos:
3 2 1
2 3 5
4 5 3 Y 1 = 3 = 1. β̂0 + 2. β̂1 + 1. β̂ 2 + E 1
5 7 6 Y 2 = 2 = 1. β̂0 + 3. β̂1 + 5. β̂2 + E 2
8 8 7
Y 3 = 4 = 1. β̂0 + 5. β̂1 + 3. β̂2 + E 3
O modelo para este caso será dado por: Y 4 = 5 = 1. β̂0 + 7. β̂1 + 6. β̂ 2 + E 4
Y i = β0 + β1 X 1 + β2 X 2i + Ui Y 5 = 8 = 1. β̂0 + 8. β̂1 + 7 β̂ 2 + E 5
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
7
As equações podem ser expressas de Tem-se, então:
forma matricial, fazendo: 3 1 2 1 e 1
2 1 3 5 β̂ 0 e 2
3 1 2 1 e 1
2 1 3 5 β̂ y = 4 = 1 5 3 β̂ + e 3
0 e 2 1
Y = 4 X = 1 5 3 β̂ = ˆ E = e 3 5 1 7 6 β̂ e 4
β 8 1 2
1 8 7 e 5
5 1 7 6
β̂ e 4
8 1 8 7 2 e 5
A forma matricial é, então: y = β x + e
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
−1
A solução é dada por: β̂ = ( X' X ) Xy' Resolvendo por partes:
22
Assim, para os valores dados, tem-se: 5 25 22
' X = 25 X ' y = 131
X 151 130
1 2 1
−1
111
3 22 130 120
1 1 1 1 1 1 3 5 1 1 2
1 1 1
ˆ = 2
8 1 3
8 4
β 3 5 7 5 2 3 5 7
1220 − 140 − 72
1 5 3 6 7 1 7 6 1 5 3 6 7 5 −1 1
( X' X ) = − 140 116 − 100
1 8 7 8 1016
− 72 − 100 130
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Qualidade do Ajuste
Os coeficientes serão: Na ANOVA a variabilidade entorno da
média geral é decomposta em variabilidade
1220 − 140 − 72 22 0 ,50 dentro e entre tratamentos. Na Análise de
ˆ = 1
β − 140 116 − 100 131 = 1 ,00
1016 Regressão a variabilidade total é decomposta
− 72 − 100 130 111 − 0 ,25
em variabilidade sobre a regressão (Explicada)
A equação de regressão, será: e variabilidade devido a regressão (Não-
Explicada). Para mostrar esta decomposição
Ŷ i = 0 ,50 + X 1 − 0 ,25. X 2
vamos partir da seguinte identidade:
E i = Y i − Ŷ i Y i − Ŷ i = ( Y i − Y ) − ( Ŷ i − Y )
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
8
Elevando os dois lados ao quadrado, tem-se:
SQT (Soma dos Quadrados Total )
2 2
( Y i −Ŷ i ) = [ ( Y i −Y ) −( Ŷ i −Y )]
(TSS = Total Sum of Squares)
Manipulando algebricamente, tem-se:
n
n 2 n 2 n 2 VT = SQT = ∑ ( Y i − Y ) 2
∑ ( Y i −Y ) = ∑( Y i −Ŷ i ) + ∑( Ŷ i −Y ) i =1
i =1 i =1 i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
SQE (SSoma dos Quadrados E xplicados ou SSR (SSoma dos Quadrados dos Resíduos)
Ajustados)
(RSS = Residual Sum of Squares)
(ESS = Explained Sum of Squares)
n 2 n n
VE = SQE = ∑ ( Ŷ i − Y ) 2 VR = SQR = ∑ E i2 = ∑ ( Y i −Ŷ i )
i =1 i =1 i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
9
Como na regressão simples pode- pode-se
definir o coeficiente de determinação ou R2
SQE SQR
R2 = =1 −
SQT SQT
2
∑n
( )
(Y i − Y ) Ŷ i − Y
R 2
= n i =1
∑ (Y − Y )2 ∑ n
( )
2
i Ŷ i − Y
i =1 i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
∑ (Y i − Y ) ∑ (Y i − Y )
2 2
n n
Mas VR = ∑ E 2i = ∑ Y i −Ŷ i
i =1 i =1
( ) 2
Assim R2, conforme definido irá
depende do número de variáveis aumentar. Desta forma ao se comparar dois
independentes existentes no modelo. modelos de regressão com a mesma variável
Assim, pelo menos intuitivamente, a dependente mas diferente número de variáveis
medida que aumenta o número de variáveis independentes, deve-se ter cautela na
X, VR deve diminuir ou não aumentar. interpretação de R2.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
10
Assim para comparar dois modelos com 2 VR /( n − k )
R =1 −
VT /( n − 1 )
números diferentes de variáveis explicativas é
conveniente levar em conta esta diferença. Onde k = número de parâmetros do
Para fazer isto define-se um coeficiente de modelo incluindo o intercepto. Esta medida é
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
n
(
∑ Y i −Ŷ i )2
n
Onde o numerador é a variância residual,
i =1
n −k
( n − 1 ) ∑ Y i −Ŷ i ( )2
11
Não--Tendenciosidade
Não Variância dos Estimadores
Os estimadores de mínimos quadrados Três fatores influenciam a variância dos
ordinários da regressão linear múltipla são estimadores
não-tendenciosos, isto é: E( β̂ ) = β Variância do erro
0 0
E( β̂1 ) = β1 Variação de Xi
E( β̂2 ) = β2
Grau de relação linear entre as
...
variáveis explicativas
E( β̂k ) = βk
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Teorema de Gauss-
Gauss-Markov
Todos os estimadores
Sob as hipóteses (H1) - (H5) os estimadores
de MQO são BLUE (Best Linear Unbiased Estimadores lineares
Estimadores não-tendenciosos
Estimators), isto é, são os melhores
estimadores, no sentido de possuírem menor MQO
variância (maior eficiência), dentro da classe
dos estimadores lineares e não-viesados..
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
12
Teorema
Inferência em modelos de regressão linear múltipla. Sob as hipóteses (H1) - (H6) e
Distribuição dos estimadores de MQO;
condicionalmente nos valores observados das
variáveis independentes.
Testes de hipóteses sobre um único parâmetro:
o teste t; β̂ j ~ N β j ,Var( β̂ j ) ( )
Intervalos de confiança; Logo
Testando restrições lineares nos parâmetros: o β̂ j − β j
~ N (0 ,1 )
teste F. Var( β̂ j )
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
σ̂ β̂ j
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
13
Solução
Redefina H0 da seguinte forma:
forma: O erro padrão da diferença dos dois
H0: β 1 - β 2 = 0
estimadores, será
será::
A estatística do teste será:
V( β̂1 − β̂2 ) = V( β̂1 ) + V( β̂2 ) − 2 Cov( β̂1 , β̂2 )
β̂ − β̂2
t n −k −1 = 1
σ̂ β̂1 − β̂2
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Propriedades assintóticas
Até o momento foram estudadas as
propriedades em amostras pequenas dos estimadores
de mínimos quadrados.
quadrados.
Consistência dos estimadores
Por exemplo, a propriedade de não não--
tendenciosidade dos estimadores de MQO vale para
Normalidade assintótica qualquer tamanho de amostra.
amostra.
Estas propriedades são conhecidas como
propriedades exatas dos estimadores.
estimadores.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Consistência
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
14
Consistência Definição
Normalidade
Teorema: sob as hipóteses de Gauss-
Teorema: Gauss-
^
^ Markov (H1 a H5) os estimadores de MQO
Teorema:
Teorema: sob as hipóteses (H1) - (H4), são assintoticamente normais onde:
onde:
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
15
Considere ainda que o efeito de X3 em Y, O que acontece quando variáveis
após a inclusão de X1 e X2 no modelo, seja relevantes não são incluídas no modelo?
nulo. Isto é:
Os estimadores serão viesados
β 3 = 0 ⇒ E( y| x 1 , x 2 , x 3 ) = E( y| x 1 , x 2 ) (tendenciosos)..
(tendenciosos)
E( y| x 1 , x 2 ) = β0 + β1 x 1 + β2 x 2 O viés é geralmente chamado de viés de
Mas na prática não se sabe a priori que variáveis omitidas.
omitidas.
β 3 = 0. O que acontecerá com os estimadores? Y = β0 + β1 X 1 + β2 X 2 + U
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
16
Isto é, todos os coeficientes são nulos, SQE /( k − 1 ) ( n − k ) SQE
F= = =
contra a alternativa de que nem todos são SQR /( n − k ) ( k − 1 ) SQR
( n − k ) SQE
simultaneamente nulos, determina-se: = =
( k − 1 )( SQT − SQE )
SQE /( k − 1 )
F= =
( n − k )( SQE / SQT )
=
SQR /( n − k ) ( k − 1 )[ 1 − ( SQE / SQT )]
A expressão tem uma distribuição F com ( n −k ) R 2 R 2 /( k − 1 )
= =
k - 1 e n - k graus de liberdade. ( k − 1 )( 1 − R 2 ) ( 1 − R 2 ) /( n − k )
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Onde:
SQE (SSoma dos Quadrados E xplicados)
SSR (SSoma dos Quadrados dos Resíduos) (ESS = Explained Sum of Squares)
(RSS = Residual Sum of Squares)
n 2
n n 2
VE = SQE = ∑ ( Ŷ i −Y )
VR = SQR = ∑ E i2 = ∑ ( Y i −Ŷ i ) i =1
i =1 i =1
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
n 2 n n 2
variam diretamente. Assim se R2 = 0, então F é
2
∑ ( Y i −Y ) = ∑( Y i −Ŷ i ) + ∑( Ŷ i −Y )
i =1 i =1 i =1 zero. Quanto maior o valor de R2 maior será o
valor de F. Desta forma o teste F que é de
SQT = SQR + SQE
G.L. ajuste do modelo também testa a significância
n -1 = (n - k - 1) + k
do coeficiente de determinação.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
17
Decidindo entre modelos competitivos
A decisão entre um modelo linear ou um O teste MWD foi proposto por
modelo log-linear (o lagaritmo do regressor é MacKinnon, White e Davidson e envolve as
uma função dos logaritmos dos regressores) é seguintes etapas:
uma questão básica na análise empírica. Para
Estimar o modelo linear e determinar os
testar:
valores Ŷ ;
H0: Modelo Linear;
Estimar o modelo log-linear e obter os
^
H1: Modelo Log-Linear. valores ln Y ;
Pode-se utilizar o teste MWD.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
^
Obtenha Z1 = ln Ŷ − ln Y ;
Fazer uma regressão de Y sobre os valores de X e Z
otidos como acima. Rejeitar H0 se o coeficiente de Z1 for
estatisticamente significativo através do teste t
tradicional;
^ )
Obter Z2 = ( anti ln ln Y − Y )
Regredir o ln de Y sobre os logaritmos de Xs e Z2.
Rejeitar H1 se o coeficiente de Z2 for significativo pelo
teste t.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
18
Três questões devem ser respondidas:
Qual o desvio mínimo em relação a uma
hipótese, para que isto faça diferença?
Como verificar se uma hipótese foi, de fato,
violada, numa situação específica?
Que correção adotar quando uma ou mais
hipóteses não forem verdadeiras?
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A existência da multicolinearidade
λ 1 X1 + λ 2 X2 + λ k Xk + V i = 0
pefeita torna os coeficientes da regressão
Onde o termo Vi é estocástico. indeterminados e seus erros padrão
O termo multicolinear como definido inclui infinitamente grandes. Se a
multicolinearidade não for alta (não perfeita)
apenas relacionamento linear mas isto não exclui
os coeficientes de regressão poderão ser
outras relações como por exemplo: X2 = X1.X1
determinados mas os erros padrão serão
grandes.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
19
Conseqüências da multicolinearidade
Percepção da multicolinearidade
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Índice de Condição
Pode-se adotar, então, a seguinte regra
O número de condição “k” é definido
empírica. Se k estiver entre 100 e 1000 existe
como: Autovalor Máximo
k = multicolinearidade de moderada a forte. Se
Autovalor Mínimo
estiver acima de 1000 a multicolinearidade é
O Índice de Condição (IC) é definido, grave. Da mesma pode-se utilizar o IC. Se ele
então, como: estiver entre 10 e 30 colinearidade moderada a
Autovalor Máximo
IC = = k
Autovalor Mínimo forte e acima de 30 grave.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
20
Uma hipótese importante do modelo
clássico de regressão linear é a de que a
variância de cada termo residual (Ui) é
constante e igual a σ2.
Homo (igual) scedasticidade (dispersão) ,
ou
E( U 2i ) = σ 2 i = 1, 2, ..., n
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
21
Neste caso, a variância do estimador será Neste caso o estimador MQO continua
dada por: 2 2 linear e não tendencioso, mas não será mais
∑( X i − X ) σ i de variância mínima.
V(b ) = 2
[ ∑( X i − X ) 2 ] Ele não é eficiente,
eficiente, pois não leva em
consideração a informação de que para cada x
Se σ 2i = σ 2 , então a expressão acima a variância de Y é diferente.
diferente. Para obter um
ficará reduzida ao caso usual. estimador eficiente é preciso fazer uso do
método dos MQG.
MQG.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
22
Se as variabilidades residuais Se as variabilidades residuais não forem
forem conhecidas então deve-se conhecidas pode-se adotar os seguintes
utilizar o Método dos Mínimos 1 procedimentos:
wi = 2
Quadrados Generalizados ou σi Variâncias e erros-padrão consistentes em
Ponderados, onde a ponderação é heteroscedasticidade segundo White;
dada por: Hipóteses plausíveis a respeito do padrão de
heteroscedasticidade;
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
A Natureza
O termo autocorrelação pode ser entendido
Qual a sua natureza? como a “correlação entre os termos de observações
Quais as conseqüências teóricas e no tempo” [séries temporais} ou “espaciais” [dados
de corte].
práticas?
No modelo clássico a suposição é de que:
Como corrigir o problema quando ele
E(UiUj) = 0 se i ≠ j
ocorre? Isto é, um dado resíduo “i” não é influenciado
por um outro dado resíduo “j”.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
23
Causas da Autocorrelação
Inércia ou rigidez. Séries como PNB, A oferta de produtos agrícolas reflete um
Índices de Preços, Produção, Emprego e fenômeno denominado de Teia de Aranha, em
Desemprego são cíclicas;
que a oferta reage ao preço como uma
Viés de especificação: variáveis excluídas.
defasagem de um período de tempo, pois as
Viés de especificação: forma funcional
incorreta; decisões relativas à oferta levam um certo
Defasagens. Em uma regressão de série temporal O que ocorre com os estimadores de MQO
do consumo sobre a renda, não é raro verificar
se E(UiUj) ≠ 0 (para i ≠ j) e as demais
que o consumo no período corrente depende,
entre outras coisas, do consumo no período hipóteses forem mantidas?
anterior; Neste caso os estimadores, a exemplo, do
Manipulações de dados. Dados trimestrais
caso heteroscedástico, são ainda lineares e não
agregados de médias de dados mensais;
tendeciosos.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
No entanto sua variância será afetada. Para isto será necessário utilizar
Neste caso eles não mais terão variância MQG – Mínimos Quadrados
mínima, isto é, eles não serão eficientes. Generalizados, que incorpora qualquer
Aqui, também, a exemplo da informação adicional que tivermos através
heteroscedasticidade pode-se encontrar um
da transformação das variáveis.
estimador que seja eficiente.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
24
Detectando a Autocorrelação
A autocorrelação é um problema
Método Gráfico. Representar
potencialmente sério e medidas corretivas graficamente os resíduos (Ut) e os
devem ser tomadas. Entretanto, resíduos padronizados (Ut/s);
inicialmente, é necessário, verificar se ela Teste das carreiras ou de Geary.
existe. Alguns testes para detectar a
O teste d de Durbin-Watson
autocorrelação.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Medidas Corretivas
Quando o autocorrelação não é conhecida.
Quando a estrutura da autocorrelação
Embora simples de aplicar a regressão de
é conhecida utilizar a transformação de diferença generalizada é geralmente difícil de
Prais-Winsten e a Equação de Diferença rodar, pois, na prática, poucas vezes se
Generalizada ou de Quase-Diferença. conhece o valor de ρ. Por isto foram criados
métodos alternativos.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
25
PARK, R. E. Estimation with Heteroscedastic Error BREUSCH, T., PAGAN, A. A Simple Test for
Terms. Econometrica. v. 34, n. 34, Out de 1966. p. Heteroscedasticity and Random Coefficient
888. Variation. Econometrica. v. 47, 1979. p. 1287-94.
GLEJSER, H. A New Test for Heteroscedasticity. GODFREY, L. Testing for Multiplicative
Journal of the American Statistical Association. v. Heteroscedasticity. Jornal of Econometrics. v. 8,
64, 1969. p. 316-23. 1978. p. 227-36.
GOLDFELD, S. M., QUANDT, R. E. Nonlinear WHITE, H. A Heteroscedasticity Consistent
Methods of Econometrics. Amesterdã: North- Covariance Matrix Estimator and a Direct Test of
Holland, 1972. Heteroscedasticity. Econometrica. v. 48, 1980. p. 817-
18.
Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Curso: Engenharia de Processos e de Sistemas de Produção - Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
26