Beruflich Dokumente
Kultur Dokumente
Departamento Estatı́stica-IMECC
Universidade Estadual de Campinas
Campinas, São Paulo, Brasil
1) Regressão vs Causação
Uma relação estatística por sí propria não implica uma
causação
Para atribuir causação, devemos invocar a alguma
teoría (p.e. econômica)
2) Regressão (AR) vs Correlação (AC)
E(Y |X = x) = µY |x = β0 + β1 x
E(Y |X = x) = µY |x = β0 + β1 x
E(Y |X = x) = µY |x = β0 + β1 x
Y = β0 + β1 X1 + . . . + βk Xk + ε,
Y = β0 + β1 X1 + . . . + βk Xk + ε,
i=1
β̂1 = P
n
2 .
n
P xi
x2i − i=1
n
i=1
P
n
x
P
n
y
i i
onde x̄ = i=1
n
e ȳ = i=1
n
.
P
n
2
X
n X
n
i=1
xi X
n
Sxx = (xi − x̄)2 = x2i − = x2i − nx̄2 ,
n
i=1 i=1 i=1
P
n
P
n
X
n X
n X
n x
i=1
y
i
i=1
i
Sxy = (xi − x̄)(yi − ȳ) = (xi − x̄)yi = xi yi −
i=1 i=1 i=1
n
Xn
= xi yi − nx̄ȳ,
P 2
i=1
n
X
n X
n X
n
i=1
yi
X
n
Syy = (yi − ȳ)2 = (yi − ȳ)yi = yi2 − = yi2 − nȳ 2 .
i=1 i=1 i=1
n i=1
ǫi é zero
O valor médio do resíduo b
ǫi são não correlacionados com Xi e Ybi .
Os residuos b
n = 20
X
n
xi = 907 + 926 + . . . + 621 = 14.623; x̄ = 731, 15
i=1
Xn
yi = 11, 20 + 11, 05 + . . . + 7, 41 = 176, 11; ȳ = 8, 8055
i=1
Xn
x2i = (907)2 + (926)2 + . . . + (621)2 = 11.306.209
i=1
Xn
yi2 = (11, 20)2 + (11, 05)2 + . . . + (7, 41)2 = 1.602, 0971
i=1
X
n
xi yi = (907)(11, 20) + (11, 05)(926) . . . + (7, 41)(621) = 134.127, 90
i=1
Sxy 5.365, 08
β̂1 = = = 0, 00873; β̂0 = ȳ−β̂1 x̄ = 8, 8055−(0, 00873)(731, 15) = 2, 423
Sxx 614.603
ŷ = 2, 423 + 0, 00873x.
9
8
7
6
Numero de clientes
Regressão Linear Simples – p. 17/6
Suponha que tem-se interesse em prever as vendas
semanais para um supermercado com 600 clientes.
No modelo de regressão ajustado basta substituir
X = 600, ísto é,
σ 2 x̄
Cov(β̂0 , β̂1 ) = − Sxx
Exercicio 2.
Os resíduos,
ei = yi − ŷi
são empregados na estimação de σ 2 . A soma de
quadrados residuais ou soma de quadrados dos erros,
denotado por SQR é:
n
X n
X
SQR = e2i = (yi − ŷi )2
i=1 i=1
E(SQR) = (n − 2)σ 2
Regressão Linear Simples – p. 21/6
Portanto, um estimador não viciado de σ 2 , é
ˆ2
SQR
σ = = QM R (Quadrado médio residual),
n−2
Uma fórmula mais conveniente para o cálculo da SQR é
dada por:
SQR = Syy − β̂1 Sxy .
A estimativa de σ 2 para o exemplo 1.
ˆ2
SQR Syy − β̂1 Sxy
σ = =
n−2 n−2
51, 3605 − (0, 00873)(5.365, 08)
= = 0, 2513.
20 − 2 Regressão Linear Simples – p. 22/6
Previsão
2
SQM SQR 2 SQM s xy
1 = + ⇒r = =
SQT SQT SQT sxx syy
σ 2 /σ 2 ∼ χ2 (n − 2)
(n − 1)b
A distribuição de βb0 e βb1 é independente de σ
b2
(Exercicio 5.)
βb0 e βb1 têm variância mínima dentro de toda classe dos
estimadores não viesados, sejam ou não lineares (Rao)
H0 : β1 = β1,0 , vs H1 : β1 6= β1,0
A estatística
β̂1 − β1,0
T =p ,
2
σ̂ /Sxx
tem distribuição t-Student com n − 2 graus de liberdade
sob H0 : β1 = β1,0 . Rejeita-se H0 se
H0 : β0 = β0,0 , vs H1 : β0 6= β0,0
A estatística
β̂0 − β0,0
T =q
x̄2
σ̂ 2 [ n1 + Sxx
]
H0 : β1 = 0, vs H1 : β1 6= 0,
β̂1 0, 00873
Tobs = p =p = 13, 65.
σ̂ 2 /Sxx 0, 2513/614.603
SQM/1 QM reg
F = = ∼ F (1, n − 2),
SQR/(n − 2) QM R
s
p 1 x̄2
(β̂1 − β1 )/ QM R/Sxx e (β̂0 − β0 )/ QM R[ + ]
n Sxx
s
1 x̄2
IC(β0 ; 1 − α) = β̂0 − t α2 , n−2 QM R[ + ]
n Sxx
s !
1 x̄2
β̂0 + t α2 , n−2 QM R[ + ]
n Sxx
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − E; µ̂Y |xo + E
q
(x0 −x̄)2
onde E = t α
2
, n−2 QM R[ n1 + Sxx
]
Exemplo: Suponha que tem-se interesse em construir um
intervalo de 95% de confiança da venda, média, semanal
para todos supermercados com 600 clientes.
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − E; µ̂Y |xo + E
q
(x0 −x̄)2
onde E = t α
2
, n−2 QM R[ n1 + Sxx
]
Exemplo: Suponha que tem-se interesse em construir um
intervalo de 95% de confiança da venda, média, semanal
para todos supermercados com 600 clientes.
No modelo ajustado µ̂Y |x0 = 2, 423 + 0, 00873x0 . Para
x0 = 600, obtém-se µ̂Y |x0 = 7, 661.
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − E; µ̂Y |xo + E
q
(x0 −x̄)2
onde E = t α
2
, n−2 QM R[ n1 + Sxx
]
Exemplo: Suponha que tem-se interesse em construir um
intervalo de 95% de confiança da venda, média, semanal
para todos supermercados com 600 clientes.
No modelo ajustado µ̂Y |x0 = 2, 423 + 0, 00873x0 . Para
x0 = 600, obtém-se µ̂Y |x0 = 7, 661. Também,
x̄ = 731, 15, QM R = 0, 2513, Sxx = 614.603, n = 20
e 1 − α = 0, 95 ⇒ t0,05,18 = 2, 101.
IC(µ̂Y |x ; 1 − α) = µ̂Y |xo − E; µ̂Y |xo + E
q
(x0 −x̄)2
onde E = t α
2
, n−2 QM R[ n1 + Sxx
]
Exemplo: Suponha que tem-se interesse em construir um
intervalo de 95% de confiança da venda, média, semanal
para todos supermercados com 600 clientes.
No modelo ajustado µ̂Y |x0 = 2, 423 + 0, 00873x0 . Para
x0 = 600, obtém-se µ̂Y |x0 = 7, 661. Também,
x̄ = 731, 15, QM R = 0, 2513, Sxx = 614.603, n = 20
e 1 − α = 0, 95 ⇒ t0,05,18 = 2, 101.
q
1 (600−731,15)2
E = 2, 101 0, 2513[ 20 + 614.603 ] = 0, 292
Regressão Linear Simples – p. 40/6
IC(µY |x0 ; 0, 95) = (7, 661 − 0, 292; 7, 661 + 0, 292)
= (7, 369; 7, 935)
IC(Y0 ; 1 − α) = (Ŷ − E; Ŷ + E)
q
1 (x0 −x̄)2
onde E = t 2 , n−2 QM R[1 + n + Sxx ]
α
Análise residual,
Análise residual,
Coeficiente de determinação
Análise residual,
Coeficiente de determinação
Análise residual,
Coeficiente de determinação
Análise residual,
Coeficiente de determinação
onde β0 = µ2 − µ1 ρ σσ21 , β1 = σ2
σ1
ρ e σY2 |x = σ22 (1 − ρ2 )
β̂0 = Ȳ − β̂1 X̄
β̂0 = Ȳ − β̂1 X̄
Pn Y (X −X̄)
β̂1 = Pi=1
n
i i
(Xi −X̄)2
= SXY
SXX
i=1
β̂0 = Ȳ − β̂1 X̄
Pn Y (X −X̄)
β̂1 = Pi=1
n
i i
(Xi −X̄)2
= SXY
SXX
i=1
P
n
Y (X −X̄)
i i
ρ̂ = r = s P
n
i=1
P
n
= √ SXY
SXX SY Y
(X −X̄)2i (Y −Ȳ )2 i
i=1 i=1
β̂0 = Ȳ − β̂1 X̄
Pn Y (X −X̄)
β̂1 = Pi=1
n
i i
(Xi −X̄)2
= SXY
SXX
i=1
P
n
Y (X −X̄)
i i
ρ̂ = r = s P
n P
n
i=1
= √ SXY
SXX SY Y
(X −X̄)2 (Y −Ȳ )2
i i
i=1 i=1
1/2
SY Y
β̂1 = SXX
r
H0 : ρ = 0 vs H1 : ρ 6= 0
A estatística de teste apropriada é
√
r n−2 ∼
T = √ sob H0 t(n − 2)
1−r 2
H0 : ρ = 0 vs H1 : ρ 6= 0
A estatística de teste apropriada é
√
r n−2 ∼
T = √ sob H0 t(n − 2)
1−r 2
SXY 8, 6437
r=√ =p = 0, 883.
SXX SY Y (11, 4594)(8, 3522)
Regressão Linear Simples – p. 59/6
H0 : ρ = 0 (não relação linear entre X e Y )
H1 : ρ 6= 0 (há relação linear entre X e Y )