Beruflich Dokumente
Kultur Dokumente
Generalizados
g(µi ) = ηi , i = 1, · · · , n (2)
η = Xβ,
X = (x1 , · · · , xp ),
n
X p
X p
X n
X n
X
L(β; y) = φ[yi xij βj − b( xij βj )] + φ c(yi ) + a(yi , φ)
i=1 j=1 j=1 i=1 i=1
n
X
onde Sj = φ yi xij .
i=1
Logaritmo: η = log µ.
Normal : n
X
D(y; µ̂) = (yi − µ̂i )2 ,
i=1
Binomial :
n h y 1 − yi i
i ni
X
D(y; µ̂) = 2 yi log + (ni − yi ) log .
ni µ̂i 1 − µ̂i
i=1
Gama :
n y (y − µ̂ )
i i i
X
D(y; µ̂) = 2 − log + .
µ̂i µ̂i
i=1
Poisson :
n h y i
i
X
D(y; µ̂) = 2 yi log − (yi − µ̂i ) .
µ̂i
i=1
Normal Inversa :
n
X (yi − µ̂i )2
D(y; µ̂) = 2 .
i=1
yi µ̂i
Aula - Modelos Lineares Generalizados – p. 16/??
Um valor pequeno para a função desvio indica que, para
um menor número de parâmetros, obtém-se um ajuste tão
bom quanto o ajuste com o modelo saturado.
∂L(β; y) > 1
− 12
U (β) = = φX W V (y − µ),
2
∂β
e
∂ 2 L(β; y) o
n
>
K(β) = E − >
= φX W X,
∂β∂β
Aula - Modelos Lineares Generalizados – p. 22/??
Estimação dos parâmetros
dµi
V = diag(V1 , . . . , Vn ), com Vi = .
dθi
Para a obtenção da estimativa de máxima verossimilhança de
β utilizamos o processo iterativo de Newton-Raphson, que
pode ser reescrito como um processo iterativo de mínimos
quadrados reponderados dado por
1 1
m = 0, 1, · · ·, onde z = η − −
+ W V 2 (y
2 − µ).
onde K(β)
Σ(β) = lim ,
n→∞ n
P
sendo (β) uma matriz positiva definida e
√ d
n(φ̂ − φ) −→ N 0, Σ−1
(
φ) , conforme n −→ ∞,
2
Pn 00
em que σ(φ) = limn→∞ −n{ i=1 c (yi , φ)}−1 .
Objetivos principais:
1) Verificar se há afastamentos sérios das suposições feitas
para o modelo.
em que
√
d(yi ; µ̂i ) = sinal(yi − µ̂i ) 2{yi (θ̂i0 − θ̂i ) + (b(θ̂i ) − b(θ̂i0 ))}1/2 .
William (1984) verificou que a distribuição tDi está mais
próxima da normal. Assim, para grandes amostras, são
considerados marginalmente aberrantes pontos tais que
|tDi | > 2
Aula - Modelos Lineares Generalizados – p. 34/??
Gráficos
attach(doenca.dat)
anos=doenca.dat$anos
suc=doenca.dat$suc
total=doenca.dat$total
prop=suc/total
plot(anos,prop,xlab="Anos de Exposição",
ylab="Proporção de casos")
lines(anos,prop)
Aula - Modelos Lineares Generalizados – p. 40/??
Diagrama de Dispersão dos dados de doenças no pulmão
0.4
Proporção de casos
0.3
0.2
0.1
0.0
10 20 30 40 50
Anos de Exposição
predict(fit)
fitted(fit)
Aula - Modelos Lineares Generalizados – p. 42/??
Xmat=cbind(suc,total-suc)
fit=glm(Xmat˜anos,family=binomial())
summary(fit)
Call:
glm(formula = Xmat ˜ anos, family = binomial())
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6625 -0.5746 -0.2802 0.3237 1.4852
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -4.79648 0.56859 -8.436 < 2e-16 ***
anos 0.09346 0.01543 6.059 1.37e-09 ***
--- Aula - Modelos Lineares Generalizados – p. 43/??
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’
π(xi ))
η̂(xi + 1) − η̂(xi ) = β̂1 chance(xi ) :
(1 − π(xi ))
chance(xi +1)
Razão de chances : ψ = chance(xi )
Deviance Residuals:
Min 1Q Median 3Q Max
-1.3106 -1.0114 -0.7003 0.4031 1.8813
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.71995 0.55770 -3.084 0.00204 **
x 0.13065 0.02433 5.370 7.88e-08 ***
---
Signif. codes: 0 ’***’ 0.001 ’**’ 0.01 ’*’ 0.05 ’.’
Model 1: y ˜ 1
Model 2: y ˜ x
Resid. Df Resid. Dev Df Deviance P(>|Chi|)
1 14 44.167
2 13 14.935 1 29.233 6.419e-08
14
0.8
0.6
h
0.4
0.2
2 4 6 8 10 12 14
Índice
2
1
0
−1
−2
−1 0 1
Percentis da N(0,1)
2
Componente do desvio
1
0
−1
2 4 6 8 10 12 14
Índice
12
10
Distância de Cook
8
6
4
2
0
2 4 6 8 10 12 14
Índice