Beruflich Dokumente
Kultur Dokumente
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
210 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
211 / 429
A ANOVA a um Factor
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
212 / 429
As n observaes
Para estudar os efeitos dum factor, com k nveis, sobre uma varivel
resposta Y , admitimos que temos n observaes independentes de
Y , sendo ni (i = 1, ..., k) correspondentes ao nvel i do factor. Logo,
n1 + n2 + + nk = n .
Embora fosse possvel continuar a indexar as n observaes de Y
com um nico ndice, variando de 1 a n (como se fez na Regresso),
prefervel utilizar dois ndices para indexar as observaes de Y :
um para indicar o nvel do factor a que a observao corresponde;
outro para distinguir cada observao dentro de um dado nvel.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
213 / 429
As n observaes (cont.)
( = nc ) ,
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
214 / 429
A modelao de Y
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
215 / 429
A modelao de Y (cont.)
Para poder enquadrar a ANOVA na teoria j estudada, conveniente
re-escrever as mdias de nvel na forma:
E [Yij ] = i = + i .
O parmetro comum a todas as observaes, enquanto os
parmetros i so especficos para cada nvel (i) do factor.
Cada i designado o efeito do nvel i.
Admite-se ainda que Yij oscila aleatoriamente em torno do seu valor
mdio:
Yij = + i + ij ,
com E [ij ] = 0.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
216 / 429
Estatstica e Delineamento
2010-11
217 / 429
As variveis indicatrizes
Por exemplo, se se fizerem n = 9 observaes, com n1 = 3
observaes no primeiro nvel do factor, n2 = 4 no segundo nvel e
n3 = 2 observaes no terceiro nvel, as variveis I2 e I3 sero:
I2 =
J. Cadima (ISA)
0
0
0
1
1
1
1
0
0
I3 =
Estatstica e Delineamento
0
0
0
0
0
0
0
1
1
2010-11
218 / 429
Y11
Y12
Y13
Y21
Y22
Y23
Y24
Y31
Y32
J. Cadima (ISA)
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
11
12
13
21
22
23
24
31
32
1
+
2
Estatstica e Delineamento
2010-11
219 / 429
Estatstica e Delineamento
2010-11
220 / 429
Y11
Y12
Y13
Y21
Y22
Y23
Y24
Y31
Y32
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
2 +
11
12
13
21
22
23
24
31
32
E [Y3j ] = 1 + 3
j = 1, ..., n2
j = 1, ..., n3
Estatstica e Delineamento
2010-11
221 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
222 / 429
a1
...
a
1
a +a
2
1
...
a +a
1
2
a1 1n + a2 I2 + a3 I3 + ... + ak Ik = a1 + a3
...
a1 + a3
(...)
a1 + ak
...
a1 + ak
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
223 / 429
= (Xt X)1 Xt Y .
Devido natureza das colunas da matriz X, tem-se:
n n2 n3 n4 nk
n2 n2 0 0 0
n3 0 n3 0 0
t
XX = n
4 0 0 n4 0
.
.
.. . .
..
..
..
. ..
.
.
.
nk
J. Cadima (ISA)
Estatstica e Delineamento
nk
2010-11
224 / 429
Xt X
1
=
n1
1
1
1
1
..
.
1
1
1
1
1
..
.
1
n1 +n3
n3
ni
Yij
ki=1 j=1
n2
j=1 Y2j
n3
Y3j
j=1
..
.
nk
j=1 Ykj
n1 +n2
n2
t
XY =
J. Cadima (ISA)
1
..
.
1
Estatstica e Delineamento
1
1
1
n1 +n4
n4
..
.
1
..
.
1
1
1
1
..
.
n1 +nk
nk
2010-11
225 / 429
1
2
..
.
onde Y i =
1
ni
= Y 1
= Y 2 Y 1
=
..
.
Y 3 Y 1
..
.
= Y k Y 1
ni
j=1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
226 / 429
1
2
3
..
.
k
= Y 1
= Y 2
=
..
.
Y 3
..
.
= Y k
Estatstica e Delineamento
2010-11
227 / 429
i = 1, ..., k ,
j = 1, ..., ni ,
com E [ij ] = 0 e 1 = 0.
Admite-se ainda que os erros aleatrios ij tm as mesmas
propriedades que no modelo de regresso linear: Normais, de
varincia constante e independentes.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
228 / 429
Yij = 1 + i + ij ,
2)
i = 1, ..., k ,
ij N (0 ,
{ij }ni=1 v.a.s independentes.
j = 1, ..., ni
(1 = 0).
= (1 , 2 , 3 , , k )t .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
229 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
230 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
231 / 429
2 = 3 = ... = k = 0 .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
232 / 429
Os resduos e SQRE
ij = i = Y i , pelo que o resduo da
Viu-se antes (acetato 227) que Y
observao Yij dado por:
ij = Yij Y i ,
Eij = Yij Y
Logo, a Soma de Quadrados dos Resduos dada por:
k
SQRE =
ni
i=1 j=1
onde Si2 =
1
ni 1
Yij Y i
2
(ni 1) Si2 ,
i=1
ni
j=1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
233 / 429
SQF
ni
i=1 j=1
k
sendo Y =
SQF
ni
i=1
1
n
2
ij Y
=
Y
Y i Y
ni
i=1 j=1
Y i Y
2
2
ni
i=1 j=1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
234 / 429
ni
(Yij Y )2 =
i=1 j=1
SQF
k
ni (Y i Y )2 +
i=1
SQRE
k
(ni 1) Si2 .
i=1
onde:
SQT numerador da varincia amostral SY2 da totalidade das
n observaes de Y ;
SQF medida da variabilidade das k mdias de nvel
(variabilidade inter-nveis);
SQRE soma ponderada das varincias amostrais de Y em
cada um dos k nveis (variabilidade intra-nveis).
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
235 / 429
Os graus de liberdade
g.l.
k 1
nk
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
236 / 429
Fonte
g.l.
SQ
k
k 1
SQF = ni (y i y )2
Resduos
nk
Total
n1
SQT = (n 1) sy2
Factor
J. Cadima (ISA)
QM
QMF =
i=1
QMRE =
i=1
Estatstica e Delineamento
fcalc
SQF
k 1
QMF
QMRE
SQRE
nk
2010-11
237 / 429
QMF
QMRE
F(k 1,nk )
se H0 .
0.4
0.3
0.2
0.0
0.1
df(x, 4, 16)
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
238 / 429
ANOVAs a um Factor no
Para efectuar uma ANOVA a um Factor no
, convm organizar os
dados numa data.frame com duas colunas:
1
, Adubo k))
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
239 / 429
ANOVAs a um Factor no
(cont.)
As frmulas utilizadas no
para indicar as ANOVAs pretendidas
so semelhantes s usadas na regresso linear, admitindo a
indicao de nomes de factores.
Por exemplo, se pretendemos efectuar uma ANOVA de comprimentos
das ptalas sobre espcies, nos dados relativos aos n = 150 lrios, a
frmula :
Petal.Length
Species
uma vez que a data frame iris contm uma coluna de nome Species
que foi definida como factor.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
240 / 429
ANOVAs a um factor no
(cont.)
Species Residuals
Sum of Squares 437.1028
27.2226
Deg. of Freedom
2
147
Residual standard error: 0.4303345
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
241 / 429
ANOVAs a um factor no
(cont.)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
242 / 429
Os parmetros estimados, no
Para obter as estimativas dos parmetros 1 , 2 , 3 , ..., k , pode
aplicar-se a funo coef ao resultado da ANOVA.
No exemplo dos lrios, temos:
> coef(iris.aov)
(Intercept) Speciesversicolor
1.462
2.798
Speciesvirginica
4.090
Estatstica e Delineamento
2010-11
243 / 429
Parmetros estimados no
(cont.)
virginica
5.552
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
244 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
245 / 429
A explorao ulterior de H1
A Hiptese Nula, no teste F numa ANOVA a 1 Factor, afirma que
todos os nveis do factor tm efeito nulo, isto , que a mdia da
varivel resposta Y igual nos k nveis do Factor:
2 = 3 = ... = k = 0
1 = 2 = 3 = = k
A Hiptese Alternativa diz que pelo menos um dos nveis do factor tem
uma mdia de Y diferente do primeiro nvel:
i =
6 0
6 i
tal que 1 =
tal que
(i > 1)
(i > 1)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
246 / 429
A explorao ulterior de H1
(cont.)
1 = 2 6= 3
1 = 3 6= 2
1 6= 2 = 3
i todos diferentes
i.e., 2 = 0 ; 3 6= 0
i.e., 3 = 0 ; 2 6= 0
i.e., 2 = 3 6= 0;
i.e., 2 6= 3 e 2 , 3 6= 0.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
247 / 429
A explorao ulterior de H1
(cont.)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
248 / 429
As comparaes mltiplas
possvel construir testes de hipteses relativos a todas as diferenas
i j , definidas pelas mdias populacionais de Y nos nveis i, j de
um factor (i, j = 1, ..., k, com i 6= j), controlando o nvel de significncia
global do conjunto dos testes. Tais testes chamam-se testes de
comparaes mltiplas de mdias.
O nvel de significncia nos testes de comparao mltipla a
probabilidade de rejeitar qualquer das hipteses i = j , caso ela seja
verdade, ou seja, um nvel de significncia global.
O mais usado desses testes o teste de Tukey.
Alternativamente, podem-se construir intervalos de confiana para
cada diferena i j , com um nvel (1 ) 100% de confiana de
que os verdadeiros valores de i j pertencem a todos os intervalos.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
249 / 429
2
SW
2
W
2 .
Sejam Sw e Rw independentes.
W
Ento, a amplitude Studentizada, R
SW , tem a distribuio de Tukey, que
depende de dois parmetros: k e .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
250 / 429
(1 = 0) ,
= i
Y i N
J. Cadima (ISA)
2
i ,
ni
1
ni
ni
j=1
Y i i N
Estatstica e Delineamento
2
0,
ni
2010-11
251 / 429
SQRE
QMRE /nc
2
=
nk
,
2
/nc
2
Estatstica e Delineamento
2010-11
252 / 429
Assim,
R
=
S
max(Y i i ) min(Y j j )
j
i
q
QMRE
nc
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
253 / 429
J. Cadima (ISA)
QMRE
nc
Estatstica e Delineamento
2010-11
254 / 429
q
y i y j + q (k ,nk ) QMRE
nc
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
255 / 429
i, j
QMRE
nc
Estatstica e Delineamento
2010-11
256 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
257 / 429
(cont.)
Neste exemplo, nenhum dos intervalos inclui o valor zero, pelo que
consideramos que i 6= j , para qualquer i 6= j, ou seja, todas as
mdias de espcie so diferentes.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
258 / 429
(cont.)
Estatstica e Delineamento
2010-11
259 / 429
virginicaversicolor virginicasetosa
versicolorsetosa
0.8
0.6
0.4
0.2
0.0
0.2
0.4
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
260 / 429
Delineamentos no equilibrados
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
261 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
262 / 429
1.0
Residuals vs Fitted
16
0.0
0.5
1.0
Residuals
0.5
118
42
2.8
2.9
3.0
3.1
3.2
3.3
3.4
Fitted values
aov(Sepal.Width ~ Species)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
263 / 429
t.q.
i2 6= i2 ,
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
264 / 429
MA =
p i i .
i=1
MG =
ip
i=1
Estatstica e Delineamento
2010-11
265 / 429
MA
(4)
1 = 2 = = k .
Quanto maior fr a disperso dos , maior ser a diferena entre
mdia geomtrica e mdia aritmtica.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
266 / 429
O nosso contexto
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
267 / 429
1
ni 1
ni
j=1
Yij Y i
2
n 1
ni 1
= i
,
(n
1)
nk
i i
MA =
i=1
J. Cadima (ISA)
ni 1 2
Si =
nk
ni
(Yij Y i )2
i=1 j=1
nk
Estatstica e Delineamento
= QMRE .
2010-11
268 / 429
MG =
(Si2 )
ni 1
nk
i=1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
269 / 429
O teste de Bartlett
Bartlett demonstrou que, sob H0 , uma transformao montona
crescente do quociente MA/MG tem distribuio assintoticamente 2 ,
caso as variveis subjacentes s varincias tenham distribuio
Normal. Concretamente, demonstrou que
MA
nk
nk
ln
(ln MA ln MG) ,
=
K =
C
MG
C
tem, assintoticamente distribuio k21 , sendo
1
C = 1+
3(k 1)
J. Cadima (ISA)
"
i=1
1
1
ni 1 n k
Estatstica e Delineamento
2010-11
270 / 429
O Teste de Bartlett
Teste de Bartlett homogeneidade de varincias
Hipteses: H0 : 12 = 22 = ... = k2
vs.
[Varincias homogneas]
H1 : i, i t.q. i2 6= i2
[Var. heterogneas]
Estatstica do Teste:
k
K =
onde C = 1 +
i=1
C
1
3(k 1)
i=1
1
ni 1
1
nk
k21
Estatstica e Delineamento
2010-11
271 / 429
O Teste de Bartlett no
No
, o teste de Bartlett invocado pelo comando bartlett.test,
tendo por argumento uma frmula (anloga usada no comando aov
para indicar a varivel resposta e o factor). E.g.,
> bartlett.test(Sepal.Width ~ Species, data=iris)
Bartlett test of homogeneity of variances
data: Sepal.Width by Species
Bartletts K-squared = 2.0911, df = 2, p-value = 0.3515
Neste caso, o teste de Bartlett indica a no rejeio de H0 , ou seja,
admissvel a hiptese de igualdade nas varincias em cada nvel do
factor.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
272 / 429
Precaues
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
273 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
274 / 429
Uma advertncia
Na formulao clssica do modelo ANOVA a um Factor, e a partir da
equao-base
Yij = + i + ij ,
em vez de impor a condio 1 = 0, impe-se a condio i i = 0.
Esta condio alternativa:
muda a forma de interpretar os parmetros ( agora uma
espcie de mdia geral das observaes e i o desvio mdio das
observaes do nvel i em relao a essa mdia geral);
Muda os estimadores dos parmetros.
No muda o resultado do teste F existncia de efeitos do factor,
nem a qualidade global do ajustamento.
A nossa formulao, alm de generalizvel a modelos com mais
Factores, permite aproveitar directamente os resultados da
Regresso Linear Mltipla.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
275 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
276 / 429
numa ANOVA
heterogeneidade no controlada nas unidades experimentais contribui
para esconder a presena de eventuais efeitos do factor.
Estatstica e Delineamento
2010-11
277 / 429
Controlar a heterogeneidade
Na prtica, frequentemente impossvel controlar totalmente todos os
factores que afectam as unidades experimentais.
A natural variabilidade de plantes, animais, terrenos, localidades
geogrficas, clulas, etc. significa que em muitas situaes existir
variabilidade indesejada entre unidades experimentais.
Alguma proteco contra efeitos no controlados resulta dos
princpios de:
repetio;
casualizao.
Deve-se associar nveis do factor s unidades experimentais de forma
aleatria (casualizada).
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
278 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
279 / 429
Um exemplo
Pretende-se analisar o rendimento de 5 diferentes variedades de trigo.
Os rendimentos so tambm afectados pelos tipo de solos usados.
Nem sempre possvel ter terrenos homogneos numa experincia.
Mesmo que seja possvel, pode no ser desejvel, por se limitar a
validade dos resultados a um nico tipo de solos.
Admita-se que existem terrenos com quatro diferentes tipos de solos.
Cada terreno pode ser dividido em cinco parcelas viveis para o trigo.
Em vez de repartir aleatoriamente as 5 variedades pelas 20 parcelas,
prefervel forar cada tipo de terreno a conter uma parcela com cada
variedade. Apenas dentro dos terrenos haver casualizao.
Num delineamento experimental deste tipo, os terrenos designam-se
blocos casualizados.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
280 / 429
Um exemplo (cont.)
A situao descrita no acetato anterior a seguinte:
Bloco 1 (Solo 1)
Var.1
Var.3
Var.4
Var.5
Var.2
Bloco 2 (Solo 2)
Var.4
Var.3
Var.5
Var.1
Var.2
Bloco 3 (Solo 3)
Var.2
Var.4
Var.1
Var.3
Var.5
Bloco 4 (Solo 4)
Var.5
Var.2
Var.4
Var.1
Var.3
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
281 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
282 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
283 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
284 / 429
nij
= n.
i=1 j=1
i, j ,
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
285 / 429
A modelao de Y
ij
+ i + j .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
286 / 429
A modelao de Y (cont.)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
287 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
288 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
289 / 429
X=
1
1
.
.
.
.
.
.
1
.
.
.
.
.
.
1
1
1n
1
1
1
.
.
.
1
1
0
0
0
.
.
.
0
0
.
.
.
0
.
.
.
0
0
IA
0
0
0
.
.
.
0
0
1
1
1
.
.
.
1
1
.
.
.
0
.
.
.
0
0
IA
...
...
...
0
1
0
0
1
0
0
0
1
.
.
.
.
.
.
.
.
.
.
.
.
...
0
0
0
...
0
0
0
...
0
1
0
...
0
1
0
...
0
1
0
.
.
.
.
.
.
.
.
.
.
.
.
...
0
0
0
...
0
0
0
.
.
.
.
.
.
.
.
.
.
.
.
...
1
1
0
.
.
.
.
.
.
.
.
.
.
.
.
...
1
0
0
...
1
0
0
IB
...
IAa
1
...
...
...
.
.
.
...
...
...
...
...
.
.
.
...
...
.
.
...
.
.
.
...
...
IB
0
0
0
.
.
.
1
1
0
0
0
.
.
.
1
1
.
.
.
0
.
.
.
1
1
...
IB
Estatstica e Delineamento
2010-11
290 / 429
1 = 0
1 = 0 .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
291 / 429
X=
J. Cadima (ISA)
1
1
.
.
.
.
.
.
1
.
.
.
.
.
.
1
1
1n
0
0
0
.
.
.
0
0
1
1
1
.
.
.
1
1
.
.
.
0
.
.
.
0
0
IA
...
...
...
..
.
...
...
...
...
...
.
.
.
...
...
.
.
...
.
.
.
...
...
...
0
0
...
0
0
0
...
0
0
1
...
0
.
.
.
.
.
.
.
.
.
.
.
.
0
0
...
1
0
0
...
1
0
0
...
0
0
0
...
0
0
0
...
0
.
.
.
.
.
.
.
.
.
.
.
.
0
0
...
1
0
0
...
1
.
.
.
.
.
.
.
.
.
.
.
.
1
0
...
0
.
.
.
.
.
.
.
.
.
.
.
.
1
0
...
1
1
0
...
1
...
IB
IB
IAa
b
2
Estatstica e Delineamento
2010-11
292 / 429
A natureza do parmetro
E [Y11k ] =
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
293 / 429
E [Yi1k ] = 11 + i
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
294 / 429
E [Y1jk ] = 11 + j
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
295 / 429
E [Yijk ] = 11 + i + j .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
296 / 429
2
3
Yijk = 11 + i + j + ijk ,
(1 = 0; 1 = 0).
ijk N (0 , 2 ), i, j, k
{ijk }i,j,k v.a.s independentes.
11 ;
os a1 acrscimos i (i > 1); e
os b1 acrscimos j (j > 1).
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
297 / 429
J. Cadima (ISA)
i = 2, ..., a ; e
j = 2, ..., b.
Estatstica e Delineamento
2010-11
298 / 429
j = 2, ..., b
vs.
H1 : j
tal que j 6= 0 .
Yijk = 11 + i + j + ijk ,
Yijk = 11 + i + ijk ,
Estatstica e Delineamento
2010-11
299 / 429
i = 2, ..., a
vs.
H1 : i
tal que i 6= 0 ,
Yijk = 11 + i + j + ijk ,
Yijk = 11 + j + ijk ,
Estatstica e Delineamento
2010-11
300 / 429
J. Cadima (ISA)
(Efeitos Factor A)
(Efeitos Factor B)
Estatstica e Delineamento
SQREB SQREA+B
a1
SQREA+B
n(a+b1)
SQREA SQREA+B
b1
SQREA+B
n(a+b1)
2010-11
301 / 429
1
b nc
nc
Yijk
j=1 k =1
1
a nc
nc
Yijk
i=1 k =1
1
n
nc
Yijk .
i=1 j=1 k =1
tem-se:
11 = Y 1 + Y 1 Y
i = Y i Y 1
j = Y j Y 1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
302 / 429
11 +
i + j
Y i + Y j Y
i, j, k
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
303 / 429
SQT
nc
i=1 j=1 k =1
a
SQF
nc
i=1 j=1 k =1
a
SQRE =
nc
i=1 j=1 k =1
J. Cadima (ISA)
Yijk Y
2
2
ijk Y
Y
2
ijk
Yijk Y
Estatstica e Delineamento
2010-11
304 / 429
SQFA+B =
nc
i=1 j=1 k =1
a
nc
i=1 j=1
(Y i + Y j Y ) Y
2
(Y i Y ) + (Y j Y )
= b nc (Y i Y )2
i=1
J. Cadima (ISA)
2
{z
= SQA
Estatstica e Delineamento
a nc (Y j Y )2
j=1
{z
= SQB
2010-11
305 / 429
SQA
+ SQB} + SQREA+B
{z
|
=SQFA+B
As Somas de Quadrados
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
306 / 429
SQB
No teste aos efeitos do Factor A, compara-se os modelos
(Modelo MA+B )
Yijk
= 11 + i + j + ijk
(Modelo MB )
Yijk
= 11 + j + ijk ,
SQFB =
nc
(Yijk Y )2
i=1 j=1 k =1
= a nc (Y j Y )2 = SQB
j=1
Estatstica e Delineamento
2010-11
307 / 429
SQREB SQREA+B
a1
SQREA+B
n(a+b1)
SQA
a1
QMREA+B
QMREA+B
QMA
,
QMRE
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
308 / 429
SQA
De forma anloga, no teste aos efeitos do Factor B, compara-se os
modelos
(Modelo MA+B )
Yijk
= 11 + i + j + ijk
(Modelo MA )
Yijk
= 11 + i + ijk ,
SQFA =
nc
(Yijk Y )2
i=1 j=1 k =1
= b nc (Y i Y )2 = SQA
i=1
Logo,
SQREA = SQT SQA
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
309 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
310 / 429
Fonte
Factor A
Factor B
Resduos
g.l.
SQ
a
a1
SQA = b nc (y i y )
b1
SQB = a nc y j y
i=1
b
j=1
n(a+b1)
nc
Total
QM
n1
J. Cadima (ISA)
SQT = (n 1) sy2
Estatstica e Delineamento
2
fcalc
QMA =
SQA
a1
QMA
QMRE
QMB =
SQB
b1
QMB
QMRE
SQRE
QMRE= n(a+b1)
2010-11
311 / 429
QMA
QMRE
vs.
vs.
H1 : i=2,..,a t.q. i 6= 0.
[A AFECTA Y ]
F(a1,n(a+b1))
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (a1,n(a+b1))
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
312 / 429
QMB
QMRE
vs.
vs.
H1 : j=2,..,b t.q. j 6= 0.
[B AFECTA Y ]
F(b1,n(a+b1))
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (b1,n(a+b1))
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
313 / 429
As frmulas utilizadas no
para indicar uma ANOVA a dois
Factores, sem interaco, so semelhantes s usadas na Regresso
Linear com dois preditores, devendo o nome dos dois factores ser
separado pelo smbolo +:
y
J. Cadima (ISA)
fA + fB
Estatstica e Delineamento
2010-11
314 / 429
Um exemplo
O rendimento de cinco variedades de aveia (manchuria,
svansota,velvet, trebi e peatland ) foi registado em seis diferentes
localidades 1 . Em cada localidade foi semeada uma e uma s parcela
com cada variedade (havendo casualizao em cada localidade).
> summary(aov(Y1 ~ Var + Loc, data=immer))
Df Sum Sq Mean Sq F value
Pr(>F)
Var
4 2756.6
689.2 4.2309
0.01214 *
Loc
5 17829.8 3566.0 21.8923 1.751e-07 ***
Residuals
20 3257.7
162.9
Estatstica e Delineamento
2010-11
315 / 429
Delineamentos no equilibrados
Se um delineamento no equilibrado, as frmulas do acetato 302, e
as que delas decorrem, no se aplicam.
possvel manter uma decomposio do tipo
SQT = SQA + SQB + SQRE
e justificar testes anlogos aos considerados nos acetatos (312) e
(313), mas de duas formas alternativas e diferentes:
Tomar
SQA = SQFA
(6=SQFB )
(6=SQFA )
Tomar
SQB = SQFB
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
316 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
317 / 429
1 = 0 ;
1 = 0 ;
( )1j = 0 , j
( )i1 = 0 , i.
Tem-se:
Para a primeira clula (i = j = 1): E [Yijk ] = = 11 .
Nas restantes clulas (1, j) do primeiro nvel do Factor A:
E [Yijk ] = 11 + j .
Nas restantes clulas (i, 1) do primeiro nvel do Factor B:
E [Yijk ] = 11 + i .
Nas clulas genricas (i, j), com i > 1 e j > 1,
E [Yijk ] = 11 + i + j + ( )ij .
Os efeitos i e j designam-se efeitos principais de cada Factor.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
318 / 429
Estatstica e Delineamento
2010-11
319 / 429
Estatstica e Delineamento
2010-11
320 / 429
i = 2, ..., a , j = 2, ..., b ;
i = 2, ..., a ; e
j = 2, ..., b .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
321 / 429
2
3
ijk N (0 , 2 )
{ijk }i,j,k v.a.s independentes.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
322 / 429
i = 2, ..., a , j = 2, ..., b ,
com o submodelo
(Modelo MA+B )
Yijk = 11 + i + j + ijk ,
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
323 / 429
i = 2, ..., a
Yijk
= 11 + i + j + ijk
(Modelo MB )
Yijk
= 11 + j + ijk ,
e tomar
SQA = SQREB SQREA+B
Nesse caso, pode ainda tomar-se
SQB = SQFB ,
associada ao QMF num teste aos efeitos do Factor B no Modelo MB .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
324 / 429
A decomposio de SQT
Definimos :
SQAB = SQREA+B SQREAB
SQA = SQREB SQREA+B
SQB = SQFB
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
325 / 429
Yijk
= 11 + i + j + ijk
(Modelo MA )
Yijk
= 11 + i + ijk ,
e tomar
SQB = SQREA SQREA+B
SQA = SQFA
Estatstica e Delineamento
2010-11
326 / 429
Delineamentos equilibrados
SQFA
SQFB
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
327 / 429
O quadro-resumo
Com base nas decomposies dos acetatos 325 e/ou 326, podemos
construir o quadro resumo da ANOVA a 2 Factores, com interaco.
Fonte
Factor A
g.l.
a1
SQ
SQA
QM
QMA = SQA
a1
QMA
QMRE
Factor B
b1
SQB
QMB =
SQB
b1
QMB
QMRE
Interaco
(a 1)(b 1)
SQAB
Resduos
Total
n ab
n1
SQRE
SQT = (n 1) sy2
J. Cadima (ISA)
QMAB =
Estatstica e Delineamento
SQAB
(a1)(b1)
QMRE =
fcalc
QMAB
QMRE
SQRE
nab
2010-11
328 / 429
QMAB
QMRE
F((a1)(b1),nab)
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f ((a1)(b1),nab )
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
329 / 429
QMA
QMRE
vs.
vs.
H1 : i=2,..,a t.q. i 6= 0.
[ EFEITOS DE A]
F(a1,nab)
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (a1,nab)
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
330 / 429
QMB
QMRE
vs.
vs.
H1 : j=2,..,b t.q. j 6= 0.
[ EFEITOS DE B]
F(b1,nab)
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (b1,nab)
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
331 / 429
As frmulas utilizadas no
para indicar uma ANOVA a dois
Factores, com interaco, recorrem ao smbolo :
y
J. Cadima (ISA)
fA fB
Estatstica e Delineamento
2010-11
332 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
333 / 429
Valores ajustados de Y
Sejam
Y ij a mdia amostral das nij observaes da clula (i, j),
Y i a mdia amostral das j nij observaes do nvel i do
Factor A,
Y j a mdia amostral das i nij observaes do nvel j do
Factor B,
Y a mdia amostral da totalidade das n = i j nij
observaes.
ijk so iguais para todas as observaes numa
Os valores ajustados Y
mesma clula, e so dados por:
ijk = Y ij .
Y
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
334 / 429
2,
Yijk N (ij , 2 ),
i, j, k.
i, j, k
i, j, k.
J. Cadima (ISA)
i, j.
Estatstica e Delineamento
2010-11
335 / 429
Y ij ij
tnab .
QMRE /nij
Estatstica e Delineamento
2010-11
336 / 429
ij = c
Estatstica do Teste: T =
vs. H1 :
<
ij 6= c
>
=c
z}|{
Y ij ij |H0
r
QMRE
nij
tnab
sob H0 .
Estatstica e Delineamento
2010-11
337 / 429
y ij t /2 (nab)
J. Cadima (ISA)
QMRE
nij
y ij + t /2 (nab)
Estatstica e Delineamento
QMRE
nij
2010-11
"
338 / 429
fit
32.23333
32.23333
32.23333
53.60000
53.60000
53.60000
83.76667
...
lwr
27.28967
27.28967
27.28967
48.65634
48.65634
48.65634
78.82301
...
J. Cadima (ISA)
upr
37.17699
37.17699
37.17699
58.54366
58.54366
58.54366
88.71033
...
Estatstica e Delineamento
2010-11
339 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
340 / 429
O Teste de Tukey
Teste de Tukey para mdias de clulas
Admite-se que o delineamento equilibrado, com nc repetioes em
todas as ab clulas.
Rejeita-se a igualdade das mdias das clulas (i, j) e (i , j ), a favor da
hiptese ij 6= i j , se
|Y ij Y i j |
>
q (ab,nab)
QMRE
,
nc
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
341 / 429
,
y ij y i j q (ab,nab) QMRE
y
y
+
q
(ab,nab)
ij
ij
nc
nc
Conclui-se que ij 6= i j se o intervalo correspondente a este par de
clulas no contm o valor zero.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
342 / 429
Tukey no
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
343 / 429
Estimadores de parmetros
Os estimadores dos parmetros num modelo ANOVA a 2 Factores,
com interaco, so:
11 = Y 11
i = Y i1 Y 11
j = Y 1j Y 11
(i > 1)
(j > 1)
)ij = (Y ij + Y 11 ) (Y i1 + Y 1j )
(
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
344 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
345 / 429
vs.
H1 : i,j,i ,j : ij2 6= i2 j
[Var. heterogneas]
Estatstica do Teste:
b
K =
onde C = 1 +
i=1 j=1
C
1
3(ab1)
"
i=1 j=1
1
nij 1
1
nab
2
ab1
Estatstica e Delineamento
2010-11
346 / 429
O Teste de Bartlett no
, para 2 Factores
No
, o comando bartlett.test apenas aceita a indicao de um
factor. Mas a extenso do teste de Bartlett s varincias de clulas
imediata se as ab clulas forem identificadas como ab nveis de 1
Factor.
Um comando que permite criar um vector que distinga entre clulas
definidas por factores fA e fB para posterior utilizao num teste de
Bartlett :
> celulas <-paste( fA , 0 , fB , sep=)
> bartlett.test( y celulas)
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
347 / 429
Uma advertncia
Na formulao clssica do modelo ANOVA a dois Factores, com
interaco, e a partir da equao-base Yijk = + i + j + ( )ij + ijk ,
em vez de impor as condies 1 = 1 = ( )i1 = ( )1j = 0 ( i, j),
admite-se a existncia de acrscimos de todos os tipos para qualquer
valor de i e j e impe-se as condies:
i i = 0;
j j = 0;
i ( )ij = 0 ,
j ( )ij = 0 ,
j;
i.
Estatstica e Delineamento
2010-11
348 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
349 / 429
2.0
ambiente
1.6
1.4
1.0
1.2
mean of perda.peso
1.8
Amb.2
Amb.3
Amb.4
Amb.1
1 mes
2 meses
3 meses
tempo
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
350 / 429
90
tempo.exposicao
120
110
90
80
70
30
T1
T2
T3
Golden.rain
temperatura
J. Cadima (ISA)
0.6cwt
0.4cwt
0.2cwt
0.0cwt
100
mean of Y
70
60
50
40
mean of absorcao$absorcao
80
E3
E2
E1
Victory
V
Estatstica e Delineamento
2010-11
351 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
352 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
353 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
354 / 429
QMx
QMRE ,
onde x
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
355 / 429
Um exemplo
No
, ANOVAs factoriais a 3 Factores fazem-se de forma anloga s
de dois factores:
> summary(aov(yield ~ N*P*K, data=npk))
Df Sum Sq Mean Sq F value Pr(>F)
N
1 189.28 189.28 6.1608 0.02454 *
P
1
8.40
8.40 0.2735 0.60819
K
1 95.20
95.20 3.0986 0.09746 .
N:P
1 21.28
21.28 0.6927 0.41750
N:K
1 33.14
33.14 1.0785 0.31448
P:K
1
0.48
0.48 0.0157 0.90192
N:P:K
1 37.00
37.00 1.2043 0.28870
Residuals
16 491.58
30.72
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
356 / 429
Delineamentos hierarquizados
Delineamentos que, superficialmente, podem confundir-se com os
delineamentos factoriais so delineamentos onde surgem dois (ou
mais) factores, mas em que os nveis de um dos factores variam
consoante os nveis do outro factor.
Por exemplo, considere uma varivel resposta rendimento de trigo,
que se pretende modelar com os factores variedade e adubao.
Suponha que
na variedade 1 as adubaes mais frequentes so X, Y e Z;
na variedade 2 as adubaes mais utilizadas so K, L e M.
Um delineamento factorial obriga a ter ab = 2 6 = 12 clulas,
sabendo-se de antemo que no interessam as clulas que
combinam a variedade 1 com as adubaes K,L,M e as clulas que
combinam a variedade 2 com as adubaes X,Y,Z.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
357 / 429
Variedade 1
Variedade 2
FACTOR A
(Variedade)
FACTOR B
(Adubacao)
X
Y Z
K L M
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
358 / 429
Estatstica e Delineamento
2010-11
359 / 429
i=1
1 + (a 1) + (bi 1) =
i=1
bi
i=1
Estatstica e Delineamento
2010-11
360 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
361 / 429
2
3
ijk N (0 , 2 ) ,
i, j, k
{ijk }i,j,k v.a.s independentes.
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
362 / 429
i = 2, ..., a ; e
i = 1, ..., a e j = 2, ..., bi .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
363 / 429
A decomposio de SQT
Para efectuar a decomposio da Soma de Quadrados Total,
consideremos os modelos
(Modelo MA/B )
(Modelo MA )
Estatstica e Delineamento
2010-11
364 / 429
Graus de liberdade
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
365 / 429
g.l.
a1
SQ
SQA
(bi 1)
SQB(A)
Fonte
Factor A
Factor B(A)
QM
QMA = SQA
a1
QMB(A) =
i=1
SQB(A)
a
(bi 1)
fcalc
QMA
QMRE
QMB(A)
QMRE
i=1
Resduos
n bi
SQRE
QMRE =
n1
Total
J. Cadima (ISA)
SQT = (n 1) Sy2
Estatstica e Delineamento
SQRE
a
n bi
i=1
2010-11
366 / 429
QMA
QMRE
F(a1,ni bi )
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (a1 ,ni bi )
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
367 / 429
QMB(A)
QMRE
se H0 .
0.4
df(x, 4, 16)
0.3
0.2
0.1
0.0
Rejeitar H0 se
Fcalc > f (i (bi 1),ni bi )
0.5
0.6
0.7
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
368 / 429
As frmulas utilizadas no
para indicar uma ANOVA a dois
Factores, sem interaco, so semelhantes s usadas na Regresso
Linear com dois preditores, devendo o nome dos dois factores ser
separado pelo smbolo /. Se o factor fA dominante:
y
J. Cadima (ISA)
fA / fB
Estatstica e Delineamento
2010-11
369 / 429
Um exemplo
Um estudo sobre rendimentos (Y ), de vrias variedades de aveia
(factor V ), tendo sido usadas vrias adubaes azotadas (factor N),
mas nem sempre iguais para cada variedade.
> summary(aov(Y ~ V/N, data=oats))
Df Sum Sq Mean Sq F value
Pr(>F)
V
2 1786.4
893.2 1.7949 0.1749504
V:N
9 20342.2 2260.2 4.5421 0.0001397 ***
Residuals
60 29857.3
497.6
--Signif. codes: 0 ~***~ 0.001 ~**~ 0.01 ~*~ 0.05 ~.~ 0.1 ~ ~ 1
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
370 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
371 / 429
Anlise de resduos
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
372 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
373 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
374 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
375 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
376 / 429
4. A correco de Bonferroni
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
377 / 429
4. A desigualdade de Bonferroni
Admita que se pretendem efectuar r comparaes de mdias, atravs
de ICs, e que se deseja um grau de confiana global 1 .
Seja Aj o acontecimento aleatrio o j-simo intervalo contm a
verdadeira diferena de mdias populacionais,
e 1 j a respectiva
"
#
r
T
j=1
"
r
\
Aj
j=1
= 1P
"
r
[
Aj
j=1
Aj exceda 1 . Ora,
r
j=1
j=1
1 P[Aj ] = 1 j .
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
378 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
379 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
380 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
381 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
382 / 429
J. Cadima (ISA)
Estatstica e Delineamento
2010-11
383 / 429