Beruflich Dokumente
Kultur Dokumente
Fator uma varivel independente em estudo, por exemplo, solventes, aditivos. Estes
fatores geralmente envolvem diversos nveis. A ANOVA utilizada para verificar se
existem diferenas significativas entre os nveis dos fatores (tratamentos). Aqui
assume-se que o delineamento completamente casualizado. Estes experimentos s
podem ser realizados quando as unidades experimentais so homogneas. Por
exemplo, 12 leites da mesma raa, mesmo sexo, mesma idade e com pesos iniciais
prximos.
Solventes
E50
EAW
MAW
E70
M1M
1
0,5553
0,5436
0,4748
0,6286
0,1651
Observaes
2
3
4
0,5623 0,5585 0,5096
0,5660 0,5860 0,5731
0,4321 0,4309 0,5010
0,6143 0,5826 0,7498
0,1840 0,2144 0,2249
5
0,5110
0,5656
0,4094
0,6060
0,1954
0,8
0,7
Absorbncia
0,6
0,5
0,4
0,3
0,2
0,1
E50
EAW
MAW
E70
M1M
Solventes
y11
y12
y1n
y1.
y1
y21
y22
y2n
y2.
y2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ya1
ya2
yan
ya.
ya
y ij i
i=1,2,...,a
ij
j=1,2,...,n
yij ~ N ( i ; 2 ) e independentes
y
a
i 1 j1
ij y.. n y i. y.. y ij y i.
2
i 1
i 1 j1
QMTrat
QMErro
SQTratamen tos
a 1
SQErro
a(n -1)
E(QMTratamentos) 2
Teste de hiptese:
n
i 1
2
i
a 1
QMTtratamentos
F
QMErro
7
SST y
i 1 j1
SSTratamentos 1
2
ij
y..2
2
y
i.
n i 1
y..2
SSTratamentos
a-1
QMTratamentos QMTratamentos
QMErro
N-a
QMErro
Total
N-1
SST
Valor p
N=an
0,5831
0,1458
Erro
0,0288
20
0,0014
Total
0,6119
24
F.05;4;20=2,87
F,01;4;20=4,43
101,1087
(P<0,0001)
CV
QMErro
Mdia
.100
Rejeita-se H0, e conclumos que as mdias de tratamentos diferem entre si; os solventes afetam significativamente as mdias de absorbncia.
10
y..
i y i. y..
Estimativa pontual de i: dado i= + i, temos:
i i y i.
Um intervalo de confiana para i dado por:
y i. t /2, N a QM Erro /n
11
E50
EAW
ni
SQ Tratamentos
y i.2 y..2
N
i 1 n i
a
13
14
15
0.05
I
D
U
0.00
O
-.05
5
10
15
20
25
OBS
16
0.05
I
D
U
0.00
O
-.05
0.2
0.4
PREDITO
0.6
A distribuio dos pontos aleatria. til para verificar se as varincias so heterogneas (forma de
megafone). Devido a presena de 1 outlier as varincias no so homogneas. Na presena de
heterogeneidade de varincias usual aplicar uma transformao nos dados. Pode-se usar os testes noparamtricos. A heterogeneidade de varincia tambm ocorre nos casos de distribuies assimtricas, pois a 17
varincia tende a ser funo da mdia.
H 0 : 12 22 ... a2
H1 : i2 2j
q
2,3026
c
a
2
q (N a)log10Sp (ni 1)log10 Si2
2
0
i j
i1
c 1
3(a 1)
ni 1 1 N a
i1
Sp2
(ni 1)Si2
i1
Na
18
c 1
2
0,05;4
9,488
Teste de Levene
1) Calcular os resduos da anlise de varincia;
2) Fazer uma anlise de varincia dos valores absolutos desses resduos;
3) Se as varincias so homogneas, o resultado do teste F ser no significativo.
Exemplo: dados de absorbncia.
QMTratamentos
QMErro
Nvel descritivo
0,000894
0,000447
1,9989
0,1335
20
21
Idade
0
1
2
3
4
Causas de
variao
Idades
Resduo
Observaes
13,44
10,11
9,83
7,94
4,86
12,84
11,38
9,00
6,01
5,10
S.Q.
260,81
55,23
11,91
10,28
8,65
5,14
5,67
G.L.
4
20
20,09
8,96
7,85
6,90
5,75
Q.M.
65,20
2,76
Mdia
15,60
8,59
8,88
6,77
6,23
F
23,61
14,78
9,86
8,84
6,55
5,52
Desvio
padro
3,27
1,12
0,71
1,05
0,55
Nvel
descritivo
<0,0001
22
E
S
I
D
U
O
-2
6
10
PREDITO
12
14
23
Para estudar a possibilidade de uma transformao nos dados, plotamos log do desvio padro
versus log da mdia. A equao de uma regresso linear simples para os dados dada por:
G.L
Q.M.
4
19
0,0205
0,0006
Nvel
descritivo
36,06
<0,0001
25
Causas de
variao
Idade
Resduo
S.Q.
0,5385
0,0743
G.L
Q.M.
4
20
0,1346
0,0037
Nvel
descritivo
36,23
<0,0001
26
27
28
Doses de
fsforo
0 kg/ha
25 kg/ha
50 kg/ha
75 kg/ha
100 kg/ha
Observaes
2,38
6,15
9,07
9,55
9,14
6,77
8,78
8,73
8,95
10,17
3,50
8,99
6,92
10,24
9,75
Totais
5,94
9,10
8,48
8,66
9,50
18,59
33,02
33,20
37,40
38,56
2,05
1,40
0,95
0,69
0,40
29
11
Produo em kg/parcela
-20
20
40
60
80
100
120
y 0 1x 2 x 2
Doses de fsforo
Onde 0, 1 e 2 so parmetros
desconhecidos e que devem ser estimados e
o erro aleatrio. Para o exemplo a equao
ajustada dada por:
30
8,6Y10,5
' y
0,1087 0,0006 x 0 x 90,58
'
x
'' y
0,0006 ( Ponto de mximo)
''
x
31
1-5.3 Contrastes
Desejamos verificar se a mdias dos solventes E50, EAW e E70 no diferem da mdia dos
solventes MAW e MM. Esta hiptese escrita como:
H0 : 21 22 24 33 35
H1 : 21 2 2 2 4 3 3 3 5
Temos o contraste:
SQ c
i 1
ci yi.
c
i 1
n c i2
i 1
32
SQ c
i 1
ci y i.
n i ci2
i 1
i 1
i 1
ci d i 0 ou n i ci d i (desbalanceado)
Exemplo: vamos considerar um
experimento com 3 tratamentos
(a=3), sendo um deles o controle.
y1 2y1. y 2. y 3.
y2
y 2. y 3.
ortogonais
33
Contrastes
H 0 : 2 1 2 2 2 4 3 3 3 5
C1=2y1.+2y2.-3y3.+2y4.-3y5.
C2= y1.+ y2.
-2y4.
C3= y1.- y2.
C4=
y3.
-y5.
H 0 : 1 2 2 4
H 0 : 1 2
H 0 : 3 5
C1=7,7286; C2=-0,8316; C3=-0,1376; C4=1,2644
SQC1=0,3982; SQC2=0,0231; SQC3=0,0019; SQC4=0,1599
34
Variaes
Soma de
GL Quadrado
F
no modelo Quadrados
Mdio
Solventes
0,5832
4
0,1458 101,11
Contrastes
C1
(0,3982)
1
276,23
C2
(0,0231)
1
15,99
C3
(0,0019)
1
1,31
C4
(0,1599)
1
110,90
Erro
0,0280
20
0,0014
Total
0,6112
24
P<0,0001
P<0,0001
P<0,0007
P<0,2653
P<0,0001
35
SC u QM Erro c iu2 /n i
i 1
36
Critrio do teste: o valor com o qual Cu deve ser comparado dado por:
S, u SC u (a 1)F; a 1, N a
Se |Cu S,u|, ento rejeita-se a hiptese de que o contraste u igual a zero.
Exemplo 1-1. Dados de absorbncia. Considere os 2 contrastes de interesse
1 2 1 2 2 3 3 2 4 3 5
2 1 2 2 4
As estimativas desses contrastes so:
C1 2y1 2y 2 3y 3 2y 4 3y 5
2(0,5393) 2(0,5669) 3(0,4496) 2(0,6363) 3(0,1968)
1,5458
37
C 2 y1 y 2 2y 4
0,5393 0,5669 2(0,6363)
0,1664
Erros padres dos contrastes:
H 0 : i j para todos os i, j.
t0
yi y j
1
1
QMErro
i nj
y i y j t / 2;N a QMErro(1 n i 1 n j )
39
Critrio do teste: se
y i y j LSD
40
Teste de Tukey
Duas mdias so diferentes significativamente se a diferena das mdias amostrais
(em valor absoluto) for superior a DMS (Diferena Mnima Significativa):
DMS
q
2
1
1
ri r j
DMS q0 , 05 ( 5; 20 )
QMErro
2
0,0014
1 1
4,23
ni n j
2
2
0,0708
5
H 0 : i a H 1 : i a para i 1,2,..., a - 1
Onde a a mdia do tratamento controle.
A hiptese de nulidade rejeitada, ao nvel de significncia , se
1
1
yi . y a . d (a 1, f ) QMErro
ni n a
Exemplo: dados de absorbncia. Considere o tratamento MM como sendo o controle. Neste
exemplo, a=5, a-1=4 e f=20 e ni=na=5. Para =5%, da tabela (valores crticos do teste de
Dunnett) obtemos d0,05(4;20)=2,65. Assim, o valor crtico dado por:
2,65 (0,00144)
2
0,0636
5
42
y1 y 5 0,3425
y 2 y 5 0,3701
y 3 y 5 0,2528
y 4 y 5 0,4395
Concluso: todas as mdias diferem significativamente da mdia do tratamento controle.
Qual teste usar?
O LSD eficiente para detectar diferenas verdadeiras nas mdias se ele for aplicado apenas
depois do teste F da ANOVA se significativo a 5%. Idem para o Duncan. Estes mtodos no
contm o erro tipo I (erro geral ou experimentwise error). Como o Tukey controla este erro
ele o preferido pelos estatsticos. O SNK mais conservador do que o Duncan.
43
44
Marcas
1
2
3
4
5
6
1
24.4
10.2
19.2
17.4
13.4
21.3
2
22.6
12.1
19.4
18.1
15.0
20.2
3
23.8
10.3
19.8
16.7
14.1
20.7
Garrafas
4
5
22.0 24.5
10.2
9.9
19.0 19.6
18.3 17.6
13.1 14.9
20.8 20.1
6
22.3
11.2
18.3
17.5
15.0
18.8
7
25.0
12.0
20.0
18.0
13.4
21.1
8
24.5
9.5
19.4
16.4
14.8
20.3
23.8
O modelo estatstico:
H 0 : 2 0
H 1 : 2 0
45
E(QMTratamentos) 2 n 2
E(QMErro) 2
Portanto,
QMTratamentos 2 n 2
QMErro 2
assim,
2
QMErro
2 (QMTratamentos QMErro)/n
46
Variaes
S.Q.
no modelo
Marcas
854,529
Erro
30,070
Total
884,599
Concluso: rejeita-se H0:
G.L.
5
42
47
Q.M.
170,906
0,716
Nvel
descritivo
238,71 P<0,0001
2 0
2 0,716
2 ( 170 ,906 0,716 )/ 8 21,2738
Um uso importante: isolar diferentes fontes de variabilidade que afetam um produto
ou um sistema. Identificar fatores com maior variabilidade (Exemplo: Lotes,
amostras e rplicas).
47
1 P Rejeitar H 0 | H 0 falsa
1 P F0 F; a 1;Na | H 0 falsa
As CCO dadas no baco V (Apndice), so usadas para avaliar o valor de . Essas
CCO so um grfico de (ordenadas) versus (abcissas), onde:
a
2
i
i 1
a 2
48
1) i i onde 1 a i1 i
a
Assim,
i1 i 0,268
a
Temos:
n 0,268
0,893n
5(0,06)
4
3,37
1,89
15
0,15
5
4,47
2,11
20
0,07
(1-)
0,85
0,93
Assim, a pesquisadora deve utilizar n=5 repeties para realizar o teste com o poder
desejado.
Alternativa: selecionar um tamanho de amostra tal que, se a diferena entre qualquer duas
mdias exceder um valor especificado, a hiptese de nulidade deve ser rejeitada. Seja D este
valor (preciso), ento:
2
nD
2
2a 2
50
2
n
(
0
,
3
)
2
0,60n
2(5)(0,015)
5
3,0
1,73
20
0,15
6
3,6
1,90
25
0,12
7
4,2
2,05
30
0,07
(1-)
0,85
0,88
0,93
Conclui-se que n=7 repeties devem ser usadas para ter a preciso e confiana desejadas.
Modelo de efeitos aleatrios: a probabilidade de erro tipo II para esse caso :
1 P Rejeitar H 0 | H 0 falsa
1 P(F0 F; a-1;N-a | 2 0)
As CCO (baco VI, Apndice) so grficos onde na ordenada temos a probabilidade de erro
tipo II e na a abcissa temos , onde dado por:
n 2
1
2
51
n(10)
1 n(10)
3
5,6
12
0,027
0,973
4
6,4
18
0,015
0,985
5
7,1
24
0,000
1,000
Mtodo do Intervalo de Confiana
Assume-se que o pesquisador deseja expressar os resultados em termos de intervalos de
confiana dos efeitos dos tratamentos. Especifica priori a amplitude dos mesmos.
52
t/2; Na
2(QMErro)
n
53
Formulaes
Observaes
1
1
2
3
4
501,5
447,0
466,5
469,5
2
92,63
15,55
12,02
41,72
54
Variaes
no modelo
Formulaes
Erro
S.Q.
7,408
4,789
G.L.
3
12
Q.M.
2,469
0,396
Nvel
descritivo
6,24
0,0085
Observa-se que as formulaes afetam o desvio padro do volume especfico do po, isto ,
as formulaes tem um efeito de disperso.
55
1
2
3
4
Dos resultados do teste LSD, conclui-se que a formulao 2 produz menos disperso do
que as demais; As formulaes 1, 3 e 4, so estatisticamente equivalentes.
Dose de
fsforo
Totais dos
trat/os
yi.
18,59
33,02
33,20
37,40
38,56
0
25
50
75
100
Efeito:
Soma de quadrados:
i 1
ci y i .
c y
i
i.
i 1
i 1
11,21
-25,33
49,11
9,06
3,14
2,29
n ci2
-22,52
44,32
57
Causas de
variao
Doses
(Linear)
(Quadrtico)
(Cbico)
(4. grau)
Erro
Total
Soma
Graus
QuadraF
Nvel
de
de
dos
Descritivo
Quadrados Liberdade Mdios
63,60
4
15,90 10,22
0,0003
49,107
1 49,107 31,56
0,0001
9,06
1
9,06 5,82
0,0291
3,14
1
3,14 2,02
0,1758
2,29
1
2,29 1,47
0,2437
23,34
15
1,56
86,94
19
y 0 1 P1 ( x) 2 P2 ( x)
P0 ( x) 1
x 50
(x x)
x 50
25
25
d
x x 2 a 2 1
x 50 2 x 50 2
1
P2 ( x) 2
2
2
12
d
25
25
P1 ( x) 1
yP ( x)
P ( x)
i
i 0,1,..., a 1
59
Y
2,38
6,77
3,50
5,94
6,15
8,78
8,99
9,10
.
.
.
9,50
160,77
60
160 160
8,039
20
4(5)
44,32 44,32
1
1,108
40
4(10)
22,46 22,46
2
0,401
56
4(14)
x 50 2 5 2 1
x 50
y 8,039 1,108(1)
0,401(1)
25
12
25
y 5,02036 0,10849 x 0,00064 x 2 R2=
2-4 Mtodos no paramtricos na anlise de varincia
2-4.1 O Teste de Kruskal-Wallis
Quando as pressuposies bsicas da ANOVA no forem atendidas, por exemplo, a varivel
em estudo no apresenta distribuio normal (notas em escala), heterogeneidade de
varincias, outliers.
usado para testar a hiptese de que a tratamentos so idnticos contra a hiptese
alternativa de que pelo menos dois deles diferem entre si.
61
H 0 : 1 2 ... a
H a : i j para i j
Mtodo: procedemos a classificao conjunta (em ordem crescente) das N observaes,
dando ordem 1 menor e ordem N maior delas, e substitumos s observaes pelos seus
postos (ranks). No caso de empates (observaes com o mesmo valor), designa-se o posto
mdio para as observaes empatadas. Seja Ri a somas dos ranks do i-simo tratamento. O
teste estatstico dado por:
2
2
a
1
H 2
S
R i. N(N 1)
4
i 1 n i
1
S
N 1
2
N(N 1) 2
R
4
i1 j1
ni
2
ij
62
Sem empates:
S 2 N(N 1)/12
a
R i.2
12
H
3(N 1)
N(N 1) i1 n i
Critrio do teste: para ni5, H tem distribuio aproximada de 2a-1 sob H0.. Assim, se
H
rejeita-se H0.
2
, a 1
Olhar o valor p
E50
y1j
0,5553
0,5623
0,5585
0,5096
0,5110
EAW
R1j
14
16
15
11
12
68
y2j
R2j
0,5436 13
0,5660 17,5
0,5860 21
0,5731 19
0,5660 17,5
88
MAW
y3j
R3j
0,4748
9
0,4321
8
0,4309
7
0,5010 10
0,4094
6
40
E70
y4j
R4j
0,6286 24
0,6143 23
0,5826 20
0,7498 25
0,6060 22
114
M1M
y5j
R5j
0,1651
1
0,1840
2
0,2144
4
0,2249
5
0,1954
3
15
63
i 1
j1
2
R
ij 5524,50
S2
1
5524,5 4225,0 54,1458
25 1
1
1 2
2
2
2
2
68
88
40
114
15
4225,0
22,3987
54,1458 5
O nvel descritivo para H=22,3987 com 4 g.l. 0,0002, portanto, rejeita-se H0.
* Teste de comparao de mdias no paramtrico.
64
Tratamentos
1
2
.
.
a
Totais
subjects
y ij i j ij
O modelo estatstico:
0,
2
Partio da soma de quadrados total: S.Q. Total = S.Q Entre julgadores + S.Q.Dentro julgadores
y
a
i 1
j1
ij
y .. a y .j y .. y ij y .j
n
j1
i 1
j1
65
y
a
i 1
y .j n y i. y .. y ij y i. y .j y ..
2
ij
j1
i 1
i 1
j1
H 0 1 2 ... a 0
Ha i 0
Critrio do teste: F0
Rejeita-se H0 se:
QMTratamento s
QMErro
F0 F; a 1,(a 1)(n1)
E QMSuj 2 a 2
n a
E(QMTrat)
a 1 i1
E(QMErro) 2
2
66
2
j
Tratamentos
A
B
C
D
1
3,2
4,4
2,0
2,0
Variaes
SQ
No modelo
Julgadores
7,829
Tratamentos
1,798
Erro
5,851
Total
15,479
Teste para julgadores:
Julgadores
3
4
5
4,0
4,4
3,6
3,4
4,2
2,6
3,8
3,6
4,0
4,2
3,4
2,2
2
3,0
2,8
2,4
2,4
GL
6
3
18
27
QM
1,305
0,599
0,325
6
3,2
2,8
2,6
2,6
7
4,0
4,0
3,8
4,0
Nvel
Descritivo
4,01
0,0100
1,84
0,1753
H 0 : 2 0 H a : 2 0
Intervalos de confiana:
3,03 1 4,23
2,86 2 4,06
2,57 3 3,77
2,37 4 3,57
y1
a mdia
y1
y2
X1
corrigida por X
Tratamento 1
Tratamento 2
y1
X2
69
Dados de pop. de Staphilococus para y = pop. aos 7 dias e x = pop. aos 0 dia
BP
BPM
VN
VNM
y
x
y
x
y
x
y
x
3,1710 3,3507 3,0663 3,4423 3,3903 3,7643 3,5623 3,7447
3,1857 3,4860 3,1840 3,6617 4,0037 4,0880 3,8820 4,0880
2,8553 3,0527 2,8300 3,2980 3,8293 4,1053 3,1507 3,8820
3,5063 3,6577 3,6603 3,7873 3,1637 3,4807 3,2253 3,4807
3,7740 4,0143 3,7180 3,8953 2,7917 3,7447 3,6393 3,4523
3,1383 3,7407 4,0263 3,7953 3,7917 3,3903 2,9937 3,5020
19,6307 21,3020 20,4850 21,8800 20,9703 22,5733 20,4533 22,1497
70
y ij i x ij x .. ij
71
Suposio:
ij ~ NID(0 ; ); 0 ; 1 ..., a
2
i 0
i 1
72
S yy y ij y ..
S xx x ij x ..
i 1
j1
i 1
j1
y ..2
y
an
i 1 j1
a
2
ij
x ..2
x
an
i 1 j1
a
2
ij
S xy x ij x .. y ij y .. x ij y ij
a
i 1
j1
i 1
j1
1 a 2 y ..2
(y i. y .. ) y i.
n i1
an
i 1
a
1 a 2 x ..2
2
(x i. x .. ) x i.
n i1
an
i 1
a
(x )(y .. )
1 a
x i. x .. y i. y .. (x i. )(y i. ) ..
n i1
an
i 1
a
Tyy
Txx
Txy
(x .. )(y .. )
an
E yy y ij y i. S yy Tyy
a
i 1
j1
E xx x ij x i. S xx Txx
a
i 1
j1
E xy x ij x i. y ij y i. S xy Txy
a
i 1
j1
73
Somas de quadrados:
SQTotal S yy
SQRegresso S xy S xx
2
SQTratamentos(ajustado) S yy S xy S xx E yy E xy E xx
2
SQErro E yy E xy E xx
Graus de liberdade:
Regresso: 1
Tratamentos(ajustado): a-1
Erro: a(n-1)-1
Total: na-1
Teste da hiptese:
F0
H 0 : i 0
ou
H 0 1 2 3 4
Rejeita-se H0 se:
F0 F ;a1,a ( n1)1
Use o valor p
74
y i. y i. x i. x ..
E xy E xx
S x ajustada
1/ 2
H 0 : 0 vs H a : 0
Hiptese:
F0
1 xi . x.. 2
QMErro
E xx
xy
/E xx
QMErro
Rejeita-se H0 se:
F0 F ;1,a ( n1)1
Use o nvel descritivo
75
Variaes
no modelo
Regresso
Tratamentos
ajustados
Erro
Total
1
3
1,2666
0,0037
1,9395
3,3605
19
23
0,1021
Nvel
descritivo
12,41
0,0023
0,04
0,9903
Erro padro
0,1335
0,1305
0,1328
0,1306
76
0,8904
s 0,2527
Diagnstico do modelo: os resduos so dados por:
y..
Exemplo: e11=3,1710-3,2718-0,8904(3,3507-3,55033)
=0.07701
Os resduos esto
aleatoriamente distribudos
em torno do valor zero. A
faixa de distribuio, -0,5 a
0,5, curta; no tem
outliers. Varincias
homogneas.
77
A suposio de normalidade
satisfeita.
78
Valores aleatoriamente
distribudos em torno de zero.
Concluso: de acordo com os grficos, os resultados da anlise estatstica podem ser utilizados,
pois eles no revelam qualquer problema quanto as suposies do modelo.
79