Beruflich Dokumente
Kultur Dokumente
http://www.pucrs.br/famat/viali/
viali@pucrs.br
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Objetivos
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
1
Objetivos
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
2
One-Way ANOVA
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Two-Way ANOVA
Two-
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
3
Quatro variáveis independentes
apresentam seis interações de primeira à medida que o número de interações
ordem (AB, AC, AD, BC, BC, CD), três de aumenta, torna-se bastante difícil
segunda-ordem (ABC, ACD, BCD) e uma interpretar o modelo.
de terceira ordem (ABCD). Dez no total.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O Modelo: Y ij = µ i + U ij
Suposiç
Suposições:
ões:
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
4
Resumindo:
Resumindo: Metodologia:
Metodologia:
Supõem-se que os valores Yij são valores Fazendo µi = µ + αi, onde os αι são os
que resultam da adição de um valor médio µi efeitos dos tratamentos, o modelo fica:
com um termo erro Uij que são variáveis
Y ij = µ + α i + U ij
aleatórias independentes com distribuição
normal de média zero e variância constante Os αι, estão sujeitos a restrição Σniα i = 0.
1
igual a σ2. Então de µi = µ + αi, segue que: µ = ∑n i µi
n i
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
ni
k ni k ni Segue, então: n i m i = ∑Y
= ∑ ∑ ( Y ij −m i )
2
Q = S .Q .R = ∑ ∑ E 2ij ni j
ij
i j i j
Ou ∑ Y ij
j
Derivando e igualando a zero, tem-se: m i = = Y i
ni
5
As Somas dos Quadrados
Indicando por Ai o total do i-ésimo k ni k ni
ij −m i ) = ∑ ∑( Y ij −Y i )
2 2
S .Q .R = ∑ ∑( Y
tratamento, isto é, fazendo: i =1 j =1 i =1 j =1
ni
Ai = ∑Y ij Elevando o binômio ao quadrado, segue:
j =1
Tem-se:
Ai k ni k ni k
2
mi = Y i = S .Q .R = ∑ ∑Y 2ij − 2 ∑Y ∑Y ij + ∑n i Y
ni i i
i =1 j =1 i =1 j =1 i =1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
k ni k Lembrando que:
G = ∑ ∑ Y ij = ∑ A i A k
i j i mi = Y i = i e ∑α i = 0
ni i= 1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
6
2 2
Tem-se: S .Q .Trat . = k A i − G Esta expressão mostra que a Soma dos
∑
i ni n Quadrados Totais é composta de duas
Juntando os resultados, segue que: parcelas: A Soma dos Quadrados dos
Tratamentos (variação entre tratamentos) e a
Soma dos Quadrados dos Resíduos (variações
S.Q.Res. = S.Q.Total - S.Q.Trat. ou
dentro de tratamentos).
S.Q.Total = S.Q.Trat. + S.Q.Res.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo:
Exemplo: Tem-se:
Am. 1 Am. 1 Am. 1 n1 = 5, n2 = 6 e n3 = 7 n = 18 e k = 3
10 15 20
Considere- A1 = 55, A2 = 87 e A3 = 119
09 13 19
se os valores Yij 12 12 17 Y 1 = 11; Y 2 = 14 ,5 ; Y 3 = 17 e Y = 14,5
de três amostras 11 17 15 k ni G2
S .Q .Total = ∑ ∑ Y 2ij - = 160 ,50
supostamente 13 14 16
i j n
55 16 18
independentes:
87 14 A2i G 2
k
S.Q .Trat. = ∑ − = 3889 ,50 − 3784,5 = 105
119 i ni n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
7
ni
A i = n i µ i + ∑ µ ij Com l ≠ j, segue:
j =1 ni 2 ni ni
2
Segue, então: 2 E( ∑ µ )
ij = E( ∑ µ ij + ∑ µ ij µ il ) = n i σ 2
ni ⎛ ni ⎞ j =1 j =1 l
+ 2 n i ν i ∑ µ ij + ⎜⎜ ∑ µ ij ⎟⎟
2
A 2i = n 2i µ i
j =1 ⎝ j =1 ⎠ Daí: E ( A2i ) = n 2i µ 2i + n i σ 2
Mas:
⎛ ni ⎞ k k ni
E ⎜ ∑ µ ij ⎟ = 0 Como: G = ∑ n i µ i + ∑ ∑ µ ij
⎜ j =1 ⎟ i =1
⎝ ⎠ i =1 j =1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
2
Segue: k ni k ni
2
k k ni ni
E( ∑ ∑ µ )
ij = E( ∑ ∑ µ ij + ∑ ∑ ∑ ∑ µij µhl ) = n σ 2
k 2 k k ni k ni 2 i =1 j =1 i =1 j =1 i =1h =1 l =1 j =1
G 2 = ( ∑ n i µi ) + 2.( ∑ ni µi )( ∑ ∑ µij ) + ( ∑ ∑ µij )
i =1 i =1 i =1 j =1 i =1 j =1 k 2
k ni Assim: E( G2 ) = ( ∑n i µi ) + n σ 2
i =1
Mas: E ( ∑ ∑ µ ij ) = 0
i =1 j =1 Portanto:
2
k 1 k
E( S .Q .Total ) = ∑ n i µ 2i − ( ∑ni µi ) +( n −1 ) σ 2
E com h ≠ i e/ou l ≠ k, segue i =1 n i =1
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Ou: E( S .Q .Total ) = W + ( n − 1 ) σ 2
Para os tratamentos, tem-se:
2
2 k 2 1 k
k 1 k E( S .Q .Trat .) = ∑ ( n i µ i + σ 2 ) − ( ∑n i µi ) − σ 2 =
W = ∑ n i µ 2i − ( ∑ n i µ i ) i =1 n i =1
i =1 n i =1
k k 2
2 1
k = ∑ n i µ i − ( ∑n i µ i ) + ( k − 1 ) σ 2
Ou: W = ∑ ni ( µi − µ )
2
i =1 n i =1
i =1
Ou
A expressão mostra que W = 0, apenas se E( S .Q .Trat .) = W + ( k − 1 ) σ 2
µ1 = µ2 = ... = µk = µ
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
8
Os Quadrados Médios
Causa da Soma dos Espec. da Esp. da Soma Consideremos a hipótese de nulidade:
Variação Quadrados Soma (sob H0)
H0: µ1 = µ2 = … = µk
Tratamentos k
A2 G2 W + (k - 1)σ 2 (k - 1)σ 2
∑ i - Isto é, consideremos a hipótese de que as
i ni n
médias das “k” populações sob análise sejam
Resíduo k ni k A2 (n - k )σ 2 (n - k )σ 2 idênticas.
∑ ∑ Y 2ij - ∑ i
i=1 j=1 i=1 ni
Sob esta hipótese, o valor W, definido
Total k ni G 2
(n - 1 )σ 2 (n - 1 )σ 2
∑ ∑ Y 2ij - anteriormente é igual a zero. Então, tem-se:
i j n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
9
A Tabela da ANOVA
Causa da Grau de Soma dos Espec. Do Esp. da
Variação
Variaç Liberdade Quadrados Quadrado Soma (sob
(G.L.) (S. Q.) Médio H0 ) Causa da Grau de Soma dos Quadrado F
Variação Liberdade Quadrados Médio
Tratamentos k-1 k A 2i G2 W + σ2 σ2
∑ -
i ni n k -1 Tratamentos k-1 SQTrat. MQTrat. MQTrat.
MQRes
Resíduos n–k k ni
∑ ∑ Y 2ij - ∑
k A2
i σ2 σ2 Resíduos n–k SQRes. MQRes
i=1 j =1 i=1 n i
Total n–1 SQTotal
Total n–1 k ni 2
G
∑ ∑ Y 2ij -
i j n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O Teste F A Distribuiç
Distribuição F (de Snedecor)
Pode-se demonstrar que se X1 e X2 são Uma variável aleatória X tem uma
variáveis aleatórias independentes com distribuição “F” ou de Snedecor se sua fdp for do
distribuições Qui-Quadrado de g1 e g2 graus de tipo:
m n m
m + n 2 2 2 -1 m+n
liberdade, respectivamente, então a variável Γ( )m n x ( n + mx ) - 2
2
resultante do quociente: (X1 /g1)/(X2 /g2) f( x )= m n
se x > 0
Γ ( ) Γ( )
apresenta uma distribuição F com g1 e g2 2 2
0 se x ≤0
graus de liberdade. Anota-se F(g1 ; g2).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
m liberdade do 0,8
F(1, 3)
E (X )= numerador e n F(2, 5)
m -2 0,6
do denominador 0,4
F(5, 10)
F(20, 20)
2 (m + n - 2 ) - m 2 0,2
Var(X) =
m(n - 2 )(n - 4 ) 0,0
0 1 2 3 4 5 6 7 8
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
10
Planilha Exemplo
O que é tabelado é a área à direita de cada (a) Dada uma distribuição F com
curva (funç
(função direta), isto é, dado um certo parâmetros g.l. do numerador = 3 e g.l.
valor de “f”, tem-se: P[F(m, n) ≥ f] = α, ou do denominador igual a 5, determinar
dado uma área à direita α pode-se determinar o P(F ≥ 2,5)
valor “f” que satisfaça P[F(m, n) ≥ f] = α
(b) O valor de “f” tal que P(F ≤ f) = 80%.
( funç
função inversa).
inversa).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exercí
Exercício Dados
Com base em um teste preliminar um grupo
Ótimo Bom Regular Fraco
de alunos foi classificado de acordo com o 9,4 7,5 7,0 6,8
desempenho em: Ótimo, Bom, Regular e Fraco. 9,0 6,8 7,3 7,0
Para verificar se este teste era útil como previsor 8,5 7,7 7,6 7,2
da média final dos alunos, amostras de cada 8,0 8,3 7,8 6,5
grupo foram selecionadas. Teste se existe 8,8 8,0 7,4
6,8 6,5
diferença entre as médias dos grupos ao nível de
6,5
1% de significância.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
11
Intervalos de confianç
confiança
Um intervalo de confiança de (1 – α)
Um intervalo de confiança de (1 – α) para a para a diferença nas médias de dois
média do i-ésimo tratamento µi é dado por: tratamentos µi - µj também pode ser
determinado.
MQR es MQR es O estimador de µi - µj é Y i-Y j e a
Y i − tn−k ≤ µ i ≤ Y i + tn−k
ni ni variância desse estimador é:
σ2 σ2 1 1
V ( Y i -Y j )= + = σ2( + )
ni n j ni n j
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
independente.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
12
Comparações Múltiplas
Comparaç
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
O método de Tukey
Assim se tivermos cinco grupos e dez O método de Tukey é também denominado
comparações o nível de significância final , de Teste DHS (Diferenças Honestamente
considerando cada teste com 5% de Significativas – Honestly Significant
significância, será de: Difference). Ele foi projetado para manter a
αf = 1 – (1 – α)c = 1 – (1 – 0,05)10 = taxa de Erro do Tipo I a um nível de
= 40,13% significância α.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
13
A distribuiç
distribuição Q
A hipótese nula para cada para sendo
A distribuição Q é denominada de
comparado é:
Distribuição da Amplitude Estudentizada
H0: µi = µj para i ≠ j, (Studentized Range Distribuition).
Isto é, cada par das médias populacionais
Suponha que se tenha n observações
são iguais. A estatística teste Q é definida
independentes y1, ..., yr retiradas de uma
por: Xi– X
Q =
j distribuição normal com média µ e desvio σ.
EMQ/n
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
14
No desenvolvimento da distribuição Q o Esta expressão é válida quando a
número de grupos variou, mas o número de ANOVA é balanceada, isto é, todos os grupos
observações em cada um dos grupos k é o
apresentam o mesmo tamanho.
mesmo. Isto e ni = n é o mesmo para os k
Quando os grupos diferem uma versão
grupos. Os valores críticos são dependentes do
número de grupos comparados k e o gl modificada é utilizada. Neste caso o teste é
associado com a estimativa da variância da denominado de método de Tukey-Kramer
população EQM, isto é, Q(n-k, k). (TK).
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo:
Exemplo:
A expressão para o cálculo da estatística Suponha que um método de produção
de TK é dada por: Xi– X
possa ser executado de 4 formas diferentes:
j
Q = A, B, C e D. A tabela da ANOVA é dada
1/ n i + 1 / n j
EMQ( )
2 (próxima lâmina). Como o valor F(3, 29) é
A distribuição amostral é Q e é dada em 2,93 e o Fc = 10,47 é significativo, determinar
função (para 5% e 1%) do grau de liberdade através do método de TK quais diferenças de
(gl) e de k = número de tratamentos. médias são significativas.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Tabela da Anova
Grupo A B C D O valor da estatística Q para o método
21,86 23,00 17,29 16,80
TK é encontrado através de tabelas. Neste
ni 7 9 7 10
Resumo da ANOVA caso, r = 4 e v = 29 o valor para uma
Causa GL SQ MQ F F0,05 significância de 5% é 3,86.
Trat. 3 255,45 85,15 10,47 2,93
Assim µ1 é diferente de µ3 e µ4.
Resíduo 29 235,89 8,13
Total 32 491,34 E µ2 é diferente de µ3 e µ4.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
15
Relação entre a ANOVA e o teste t
Cálculos do valor Q utilizando o método TK
Q 1-2
21,86 - 23,00
= - 1 ,12 23,00 - 17,29 Ao testar a hipótese H0 para amostras
Q 2 -3 = - 5 ,62 *
1/7 + 1/9 1/9 + 1/7
8,13( ) 8,13( ) independentes pode ser utilizado tanto o teste
2 2
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
16
ANOVA de medidas repetidas Hipóteses da ANOVA MR:
Causa da Grau de Soma dos Quadrado F 1. As amostras são aleatórias;
Variação Liberdade Quadrados Médio
Sujeitos MQ 2. A variável dependente é normalmente
k-1 SQI MQI I/MQR
distribuída;
Ocasiões l–1 SQO MQT MQ
T/MQR 3. As variâncias das repetições são
Resíduo (k-1)(l-1) SQR MQR homogêneas;
4. Os coeficientes de correlação entre os pares
Total n–1 SQT
de repetições são iguais.
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Exemplo: Dados
Sujeito Teste 1 Teste 2 Teste3
A 6 12 18
Um teste foi aplicado a um conjunto de B 9 14 16
10 pessoas em três ocasiões diferentes. A C 4 8 15
D 3 10 12
variável dependente é o desempenho nos testes E 1 6 10
nas diferentes ocasiões. O interesse é verificar F 7 15 20
G 6 8 15
se existe diferença entre os testes. H 9 11 18
I 8 12 13
J 6 10 16
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Solução:
k l G2
SQT = ∑ ∑ Y 2
ij - k = número de repetições (tratamentos)
i=1 j=1 n
l = número de pessoas em cada repetição (casos)
k A2 G2
SQ = ∑ i -
T
i= 1 l n n = total de dados ⇒ n = k.l
Ai = soma de cada repetição (tratamentos)
l 2 G2
SQ I = ∑ B i - Bi = soma dos resultados do i-ésimo caso (linhas)
i= 1 k n
G = soma de todos os valores = ΣAi = ΣBi
SQR = SQT - SQI - SQO
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
17
Resumo:
k m G2 Causa da Grau de Soma dos Quadrado F
SQT = ∑ ∑ Y 2ij - = 4054 - 3413 ,33 = 640 ,67
i=1 j =1 n Variação Liberdade Quadrados Médio
l B 2i G 2 Sujeitos 10 – 1 = 9 167,33 18,59 6,68
SS I = ∑ - = 3580 ,6667 - 3413 ,333 = 167 ,33
i= 1 k n Testes 3–1=2 423,27 211,64 76,09
Resíduo (3-1)(10-1) 50,07 2,78
k A 2i G 2
SQ T = ∑ - = 3836 ,60 - 3413 ,33 = 423 ,27 = 2.9 = 18
i=1 l n
Total 30 – 1 = 29 640,67
SQR = SQT - SQI – SQO = 50,07
Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística
Conclusão:
18