Beruflich Dokumente
Kultur Dokumente
IC 283 BIOESTATSTICA
IC 284 ESTATSTICA EXPERIMENTAL
Marcelo Jangarelli
Prof. Adjunto DEMAT/ICE/UFRRJ
IC 283 BIOESTATSTICA
IC 284 ESTATSTICA EXPERIMENTAL
Marcelo Jangarelli
Prof. Adjunto DEMAT/ICE/UFRRJ
Sumrio
01
II
Testes de Hipteses
05
III
16
IV
20
Experimentos Fatoriais
37
VI
Regresso Linear
42
VII
Listas de Exerccios
47
VIII
Gabarito
62
Referncias
65
Apndice
66
CONTEDO I
DISTRIBUIO AMOSTRAL E INTERVALO DE CONFIANA
1 INTRODUO
Ao retirarmos uma amostra aleatria de uma populao e calcularmos a partir desta
amostra qualquer quantidade (medidas descritivas numricas), encontramos a estatstica, ou
seja, chamaremos os valores calculados em funo dos elementos da amostra de estatsticas.
As estatsticas, sendo variveis aleatrias, tero alguma distribuio de probabilidade,
com uma mdia, uma varincia, etc. A Distribuio de Probabilidade de uma estatstica
denominada de Distribuio Amostral.
A Inferncia Estatstica tem por objetivo fazer generalizao sobre uma populao
com base em dados de uma amostra (Estatsticas). As populaes so caracterizadas por
medidas descritivas numricas, chamadas de parmetros. Muitas pesquisas tem por objetivo
fazer inferncia a respeito de um ou mais parmetros da populao. Essa inferncia pode ser
por meio de um nico valor numrico (Estimao por Ponto), por uma amplitude de valores
numricos (Estimao por Intervalo) ou pelo simples sim ou no (Teste de Hiptese).
Como exemplo, considere uma nova marca de inseticida lanada no mercado. A
pesquisa pode ter diversos interesses: i) saber qual dose de inseticida mata 90% dos insetos
(estimao por ponto); ii) desejar um intervalo da dose com coeficiente 1 de confiana
para que se tenha a mortalidade de 90% dos insetos (estimao por intervalo); iii) ou ainda o
interesse poderia focar se o inseticida novo melhor do que os j existentes no mercado
(testes de hipteses).
A estimao por ponto utiliza a informao da amostra para chegar a um nico valor
numrico ou ponto, que estima o parmetro de interesse (parmetro populacional). Ex: Mdia,
Varincia, Coeficiente de Variao, etc.
A estimao por intervalo utiliza a informao da amostra para chegar a dois nmeros,
entre os quais pretende-se que esteja o parmetro de interesse. Caso esse intervalo esteja
associado a uma probabilidade 1 , tem-se um intervalo de confiana com coeficiente de
confiana de 1 .
2 DEFINIES
Populao: o conjunto de todos os elementos sobre os quais desejamos desenvolver
determinado estudo;
Amostra: uma parte desses elementos, ou seja, qualquer subconjunto da populao;
Parmetro: uma medida utilizada para descrever uma caracterstica da populao;
Estatstica: uma caracterstica da amostra, ou seja, uma estatstica T uma funo
de X1, X2, X3, ..., Xn T = f (X1, X2, X3, ..., Xn);
Estimador: qualquer estatstica T = f (X1, X2, X3, ..., Xn) utilizada para estimar uma
quantia desconhecida. Em geral, ele representado por uma determinada frmula;
Estimativa: o valor numrico assumido pelo estimador quando os valores
observados (X1, X2, X3, ..., Xn) so considerados.
3 DISTRIBUIO AMOSTRAL DA MDIA
A distribuio amostral de determinada estatstica a distribuio de todos os
possveis valores que ela pode assumir, calculados a partir de todas as possveis amostras de
mesmo tamanho.
Para determinado tamanho n da amostra, tomada de uma populao com mdia ,
o valor da mdia amostral ( X ) ir variar de uma amostra para outra. A distribuio amostral
da mdia descrita para determinar o valor esperado [E( X )] e o desvio padro [( X )] da
distribuio das mdias. Uma vez que este desvio padro indica a acurcia da mdia da
amostra como um estimador por ponto, ( X ) usualmente chamado de erro padro da
( X ) =
Se o desvio padro da populao () for desconhecido o erro padro da mdia pode ser
estimado por meio do desvio padro amostral (s).
s( X ) =
s
n
P X Z
X + Z
=1
n
n
2
2
IC () 1 : X Z
2
t (n 1) g .l.
2
EXERCCIOS PROPOSTOS
1 Uma Varivel Aleatria X tem distribuio normal, com mdia 100 e desvio padro 10.
a) Qual a P (90 < X < 110)?
b) Se X a mdia de uma amostra de 25 elementos, calcular P (95 < X < 105);
c) Qual tamanho deveria ter a amostra para que P (90 < X < 110) fosse obtido a 95% de
confiana?
2 Seja X a durao da vida de uma pea de equipamento tal que = 5 horas. Admita que
100 peas foram ensaiadas fornecendo uma durao de vida mdia de X = 500 horas.
a) Obter um intervalo de 95% para a mdia ;
b) Qual o tamanho da amostra para o intervalo obtido? IC ()95%: 500 1,63
c) Com a amostra de 100 peas foi obtido o intervalo 500 0,765. Determinar a
confiana (%) utilizada para obter este intervalo;
3 Em uma amostra aleatria de 25 crianas de uma determinada comunidade encontrou-se
altura mdia 150 cm e desvio padro 5 cm. Admitindo que a distribuio das alturas das
crianas normal, determine:
a) Um intervalo de 95% de confiana para a altura mdia da populao;
b) O comprimento do intervalo obtido na letra a.
CONTEDO II
TESTES DE HIPTESES
1 INTRODUO
amostrais (X1, X2, ..., Xn). Ele representa uma determinada frmula de clculo, fornecendo
valores diferentes conforme a amostra selecionada;
Estimativa o valor numrico assumido pelo estimador quando os valores
uma regra decisria que nos permite aceitar ou rejeitar uma hiptese estatstica com
base nos elementos de uma amostra. Estas hipteses so, em geral, sobre parmetros
populacionais ou relacionadas natureza da distribuio da populao.
ao
fato
dessas
hipteses
serem
contrastantes
mutuamente
excludentes,
a faixa de valores da estatstica do teste que nos leva a rejeio da hiptese H0, ou
seja, a RC para um teste de hiptese a que nos leva a rejeio de H0. vlido ressaltar que o
teste estatstico construdo na suposio de que H0 verdadeiro.
Caso o valor observado da estatstica do teste (F, t, 2 , etc.) pertena regio crtica,
rejeitamos H0, caso contrrio, no rejeitamos ou aceitamos H0.
3.3 Tipos de Erros
Para qualquer deciso que tomarmos, a partir de uma amostra da populao, estaremos
sujeitos a erros, pois trabalhamos com amostras e no com a populao como um todo.
3.3.1 Erro tipo I ou erro
Realidade
H0 verdadeiro
H0 falso
Rejeitar H0
No rejeitar H0
Rejeita-se H0 se X C1 ou X C2.
H0 : = K
H1 : K
3.5 Etapas para construo de um Teste de Hiptese
3. Estabelecer o valor crtico (C) ou os valores crticos (C1 e C2) da estatstica do teste
em funo do nvel e das tabelas estatsticas apropriadas;
4. Determinar o valor real da estatstica do teste por meio dos elementos amostrais;
5. Tomar a deciso pela no rejeio ou rejeio de H0 (concluso) pela comparao do
valor obtido na 4 etapa com o valor crtico (ou valores crticos) fixado (s) pela
estatstica do teste na 3 etapa.
4 DISTRIBUIO t DE STUDENT E O TESTE PARA UMA MDIA DA
POPULAO COM DESVIO PADRO POPULACIONAL () DESCONHECIDO
(Teste t)
Para testar hipteses referentes mdia de uma populao, cujo desvio padro
populacional () desconhecido, utiliza-se a estatstica t (Teste t), definida por:
t calc. =
X X
=
,
s
s( X )
n
OBS: A tabela da distribuio t de Student a ser utilizada em nossas aulas bilateral. Assim,
se o teste efetuado for bilateral, entra exatamente com o na tabela. Caso contrrio, o teste
realizado seja unilateral, deve-se entrar com 2 na tabela.
5 DISTRIBUIO t DE STUDENT E O TESTE PARA COMPARAR MDIAS DE
DUAS AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS COM
VARINCIAS DESCONHECIDAS (Teste t)
10
Sejam as hipteses:
H0 : x2 = y2
H1: x2 > y2 ou
x2 < y2 ou
x2 y2
Para testar H0, utiliza-se a estatstica F (Teste F), definida por:
FCalc. =
s x2
,
s 2y
11
Quando H0 no for rejeitada. Admitimos que as varincias sejam iguais, cujos valores
assumidos por s A2 e s B2 so estimativas de um mesmo valor 2. Devemos combinar essas
varincias ( s A2 e s B2 ), estimando-se uma varincia comum ( sC2 ).
sC2 =
s A2 =
SQD A
SQD A = (n A 1).s A2
nA 1
s B2 =
SQDB
SQDB = (n B 1).s B2
nB 1
X Y
1
1
sC2
+
n A nB
ttab. = f ( ; nA + nB 2 g.l.)
Tomada de deciso (concluso):
Se t calc. ttab: Rejeita-se H0;
Se t calc. < ttab: No Rejeita-se H0 ou Aceita-se H0.
X Y
s A2 s B2
+
n A nB
12
n* =
s A2 s B2
+
n A nB
s 2A
s B2
nA + nB
n A 1 nB 1
ttab. = f ( ; n* g.l.)
OBS: Adotar como g.l. o maior valor inteiro desde que no supere o valor calculado.
administrar
um
determinado
fertilizante.
Referimo-nos a
isto
como
13
n
di
n
i =1
2
di
n
i =1
n 1
d
d=
i =1
sd =
sd
n
Sejam as hiptese:
H0 : D = 0
H1 : D > 0 ou
D < 0 ou
D 0
Para testar H0, utiliza-se a estatstica t de Student, definida por:
t calc. =
di D
sd
Sob H0 D = 0:
t calc. =
di 0 di
=
,
sd
sd
n
que tem distribuio t de Student, cujo grau de liberdade representa o nmero de pares
observados menos um, ou seja, (n 1) graus de liberdade (g.l.).
ttab. = f [; (n 1)g.l.]
14
EXERCCIOS PROPOSTOS
1 Um fertilizante foi aplicado a uma variedade de tomate. As produes, em kg, de dez ps
de tomate foram: 1,6; 1,7; 1,8; 1,4; 1,5; 1,9; 2,3; 2,1; 1,9 e 1,7 Kg. Verificar se o fertilizante
proporciona uma produo superior a 1,5 kg por p de tomate. Adotar = 5%.
2 Em indivduos sadios o consumo renal de oxignio (O2) distribui-se normalmente com
mdia de 12 cm3/minuto. Deseja investigar, com base em cinco indivduos portadores de certa
doena, se esta tem influncia no consumo renal mdio de O2. Os consumos medidos para os
cinco pacientes foram: 14,4; 12,9; 15,0; 13,7 e 13,5 cm3/minuto. Qual a concluso ao nvel de
1% de significncia?
3 Os dados a seguir referem-se a um experimento de competio de duas prognies de
Eucalyptus saligna. Cada prognie foi cultivada em solos com caractersticas semelhantes e a
avaliao das plantas foi feita pela mdia dos dimetros altura do peito (DAP) de cada
parcela. Foram utilizadas dez parcelas para cada prognie. Avaliar as prognies (A e B) com
relao caracterstica mensurada. ( = 5%)
Prognie A
Prognie B
15,4
13,5
Mdia DAP (cm)
2,5
3,0
Varincia DAP (cm2)
10
10
Nmero de Parcelas
5 A Tabela abaixo apresenta dados da presso sangunea sistlica de dez mulheres, na faixa
etria de 30 a 35 anos, que fizeram uso de anovulatrio por determinado perodo e depois no
o fez, e vice e versa. Teste a hiptese de que o uso de anovulatrio no tem efeito sobre a
presso sangunea sistlica. ( = 5%)
Anovulatrio
Mulheres (30 35 anos)
111 119 121 113 116 126 128 123 122 121
Sim
109 113 120 117 108 120 122 124 115 112
No
15
CONTEDO III
PRINCPIOS BSICOS DA EXPERIMENTAO
1 INTRODUO
Grande parte do conhecimento que a humanidade acumulou ao longo dos sculos foi
adquirido atravs da experimentao. A ideia de experimentar no se limita a antiguidade,
pois tambm est presente no nosso dia a dia. Todos ns j aprendemos alguma coisa ao
longo da vida experimentando. Entretanto, a experimentao s se difundiu como tcnica
sistemtica de pesquisa h pouco mais de um sculo, quando foi formalizada atravs da
estatstica (Vieira, 2006).
Entende-se por experimento uma experincia realizada sob condies previamente
estabelecidas e que opera com causas controladas. O propsito da estatstica experimental
analisar, objetivamente, os dados experimentais, isolando as causas da variao do acaso,
prprias de qualquer conjunto de dados observados (Dias & Barros, 2009).
A experimentao tem por objetivo o estudo dos experimentos, ou seja, seu
planejamento, execuo, anlise dos dados e interpretao dos resultados.
2 CONCEITOS
17
3.2 Casualizao
4.2 Sistemtica
experimental,
que
podem
ser
controladas
pelo
pesquisador.
Exemplo:
19
CONTEDO IV
DELINEAMENTOS EXPERIMENTAIS E TESTE DE COMPARAO DE MDIAS
1 DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
20
Repeties
1
2
.....
J
Totais
Tratamentos
2
.....
Y21
.....
Y22
.....
.....
.....
Y2J
.....
T2
.....
1
Y11
Y12
.....
Y1J
T1
I
YI1
YI2
.....
YIJ
TI
N de unidades experimentais: N = I x J
Total geral: G =
I ,J
i =1
j =1
i =1
Yij = Ti
ij
j =1
Ti
J
G
IJ
uma tcnica de anlise estatstica que permite decompor a variao total, ou seja, a
variao existente entre todas as observaes, na variao devido diferena entre os
tratamentos e na variao devido ao acaso (erro experimental ou resduo). Entretanto, para
que esta tcnica seja empregada necessrio que sejam satisfeitas diversas pressuposies,
entre elas citam-se:
Os erros so variveis aleatrias independentes;
A varincia constante (homocedasticidade);
A distribuio dos erros normal ou aproximadamente normal.
21
Por meio do modelo estatstico pode-se decompor a variao total entre as observaes
em duas partes que a compem, como ser demonstrado a seguir.
Considere o modelo estatstico para um experimento instalado segundo o DIC:
Yij = m + ti + eij ,
fazendo ti = mi m, tem-se:
I ,J
(Y
ij
I,J
I ,J
m) 2 = ( m i m) 2 + eij2
i =1
j =1
i =1
j =1
i =1
j =1
SQTotal =
I ,J
(Y
ij
m) 2 =
I ,J
2
ij
ij
)2
ij
)2
i =1, j =1
IJ
i =1
j =1
i =1
j =1
Para a SQTratamento:
I ,J
T2
SQTrat. = (m i m) 2 = i
i =1
i =1 J
I ,J
j =1
22
Y
i =1, j =1
IJ
SQTrat. =
Ti
i =1 J
ij
i =1, j =1
)2
,
em que:
I
r ;
i
i =1
GL
SQ
QM
Tratamentos
(I 1)
SQTrat.
SQTrat
I 1
QMTrat
QM Re s
Resduo
I(J 1)
SQRes.
SQ Re s
I ( J 1)
Total
IJ 1
SQTotal
23
C.V .(%) =
Q Re sd
^
.100 , em que m =
G
N
24
C.V.(%)
< 10%
10% a 20%
20% a 30%
> 30%
Preciso
Alta
Mdia
Baixa
Muito Baixa
R2 =
SQTrat.
SQTotal
25
=0
i =1
26
mdias obtidas por meio de experimentos ou amostras. Assim, o estimador para o contraste de
mdias dado por:
^
= a1 m1 + a2 m 2 + ... + an mn
3.2 Teste de Tukey
O teste de Tukey, baseado na amplitude total estudentizada, pode ser utilizado para
comparar todo e qualquer contraste entre duas mdias de tratamentos. Ou seja, para n I
tratamentos (nmero de tratamentos ou de nveis do fator em estudo) podero ser
estabelecidos nI(n I 1)/2 contrastes do tipo Yij = mi mj, para i j.
Este teste baseia-se na diferena mnima significativa (DMS), representada por , dada
por:
=q
1 ^ ^
V (Y )
2
em que:
= a diferena mnima significativa (DMS );
q = o valor tabelado da amplitude estudentizada, que obtido pela expresso:
1 1 1
+
QM Re s
2 ri r j
QM Re s
r
27
H0: mi = mj
H1: mi mj , para i j
^
Se Y ij , rejeita-se H0;
Neste caso a concluso ser nica para todos os contrastes que se fizerem necessrio
avaliar: As mdias seguidas por pelo menos uma mesma letra no diferem entre si ao nvel
de probabilidade pelo Teste de Tukey.
subdividir os animais em blocos de tal forma que cada bloco possa ser homogneo dentro de
si, por exemplo: com relao a idade; peso; raa; etc.
Em experimentos instalados segundo o DBC, no importa que as condies
experimentais de um bloco sejam diferentes das condies experimentais do outro bloco. O
importante a homogeneidade dentro de cada bloco.
4.1 Vantagens e Desvantagens do DBC
4.1.1 Vantagens
Se o controle local se fizer necessrio, esse delineamento mais eficiente que o
29
Blocos
1
2
.....
J
Totais
Tratamentos
2
.....
Y21
.....
Y22
.....
.....
.....
Y2J
.....
T2
.....
1
Y11
Y12
.....
Y1J
T1
I
YI1
YI2
.....
YIJ
TI
Totais
B1
B2
.....
BJ
G
N de unidades experimentais: N = I x J
I ,J
Total geral: G =
ij
i =1
j =1
= Ti = B j
i =1
j =1
ij
j =1
I
ij
i =1
^
Ti
J
Bj
I
^
G
IJ
30
SQTotal =
I ,J
2
ij
ij
)2
i =1, j =1
IJ
i =1
j =1
I ,J
T2
SQTrat. = i
i =1 J
I
ij
i =1, j =1
IJ
I,J
SQBloco =
j =1
B
I
2
j
)2
ij
)2
i =1, j =1
IJ
GL
SQ
QM
Blocos
(J 1)
SQBlocos
Tratamentos
(I 1)
SQTrat.
SQTrat
I 1
QMTrat
QM Re s
Resduo
(I 1)(J 1)
SQRes.
SQ Re s
( I 1)( J 1)
Total
(IJ 1)
SQTotal
H0: m1 = m2 = ... = mI = m
H1: no H0
Ou,
Todos os possveis contrastes entre as mdias dos tratamentos so estatisticamente
nulos ao nvel de probabilidade/significncia;
Existe pelo menos um contraste entre as mdias dos tratamentos estatisticamente
diferente de zero ao nvel de probabilidade/significncia.
31
B, C, D, E), programados em cinco dias teis e, em cada dia, feita uma anlise a cada hora,
totalizando um perodo de cinco horas.
O quadrado latino assegura que todos os mtodos sejam processados uma nica vez
em cada perodo e em cada dia. O quadro abaixo ilustra a configurao a ser adotada.
Perodos
1
2
3
4
5
1
A
C
D
E
B
Dias
3
C
E
A
B
D
2
E
B
C
D
A
4
D
A
B
C
E
5
B
D
E
A
C
OBS: Note que os nveis de uma fonte formam as linhas e os nveis da outra fonte formam as
colunas.
32
rao (A, B, C, D), em quatro raas distintas e em quatro idades de animais. Como o interesse
avaliar os quatro tipos de rao, tomam-se as raas e as idades dos animais como blocos, ou
seja:
Raas
Idades
I1
I2
I3
I4
R1
A
B
D
C
R2
B
C
A
D
R3
D
A
C
B
R4
C
D
B
A
de tratamentos;
Cada tratamento representado uma nica vez, e ao acaso, em cada linha e em cada
coluna;
O nmero de tratamento igual ao nmero de repeties;
Este delineamento aconselhvel quando o nmero de tratamentos oscila entre 3 e 10.
GL
SQ
QM
Linhas
(I 1)
SQLinhas
Colunas
(J 1)
SQColunas
Tratamentos
(K 1)
SQTratamentos
QMTrat.
Resduo
(K 1)(K 2)
SQResduo
QMRes.
QMTrat
QM Re s
SQTotal
Total
(K 1)
33
Considerando:
LI = Total da linha i;
CJ = Total da coluna j;
TK = Total do tratamento k;
G = Total geral.
SQTotal =
I ,J
Yij2 C
C=
ij
i =1, j =1
i =1
j =1
IJ
SQLinhas =
1 I 2
Li C
I i=1
SQColunas =
1 J 2
C j C
I j =1
SQTratamentos =
)2
=
G2 G2
= 2
IJ
I
1 K 2
Tk C
I k =1
34
EXERCCIOS PROPOSTOS
1 Para comparar o crescimento de mudas de quatro espcies de eucalipto um pesquisador
tomou 20 parcelas similares e distribuiu, inteiramente ao acaso, cada uma das quatro espcies
em cinco parcelas experimentais. A partir dos dados fornecidos abaixo, possvel concluir
que existe diferena significativa entre as espcies com relao ao crescimento das mudas?
Utilizar o nvel de significncia de 5%.
Totais
A
25
26
20
23
21
115
Espcies
B
C
31
22
25
26
28
28
27
25
24
29
135
130
D
33
29
31
34
28
155
Mandioca
23,40
22,37
24,36
25,12
22,94
-
Araruta
35,42
32,47
34,48
33,79
35,04
35,19
Batata Doce
22,15
24,37
26,54
20,37
19,54
24,06
N. de Colnias Bacterianas
19
31
15
30
40
35
46
41
33
39
27
20
29
45
27
12
13
28
30
Totais
95
195
160
110
35
1
30
29
43
23
125
2
32
31
47
25
135
3
33
34
46
21
134
Grupos
4
34
31
47
19
131
5
29
33
48
20
130
6
30
33
44
21
128
7
33
29
47
22
131
Totais
221
220
322
151
914
1
40,8 (A)
66,3 (C)
33,4 (D)
60,2 (E)
51,7 (B)
252,4
2
57,3 (E)
46,5 (B)
70,6 (C)
35,6 (D)
48,7 (A)
258,7
Dias
3
61,8 (C)
54,8 (E)
53,2 (A)
54,2 (B)
29,8 (D)
253,8
a) ANOVA;
b) Aplicar o Teste de Tukey, se necessrio.
36
4
38,6 (D)
38,7 (A)
41,7 (B)
64,0 (C)
55,3 (E)
238,3
5
50,6 (B)
30,2 (D)
50,1 (E)
45,3 (A)
65,7 (C)
241,9
Totais
249,1
236,5
249,0
259,3
251,2
1.245,1
CONTEDO V
EXPERIMENTOS FATORIAIS
1 INTRODUO
simultaneamente. O primeiro com dois nveis, o segundo com quatro nveis e o terceiro com
seis nveis. Quando o nmero de nveis igual para todos os fatores pode-se utilizar a
seguinte simbologia: nF, em que: F o nmero de fatores e n o nmero de nveis de cada
fator. Exemplo: 43 indica que no experimento fatorial foram testados trs fatores com
quatro nveis cada (4 x 4 x 4).
2 VANTAGEM E DESVANTAGEM DO EXPERIMENTO FATORIAL
2.1 Vantagem
Permite o estudo dos efeitos principais dos fatores e a interao entre fatores;
37
2.2 Desvantagem
Requer maior nmero de unidades experimentais em comparao aos experimentos
simples.
3 EFEITOS AVALIADOS EM UM EXPERIMENTO FATORIAL
B2
Y121
Y122
...
Y12K
A1B2
A2
...
...
...
...
...
...
BJ
Y1J1
Y1J2
...
Y1JK
A1BJ
B1
Y211
...
...
Y21K
A2B1
B2
Y221
...
...
Y22K
A2B2
...
...
...
...
...
...
BJ
Y2J1
...
...
Y2JK
A2BJ
ijk
k =1
K ;J
ijk
k =1
j =1
K ;I
ijk
k =1
i =1
Total geral: G =
K ;J ;I
ijk
k =1
j =1
i =1
38
...
...
...
...
...
...
...
AI
B1
YI11
...
...
YI1K
AIB1
B2
YI21
...
...
YI2K
AIB2
...
...
...
...
...
...
BJ
YIJ1
...
...
YIJK
AIBJ
Ai
JK
Bj
Mdia geral: m =
IK
G
IJK
A tabulao dos dados fornecida acima pode ser resumida no quadro a seguir:
Bj \ Ai
B1
B2
...
BJ
Total
A1
A1B1
A1B2
...
A1BJ
A1
A2
A2B1
A2B2
...
A2BJ
A2
...
...
...
...
...
...
AI
AIB1
AIB2
...
AIBJ
AI
Total
B1
B2
...
BJ
G
5 ANLISE DE VARINCIA
GL
(I 1)
SQ
SQA
QM
QMA
Fator B
(J 1)
SQB
QMB
Interao (AxB)
(I 1)(J 1)
SQ(AxB)
QM(AxB)
Tratamento
Resduo
Total
(IJ 1)
(IJ)(K 1)
(IJK 1)
SQTrat.(AB)
SQResduo
SQTotal
QMRes.
-
SQTotal =
I ,J ,K
Y
i =1
j =1
k =1
SQTrat(AB) =
1
K
I,J
2
ijk
G2
IJK
( Ai B j ) 2
i =1
j =1
39
G2
IJK
F
QMA
QM Re s
QMB
QM Re s
QMAxB
QM Re s
-
SQA =
SQB =
1
JK
Ai2
i =1
G2
IJK
1 J 2 G2
B j IJK
IK j =1
ou
SQResduo = SQTotal SQA SQB SQ(AxB)
Ou,
H0: Todos os possveis contrastes entre as mdias dos nveis do fator A so estatisticamente
Fator B:
Ou,
H0: Todos os possveis contrastes entre as mdias dos nveis do fator B so estatisticamente
40
Efeito da Interao
Os valores de Fcal obtidos na anlise de varincia para cada uma das fontes de variao
em teste (efeitos principais e efeito da interao) devem ser comparados com os valores de
Ftab apropriados, os quais sero obtidos na tabela para valores de F, de acordo com o nvel de
Pede-se:
a) ANOVA;
b) Aplicar o Teste de Tukey, se necessrio.
41
Totais
114,2
104,9
94,9
314,0
CONTEDO VI
REGRESSO LINEAR
1 INTRODUO
independentes.
Na anlise de regresso obtm-se uma equao que tenta explicar a variao da
varivel dependente pela variao dos nveis da (s) varivel (is) independente (s). As variveis
independentes so classificadas como quantitativas, cujos nveis representam diferentes
quantidades de um mesmo fator.
2 ANLISE DE REGRESSO
Para tentar estabelecer uma equao que representa o fenmeno em estudo pode-se
plotar (desenhar) um Diagrama de Disperso para verificar como se comporta os valores da
varivel dependente (Y) em funo da variao dos nveis da varivel independente (X). O
diagrama de disperso um grfico no qual cada ponto plotado representa um par observado
de valores para as variveis dependente e independente. O valor da varivel independente X
plotado no eixo horizontal, enquanto o valor da varivel dependente Y no eixo vertical.
O comportamento de Y em relao a X pode-se apresentar de diversas maneiras:
linear, quadrtico, exponencial, etc. Para estabelecer o modelo apropriado para explicar o
fenmeno, deve-se verificar qual o tipo de curva e equao de um modelo matemtico que
mais se aproxima dos pontos plotados no diagrama de disperso.
Contudo, pode-se observar que os pontos do diagrama de disperso no se ajustaro
perfeitamente ao modelo matemtico proposto. Existir, na maioria dos pontos, uma distncia
entre os pontos do diagrama e os pontos do modelo matemtico. Isto devido ao fato do
fenmeno em estudo no ser um fenmeno matemtico e sim um fenmeno sujeito a
42
influncias que acontecem ao acaso. Desta forma, o objetivo da regresso obter um modelo
matemtico que melhor se ajuste aos valores observados de Y em funo da variao dos
nveis da varivel X.
2.1 Modelo da Regresso Linear Simples e Mtodo de Estimao dos Parmetros
Yi = 0 + 1Xi + ei
em que:
independente X;
0 = Y 1 X
43
XY
Cov( X , Y )
1 =
=
Var. X
^
X Y
XY
n 1
( X )
X Y
SPXY
n
=
2
( X ) SQDX
n
n 1
^
Y = 0 + 1 X i
2.2 Avaliao Estatstica do Modelo
2.2.1 Anlise de Varincia da Regresso
estimativa do coeficiente de regresso ( 1 ). Um teste que pode ser realizado para verificar tal
fato o Teste F da Anlise de Varincia.
O quadro para Anlise de Varincia da Regresso fica assim estabelecido:
FV
Regresso
GL
p
SQ
SQRegresso
Resduo da
Regresso
n1p
SQResduo
Total
n1
SQTotal
QM
SQ Re gres.
p
SQ Re sd .
n 1 p
-
em que:
p Nmero de Coeficientes de Regresso (no inclui o 0);
n Nmero de observaes ou nveis;
44
F
QM Re gres.
QM Re sd .
SQTotal =
( Yi ) 2
2
i =1
SQRegresso =
(SPXY )2
SQD X
i =1
n
^
= 1 ( SPXY )
(SPXY )
SQ Re gresso
R =r =
=
SQTotal
SQD X .SQDY
2
45
O Grfico da Equao de Regresso Estimada pode ser obtido atribuindo valores para
a varivel independente e, consequentemente, obtendo os respectivos valores estimados para a
varivel dependente. Esses pares de valores so plotados nos respectivos eixos X e Y, obtendo
assim o grfico da equao de regresso estimada.
A distncia dos pontos observados no experimento em relao ao grfico (curva ou
reta) da equao de regresso estimada tambm uma indicao da adequao ou no do
modelo de regresso proposto para descrever o fenmeno.
EXERCCIOS PROPOSTOS
1 De acordo com os dados fornecidos abaixo para a varivel X (dose de Zn em ppm) e para a
varivel Y (MS (g)/planta), pede-se:
1,0
20,3
2,5
26,3
4,0
29,6
5,5
31,1
7,0
32,2
8,5
34,7
20
43
30
41
40
34
50
30
60
26
46
70
23
80
18
1 O peso dos ovos de determinada linhagem de ave de postura tem distribuio normal, com
mdia de 65 gramas e desvio padro de cinco gramas. Considere uma amostra aleatria de
uma dzia (caixa) desses ovos. Qual a probabilidade de que o peso desta amostra (caixa)
esteja compreendido entre o intervalo de 750 e 825 gramas?
2 Para avaliar a preciso de uma balana de laboratrio, pesa-se repetidas vezes um objeto
padro de peso conhecido igual a 10 gramas. As leituras da balana tem distribuio normal.
Sabe-se que o desvio padro das leituras 0,0002 gramas. Pesa-se o objeto cinco vezes e o
resultado mdio 10,0023 gramas.
a) Estabelea um intervalo de 95% de confiana para a mdia de repetidas pesagens do
objeto;
b) Quantas pesagens ou medidas devem entrar no clculo da mdia a fim de que se
obtenha uma margem de 0,0001 de erro com 95% de confiana?
3 Uma agncia de propaganda, que atende a uma das principais estaes de rdio, gostaria
de calcular a quantidade mdia de tempo que a audincia gasta diariamente ouvindo radio. A
partir de estudos anteriores, o desvio padro calculado em 45 minutos.
a) Que tamanho de amostra necessrio se a agncia quiser ter 90% de confiana de
estar correta em um intervalo de 5 minutos?
b) Se for desejado um nvel de 99% de confiana, que tamanho de amostra necessrio
para o mesmo intervalo da alnea anterior ( 5 minutos)?
c) Faa inferncias a respeito dos tamanhos das amostras encontrados nas alneas
anteriores (a e b), explicando o motivo de ter encontrado dimenses distintas.
4 O tempo de reao de um novo medicamento pode ser considerado como tendo
distribuio normal. Deseja-se fazer inferncia sobre a mdia que desconhecida por meio de
um intervalo de confiana. Vinte pacientes foram sorteados ao acaso e tiveram seu tempo de
reao anotado. Os dados foram os seguintes (em minutos):
2,9
4,8
3,4
5,7
3,5
5,8
4,1
5,0
4,6
3,4
4,7
5,9
4,5
6,3
3,8
4,6
5,3
5,5
4,9
6,2
47
5 Estudos anteriores levam a supor que crianas de dois meses alimentadas exclusivamente
com leite do tipo A sofrem um aumento de peso que segue distribuio normal, com mdia
desconhecida, porm de varincia 9.000 gramas2. Escolhe-se ao acaso 20 crianas de dois
meses, alimentando-as exclusivamente com leite do tipo A. Nesta amostra o aumento de peso
mdio foi de 475 gramas. Obtenha um intervalo de 99% de confiana para o aumento mdio
do peso das crianas nas condies apresentadas.
6 O consumo mensal de calorias (kcal/g) de certa espcie de esquilos segue distribuio
normal com desvio padro 0,16. Recolheu-se uma amostra aleatria de dimenso 18 cuja
mdia amostral foi de 0,41.
a) Obtenha um intervalo de confiana a 95% para o consumo mdio de calorias;
b) Qual deve ser a dimenso da amostra para que um intervalo de confiana a 95% para a
mdia tenha amplitude 0,2?
7 Um conjunto, composto por 12 animais em experincia, foi alimentado com uma dieta
especial durante determinado tempo e verificou-se que os ganhos de peso (em kg) foram de:
25 22 30 26 24 39 32 26 32 33 28 30. Encontrar os limites de confiana
para a mdia ao nvel de 90% de probabilidade.
8 Qual deve ser a dimenso da amostra a recolher de uma populao normal de valor mdio
e desvio padro 10 de modo que o intervalo de confiana para a 99% tenha amplitude 1?
9 Considere que o comprimento dos corpos de uma espcie de camaro de gua doce
apresente distribuio normal. Uma amostra de 60 camares apresentou uma mdia de 5,315
cm e desvio padro 0,8293 cm.
a) Determine um intervalo de confiana a 99% para a mdia da populao;
b) Qual o erro padro associado mdia da amostra?
10 A altura (em mm) da espuma de sabo em uma bacia importante para os fabricantes de
detergentes e supe-se que sua distribuio normal. Foi efetuada uma experincia colocando
a mesma quantidade de detergente em 10 bacias de tamanho padro e, depois de certa
agitao da gua, mediu-se a altura da espuma. Obtiveram-se os seguintes resultados:
10
x
i =1
= 229
10
(x
= 1.553
i =1
48
25
35
35
25
45
20
30
15
20
30
25
30
1
5,0
2
5,2
3
5,4
4
4,8
5
5,1
6
4,9
7
5,0
8
5,2
9
5,5
10
5,6
49
1
3,8
2,5
2
4,2
4,2
3
2,3
2,5
4
3,3
2,2
5
3,4
2,0
6
3,1
1,8
7
3,0
2,0
8
2,5
2,0
40,3
18,6
40,0
20,3
39,6
23,6
35,2
22,2
32,0
20,9
0,32
0,72
0,49
0,90
0,51
0,67
0,45
0,83
0,70
0,67
0,52
0,93
0,35
0,80
0,60
0,75
0,32
0,72
0,49
0,90
0,51
0,67
0,45
0,83
0,70
0,67
0,52
0,93
0,35
0,80
0,60
0,75
50
1
130
129
128
126
130
643
Tcnicas de Preparao
2
125
131
130
129
127
642
3
127
129
131
128
130
645
51
cido Forte
Mdias
14,81
N de carros
10
Dado: SQResduo = 6,0264
Base Fraca
10,09
10
7,12
8,45
6,58
6,91
8,53
7,04
6,34
8,35
7,23
6,45
-
Existe algum tempo de pastejo no qual o ganho de peso mdio diferiu dos demais, ao
nvel de 5% de significncia?
5 Dez reprodutores foram separados em dois grupos independentes e alimentados com
raes diferentes, obtendo-se os seguintes ganhos de peso (kg):
Rao A
Rao B
5,0
8,0
6,0
9,0
7,0
6,0
4,0
7,0
3,0
10,0
52
0% de Farelo
0,60
0,62
0,61
0,64
0,63
10% de Farelo
0,82
0,85
0,78
0,79
0,80
20% de Farelo
0,79
0,83
0,82
0,81
0,82
30% de Farelo
0,82
0,81
0,79
0,80
0,79
m1 = 370
m 2 = 338
m 3 = 380 m 4 = 320
= 33
m 5 = 325
m 6 = 367
T1 = 120,6
T2 = 130,7
T3 = 140,8
T4 = 180,6
T5 = 115,6
9 Aplicar o teste de Tukey s comparaes mltiplas obtidas com as mdias dos tratamentos
de um experimento realizado no delineamento inteiramente casualizado (DIC). Concluir para
o nvel de 1% de probabilidade.
SQResduo = 438,8631
r1 = r2 = r3 = 4
r4 = r5 = 3
^
m1 = 230,6
m 2 = 217,2
m 3 = 204,9
m 4 = 209,9
m 5 = 188,3
10 Em uma propriedade agrcola foi realizado um experimento com cinco empregados. Eles
realizaram a pulverizao de cinco reas (uma rea/empregado) com pulverizadores costais
manuais (em condies iguais). No fim de cada turno de trabalho foi avaliado o consumo do
pulverizador por empregado, obtendo, para 10 turnos, as seguintes mdias (consumo em
litros/100m2):
^
53
Tratamentos
Totais
1
37,2
2
44,8
3
31,6
4
32,8
F.V.
Tratamento
Resduo
Total
G.L.
SQ
QM
33,82
2
11,5
13,7
14,1
8,9
Variedades
3
8,2
11,1
6,2
15,7
16,1
4
14,2
10,9
13,1
11,4
5
15,2
16,1
11,1
14,4
11,7
6
30
33
44
21
128
7
33
29
47
22
131
Totais
221
220
322
151
914
54
c) Com base no teste de Tukey, qual (is) seria (m) o (s) tipo (s) de alimentao a ser (em)
recomendado (s) s ovelhas?
d) Calcular o coeficiente de variao do experimento.
14 Um experimento no DBC, com quatro repeties, forneceu os dados abaixo:
Tratamentos
1
2
3
4
5
Totais
1
142,36
139,28
140,73
150,88
153,49
726,74
Blocos
2
3
144,78
145,19
137,77
144,44
134,06
136,07
135,83
136,97
165,02
151,75
717,46
714,42
4
138,88
130,61
144,11
136,36
150,22
700,18
Totais
571,21
552,10
554,97
560,04
620,48
2.858,80
1
30
29
25
2
32
30
26
3
33
31
30
4
35
33
31
55
A
9
13
11
9
B
21
27
26
25
Variedades
C
22
29
24
25
D
15
11
10
12
E
12
18
18
17
1
432 (D)
724 (C)
489 (E)
494 (B)
515 (A)
2.654
2
518 (A)
478 (E)
384 (B)
500 (D)
660 (C)
2.540
Colunas
3
458 (B)
524 (A)
556 (C)
313 (E)
438 (D)
2.289
4
583 (C)
550 (B)
297 (D)
486 (A)
394 (E)
2.310
5
331 (E)
400 (D)
420 (A)
501 (C)
318 (B)
1.970
Totais
2.322
2.676
2.146
2.294
2.325
11.763
T2 = 2.549,0
T3 = 2.349,0
T4 = 1.970,0
SQResduo = 34.116,0
56
T5 = 1.734,0
1
93,0 (A)
110,6 (C)
102,1 (B)
115,4 (D)
117,6 (E)
538,7
5
110,4 (B)
112,0 (D)
111,7 (C)
118,5 (E)
80,2 (A)
532,8
Totais
545,9
525,6
523,3
543,0
539,4
2.656,2
57
GL
SQ
5,0400
1,0000
QM
(20,3750)
15,0000
Raes
Raas
1
2
3
Totais
1
45
38
39
122
2
40
45
48
133
Totais
85
83
87
255
A1
A2
A3
Totais
B1
29
29
21
79
B2
25
23
23
71
B3
22
20
19
61
58
B4
18
15
18
51
Totais
94
87
81
262
A1
A2
Totais
B1
20,6
19,8
40,4
2
j
B2
40,5
41,6
82,1
B3
42,3
42,5
84,8
Totais
103,4
103,9
207,3
= 8.362,22 ;
2
ijk
= 1.556,32
j =1
Adubos
IAC-9
29,8
1
35,0
2
52,9
3
54,2
4
52,9
5
224,8
Totais
Dados: SQResd. = 218,73 e
Cultivares
UFV-1
53,4
42,4
44,6
49,9
23,1
213,4
= 5%.
Criatalina
21,0
40,1
33,7
39,0
27,5
161,3
Totais
104,2
117,5
131,2
143,1
103,5
599,5
59
10
1.003
15
1.005
20
1.010
25
1.011
30
1.014
UR (%)
Germinao (%)
30
96
40
95
50
97
2
10,3
4
18,2
6
25,1
8
35,6
10
43,0
12
50,0
14
59,1
16
67,8
18
75,2
20
85,0
4 O modelo de regresso linear de 1 grau foi proposto para explicar a relao entre a
quantidade de rao fornecida e a produo de leite por cabras. Por meio dos dados fornecidos
abaixo, pede-se:
Nveis de Rao (g)
Produo de Leite (l/dia)
50
1,2
75
1,7
100
2,0
125
2,1
150
2,5
60
5 Suponha que tenha sido realizada uma pesquisa a respeito da influncia do tempo de
estudo na nota da prova de determinada disciplina. Os dados relacionados a cinco alunos
aleatoriamente entrevistados so dados abaixo:
X = Tempo de estudo (horas)
Y = Nota obtida (0,0 a 10,0)
2
3,0
3
5,0
4
6,0
5
8,0
6
9,0
Dados:
5
X i = 20 ;
X i2 = 90 ;
Yi = 31 ;
Yi 2 = 215 ;
X Y
i =1
i =1
i =1
i =1
i =1
i i
= 139
Pede-se:
a) Ajuste um modelo de regresso linear de 1 grau para tentar explicar a variao na
nota do aluno em funo do tempo de estudo;
b) Poderamos dizer que o tempo de estudo influencia significativamente a nota obtida?
( = 5%)
c) Estime o tempo requerido de estudo (em horas/minutos) para que o aluno obtenha a
nota 7,0 na disciplina.
d) Obter o diagrama de disperso associado ao grfico da equao de regresso estimada.
6 Para estudar a influencia do nmero de plantas existentes na parcela experimental (X)
sobre a produo de gros (Y), em uma variedade de sorgo gramneo, montou-se um
experimento cujos resultados foram:
X
Y
18
58
15
90
17
95
16
53
19
92
24
96
15
75
14
84
17
94
18
87
Pede-se:
a)
b)
c)
d)
61
VIII - GABARITO
CONTEDO I Distribuio Amostral e Intervalo de Confiana
1 0,9535
2 a) 10,0021247 10,0024753
b) n = 15,37 16
3 a) n = 220,52 221
b) n = 539,17 540
4 a) 4,279 5,211
b) 4,108 5,382
c) Comprimento(a) = 0,932 ; Comprimento (b) = 1,274
5 420,27 529,73
6 a) 0,3361 0,4839
b) n = 9,83 10
7 26,473 31,367
8 n = 2.662,56 2.663
9 a) 5,03 5,6
b) s X = 0,10706
10 a) X = 22,9 ; s = 13,136
b) 9,4 36,4
CONTEDO II Testes de Hipteses
1 tcal = 1,06
t = 1,81
2 tcal = 14,61
t = 3,01
t = 1,73
5 tcal = 3,57
t = 2,88
6 tcal = 3,64
t = 3,00
t = 1,86
9 tcal = 5,19
t = 1,76
10 tcal = 4,72
t = 1,90
62
1 Fc = 7,8
F = 3,24
2 c) Fc = 0,135
F = 6,93
3 a) Fc = 685,06 F = 2,84
4 Fc = 63,41
F = 3,81
5 Fc = 9,0
F = 5,32
6 Fc = 118,22
F = 3,24
b) 1,22
c) 8,25
d) 0,03
= 0,0351
(4;5) = 9,7406
(5;5) = 9,183
9 (4;4) = 16,645
(4;3) = 17,980
(3;3) = 19,22
10 Fc = 0,1589
F = 2,61
11 Fc = 15,17
F = 5,95
= 2,1
12 a) Fc = 1,33 F = 2,93
13 b) Fc = 177,81
c) = 3,84
d) 6,115%
14 a) Fc = 5,869
b) = 13,12
15 c) Fc = 20,96
d) = 2,36
16 a) Fc = 37,70
b) = 5,05
17 a) Fc = 12,09
b) = 107,54
18 = 107,54
19 a) Fc = 9,016
b) = 33,66
1 FA = 5,04;
3 a) FA = 1,68;
FB = 0,50;
FB = 7,85;
FAxB = 7,1675
FAxB = 0,93
FAxB = 0,0393
1 a) Y = 997,4 + 0,56 X
b) Fc = 84,43
63
2 a) Y = 92,7 + 0,08 X
b) Fc = 3,55
^
3 Y = 1,522 + 4,128 X
Fc = 8.079,8
^
4 a) Y = 0,7 + 0,012 X
b) Fc = 67,669
^
5 a) Y = 0,2 + 1,5 X
b) Fc = 225,00
c) 4 horas e 32 minutos
^
6 a) Y = 53,895 + 1,648 X
b) Fc = 0,7947
c) r2 = 0,0904
64
REFERNCIAS
65
APNDICE
As tabelas que aqui constam foram adaptadas do livro: GOMES, F.P. Curso de
Estatstica Experimental. 15. ed. Editora FEALQ, 2009.
Nome: _____________________________________________________________________
66
67
68
69
probabilidade.
probabilidade.
70