Beruflich Dokumente
Kultur Dokumente
UNIVERSIDADE FEDERAL DE VIOSA Departamento de Estatstica EST 220 Estatstica Experimental 2010 / II 1. CONTEDO Captulo 1 Testes de hipteses Captulo 2 Contrastes Captulo 3 Introduo Experimentao Captulo 4 Delineamento Inteiramente Casualizado Captulo 5 Procedimentos para Comparaes Mltiplas Captulo 6 Delineamento em Blocos Casualizados Captulo 7 Delineamento em Quadrado Latino Captulo 8 Experimentos Fatoriais Captulo 9 Experimentos em Parcelas Subdivididas Captulo 10 Regresso e Correlao 2. AVALIAO Prova 1 2 3 Data 03/09 (Sex) 15/10 (Sex) 26/11 (Sex) Horrio 18:20 h 20:30 h 20:30 h Local A CONFIRMAR A CONFIRMAR A CONFIRMAR
O sistema de avaliao constar de trs provas com pesos iguais, cujas datas foram sugeridas ao Registro Escolar. A nota final ser a mdia das provas. Ser aplicada uma quarta prova escrita (29/11 Seg 12:00 h) que abordar todo o assunto do semestre, somente para o estudante que perder pelo menos uma das trs provas por qualquer motivo. Levar documento com foto para fins de fiscalizao durante as provas. Levar tabelas dos testes de hipteses, formulrio e calculadora para as provas, pois so de uso individual. O coordenador da disciplina marcar um nico perodo de reviso para cada uma das provas que dever ser respeitado, dado que no sero abertas excees para revises de provas fora do perodo estabelecido. As revises de provas sero realizadas com o monitor durante o seu horrio numa sala do Departamento de Estatstica no prdio do CCE, mesmo que a monitoria regular esteja marcada para outro local. A data da prova final ser marcada pelo Registro Escolar. 3. MONITORIA O horrio e local da monitoria sero divulgados na terceira semana de aula. Sero agendados horrios extras durante a semana de cada prova, sendo o horrio e local, divulgados no quadro de avisos do Departamento de Estatstica no prdio do CCE.
4. BIBLIOGRAFIA BARBETTA, P.A.; REIS, M.M. e BORNIA, A.C. Estatstica para cursos de engenharia e informtica. Editora Atlas, So Paulo, 2004. 410 p. BANZATTO, D.A. e KRONKA, S.N. Experimentao agrcola. FUNESP, Jaboticabal, 1989. 249 p. COSTA NETO, P.L.O. Estatstica. Editora Edgard Blcher, So Paulo, 1977, 264 p. GOMES, F.P. Curso de estatstica experimental. 12a edio, Livraria Nobel S.A, So Paulo, 1987. 467 p. HINES, W.W.; MONTGOMERY, D.C.; GOLDSMAN, D.M. e BORROR, C.M. Probabilidade e estatstica na engenharia. 4a edio, LTC Editora, Rio de Janeiro, 2006. 588 p. HOFFMANN, R. e VIEIRA, S. Anlise de regresso: uma introduo econometria. 2a edio, Editora Hucitec, So Paulo, 1983. 379 p. MONTGOMERY, D.C. e RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. 4a edio, LTC Editora, Rio de Janeiro, 2009. 490 p. MOORE, D.S. e McCABE, G.P. Introduo prtica da estatstica. 3a edio, LTC Editora, Rio de Janeiro, 2002. 536 p. RIBEIRO JNIOR, J.I. Anlises estatsticas no Excel guia prtico. Editora UFV, Viosa, 2004. 249 p. RIBEIRO JNIOR, J.I. e MELO, A.L.P. Guia prtico para utilizao do SAEG. Folha Artes Grficas Ltda, Viosa, 2008. 288 p. VIEIRA, S. e HOFFMANN, R. Estatstica experimental. Editora Atlas, So Paulo, 1989, 179 p. 5. PROFESSORES Antonio Policarpo Souza Carneiro CCE 313B Ramal 1786 Jos Ivo Ribeiro Jnior CCE 306B Ramal 1783 (Coordenador) Nerilson Terra Santos CCE 312B Ramal 1784 Sebastio Martins Filho CCE 316B Ramal 1773 6. HORRIOS DAS TURMAS Horrio 8 10 14 16 Ter Qua Qui Sex T1 - PVB310 T4 - PVB209 T3 - PVB209 Nerilson Sebastio Nerilson T4 - PVB209 T3 - PVB209 T1 - PVB310 Sebastio Nerilson Nerilson T6 - PVB304 T5 - PVB105 T2 - PVB209 Policarpo Jos Ivo Sebastio T2 - PVB209 T6 - PVB304 T5 - PVB105 Sebastio Policarpo Jos Ivo Seg
7. PLANEJAMENTO Aula 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 23 a 27/08 30 a 03/09 08 a 10/09 13 a 17/09 20 a 24/09 27 a 29/09 04 a 08/10 11 a 15/10 25 a 29/10 03 a 05/11 08 a 12/11 17 a 19/11 22 a 26/11 Semana 02 a 06/08 09 a 13/08 Assunto Apresentao da disciplina Testes de hipteses: conceitos Teste t e intervalo de confiana para uma mdia Teste F para duas varincias, teste t para duas mdias independentes Intervalo de confiana para duas mdias independentes, teste t para duas mdias dependentes e intervalo de confiana para duas mdias independentes Teste t e intervalo de confiana para duas mdias dependentes Contrastes: conceitos Mtodos para obteno de contrastes ortogonais Princpios bsicos da experimentao Tira dvidas Prova 1 03/09 Sex 18:20 h Delineamento inteiramente casualizado (DIC) Anlise de varincia e pressuposies Delineamento em blocos casualizados (DBC) Delineamento em quadrado latino (DQL) Testes de Tukey e Duncan Testes t e de Scheff Experimento fatorial (EF) Interao AxB no significativa de EF Interao AxB significativa de EF Tira dvidas Prova 2 15/10 Sex 20:30 h Experimento em parcelas subdivididas (EPS) Interao AxB no significativa de EPS Interao AxB significativa de EPS Regresso linear de 1o grau Regresso linear de 2o grau Regresso linear com delineamento experimental Anlise de correlao Tira dvidas Prova 3 26/11 Sex 20:30 h Prova 4 29/11 Seg 12:00 h Software estatstico 30/11 Ter 12:00 h
16 a 20/08
ndice
Captulo 1 - Testes de Hipteses Captulo 2 - Contrastes Captulo 3 Introduao Experimentao Captulo 4 - Delineamento Inteiramente Casualizado Captulo 5 Procedimentos para Comparaes Mltiplas Captulo 6 - Delineamento em Blocos Casualizados Captulo 7 - Delineamento em Quadrado Latino Captulo 8 - Experimentos Fatoriais Captulo 9 - Experimentos em Parcelas Subdivididas Captulo 10 - Regresso Captulo 11 Respostas dos Exerccios Anexo 1 - Formulrio e Tabelas 1 22 30 37 45 53 65 71 95 111 125 151
Anexo 2 Frmula Geral para o Clculo de Soma de Quadrados 167 Anexo 3 Introduo ao Uso do Programa SAS Anexo 4 p-valor Anexo 5 Exemplo Extra ANOVA 169 190 191
1. Testes de Hipteses
1.1. Introduo
Os testes de hipteses fazem parte de um conjunto de procedimentos inferenciais usados em estatstica. O uso de tais procedimentos permite ao pesquisador fazer inferncias a respeito de uma populao a partir de uma ou mais amostras representativas da populao da qual as amostras foram retiradas. No dia a dia usamos de inferncia para tomarmos certas decises. Por exemplo, quando vamos a feira para comprar abacaxi e um feirante nos oferece um pedao de abacaxi. Qual o nosso procedimento? Se aquele pedao de abacaxi for doce, conclumos que todo o lote de abacaxi vendido por aquele feirante doce. Por outro lado, se o pedao for azedo, inferimos que todo o lote azedo. lgico que podemos tomar decises erradas devido amostragem. Por exemplo, corremos o risco de levar abacaxi azedo para casa, mesmo que a nossa prova tenha sido doce. Isto pode acontecer porque o lote de abacaxi pode no ser completamente uniforme no teor de acar, ou porque experimentamos um abacaxi doce no meio de um lote composto por abacaxis azedos. Este um exemplo prtico que ilustra o princpio bsico do teste de hipteses. Porm, em cincia necessrio que todos os procedimentos sejam padronizados e bem especificados. O objetivo deste captulo fornecer os conceitos tericos fundamentais para um correto uso dos testes de hipteses. Neste captulo, sero abordados alguns dos testes de hipteses mais comuns para comparar no mximo parmetros de duas populaes. Outros testes de hipteses aplicveis para comparaes de parmetros envolvendo mais de duas populaes sero apresentados no Captulo 5.
As medidas de disperso indicam quanto os valores de uma populao esto dispersos em torno de sua mdia. Como exemplo de medidas de disperso temos a varincia ( 2 = V( X) ) e o desvio-padro ( ).
1.2.2 Estimador
Na grande maioria das situaes, no possvel realizar o censo de uma populao, porque ou a populao muito grande ou de tamanho infinito. Para contornar este problema, o pesquisador pode retirar uma amostra da populao e a partir desta amostra caracterizar a populao de onde a amostra foi retirada sem nenhum vis. Para alcanar este objetivo deve-se usar frmulas estatsticas, conhecidas como estimadores, que apresentem caractersticas estatsticas desejveis, tais como no1
Cap 1 Testes de Hipteses ____________________________________________________________________ tendenciosidade, varincia mnima, fornecer estimativas que se aproximem do valor paramtrico medida que o tamanho da amostra aumenta, e etc.. Exemplos de estimadores so a mdia aritmtica amostral, m , que usada para 2 estimar a mdia populacional; e a varincia amostral, s , que usada para estimar a varincia populacional. Outras simbologias comuns para a mdia amostral so e X , e 2 para a varincia amostral so e V( X) .
Observe que algumas vezes a simbologia usada para representar os parmetros e seus respectivos estimadores muito parecida. Por exemplo, podemos representar a mdia populacional por m e seu estimador por m , ou seja, a diferena entre o parmetro e o seu estimador o chapu que existe no smbolo usado para representar o estimador. Isto parece ser uma diferena mnima, mas do ponto de vista estatstico, a diferena conceitual entre parmetro e estimador enorme. O parmetro sempre um valor constante, pois para a obteno do mesmo so usados todos os elementos da populao. Por outro lado, o estimador representa uma varivel aleatria, pois os seus valores mudam de amostra para amostra. Isto acontece porque os elementos que pertencem a uma amostra geralmente no so os mesmos em outras amostras. Conseqentemente, possvel estabelecer uma distribuio de probabilidades para os valores de um estimador. Para o parmetro, isto no possvel, pois se assume que ele tem um valor constante. Por isto recomenda-se muito cuidado para usar corretamente a simbologia para o parmetro e paro o estimador. Conforme mencionado anteriormente, os estimadores podem assumir valores diferentes em amostras diferentes. Estes diferentes valores que um estimador assume so tambm conhecidos como estimativas.
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ Uma outra alternativa seria a situao em que ele no tem nenhuma desconfiana de qual sabor teria um teor mdio de glicose maior do que o outro. Neste caso, a hiptese alternativa expressa por m morango m chocolate Neste ponto fica claro que para realizar um teste de hipteses necessrio que o pesquisador lance duas hipteses. A primeira que contm um sinal de igualdade conhecida como hiptese de nulidade, comumente denotada por Ho. dado este nome, pois ela representa uma nulidade de diferena entre mdias. J a outra hiptese que contm um sinal de desigualdade, conhecida como hiptese alternativa, comumente designada por Ha ou H1. Como o prprio nome diz, ela uma alternativa a hiptese de nulidade. Na verdade, quando um pesquisador realiza um experimento, a hiptese de nulidade construda com o expresso propsito de ser rejeitada. Isto faz sentido porque, quem teria o trabalho de realizar um experimento se achasse que duas mdias so iguais? Qualquer um se daria ao trabalho de instalar um experimento, apenas se desconfiar que existe diferena significativa entre as mdias de duas populaes. No entanto, num teste de hipteses, at que se prove o contrrio, a Ho considerada como a hiptese verdadeira. Para o exemplo dado, supondo que o pesquisador no desconfie a princpio qual sabor que apresenta maior teor mdio de glicose, o par de hipteses a ser lanado expresso por H0 : m morango = m chocolate
Ha : m morango m chocolate Observe que apesar de ser possvel existir trs possibilidades para Ha, apenas uma possibilidade foi lanada. Outro ponto importante que as hipteses foram lanadas em termos dos parmetros e no em termos dos seus estimadores. No faz sentido lanar as hipteses usando os estimadores, pois os mesmos no possuem um valor fixo, ou seja, apresentam valores diferentes para amostras diferentes, enquanto que o parmetro possui um valor fixo.
Cap 1 Testes de Hipteses ____________________________________________________________________ Por outro lado, se as duas fontes de variao apresentarem valores bem diferentes, conclui-se que a variao entre o valor especificado para o parmetro e o de sua estimativa no prpria dos dados. Neste caso a variao entre o valor paramtrico e a estimativa significativa, o que leva a rejeitar-se a hiptese de nulidade. Para ento decidirmos entre rejeitar ou no-rejeitar a hiptese de nulidade devemos estabelecer o que uma pequena e uma grande variao. Para isto, precisamos conhecer a distribuio de probabilidades do estimador usado para estimar o parmetro. Vamos ilustrar esta situao com o seguinte exemplo. Suponha que um pesquisador desconfie que a estatura mdia de adolescentes na faixa etria de 13 a 15 anos menor do que aquela informada por um rgo oficial como sendo igual a 1,5 metros. Este pesquisador sabe de fontes seguras que a estatura uma varivel aleatria que segue uma distribuio normal com varincia igual a 0,25 metros2. Se a informao do rgo oficial for verdadeira, ou seja a mdia de estatura igual a 1,50 metros, poderamos descrever a distribuio de valores da varivel estatura, digamos X, como X ~ N(15 ; 0,25) e representar esta distribuio por meio do grfico ,
f (X ) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 1. 0 m 1. 5 = V i avel : X ar 2. 0 2. 5 3. 0
A funo densidade de probabilidade de uma varivel aleatria contnua que tem distribuio normal, no caso, f(X) dada por:
f ( X) = 1 2 e
1 x m 2
2
Para verificar se a informao do rgo oficial correta, o pesquisador tem duas opes: medir a estatura da populao de todos os adolescentes, ou ento tomar uma amostra de adolescentes e medir a estatura dos mesmos e usar um teste de hipteses. Na primeira opo nenhum teste de hipteses seria necessrio, pois o pesquisador teria condies de conhecer o verdadeiro valor da mdia de estatura, ou seja, ele conheceria o parmetro mdia daquela populao de adolecentes. Na segunda opo, o pesquisador teria que usar uma mdia da amostra para tomar a sua deciso.
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ evidente que a segunda opo operacionalmente mais fcil, pois o custo e o tempo gasto so muito menores. Para realizar a segunda opo, o pesquisador deve escolher um tamanho de amostra adequado, por exemplo, suponha que para este exemplo o tamanho amostral ideal seja igual a 10 indivduos. Da populao de adolecentes possvel retirar um grande nmero de diferentes amostras de tamanho 10. Cada amostra fornece um valor para a mdia amostral. Pode ser demonstrado que a mdia de todas as mdias amostrais igual mdia da varivel original, a varincia igual varincia original dividido pelo tamanho da amostra e que a varivel aleatria m tambm segue distribuio normal, ou seja, m ~ N(15 ; 0,025 ) . O grfico da distribuio , das mdias amostrais seria
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 1. 0 m 1. 5 = V i avel : X ar b 2. 0 2. 5 3. 0
em que Xb = m e f(Xb) = f( m ).
Como pode ser notado, a distribuio das mdias amostrais para a varivel estatura, representadas no grfico por Xb, mais concentrada em torno da mdia do que a varivel original X. Isto acontece porque a varincia das mdias amostrais menor do que a varincia da varivel original estatura. Deve ficar entendido que possvel retirar um nmero muito grande de amostras de mesmo tamanho de uma populao, principalmente se a populao for muito grande. No entanto, numa pesquisa geralmente toma-se deciso usando-se apenas uma nica amostra. As hipteses estatsticas para esta situao seriam: H O : m altura = 1,5 metros H a : m altura < 1,5 metros Para se entender a lgica dos testes de hipteses, vamos supor diferentes resultados possveis para a mdia amostral obtida a partir de uma amostra de 10 estudantes. Suponha inicialmente que o pesquisador, obtenha uma mdia amostral, digamos m , igual a 1,49 metros. Neste caso, a variao entre o valor observado igual a 1,49 e o valor suposto igual a 1,50 muito pequena. Poder-se-ia atribuir esta variao ao 5
Cap 1 Testes de Hipteses ____________________________________________________________________ acaso, ou seja, esta variao uma variao prpria de uma populao que apresente mdia igual a 1,5 metros. Em termos probabilsticos poderamos dizer que existe uma grande probabilidade de numa populao com mdia igual a 1,50 metros existir grupos de 10 indivduos que apresentem uma mdia de estatura igual ou inferior a 1,49 metros. Justificativa semelhante poderia ser atribuda a mdias amostrais que tivessem valores prximos ao valor suposto, tais como: 1,48; 1,47; 1,42; etc. Por outro lado, se a mdia amostral apresentar um valor muito distante do valor suposto, como por exemplo, 0,60 metros, o pesquisador tem a tendncia de rejeitar a hiptese de nulidade, isto porque h um forte indcio de que a amostra foi retirada de uma populao que apresenta uma mdia menor do que a suposta de 1,5 metros. Em termos probabilsticos poderia se dizer que a probabilidade de encontrar um grupo de indivduos com mdia igual ou inferior a 0,60 metros muito pequena, em uma populao que apresenta uma mdia igual a 1,5 metros. Veja na figura a seguir
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 60 1. 0 1. 5 V i avel : X ar b 2. 0 2. 5 3. 0
A funo densidade de probabilidade da mdia amostral de uma varivel aleatria que tem distribuio normal, no caso, f(Xb), dada por:
1
1 x m 2 n
2
e 2 n A rea sob a curva abaixo do valor 0,60 m, indica a probabilidade de se encontrar um valor igual ou inferior a 0,60 metros em uma populao com mdia igual a 1,5 metros. Como pode ser notado, esta probabilidade pequena em relao rea total do grfico. Com base neste raciocnio que o pesquisador estabelece um valor crtico que o ajuda a decidir sobre rejeitar ou no-rejeitar a hiptese de nulidade. Este valor crtico pode a princpio ser estabelecido de duas maneiras. A primeira delas seria a situao em que o pesquisador de posse de seu conhecimento prvio no assunto estabeleceria um valor crtico antes de coletar a amostra. Este valor crtico seria um valor para a mdia amostral tal que acima dele o pesquisador no-rejeitaria a hiptese de nulidade e abaixo dele rejeitaria a hiptese de nulidade. Digamos que neste caso o valor crtico adotado fosse igual a 1,0 metro. O valor para a mdia igual a 1,0 metro determinaria duas regies na
f ( Xb) =
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ distribuio das mdias amostrais, conforme apresentado na figura a seguir. Estas duas regies so denominadas como Regio de No-Rejeio da Hiptese de Nulidade (RNRHo) e Regio de Rejeio da Hiptese de Nulidade (RRHo) . Como os respectivos nomes indicam, se o valor da mdia amostral estiver contido na RNRHo, o pesquisador no deve rejeitar a hiptese de nulidade. Caso contrrio, se o valor da mdia amostral estiver contido na RRHo, o pesquisador deve rejeitar a hiptese de nulidade e considerar a hiptese alternativa como sendo a hiptese verdadeira.
Deve-se observar que ao adotar o critrio acima, o pesquisador sempre estar sujeito a cometer um de dois erros possveis. Um destes erros, conhecido como erro tipo I ou erro alfa (), se refere probabilidade de rejeitar uma hiptese verdadeira, no caso a hiptese de nulidade. Na figura citada anteriormente, o critrio adotado pelo pesquisador foi que se a mdia amostral assumisse um valor menor que 1,0 metro, ento rejeitar-se-ia a hiptese de nulidade. exatamente a adoo deste critrio que pode levar o pesquisador a cometer um erro em sua tomada de deciso, pois como se pode observar na figura, em uma populao que realmente apresenta mdia igual a 1,5 metros, existe uma pequena percentagem de indivduos que podem apresentar uma altura mdia inferior a 1,0 metro. No entanto, o pesquisador acaba assumindo que devido ao fato daquela chance ser muito pequena, ele decide que se uma amostra de elementos apresentar mdia menor que 1,0 metro, ela pertence a uma populao com mdia inferior especificada de 1,5 metros, conforme mostrado na figura a seguir.
Nesta figura, pode-se observar duas curvas: a da esquerda quando se assume que a populao tem uma mdia inferior a especificada, isto a curva para a hiptese alternativa (Ha) com m < 1,5 metros; e a curva da direita para a situao em que a populao apresenta mdia igual especificada, ou seja, curva para a hiptese de nulidade (Ho) com mdia m = 1,5 metros. Quando o pesquisador toma a deciso de rejeitar a Ho, ele na verdade acaba por concluir que a populao de onde foi retirada a amostra pertence aquela populao com mdia m < 1,5 metros. Observe, valores nesta regio podem levar a duas concluses que a rigor ambas estariam corretas, mas a probabilidade de encontrar indivduos com mdia inferior ou igual ao valor crtico, no caso 1,0 metro, bem maior numa populao com m < 1,5 metros do que numa populao com mdia m = 1,5 metros. esta diferena nas probabilidades que leva o pesquisador a rejeitar Ho ao invs de no rejeit-la. Conforme mencionado anteriormente, a rea sob a curva da hiptese Ho que leva a sua rejeio se refere probabilidade de se rejeitar Ho quando Ho verdadeira. Isto foi definido anteriormente como erro alfa. Um raciocnio lgico que se tem tentar fazer este erro ser o menor possvel. No entanto, em todo teste de hipteses existe tambm um outro erro, conhecido como erro tipo II ou erro beta (), o qual aumenta o seu valor medida que se diminui o erro alfa. Este erro se refere probabilidade no-rejeitar a hiptese Ho quando Ho falsa (ver figura anterior). No exemplo que estamos trabalhando, este erro beta ser tanto maior, quanto menor for o valor crtico. Se por exemplo, fizermos que o valor crtico para a mdia amostral seja igual a 0,9 m, ento a nova proporo entre os erros alfa e beta seria conforme figura a seguir.
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 er r o al f a cur va H a
RH Ro
X bc= 9 0.
1. 5 V i avel : X ar b
2. 0
2. 5
3. 0
m a edi
0. 8
1. 5
Ns acabamos de ver a maneira emprica de realizar um teste de hiptese, a qual se baseia no fato do pesquisador estabelecer o valor crtico de rejeio da hiptese Ho com base em seu prvio conhecimento do problema. Este procedimento, embora seu forte apelo prtico, traz a desvantagem de no poder estabelecer a princpio qual seria a probabilidade de se cometer o erro tipo I, ou seja, a que nvel de significncia que o teste de hipteses ser realizado. de consenso que se publique, que nos trabalhos cientficos, a que nvel de significncia um teste de hipteses foi realizado. Desta forma, possvel comparar os resultados e concluses de diferentes trabalhos de pesquisa, pois existe uma tendncia que, para determinada rea do conhecimento, o nvel de significncia esteja dentro de uma faixa de valores aceito pela maioria dos pesquisadores. A determinao do nvel de significncia quando se usa o mtodo emprico possvel, embora computacionalmente no seja uma tarefa fcil, pois envolve a integrao de funes complexas tais como exponenciais, gama, beta, e etc. . Devido a todas estas razes, o mtodo no-emprico o mais usado. O procedimento para um teste de hipteses usando o mtodo no-emprico similar ao mtodo emprico. A diferena est basicamente que no mtodo no-emprico, o valor crtico conhecido a partir do nvel de significncia estabelecido e o uso de tabelas estatsticas. Existe uma tabela estatstica apropriada para cada tipo de teste de hipteses. Estas tabelas fornecem valores crticos que delimitam regies de rejeio e de norejeio de Ho. O valor obtido de uma ou mais amostras retirada da(s) populao(es) ento usado para calcular o valor de uma estatstica que tem distribuio de probabilidades idntica quela usada para identificar o valor tabelado. A comparao dos valores calculado e tabelado permite ao pesquisador decidir entre rejeitar ou no-rejeitar Ho. Os prximos itens deste captulo iro tratar sobre alguns testes de hipteses que usam este mtodo no-emprico.
f (t ) 0. 5
0. 4
0. 3
0. 2
0. 1
0. 0 - 3. 5 - 2. 5 - 1. 5 - 0. 5 0. 5 1. 5 2. 5 3. 5
V i avel : t ar n 1 5 30
10
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ As hipteses num teste t, para uma mdia populacional, so do seguinte tipo H0: Ha: Ha: Ha: m = m0 m > m0 m < m0 m m0 versus ou ou
Para decidirmos entre Rejeitar ou No-Rejeitar HO, comparamos o valor de t com o valor tabelado de t obtido por t tab = t (n 1) . A tabela apresentada no final deste livro uma tabela elaborada para testes bilaterais. Neste caso, para encontrarmos o valor tabelado basta entrar com o valor de e o respectivo nmero de graus de liberdade. Por outro lado, se desejarmos realizar um teste unilateral e usarmos uma tabela bilateral, devemos entrar na tabela com 2 como nvel de significncia. Este procedimento garante que realizaremos o teste ao nvel de significncia como desejado para testes unilaterais. Depois de obtido o valor calculado e o valor tabelado de t, usamos a seguinte regra decisria: - se t t tab ento Rejeita-se Ho
-
se
Exerccios 1.1. Em indivduos sadios, o consumo renal de oxignio distribui-se normalmente em torno de 12 cm3/min. Deseja-se investigar, com base em cinco indivduos portadores de certa molstia, se esta tem influncia no consumo renal mdio de oxignio. Os consumos medidos para os cincos pacientes foram: 14,4 12,9 15,0 13,7 13,5
Qual a concluso ao nvel de 1% de significncia? 1.2. Uma amostra de seis elementos, extrada de uma populao normal, forneceu
X i = 84,0
i =1
(X
6 i =1
m) = 55,0
2
Deseja-se saber se a mdia da populao pode ser considerada como superior a 11. Qual a concluso, ao nvel de 5% de significncia?
11
Cap 1 Testes de Hipteses ____________________________________________________________________ Conforme mencionado anteriormente, para comparar as mdias das duas populaes, toma-se uma amostra de cada populao. Suponha que as amostras geradas sejam X11, X12,... , X1n e X21, X22, ... , X2m, onde o tamanho das amostras podem ser diferentes, ou seja, n pode ser diferente de m. Para cada amostra, ento calcula-se a sua mdia e varincia. Um estimador comum para a varincia obtido tomando-se uma mdia ponderada das estimativas de varincia obtidas para as duas amostras. O tamanho da amostra utilizado como um peso para o clculo desta varincia mdia ponderada. A obteno de um estimador comum para a varincia pressupe que a varincia das duas 2 populaes sejam idnticas, ou seja 1 = 2 . A frmula do estimador comum : 2
s =
2 c 2 1 2 2
n1 + n 2 2
em que s e s so as varincias amostrais das populaes 1 e 2, respectivamente. A frmula geral para o clculo da varincia amostral dada por
n Xi n i=1 2 Xi n 2 s = i=1 n 1
2
Esta estatstica tem distribuio t de Student com (n1 + n 2 2) graus de liberdade. A comparao do valor calculado de t com o valor tabelado dado por t tab = t (n1 + n 2 2) , usada para testar a hiptese de nulidade versus H0: m1 = m2 Ha: m1 > m2 ou Ha: m1 < m2 ou Ha: m1 m2 A regra de deciso idntica ao caso anterior, ou seja: - se | t | ttab Rejeita-se Ho - se | t | ttab No-Rejeita-se HO.
Exerccio 1.3. Os dados que seguem referem-se a cinco determinaes da resistncia de dois tipos de concreto. Ao nvel de 5% de significncia, h evidncia de que o concreto 1 seja mais resistente que o concreto 2?
Uma vez obtidas estas estimativas, calcula-se o valor da estatstica t dada por: m m (m1 m 2 ) 2 t= 1 1 2 1 sc + n n 2 1
Concreto 1 Concreto 2
54 50
55 54
58 56
51 52
57 53
1.3.1.2.2 Teste de hipteses para o caso de duas amostras dependentes Duas amostras de elementos so ditas serem dependentes quando existe algo que as relacione. Por exemplo, se os valores de duas amostras foram obtidos de um mesmo conjunto de elementos amostrais, podemos dizer que as duas amostras de 12
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ valores so dependentes uma vez que foram tomados de um conjunto de elementos amostrais comum. O objetivo neste caso verificar se houve alterao na mdia de uma populao quando a mesma avaliada sob duas condies diferentes. Cada condio representa uma populao distinta, embora se suponha que os elementos populacionais sejam os mesmos nas duas condies. Para verificar se houve alterao na mdia, avalia-se uma caracterstica de interesse do pesquisador num conjunto de elementos amostrais tomados ao acaso na populao quando a mesma esteja sob a condio 1. Digamos que a avaliao da caracterstica resulte nos seguintes valores amostrais X11, X12,... , X1n. Depois de feita esta avaliao, os elementos amostrais que originaram a primeira amostra, sejam submetidos condio 2. Os mesmos elementos amostrais so novamente avaliados para a mesma caracterstica na nova condio 2. Digamos que esta nova avaliao resulte nos seguintes valores amostrais X21, X22, ... , X2n. Se a condio 2 no tiver nenhum efeito, espera-se que em mdia os valores observados nas duas condies sejam iguais. Em termos de desvios, se a alterao das condies no resultasse em nenhum efeito significativo, poderamos dizer que a diferena entre os valores observados na primeira condio e na segunda condio seria em mdia igual a zero. Portanto para verificar se houve alterao na mdia de uma populao avaliada em duas condies diferentes, pode-se testar a hiptese de que o desvio mdio ser estatisticamente igual a zero. Portanto, a partir de duas amostras obtm-se uma outra baseada nos desvios, conforme mostrado a seguir. Elemento amostral i Amostra 1 Amostra 2 di=X1i-X2i 1 X11 X21 d1 2 X11 X22 d2 ... ... ... ... n X1n X2n dn
Apresentado desta forma, o teste t para duas amostras dependentes reduz-se teste t para uma mdia populacional, visto anteriormente. No presente caso, deseja-se testar se a mdia dos desvios igual por exemplo a um valor m0. Escrevendo em termos de hipteses estatsticas teramos H0: Ha: Ha: Ha: m = m0 m > m0 m < m0 m m0 versus ou ou
Para decidir entre Rejeitar ou No-Rejeitar a hiptese de nulidade, deve-se calcular o valor da estatstica t dada por m m0 t= s2 n em que m=
d
i=1
13
n di n i=1 2 di n 2 s = i=1 n 1 Sob Ho, esta estatstica t tem distribuio t de Student com n-1 graus de liberdade. A comparao deste valor calculado com o valor de ttab dado por t tab = t (n 1) . Depois de obtido os valores calculado e tabelado de t, usamos a seguinte regra decisria: - se t t tab ento Rejeita-se Ho
-
Exerccios 1.4. Com o objetivo de avaliar se determinado produto qumico eficiente para repelir insetos domsticos, foi realizada uma contagem do nmero de insetos, antes e aps a aplicao deste produto qumico, em 7 residncias. O nmero de insetos observado em cada residncia foi
Residnca 1 2 3 4 5 6 7 Antes da aplicao 8 6 7 8 9 6 7 Aps a aplicao 4 0 3 5 3 4 2 Por meio destes dados e ao nvel de 5% de probabilidade, possvel concluir, em termos mdios, que o produto utilizado eficiente para repelir insetos? 1.5. Com a finalidade de testar se determinado mtodo de secagem rpida consegue reduzir significativamente a quantidade mdia de gua de gros de cereais, uma poro de cada um dos seguintes tipos de cereais: Milho, Cevada, Trigo, Arroz e Sorgo, foi exposta ao referido mtodo de secagem. Os resultados obtidos, para o peso da poro (em g) amostrada por cereal, com a realizao do experimento foram: Sem a secagem Com a secagem Milho 30 21 Cevada 34 28 Trigo 41 33 Arroz 25 21 Sorgo 36 31
possvel concluir ao nvel de 5% de significncia que o mtodo de secagem proposto, eficiente para secar os gros?
14
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ s2 1 2 s2 Sob a hiptese de nulidade, este quociente tem distribuio F, de Fisher-Snedecor, com n 1 e n 2 graus de liberdade, ou seja a distribuio de probabilidades da estatstica F depende dos nmeros de graus de liberdade n1 e n2. Um grfico para a distribuio F, para trs diferentes pares de graus de liberdade ilustrado na figura a seguir. F=
A concluso do teste feita mediante a comparao do valor de F com o valor de Ftab= F = (n1 , n 2 ) . Se F Ftab Rejeita-se H0 ao nvel de probabilidade. Caso contrrio NoRejeita-se HO
Exerccios 1.6. Com o intuito de controlar a homogeneidade da produo de certas partes ao longo do tempo, amostras semanais so retiradas da produo corrente. Uma primeira amostra, de dez elementos, forneceu mdia 284,55 e desvio padro 0,320, ao passo que, numa segunda amostra, forneceu, nas mesmas unidades, os seguintes valores:
284,6
283,9
284,8
285,2
284,3
283,7
284,0
Ao nvel de 5% de significncia, podemos concluir que a semana 2 apresentou maior variabilidade que a semana 1? 1.7. A qualidade de rebites tanto melhor quanto maior sua homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se obtido as seguintes cargas de ruptura: 15
Cap 1 Testes de Hipteses ____________________________________________________________________ Rebite 1 2 3 4 5 6 Marca A 34,9 35,5 38,8 39,2 33,7 37,6 Marca B 38,5 39,0 40,7 42,9 37,8 41,4 Estes resultados ratificam a afirmao do produtor da marca B, de que seus rebites so melhores? Use o nvel de 5% de significncia.
1.9. Um material isolante foi utilizado com a finalidade de reduzir a temperatura mdia interna em ambientes similares. Para testar a hiptese H o , 10 ambientes foram selecionados ao acaso e expostos a uma determinada fonte de radiao de calor. Testar a hiptese H o e concluir para = 5%. Os dados obtidos (em C) so fornecidos abaixo. AMBIENTE s/isolante c/isolante 1 30,5 28,2 2 35,3 35,1 3 33,2 33,2 4 40,8 35,6 5 42,3 40,2 6 41,5 37,4 7 36,3 34,2 8 43,2 42,1 9 34,6 30,5 10 38,5 38,4
1.10. Dois processos que tm por objetivo o controle da temperatura mdia interna em ambientes foram colocados em competio. Para testar a H o , 20 ambientes foram convenientemente preparados. Testar e concluir para = 5% , considerando os dados abaixo. PROCESSO s/isolamento c/isolamento 30,5 28,2 35,3 35,1 33,2 33,2 40,8 35,6 Temperatura C 42,3 41,5 36,3 40,2 37,4 34,2 43,2 42,1 34,6 30,5 38,5 38,4
1.11. Um produto foi desenvolvido com o objetivo de reduzir a mdia da temperatura do funcionamento de motores. Para testar o produto, foram selecionados ao acaso 8 motores e aps 10 minutos de funcionamento, em cada condio, foram obtidos os dados (em C) do quadro abaixo. Testar a hiptese H o e concluir, para = 5% . MOTOR SEM PRODUTO COM PRODUTO 1 80,5 75,8 2 99,6 98,8 3 83,4 77,6 4 100,2 99,9 5 81,5 74,2 6 84,6 80,5 7 85,0 83,6 8 105,8 105,8
1.12. Um experimentador deseja testar o efeito de certo fertilizante na mdia de produo de milho. Para realizar o experimento tinha-se 12 unidades experimentais de reas iguais, onde 7 receberam o fertilizante e as outras no; sendo as outras condies mantidas iguais. As produes em kg/unidade experimental foram as seguintes:
16
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ Com Fertilizante Sem Fertilizante 25 35 35 25 45 20 30 15 20 30 25 30
De posse dos dados acima, pode o experimentador concluir que houve aumento da mdia de produo de milho por causa do fertilizante, com nvel de significncia igual a 5%. 1.13. Desejando comparar os efeitos de dois analgsicos A e B, em termos do tempo mdio de ao sobre pacientes com certa doena (bastante prolongada), ambos foram aplicados a 14 doentes, em dias diferentes, sendo que 7 pacientes receberam primeiro o A, e outros 7 primeiro o B. A situao foi controlada de forma a no haver interferncia do efeito de um sobre o outro. Os resultados (em minutos) foram: Paciente XA XB 1 2 3 4 5 6 7 8 9 10 11 12 13 14 362 345 356 370 360 365 345 363 358 332 335 370 335 362 320 330 315 325 323 328 318 322 320 310 308 332 307 325
Testar a hiptese de diferena nula entre as mdias populacionais, ao nvel de significncia igual a 1%. 1.14. Os dados abaixo se referem aos pesos, em gramas, de ratos machos da raa Wistar com 15 dias de idade, segundo a condio normal e submetidos extirpao do timo (timectomizao) aos 4 dias de idade. Verificar se a timectomizao piora o ganho mdio de peso destes animais, usando = 5% . Condio Normal Timectomizado 40,3 18,6 40,0 20,3 39,6 23,6 35,2 22,2 32,0 20,9
1.15. Em determinada propriedade rural, foi avaliado o efeito de Suprimento Mineral (SM) na engorda de sunos. Para tanto, tomou-se 14 sunos similares em peso. Cada animal recebeu um dos SM. Os resultados obtidos, aps certo perodo de tempo, foram os seguintes: Pesos (Kg) 36 35 31 37
SM 1 SM 2
38 40
33 30
36 38
32 32
30 37
possvel afirmar ao nvel de 1% de probabilidade que o SM 1 promove menor mdia de ganho de peso que o SM 2?
1.16. Determinada fbrica, interessada em ampliar o seu quadro de pessoal com indivduos do sexo que apresentam menor variabilidade no tempo gasto para realizar a montagem de determinado equipamento eletrnico, realizou uma pesquisa. Os dados (em minutos) obtidos so fornecidos abaixo. Ao nvel de 1% de probabilidade, pode-se concluir que indivduos do sexo masculinos deveriam ser contratados porque apresentaram menor variabilidade no tempo gasto? Masculino Feminino 4 1 8 5 3 2 9 14 7 3 5 11
17
Cap 1 Testes de Hipteses ____________________________________________________________________ 1.17. Um fazendeiro, visando otimizar os recursos de sua propriedade e aumentar a mdia de produo de leite, realizou uma pesquisa para verificar se o fornecimento da cama de galinha da sua granja poderia substituir, em parte, o fornecimento de rao ao seu gado. Para tanto, seguindo as recomendaes de um zootecnista, selecionou um plantel de 10 animais e obteve os seguintes dados, em kg de leite por dia: Rao com cama Rao sem cama 45 38 47 37 49 35 48 39 46 37
De acordo com os resultados obtidos e ao nvel de 5% de probabilidade, voc recomendaria o uso de cama de galinha para substituir parte a rao?
1.18. Por meio dos dados amostrais fornecidos abaixo, possvel concluir que a mdia salarial de determinada empresa inferior a R$ 950,00? (use o nvel de 1% de significncia) Mdia N de indivduos avaliados Varincia
o
945 15 25
1.19. Dentre um rebanho de vacas reprodutoras, foram selecionadas ao acaso 10 animais. Dos animais selecionados, foram anotadas as produes mdias dirias (kg/dia) durante o perodo de amamentao das crias 1 e 2. Pode-se afirmar que durante a amamentao da 2a cria ocorre maior produo de leite? Use = 5% Cria 1 2 Produo de cada animal (Kg de leite/dia) 19,5 14,5 16,2 20,2 14,6 13,1 17,2 19,8 18,5 19,1 18,3 16,5
15,6 18,3
16,3 16,3
16,2 19,5
17,1 19,8
1.20. Dois novos tipos de embalagens (A e B) foram testados para armazenar extrato de tomate. Uma boa embalagem mantm o pH do extrato de tomate em 7,2 at trs meses aps a sua armazenagem. Para comparar estes dois tipos de embalagens, 10 embalagens de cada um dos dois tipos testados, receberam a mesma quantidade de extrato de tomate e foram avaliados quanto ao seu pH trs meses aps a sua armazenagem. Os resultados das avaliaes so apresentados a seguir Embalagem A Embalagem B 6,8 7,2 7,0 7,3 7,1 7,4 7,0 7,3 7,1 7,4 7,3 7,6 7,4 7,7 7,5 7,8 7,4 7,6 7,4 7,7
Admitindo-se que a variabilidade do pH em extratos armazenados nas embalagens A e B a mesma, pede-se: a. Pode-se concluir que existe diferena significativa entre as duas embalagens com relao a mdia do pH do extrato de tomate trs meses aps a sua armazenagem? Use o nvel de 5% de probabilidade. b. Baseado nos seus clculos do item a, qual embalagem deveria ser recomendada? Justifique.
18
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ 1.21. Em humanos relativamente comum o hipotiriodismo, a qual uma deficincia da glndula tireide para produzir certos hormnios. Uma indstria farmacutica, visando testar um novo tipo de droga, realizou uma pesquisa com 6 indivduos portadores desta doena. Com tal finalidade, fez a avaliao da dosagem do hormnio H nos indivduos portadores da doena antes e depois de serem medicados com a nova droga. Os resultados desta pesquisa so fornecidos a seguir Indivduo Antes Depois 1 100 140 2 110 135 3 98 125 4 105 145 5 108 135 6 105 140
Pode-se concluir que a nova droga capaz de aumentar a dosagem mdia do hormnio H ao nvel de 5% de significncia? 1.22. Um fabricante de componentes eletrnicos elaborou um novo tipo de microprocessador. No entanto, desejvel que este novo microprocessador tenha velocidade mdia de processamento superior a 2,5 GHz. Para testar o novo microprocessador, o fabricante retirou ao acaso, uma amostra de 6 unidades, da qual obteve as seguintes informaes: Processador Velocidade (GHz) 1 3,0 2 2,0 3 3,7 4 4,1 5 1,9 6 3,8
Mdia da velocidade de processamento dos 6 processadores amostrados = 3,08 GHz Desvio padro da velocidade de processamento dos 6 processadores amostrados = 0,95 GHz Com base nas informaes fornecidas, pergunta-se: 1.22.1 As hipteses estatsticas para este problema so a. Ho : m = 2,5 GHz, Ha : m < 2,5 GHz b. Ho : m = 2,5 GHz, Ha : m 2,5 GHz c. Ho : m = 2,5 GHz, Ha : m > 2,5 GHz d. Ho : m = 2,5 GHz, Ha : m < 2,5 GHz e. Ho : m = 2,5 GHz, Ha : m 2,5 GHz f. Ho : m > 2,5 GHz, Ha : m = 2,5 GHz g. nenhuma das anteriores 1.22.2 O valor da estatstica t calculada para este problema, ao nvel de 5% de probabilidade, leva a concluso de que o novo microprocessador possui velocidade mdia de processamento a. superior a 2,5 GHz b. inferior a 2,5 GHz c. igual a 2,5 GHz d. nenhuma das anteriores 1.22.3 O valor da velocidade mdia amostral a partir do qual a hiptese H0 rejeitada igual a a. m = 1,72 GHz b. m = 1,50 GHz 19
1.23. Selecionaram-se aleatoriamente oito comprimidos diferentes de cada um de dois remdios antigripais concorrentes, Dozenol (D) e Niteze (N). Fez-se um teste do contedo de acetaminofena em cada um deles, obtendo-se os seguintes resultados (em mg): Dozenol Niteze 472 562 487 512 506 523 512 528 489 554 503 513 511 516 501 510
Ao nvel de 5% de significncia, teste a afirmao de que a quantidade mdia de acetaminofena a mesma nas duas marcas. 1.24. Uma mquina foi regulada para fabricar placas de 5 mm de espessura, em mdia. Iniciada a produo, foi colhida uma amostra de tamanho 10, que forneceu as seguintes medidas de espessura, em mm: 5,1 4,8 5,0 4,7 4,8 5,0 4,5 4,9 4,8 5,2 Ao nvel = 0,01, pode-se aceitar a hiptese de que a regulagem da mquina foi satisfatria? 1.25. Um banho de leo aquecido aos poucos e sua temperatura medida de meia em meia-hora por dois termmetros. Tendo-se obtido os valores abaixo, h diferena entre as indicaes dos dois termmetros, a = 5%? Termmetro 1: 38,2 44,5 53,0 59,0 66,4 71,3 Termmetro 2: 37,5 44,2 51,6 58,0 66,8 72,4 1.26. Um aparelho utilizado para testar a durabilidade de lmpadas, o qual consta de oito soquetes ligados em paralelo e de um reostato ligado em srie com um gerador. Oito lmpadas da marca A e oito lmpadas da marca B foram ensaiadas nesse aparelho, sob as mesmas condies, fornecendo as seguintes duraes, em horas: Marca A: 35 26 40 35 31 49 38 24 Marca B: 23 28 31 35 36 30 27 26 Podemos concordar com a afirmao do fabricante da marca A, de que suas lmpadas tm maior mdia de durabilidade que as da marca B ( = 1%). 1.27. Dois produtos A e B, foram avaliados quanto ao gosto, de acordo com as notas fornecidas por 10 indivduos. Admitindo-se os valores 1 (pssimo), 2 (ruim), 3 (regular), 4 (bom) e 5 (timo) e um nvel de significncia de 5%, qual o melhor produto em termos da mdia da nota recebida? Indivduo: Produto A: Produto B: 1 2 3 4 5 6 7 8 9 10 3 3 4 4 4 4 4 5 5 5 3 3 3 3 2 2 2 1 1 1
20
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ 1.28. Dois candidatos a um emprego, A e B, foram submetidos a um conjunto de oito questes, sendo anotados os minutos que cada um gastou na soluo. Podemos, ao nvel de 5% de significncia, concluir que B seja mais rpido que A? Questo Indivduo A Indivduo B 1 11 5 2 8 7 3 15 13 4 2 6 5 7 4 6 18 10 7 9 3 8 10 2
1.29. Numa competio de mercado de lmpadas fluorescentes, duas marcas alegam para si o ttulo de, em mdia, apresentar mais economia de energia. Para sanar esta dvida, uma associao de consumidores resolve fazer uma bateria de testes com lmpadas das duas marcas. O resultado do consumo em watts/hora desta bateria de testes fornecido a seguir: Marca Consumo (watts/hora) A 69 72 73 72 70 B 89 92 93 92 90 Com base em um teste de hiptese, qual marca de lmpada a associao de consumidores deveria recomendar? Utilize o nvel de 5% de significncia. 1.30. Suponha que um pesquisador da rea de sade deseja mostrar que os indivduos portadores de febre amarela apresentam um teor de glicose inferior mdia de 120 mg dos indivduos no portadores. Para tanto, coletou uma amostra de sangue em sete indivduos portadores de febre amarela e para cada um deles fez a avaliao do teor de glicose, em mg. Os resultados obtidos foram: Indivduo Teor de glicose 1 119 2 122 3 120 4 110 5 112 6 115 7 116
Com base em um teste de hipteses apropriado, qual deveria ser a concluso do pesquisador? Utilize o nvel de 5% de significncia.
21
Cap 2 Contrastes
2. Contrastes
2.1. Introduo
O estudo de contrastes muito importante na Estatstica Experimental, principalmente quando o experimento em anlise composto por mais do que dois tratamentos. Com o uso de contrastes possvel ao pesquisador estabelecer comparaes, entre tratamentos ou grupos de tratamentos, que sejam de interesse. Este captulo visa dar fundamentos para estabelecer grupos de contrastes, obter a estimativa para cada contraste estabelecido, bem com estimar a variabilidade associada a cada um destes contrastes. Todos os conhecimentos adquiridos neste captulo sero utilizados no Captulo 5 para se realizar testes de hipteses para o grupo de contrastes estabelecidos.
2.2. Definies
Contraste
Considere a seguinte funo linear de mdias populacionais de tratamentos
C = a1m1 + a 2m 2 + ... + a ImI
a
i=1
=0
Estimador do Contraste
Na prtica, geralmente no se conhece os valores das mdias populacionais mi , mas suas estimativas. Da, em Estatstica Experimental, no se trabalhar com o contraste C mas com o seu estimador C , que tambm uma funo linear de mdias obtidas por meio de experimentos ou amostras. Assim tem-se que o estimador para o contraste de mdias dado por:
Tratamentos 1 - Abacaxi (0,90 x 0,30m) monocultivo 2 - Abacaxi (0,80 x 0,30 m) monocultivo 3 - Abacaxi (0,80 x 0,30 m) + amendoim 4 - Abacaxi (0,80 x 0,30 m) + feijo Pede-se obter as estimativas dos seguintes contrastes: C1 = m1 + m2 m3 m4 C2 = m1 m2 C3 = m3 m4
22
()
) () V (C) = a V (m ) + a V (m ) + ... + a V (m )
1 1 2 2 I I
2 1
2 2
2 I
Sabe-se que: V (m i ) =
ri
2 i
, assim
2 2 2 = a 2 1 + a 2 2 + ... + a 2 I VC 1 2 I r1 r2 rI
()
()
I 2 a2 = 2 i i=1 ri
Na prtica, geralmente, no se conhece a varincia 2 , mas sua estimativa a qual obtida por meio de dados experimentais. Esta estimativa denominada como estimador 2 comum s c . Ento o que normalmente se obtm o valor do estimador da varincia do estimador do contraste, a qual obtida por I a2 2 V C = sc i i=1 ri
( )
()
Exerccio 2.2 Por meio dos dados e dos contrastes fornecidos abaixo, obter as estimativas dos contrastes e as estimativas das varincias das estimativas dos contrastes.
m1 = 11,2 r1 = r2 = 6 m 2 = 10,5 r3 = 4 r4 = 5 m 3 = 10,0
2 s c = 0,45
m 4 = 21,0
C1 = m1 + m2 m3 m4 C2 = m1 m2 C3 = m3 m4
23
Cap 2 Contrastes C 2 = b1m1 + b 2m 2 + ... + bImI e C 2 , supondo independncia entre tratamentos, obtida
2 1 2 2 + a 2b 2 2 + ... + aIb I I r1 r2 rI Admitindo que exista homogeneidade de varincias entre os tratamentos, ou seja: 2 1 = 2 = ... = I2 = 2 , ento. 2
I a b a b ab ab Cov C1, C 2 = 1 1 + 2 2 + ... + I I 2 = 2 i i r r2 rI i=1 ri 1 Sabe-se que, se duas variveis aleatrias so independentes, a covarincia entre elas igual a zero. Assim, se C1 e C 2 so independentes, a covarincia entre eles igual a zero, isto : Cov C1, C 2 = 0 Para que a covarincia seja nula, necessrio, portanto que: I ab ri i = 0 . i=1 i Esta a condio de ortogonalidade entre dois contrastes para um experimento com nmero diferente de repeties para os tratamentos. Para um experimento com o mesmo nmero de repeties, satisfazendo as mesmas pressuposies (mdias independentes e homogeneidade de varincias), a condio de ortogonalidade se resume a:
a b
i=1 i
=0
Para um experimento com I tratamentos, podem ser formados vrios grupos de contrastes ortogonais, no entanto cada grupo dever conter no mximo (I-1) contrastes ortogonais, o que corresponde ao nmero de graus de liberdade para tratamentos. Dentro de um grupo de contrastes ortogonais, todos os contrastes tomados dois a dois, sero tambm ortogonais.
Exerccios 2.3. Verificar se os contrastes do Exerccio 2.1 formam um grupo de contrastes ortogonais.
24
Suponha que ao estabelecer as comparaes dos hbridos com relao a produo, seja levado em considerao o porte; o incio do florescimento; o ndice de acamamento.
Obtenha um grupo de contrastes ortogonais que permita testar as comparaes segundo os critrios citados.
Cap 2 Contrastes Dividir o m.m.c. por g2. O resultado ser o coeficiente de cada mdia do 2 grupo. Multiplicar os coeficientes obtidos pelo nmero de repeties da respectiva mdia. Se possvel, simplificar os coeficientes obtidos por uma constante. No caso em que o nmero de repeties igual para todos os tratamentos, este passo pode ser eliminado.
Exerccio
2.6. Num experimento inteiramente casualizado, com 4 repeties, foram comparados os efeitos de 5 tratamentos em relao ao crescimento de mudas de Pinus oocarpa, 60 dias aps a semeadura. Os tratamentos utilizados e os resultados obtidos foram (BANZATTO e KRONKA, 1989): Tratamentos 1 Solo de cerrado (SC) 2 Solo de cerrado + esterco (SC+E) 3 Solo de cerrado + esterco + NPK (SC+E+NPK) 4 Solo de cerrado + vermiculita (SC+V) 5 Solo de cerrado + vermiculita + NPK (SC+V+NPK) Obtenha um grupo de contrastes ortogonais entre as mdias. 2.7. Suponha agora para o exemplo 1 que os tratamentos 1 e 4 tenham 3 repeties e os tratamentos 2, 3 e 5 tenham 4 repeties. Obtenha um grupo de contrastes ortogonais entre mdias. Totais 21,0 27,1 26,6 22,1 25,6
ri 5 5 5 6
C1 = m1 m 2 C 2 = m1 + m 2 2m 3
C 3 = m1 + m 2 + m 3 3m 4 Admitindo-se que os estimadores das mdias sejam independentes e que 2 s c = 0,45 , pede-se a) C , C e C
1
b) V C1 , V C 2 , e V C 3 c) as estimativas das covarincias entre os estimadores dos contrastes, e por meio das mesmas, dizer quais so os contrastes ortogonais entre si.
( ) ( )
2
( )
26
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 2.9. Supondo independncia entre mdias, homogeneidade de varincias entre tratamentos e admitindo que m1,m 2 e m 3 tm, respectivamente, 5, 3 e 6 repeties, verificar se os contrastes dados abaixo so ortogonais. C 1 = m1 m 2 C 2 = m1 + m 2 2m 3 . 2.10. Considere um experimento com 4 tratamentos e as seguintes informaes:
2 s c = 4,10
r1 = r2 = r3 = 4; r4 = 3 C1 = m1 + m 2 + m 3 3m 4
C 2 = m1 2m 2 + m 3 Pede-se: a) Forme um grupo de contrastes ortogonais, a partir dos contrastes C1 e C2, por meio do mtodo do sistema de equaes lineares. b) Obtenha V C1 c) Obtenha V(C1) 2.11. Num experimento com 4 tratamentos e 5 repeties, so dados os seguintes contrastes ortogonais: C1 = m 2 m 4 C 2 = 2m1 + m 2 + m 4 Determinar um contraste C3 que seja ortogonal a C1 e C2. 2.12. Com os dados abaixo, obter o contraste C 3 ortogonal aos contrastes C 1 e C 2 . C1 = m1 m 2 r1 = r3 = 4
( )
C 2 = 4m 1 + 5m 2 9m 4 r2 = r 4 = 5 2.13. Dado o contraste C1 = 2m1 m2 m3, referente a um experimento com 3 tratamentos (r1 = r2 = r3 = 5), obter um contraste ortogonal C2 em relao a C1. 2.14. Dado o contraste C1 = 2m1 m2 m3, referente a um experimento com 3 tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relao a C1 2.15. Dado o contraste C1 = 9m1 4m2 5m3, referente a um experimento com 3 tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relao a C1. 2.16. Dados os contrastes C1 = m2 m4 e Y2 = 2m1 + m2 + m4, referente a um experimento com 4 tratamentos (r1 = r2 = r3 = r4 = 5), obter um contraste ortogonal C3 em relao a C1 e C2. 2.17. Dados os contrastes C1 = m1 + m2 + m3 3m4 e C2 = m1 2m2 + m3, referente a um experimento com 4 tratamentos (r1 = r2 = r3 = 4 e r4 = 3), obter um contraste ortogonal C3 em relao a C1 e C2. 2.18. Dados os contrastes C1 = m1 4m2 + m3 + 2m4 e C2 = m1 m3, referente a um experimento com 4 tratamentos (r1 = r3 = 6, r2 = 4 e r4 = 5), obter um contraste ortogonal C3 em relao a C1 e C2.
27
Cap 2 Contrastes 2.19. Para verificar o efeito de trs tipos de adoantes no teor de glicose no sangue, foi realizada uma pesquisa em que se ministrou cada um destes tipos de adoantes a um determinado grupo de cobaias, por certo perodo de tempo. Ao final deste perodo, o teor mdio de glicose ( m i ) no sangue foi avaliado para cada grupo, obtendo-se os seguintes resultados: Adoante 1-Qumico 2- Qumico 3- Natural No de Cobaias 8 10 5
mi 115 90 75
s2 30 30 30
A partir dos dados fornecidos acima, pede-se: 2.19.1 Desejando-se testar o teor mdio de glicose do conjunto de cobaias que recebeu adoante qumico contra o grupo que recebeu adoante natural, qual seria o contraste apropriado? Qual o valor da estimativa deste contraste? 2.19.2 Suponha que seja de interesse testar a seguinte comparao: C1 = m2 m3, no entanto, desejamos testar outros contrastes que sejam ortogonais a C1. Obtenha o (s) outro (s) contraste (s) ortogonal (is) necessrio (s) para completar o grupo de contrastes ortogonais a C1. 2.20. Num experimento, 4 novos tipos de herbicida foram comparados para verificar se so eficazes para combater ervas daninhas e assim manter a produo de milho em nveis elevados. Um resumo do experimento dado a seguir
Herbicida 1 Biolgico 2 Qumico base de nitrognio e enxofre 3 Qumico base de nitrognio e fsforo 4 Qumico base de inativadores enzimticos Mdia de produo (kg/ha) 46 31 32 25 Repeties 4 4 4 4
Suponha que seja de interesse testar o seguinte contraste entre as mdias de tratamentos C1 = 3m1 m 2 m 3 m 4 . Suponha ainda que todos os tratamentos possuam uma mesma varincia e que sua estimativa igual a 35 (kg / ha) 2 . Pergunta-se: a) Qual a comparao que est sendo feita pelo contraste C1? Qual a estimativa para este contraste? b) Por meio da estimativa obtida para o contraste C1 pode-se AFIRMAR que exista um grupo melhor de herbicidas do que outro? Justifique a sua resposta. c) Qual a estimativa da varincia para a estimativa do contraste C1? d) Forme um grupo de contrastes ortogonais a partir do contraste C1. Descreva qual comparao que est sendo feita por cada contraste que voc obteve. Baseando-se nos dados amostrais fornecidos, obtenha tambm a estimativa para cada um dos contrastes.
28
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 2.21. Considere um experimento, onde foi avaliada a varivel produo (kg/parcela) de quatro tratamentos (adubaes), denominados como: T1 = Sulfato de Amnio, T2 = Sulfato de Amnio + Enxofre, T3 = Nitroclcio e T4 = Nitroclcio + Enxofre. Os resultados obtidos foram: Tratamentos 1 Sulfato de Amnio 2 Sulfato de Amnio + Enxofre 3 Nitroclcio 4 Nitroclcio + Enxofre
mi 24,0 28,0 27,0 25,0
ri 4 5 4 5
2 s c = 0,75 a) Estabelecer as seguintes comparaes de interesse (as comparaes solicitadas, no so necessariamente ortogonais): i) Sulfato de Amnio versus Nitroclcio na ausncia de Enxofre ii) Sulfato de Amnio versus Sulfato de Amnio + Enxofre iii) Nitroclcio versus Nitroclcio + Enxofre
b) Sendo dados, com base em outros critrios, os seguintes contrastes: C1 = m1 m2 C2 = 4m1 + 5m2 + 4m3 13m4 Pede-se: i) Obter a estimativa do contraste C2. ii) Obter a estimativa da varincia da estimativa do contraste C2. iii) Obter a varincia do contraste C. iv) Os contrastes C1 e C2 so ortogonais? Justifique a sua resposta.
29
3. Introduo Experimentao
3.1. Introduo
A experimentao tem por objetivo o estudo dos experimentos, isto , seu planejamento, execuo, anlise dos dados obtidos e interpretao dos resultados.
Princpio da Repetio
A repetio consiste em aplicar o mesmo tratamento a vrias unidades experimentais, ou seja, consiste na reproduo do experimento bsico. No existe uma regra dizendo qual deve ser o nmero mnimo de repeties. Isto depende do conhecimento do pesquisador sobre o assunto e do conjunto de condies em que ser realizado o experimento. Como regra prtica, sugere-se que os experimentos tenham pelo menos 20 unidades experimentais e 10 graus de liberdade para o resduo. Quanto maior o nmero de repeties, espera-se que seja maior a preciso do experimento. Em termos estatsticos, o uso do princpio da repetio tem por finalidade obter uma estimativa do erro experimental. 30
Princpio da Casualizao
O princpio da casualizao consiste em distribuir ao acaso os tratamentos s unidades experimentais. Este princpio tem por finalidade propiciar, a todos os tratamentos, a mesma chance de serem designados a qualquer uma das unidades experimentais, visando evitar que algum dos tratamentos seja sistematicamente favorecido ou desfavorecido por fatores fora de controle do pesquisador. Sendo assim com o uso do princpio da casualizao, as variaes que contribuem para o erro experimental so convertidas em variveis aleatrias. Do ponto de vista estatstico, com o uso do princpio da casualizao em um experimento: a. obtm-se uma estimativa vlida do erro experimental; b. fica garantido o uso de testes de significncia, pois os erros experimentais atuam de forma independente nas diversas unidades experimentais. Todo experimento deve conter no mnimo os princpios bsicos da repetio e da casualizao.
Premeditada
aquela introduzida pelo pesquisador com a finalidade de fazer comparaes. Por exemplo: tratamentos.
Sistemtica
Variaes no intencionais, mas de natureza conhecida. Variao inerente ao material experimental. Podem ser controladas pelo pesquisador. Por exemplo: heterogeneidade do solo, tamanho de semente, etc.
Aleatria
So variaes de origem desconhecida, no podendo ser controladas. Constituem o erro experimental. So devidas a duas fontes: variaes no material experimental e falta de uniformidade nas condies experimentais.
31
3.5. Exerccios
3.1. Um experimento deve conter no mnimo o(s) seguinte(s) princpio(s) bsico(s) da experimentao: a) repetio b) casualizao c) controle local d) repetio e controle local e) repetio e casualizao f) casualizao e controle local g) nenhuma das respostas anteriores 3.2. A repetio tem a funo de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores 3.3. A casualizao tem a funo de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores 3.4. Um extensionista, desejando comparar 10 raes para ganho de peso em animais, procedeu da seguinte forma: tomou 10 animais de uma propriedade rural. Estes 10 animais visivelmente no eram homogneos entre si, porque foram oriundos de diferentes cruzamentos raciais e apresentavam idades diferentes. as raes que o extensionista julgou ser as melhores foram designadas aos melhores animais, e as raes que o extensionista julgou ser as piores foram designadas aos piores animais, de tal forma que cada animal recebeu uma nica rao. ao final de sua pesquisa, o extensionista recomendou a rao que proporcionou maior ganho de peso nos animais. Baseado nestas informaes, pergunta-se: 3.4.1 Quantos e quais foram os tratamentos em teste nesta pesquisa? Justifique sua resposta. 3.4.2 Qual foi a constituio de cada unidade experimental nesta pesquisa? Justifique sua resposta. 3.4.3 Qual(is) foi(ram) o(s) princpio(s) bsico(s) da experimentao utilizados nesta pesquisa? Justifique a sua resposta. 3.4.4 possvel estimar o erro experimental nesta pesquisa? Justifique sua resposta. 3.4.5 A concluso dada pelo extensionista ao final da pesquisa, estatisticamente aceitvel? Justifique a sua resposta.
32
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 3.5. Um bioqumico desejando verificar qual entre 5 enzimas (identificadas como E1, E2, E3, E4 e E5) produz maiores fragmentos de DNA de clulas epiteliais de cobaias, realizou o seguinte ensaio: selecionou um conjunto de 15 cobaias (sistematicamente identificadas como 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 e 15) que eram supostamente homogneas para as caractersticas essenciais; de cada uma das 15 cobaias, tomou uma amostra de tecido epitelial de cada um dos seguintes membros: superior, mediano e inferior. Procedeu posteriormente a uma mistura das amostras coletadas dos trs membros, denominada de amostra composta; cada amostra composta foi convenientemente tratada para a extrao do DNA. A amostra obtida contendo apenas o DNA foi denominada amostra genmica. As amostras genmicas foram identificadas de acordo com o nmero da cobaia que a originou, ou seja, a amostra genmica identificada como C1, conteve DNA extrado da cobaia 1; a amostra genmica identificada como C2, conteve DNA extrado da cobaia 2; e assim por diante. Ao final obteve-se as amostras genmicas C1, C2, C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14 e C15; cada uma das amostras genmicas foi tratada com um tipo de enzima. A distribuio das enzimas s amostras foi feita da seguinte forma sistemtica: E1 foi destinada s amostras genmicas C1, C2 e C3; E2 foi destinada s amostras genmicas C4, C5 e C6; E3 foi destinada s amostras genmicas C7, C8 e C9; E4 foi destinada s amostras genmicas C10, C11 e C12; e E5 foi destinada s amostras genmicas C13, C14 e C15; uma amostra de 1 ml de cada substrato qumico dos fragmentos de DNA foi colocado para correr em um gel. O tempo, em minutos, gasto por cada uma das 15 amostras para percorrer a distncia de 25 cm foi registrado para comparar o efeito das enzimas E1, E2, E3, E4 e E5.
Com base nas informaes fornecidas deste ensaio e das explicaes fornecidas em sala de aula, pergunta-se: 3.5.1 Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta. 3.5.2 Neste experimento os tratamentos surgiram de uma forma aleatria, premeditada ou sistemtica? Justifique a sua resposta. 3.5.3 Qual foi a unidade experimental nesta pesquisa? Justifique a sua resposta. 3.5.4 O princpio da repetio foi utilizado nesta pesquisa? Justifique a sua resposta. Em caso afirmativo, explique porque diferentes observaes obtidas para um mesmo tratamento no so iguais. Em caso negativo, faa uma anlise crtica quanto necessidade do uso de repeties num experimento. 3.5.5 O princpio da casualizao foi utilizado nesta pesquisa? Justifique a sua resposta. 3.5.6 O princpio do controle local foi utilizado nesta pesquisa? Justifique a sua resposta. Em termos gerais, quando que o princpio do controle local deve ser utilizado em um experimento? 3.5.7 possvel estimar o erro experimental nesta pesquisa? Justifique a sua resposta. Em caso afirmativo, a estimativa do erro experimental vlida? Justifique a sua resposta. Em caso negativo, indique o que deveria ser feito de diferente neste ensaio para ser possvel estimar o erro experimental. Justifique a sua resposta. 3.5.8 Neste ensaio, qual foi a varivel resposta utilizada para comparar os efeitos de tratamentos? Justifique a sua resposta.
33
Cap 3 Introduo Experimentao ____________________________________________________________________ 3.6. Um pesquisador desejava comparar os efeitos que 8 tipos de leo tm sobre o teor de gordura total em preparos de maionese. Com esta finalidade, esse pesquisador procedeu da seguinte forma: para a avaliao do teor de gordura total, o pesquisador tinha sua disposio 8 bioqumicos. Devido falta de experincia dos bioqumicos, o pesquisador temia que a medio dos mesmos pudesse interferir na comparao dos tipos de leo. Visando controlar esta fonte de variao, o pesquisador decidiu que cada um dos 8 bioqumicos deveria fazer a medio do teor de gordura dos preparos de maionese produzidos utilizando os 8 tipos de leo; baseado em experimentos anteriores, o pesquisador sabia que, apesar do controle de qualidade, havia variao entre os lotes de substrato de preparos de maionese. O substrato de preparo da maionese o composto que tem todos os ingredientes do preparo da maionese, exceto o leo. Como um lote de substrato no seria suficiente para testar os 8 tipos de leo em todas as repeties desejadas, o pesquisador decidiu que prepararia 8 lotes de substrato e dividiria cada lote em 8 partes iguais. Cada uma das 64 partes, assim obtidas, seria denominada de amostra bsica; foi ento realizada uma distribuio ao acaso dos 8 tipos de leo s amostras bsicas, tendo as seguintes restries na casualizao:
1a) cada tipo de leo deveria ser aplicado em uma nica amostra bsica de cada um dos 8 lotes de substrato. 2a) os 8 tipos de preparo de maionese obtidos misturando cada uma das amostras bsicas com cada um dos 8 tipos de leo, deveriam ser avaliadas por cada um dos 8 bioqumicos; No local que foi conduzido o experimento, o pesquisador constatou que, aps certo tempo do experimento ter sido instalado, houve uma pequena contaminao por fungo em algumas unidades experimentais. O pesquisador, usando do seu conhecimento tcnico na rea, julgou que a contaminao no comprometeria os resultados obtidos no experimento. Baseando-se nestas informaes, responda com objetividade e clareza, as seguintes perguntas: 3.6.1 Quais foram os tratamentos em teste? Justifique a sua resposta. 3.6.2 Como voc classificaria a fonte de variao contaminao por fungo, observada nesse experimento? Justifique a sua resposta. 3.6.3 Qual foi a unidade experimental utilizada nesta pesquisa? Justifique a sua resposta. 3.6.4 O princpio da repetio foi utilizado nesta pesquisa? Se sua resposta for afirmativa, responda qual foi o nmero de repeties utilizado. Se a sua resposta for negativa, responda se o procedimento do pesquisador est correto. 3.6.5 O princpio da casualizao foi utilizado nesta pesquisa? Justifique a sua resposta. 3.6.6 O princpio do controle local foi utilizado nesta pesquisa? Se a sua resposta for afirmativa, explique como este princpio foi utilizado. Se a sua resposta for negativa, explique por que no houve a necessidade da utilizao deste princpio. 3.6.7 Qual foi a caracterstica utilizada pelo pesquisador para avaliar o efeito de tratamentos neste experimento. Justifique a sua resposta.
34
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 3.7. Um fabricante de mveis realizou um experimento para verificar qual dentre cinco marcas de verniz proporciona maior brilho. Com esta finalidade, procedeu da seguinte forma: Em sua fbrica identificou amostras de madeira que estariam disponveis para a realizao deste experimento. Verificou que possua cinco tbuas de Jatob, cinco tbuas de Cerejeira, cinco tbuas de Mogno, cinco tbuas de Goiabo e cinco tbuas de Castanheira. Constatou tambm que as cinco tbuas de cada tipo de madeira eram homogneas para as caractersticas essenciais e que havia uma grande variedade de cores entre os cinco tipos de madeira (Jatob, Cerejeira, Mogno, Goiabo e Castanheira). Sabe-se que a cor da madeira pode influenciar muito o brilho da mesma quando envernizada; Resolveu ento distribuir ao acaso as cinco marcas de verniz s tbuas de madeira, de tal forma que cada tipo de madeira fosse testada com todas as marcas de verniz; O brilho foi medido por meio de um aparelho que mede a refletncia da luz branca projetado sobre a tbua de madeira envernizada;
Baseado nas informaes deste experimento, pergunta-se: 3.7.1. Qual foi a unidade experimental utilizada neste experimento? Justifique a sua resposta. 3.7.2. Quais foram os tratamentos comparados neste experimento? Justifique a sua resposta. 3.7.3. Quais foram os princpios bsicos da experimentao utilizados neste experimento? Justifique a sua resposta. 3.7.4. possvel estimar o erro experimental neste experimento? Justifique a sua resposta. Se a resposta for afirmativa, a estimativa do erro vlida? Justifique. Se a resposta foi negativa, explique o que deveria ser feito para obter uma estimativa vlida para o erro experimental. 3.7.5. O que faz surgir o erro num experimento? possvel eliminar totalmente o efeito do erro experimental em um experimento? Justifique a sua resposta. 3.7.6. O procedimento adotado pelo pesquisador de distribuir as marcas de verniz ao acaso dentro de cada tipo de madeira foi realmente necessrio? Justifique a sua resposta. 3.8. Um pesquisador de uma indstria de alimentos desejava verificar se seis sabores de sorvete apresentavam o mesmo o teor de glicose. O pesquisador, baseado em experimentos anteriores, sabia que duas outras fontes de variao indesejveis poderiam influenciar o valor mensurado do teor de glicose: o tipo de recipiente utilizado para armazenagem do sorvete e o equipamento utilizado para mensurao do teor de glicose. Para controlar estas duas fontes de variao o pesquisador decidiu que cada sabor deveria ser avaliado em cada um dos seis equipamentos disponveis; e armazenado em cada um dos seis tipos de recipientes disponveis. Com esta finalidade, o pesquisador planejou o experimento da seguinte maneira: - preparar 6 lotes de 100 ml de cada sabor. O total de lotes a serem preparados seria de 36 lotes; - os lotes de sorvetes deveriam ser distribudos ao acaso aos recipientes, com a restrio de que cada tipo de recipiente recebesse todos os 6 sabores uma nica vez;
35
Cap 3 Introduo Experimentao ____________________________________________________________________ os lotes de sorvetes seriam designados ao acaso aos equipamentos para a anlise do teor de glicose, com a restrio de que cada equipamento avaliasse cada um dos seis sabores uma nica vez. Baseando-se nestas informaes, pergunta-se: 3.8.1. Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta. 3.8.2. O princpio da repetio foi utilizado neste experimento? Justifique a sua resposta. 3.8.3. O princpio do controle local foi utilizado neste experimento? Justifique a sua resposta. Se a resposta for afirmativa, quantas vezes o mesmo foi utilizado? Se a resposta for negativa, discuta sobre a necessidade do mesmo ser utilizado neste experimento.
36
Tratamentos 2 ... ... Y21 ... Y22 ... ... ... Y2J
T2
...
Deste quadro pode-se retirar algumas informaes de interesse: no de unidades experimentais: N = I x J Total geral: G =
i =1, j =1
I,J
Yij = Ti = Y
i =1
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ em que, Yij o valor observado para a varivel resposta obtido para o i-simo tratamento
em sua j-sima repetio; m mdia de todos os valores possveis da varivel resposta; t i o efeito do tratamento i no valor observado Yij ;
t i = mi m eij o erro experimental associado ao valor observado Yij ;
e ij = Yij m i O erro experimental ocorre em todos os experimentos, porque no possvel controlar o efeito de fontes de variaes que ocorrem de forma aleatria e desconhecida. Este erro o responsvel pela variao observada entre as observaes obtidas nas repeties para cada tratamento.
aplicando somatrio
i=1, j=1
(Y
I,J I,J
ij
2 m) =
i=1, j=1
[(m
I,J I,J
2 m) + (Yij m i ) ,
ij
i=1, j=1
(Y
I,J
ij
2 m) =
I,J
i=1, j=1
2 (mi m) +
i=1, j=1
(Y
2 mi ) +
i=1, j=1
duplos produtos
I,J
i =1, j =1
duplos produtos = 0 .
SQTotal = SQTrat + SQRes
Escrevendo de uma forma mais simplificada a igualdade anterior temos: Por meio das frmulas obtidas anteriormente, pode-se obter os valores para as respectivas somas de quadrados. No entanto, essas frmulas demandam muitos clculos.
38
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Frmulas de mais fcil aplicao podem ser obtidas, conforme mostrado a seguir. Inicialmente trabalharemos com a frmula da SQTotal. Tem-se que:
SQTotal =
i =1, j =1
(Y
I,J 2 ij
ij
m)
(Y
I,J ij
ij
2 m) =
I,J
i =1, j =1
(Y
I,J
2mYij + m 2
I,J I,J
)
2
(Y
I,J i =1, j =1
m) =
2 ij
i =1, j =1
Yij2 2m Yij +
i =1, j =1 I,J
i =1, j =1
(Y
2 m) =
i =1, j =1
I,J
2 ij
2m Yij + IJm 2
i =1, j =1
i =1, j =1
Y
IJ
I,J
ij
, assim
2
i =1, j =1
(Y
I,J
ij
m)
I,J Yij I,J Yij I,J i =1, j =1 i=1, j =1 2 = Yij 2 =1Yij + IJ IJ IJ i=1, j i =1, j =1
I,J
simplificando tem-se,
i =1, j =1
(Y
I,J
ij
m)
finalmente temos:
SQTotal =
i =1, j =1
(Y
I,J
ij
m)
que a frmula mais prtica para se calcular a SQTotal. Para a SQTratamentos tem-se:
SQTrat =
i =1, j =1
(m
I,J
m)
2 (m i m)
I,J
=
I,J
i =1, j =1
(m
I,J
2 i
2m m i + m 2
I,J I,J
)
2
2 (m i m) (m
i
I,J
=
2
i =1, j =1 I
m i2 2m m i +
i =1, j =1 I
i =1, j =1
i =1, j =1
m) = J m i2 2mJ m i + IJm 2
i =1 i =1
A mdia geral e a mdia para tratamentos podem ser escritas respectivamente como: 39
m=
i =1, j =1
I,J
ij
e mi =
I,J
Ti J
i =1, j =1
(m
I,J J
2 m)
i =1, j =1
(m
I,J
m)
simplificando, tem-se.
(m
I,J
i =1, j =1
2 m)
finalmente tem-se:
I,J Yij I,J I T 2 i=1, j=1 2 SQTrat = (m i m) = i IJ i =1, j =1 i =1 J A frmula anterior utilizada quando o nmero de repeties igual para todos os tratamentos. No caso em que o nmero de repeties varia de acordo com o tratamento a frmula apropriada I,ri Yij I T 2 i =1, j =1 SQTrat = i ri N i =1
2
r
i =1
A Soma de Quadrados do Resduo (SQRes) obtida por diferena, SQRes = SQTotal - SQTrat O quadro da anlise de varincia, geralmente denotada por ANOVA (ANalysis Of VAriance) para a anlise de um experimento instalado segundo o DIC, com igual nmero de repeties para todos os tratamentos do seguinte tipo:
40
A partir das SQTrat e SQRes, obtm-se os respectivos quadrados mdios, por meio do quociente entre a soma de quadrados com o respectivo nmero de graus de liberdade. Para se concluir se existe diferena entre tratamentos, calcula-se o valor de F, que obtido pelo quociente do QMTrat com o QMRes. Este valor de F calculado deve ser comparado com o valor de F tabelado, o qual obtido na tabela de distribuio da varivel aleatria F, de acordo com o nvel de significncia do teste, graus de liberdade para tratamentos e graus de liberdade para resduo. As hipteses para o teste F da anlise de varincia para tratamentos so as seguintes: H 0 : m1 = m 2 = ... = m I = m , o que equivale a dizer que todos os possveis contrastes entre as mdias dos tratamentos, so estatisticamente nulos, ao nvel de probabilidade que foi executado o teste. H a : no H 0 , o que equivale a dizer que existe pelo menos um contraste entre as mdias dos tratamentos, estatisticamente diferentes de zero, ao nvel de probabilidade que foi realizado o teste. A regra decisria para o teste F a seguinte:
-
se o valor do F calculado for maior ou igual ao valor do F tabelado, ento rejeita-se H0 e conclui-se que os tratamentos tem efeito diferenciado ao nvel de significncia em que foi realizado o teste; se o valor de F calculado for menor que o valor do F tabelado, ento no rejeita-se H0 e conclui-se que os tratamentos tm efeitos iguais ao nvel de significncia em que foi realizado o teste.
O CV utilizado para avaliao da preciso de experimentos. Quanto menor o CV mais preciso tende a ser o experimento. A ttulo de classificao geral pode-se utilizar a seguinte tabela C.V. < 10% 10 a 20% 20 a 30% >30% Avaliao Baixo Mdio Alto Muito Alto Preciso Alta Mdia Baixa Muito Baixa
Porm o valor do CV no tem nada de absoluto, pois existe uma variabilidade inerente a cada rea de pesquisa. Por exemplo, experimentos realizados em locais com
41
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ ambiente controlado geralmente so mais precisos e podem apresentar CV menores que 5%.
Desvantagens
a) no fcil conseguir e manter total homogeneidade das condies durante a toda a realizao do experimento; b) todas as variaes exceto a devida a tratamentos, so consideradas como sendo variaes que ocorrem ao acaso. Isto pode acarretar em uma estimativa muito alta para o erro experimental.
4.7. Exerccios
4.1. Para comparar a produtividade de quatro variedades de milho, um agrnomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, possvel concluir que existe diferena significativa entre as variedades com relao a produtividade, utilizando o nvel de significncia de 5%? A 25 26 20 23 21 115 23 Variedades B C 31 22 25 26 28 28 27 25 24 29 135 130 27 26 D 33 29 31 34 28 155 31
Totais Mdias
4.2. Um treinador de corrida rstica, objetivando melhorar o desempenho de seus atletas, testou trs novas tcnicas de preparao. Para tanto trabalhou com um grupo de 15 atletas completamente homogneos para as caractersticas essenciais. A designao das tcnicas de preparao aos atletas foi feita totalmente ao acaso e de tal forma que o nmero de atletas avaliados em cada uma das tcnicas fosse o mesmo. Os resultados obtidos, aps um determinado perodo de tempo de aprendizado da tcnica pelos atletas, foram os seguintes (minutos / 25 Km):
42
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Repeties 1 2 3 4 5 Totais Tcnicas de Preparao 1 2 3 130 125 135 129 131 129 128 130 131 126 129 128 130 127 130 643 642 653
De acordo com os resultados obtidos, pede-se. a) Quais foram os Princpios Bsicos da Experimentao utilizados pelo pesquisador neste experimento? b) Qual foi a unidade experimental nesta pesquisa? c) possvel concluir que existe diferena entre as tcnicas de preparao com relao ao tempo mdio gasto para percorrer a distncia de 25 km? ( = 1%) d) Qual seria a tcnica a ser recomendada? 4.3. Com o objetivo de diminuir o consumo dos motores gasolina, uma determinada indstria petroqumica testou 4 novas formulaes de gasolina, as quais se diferenciavam pelo tipo de aditivo que era acrescentado mesma durante o seu processo de fabricao. Para efetuar o teste, a indstria petroqumica utilizou carros completamente homogneos para todas as caractersticas. A designao das formulaes aos carros foi feita inteiramente ao acaso. Aps os testes de rodagem, os resultados obtidos foram (km/l): Aditivo a base de cido Forte Mdias 14,81 N de carros 10 SQResduo=6,0264 cido Fraco 6,56 10 Base Forte 10,06 10 Base Fraca 10,09 10
Com base nos resultados acima, pede-se: a) Existe diferena entre os 4 tipos de formulaes? ( = 5%) b) Estabelea um contraste entre o grupo base de formulao cida contra o grupo base de formulao bsica. Obtenha a estimativa para este contraste. c) Estabelea um contraste para comparar aditivos de formulao cida. Obtenha a estimativa para este contraste. d) Estabelea um contraste para comparar aditivos de formulao bsica. Obtenha a estimativa para este contraste. 4.4. Com o objetivo de verificar se a partida tem influncia na taxa de glicose no sangue, em ratos, um experimento no DIC foi realizado. Vinte e quatro ratos machos da raa W foram escolhidos aleatoriamente e separados em trs grupos. Os dados referentes as taxas de glicose, em miligramas por 100 ml de sangue, segundo o grupo, em ratos machos com 60 dias de idade so dados abaixo: Parotidectomizado 96,0 Pseudoparotidectomizado 90,0 Normal 86,0 95,0 100,0 108,0 120,0 110,5 97,0 93,0 89,0 88,0 87,0 92,5 87,5 85,0 105,0 105,0 90,0 100,0 95,0 92,5 85,0 95,0
Usando = 5% , testar a hiptese de que as mdias relativas aos trs grupos so iguais, e concluir. 4.5.O resultado das vendas efetuadas por 3 vendedores de uma indstria de pesticidas durante certo perodo dado a seguir. Ao nvel de 5% de probabilidade e considerando os 43
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ vendedores como tratamentos de um D.I.C., verifique se h diferena de eficincia entre os vendedores. A 29 27 31 29 32 30 178 Vendedores B 27 27 30 28 C 30 30 31 27 29 147
Totais
112
4.6. Baseado nas informaes fornecidas abaixo e supondo que os tratamentos que possuem as maiores mdias so os desejados, pergunta-se: Qual(is) tratamento(s) deve(m) ser recomendado(s)? Justifique a sua resposta. Use o nvel de 1% de significncia. FV Tratamentos Resduo Total Mdias de tratamentos: m1 = 128,6 m2 = 128,4 m3 = 130,6 GL SQ 2 14,80 14 78,40 QM 7,40 F
4.7. Os seguintes dados referem-se a ganhos de peso, em kg, de animais durante um perodo experimental. Repeties 2 3 8,9 6,0 8,8 4,9 5,0 9,1 10,8 10,2 11,3 10,0
Raes A B C D E
Tais dados so descritos segundo o modelo estatstico: Yij = m + ti + eij. Baseando nas informaes fornecidas, pede-se: 4.7.1. Proceda a anlise de varincia dos dados (use = 5%) 4.7.2. De acordo com o resultado do teste F, pode-se concluir que existe efeito significativo de raes com relao ao ganho de peso mdio proporcionado pelas mesmas? 4.7.3. Proponha um contraste que compare as raes B e C juntas contra as raes D e E. Obtenha a estimativa para este contraste. 4.7.4. Calcule o coeficiente de variao e interprete-o.
44
45
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ A princpio um determinado contraste, por exemplo, entre duas mdias poderia ser testado por cada um dos procedimentos aqui apresentados. A concluso a respeito da significncia do contraste pode variar de um procedimento para outro, pois o valor da dms varia de um teste para outro, pois cada um se baseia numa distribuio de probabilidades especfica. Devido a esta possibilidade na diferena de concluses a respeito da significncia do contraste, ns podemos dizer que um teste mais conservador (ou rigoroso) que o outros. Na estatstica dizemos que um teste mais conservador que o outro quando a dms dele maior, pois ele tende a conservar a hiptese de igualdade entre mdias como verdadeira. Isto porque quanto maior a dms mais difcil se torna rejeitar a hiptese de nulidade. Este maior ou menor conservadorismo de um teste pode ajudar o pesquisador a escolher um procedimento de comparao mltipla. Se por exemplo, por experincia prpria o pesquisador sabe que as diferenas entre os efeitos dos nveis do fator em teste so pequenas e ele deseja detectar estas pequenas diferenas, ento ele deve usar um procedimento menos conservador, ou seja, que apresenta uma menor dms. Se por outro lado, ele quer concluir que os nveis do fator tm efeitos diferentes somente quando a diferena nos seus efeitos for realmente grande, ento ele deve usar um teste mais conservador, ou seja, com maior dms. Vamos ver a partir de agora cada procedimento com mais detalhe. Considere para tanto, que estamos interessados em comparar as mdias dos I nveis de um fator qualitativo, as quais foram obtidas a partir da realizao de um experimento no delineamento inteiramente casualizado com J repeties, para o qual o teste F para fator foi significativo; e que o nmero de graus de liberdade para o fator em estudo foi igual a n1 e para o resduo foi igual a n2, ou seja, FV Fator Resduo Total GL I-1 I(J-1) IJ - 1 SQ SQFator SQRes SQTotal QM QMTrat QMRes F significativo
Teste de Tukey
O teste de Tukey, pode ser utilizado para comparar a totalidade dos contrastes entre duas mdias, ou seja, para os I(I1)/2 contrastes do tipo C=mi mu; para 1 i < u I, em que I o nmero de nveis do fator em estudo. Este teste baseia-se na diferena mnima significativa (d.m.s.) representada por e dada por: 1 =q VC 2 em que, q = q (I, n 2 ) o valor tabelado da amplitude total estudentizada, que obtido em
()
funo do nvel de significncia do teste, nmero de nveis do fator em estudo (I) e nmero de graus de liberdade do resduo (n2) da anlise de varincia.
46
()
No caso em que todos os tratamentos apresentaram o mesmo nmero de repeties, ou seja, ri = ru = K, o valor de simplificado com a seguinte expresso
=q
QM Re s K
Para a realizao do teste Tukey,a um nvel de significncia , necessrio: 1. enunciar as hipteses: H0: C = 0 vs Ha: C 0, em que C = mi mu, para i u; 2. obteno das estimativas dos contrastes, C = m i m u , com base nos valores amostrais; 3. clculo do ; 4. concluir a respeito da significncia dos I(I1)/2 contrastes em teste, usando a seguinte relao: se C , rejeita-se H0 ; caso contrrio, no se rejeita H0 . Neste caso, indicar as mdias iguais, seguidas por uma mesma letra. Consideraes: 1. O teste de Tukey vlido para a totalidade dos contrastes de duas mdias. 2. O teste de Tukey exige, em princpio, balanceamento. Mas, no caso dos tratamentos apresentarem nmeros de repeties diferentes, o resultado obtido por este teste apenas uma aproximao. 3. O teste de Tukey exato para testar a maior diferena, nos demais casos conservador.
Teste de Duncan
Tal como o teste de Tukey, o teste de Duncan um procedimento seqencial, vlido para a totalidade dos contrastes de duas mdias do tipo C = mi mu. O teste de Duncan necessita a prvia ordenao das mdias, dos nveis do fator em estudo. Este teste baseia-se na amplitude total mnima significativa (D i ) dada por:
Di = z i 1 VC 2
()
em que, z i = z (n, n 2 ) o valor tabelado da amplitude total estudentizada, que obtido em funo do nvel de probabilidade, nmero de mdias ordenadas abrangidas pelo contraste entre os nveis do fator em estudo (i) e nmero de g.l. do resduo da ANOVA (n2). Como se trata de um processo seqencial, n1 varia seu valor durante a aplicao do teste; 1 1 V C = QM Re s + r r u i No caso em que todos os tratamentos apresentaram o mesmo nmero de repeties, ou seja, ri = ru = K, o valor de Di simplificado com a seguinte expresso
()
D =z i i
QM Re s K
47
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Para a realizao do teste Duncan a um nvel de significncia necessrio: 1. enunciar as hipteses: H0: C = 0 vs Ha: C 0, em que C = mi mu, para i u; 2. ordenar as mdias do fator em estudo em ordem crescente ou decrescente; 3. obter o valor da estimativa do contraste entre a maior e a menor mdia, com base nos valores amostrais; 4. calcular o valor de Di , com base no nmero de mdias ordenadas abrangidas pelo contraste. Neste primeiro passo i= I; 5. concluir a respeito da significncia do contraste em teste, usando o seguinte critrio: a) Se o valor de D i for maior do que o mdulo da estimativa do contraste, no rejeita-se H 0 e as mdias so ligadas por um trao, indicando que no h diferena entre elas; b) Caso contrrio, reduzir de uma unidade o valor de n1. Calcula-se o novo valor de D i e, para todos os pares de mdias que no estejam ligadas por um mesmo trao e que envolvem n1 mdias, repetir o procedimento que consta no item 3 e nos seguintes; 6. Proceder ao item 3 e seguintes at que i = 2. Este teste tem como inconveniente, alm de ser um teste trabalhoso, o fato das mdias ordenadas no serem independentes e o valor de zi em conseqncia, no ser exato. Consideraes: 1. O teste Duncan um procedimento seqencial vlido para a totalidade dos contrastes de duas mdias. 2. Tal como o teste de Tukey, o teste de Duncan exige, em princpio, balanceamento. Mas, no caso de serem diferentes os nmeros de repeties este teste pode ainda ser usado, mas ento apenas aproximado. 3. Quando a maior mdia no diferir significativamente da menor, no se admitir diferena significativa, entre as mdias intermedirias.
Teste t de Student
O teste t pode ser utilizado para testar contrastes envolvendo duas ou mais mdias. Porm este teste exige que: 1. as comparaes a serem realizadas sejam escolhidas a priori, ou seja, antes de serem examinados os dados; 2. podem-se testar no mximo, tantos contrastes quantos so os graus de liberdade para tratamentos, e estes contrastes devem ser ortogonais. A ortogonalidade entre os contrastes indica independncia linear na comparao estabelecida por um contraste com a comparao estabelecida pelos outros contrastes. Entre I mdias de um fator, podem ser obtidos I 1 contrastes ortogonais. Consideremos um contraste de mdias, entre os nveis de um fator, em sua forma geral: C = a1m1 + a 2m 2 + ... + a ImI do qual obtemos a estimativa por meio do estimador C = a m + a m + ... + a m ,
1 1 2 2 I I
que pode ser testada pelo teste t, calculando-se a estatstica t, dada por.
48
CC a i2 QMRe s i=1 ri
I
que tem distribuio t de Student com n2 graus de liberdade, sendo n2 o nmero de graus de liberdade do resduo e QMResduo o quadrado mdio residual da anlise de varincia. Caso o nmero de repeties seja o mesmo para todos os tratamentos, ou seja r1=r2=...=rI=K, ento a frmula para a aplicao do teste t CC t= QM Re s I 2 ai K i=1 Quando aplicamos o teste t a um contraste, C, geralmente o interesse testar as hipteses: H0: C = 0 vs Ha: C 0. O valor tabelado de t obtido por ttab=t (n2). A regra de deciso, neste caso, a seguinte: Se |t| ttab rejeita-se H 0 . Caso contrrio no se rejeita H 0 . Consideraes: 1. O nvel de significncia vlido para um nico contraste, e no para uma srie deles; 2. O nvel de significncia vlido somente se o contraste for estabelecido a priori e no sugerido pelos dados, pois, pode ficar caracterizado uma estatstica de ordem ao querer comparar a maior com a menor mdia, o que acarretaria certa dependncia entre as mdias.
Teste de Scheff
Este teste pode ser aplicado para testar todo e qualquer contraste entre mdias, mesmo quando sugerido pelos dados. freqentemente utilizado para testar contrastes que envolvam grupos de mdias. um teste mais conservador que o teste t, porm no exige que os contrastes a serem testados sejam ortogonais e nem que estes contrastes sejam estabelecidos antes de se examinar os dados. Se o valor de F obtido no for significativo, nenhum contraste poder ser significativo pelo teste de Scheff, e sua utilizao no se justifica. A estatstica do teste, denotada por S, calculada por: S = (I 1)F V(C)
tab
em que, I = o nmero de nveis do fator em estudo; Ftab = F(I-1;n2) o valor tabelado de F, obtido em funo do nvel de probabilidade, nmero de graus de liberdade do fator em estudo, ou seja I-1, e nmero de graus de liberdade do resduo, ou seja n2; I a2 V(C) = QMRe s i i =1 ri
49
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Caso o nmero de repeties seja o mesmo para todos os tratamentos, ou seja, r1=r2=...=rI=K, ento a frmula para a aplicao do teste Schheff
S = (I 1)Ftab QM Re s I 2 ai K i=1
Deve-se ento, calcular a estimativa do contraste C, ou seja, C = a1m1 + a 2m 2 + ... + a ImI Se verificarmos que | C | S, dizemos que o contraste significativamente diferente
de zero ao nvel de probabilidade, indicando que os grupos de mdias confrontados no contraste diferem entre si a esse nvel de probabilidade. Consideraes: 1. O teste de Scheff vlido para a totalidade dos contrastes. 2. Para testar um nico contraste, ou para testar um nmero pequeno deles, o teste de Scheff bastante rigoroso.
5.4. Exerccios
5.1. Aplique os testes Tukey e Duncan, aos exemplos dados ao final da apostila do Captulo de Delineamento Inteiramente Casualizado. 5.2. Para os dados fornecidos a seguir, conclua pelo teste Duncan e Tukey ( = 5 %) . m 1 = 370 D 6 = 31 m 2 = 338 D 5 = 30,2 m 3 = 380 D 4 = 28,7 m 4 = 320 D 3 = 26 m 5 = 325 D 2 = 24,6 m 6 = 367 = 33
50
Cap 5 Comparaes Mltiplas ____________________________________________________________________ 5.3. Aplicar o teste de Duncan s comparaes mltiplas obtidas com as mdias dos tratamentos instalados em um experimento segundo o Delineamento Inteiramente Casualizado (DIC).Concluir para = 5% de probabilidade. T1 = 452,16 T2 = 481,80 T3 = 442,56 T4 = 469,52 T5 = 439,48 T6 = 461,6 SQTratamen to = 331,8677 SQTotal = 783,4964 r=4
5.4. Um experimento para avaliar a influncia de 4 tipos de aleitamento no ganho de peso de leites foi conduzido utilizando-se o delineamento inteiramente casualizado com 4 repeties. Foram obtidos os seguintes resultados parciais: Tratamentos Totais FV Tratamento Resduo Total 1 37,2 GL 2 44,8 SQ 26,76 33,82 3 31,6 QM 4 32,8 F
Complete o quadro da ANOVA e, considerando-se = 1%, responda qual(is) o(s) melhor(es) tipo(s) de aleitamento. (Use o teste de Tukey, se necessrio) 5.5. Com o objetivo de verificar se existe diferena, no tempo mdio gasto para ir de 0100 km/h, entre 5 marcas de carro de mesma categoria, 4 carros de cada marca foram escolhidos inteiramente ao acaso da linha de produo de cada marca e avaliados em uma pista de provas apropriada. Os resultados obtidos, em segundos, foram: Marcas 3 8 7 8 6
1 12 11 11 13
2 12 10 10 11
4 12 12 10 11
5 13 14 15 13
Usando o nvel de 5% de probabilidade a. Existe de diferena significativa entre as marcas de carro quanto ao tempo mdio gasto para ir de 0-100 km/h? b. Qual(is) (so) a(s) marca(s) mais lenta(s) para ir de 0-100 km/h, pelo teste de Duncan? c. Qual(is) (so) a(s) marca(s) mais rpida(s) para ir de 0-100 km/h, pelo teste de Tukey? d. Suponha que em termos de custo final ao consumidor pode-se classificar os carros produzidos pela marca 1 como de custo alto, os produzidos pelas marcas 2 e 3 de custo mdio e aqueles produzidos pelas marcas 4 e 5 como de custo alto. Suponha tambm que este experimento tinha como objetivos verificar se existe diferena no tempo mdio para ir de 0-100 km/h entre: 1) os carros de custo alto e os demais carros; 2) entre os carros de custo mdio e os de custo alto; 3) os carros de custo mdio; e 4) os carros de
51
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ custo baixo. Utilize os testes de Scheff e de t para verificar se estas comparaes so significativas. 5.6. Quatro padarias da cidade de So Paulo, foram fiscalizadas para verificar a quantidade de bromato de potssio existente nos pes franceses que elas produzem. Com esta finalidade foi tomada uma amostra de pes, inteiramente ao acaso, de cada padaria e para cada um deles foi avaliado o teor de bromato de potssio (mg de bromato de potssio/1kg de po). O resumo da avaliao fornecido a seguir: Padaria Teor mdio Nm. de pes avaliados SQResduo = 52 Usando o nvel de 5% de probabilidade a. Pode-se concluir que existe diferena significativa no teor mdio de bromato de potssio no po entre as padarias avaliadas? b. Suponha que as padarias 1 e 2 suprem a classe social A, a padaria 3 a classe B e a 4 a classe C. Verifique, por meio de um contraste, pelo teste de Scheff e pelo teste t, se existe diferena no teor mdio de bromato de potssio entre as padarias que suprem as classes A e C. 5.7. Com os dados fornecidos a seguir oriundos de um experimento instalado no DIC com 4 repeties, para o qual o teste F da ANOVA para tratamentos foi significativo, aplicar o teste de Duncan e o teste de Tukey para se concluir qual(is) tratamento(s) apresentou(aram) maior(es) mdia(s) ao nvel de 5% de probabilidade. SQResduo = 905,6790 T1 = 813,44 T2 = 729,52 T3 = 786,32 T4 = 661,52 T5 = 755,44 T6 = 612,50 1 10 7 2 11 8 3 8 7 4 9 8
52
53
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ pode acarretar em no identificar nenhuma diferena nos efeitos dos tratamentos, quando de fato uma ou mais diferenas possam existir. No entanto, a instalao de um experimento no DBC quando o mesmo no necessrio, pode implicar na perda de eficincia do experimento, pois quando se instala um experimento no DBC com J blocos, quando na verdade o DIC seria suficiente, so perdidos (J-1) graus de liberdade para o resduo. No DBC o no de graus de liberdade para o resduo menor. Conseqente o F tabelado maior. Portanto maior dever ser a diferena entre os efeitos dos nveis do fator para que tais diferenas atinjam significncia estatstica.
Totais B1 B2 ... BJ G
Deste quadro pode-se retirar algumas informaes de interesse: n de unidades experimentais: N = I x J; Total geral: G =
i =1, j =1
I,J
ij
= Ti = B j = Y ;
i =1 j =1
Ti ; J
Bj I
G . IJ
bloco j,
54
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ m mdia de todas as unidades experimentais para a varivel em estudo. t i o efeito do particular tratamento i no valor observado Yij :
t i = mi m b j o efeito do bloco j no valor observado Yij :
substituindo m m i , m j e e ij por seus estimadores tem-se: Yij m = (m i m) + (m j m) + e ij , elevando ambos os membros ao quadrado (Yij m)2 = (mi m) + (m j m) + e ij 2 ,
aplicando somatrio
i=1, j=1
(Y
I,J
ij
2 m) =
I,J
i =1, j =1
[(m
I,J
m) + (m j m) + e ij
I,J I,J
i=1, j=1
(Y
I,J
ij
m) =
2
i=1, j=1
duplos produtos
I,J
i =1, j =1
duplos produtos = 0 .
Por meio das frmulas obtidas no desenvolvimento anterior, pode-se obter os valores para as respectivas somas de quadrados. No entanto, essas frmulas so muito trabalhosas para se obter tais valores. So fornecidas a seguir, frmulas mais prticas para se obter as somas de quadrados.
55
SQTotal =
i =1, j =1
I,J
Yij
SQResduo = SQTotal - SQTratamentos - SQBlocos Estas frmulas prticas so deduzidas a partir das somas de quadrados, obtidas no desenvolvimento anterior, mediante o desenvolvimento do quadrado do binmio, aplicao dos somatrios a todos os termos e substituio de cada uma das mdias pelo quociente do total pelo n de observaes que origina cada total. As dedues so semelhantes quelas apresentadas no captulo de Delineamento Inteiramente Casualizado. O quadro da ANOVA para a anlise de um experimento instalado segundo o DBC do seguinte tipo:
FV Blocos Tratamentos Resduo Total GL (J-1) (I-1) (I-1)(J-1) IJ - 1 SQ SQBlocos SQTratamentos SQResduo SQTotal QM SQTrat
I1 SQ Re s
F QMTrat
QM Re s
(I 1)(J 1)
-
Geralmente, o que interessa na anlise de um experimento, avaliar se existe diferena entre os tratamentos, o que pode ser verificado por meio do teste F para tratamentos. As hipteses para o teste F da anlise de varincia para tratamentos so as seguintes: H 0 : m1 = m 2 =...= m I = m , o que equivale a dizer que todos os possveis contrastes entre mdias de tratamentos, so estatisticamente nulos, ao nvel de probabilidade que foi executado o teste. H a : n~o H 0 , o que equivale a dizer que existe pelo menos um contraste entre mdias, a estatisticamente diferente de zero, ao nvel de probabilidade que foi realizado o teste. O teste F para blocos, ou seja, comparao entre blocos, geralmente desnecessria, pois ao instalar o experimento no DBC, o pesquisador utilizou os blocos para controlar uma causa de variao conhecida. Nos casos em que a variao entre blocos duvidosa, o pesquisador pode realizar o teste F para blocos, para servir como orientao para a instalao de futuros experimentos.
56
6.5. Exerccios
6.1. Os dados abaixo, se referem a um experimento instalado segundo o DBC, em que os tratamentos, 5 produtos comerciais para suprir deficincia de micronutriente em caprinos, foram fornecidos aos animais os quais foram separados em 3 grupos segundo a idade. Os resultados obtidos, expressos em ppm de micronutriente/ml de sangue, foram os seguintes: Produtos comerciais 2 3 4 86 103 116 69 79 81 61 79 79 216 261 276
Bloco 1 2 3 Totais
1 83 63 55 201
5 132 98 91 321
Pede-se proceder a ANOVA e aplicar o teste Tukey e Duncan, usando o nvel de 5% de probabilidade.
6.2. Com a finalidade de aumentar a produo de l de suas ovelhas, por meio de uma alimentao mais apropriada um criador separou 28 ovelhas de sua criao. Como as ovelhas eram de idades diferentes, dividiu-as em 7 grupos, sendo que dentro de cada um destes grupos havia 4 ovelhas de mesma idade e homogeneidade para as demais caractersticas. Dentro de cada grupo foi realizado um sorteio para distribuir ao acaso, os 4 Tipos de Alimentao (TA) s ovelhas do grupo. O experimento se iniciou logo aps as ovelhas terem sido submetidas a uma tosquia e se encerrou quando j era o momento de se realizar uma nova tosquia da qual foram obtidos os seguintes resultados, expressos em unidade de medida de l por animal: grupos 3 4 5 33 34 29 34 31 33 46 47 48 21 19 20 134 131 130
TA 1 2 3 4 Totais
1 30 29 43 23 125
2 32 31 47 25 135
6 30 33 44 21 128
7 33 29 47 22 131
Com base nas informaes anteriores, pede-se ( = 1% ): a) Qual o tipo de delineamento experimental que o criador utilizou? Justifique sua resposta. b) Existe diferena entre os tipos de alimentao fornecidos s ovelhas com relao a produo de l? c) Com base no teste Tukey, qual(is) seria(m) o(s) tipo(s) de alimentao a ser(em) recomendada(s) s ovelhas?
57
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ 6.3. Um experimento no DBC com 4 repeties forneceu os dados abaixo: Blocos Tratamento 1 2 3 4 5 Total 1 142,36 139,28 140,73 150,88 153,49 726,74 2 144,78 137,77 134,06 135,83 165,02 717,46 3 145,19 144,44 136,07 136,97 151,75 714,42 4 138,88 130,61 144,11 136,36 150,22 700,18 Total 571,21 552,10 554,97 560,04 620,48 2858,80
Para o nvel de 5% de significncia, pede-se: a) ANOVA b) Teste Tukey c) Teste Duncan d) Aplicar o teste Scheff ao contraste C = m 1 + m 2 2m 5 e) Aplicar o teste t aos contrastes C1 = m1 + m 2 2m 4 C 2 = m 2 + m 3 m1 m 4 C 3 = m1 m 2 6.4. O resumo da Anlise de Varincia de um experimento instalado segundo o Delineamento em Blocos Casualizados, para verificar se existe diferena entre 5 tipos de Levedura na produo de cerveja, fornecido a seguir: FV Blocos Tratamentos Resduo Total Totais de Tratamentos: T1 = 12,0 T2 = 25,2 T3 = 22,0 T4 = 24,0 T5 = 45,6 Ao nvel de 5% de probabilidade, pede-se: a)Existe diferena entre os 5 tipos de Levedura, na produo de cerveja? b)Pelo teste Tukey, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) maior produo? c)Pelo teste Duncan, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) menor produo? 6.5. Um Engenheiro-Agrcola, com o objetivo de verificar qual tipo de pneu que proporciona menor consumo de combustvel, para trabalhar em terrenos encharcados, testou 4 diferentes tipos de pneus. Como a rea que dispunha para realizar o experimento era heterognea com relao declividade, ele subdividiu a rea total em 3 sub-reas de tal forma que dentro de cada uma delas existia uniformidade com relao declividade. Aps isto, dentro de cada sub-rea realizou um sorteio ao acaso, dos tipos de pneus s unidades experimentais. Com a realizao da pesquisa, obteve-se os seguintes resultados de consumo expressos em litros/hora trabalhada. 58 GL 3 QM --4,895 F ---
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Pneu Sub-reas 1 2 3 Tipo 1 30 29 25 Tipo 2 32 30 26 Tipo 3 33 31 30 Tipo 4 35 33 31
Por meio das informaes fornecidas acima, pede-se (use o nvel de 5% de significncia, quando necessrio). a)Quais foram os Princpios Bsicos da Experimentao utilizados neste experimento? Justifique sua resposta. b)Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro-Agrcola? Justifique sua resposta. c)Em termos do consumo, conclua com relao aos tipos de pneus, por meio de uma anlise de varincia. d)Qual tipo de pneu que proporciona o pior consumo? Use o teste Duncan, se necessrio.
6.6. Suponha que algum solicite sua ajuda, na aplicao de testes de mdias aos dados de um experimento, instalado segundo o DBC com 4 repeties, para o qual o F da Anlise de Varincia para tratamentos foi significativo. Para tanto voc recebe as seguintes informaes: Tratamentos 1 2 3 Totais 400 440 360 SQResduo=360 = 5% C 1 = 3m 1 2m 2 2m 3 C 2 = m 1 2m 2 + m 3 C 3 = m 1 m 2 a)Obtenha a V(C2) b)Admita que ele deseja aplicar o teste de Scheff em C1 e C2. Proceda a aplicao do teste Scheff de maneira adequada conforme visto em sala de aula. c)Admita que ele deseja aplicar o teste t em C2 e C3. Proceda a aplicao do teste t de maneira adequada conforme visto em sala de aula. d)Obtenha um grupo de contrastes ortogonais a partir apenas de C3, usando o mtodo do sistema de equaes lineares. 6.7. Um pesquisador foi encarregado de verificar se havia diferena de durabilidade entre 4 tipos de microaspersores presentes no mercado, produzidos por duas fbricas diferentes, conforme quadro abaixo: Tratamentos 1 2 3 4 Microaspersor Tipo A Tipo B Tipo C Tipo nico Fabricado por gua Boa S.A. gua Boa S.A. gua Boa S.A. gua Ardente Ltda.
Desconsiderando como o experimento foi conduzido, bem como o tipo de informao usado na avaliao, considere os seguintes dados, aps uma anlise parcial dos mesmos:
59
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ F.V. Tratamentos Bloco Resduo Total G.L. 3 4 12 19 Q.M. 1760,00 ---50,00 F 35,2 Mdias dos Tratos m1 = 36 m2 = 40 m3 = 60
m 4 = 40
Com base nas informaes acima pede-se: (use =5%) a)Cada tratamento foi repetido quantas vezes? Justifique sua resposta. b)Que hiptese estaramos testando pela ANOVA? Qual a sua concluso no presente caso? c)Para responder qual o melhor microaspersor, o que deveramos fazer? Apenas comente rapidamente. d)Faa um teste ( sua escolha) para saber se h diferena entre os resultados mdios apresentados pelos microaspersores da fbrica gua Boa S.A. com o apresentado pelo microaspersor da fbrica gua Ardente Ltda. 6.8. Em um experimento com 5 variedades de batatinhas (A, B, C, D e E), em blocos casualizados, as produes, em toneladas por hectare, foram: Variedades B C D 21 22 15 27 29 11 26 24 10 25 25 12
Blocos 1 2 3 4
A 9 13 11 9
E 12 18 18 17
Para o nvel de significncia igual a 5%, pede-se: a) O quadro da ANOVA b) Aplicar o teste de Duncan c) Teste t para o contraste : C = m A + m B 2m D 6.9. Obtenha o quadro da Anlise de Varincia, proceda ao teste de mdia se necessrio e conclua para = 1% , considerando os dados do delineamento em blocos casualizados (DBC), fornecidos a seguir: T1 = 130,6 T2 = 183,4 T3 = 152,6 T4 = 185,6 T5 = 143,2
B
j =1
2 j
= 159.306,92
Y
i, j
2 ij
= 32.889,70
6.10. Um melhorista de plantas instalou um experimento visando selecionar as melhores prognies para dar continuidade ao seu programa de melhoramento. Na instalao do experimento, ele verificou que a rea a ser utilizada no era completamente homognea. Ento dividiu a rea em 4 sub-reas de tal forma que cada uma fosse completamente homognea e pudesse conter todas as prognies em teste. Aps esta diviso, as prognies foram distribudas ao acaso dentro de cada sub-rea. Na poca da colheita ele avaliou a produo de gros por planta (kg/planta), cujos resultados foram: 60
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Sub-reas Prognie 1 2 3 4 5 Totais 1 2,7 2,7 2,6 2,6 2,7 13,3 2 2,8 2,5 3,2 3,1 2,8 14,4 3 2,9 2,8 3,0 2,8 2,8 14,3 4 3,3 2,4 3,5 2,5 2,5 14,2 Totais 11,7 10,4 12,3 11,0 10,8 56,2
Com base nestas informaes, pede: (utilize = 5% quando necessrio) 6.10.1. Qual delineamento experimental foi utilizado? Justifique a sua resposta. 6.10.2. Verificar se existe diferena entre as prognies com relao produo. Faa a ANOVA e aplique o teste de Duncan, se necessrio, concluindo corretamente. (Dado: SQTotal = 1,5780) 6.11. Uma nutricionista formulou dois novos tipos de dieta (A e B) para diminuir o peso de pessoas obesas. Desejando verificar qual tipo de dieta proporciona maior perda de peso, resolveu fazer um teste com os seus pacientes. Com esta finalidade, solicitou que aqueles que estivessem interessados em participar deste teste se apresentassem como voluntrios. Um grupo de 8 indivduos apresentou-se para trabalhar com o nutricionista. No entanto, a nutricionista verificou que naquele grupo de indivduos havia diferentes faixas de idade, sendo 2 indivduos pertencentes faixa infantil, 2 faixa adolescente, 2 faixa adulta e 2 faixa idosa. Com receio de que a diferena de idade dos indivduos pudesse diminuir a preciso do seu experimento, a nutricionista resolveu que cada um dos dois tipos de dieta fosse testado em cada uma das faixas de idade. Para tanto, dividiu o grupo de 8 indivduos em subgrupos de tal forma que cada subgrupo inclusse indivduos de mesma faixa de idade. Aps isso, fez a distribuio dos tipos de dieta ao acaso dentro de cada subgrupo. As perdas de peso (em Kg) obtidas por cada um dos oito indivduos so fornecidas a seguir: Faixa de Idade Adolescente 7 13 20
Dieta A B Totais
Infantil 3 7 10
Adulta 14 22 36
Idosa 8 14 22
Totais 32 56 88
Dado: SQResduo = 4,00 Com base nas informaes fornecidas pede-se: 6.11.1.Qual foi a unidade experimental utilizada? a) cada faixa de idade b) cada dieta c) cada indivduo d) todos os indivduos e) os dois tipos de dieta f) nenhuma das alternativas anteriores 6.11.2. Qual(is) foi(ram) o(s) princpio(s) bsico(s) da experimentao utilizado(s)? a) repetio e casualizao b) repetio e controle local c) casualizao e controle local 61
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ d) e) f) g) h) i) controle local repetio casualizao controle local repetio, casualizao e controle local nenhuma das alternativas anteriores
6.11.3 Qual foi o delineamento experimental utilizado? a) Delineamento em Quadrado Latino b) Delineamento Inteiramente Casualizado c) Delineamento em Blocos Casualizados d) Delineamento em Ltice e) nenhuma das alternativas anteriores 6.11.4. De acordo com o teste F da anlise de varincia para a fonte de variao dieta, pode-se concluir ao nvel de 5% de probabilidade que: a) no existe diferena entre os tipos de dieta b) o valor de F menor que um e no possvel concluir c) a dieta B possui a maior mdia d) nenhuma das alternativas anteriores 6.11.5 Qual o tipo de dieta deveria ser recomendado? Use o teste Duncan e o nvel de 5% de probabilidade, se necessrio. a) qualquer uma das dietas b) todas as dietas c) nenhuma das dietas d) a dieta B e) a dieta A f) nenhuma das alternativas anteriores 6.12. Um experimento instalado segundo o Delineamento em Blocos Casualizados produziu os seguintes resultados: Tratamentos Totais Blocos Totais Dados: 1 125 2 135 1 221 3 134 2 220 4 131 3 322 5 130 4 151 6 128 7 131
SQTotal = 2214,43 SQTratamentos = 2125,29 Com base nas informaes fornecidas, pede-se (use o nvel de significncia de 1% quando necessrio): 6.12.1. Conclua a respeito dos efeitos de tratamentos, com base na anlise de varincia. 6.12.2. Se so desejados tratamentos que propiciam menores mdias, qual(is) tratamento(s) deve(m) ser recomendado(s)? Utilize o teste de Tukey, se necessrio. Caso contrrio, justifique a sua resposta. 6.13. Quatro pesquisadores realizaram um experimento com 4 tratamentos (A, B, C e D) e 5 repeties segundo um delineamento em blocos casualizados (DBC), obtendo-se as seguintes mdias de tratamentos: 62
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Tratamentos Mdias A 27,8 B 26,0 C 23,8 D 31,4
Dados: QMRes = 1,82; GLRes = 12; F calculado = 28,34 e = 5%. Os procedimentos adotados por cada um dos quatro pesquisadores foram os seguintes: - O pesquisador 1 estabeleceu, a priori, trs contrastes ortogonais com o objetivo de aplicar, separadamente a cada um deles, o teste de Scheff. Os contrastes foram os seguintes: Y1 = 3mA mB mC mD,
-
Y2 = mB + mC 2mD
Y3 = mB mC
O pesquisador 2 estabeleceu, a priori, os mesmos trs contrastes ortogonais estabelecidos pelo pesquisador 1, porm com o objetivo de aplicar, separadamente a cada um deles, o teste t O pesquisador 3 estabeleceu seis contrastes entre duas mdias (Y3 = mB mC Y4 = mA mB, Y5 = mA mC, Y6 = mA mD, Y7 = mB mD e Y8 = mC mD), com o objetivo de aplicar, separadamente a cada um deles, o teste de Tukey O pesquisador 4, aps observar os dados, estabeleceu o seguinte contraste: Y9 = mA + mB mC mD.
No entanto, os pesquisadores 1, 2 e 3, utilizando um mesmo valor para o nvel de significncia, apresentaram divergncias com relao aos resultados das anlises estatsticas para a caracterstica estudada, conforme mostrado a seguir: O pesquisador 2 obteve uma concluso diferente da encontrada pelo pesquisador 1, em relao ao contraste Y3 - O pesquisador 3 obteve uma concluso diferente da encontrada pelo pesquisador 2 em relao ao contraste Y3 Pede-se: 6.13.1 Com base na diferena das concluses encontradas pelos pesquisadores 1 e 2 em funo da utilizao de testes diferentes, marque a alternativa correta e justifique a sua resposta. a) O procedimento adotado pelo pesquisador 1 est correto e o procedimento adotado pelo pesquisador 2 est errado b) O procedimento adotado pelo pesquisador 2 est correto e o procedimento adotado pelo pesquisador 1 est errado c) Ambos os procedimentos adotados pelos pesquisadores 1 e 2 esto corretos d) Ambos os procedimentos adotados pelos pesquisadores 1 e 2 esto errados. 6.13.2. Com base na diferena das concluses encontradas pelos pesquisadores 2 e 3 em funo da utilizao de testes diferentes, marque a alternativa correta e justifique a sua resposta. a) O procedimento adotado pelo pesquisador 2 est correto e o procedimento adotado pelo pesquisador 3 est errado b) O procedimento adotado pelo pesquisador 3 est correto e o procedimento adotado pelo pesquisador 2 est errado c) Ambos os procedimentos adotados pelos pesquisadores 2 e 3 esto corretos 63
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ d) Ambos os procedimentos adotados pelos pesquisadores 2 e 3 esto errados 6.13.3. O procedimento adotado pelo pesquisador 4 foi correto? Se a sua resposta for afirmativa, aplique o teste de Scheff ao contraste Y9. Se a sua resposta for negativa, justifique a sua resposta. 6.14. Considere um experimento no delineamento em blocos casualizados, com 4 tratamentos e 3 repeties, para o qual o teste F para a fonte de variao tratamentos foi significativo ao nvel de 5% de probabilidade. Baseando-se nestas informaes, pede-se: 6.14.1 Qual a frmula geral dos contrastes a serem testados pelo teste de Tukey? Qual o nmero mximo de contrastes a serem testados pelo teste de Tukey? 6.14.2. Suponha que para este experimento, a diferena mnima significativa de Tukey foi igual a 10, ou seja = 10. Usando-se este , o seguinte resultado foi obtido para as comparaes de mdias de tratamentos
m1 = 100 a m 4 = 92 ab m 3 = 88 bc m 2 = 79 c
Pode-se observar que as mdias 1 e 4, mdias 4 e 3 e mdias 3 e 2 so estatisticamente iguais. Deste modo, pode-se concluir que as mdias 1 e 2 so tambm estatisticamente iguais? Justifique a sua resposta. 6.14.3. Caso dois outros pesquisadores realizassem o mesmo experimento e obtivessem, respectivamente 1 = 5 e 2 = 20 , pelo teste de Tukey, qual dos dois pesquisadores obteve maior preciso experimental? Justifique a sua resposta. 6.14.4. Aplique o teste de Tukey s mdias de tratamentos com base no 2 = 20 , considerando que o pesquisador 2 obteve as mesmas mdias listadas no item b, com teste F significativo. 6.14.5. Se o interesse fosse testar os quatro contrastes:
Y1 = m1 m 2 Y2 = m 1 + m 2 2m 3
Y3 = m 1 + m 2 2m 4 Y4 = m 1 + m 2 m 3 m 4 Qual(is) o(s) teste(s) visto(s) em sala de aula, que poderia(m) ser aplicado(s) a todos estes contrastes? Justifique a sua resposta.
64
Note que os nveis de uma fonte formam as linhas e os nveis da outra fonte formam as colunas Exemplo 2 - Num experimento com sunos pretende-se testar 4 tipos de rao (A,B,C,D), em 4 raas e 4 idades de animais. Sendo interesse fundamental o comportamento dos 4 tipos de rao, toma-se a raa e a idade como blocos, ou seja:
Raa Idade I1 I2 I3 R1 A B D R2 B C A R3 D A C R4 C D B
I4
Exemplo 3 - Um experimento de competio de 6 variedades de cana-de-acar em que a rea experimental apresenta gradiente de fertilidade do solo em duas direes. O 65
Cap 7 Delineamento em Quadrado Latino _____________________________________________________________________ quadrado latino possibilita a formao de blocos nas duas direes, ou seja, procedemos a um duplo controle local. O croqui seguinte ilustra a distribuio das variedades (A, B, C, D, E, F) nas parcelas.
Linhas 1 2 3 4 5 6 1 F B D A C E 2 B D F C E A Colunas 3 4 C E E A A C D F F B B D 5 D F B E A C 6 A C E B D F
Linhas 1 2 3 4 5
1 A E D C B
2 B A E D C
4 D C B A E
5 E D C B A
2o) Em seguida distribui-se ao acaso as linhas entre si, e depois as colunas, podendo-se obter um quadrado final semelhante ao apresentado abaixo. Casualizando as linhas (2, 4, 5, 1, 3) E C B A D A D C B E B E D C A C A E D B D B A E C
66
Quadrado final
em que, Yij( k ) o valor observado para a varivel em estudo referente ao k-simo tratamento,
m li cj na i-sima linha e na j-sima coluna; mdia de todas as unidades experimentais para a varivel em estudo; o efeito da linha i; o efeito da coluna j;
Admitindo-se I tratamentos, conseqentemente I linhas e I colunas, o esquema da anlise de varincia fica: FV Linhas Colunas Tratamentos Resduo Total Considerando Li = Total da linha i; Cj = Total da coluna j; Tk = Total do tratamento k; G = total geral; as somas de quadrados so dadas por: SQTotal = Yij2 C,
i, j
Exemplo 1 4 4 4 12 24
Exemplo 2 3 3 3 6 15
Exemplo 3 5 5 5 20 35
onde
C=
G2 G2 = 2 I I I
7.5. Exerccios
7.1. Num experimento de competio de variedades de cana forrageira foram usadas 5 variedades: A=CO290; B=CO294; C=CO297; D=CO299 e E=CO295, dispostas em um quadrado latino 5x5. O controle feito atravs de blocos horizontais e verticais teve por objetivo eliminar influncias devidas a diferenas de fertilidade em duas direes. As produes, em kg/parcela, foram as seguintes: Colunas 3 458(B) 524(A) 556(C) 313(E) 438(D) 2289
Linhas 1 2 3 4 5 Totais
Considerando = 5% , pede-se: a. Anlise de Varincia b. Qual a variedade a ser recomendada? Utilize teste de Tukey, se necessrio. 7.2. Em um experimento no delineamento em quadrado latino com 5 tratamentos, so dados: m1 = 50,0; m 2 = 60,0; m 3 = 47,5; m 4 = 40,0; m 5 = 52,5 SQ Re sduo = 388,80 a. Verificar se existe efeito significativo de tratamentos, pelo teste F, e concluir para = 5% . b. Qual o tratamento deve ser recomendado nos seguintes casos: b.1. Se estivssemos avaliando a produo de uma certa cultura (em kg/ha)? b.2. Se estivssemos avaliando a perda de gros, durante a colheita, de uma certa cultura (em g/parcela)? Obs.: Utilize = 5% e o Teste de Duncan (se necessrio) 7.3. Aplicar o teste de Tukey para comparar as mdias de tratamentos, relativos ao Quadrado Latino 5x5, dados: T1 = 3024,0; T2 = 2549,0; T3 = 2349,0; T4 = 1970,0; T5 = 1734,0 SQ Re siduo = 34116,0
= 5%
7.4. O objetivo de um experimento foi estudar o efeito da poca de castrao no desenvolvimento e produo de sunos. Dispunha-se para esse estudo, de 5 matrizes da mesma raa, que foram submetidas mesma alimentao e manejo durante o perodo de gestao. Os tratamentos foram: (A) Castrao aos 56 dias de idade; (B) Castrao aos 7 dias de idade; (C) Castrao aos 36 dias de idade; (D) Inteiros; (E) Castrao aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variao entre leitegadas (linhas) e a variao no peso inicial dos leites (colunas), sendo a parcela experimental constituda de um leito. Os ganhos de pesos, em kg, aps o perodo experimental (28 semanas), esto apresentados no quadro abaixo:
68
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ Leitegadas 1 2 3 4 5 Totais 1 93,0(A) 110,6(C) 102,1(B) 115,4(D) 117,6(E) 538,7 Faixas de Peso Inicial 2 3 4 115,4(C) 116,9(E) 110,2(D) 96,5(E) 108,9(B) 97,6(A) 108,6(D) 77,9(A) 102,0(E) 94,9(A) 114,0(C) 100,2(B) 114,1(B) 118,7(D) 108,8(C) 529,5 536,4 518,8 5 110,4(B) 112,0(D) 111,7(C) 118,5(E) 80,2(A) 532,8 Totais 545,9 525,6 502,3 543,0 539,4 2656,2
Considerando = 5% , pede-se: a. Faa a anlise de varincia. DADO: SQTotal = 2998,4824 b. Formule um contraste que permita avaliar o efeito mdio da prtica de castrao. c. Teste o contraste obtido no item anterior. Utilize os teste de Scheff e t. 7.5. Um experimento foi conduzido numa regio do Pantanal com o objetivo de selecionar forrageiras que garantissem uma maior produo de matria seca. Foi utilizado o delineamento em quadrado latino, buscando controlar diferenas de fertilidade em duas direes, sendo avaliadas 7 forrageiras (A, B, C, D, E, F, G). Foram obtidos os seguintes resultados parciais com a realizao do experimento: Tratamentos Totais A 30,8 B 25,2 C 19,6 D 14,0 E 13,3 F 9,8 G 8,4
Linhas Totais
1 18,9
2 19,9
3 14,5
4 18,1
5 15,6
6 17,4
7 16,7
SQTotal=72,36 SQColunas=1,27 Verificar se existe efeito significativo de forrageiras, pelo teste F, e concluir para =1%. 7.6. Um pesquisador instalou um experimento para comparar 5 tipos de bacilos (A, B, C, D, e E) usados para produo de iogurte. No momento da instalao do experimento, o pesquisador verificou que o material experimental disponvel (25 unidades de 1 litro de leite) no era completamente homogneo entre si, pois apresentavam variao quanto ao teor de gordura e grau de acidez. Para controlar estas duas fontes de variao, o pesquisador distribuiu os bacilos ao acaso s amostras de leite de tal forma que cada bacilo pudesse ser testado em todas as condies de teor de gordura e grau de acidez. O quadro dado a seguir ilustra a distribuio dos bacilos s amostras de leite bem como o volume (em ml) de iogurte produzido:
69
Cap 7 Delineamento em Quadrado Latino _____________________________________________________________________ Teor de Gordura 1 2 3 4 5 Totais TA = 3395 1 450 A 750 C 750 D 650 E 750 B 3350 Grau de Acidez 2 3 4 620 680 620 E C D 990 750 660 B E A 910 690 990 C A B 890 835 850 D B C 720 850 770 A D E 4130 3805 3890 TC = 4080 TD = 3940 5 780 B 830 D 760 E 875 A 890 C 4135 Totais 3150 3980 4100 4100 3980 19310
TB = 4345
TE = 3550
Com base nas informaes fornecidas, pergunta-se: 7.6.1. Qual foi a unidade experimental utilizada? 7.6.2. Quais foram os tratamentos em teste? 7.6.3. Quantas vezes o princpio do controle local foi utilizado neste experimento? 7.6.4. Qual foi o Delineamento experimental utilizado nesta pesquisa? 7.6.5. Usando os dados experimentais fornecidos anteriormente e o teste F para testar a fonte de variao bacilos, pode-se concluir que ao nvel de 5% de probabilidade que a) existe pelo menos um contraste entre mdias de bacilos estatisticamente diferente de zero b) todos os possveis contrastes entre mdias de bacilos so estatisticamente nulos c) o bacilo A o melhor d) o bacilo B o melhor e) o bacilo C o melhor f) nenhuma das alternativas anteriores 7.6.6. O teste de Tukey indica que o(s) bacilo(s) que proporciona(m) maior(es) mdia(s) de produo de iogurte (so) (use o nvel de 5% de significncia) foi(ram) a) o bacilo A b) o bacilo B c) o bacilo C d) o bacilo D e) o bacilo E f) os bacilos A, B e C g) os bacilos B, C e D h) os bacilos C, D e E i) os bacilos A, D e E j) nenhuma das alternativas anteriores
70
8. Experimentos Fatoriais
8.1. Introduo
Experimentos fatoriais so aqueles em que se estudam simultaneamente dois ou mais fatores, cada um deles com dois ou mais nveis. O fatorial um tipo de esquema, ou seja, uma das maneiras de organizar os tratamentos e no um tipo de delineamento, que representa a maneira pela qual os tratamentos so distribudos s unidades experimentais. Na verdade, os experimentos fatoriais so montados segundo um tipo de delineamento experimental, como por exemplo: o DIC e o DBC. Nos experimentos fatoriais, os tratamentos so obtidos pelas combinaes dos nveis dos fatores. Num experimento fatorial completo, cada nvel de um fator combina com todos os nveis dos outros fatores. A principal aplicao de experimentos fatoriais quando se quer saber sobre o efeito de diversos fatores que influenciam na varivel em estudo e o relacionamento entre eles. A simbologia comumente utilizada, para experimentos fatoriais indicar o produto dos nveis dos fatores em teste. Por exemplo: Experimento Fatorial 2x4x6. O produto 2x4x6 informa que no experimento foram testados simultaneamente 3 fatores. O primeiro possui 2 nveis, o segundo 4 nveis e o terceiro 6 nveis. Quando o nmero de nveis igual para todos os fatores, pode-se utilizar a seguinte simbologia: nF , em que F o nmero de fatores n o nmero de nveis de cada fator. Por exemplo: Experimento Fatorial 43. A potncia 43 informa que o experimento tem 3 fatores com 4 nveis cada um.
71
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Suponha os seguintes resultados fictcios, para a varivel altura de plantas (cm), deste experimento, nas seguintes situaes: 1) No h interao Espaamentos E1 E2 Variedades V1 V2 V3 8 10 12 6 8 10
Quando no h interao as diferenas entre os resultados dos nveis de um fator so estatisticamente iguais para todos os nveis do outro fator.
12 10 8 Altura de plantas (cm) 6 4 2 0 V1 V2 V3
E1 E2
Quando h interao as diferenas entre os nveis de um fator dependem dos nveis do outro fator.
10 9 8 7 6 Altura de 5 plantas (cm) 4 3 2 1 0 V1 V2 E1 E2
V3
72
Cap 8 Experimentos Fatoriais ____________________________________________________________ A1 Repetio B1 B2 ... Y111 Y121 ... 1 Y112 Y122 ... 2 ... ... ... ... Y11K Y12K ... K Y11 Y12 ... Total BJ Y1J1 Y1J2 ... Y1JK
Y1J
A2 B1 B2 ... Y211 Y221 ... Y212 Y222 ... ... ... ... Y21K Y22K ... Y21 Y22 ...
AI B1 B2 ... YI11 YI21 ... YI12 YI22 ... ... ... ... YI1K YI2K ... YI1 YI2 ...
Deste quadro, pode-se tirar algumas informaes que posteriormente sero teis na anlise de varincia:
-
k =1 J,K
j =1,k =1 I,K
ijk
= Yi = Y j
i =1,k =1
ijk
i =1, j =1,k =1
Yijk = A i = B j = YL
i =1 j =1
Ai JK Bj
IK
Pode-se montar um quadro auxiliar contendo os totais de tratamentos, cujos valores so obtidos pela soma de todas as repeties para o tratamento em questo. Este quadro facilita o clculo das somas de quadrados devido aos fatores A e B, e da interao entre eles. Para a situao citada, o quadro de totais de tratamentos do seguinte tipo:
Fator B B1 B2 ... BJ Y11. Y12. ... Y1J. Y21. Y22. ... Y2J. ... ... ... ... YI1. YI2. ... YIJ. B1 B2 ... Bj
Totais A1 A2 ... AI G
73
m
i
repetio da combinao do i-simo nvel do fator A com o j-simo nvel do fator B; a mdia de todas as unidades experimentais para a varivel em estudo; o efeito do i-simo nvel do fator A no valor observado Yijk ; o efeito do j-simo nvel do fator B no valor observado Yijk ; do fator B; o erro associado a observao Yijk .
Para um experimento fatorial instalado segundo o DBC, com K blocos, o modelo estatstico seria: Y = m + + + ( )ij + + e ijk i j k ijk em que, k o efeito do k-simo bloco na observao Yijk .
74
I,J,K
SQTotal =
i=1, j=1,k =1
2 Yijk C
SQTrat =
J
i=1, j=1
I,J
Yij2 . K
SQA =
JK C
i=1
A i2
SQB =
IK
j=1
B2 j
O quadro abaixo apresenta como seria a anlise de um experimento fatorial, com 2 fatores A e B, com I e J nveis, respectivamente, e K repeties (ou blocos), instalado segundo o DBC.
FV A B AxB (Trat) Blocos Resduo Total GL (I-1) (J-1) (I-1)(J-1) (IJ-1) K-1 n2=(IJ-1)(K-1) IJK - 1 SQ SQA SQB SQAxB (SQTrat) SQBlocos SQRes SQTotal QM F QMAxB QMRe s Ftab, [(I-1)(J-1); n2] -
(I 1)(J 1)
SQ Re s (IJ 1)(K 1) -
SQAxB
Nesta situao,
SQBlo cos =
2 Wk C IJ k =1 I,J
ijk
= Yk
Conforme apresentado nas duas tabelas anteriores, na anlise dos dados oriundos de um experimento fatorial, para os dois tipos de delineamentos, deve-se inicialmente proceder ao teste F para a interao entre os fatores. As hipteses para o teste F da interao so: H0 : Os fatores A e B atuam independentemente sobre a varivel resposta em estudo. Ha : Os fatores A e B no atuam independentemente sobre a varivel resposta em estudo. O resultado deste teste F para a interao indica como as comparaes dos nveis de um fator devem ser realizadas. Temos dois resultados possveis para o teste F da interao os quais sero apresentados a seguir.
75
[(I-1);n2] [(J-1);n2] -
(I 1)(J 1)
SQ Re s (IJ 1)(K 1) -
SQAxB
As hipteses para realizar o teste F para os efeitos principais so Fator A H0 : m A1 = m A 2 =...= m AI ou seja, todos os possveis contrastes entre as mdias dos nveis do fator A, so estatisticamente nulos, ao nvel de probabilidade em que foi executado o teste. Ha : no H0 ou seja, existe pelo menos um contraste entre as mdias dos nveis do fator A, que estatisticamente diferente de zero, ao nvel de probabilidade em que foi executado o teste. Fator B H0 : mB1 = mB 2 =...= mBJ ou seja, todos os possveis contrastes entre as mdias dos nveis do fator B, so estatisticamente nulos, ao nvel de probabilidade em que foi executado o teste. Ha : no H0 ou seja, existe pelo menos um contraste entre as mdias dos nveis do fator B, que estatisticamente diferente de zero, ao nvel de probabilidade em que foi executado o teste. Se os fatores A e B forem qualitativos, e o teste F para A e/ou B, for no significativo, a aplicao do teste de mdias desnecessria. Se o teste F for significativo, para A e/ou B, aplica-se um teste de mdias para comparar os nveis do fator. As estimativas das mdias dos nveis dos fatores so obtidas por 76
Fator B mBj =
IK
Para realizar o teste de Tukey para comparar as medias dos nveis dos fatores em teste temos que usar A B
q
QM Re s JK
QM Re s IK
q (I;n2) (J;n2)
z (nA;n2) (nB;n2)
Em que nA e nB so os nmeros de mdias ordenadas abrangidas pelo contraste sendo testados. As hipteses para os testes Tukey e Duncan para comparar as mdias dos nveis dos fatores so Fator A H0 : mAi = mAu versus Ha : mAi mAu para i u = 1, 2, 3, ... , I Fator B H0 : mBj = mBu versus Ha : mBj mBu para j u = 1, 2, 3, ... , J Para a aplicao do teste t temos que usar t
CA CA
ttab
QM Re s JK
a
i=1
2 i
t (n2)
CB CB
QM Re s IK
b
j=1
2 j
t (n2)
77
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Para a aplicao do teste Scheff para testar os contrastes YA e YB temos que usar S A B
S = (I 1)Ftab
S = (J 1)Ftab
Ftab
QM Re s JK
a
i=1 J j=1
2 i
QM Re s IK
2 j
As hipteses para os testes de Scheff e t para testar os contrastes so Fator A H0 : CA = 0 versus Ha : CA 0 Fator B H0 : CB = 0 versus Ha : CB 0
As hipteses para testar as fontes de variao da tabela acima, para j=1, 2, 3, ..., J, so H0 : mA1/Bj = mA2/Bj = ... = mAI/Bj Ha : no H0 Desdobramento para comparar os nveis de B dentro de cada nvel de A, ou seja estudar B/A 78
As hipteses para testar as fontes de variao da tabela acima, para i=1, 2, 3, ..., I, so H0 : mB1/Ai = mB2/Ai = ... = mBJ/Ai Ha : no H0 Em que as SQA/Bj e SQB/Ai podem ser obtidas usando a frmula geral para a soma de quadrados dada por
k Xi 2 k X i i=1 SQ = k i=1 ri ri
i=1 2
Se os fatores forem qualitativos, procede-se ao teste F para cada fonte de variao do desdobramento. Nas fontes de variao em que o teste F foi significativo e o fator tem mais de dois nveis, recomenda-se a aplicao de um teste de mdias. As estimativas das mdias dos nveis dos fatores so obtidas por
A Fator A m Ai = i K Bj
Fator B mBj =
Para realizar o teste de Tukey para comparar as mdias dos nveis dos fatores em teste temos que usar A B
q q
QM Re s K QM Re s K
q (I;n2) (J;n2)
79
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Para o teste de Duncan temos que usar Di A B
zi zi
QM Re s K QM Re s K
z (nA;n2) (nB;n2)
Em que nA e nB so os nmeros de mdias ordenadas abrangidas pelo contraste sendo testados. As hipteses para os testes Tukey e Duncan para comparar as mdias dos nveis dos fatores so Fator A H0 : mAi/Bj = mAu/Bj versus Ha : mAi/Bj mAu/Bj para i u = 1, 2, 3, ... , I e j = 1, 2, ... , J Fator B H0 : mBj/Ai = mBu/Ai versus Ha : mBj/Ai mBu/Ai para j u = 1, 2, 3, ... , J e i = 1, 2, ... , I Para a aplicao do teste t temos que usar t
CA CA
ttab
QM Re s K
a
i=1
2 i
t (n2)
CB CB
QM Re s K
b
j=1
JI
2 i
t (n2)
Em que CA = a1mA1/Bj + a2mA2/Bj + ... + aImAI/Bj para j = 1, 2, ..., J e CB = b1mB1/Ai + b2mB2/Ai + ... + bJmBJ/Ai para i = 1, 2, ... , I Para a aplicao do teste Scheff para testar os contrastes CA e CB temos que usar S A B
S = (I 1)Ftab
I
Ftab
S = (J 1)Ftab
QMRe s J 2 bj K j =1
As hipteses para os testes de Scheff e t para testar os contrastes so Fator A H0 : CA = 0 versus Ha : CA 0 Fator B H0 : CB = 0 versus Ha : CB 0 80
8.6.2 Desvantagem
b. Requer maior nmero de unidades experimentais em relao aos experimentos simples.
8.7. Exerccios
8.1. Seja um experimento fatorial instalado no DIC, com dois fatores: Irrigao (A) e Calagem (B), cada um deles com dois nveis: presena (A 1 e B 1 ) e ausncia (A 0 e B 0 ) . Os dados obtidos (kg de planta/parcela) para cada tratamento so fornecidos abaixo. Pede-se realizar a ANOVA e obter as concluses sobre os fatores. Use = 5 % . A0B0 25 32 27 A0B1 35 28 33 A1B0 41 35 38 A1B1 60 67 59
8.2. Em um experimento fatorial no DIC em que foram combinadas duas doses de N e duas doses de fsforo, com 5 repeties, so dados: N0 N1 10,5 11,5 11,0 12,4 P0 9,8 10,2 11,2 12,7 9,9 10,4 11,2 14,0 11,0 14,1 P1 10,4 13,8 13,1 13,5 10,6 14,2
Considerando o nvel de significncia de 5%, concluir sobre os efeitos dos fatores. 8.3. Foi realizada uma pesquisa para testar dois tipos de ambiente (com luz artificial e sem luz artificial no perodo da noite) e dois tipos de rao (com clcio e sem clcio). Para tanto foram utilizadas 24 poedeiras similares, escolhidas aleatoriamente. Ao final da avaliao foram obtidos os seguintes resultados (ovos/poedeira): Rao com clcio sem clcio Ambiente noite com luz artificial sem luz artificial 50 52 48 54 52 50 49 52 50 48 46 45 42 44 46 43 44 45 40 40 38 39 41 43
81
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Ao nvel de 1% de probabilidade e admitindo que se trata de um experimento instalado segundo o DIC, pede-se: a) Pode-se afirmar que o tipo de Rao e o tipo de Ambiente atuam independentemente na produo de ovos? b) Qual seria o tipo de Rao recomendada? (Use o teste Tukey se necessrio). c) Qual seria o tipo de Ambiente recomendado? (Use o teste Tukey se necessrio). 8.4. Para um experimento montado no DBC e que se pretendia verificar o efeito dos fatores tipo de vasilhame e tipo de fonte nutritiva no crescimento de colnias bacterianas em laboratrio, foram obtidos os seguintes resultados, aps o trmino da realizao do experimento: Totais de Tratamento para o no de colnias bacterianas Fonte nutritiva (F) a base de Vasilhame (V) N P K Tubo de Ensaio 25 30 10 Placa de Petri 20 15 40 Total 45 45 50 FV V F VxF Blocos Resduo Total Resumo da ANOVA GL SQ QM F
Total 65 75 140
1,72 2,05
Com base nos resultados fornecidos acima, pede-se, ao nvel de 5% de probabilidade: a) Os fatores fonte nutritiva e vasilhame atuam independentemente no no de colnias bacterianas? Justifique sua resposta. b) Qual a melhor fonte nutritiva para o vasilhame placa de petri? (Use o teste Tukey, se necessrio). c) Qual o melhor vasilhame para a fonte nutritiva a base de K? (Use o teste Tukey, se necessrio). 8.5. Um experimento, instalado segundo o Delineamento Inteiramente Casualizado com 5 repeties, com o objetivo de verificar o efeito de 2 cultivares de Eucalipto e de 2 espaamentos na produo de carvo, forneceram os seguintes resultados:
82
V1 30 38 68
Totais 65 77 142
Usando o nvel de significncia de 5% e aplicando o teste Tukey quando necessrio, pede-se: a) Os fatores variedades e espaamentos atuam independentemente na produo de carvo? b) Qual foi a variedade que forneceu a menor produo? c) Qual foi o espaamento que forneceu a maior produo? 8.6. Abaixo so fornecidos o Quadro da Anlise de Varincia e o Quadro de Interao para um experimento fatorial instalado segundo o Delineamento em Blocos Casualizados, com 4 repeties, que foi realizado por um zootecnista para comparar 3 raas de sunos e 2 tipos de raes com relao ao teor de gordura na carcaa. Totais de Tratamentos Rao Raa Totais 1 2 1 45 40 85 2 38 45 83 3 39 48 87 Totais 122 133 255 FV Rao Raa Interao (Tratamentos) Blocos Resduo Total GL SQ 5,0400 1,0000 (20,3750) 15,0000 QM F
Ao nvel de 5% de probabilidade, pede-se: a)Os fatores Raa e Rao atuam independentemente no teor de gordura dos sunos? b)Proceda a anlise do fator Rao, da maneira adequada, conforme o resultado obtido para o teste F da Anlise de Varincia para a Interao Raa*Rao.
83
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 8.7. Suponha que voc esteja participando de uma seleo para um emprego numa empresa de pesquisa. Dentre as vrias reas em avaliao, consta a rea de Estatstica, que objetiva avaliar seus conhecimentos na rea, no simplesmente pedindo-lhe para fazer "contas" (o que eles acham ser de menor importncia), mas sim com respeito estratgia de anlise, interpretao, discusso e tomada de deciso. So feitas as seguintes perguntas: a) Como voc faria um "leigo" entender o que vem a ser INTERAO ENTRE DOIS FATORES A e B. Para explicar voc pode usar exemplos, grficos, tabelas, etc, sua escolha. b) Qual a estratgia de anlise a ser efetuada (ou os passos da anlise subseqente) nos seguintes casos de um fatorial com dois fatores A e B: b.1) INTERAO NO SIGNIFICATIVA; b.2) INTERAO SIGNIFICATIVA. 8.8. Para se avaliar o comportamento de 4 espcies de fungos (A, B, C e D) com relao ao crescimento em meio mnimo (m.m.) com (c/) ou sem (s/) a fonte nutritiva extrato de levedura, foi realizado um experimento fatorial 4x2 no D.B.C. com 5 repeties. Aps a coleta e tabulao dos dados (numa unidade de medida qualquer) foi montado o seguinte quadro de interao de totais de tratamentos: Meio Fungo A Fungo B Fungo C Fungo D m.m.c/ 52 60 60 90 m.m s/ 50 56 40 40 Totais 102 116 100 130 A anlise de varincia dos dados no computador forneceu quadro (incompleto) da ANOVA: F.V. G.L. QM Fator A 1 144,40 Fator B 3 19,40 Int. AxB 49,20 (Trat) ---Blocos ---Resduo 10,00 Total Totais 262 186 448 o seguinte
Com base nos resultados fornecidos acima, pede-se: (obs.: use =1%) a) Cada valor interno no quadro de interao acima veio de quantas observaes? Justifique. b) Complete a coluna de G.L. do quadro acima, explicando como obteve cada um deles. c) A que se refere o Fator A do quadro da ANOVA acima? E o Fator B? Justifique suas respostas. d) Os fatores em estudo atuam independentemente na varivel em anlise (crescimento)? Justifique sua resposta. e) Qual meio de cultura (meio mnimo com extrato de levedura ou meio mnimo sem extrato de levedura) voc usaria para propiciar um maior crescimento do fungo B? Justifique sua resposta.
84
Cap 8 Experimentos Fatoriais ____________________________________________________________ f) Compare por meio de um contraste, a mdia do grupo de fungos A e B com a mdia do grupo de fungos C e D pelo teste t e Scheff quando o meio de cultura com extrato de levedura foi utilizado. Assuma que as pressuposies dos testes t e Scheff foram satisfeitas. 8.9. Em um experimento no esquema fatorial, com dois fatores qualitativos A e B, em que se deseja estudar os efeitos dos dois fatores, qual procedimento deve-se adotar quando: a) A interao for no-significativa. b) A interao for significativa. 8.10. Do fatorial 4x3, no DIC com 3 repeties, so dados: A1 14 17 21 A2 17 23 31 A3 21 26 32 A4 24 30 35
B1 B2 B3
12 18 22
16 20 20
15 22 30
18 23 32
20 25 29
23 28 32
23 29 34
26 32 37
Para o nvel de significncia de 5%, pede-se: a) ANOVA b) Teste de Tukey +m 2m pelo teste de c) Testar o contraste C = m B1 / A1 B2 / A1 B3 / A1 Scheff.
8.11. De um experimento no DBC, no esquema fatorial, foram obtidos os seguintes resultados: Totais de Tratamentos A1 A2 A3 B1 9068 8841 9278 B2 9932 9960 9779 B3 10709 9560 10023 2 Y = 283282054 ijk Bloco Total Pede-se ( = 5% ) : a) ANOVA b) Teste de Duncan 1 28218 2 29641 3 29291
8.12. Dizer o que voc entende e como interpreta uma interao entre dois fatores A e B significativa, para um determinado .
85
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 8.13. Analisar os dados do fatorial 2x3, ambos qualitativos, resumidos nos quadros de interaes e ANOVA, e aplicar o teste de Duncan, se for o caso, para = 1% . Totais de Tratamentos B1 B2 B3 Total A1 20,3 21,4 20,9 62,6 A2 21,4 22,3 35,6 79,3 Total 41,7 43,7 56,5 141,9 2 Y = 814,56 . ijk FV GL SQ Bloco 5 200,3146 A 7,7469 B 10,7467 AxB 10,4289 Resduo Total 8.14. Com os dados do quadro de interao do fatorial 2x6, no delineamento em Blocos Casualizados com 2 repeties, e considerando = 5% com os fatores A e B atuando dependentemente, pede-se : a) testar e concluir a respeito do fator A dentro do nvel B4 b) Fazer o estudo do fator B dentro dos nveis de A procedendo a anlise de varincia e o teste de Tukey se necessrio A1 A2 Total B1 46,8 47,2 94,0 B2 48,2 60,8 109,0 B3 47,3 69,3 116,6 B4 49,0 71,6 120,6 B5 48,5 61,5 110,0 B6 46,9 46,8 93,7 Total 286,7 357,2 643,9
SQResduo = 120,8325 8.15. Em um experimento fatorial 4x2 no delineamento em Blocos Casualizados com 3 repeties, so dados: B1 B2 Total SQTotal = 159,98 Blocos Totais I 60,4 II 74,6 III 72,4 A1 20,5 15,6 36,1 A2 26,2 21,4 47,6 A3 31,0 26,4 57,4 A4 36,5 29,8 66,3 Total 114,2 93,2 207,4
Sabendo-se que os fatores A e B atuam independentemente e adotando-se = 5% , pede-se: a) aplicar o teste de Scheff ao contraste + 2m + 3m C=m 6m A1 A2 A3 A4 b) concluir a respeito do fator B 86
Cap 8 Experimentos Fatoriais ____________________________________________________________ 8.16. Em um experimento fatorial em que foram combinados 4 nveis do fator A com 2 nveis do fator B, no delineamento em Blocos Casualizados com 5 repeties, so dados: Nveis de A Totais SQResduo = 223,9680 Admitindo que os fatores atuam independentemente, aplicar o teste Tukey aos nveis do fator A e concluir para = 5% . 8.17. Em um experimento fatorial, no DIC foram combinados 2 nveis do fator A com 3 nveis do fator B (ambos qualitativos), com 3 repeties. Os valores obtidos para cada repetio nos tratamentos avaliados, so dados abaixo. A1 A2 B1 12 14 16 14 13 16 B2 15 17 18 11 12 11 B3 12 11 13 12 12 13 A1 198 A2 184 A3 162 A4 154
Pede-se: a) Verificar se os dois fatores atuam independentemente. Use = 5% . b) Faa um estudo completo acerca dos nveis do fator A. Concluir para = 5% . 8.18. Num experimento com sunos foram comparadas trs raes (A, B, C) e dois nveis de protena (1-Alto, 2-Mdio), utilizando um delineamento inteiramente casualizado num esquema fatorial com 5 repeties. Ao final do experimento, obteve-se o seguinte quadro de interao para os totais de tratamentos: Protena 1 2 Totais A 498 469 967 Raes B 428 350 778 C 477 406 883 Totais 1403 1225 2628
Ao nvel de 5% de probabilidade, pede-se: a. Complete o quadro da ANOVA e verifique se os fatores raes e nveis de protena atuam independentemente. FV GL SQ QM F Rao Protena Interao 2 140,4667 0,34 (Tratamentos) Resduo 4957,20 Total b. Qual seria a rao a ser recomendada? (Use o teste de Duncan se necessrio) 87
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ c. Qual seria o nvel de protena a ser recomendado? (Use o teste de Duncan se necessrio). 8.19. Um pesquisador instalou um experimento para avaliar o efeito que o horrio de colheita e o tipo de colheitadeira tm na perda de gros. Para isto foram escolhidos trs horrios de colheita (H1, H2 e H3) e dois tipos de colheitadeira (T1 e T2). O pesquisador definiu como unidade experimental uma rea de 1020 metros. Como as unidades experimentais eram homogneas, o pesquisador distribuiu inteiramente ao acaso os tratamentos, ou seja, as combinaes dos nveis dos fatores, H1T1, H1T2, H2T1, H2T2, H3T1 e H3T2, s unidades experimentais conforme ilustrado na Figura 1.
Figura 1 Distribuio dos tratamentos s unidades experimentais e respectivas perdas (em gramas) observadas durante a colheita
10 m
20 m
H2T1 (43)
H1T2 (54)
H3T2 (71)
H3T2 (74)
H3T1 (56)
H2T2 (65)
H1T1 (39)
H2T2 (67)
H3T2 (73)
H2T1 (48)
H1T1 (49)
H3T1 (59)
H2T1 (41)
H3T1 (52)
H1T1 (35)
H1T2 (56)
H2T2 (62)
H1T2 (58)
H1T2 (61)
H2T1 (47)
H3T1 (58)
H2T2 (59)
H1T1 (40)
H2T2 (64)
H1T2 (59)
H3T1 (57)
H2T1 (38)
H3T2 (77)
H1T1 (45)
H3T2 (75)
T1 T2
H1 35 40 45 49 39 54 58 56 61 59
Total
1682(30)
T1 T2 Totais
88
Com base nas informaes fornecidas, pede-se: 8.19.1. Os fatores, horrio de colheita e tipo de colheitadeira, atuam independentemente na perda de gros? 8.19.2. Em qual(is) horrio(s) de colheita ocorreu maior(es) mdia(s) de perda de gros? Use o teste de Tukey e de Duncan. 8.19.3. Testar o contraste C = 2mH1 mH2 mH3 pelos testes de Scheff e t. Suponha que todas as pressuposies para a realizao de tais testes sejam satisfeitas. 8.19.4. Qual tipo de colheitadeira ocorreu maior mdia de perda de gros? Use o teste de Tukey e de Duncan se necessrio. 8.19.5. Testar o contraste C = mT1 mT2 pelos testes de Scheff e t. Suponha que todas as pressuposies para a realizao de tais testes sejam satisfeitas. 8.20. Um Engenheiro de Produo, objetivando aumentar a eficincia de uma linha de produo, instalou um experimento fatorial segundo o delineamento inteiramente casualizado com 5 repeties. Neste experimento foram comparados dois tipos de controle de qualidade (A1 e A2). Cada um dos dois tipos de controle de qualidade foi testado usando dois processos de fabricao (B1 e B2). O tempo gasto, em minutos, para completar o processo de fabricao foi medido. O quadro de totais de tratamentos fornecido a seguir: Totais de Tratamentos Fator A Fator B A1 A2 Totais B1 92 113 205 B2 112 90 202 Totais 204 203 407
Com base nestas informaes, pede-se (use o nvel de 5% de significncia): 8.20.1. Os fatores controle de qualidade e processo de fabricao atuam independentemente sobre o tempo gasto para fabricao? Justifique a sua resposta. 89
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 8.20.2. Qual processo de fabricao mais rpido quando o controle de qualidade A1 utilizado? Utilize o teste de Tukey, se necessrio. Justifique a sua resposta. 8.21. Uma fbrica de automveis realizou um experimento fatorial segundo o delineamento inteiramente casualizado com seis repeties, para verificar o efeito de dois fatores sobre o consumo de combustvel. O primeiro fator se refere ao mtodo de acelerao: eletrnica (A1) ou via cabo mecnico (A2). O outro fator se refere ao porte do motor: pequeno (B1), mdio (B2) ou grande (B3). Os nveis destes dois fatores foram combinados, obtendo-se um total de seis tratamentos. Foram montados 36 carros e o consumo destes carros, expresso em km/l, foram medidos. Os totais observados para cada tratamento foram Totais de Tratamentos Fator A Fator B A1 A2 Totais B1 73 69 142 B2 85 79 164 B3 58 52 110 Totais 216 200 416 FV GL SQ QM F A 7,11 B 122,99 A*B Tratamentos Resduo 48,67 Total 178,89 Baseado nestas informaes e usando o nvel de 1% de signficncia, pede-se: 8.21.1. Os fatores mtodo de acelerao e porte do motor atuam independentemente sobre o consumo de combustvel dos carros? Justifique a sua resposta. 8.21.2. Qual mtodo de acelerao proporciona maior consumo? Utilize o teste de Duncan se necesrio. Justifque a sua resposta. 8.22. Foram obtidos os seguintes resultados parciais com a realizao de um experimento com dois fatores A e B, instalado segundo o DBC com 3 blocos: Resumo (incompleto) da ANOVA FV A B AxB (Trat) Blocos Resduo Total GL SQ 10315,33 180,00 Totais de Tratamentos 90 QM F
Cap 8 Experimentos Fatoriais ____________________________________________________________ B1 B2 Totais A1 114 85 199 A2 209 58 267 A3 330 405 735 A4 114 299 413 Totais 767 847 1614 Usando o nvel de 5% de significncia, pede-se: 8.22.1 Os fatores A e B atuam independentemente? 8.22.2 Proceda ao estudo do fator B dentro do nvel A2 e conclua (use o teste de Tukey se necessrio). 8.22.3. Supondo que o teste F da anlise de varincia para o estudo de A dentro de B2 foi significativo, proceda ao teste de Tukey para comparar os nveis de A dentro de B2.
91
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 8.23. Em um experimento fatorial instalado segundo o delineamento inteiramente casualizado, foram testados trs tipos de suplementos minerais (Fator A) e dois tipos de suplementos vegetais (Fator B) no confinamento de bovinos. Os ganhos de peso obtidos pelos animais em teste foram: Tratamentos A1B1 A1B2 A2B1 A2B2 A3B1 A3B2 Fator A 1 2 3 Totais FV A B AxB (Trat) Resduo Total GL 1 35,2 32,8 34,7 28,6 33,8 30,8 Repeties 2 3 36,0 35,0 34,6 36,7 36,3 35,1 31,1 29,0 29,4 28,8 31,4 32,8 4 35,4 35,2 36,4 28,6 29,2 31,3 Totais 280,9 259,8 247,5 788,2 QM F Totais 141,6 139,3 142,5 117,3 121,2 126,3
Fator B 1 2 141,6 139,3 142,5 117,3 121,2 126,3 405,3 382,9 SQ 71,34 154,33 33,59 188,22
Com base nas informaes fornecidas, pede-se: 8.23.1 O valor do F calculado para testar o efeito da interao entre os fatores A e B. 8.23.2. O valor do F calculado para comparar os nveis de B dentro do nvel A2 8.23.3. O valor do F calculado para comparar os nveis de A dentro do nvel B2
92
Cap 8 Experimentos Fatoriais ____________________________________________________________ 8.24. Em um experimento instalado segundo o delineamento inteiramente casualizado, com 4 repeties, foram estudados os fatores A e B, com 3 e 2 nveis respectivamente. Deste experimento, so fornecidas as seguintes informaes: FV A B AxB (Trat) Resduo Total GL SQ 92,86 19,08 (175,70) 198,70 Ttotais de Tratamentos Fator A A1 A2 A3 102,6 103,5 80,2 101,3 78,3 85,3 181,8 165,5 203,9 QM F
Fator B B1 B2 Totais
Com base nas informaes fornecidas, pede-se (use o nvel de 1% de significncia quando necessrio) 8.24.1. Os fatores A e B atuam independentemente? 8.24.2. Existe diferena entre os nveis de A dentro do nvel B1? 8.24.3. Qual o nvel de B apresenta maior mdia dentro do nvel A2? Use o teste de Tukey, se necessrio.
93
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 8.25 Foi realizado um experimento, instalado segundo o delineamento inteiramente casualizado no esquema fatorial, para avaliar o efeito do fator Recipiente e do fator Espcie na altura da muda aos 80 dias de idade. Os nveis do fator recipiente avaliados foram saco plstico pequeno, saco plstico grande e saco laminado, daqui por diante identificados como R1, R2 e R3, respectivamente. Os nveis do fator espcie avaliados foram Eucalyptus citriodora e Eucalyptus grandis daqui por diante identificados como, E1 e E2, respectivamente de eucalipto. Os valores observados, em cm, foram Repeties 2 3 26,0 25,0 24,6 26,7 26,3 25,1 21,1 19,0 19,4 18,8 21,4 22,8
a) Os fatores, Recipiente e Espcie, atuam independentemente na altura das mudas? b) Levando em considerao o teste F para a interao entre os fatores, indique qual(is) nvel(is) de Recipiente proporcionou(aram) maior mdia de altura das mudas? Use o teste de Tukey quando necessrio. c) Idem para Espcie. Use o teste de Tukey quando necessrio. d) Utilize os testes de Scheff e t para testar os contrastes apropriados, os quais foram elaborados pelo pesquisador durante o planejamento deste experimento Interao Significativa No-signficativa Fator Recipiente C1 = mR1/E1 + mR2/E1 2mR3/E1 C3 = mR1 + mR2 2mR3 Espcie C2 = mE1/R1 mE2/R1 C4 = mE1 mE2
Informao adicional: Quadro de Totais de Tratamentos Recipientes Espcies R1 R2 R3 Totais E1 102,6 (4) 103,5 80,2 286,3 (12) E2 101,3 78,3 85,3 264,9 (12) Totais 203,9 (8) 181,8 165,5 551,2 (24) Observao: Este exerccio foi adaptado de BANZATTO e KRONKA (1989)
94
m
i
95
Deste quadro, pode-se tirar algumas informaes que posteriormente sero teis na anlise de varincia:
-
Total do i-simo nvel do fator A: A i = Total do j-simo nvel do fator B: B j = Total Geral: G =
I,J,K I J
k =1 J,K
j =1,k =1
Y
I,K
ijk
= Yi
i =1,k =1
ijk
= Y j
i =1, j =1,k =1
Yijk = A i = B j = YL
i =1 j =1 J j =1 I,J
i =1, j =1
ijk
96
IK
Para experimentos em parcelas subdivididas, pode-se montar dois quadros auxiliares. O primeiro deles idntico ao visto para experimentos fatoriais que o quadro de totais de tratamentos, cujos valores so obtidos pela soma de todas as repeties para o tratamento em questo. Para a situao citada, o quadro de totais de tratamentos do seguinte tipo: Fator A A1 A2 ... AI Totais Fator B B1 B2 ... BJ Y11. Y12. ... Y1J. Y21. Y22. ... Y2J. ... ... ... ... YI1. YI2. ... YIJ. B1 B2 ... Bj Totais A1 A2 ... AI G
O segundo quadro se refere ao quadro de totais de parcelas. Este quadro facilita o clculo das somas de quadrados de parcelas. Para a situao acima, o quadro de totais de parcelas do seguinte tipo: Fator A A1 A2 ... AI Totais de Parcelas Parcela 1 2 ... Z Y1.1 Y1.2 ... Y1.Z Y2.1 Y2.2 ... Y2.Z ... ... ... ... YI.1 YI.2 ... YI.. P1 P2 ... PZ Totais de A A1 A2 ... AI G
97
F -
Ftab;
QMAxB QM Re s(b)
[(I-1)(J-1); n2]
em que:
I,J,K
SQTotal =
i=1, j=1,k =1
2 Yijk C
SQBlo cos =
2 WK C IJ K =1
SQParcelas =
J
P
z =1
SQTrat =
C
i=1, j =1
I,J
Yij2 . K
SQA =
JK C
i=1
A I2
SQB =
B2 J C IK j=1
SQAxB = SQTrat SQA SQB SQRes(a) = SQParcelas - SQBlocos - SQA SQRes(b) = SQTotal - SQParcelas - SQB - SQAxB
Tal como no esquema fatorial, na anlise dos dados oriundos de um experimento em parcelas subdivididas deve-se inicialmente proceder ao teste F para a interao entre os fatores. As hipteses para o teste F da interao so: H0 : Os fatores A e B atuam independentemente sobre a varivel resposta em estudo. Ha : Os fatores A e B no atuam independentemente sobre a varivel resposta em estudo. O resultado deste teste F para a interao indica como as comparaes dos nveis de um fator devem ser realizadas. Temos dois resultados possveis para o teste F da interao os quais sero apresentados a seguir.
98
[(J-1); n3] -
As hipteses para realizar o teste F para os efeitos principais so Fator A H0 : m A1 = m A 2 =...= m AI ou seja, todos os possveis contrastes entre as mdias dos nveis do fator A, so estatisticamente nulos, ao nvel de probabilidade em que foi executado o teste. H a : no H 0 ou seja, existe pelo menos um contraste entre as mdias dos nveis do fator A, que estatisticamente diferente de zero, ao nvel de probabilidade em que foi executado o teste. Fator B H0 : mB1 = m B 2 =...= mBJ ou seja, todos os possveis contrastes entre as mdias dos nveis do fator B, so estatisticamente nulos, ao nvel de probabilidade em que foi executado o teste. H a : no H 0 ou seja, existe pelo menos um contraste entre as mdias dos nveis do fator B, que estatisticamente diferente de zero, ao nvel de probabilidade em que foi executado o teste. Se os fatores A e B forem qualitativos, e o teste F para A e/ou B, for no significativo, a aplicao do teste de mdias desnecessria. Se o teste F for significativo, para A e/ou B, aplica-se um teste de mdias para comparar os 99
Cap 9 Experimentos em Parcelas Subdivididas ___________________________________________________________ nveis do fator. As estimativas das mdias dos nveis dos fatores so obtidas por
A Fator A m Ai = i JK Bj
Fator B mBj =
IK
Para realizar o teste de Tukey para comparar as medias dos nveis dos fatores em teste temos que usar A B
q q
QM Re s(a) JK
q (I;n2) (J;n3)
QM Re s(b) IK
z (nA;n2) (nB;n3)
Em que nA e nB so os nmeros de mdias ordenadas abrangidas pelo contraste sendo testados. As hipteses para os testes Tukey e Duncan para comparar as mdias dos nveis dos fatores so Fator A H0 : mAi = mAu versus Ha : mAi mAu para i u = 1, 2, 3, ... , I Fator B H0 : mBj = mBu versus Ha : mBj mBu para j u = 1, 2, 3, ... , J Para a aplicao do teste t temos que usar t
CA CA
ttab
QM Re s(a) JK
a
i=1
2 i
t (n2)
CB CB
QM Re s(b) IK
b
j =1
2 i
t (n3)
100
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Para a aplicao do teste Scheff para testar os contrastes CA e CB temos que usar S A B
S = (I 1)Ftab
S = (J 1)Ftab
Ftab
QM Re s(a) JK
a
i =1 J j=1
2 i
QM Re s(b) IK
2 i
As hipteses para os testes de Scheff e t para testar os contrastes so Fator A H0 : CA = 0 versus Ha : CA 0 Fator B H0 : CB = 0 versus Ha : CB 0
O nmero de graus de liberdade associado a esta estimativa obtido pela frmula dos graus de liberdade de Satterhwaitte (n*) dada por
n* =
[QMRe s(a) + (J 1)QMRe s(b)]2 [QMRe s(a)]2 + [(J 1)QMRe s(b)]2 g.l.Re s(a ) g.l.Re s(b )
Desdobramento para comparar os nveis de A dentro de cada nvel de B, ou seja estudar A/B 101
As hipteses para testar as fontes de variao da tabela acima, para j=1, 2, 3, ..., J, so H0 : mA1/Bj = mA2/Bj = ... = mAI/Bj H a : no H 0 Desdobramento para comparar os nveis de B dentro de cada nvel de A, ou seja estudar B/A
FV B/A1 B/A2 ... B/AI Res(b ) Total GL (J-1) (J-1) ... (J-1) n3 IJK - 1 SQTotal SQ SQB/A1 SQB/A2 ... SQB/AI QM SQB / A1 (J 1) SQB / A 2 (J 1) ... SQB / AI (J 1) QMRes(b ) F QMB / A1 QM Re s(b) QMB / A 2 QM Re s(b) ... QMB / AI QM Re s(b) Ftab, [(J-1);n3] [(J-1);n3] ... [(J-1);n3]
As hipteses para testar as fontes de variao da tabela acima, para i=1, 2, 3, ..., I, so H0 : mB1/Ai = mB2/Ai = ... = mBJ/Ai H a : no H 0 Em que as SQA/Bj e SQB/Ai podem ser obtidas usando a frmula geral para a soma de quadrados dada por
SQ =
i=1
X i2 ri
i=1 k
Xi
i
r
i =1
Se os fatores forem qualitativos, procede-se ao teste F para cada fonte de variao do desdobramento. Nas fontes de variao em que o teste F foi significativo e o fator tem mais de dois nveis, recomenda-se a aplicao de um teste de mdias. As estimativas das mdias dos nveis dos fatores so obtidas por 102
Para realizar o teste de Tukey para comparar as mdias dos nveis dos fatores em teste temos que usar A B
q q
QM Re sComb K QM Re s(b) K
q (I;n*) (J;n3)
z (nA;n*) (nB;n3)
Em que nA e nB so os nmeros de mdias ordenadas abrangidas pelo contraste sendo testados. As hipteses para os testes Tukey e Duncan para comparar as mdias dos nveis dos fatores so Fator A: H0 : mAi/Bj = mAu/Bj vs Ha : mAi/Bj mAu/Bj para i u = 1, 2, 3, ... , I e j = 1, 2, ... , J Fator B: H0 : mBj/Ai = mBu/Ai vs Ha : mBj/Ai mBu/Ai para j u = 1, 2, 3, ... , J e i = 1, 2, ... , I Para a aplicao do teste t temos que usar t
CA CA
ttab
QM Re sComb K CB CB
i=1 2 j
a i2
t (n*)
QM Re s(b) K
b
j =1
t (n3)
Em que 103
Cap 9 Experimentos em Parcelas Subdivididas ___________________________________________________________ CA = a1mA1/Bj + a2mA2/Bj + ... + aImAI/Bj para j = 1, 2, ..., J e CB = b1mB1/Ai + b2mB2/Ai + ... + bjmBJ/Ai para i = 1, 2, ... , I Para a aplicao do teste Scheff para testar os contrastes CA e CB temos que usar S A B
S = (I 1)Ftab
S = (J 1)Ftab
Ftab
QM Re sComb K
QM Re s(b) K
J
a
i =1 2 j
2 i
b
j=1
As hipteses para os testes de Scheff e t para testar os contrastes so Fator A H0 : CA = 0 versus Ha : CA 0 Fator B H0 : CB = 0 versus Ha : CB 0
104
9.6. Exerccios
9.1. Considere um experimento instalado segundo o DBC e no esquema em parcelas subdivididas no qual so comparadas 4 variedades de aveia e 4 tratamentos de sementes (3 produtos qumicos + testemunha no tratada) quanto aos efeitos de produo. Na instalao do experimento, as 4 variedades foram distribudas ao acaso nas parcelas de cada um dos 4 blocos do experimento e os tratamentos de sementes foram distribudos ao acaso nas 4 subparcelas de cada parcela (BANZATTO & KRONKA, 1989). Com base nos resultados fornecidos a seguir, pede-se, usando o nvel de 5% de probabilidade, proceder a anlise de varincia e aplicar o teste Tukey, quando necessrio:
Sementes B1 Testemunha B2 Ceresan M A1 Vicland 1 B3 Panogen B4 Agrox Totais de Parcelas B1 Testemunha B2 Ceresan M A2 Vicland 2 B3 Panogen B4 Agrox Totais de Parcelas B1 Testemunha B2 Ceresan M A3 Clinton B3 Panogen B4 Agrox Totais de Parcelas B1 Testemunha B2 Ceresan M A4 Branch B3 Panogen B4 Agrox Totais de Parcelas Totais de Blocos Variedades 1 42,9 53,8 49,5 44,4 190,6 53,3 57,6 59,8 64,1 234,8 62,3 63,4 64,5 63,6 253,8 75,4 70,3 68,8 71,6 286,1 965,3 Blocos 2 3 41,6 28,9 58,5 43,9 53,8 40,7 41,8 28,3 195,7 141,8 69,6 45,4 69,6 42,4 65,8 41,4 57,4 44,1 262,4 173,3 58,5 44,6 50,4 45,0 46,1 62,6 56,1 52,7 211,1 204,9 65,6 54,0 67,3 57,6 65,3 45,6 69,4 56,6 267,6 213,8 936,8 733,8 4 30,8 46,3 39,4 34,7 151,2 35,1 51,9 45,4 51,6 184,0 50,3 46,7 50,3 51,8 199,1 52,7 58,5 51,0 47,4 209,6 743,9 Totais Trat 144,2 202,5 183,4 149,2 679,3 203,4 221,5 212,4 217,2 854,5 215,7 205,5 223,5 224,2 868,9 247,7 253,7 230,7 245,0 977,1 3379,8
Totais de Parcelas BLOCO 2 BLOCO 3 195,7 141,8 262,4 173,3 211,1 204,9 267,6 213,8 936,8 733,8 Totais de Tratamentos B2 B3 202,5 183,4 221,5 212,4 205,5 223,5 253,7 230,7 883,2 850,0
105
Cap 9 Experimentos em Parcelas Subdivididas ___________________________________________________________ 9.2. Para se estudar o brix de mangas de acordo com a variedade e a posio dos frutos em relao aos pontos cardeais, um pesquisador procedeu a coleta de 4 frutos, cada um deles de um ponto cardeal, em cada um dos 3 exemplares de cada uma das 5 variedades em teste. Com base nos resultados (brix) fornecidos a seguir (GOMES, 1987), pede-se usando o nvel de 5% de probabilidade, proceder a anlise de varincia e o teste Duncan quando necessrio.
Variedades A1 Carlota Totais Trat A2 Extrema Totais Trat A3 Oliveira Totais Trat A4 Bourbon Totais Trat A5 Imperial Totais Trat Totais B1 Norte 18,0 17,5 17,8 53,3 16,3 16,6 15,0 47,9 16,0 19,5 16,3 51,8 16,6 15,9 17,5 50,0 18,9 18,5 21,5 58,9 261,9 B2 Sul 17,1 18,8 16,9 52,8 15,9 14,3 14,0 44,2 16,2 14,9 16,4 47,5 15,2 13,2 15,8 44,2 18,6 13,7 16,4 48,7 237,4 B3 Leste 17,6 18,1 17,6 53,3 16,5 16,3 15,9 48,7 17,9 15,0 16,0 48,9 14,2 18,0 16,7 48,9 15,3 18,2 18,3 51,8 251,6 B4 Oeste 17,6 17,2 16,5 51,3 18,3 17,5 15,2 51,0 16,1 15,3 16,4 47,8 15,5 17,3 18,4 51,2 17,0 18,3 16,6 51,9 253,2 Totais Parc 70,3 71,6 68,8 67,0 64,7 60,1 191,8 66,2 64,7 65,1 196,0 61,5 64,4 68,4 194,3 69,8 68,7 72,8 1004,1 211,3 1004,1 Totais
210,7
A1 A2 A3 A4 A5
Totais de Parcelas REP 1 REP 2 REP 3 70,3 71,6 68,8 67,0 64,7 60,1 66,2 64,7 65,1 61,5 64,4 68,4 69,8 68,7 72,8
Totais de Tratamentos B1 B2 B3 B4 A1 53,3 52,8 53,3 51,3 A2 47,9 44,2 48,7 51,0 A3 51,8 47,5 48,9 47,8 A4 50,0 44,2 48,9 51,2 A5 58,9 48,7 51,8 51,9 Totais 261,9 237,4 251,6 253,2
106
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 9.3. Um pesquisador, com o objetivo de verificar o efeito da dose de adubao fosfatada e o seu tipo de aplicao na cultura do milho, instalou um experimento no qual cada uma as doses de adubao fosfatada constituram as parcelas as quais foram distribudas segundo o DBC e o tipo de aplicao as subparcelas. Com base nos resultados fornecidos abaixo, referentes a produo de milho (kg/ha), pede-se ao nvel de 5% de probabilidade, proceder a anlise de varincia e ao teste Tukey quando necessrio (FERREIRA, 1991).
Doses 0 Tipos de Aplicao cova sulco lano Totais de Parcelas cova sulco lano Totais de parcelas cova sulco lano Totais de parcelas cova sulco lano Totais de parcelas Totais de blocos I 3778 3467 3422 10667 3302 3653 3711 10666 2938 3800 2702 9440 3013 3338 3156 9507 40280 Blocos II 3618 4284 3760 11662 2671 2653 3284 8608 2813 4356 3520 10689 3787 3369 4369 11525 42484 III 2164 3773 2747 8684 2782 3529 2556 8867 2560 3560 3382 9502 3142 2507 2831 8480 35493 IV 3996 3280 2853 10129 2502 2258 3284 8044 3049 4013 3524 10586 3604 4200 4222 12026 40785 Totais de tratamentos 13556 14804 12782 11257 12093 12835 11360 15729 13128 13546 13414 14578 159082
40
80
120
9.4. Suponha que para um experimento instalado segundo o delineamento inteiramente casualizado e no esquema de parcelas subdivididas com 3 repeties, foram obtidos os seguintes resultados:
FV Fator A Resduo(a) (Parcelas) Fator B Interao A*B Resduo(b) Total GL SQ 29,55 15,71 (45,26) 20,60 20,12 51,60 137,58 QM F
Totais de Tratamentos
A1 A2 A3 A4 A5 Totais B1 53,3 47,9 51,8 50,0 58,9 261,9 B2 52,8 44,2 47,5 44,2 48,7 237,4 B3 53,3 48,7 48,9 48,9 51,8 251,6 B4 51,3 51,0 47,8 51,2 51,9 253,2 Totais 210,7 191,8 196,0 194,3 211,3 1004,1
107
Cap 9 Experimentos em Parcelas Subdivididas ___________________________________________________________ Usando o nvel de 5% de significncia quando necessrio, pede-se: 9.4.1. Os fatores A e B atuam independentemente? Justifique sua resposta. 9.4.2. Existe diferena entre os nveis de B pelo teste F da anlise de varincia? 9.4.3. Se o objetivo obter menores mdias, qual(is) o(s) nvel(is) de B que devem ser recomendados? (Use o teste de Duncan, se necessrio). 9.5. Considere os resultados obtidos de um experimento instalado segundo o delineamento inteiramente casualizado no esquema de parcelas subdivididas e o nvel de 5% de significncia quando necessrio: Totais de Parcelas Repeties 1 2 3 50,3 51,6 48,8 27,0 24,7 20,1 26,2 24,7 25,1 21,5 24,4 28,4 69,8 68,7 72,8 Totais 150,7 71,8 76,0 74,3 211,3 Totais 150,7 71,8 76,0 74,3 211,3 584,1 F
A1 A2 A3 A4 A5
Totais de Tratamentos B1 B2 B3 B4 A1 38,3 37,8 38,3 36,3 A2 17,9 14,2 18,7 21,0 A3 21,8 17,5 18,9 17,8 A4 20,0 14,2 18,9 21,2 A5 58,9 48,7 51,8 51,9 Totais 156,9 132,4 146,6 148,2 FV A Res(a) Parcelas B Interao A*B Res(b) Total GL
Com base nestas informaes, pede-se: 9.5.1. O valor do F calculado para testar a interao entre os fatores A e B. 9.5.2. O valor do F calculado para o fator A. 9.5.3. O(s) nvel(is) de A que apresentou(aram) a(s) maior(es) mdia(s) usando o teste de Tukey. 9.5.4. O valor do F calculado para o fator B. 9.5.5. O(s) nvel(is) de B que apresentou(aram) a(s) maior(es) mdia(s) usando o teste de Tukey.
108
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ 9.6. Considere os resultados obtidos de um experimento instalado segundo o delineamento inteiramente casualizado, com 3 repeties, no esquema de parcelas subdivididas e o nvel de 5% de significncia, quando necessrio: Totais de Tratamentos B1 B2 B3 B4 53,3 52,8 53,3 51,3 47,9 44,2 48,7 51,0 51,8 47,5 48,9 47,8 50,0 44,2 48,9 51,2 58,9 48,7 51,8 51,9 261,9 237,4 251,2 253,2 GL Totais 210,7 191,8 196,0 194,3 211,3 1004,1 F
SQTratamentos = 70,26 Com base nas informaes fornecidas, pede-se: 9.6.1. Os fatores A e B atuam independentemente? Justifique a sua resposta. 9.6.2. Baseado no resultado do teste F para a interao, proceda ao estudo do fator B, indicando qual(is) nvel(is) de B que apresenta(m) maior(es) mdia(s). Use o teste de Tukey, se necessrio. 9.7. Num artigo cientfico foram apresentados os resultados abaixo referente a um experimento em parcelas subdivididas instalado segundo o delineamento em blocos casualizados, com 5 repeties, em que o fator A foi distribudo s parcelas e o fator B foi distribudo s subparcelas: Quadro de MDIAS de Tratamentos B1 B2 A1 23,80 21,60 22,70 A A2 14,00 11,60 12,8 B A3 13,20 13,60 13,40 B 17,00 a 15,60 b
As mdias seguidas por uma mesma letra maiscula na linha, ou por uma mesma letra minscula na coluna, no diferem entre si ao nvel de 5% de probabilidade, pelo teste de Tukey e pelo teste F, respectivamente. Dados: SQRes(b) = 26,60
109
Cap 9 Experimentos em Parcelas Subdivididas ___________________________________________________________ No entanto, o autor no menciona no seu artigo um teste para a interao entre os fatores A e B. Com base nas informaes acima, pede-se usando = 5% : 9.7.1. Aplique o teste F para a interao entre os fatores A e B. 9.7.2. Baseado no resultado do teste F obtido no item anterior, os procedimentos adotado para comparar os nveis de A e os nveis de B esto corretos? Justifique a sua resposta. No necessrio conferir os clculos do autor, apenas discuta se o procedimento adotado coerente com o resultado do teste F para a interao. 9.8. Abaixo, so mostrados os dados de um experimento em blocos ao acaso com parcelas subdivididas, onde o fator A com trs nveis foi casualizado nas parcelas e o fator B com dois nveis foi casualizado nas subparcelas. Fator A A1 A1 A2 A2 A3 A3 Fator B B1 B2 B1 B2 B1 B2 1 58 44 85 59 66 54 Blocos 2 3 77 38 59 30 90 73 68 45 93 67 75 53 4 52 34 77 55 64 48
Efetue o teste F para a interao AxB e proceda s comparaes dos nveis dos fatores A e B pelo teste de Tukey, se necessrio, de acordo com o resultado de significncia para a interao. Utilize = 5%. 9.9. Considere um experimento em parcelas subdivididas no delineamento inteiramente casualizado com 4 repeties, onde o fator A foi casualizado nas parcelas e fator B casualizado nas subparcelas, sendo dados: Totais de Tratamentos A1 A2 B1 20,4 11,3 31,7 B2 19,7 10,6 30,3 B3 32,3 18,0 50,3 72,4 39,9 112,3
SQParcelas = 55,9836 e SQTotal = 121,4907. Efetue o teste F para a interao AxB e proceda s comparaes dos nveis dos fatores A e B pelo teste de Duncan, se necessrio, de acordo com o resultado de significncia para a interao. Utilize = 5%.
110
10. Regresso
10.1. Introduo
Um fator em estudo num experimento pode ser classificado como qualitativo ou quantitativo. Um fator qualitativo aquele onde os seus nveis diferem por algum atributo qualitativo. Como exemplos tm-se variedades, tipos de defensivos, mtodos de conduzir uma determinada tarefa, etc. Por outro lado, um fator quantitativo aquele onde os nveis se diferem com relao a quantidade do fator. Como exemplos tm-se temperatura, umidade, concentrao de um princpio ativo, nveis de insumo, pH, etc. Quando o fator qualitativo, deve-se proceder anlise de varincia dos dados e s comparaes entre mdias dos nveis do fator usando algum dos procedimentos para comparaes mltiplas, quando o F for significativo. Para o caso de um fator quantitativo, deve-se estudar o efeito do fator quantitativo p r meio de uma relao funcional entre o mesmo e a varivel resposta. A tcnica indicada neste caso a anlise de regresso. A anlise de regresso consiste na realizao de uma anlise estatstica com o objetivo de verificar se a relao funcional estabelecida entre um fator quantitativo e uma varivel resposta significativa. Em outras palavras, consiste na obteno de uma equao que tenta explicar a variao significativa de uma varivel resposta em funo da variao dos nveis de um ou mais fatores quantitativos.
Cap 10 Regresso ____________________________________________________________________ distncias entre os pontos do diagrama e os respectivos pontos na curva da equao estimada minimizada, obtendo-se, desta forma, uma relao funcional entre X e Y, para o modelo escolhido, com um mnimo de erro possvel.
e i2 = [Yi 0 1 X i ]
i =1 i =1
(1)
Por meio da obteno de estimadores de 0 e 1 , que minimizem o valor obtido na expresso anterior, possvel alcanar a minimizao da soma de quadrados dos erros. Sabemos do Clculo que para se encontrar o mnimo de uma equao deve-se derivar a equao em relao varivel de interesse, e igualar a derivada resultante ao valor zero. Portanto, derivando a expresso (1) em relao a 0 e 1 e igualando-as a zero, obtm-se:
n 2 ei i=1 =0 0 n 2 ei i=1 =0 1
(Y
n i i=1
1X i ( 1) = 0
) )
(Y
n i i=1
1 X i = 0
(Y
n i i=1
1X i ( X i ) = 0
(Y
n i i=1
1 X i (X i ) = 0
i=1 n
Yi n 0 1 Yi X i 0
X
i=1
=0
i=1
i=1
X i 1
X
i=1
2 i
=0
112
Este o sistema de equaes normais, que permite a obteno de estimativas de 0 e 1 , que minimizam a soma de quadrados dos erros. Uma vez obtidas estas estimativas, podemos escrever a equao estimada: Yi = 0 + 1 X i
Utilizando o MMQ, no modelo de 2 grau, chegar-se- ao seguinte sistema de equaes normais, para se obter as estimativas de 0 , 1 e 2 :
n n n Yi = n 0 + 1 X i + 2 X i2 i =1 i =1 i=1 n n n n 2 3 Yi X i = 0 X i + 1 X i + 2 X i i =1 i =1 i =1 i=1 n n n n 2 2 3 4 Yi X i = 0 X i + 1 X i + 2 X i i =1 i =1 i =1 i=1
113
Cap 10 Regresso ____________________________________________________________________ ser realizado para verificar tal fato o teste F da anlise de varincia. Portanto, necessrio realizar uma anlise de varincia dos dados observados, em funo do modelo proposto. Contudo, a estratgia da anlise de varincia depende se houve ou no repeties no experimento.
10.4.1. Apenas um nico valor observado para cada nvel da varivel independente
Nesta situao no existe repetio. A nica estimativa da varincia residual aquela dada pela falta de ajuste dos valores observados ao modelo ajustado. O quadro para a anlise de varincia para a regresso para esta situao do seguinte tipo:
FV Regresso Independente da Regresso Total GL p n-1-p n-1 SQ SQReg SQInd SQTotal QM SQ Re g p SQInd n 1 p F QM Re g QMInd Ftab; (p;n-1-p)
em que, p = no de coeficientes de regresso (no inclui o 0 ) n = no de observaes. As frmulas para a obteno das somas de quadrados total e da soma de quadrados do independente da regresso so as mesmas, tanto para o modelo linear de 1o grau quanto para o de 2o grau, as quais so dadas a seguir:
SQTotal =
i=1
Yi2
Yi i=1 n
n
J a soma de quadrados para a regresso varia de acordo com o modelo em teste. 1 grau 2 grau
SQ Re gresso = 0
i=1
Yi + 1
i=1
Yi X i
Yi i=1 n
n
SQ Re gresso = 0
i=1
Yi + 1
i=1
Yi X i + 2
i=1
2 Yi X i
Yi i=1 n
n
H 0 : 1 = 2 = ... = p = 0 , o que significa dizer que as p variveis independentes no exercem influncia na varivel dependente, segundo o modelo proposto. H a : i 0 , para pelo menos um i, o que significa dizer que pelo menos uma das p variveis independentes exerce influncia na varivel dependente, segundo o modelo proposto.
114
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ O valor de F da anlise de varincia, deve ser comparado, com o valor de F tabelado (Ftab ) , o qual se obtm na tabela da distribuio F de acordo com o nvel de significncia do teste, e o nmero de graus de liberdade para a regresso e independente da regresso, ou seja: Ftab = F (p;n 1 p ) . A regra decisria para o teste F : - Se F Ftab Rejeita-se H0 ao nvel de significncia que foi realizado o teste. Podese inferir que a varivel independente influncia significativamente a varivel dependente Y. - Se F < Ftab No rejeita-se H0 ao nvel de significncia que foi realizado o teste. Pode-se inferir que a varivel independente no influncia significativamente a varivel dependente Y.
F QM Re g QM Re s QMFalta QM Re s -
O teste F para a falta de ajustamento realizado para verificar se o modelo adotado est se ajustando bem aos dados. Se o teste F para a falta de ajustamento for significativo, indica que o modelo ajustado no apropriado e um novo modelo que se ajuste melhor aos dados deve ser testado. Se por outro lado, a falta de ajustamento for no-significativa indica que o modelo adotado se ajusta bem aos dados. Conseqentemente faz sentido analisar o teste F para a fonte de variao regresso para saber se a varivel independente tem influncia significativa sobre a varivel dependente. 115
Cap 10 Regresso ____________________________________________________________________ No caso de falta de ajustamento significativa no faz sentido realizar o teste para a regresso, pois o modelo de regresso no se ajustou significativamente aos dados. As hipteses para a falta de ajustamento so: H0: a falta de ajustamento no significativa Ha: a falta de ajustamento significativa O valor tabelado de F para a falta de ajustamento encontrado usando Ftab = F (p; I 1 p ) A regra decisria para o teste F para a falta de ajustamento : Se F Ftab Rejeita-se H0 ao nvel de significncia que foi realizado o teste. O modelo adotado no se ajusta bem aos dados. Um novo modelo deve ser testado. Se F < Ftab No rejeita-se H0 ao nvel de significncia que foi realizado o teste. O modelo adotado se ajusta bem aos dados. No h necessidade de se testar um novo modelo. Procede-se ao teste F para regresso. O teste F para a regresso idntico ao caso anterior, ou seja, com apenas uma observao para cada nvel da varivel independente.
10.6. Exerccios
10.1. Verificar, utilizando os dados amostrais fornecidos abaixo, se a temperatura tem influncia significativa sobre o comprimento de uma barra de ao. Utilize o modelo linear de 1 grau e o nvel de 5% de significncia. Temperatura (C) Comprimento (mm) 10 1003 15 1005 20 1010 25 1011 30 1014
10.2. Para verificar se existe uma relao linear de 1 grau entre Umidade Relativa (UR) do ar da secagem de sementes e a germinao das mesmas, um pesquisador realizou um teste com 4 diferentes valores para a % de UR do ar que atravessava as sementes armazenadas, obtendo-se os seguintes valores amostrais:
116
Ao nvel de 5% de probabilidade, qual seria a concluso do pesquisador? Qual seria a equao estimada? 10.3. Para o seguinte conjunto de valores de X (varivel independente) e Y (varivel dependente), faa a anlise de regresso segundo o modelo linear de 1 grau e obtenha a equao de regresso estimada. Use o nvel de significncia de 5%. X Y 2 10,3 4 18,2 6 25,1 8 35,6 10 43,0 12 50,0 14 59,1 16 67,8 18 75,2 20 85,0
10.4. De acordo com os dados fornecidos abaixo para a varivel X (dose do micronutriente Zn em ppm) e a varivel Y (matria seca em g/planta), verifique, usando o nvel de 5% de probabilidade e o modelo linear de 2 grau, se a relao entre as variveis X (independente) e Y (dependente) significativa. X Y 1,0 20,3 2,5 31,3 4,0 34,6 5,5 35,1 7,0 30,2 8,5 19,7
10.5. O modelo linear abaixo foi proposto para explicar a relao entre a quantidade de rao fornecida e produo de leite por cabras: Yi = a + bX i + e i Pede-se por meio dos dados abaixo, verificar se a rao influencia significativamente a produo de leite ( = 5%) : Nveis de Rao (g) Produo de leite (l/dia) 50 1,2 75 1,7 100 2,0 125 2,1 150 2,5
10.6. Para o modelo ajustado e dados fornecidos abaixo: Y = 140,7835 + 0,2737 X 0,000783 X2 SQIndependente da Regresso = 68,1691
Yi = 1094,800 Yi X i = 166942,500
i =1 i =1 7
Y
i =1 7
= 171712,384
i 2 i
YX
i =1
= 35986875,000
117
Cap 10 Regresso ____________________________________________________________________ 10.7. Para se avaliar o efeito de diferentes dosagens de um micronutriente no desenvolvimento de duas espcies vegetais, foi realizado em experimento fatorial 4x2 no D.B.C. com 5 repeties. Aps a coleta e tabulao dos dados (em produo de matria verde por determinada unidade de rea) foi montado o seguinte quadro de totais de tratamentos: Dose 1 Dose 2 Dose 3 Dose 4 60 52 60 90 262 56 50 40 40 186 116 102 100 130 448 A anlise de varincia dos dados no computador forneceu o seguinte quadro (incompleto) da ANOVA: Espcie 1 Espcie 2 F.V. Fator A Fator B Int. AxB (Trat.) Blocos Resduo Total G.L. 1 3 S.Q. 58,2 ---------------Q.M.
49,20
10,00
Com base nos dados apresentados acima, pede-se: (obs.: use = 5%): a) Obtenha a soma de quadrados para o fator A. Apresente os clculos. b) Os fatores em estudo atuam independentemente na varivel em anlise? JUSTIFIQUE. c) Qual espcie deveria ser usada de modo a termos uma maior produo de massa verde, quando for usada a dose 3 do micronutriente? JUSTIFIQUE. d) Como deveramos continuar a anlise caso fosse de nosso interesse determinar a melhor dose do micronutriente? Descreva a estratgia de anlise de maneira resumida, apresentando a seqncia dos procedimentos a serem realizados juntamente com algumas discusses, mas sem precisar fazer nenhum tipo de clculo
118
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ 10.8. Suponha que um colega seu tenha usado um programa de computador para realizar a anlise de regresso de um experimento no DIC com 4 repeties, no qual foi avaliado o efeito de 5 nveis de adubo na produo de soja. O orientador desse seu colega pediu que ele testasse trs modelos. Como seu colega "matou" todas as aulas de estatstica, ele foi pedir sua ajuda para a escolha do melhor modelo a partir dos dados abaixo, referentes anlise de cada modelo. Baseado no quadro fornecido abaixo, pede-se escolher o melhor modelo. Explique, para cada modelo, a razo dele ter sido selecionado ou eliminado. Use = 5%. MODELO 1 F.V. Regresso Falta de Ajust. (Tratamento) Resduo Total MODELO 2 F.V. Regresso Falta de Ajust. (Tratamento) Resduo Total MODELO 3 F.V. Regresso Falta de Ajust. (Tratamento) Resduo Total G.L. 3 1 (4) 15 19 S.Q. 76 20 96 75 Q.M. 25,3 20 5 G.L. 2 2 (4) 15 19 S.Q. 66 30 96 75 Q.M. 33 15 5 G.L. 1 3 (4) 15 19 S.Q. 36 60 96 75 171 Q.M. 36 20 5
O grfico de disperso dos valores mdios de produo em funo das doses de adubo obtido pelo seu colega foi
Grfico de Disperso
Produo (kg/unid) 25 20 15 10 5 0 0 20 40 60 Dose (kg/ha)
Baseado nas informaes fornecidas acima, pede-se escolher o melhor modelo. Explique, para cada modelo, a razo dele ter sido selecionado ou eliminado. Use = 5%. 119
Cap 10 Regresso ____________________________________________________________________ 10.9. Com o objetivo de estudar o efeito da temperatura no ganho de peso de determinada espcie de animal de pequeno porte, foi realizado um estudo em que alguns animais foram submetidos a diferentes temperaturas no local em que eram confinados. Com base nos dados de ganho de peso, obtidos depois de determinado perodo, ajustouse a seguinte equao de regresso: Y = 6,89 + 0,93 X 0,02 X2 Considerando que a anlise de varincia da regresso resultou em F significativo para regresso, pede-se: a) Qual seria o ganho de peso (em quilos) esperado, se fosse mantida constante, no local de confinamento do animal em questo, a temperatura de 23 oC? b) Qual seria a temperatura a ser usada para que fosse obtido o mximo de ganho de peso? 10.10. Suponha que tenha sido realizada uma pesquisa a respeito da influncia do tempo de estudo na nota da prova de determinada disciplina. Os dados obtidos com respeito a cinco alunos aleatoriamente entrevistados so dados abaixo: Xi = Tempo de estudo (em horas) Y = Nota obtida (em 10) 2 3
i i
3 5
4 6
2 i
5 8
6 9
= 20
2 i
= 90
= 31
X Y
= 139
= 215
Pede-se: a) Ajuste um modelo de regresso linear de 1o grau para tentar explicar a variao na nota do aluno em funo do tempo de estudo. OBS.: Indique a resoluo, inclusive apresentando o sistema de equaes normais. b) Poderamos dizer que o tempo de estudo influencia significativamente a nota obtida? (use = 5%). 10.11. Com os dados relativos equao de regresso Y = a 10,38 X + 1,08 X 2 , obter i 0 i i a ANOVA da regresso e concluir para = 5% . DADOS:
Yi = 120,43
i =1 20
20
X i Yi = 340,87
i =1
20
X
i =1
20
2 i
Yi = 4238,684
Yi2 = 18375,38
i =1
X i = 256,5
i =1
20
X
i =1
20
2 i
= 346,48
10.12. Obter a equao de regresso para o modelo Y = a + a X + a X2 +e e concluir 0 1 2 para = 1% . X Y -4 1,2 -3 10,1 -2 13,2 -1 14,3 1 14,1 2 12,7 3 8,5 4 0,3
120
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ 10.13. Fazer a anlise de varincia da regresso, concluindo para = 1% , dados : Z = 10,40 + 15,46 W , i = 1 2,3,...,15 , i 2 Z = 69,80 Z = 2,3 W = 1,46 W Z = 1,92 i i i i i 10.14. Suponha que um bilogo realizou um experimento no DIC com 3 repeties, para comparar o efeito de 5 dosagens (Xi, em mg) de uma droga farmacutica desenvolvida para aumentar o tempo de sono (Yi, em horas). A anlise dos dados oriundos deste experimento produziu as seguintes informaes:
Xi Yi
1 4
2 9
13
3 10
12
4 13
17
12
5 11
16
Usando o nvel de 5% de significncia, pede-se: 10.14.1. Proceda ao teste para a falta de ajustamento e conclua se o modelo de regresso linear de 1o grau apropriado para descrever o tempo de sono em funo da dosagem de sonfero. 10.14.2. O valor estimado para 1 estatisticamente diferente de zero? Justifique a sua resposta. 10.14.3. De acordo com a equao de regresso estimada, qual seria o tempo de sono dos ratos se uma dosagem de 17 mg fosse usada? 10.15. Foi realizada uma pesquisa para estudar o efeito de determinado medicamento usado no controle de peso de cavalos de corrida. Seis doses do medicamento foram ministradas a seis animais. A perda de peso obtida para estes animais, bem como a dose do medicamento ministrada a cada um deles fornecida na tabela a seguir: Dose (mg) Perda de Peso (kg) 20 1,0 25 4,5 30 6,0 35 7,5 40 5,8 45 4,3
Suponha que o pesquisador decida usar o seguinte modelo linear de segundo grau: Yi = 0 + 1 X i + 2 X i2 + i
Y = 29,1
i i =1 n
YX
i i =1 n
= 1000,50
YX
i i =1 n i =1
2 i
= 35787,50 = 248625
X
i =1
= 195
X
i =1
2 i
= 6775
3 i
X
i =1
4 i
= 9521875
Com base nas informaes fornecidas, pede-se: 10.15.1 A estimativa do intercepto (ou seja, constante da regresso) 10.15.2. As estimativas dos coeficientes de regresso, 1 e 2 10.15.3 A dose que proporciona o mximo de perda de peso 10.15.4. O valor do F da anlise de varincia da regresso calculado para testar se existe efeito do medicamento sobre a perda de peso, segundo o modelo proposto. 10.16. Um experimento foi instalado segundo o delineamento inteiramente casualizado para verificar se existe efeito significativo do fator quantitativo X sobre uma varivel
121
Cap 10 Regresso ____________________________________________________________________ dependente Y. Suponha que foram utilizadas 2 repeties e que so fornecidas as seguintes informaes: Modelo adotado: Yi = o + 1X i + i FV Regresso Falta de Ajustamento (Tratamentos) Resduo Total Pede-se: 10.16.1. O valor do F calculado para a regresso 10.16.2. O valor do F calculado para a falta de ajustamento 10.17. Suponha que em uma pesquisa, 10 dosagens de uma droga foram ministradas a um grupo de 10 indivduos, para verificar se o efeito da mesma era capaz de reduzir o peso em seres humanos. Cada dosagem foi testada em um nico indivduo. O modelo linear de 2o grau ajustado, a SQResduo, as dosagens testadas e as respectivas perdas de peso observadas e alguns somatrios relacionados, foram: Yi = 1,15000 + 2,66174X i 0,09564X i2 Dosagem (mg) Perda de peso (kg) 2 5
2 i
GL
SQ 76,05
QM
(4)
101,60 126,10
SQRegresso=179,87 10 15
i i
4 8
6 10
8 13
12 17
14 20
10
16 18
18 15
2 i
20 13
Y
i =1 10 i =1
10
= 134
Y
i =1 10 i =1
10
= 1990
YX
i =1 10 i =1
10
= 1658
YX
i i =1
= 23876 = 405328
X i = 110
X i2 = 1540
X i3 = 24200
X
i =1
10
4 i
Com base nas informaes fornecidas acima e, usando o nvel de 5% de significncia quando necessrio, pede-se: 10.17.1. possvel concluir que o uso da droga resulta em uma perda de peso significativa? 10.17.2. Qual a dosagem da droga que proporciona maior perda de peso? 10.17.3. Qual seria a perda de peso esperada se a dosagem de 35 mg fosse utilizada?
122
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ 10.18. Suponha que um pesquisador, tendo como objetivo desenvolver uma bebida Lctea com sabor natural de laranja e temendo que o uso do suco natural resultasse em elevada acidez, resolveu testar 10 dosagens de suco natural (10, 15, 20, 25, 30, 35, 40, 45, 50 e 55 ml) com relao ao ph da bebida Lctea. Para tanto preparou um lote da frmula bsica da bebida Lctea. A frmula bsica aquela que contm todos os ingredientes da bebida Lctea, exceto o suco de laranja. Como o lote era completamente homogneo, dividiu o lote em 30 amostras. Procedeu-se ento a distribuio inteiramente ao acaso das dosagens de suco de laranja s amostras. Ao final, cada dosagem foi designada a 3 amostras. Aps a mistura do suco de laranja s amostras, o pH da bebida Lctea foi medido. Um grfico de disperso da dosagem versus pH, mostrou que o modelo linear de 1o grau era indicado para estudar o fenmeno. Com base nos dados, as seguintes informaes foram obtidas: Quadro da ANOVA da Regresso
FV Regresso Falta de Ajustamento (Tratamentos) Resduo Total GL SQ 23,7692 (24,3720) 25,1520 QM F F5%
Equao da regresso ajustada: Yi = 7,63 0.08X i Com base nas informaes fornecidas acima e usando o nvel de 5% de significncia, pede-se: OBSERVAO: UTILIZAR QUATRO DECIMAIS NOS CLCULOS 10.18.1. O modelo ajustado adequado para descrever o fenmeno? 10.18.2. A dosagem do suco de laranja tem efeito significativo na acidez da bebida Lctea? 10.18.3. Quanto se espera que varie o pH da bebida Lctea em funo da variao de 1 ml de suco de laranja?
10.19. Um padeiro resolveu testar 10 diferentes dosagens de um determinado tipo de fermento para verificar se o mesmo influenciava o peso final dos pes. Os resultados obtidos foram: Yi = 1,93 + 6,36 X i 0,45 X i2 SQTotal = 310,40
Y
i =1 10 i =1
10
= 194
Y
i =1 10 i =1
10
= 4074
YX
i =1 i 10 i =1
10
= 1179
YX
i =1 i
10
2 i
= 8461 = 25333
X i = 55
X i2 = 385
X i3 = 3025
X
i =1
10
4 i
Com base nas informaes fornecidas acima e, usando o nvel de 5% de significncia quando necessrio, pede-se: 10.19.1. possvel concluir que as dosagens do fermento influenciaram no peso final dos pes? 10.19.2. De acordo com a equao de regresso ajustada, qual a dosagem estimada que proporciona o maior peso final de pes?
123
Cap 10 Regresso ____________________________________________________________________ 10.20. Uma droga desenvolvida para o controle do nvel de acar (Y) foi testada em as doses 20, 30, 40, 50, 60, 70 e 80 mg (X). Os resultados apresentados abaixo foram publicados em uma revista cientfica: Yi = 286,32 + 0,83 X i SQTotal = 1933,71 SQRegresso=1905,75 Com base nestas informaes, pede-se: 10.20.1. A droga tem influncia significativa sobre o teor de glicose? 10.20.2. Qual a estimativa do teor de glicose no sangue quando se usa a dose de 90 mg?
124
125
Captulo 1
1.1. t = 5,24 1.2. t = 2,21 1.3. t = 1,26 t1% (4) = 4,60 t5% (5) = 2,02 t5% (8) = 1,86
2 s c = 6,25
2 s c = 20,29
1.9. t = -3,65
t(5%)(9) = 1,83
s 2 = 3,41 d
2 s c = 18,25
1.10. t = 1,11 1.11. t = 3,10 1.12. t = 1,06 1.13. t = 14,61 1.14. t = 8,82 1.15. t = -0,39 1.16. F= 5,00 1.17. t = 9,34 1.18. t = -3,87 1.19. t = -2,66
1.20. t = -3,07 1.21. t = 11,54 1.22. 1.22.1. (c) 1.23. t = -3,45 1.24. t = -1,89 1.25. t = 0,84 1.26. t = 1,62 1.27. t = 4,05 1.28. t = 1,73 1.29. t = -19,53 1.30. t = -2,25
t5% (18) = 2,10 t5% (7) = 1,90 t5% (10) = 1,81 t1% (13) = 3,01 t10% (8) = 1,86 t1% (12) = 2,68 F(1%) (5,5) = 10,97 t5% (8) = 1,86 t1% (14) = 2,62 t5% (9) = 1,83
t5% (18) = 2,10 t5% (5) = 2,02
s 2 = 7,73 d
2 s c = 65,00
s 2 = 75,46 d
2 s c = 8,54
2 s c = 11,45
2 s c = 2,57
s 2 = 25 s 2 = 5,62 d
2 s c = 0,0478
s 2 = 47,06 d 1.22.2 (c) 1.22.3 (c) 2 t1% (14) = 2,14 s c = 295,81 t5% (9) = 3,25 s 2 = 0,04 t5% (5) = 2,57 s 2 = 0,86 d t1% (14) = 2,62 t5% (9) = 1,83 t5% (14) = 1,76 t5% (8) = 1,86 t5% (8) = 1,94
2 s c = 41,82
s 2 = 2,44 d
2 s c = 18,82 2 s c = 2,7 . Marca A.
s 2 = 18,90
126
Captulo 2
2.1. C1 = 12,4 C 2 = 3,0 C = 1,6
3
2.2.
( ) ( ) ( )
2.3. So ortogonais 2.4. No so ortogonais 2.5. C1 = m1 + m2 + m3 3m4 C2 = 2m1 m2 m3 C3 = m2 m3 2.6. Um dos possveis grupos de contrastes ortogonais que podem ser formados C1 = m1 + m2 + m3 + m4 4m5 C2 = m1 + m2 + m3 3m4 C3 = m1 + m2 - 2m3 C4 = m1 - m2 2.7. Um dos possveis grupos de contrastes ortogonais que podem ser formados C1 = 3m1 + 4m2 + 4m3 + 3m4 14m5 C2 = 3m1 + 4m2 + 4m3 11m4 C3 = 3m1 + 4m2 - 7m3 C4 = m1 - m2 2.8. C 3 = -8,4 C 2 = -17,1 a) C1 =6,3 b) V ( C ) = 0,18 V ( C )=0,54 V( C ) = 0,9450
1 2
3
127
Cap 11 Respostas dos Exerccios 2.11. ortogonal. C=m1 + m2 3m3 + m4 2.12. ortogonal. C=4m1 + 5m2 14m3 + 5m4 2.13. C2 = m2 m3 2.14. C2 = m1 + 14m2 15m3 2.15. C2 = m2 m3 2.16. C3 = m1 + m2 3m3 + m4. 2.17. C3 = m1 m3. 2.18. C3 = 3m1 m2 + 3m3 5m4 2.19.
2.19.1 C = m1 + m2 - 2m3 , C = 55 ; 2.19.2 C = 3m1 2m2 m3
2.20. 2.20.1. Compara o grupo de herbicida biolgico com o grupo de qumicos. C = 50 2.20.2. No. necessrio aplicar um teste de hipteses para verificar se a estimativa encontrada estatisticamente igual a zero. 2.20.3.105 2.20.4. C1 = 3m1 m2 m3 m4; C2 = m2 m3 grupo qumico nitrognio com enxofre versus grupo qumico nitrognio com fsforo. C 2 = 1 C3 = m2 + m3 2m4 grupo qumico com nitrognio versus grupo qumico com inativadores de enzimas. C 3 = 13 2.21. 2.21.1 a) C1 = m1 m3 b) C2 = m1 m2 c) C3 = m3 m4 2.21.2 a) 19 b) 35,10 c) 0 d) so ortogonais.
Captulo 3
3.1. e 3.2. a 3.3. b 3.4. 128
EST 220 Estatstica Experimental a) Dez raes. Esta foi a fonte de variao introduzida pelo pesquisador. b) Cada animal. Cada animal recebeu um dos tratamentos. c) Nenhum. d) No. Pois o experimento no teve repetio. e) No, pois no foram usados os princpios bsicos da experimentao. 3.5. 3.5.1 As 5 enzimas. A comparao do efeito destas 5 enzimas, foi o que motivou o pesquisador a instalar este ensaio. 3.5.2 Premeditada. O pesquisador sabia a princpio quais enzimas desejava comparar. 3.5.3 Cada amostra genmica. Esta foi a unidade que recebeu um tipo de tratamento. 3.5.4 Sim. Pois cada tratamento (enzima) foi designado a trs unidades experimentais (amostra genmica). Os efeitos de ambiente que no so passveis de controle, fazem com que as observaes de um mesmo tratamento no sejam iguais. 3.5.5 No, pois os tratamentos foram designados de uma forma sistemtica s unidades experimentais. 3.5.6 No, pois no houve nenhum controle na casualizao. O princpio do controle local deve ser utilizado quando no existe uniformidade das condies experimentais. 3.5.7 Sim. Pois o princpio da repetio foi utilizado. A estimativa do erro experimental no vlida pois o princpio da casualizao no foi utilizado. 3.5.8 Tempo gasto, pelo substrato qumico contendo fragementos de DNA, para percorrer uma distncias de 25 cm no gel. 3.6. 3.6.1 Os oito tipo de leo, pois esta foi a fonte de variao introduzida pelo pesquisador com o propsito de comparao de seus efeitos. 3.6.2 Erro experimental (tipo aleatria), pois esta fonte de variao surgiu devido ao efeito de ambiente e no foi controlada pelo pesquisador. 3.6.3 Cada amostra bsica, pois cada amostra bsica recebeu um dos oito tipos de leo. 3.6.4 Sim. Foram utilizados oito repeties. 3.6.5 Sim. Pois os tipos de leo (tratamentos) foram distruibudos ao acaso s amostras bsicas (unidades experimentais). 3.6.6 Sim. Houve duas restries na casualizao de tal forma que cada bioqumico avaliou os oito tipos de leo e cada lote recebeu os oito tipos de leo. 3.6.7 O teor de gordura total, pois esta foi a caracterstica avaliada para comparar o efeito dos tipos de leo. 3.7. 3.7.1. Cada tbua de madeira, pois cada uma delas recebeu um dos 5 tratamentos em teste. 3.7.2. As 5 marcas de verniz, pois o pesquisador tinha por objetivo comparar os efeitos das 5 marcas de verniz com relao ao brilho proporcionado pelas marcas. 3.7.3.
129
Cap 11 Respostas dos Exerccios Repetio: cada marca de verniz foi aplicada a 5 tbuas (unidade experimentais); Casualizao: a distribuio das marcas de verniz s tbuas foi feita ao acaso; Controle local: a casualizao sofreu a restrio de que cada tipo de madeira fosse testada com todas as marcas de verniz. 3.7.4. Sim, pois foram usadas repeties. A estimativa vlida pois foi usado o princpio da casualizao. 3.7.5. Variaes no controladas de ambiente. No, pois geralmente no se conhece a origem destas variaes no controladas. 3.7.6. Sim, pois sabia-se que a diferena de cor entre os diversos tipos de madeira poderia afetar a avaliao do verniz. 3.8. 3.8.1. Os seis sabores de sorvete. Esta foi a fonte de variao introduzida pelo pesquisador no experimento. 3.8.2. Sim, pois cada sabor apareceu seis vezes no experimento. 3.8.3. Sim, pois houve controle na casualizao. Dois controles foram utilizados na casualizao.
Captulo 4
Rejeita-se Ho 4.1. Fcal = 7,79 Ftab5% (3,16) = 3,24 4.2. a) Casualizao e repetio b) Cada atleta No Rejeita Ho c) Fcal = 1,39 Ftab1% (2,12) = 6,93 d) Qualquer tcnica 4.3. a) Sim. Fcal = 685,06. Ftab5% (3,36) = 2,87 CV% = 3,94 Rejeita H0 b) Y= m1 + m2 - m3 - m4 Y = 1,22 c) Y= m1 m2 Y = 8,25 Y = -0,03 d) Y= m3 m4
4.4. Fcal = 6,73 Ftab5% (2,21) = 3,47 Rejeita H0 As mdias relativas aos 3 grupos diferem entre si. 4.5. No Rejeita-se Ho Fcal = 1,42 Ftab5% (2,12) = 3,89 4.6. Fcal = 1,40 4.7. 4.7.1. Fcal = 6,94 Ftab5%(4,15) = 3,06 Rejeita-se Ho. Ftab1%(2,12) = 6,93 No Rejeita-se Ho
130
EST 220 Estatstica Experimental 4.7.2. Existe efeito significativo das raes com relao ao ganho de peso mdio proporcionado pelas mesmas. 4.7.3. C = mB + mc - mD - mE C = 8,5 4.7.4. CV = 20,68%. Valor alto indicando baixa preciso experimental.
Captulo 5
5.1. A numerao se refere aos exerccios do captulo 4 4.1. Tukey Duncan = 4,79 D4 = 3,82 D3 = 3,71 D2 = 3,54 m d = 31 a a m b = 27 ab b m c = 26 b bc m a = 23 b c 4.2. F no-significativo. No necessrio aplicar teste de mdias. 4.3. Tukey = 0,49 m1 = 14,81 a m 4 = 10,09 b m 3 = 10,06 b m 2 = 6,56 c 4.4. Tukey = 9,23 m1 = 102,37 a m 3 = 95,12 a b m 2 = 89,00 b Duncan D3 = 7,99 a ab b D2 = 7,61 Duncan D4 = 0,40 D3 = 0,39 a b b c D2 = 0,37
4.5. F no-significativo. No necessrio aplicar teste de mdias. 4.6. F no-significativo. No necessrio aplicar teste de mdias.
131
Cap 11 Respostas dos Exerccios 4.7. Tukey = 3,68 md me ma mb mc 5.2. m3 m1 m6 m2 m5 m4 5.3. Fcal = 2,64 Ftab5% (5,18) = 2,77 No existe diferena significativa entre os tratamentos. Portanto, o teste de Duncan no necessrio. 5.4. Rejeita-se Ho. De acordo com o Fcal = 15,23 Ftab1% (3,12) = 5,95 teste de Tukey ( = 2,11), os tipos de aleitamentos 1 e 2 proporcionaram as maiores mdias de ganho de peso ( m 1 = 9,30 e m 2 = 11,20 ). 5.5. a. Fcal = 24,24 Ftab5% (4,15) = 3,06 Rejeita-se Ho. b. De acordo com o teste de Duncan (D5 = 1,58, D4 = 1,55, D3 = 1,51, D2 = 1,44), a marca E foi a mais lenta ( m E = 13,75 ). c. De acordo com o teste de Tukey ( = 2,10), as marcas E e A foram as mais lentas ( m E = 13,75 e m A = 11,75 ). d. C1 = 4mA mB mC mD mE C1 = +4,0 tc=1,86 t5%(15)=2,13 NRH0; S=7,48 NRH0 C2 = mB + mC mD mE C = -7,0 tc=-7,63 t5%(15)=2,13 RH0; S=3,34 RH0
2
Tukey = 33 a ab ab bc c c
Duncan D6 = 31 a a a b b b
D5 = 30,2
D4 = 28,7 D3 = 26
C3 = mB mC C4 = mD mE
132
5.7.
m1 m3
m5 m2 m4 m6
Tukey Duncan =15,96 D6=11,77 D5=11,60 D4=11,38 D3=11,07 D2=10,53 = 203,36 a a = 196,58 a b ab = 188,86 a b bc = 182,38 b c = 165,38 c d = 153,20 c e
Captulo 6
6.1. Fcal = 33,58 Ftab5% (4,8) = 3,84 Tukey = 13,54 a b b c c Duncan D5= 9,75 a b b c c D4 = 9,6 D3 = 9,39 D2 = 9
m5 m4 m3 m2 m1 6.2
= 107 = 92 = 87 = 72 = 67
a) DBC, pois a diviso foi realizada de modo que houvesse homogeneidade entre as unidades experimentais dentro de cada grupo, ficando a heterogeneidade existente entre os grupos passvel de ser quantificada e, assim, isolando os reais efeitos de tratamentos. Rho b) Sim. Fcal = 178 Ftab1% (3;18) = 5,09 c) Tukey = 3,83 3 = 46 m a m1 = 31,6 b m 2 = 31,4 b m 4 = 21,6 c 6.3. a) Fcal = 5,87 b) Tukey = 13,12 Ftab5% (4,12) = 3,26 c) Duncan D5= 9,77 D4 = 9,68 D3 = 9,39 D2 = 8,96
133
Cap 11 Respostas dos Exerccios m5 m1 m4 m3 m2 d) = 155,12 a = 142,8 a b = 140,01 b = 138,74 b = 138,02 b Y = -29,42 a b b b b R H0 S = 25,73
e) No se aplica o teste t, pois os contrastes no so ortogonais. 6.4. a) Fcal = 7,67 b) Tukey = 4,99 m 5 = 11,4 a m 2 = 6,3 b m 4 = 6,0 b m 3 = 5,5 b m1 = 3,0 b R.: Levedura tipo 5 Duncan D5 = 3,72 D4= 3,68 D3= 3,57 D2= 3,41 m 5 = 11,4 a m 2 = 6,3 b m 4 = 6,0 b m 3 = 5,5 b m1 = 3,0 b R.: Leveduras tipo 1,2,3e 4. 6.5. a) Repetio: cada tipo de pneu foi submetido a trs repeties. Casualizao; os tipos de pneus foram submetidos a sorteios dentro das respectivas sub-reas. Controle Local: a rea total foi submetido a vrias subdivises, visando proporcionar maior preciso ao experimento. b) DBC: as sub-reas formadas atuam como blocos no experimento. c) Fcal = 20,9 Ftab5% (3,6) = 4,76 d) Duncan D4 = 1,75 D3= 1,72 D2 = 1,67 m 4 = 33 a m 3 = 31,3 b m 2 = 29,3 c m1 = 28 c 6.6. 134 Ftab5% (4,12) = 3,26 R.: Sim.
EST 220 Estatstica Experimental a) V(c) = 0 b) C1 No contraste, logo no aplica teste de mdia S = 30,4 N RH0 C2 = -30 c) No se aplica o teste t, pois os contrastes no so ortogonais. d) C= m1 + m2 2m3 6.7. a) 5 vezes, pois o nmero de graus de liberdade para blocos igual a 4. b) Testa-se se h diferena significativa entre a durabilidade dos 4 microaspersores. Sendo F tabelado a 5% igual a 3,49 e enunciando as hipteses: Ho: m1 = m2 = m3 = m4 vs Ha: No Ho, verifica-se que o Fcal significativo, portanto existe pelo menos um contraste entre as mdias de durabilidade dos microaspersores estatisticamente diferente de zero. c) Deveramos aplicar um teste de mdias; Tukey ou Duncan, por exemplo. d) Ex.: Scheff C = 36 + 40 + 60 3x40 = 16 S = 35,45 NRH0 6.8. a) Fcal = 37,7 Ftab5% (4,12) = 3,26 b) Duncan D5= 3,77 D4 = 3,74 D3 = 3,62 D2 = 3,45 m C = 25 a m B = 24,75 a m E = 16,25 b m D = 12 c m A = 10,2 c c) tcal = 3,99 6.9. Fcal = 4,20 6.10. 6.10.1. Delineamento em Blocos Casualizados. Porque o melhorista ao instalar o experimento subdividiu a rea total (heterognea) em sub-reas (homogneas) entre si. Pode-se dizer tambm que o pesquisador utillizou os trs princpios bsicos da experimentao (repetio, casualizao e controle local). Rejeita-se Ho, 6.10.2. Fcal = 2,02 Ftab5% (4,12) = 3,26 No consequentemente, no necessrio proceder ao teste de Duncan. 6.11. 6.11.1. (c) 6.11.2. (h) 6.11.3. (c) 6.11.4. (c) 6.11.5. (d) 6.12. 135 Ftab1% (4,12) = 5,41 No Rejeita-se Ho ttab5% (12) = 2,18 RHo
Cap 11 Respostas dos Exerccios 6.12.1. Fcal = 177,99 Ftab1%(3,18) = 5,09 Rejeita-se Ho. 6.12.2. = 3,84 O tratamento 4 apresentou a menor mdia (21,57) portanto o desejado.
6.13. 6.13.1. (c). Porque o teste de Scheff pode ser aplicado a qualquer contraste sem nenhuma restrio e o teste t a contrastes estabelecidos a priori e ortogonais. Porm, os mesmos apresentam sensibilidades diferentes em detectar diferenas significativas. 6.13.2. (c). Porque o teste t pode ser aplicado para avaliar contrastes estabelecidos a priori e ortogonais e o teste de Tukey a todos os possveis contrastes que envolvem duas mdias. Porm os mesmos apresentam sensibilidades diferentes em detectar diferenas significativas. 6.13.3. Sim. S = 3,9. Y = 1,4 . No se rejeita Ho. 6.14. 6.14.1. Y = mi mj para i j = 1, 2, 3 e 4. Nmero mximo de contrastes = 6. 6.14.2. No, pois a diferena entre m 1 e m 2 igual a 21 a qual superior ao valor do . 6.14.3. O que obteve 1 = 5, pois o funo do QMResduo, o qual um indicativo da preciso experimental. 6.14.4. m1 = 100 a m 4 = 92 a b
m 3 = 88 a b m 2 = 79 b 6.14.5. O teste recomendado o teste de Scheff, pois existem contrastes envolvendo duas ou mais mdias e os contrastes no formarem um grupo de contrastes ortogonais.
Captulo 7
7.1. a) Fcal = 12,09 Ftab5% (4,12) = 3,26 b) Tukey = 107,54 m C = 604,8 a m A = 492,6 b m B = 440,8 b m D = 413,4 b m E = 401 b A Variedade Co 297 deve ser recomendada. 7.2.
136
EST 220 Estatstica Experimental a) Fcal = 8,198 Ftab5% (4,12) = 3,26 b.1) Duncan D5= 8,55 D4 = 8,47 D3 = 8,22 D2 = 7,84 m 2 = 60 a m 5 = 52,5 ab m1 = 50 b m 3 = 47,5 bc m 4 = 40 c Concluso: os tratamentos 2 e 5 devem ser recomendados b.2) Concluso: os tatamentos 3 e 4 devem ser recomendados 7.3. Fcal = 17,84 Tukey = 107,54 m1 = 604,8 m 2 = 509,8 m 3 = 469,8 m 4 = 394 m 5 = 346,8 7.4. a) Fcal = 9,01 Ftab5% (4,12) = 3,26 b) C = 4md ma mb mc me c) Scheff S = 54,05 Y = 33,66 Teste t tcal = 2,249 ttab5% (12) = 2,18 7.5. Fcal = 31,73 Ftab1% (6,30) =3,47 Rejeita-se Ho. Existe efeito significativo de forrageiras com relao a produo de matira seca. 7.6. 7.6.1. cada litro de leite 7.6.2. os tipos de bacilos 7.6.3. 2 vezes 7.6.4. Delineamento em Quadrado Latino 7.6.5. (a) 7.6.6. (g) Ftab5% (4,12) = 3,26 a ab bc cd d
Captulo 8
8.1. Ftab = 5,32 FcalcAxB = 21,81 RHo RHo NRHo
8.2. Ftab5% (1,16) = 4,49 FcalcAxB = 4,95 8.3. a) Sim Ftab(1;20) = 8,10 b) FcalcA = 86,05 RHo
FcalcAxB = 0,51
137
8.4. a) No. VxF: Ftab = 3,49 Fcalc = 27,23 RHo Ftab (2;20) = 3,49 b) F/V1: Fcalc = 17,07 Teste Tukey = 2,29 mF2/V1 = 8 a mF1/V1 = 4 b mF3/V1 = 3 b
c) V2/F3: m = 8
8.5. a) Sim. VxE: Fcalc = 0,75 Ftab = 4,49 b) Ambas fornecem a mesma produo. V: Fcalc = 1,70 Ftab = 4,49 E: Fcalc = 6,79 Ftab = 4,49 c) O espaamento 2 ( m 2 = 7,7). 8.6. a) No FcalcRaoxRaa = 7,17 FtabRaoxRaa = 3,68 b) F Rao/Raa1 = 3,13 F Rao/Raa2 = 6,13 F Rao/Raa3 = 10,13 Ftab(1;15) = 4,54 8.7. Questo terica 8.8 a) 5 valores - Cada valor corresponde a um total de tratamento, repetidos 5 vezes. b) 3, 7, 4, 28, 39 c) Meio de Cultura e tipo de Fungo, respectivamente. d) No. Fcalc = 4,92 Ftab = 4,57 e) Qualquer um Fcalc = 0,16 Ftab = 7,64
8.9. a) Estudar os fatores isoladamente. b) Efetuar o desdobramento dos fatores 8.10. FA*B = 3,62* FA/B1 = 30,06 FA/B2 = 36,82* FA/B3 = 51,75* 138
EST 220 Estatstica Experimental FB/A1 = 18,72* FB/A2 = 72,64* B/A1 = 2,98 A/B1 = 3,29 FB/A3 = 32,778 FB/A4 = 42,56
8.11.
FA = 0,81ns FB = 4,81* FA*B = 0,64ns Teste Duncan para fator B D3 = 262,26 D2 = 249,77 8.12. Questo terica -> ver teoria 8.13. FA = 7,45ns 8.14. a) FA/B4 = 11,62* b) FB/A1 = 0,04ns 8.15.
a) C = -15,71ns b) Fcal = 6,09*
FB = 5,16ns
FA*B = 5,01ns
FB/A2 = 5,10*
= 11,29
8.16. Tukey = 3,55 Mdias dos niveis de A m A1 = 19,8 a m A 2 = 18,4 ab m A 3 = 16,2 b m A 4 = 15,4 b 8.17. a) FA*B = 9,33* b) FA/B1 = 0,095ns FA/B2 = 24,8* FA/B3 = 0,097ns 8.18. Interao: Ftab5%(2,24) = 3,40. No Rejeita-se Ho a 5% de probabilidade. Rao: Fcal = 4,34 Ftab5%(2,24) = 3,40. Rejeita-se Ho a 5% de probabilidade. D3 = 13,93. D2 = 13,25. A rao A deve ser recomendada. Protena: Fcal = 5,11 Ftab5%(1,24) = 4,26. Rejeita-se Ho a 5% de probabilidade. O nvel alto de protena dever ser recomendado.
139
8.19.2.
FV GL SQ QM F H 2 1323,47 661,73 52,24 Resduo 24 304,00 12,67 Ftab; 5% (2; 24) = 3,40
H0: mH1 = mH2 = mH3 Ha: No H0 Concluso: 52,24 > 3,40 RH0 a 5% de probabilidade. Logo existe pelo menos um contraste estatisticamente diferente de zero entre mdias de horrio de colheita com relao a perda de gros. Teste de Tukey e Duncan Hipteses H0: mHi mHu = 0 Ha: mHi mHu 0 DMS
QMRe s 12,67 = = 1,13 IK 25
para i u = 1, 2, 3.
Tukey: = qtab
Duncan: Di = zi
QMRe s 25
i=3 i=2
Totais de Tratamentos
140
T1 T2 Totais
Mdias
mH3
mH2 mH1
Duncan a b c
8.19.3.
C = 2mH1 mH2 mH3 = 265,2 53,4 49,6 = 27,40
( )
V C
( )
S=
H0: mT1 = mT2 Ha: No H0 Concluso: 189,01 > 3,40 RH0 a 5% de probabilidade. Logo existe pelo menos um contraste estatisticamente diferente de zero entre mdias de tipo de colheitadeira com relao a perda de gros. Teste de Tukey e Duncan
141
para j u = 1, 2
Tukey: = qtab
Duncan: Di = zi
QMRe s 35
i=2
z2 = 2,92 D2 = 2,68
Totais de Tratamentos
T1 T2 Totais H1 208(5) 288 496(10) H2 217 317 534 H3 282 370 652 Totais 707(15) 975 1682(30)
Mdias
mT2 mT1
Duncan a b
8.19.5.
Observao: A aplicao de tais testes desnecessria, pois o teste F (1 GL para T) j conclusivo. Apresentamos apenas para mostrar as diferenas entre aplicar para um fator com trs nveis (H) e um fator com dois nveis (T)
C = mT1 mT2 = 47,13 65,00 = - 17,87
H0: C = 0 Ha: C 0
142
( )
V C
( )
S=
Concluso: |-17,87| > 2,67 RH0 a 5% de probabilidade 8.20. 8.20.1. Interao: Fcal = 49,97 Ftab5%(1,16) = 4,49. Rejeita-se Ho. Os fatores no atuam independentemente. 8.20.2. B/A1: Fcal = 21,62 Ftab5%(1,16) = 4,49. Rejeita-se Ho. Quando se usa o controle de qualidade A1 processo de fabricao B1 o mais rpido. 8.21. 8.21.1. Interao: Fcal = 0,037 Ftab1%(2,30) = 5,39. No rejeita-se Ho. Os fatores atuam independentemente. 8.21.2. Fator A: Fcal = 4,39. Ftab1%(1,30) = 7,56. No rejeita-se Ho. Os dois mtodos de acelerao proporcionam em mdia igual consumo. 8.22. 8.22.1. Interao: Fcal = 267,58. Ftab5%(3,14) = 3.34. Rejeita-se Ho. Os fatores A e B no atuam independentemente. 8.22.2. B/A2: Fcal = 295,73. Ftab5%(1,14) = 4,60. Rejeita-se Ho. Logo a mdia de B1/A2 estatsticamente maior do que a de B2/A2. 8.22.3. = 8,51 m A 3 / B 2 = 135,00 a m A 4 / B 2 = 99,67 b
m A1 / B 2 = 28,33 m A 2 / B 2 = 19,33 c d
8.23.OSERVAO: VALORES APROXIMADOS 8.23.1. 16,72 8.23.2. 42,54 8.23.3. 16,39 8.24. 8.24.1. Interao: Fcal = 25,10. Ftab1%(2,18) = 6,01. Rejeita-se Ho. Os fatores A e B no atuam independentemente. 8.24.2. A/B1: Fcal = 34,03. Ftab1%(2,18) = 6,01. Rejeita-se Ho. Existe pelo menos um contraste, estatisticamente diferente de zero, entre mdias do fator A dentro do nvel 1 de B. 143
Cap 11 Respostas dos Exerccios 8.24.3. B/A2: Fcal = 62,02. Ftab1%(1,18) = 8,29. Rejeita-se Ho. O nvel B1 apresenta maior mdia quando o nvel 2 de A considerado. 8.25.
FV Recipientes (R) Espcie (E) Interao RxE (Tratamentos) Resduo Total
**
GL 2 1 2 (5) 18 23
QM 31,88 1,28
F 24,91* * -
R/E
FV R/E1 R/E2 Resduo GL 2 2 18 SQ 87,12 69,50 QM 43,56 34,75 1,28 F 34,03* * 27,15* * Ftab; 1% (2; 18) = 6,01 (2; 18) = 6,01
**
R/E1
= 2,66
m R 2 / E1 =
m R1/ E1 = m R3 / E1 = 103,5 4
= = =
a a b
R/E2
= 2,66
mR1/ E2 = m R3 / E2 = mR2 / E2 =
101,3 4
= = =
a b b
E/R
FV E/R1 E/R2 E/R3 Resduo GL 1 1 1 18 SQ 0,21 79,38 3,25 QM 0,21 79,38 3,25 1,28 F 0,16 62,02 * * 2,54 Ftab; 1% (1;18) = 8,29 (1;18) = 8,29
**
144
Captulo 9
9.1. Interao AxB significativa: Fcal AxB= 3,21 Ftab5% (9,36) = 2,16 QMRes combinado = 32,41 N* = 27 Estudo A/B A/B1 SQ= 1404 QM= 468,06 Fcal= 14,14 Ftab5% (3,27) = 2,96 A/B2 SQ= 413 QM= 137,66 Fcal= 4,25 A/B3 SQ= 325 QM= 108,26 Fcal= 3,34 A/B4 SQ= 1293 QM= 430,86 Fcal= 13,2 Resduo GL= 27 QM= 32,41 Teste de Tukey A/B = 11 Para A/B1 m A4/B1 = 61,9 a m A3/B1 = 53,9 a b m A2/B1 = 50,9 b m A1/B1 = 36,1 c Para A/ B2 a ab b b Estudo: B/A B/A1 SQ= 583,49 B/A2 SQ= 45,21 B/A3 SQ= 56,96 B/A4 SQ= 71,34 Teste Tukey m B2/A1 = a m B3/A2 = ab m B4/A3 = b m B1/A4 = b
= 6,06
Para A/B3
a ab ab b
Para A/B4 a a a b
9.2. Interao AxB no significativa Fcal AxB= 0,98 Ftab5%(12,30) = 2,09 Fcal A = 4,71 Ftab5%(4,10) = 3,48 Fcal B = 3,99 Ftab5%(3,30) = 2,92 Teste Duncan Fator A (D5= 1,24 D4 = 1,22 D3 = 1,19 D2 = 1,14) Mdias m A 5 = 17,61 a m A1 = 17,56 a m A 3 = 16,33 b m A 4 = 16,19 b 145
Teste Duncan Fator B (D4= 1,056 D3= 1,029 D2= 0,978) Mdias m B1 = 17,43 a m B 4 = 16,88 a m B3 = 16,77 a b m B 2 = 15,83 b 9.3. F para interao no significativo Fcal AxB = 2,08 Fcal A = 1,17 Fcal B = 3,57 Fator B Teste tukey Mdias m sulco = 3502,5 a m lano = 3332,7 ab m cova = 3107,4 b 9.4. 9.4.1. Interao: Fcal=0,97. Ftab5%(12,30) = 2,09. No rejeita-se Ho. Os fatores atuam independentemente. 9.4.2. Fator B: Fcal = 4,00. Ftab5%(3,30) = 2,92. Rejeita-se Ho. Existe pelo menos um contraste entre mdias de niveis do fator B estatisiticamente diferente de zero. 9.4.3. D4 = 1,05 D3 = 1,02 D2 = 0,97 m B1 = 17,46 a
m B 4 = 16,88 m B3 = 16,77 m B 2 = 15,82 a ab b
9.5. OBSERVAO: VALORES APROXIMADOS 9.5.1. 0,97 9.5.2. 206,57 9.5.3. nvel 5 9.5.4. 3,99 9.5.5. niveis 1, 3 e 4 9.6. 9.6.1. Interao: Fcal = 0,97. Ftab5%(12,30) = 2,09. No rejeita-se Ho. Os fatores A e B atuam independentemente. 9.6.2. Fator B: Fcal =3,99. Ftab5%(3,30) = 2,92. Rejeita-se Ho. Existe pelo menos um contraste entre mdias de niveis de B estatisticamente diferente de zero. 146
9.7. 9.7.1. Interao: Fcal = 2,74. Ftab5%(2,12) = 3,89. No rejeita-se Ho. Os fatores A e B atuam independentemente. 9.7.2. Como a interao foi no significativa, o autor procedeu da forma correta, pois ele comparou os niveis de um fator independente do outro fator. 9.8. Interao: Fcal = 10,03. Ftab5%(2,9) = 4,26. Rejeita-se Ho. Os fatores no atuam independentemente. Estudo: A/B QMResduo Combinado: 29,83. GL = 7. A/B1: Fcal = 21,58. Ftab5%(2,7) = 4,74. Rejeita-se Ho. Existe pelo menos um constraste estatisticamente diferente de zero, entre mdias de niveis de A dentro do nvel B1. A/B2: Fcal = 10,58. Ftab5%(2,6) = 5,14. Rejeita-se Ho. Existe pelo menos um constraste estatisticamente diferente de zero, entre mdias de niveis de A dentro do nvel B2. Mdias - A/B1 m A2/B1 = 81.25 a m A3/B1 = 72.50 a m A1/B1 = 56.25 b - A/B2 m A3/B2 = 57.50 m A2/B2 = 56.75 m A1/B2 = 41.75 B/A B/A1: Fcal = 66,39. Ftab5%(1,9) = 5,12. Rejeita-se Ho. Existe pelo menos um constraste estatisticamente diferente de zero, entre mdias de niveis de B dentro do nvel A1. B/A2: Fcal = 189,55. Ftab5%(1,9) = 5,12. Rejeita-se Ho. Existe pelo menos um constraste estatisticamente diferente de zero, entre mdias de niveis de B dentro do nvel A2. B/A3: Fcal = 71,05. Ftab5%(1,9) = 5,12. Rejeita-se Ho. Existe pelo menos um constraste estatisticamente diferente de zero, entre mdias de niveis de B dentro do nvel A2. 9.9. a a b
147
Cap 11 Respostas dos Exerccios Interao: Fcal = 0,42. Ftab5%(2,12) = 3,89. No rejeita-se Ho. Os fatores atuam independentemente. Fator A: Fcal = 22,05. Ftab5%(1,6) = 5,99. Rejeita-se Ho. Existe pelo menos um contraste estatisticamente diferente de zero entre mdias de niveis do fator A. Fator B: Fcal = 5,83. Ftab5%(2,12) = 3,39. Rejeita-se Ho. Existe pelo menos um contraste estatisticamente diferente de zero entre mdias de niveis do fator B. Teste de Duncan Fator A: no necessrio. Teste F j conclusivo. Fator B D3 = 1.87 e D2 = 1.78 Mdias m B3 = 6,29 a m B1 = 3,96 b m B2 = 3,79 b
Captulo 10
10.1.
0 = 997,4 1 = 0,56 x i Fcal= 84,3. A varivel independente influencia
10.2.
0 = 92,7 1 = 0,08x i Fcal= 3,55 A varivel independente no influencia significativamente a varivel dependente.
10.3.
0 = 1 52 1 = 4,1282 F significativo. A varivel independente influencia significativamente a varivel dependente.
10.4.
0 = 11,24 1 = 10,4677 x i 2 = -1,1135 F cal=231,4. A varivel independente influencia significativamente a varivel dependente.
10.5.
0 = 0,7 1 = 0,012 x i F cal= 67,52. A varivel independente influencia significativamente a varivel dependente.
10.6. F cal=12,24. A varivel independente influencia significativamente a varivel dependente. 10.7. 148
EST 220 Estatstica Experimental a) 144,4 b)No. F cal interao foi significativo. c) Espcie 1 i GL=1 F conclusivo. d)Fazer uma anlise por meio de regresso. Escolhendo o modelo mais adequado. 10.8. Modelo 3 F falta ajustamento n.s F regresso significativo F cal= 5,06 R=78,2% 10.9. a) 3,92 kg b) 23,25C 10.10. a)F cal= 225* b) Sim. F significativo da regresso. 10.11.
0 = 120 , 44 Fcal = 44 , 49
10.12.
Yi = 16,1 0,16 x i 0.9 x i2 Fcal = 97,63
10.13. 10.14.
F =1,097 n.s
Ftab = 9,07
10.14.1. Falta de Ajustamento: Fcalc = 0,4. Ftab5%(3,10) = 3,71. No rejeita-se Ho. O modelo linear de 1o grau apropriado para descrever o tempo de sono em funo da dosagem de sonfero. 10.14.2. Regresso: Fcalc = 12. Ftab5%(1,10) = 4,96. Rejeita-se Ho. O coeficiente 1 estatisticamente diferente de zero. 10.14.3. No recomendvel fazer tal estimativa, pois a dose de 17 mg no est dentro do intervalo de dosagem testada. 10.15. OBSERVAO: VALORES APROXIMADOS 10.15.1. 23,76 10.15.2. 1,88 e -0,027 10.15.3. 34,81 10.15.4. 63,13 10.16. 10.16.1. 15,52 10.16.2. 1,74
149
Cap 11 Respostas dos Exerccios 10.17. 10.17.1. Fcalc = 43,68. Ftab5%(2,7) = 4,74. Rejeita-se Ho. A droga resulta em uma perda de peso significativa. 10.17.2. 13,91 10.17.3. Como 35 mg est fora do intervalo testado, ento a equao de regresso ajustada no pode ser usada para estimar a perda de peso para esta dosagem. 10.18. 10.18.1. Falta de Ajustamento: Fcal = 1,93. Ftab5%(8,20) = 2,45. No rejeita-se Ho. Logo o modelo ajustado adequado para descrever o fenmeno. 10.18.2. Regresso: Fcalc = 609,47. Ftab5%(1,20) = 4,35. Rejeita-se Ho. A dosagem do suco de laranja tem efeito significativo na acidez da bebida lctea. 10.18.3. 0,08. 10.19. 10.19.1. Fcal = 122,69. Ftab5%(2,7) = 4,74. Rejeita-se Ho. O fermento tem influncia significativa no peso final dos pes. 10.19.2. 7,07 10.20. 10.20.1. Fcal = 340,31. Ftab5%(1,5) = 6,61. Rejeita-se Ho. A droga tem influncia sobre o nvel de acar. 10.20.2. No possvel obter tal estimativa, pois a dose de 90 mg est fora do intervalo testado.
150
Observaes: As tabelas que aqui constam, foram adaptadas do livro: Curso de Estatstica Experimental (12 ed) de Frederico Pimentel Gomes, 1987. Este material ser usado em provas e portanto no dever conter informaes adicionais
Nome:_________________________________________________ Matrcula:______
151
Formulrio
mi =
x
i =1
SQ s = GL
2
k Xi 2 k X i i=1 SQ = k i=1 ri ri
i=1
s= s
s(m) =
s n
2 c
n1 + n 2 2
> s2 F= < s2
2
m m0 t= s n
1 VC 2
(m m2 ) (m m ) t= 1
1 2
1 2 1 sc + n n 2 1
t=
mD mD
2 sD n
mD =
d
i=1
n di n i=1 2 di n 2 s D = i=1 n 1
=q
()
Di = zi
Di = z i
1 VC 2
()
S=
( )
=q
QMRe sduo K
QMRe sduo K
(I 1)Ftab V (C)
t=
VC
()
k Xi 2 k X i =1 SQ = i k i =1 ri ri
i =1
CV(%) = 100
QM Re sduo m
mi =
Ti ri
m=
G N
n* =
[QM Re s(a ) + (J 1)QM Re s(b)]2 [QM Re s(a )]2 + [(J 1)QM Re s(b)]2 g.l. Re s(a ) g.l. Re s(b )
QM Re sComb =
152
n n Yi = n 0 + 1 X i i =1 i =1 n n n YX = i i 0 X i + 1 X i2 i =1 i =1 i =1
n n n Yi = n 0 + 1 X i + 2 X i2 i =1 i =1 i =1 n n n n Yi X i = 0 X i + 1 X i2 + 2 X i3 i =1 i =1 i =1 i =1 n n n n Yi X i2 = 0 X i2 + 1 X i3 + 2 X i4 i =1 i =1 i =1 i =1
n Yi n i =1 SQTotal = Yi2 n i =1
R2 =
SQ Re gresso SQTotal
R2 =
n Yi n n i =1 SQ Re gresso = 0 Yi + 1 Yi X i n i =1 i =1
n Yi n n n 2 SQ Re gresso = 0 Yi + 1 Yi X i + 2 Yi X i i=1 n i =1 i =1 i =1
153
154
6366 99,50 26,13 13,46 9,02 6,88 5,65 4,86 4,31 3,91 3,60 3,36 3,17 3,00 2,87 2,75 2,65 2,57 2,49 2,42 2,36 2,31 2,26 2,21 2,17 2,13 2,10 2,06 2,03 2,01 1,80 1,60 1,38 1,00
155
254,3 19,50 8,53 5,63 4,36 3,67 3,23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1,88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1,51 1,39 1,25 1,00
156
Tabela 4 - Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nvel de 1% de probabilidade I n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 2 90,03 14,04 8,26 6,51 5,70 5,24 4,95 4,75 4,60 4,48 4,39 4,32 4,26 4,21 4,17 4,13 4,10 4,07 4,05 4,02 3,96 3,89 3,82 3,76 3,70 3,64 3 135,0 19,02 10,62 8,12 6,98 6,33 5,92 5,64 5,43 5,27 5,15 5,05 4,96 4,90 4,84 4,79 4,74 4,70 4,67 4,64 4,55 4,46 4,37 4,28 4,20 4,12 4 164,3 22,29 12,17 9,17 7,80 7,03 6,54 6,20 5,96 5,77 5,62 5,50 5,40 5,32 5,25 5,19 5,14 5,09 5,05 5,02 4,91 4,80 4,70 4,60 4,50 4,40 5 185,6 24,72 13,33 9,96 8,42 7,56 7,00 6,62 6,35 6,14 5,97 5,84 5,73 5,63 5,56 5,49 5,43 5,38 5,33 5,29 5,17 5,05 4,93 4,82 4,71 4,60 6 202,2 26,63 14,24 10,58 8,91 7,97 7,37 6,96 6,66 6,43 6,25 6,10 5,98 5,88 5,80 5,72 5,66 5,60 5,55 5,51 5,37 5,24 5,11 4,99 4,87 4,76 7 215,8 28,20 15,00 11,10 9,32 8,32 7,68 7,24 6,92 6,67 6,48 6,32 6,19 6,08 5,99 5,92 5,85 5,79 5,74 5,69 5,54 5,40 5,26 5,13 5,00 4,88 8 227,2 29,53 15,64 11,55 9,70 8,61 7,94 7,47 7,13 6,88 6,67 6,51 6,37 6,26 6,16 6,08 6,01 5,94 5,89 5,84 5,68 5,54 5,39 5,25 5,12 4,99 9 237,0 30,68 16,20 11,93 9,97 8,87 8,17 7,68 7,32 7,06 6,84 6,67 6,53 6,41 6,31 6,22 6,15 6,08 6,02 5,97 5,81 5,65 5,50 5,36 5,21 5,08 10 245,6 31,69 16,69 12,27 10,24 9,10 8,37 7,86 7,50 7,21 6,99 6,81 6,67 6,54 6,44 6,35 6,27 6,20 6,14 6,09 5,92 5,76 5,60 5,45 5,30 5,16 11 253,2 32,59 17,13 12,57 10,48 9,30 8,55 8,03 7,65 7,36 7,13 6,94 6,79 6,66 6,56 6,46 6,38 6,31 6,25 6,19 6,02 5,85 5,69 5,53 5,38 5,23 12 260,0 33,40 17,53 12,84 10,70 9,48 8,71 8,18 7,78 7,48 7,25 7,06 6,90 6,77 6,66 6,56 6,48 6,41 6,34 6,28 6,11 5,93 5,76 5,60 5,44 5,29 13 266,2 34,13 17,89 13,09 10,89 9,65 8,86 8,31 7,91 7,60 7,36 7,17 7,01 6,87 6,76 6,66 6,57 6,50 6,43 6,37 6,19 6,01 5,84 5,67 5,50 5,35 14 271,8 34,81 18,22 13,32 11,08 9,81 9,00 8,44 8,02 7,71 7,46 7,26 7,10 6,96 6,84 6,74 6,66 6,58 6,51 6,45 6,26 6,08 5,90 5,73 5,56 5,40 15 277,0 35,43 18,52 13,53 11,24 9,95 9,12 8,55 8,13 7,81 7,56 7,36 7,19 7,05 6,93 6,82 6,73 6,66 6,58 6,52 6,33 6,14 5,96 5,78 5,61 5,45 16 281,8 36,00 18,81 13,73 11,40 10,08 9,24 8,66 8,23 7,91 7,65 7,44 7,27 7,13 7,00 6,90 6,81 6,72 6,65 6,59 6,39 6,20 6,02 5,84 5,66 5,49 17 286,3 36,53 19,07 13,91 11,55 10,21 9,35 8,76 8,32 7,99 7,73 7,52 7,34 7,20 7,07 6,97 6,87 6,79 6,72 6,65 6,45 6,26 6,07 5,89 5,71 5,54 18 290,4 37,03 19,32 14,08 11,68 10,32 9,46 8,85 8,41 8,08 7,81 7,59 7,42 7,27 7,14 7,03 6,94 6,85 6,78 6,71 6,51 6,31 6,12 5,93 5,75 5,57 19 294,3 37,50 19,55 14,24 11,81 10,43 9,55 8,94 8,50 8,15 7,88 7,66 7,48 7,33 7,20 7,09 7,00 6,91 6,84 6,77 6,56 6,36 6,16 5,97 5,79 5,61
157
Tabela 4 - Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nvel de 1% de probabilidade (continuao)
n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 20 298,0 37,95 19,77 14,40 11,93 10,54 9,65 9,03 8,58 8,23 7,95 7,73 7,55 7,40 7,26 7,15 7,05 6,97 6,89 6,82 6,61 6,41 6,21 6,02 5,83 5,64 22 304,7 38,76 20,17 14,68 12,16 10,73 9,82 9,18 8,72 8,36 8,08 7,85 7,66 7,51 7,37 7,26 7,16 7,07 6,99 6,92 6,70 6,49 6,29 6,09 5,90 5,71 24 310,8 39,49 20,53 14,93 12,36 10,91 9,97 9,32 8,85 8,48 8,20 7,96 7,77 7,61 7,47 7,36 7,25 7,16 7,08 7,01 6,79 6,57 6,36 6,16 5,96 5,77 26 316,3 40,15 20,86 15,16 12,54 11,06 10,11 9,45 8,97 8,60 8,30 8,07 7,87 7,70 7,57 7,44 7,34 7,25 7,17 7,09 6,86 6,64 6,43 6,22 6,02 5,82 28 321,3 40,76 21,16 15,37 12,71 11,21 10,24 9,57 9,08 8,70 8,40 8,16 7,96 7,79 7,65 7,53 7,42 7,32 7,24 7,17 6,94 6,71 6,49 6,28 6,07 5,87 30 326,0 41,32 21,44 15,57 12,87 11,34 10,36 9,68 9,18 8,79 8,49 8,25 8,04 7,87 7,73 7,60 7,49 7,40 7,31 7,24 7,00 6,77 6,55 6,33 6,12 5,91 32 330,3 41,84 21,70 15,75 13,02 11,47 10,47 9,78 9,27 8,88 8, 58 8,33 8,12 7,95 7,80 7,67 7,56 7,46 7,38 7,30 7,06 6,83 6,60 6,38 6,16 5,95 34 334,3 42,33 21,95 15,92 13,15 11,58 10,58 9,87 9,36 8,97 8,65 8,40 8,19 8,02 7,87 7,74 7,63 7,53 7,44 7,36 7,12 6,88 6,65 6,42 6,20 5,99 I 36 338,0 42,78 22,17 16,08 13,28 11,69 10,67 9,96 9,44 9,04 8,73 8,47 8,26 8,08 7,93 7,80 7,69 7,59 7,50 7,42 7,17 6,93 6,70 6,47 6,24 6,03 38 341,5 43,21 22,39 16,23 13,40 11,80 10,77 10,05 9,52 9,12 8,80 8,54 8,33 8,15 7,99 7,86 7,74 7,64 7,55 7,47 7,22 6,98 6,74 6,51 6,28 6,06 40 344,8 43,61 22,59 16,37 13,52 11,90 10,85 10,13 9,59 9,19 8,86 8,60 8,39 8,20 8,05 7,92 7,80 7,70 7,60 7,52 7,27 7,02 6,78 6,55 6,32 6,09 50 358,9 45,33 23,45 16,98 14,00 12,31 11,23 10,47 9,91 9,49 9,15 8,88 8,65 8,46 8,30 8,15 8,03 7,92 7,83 7,74 7,48 7,22 6,96 6,71 6,47 6,23 60 370,1 46,70 24,13 17,46 14,39 12,65 11,52 10,75 10,17 9,73 9,38 9,09 8,86 8,66 8,49 8,35 8,22 8,11 8,01 7,92 7,64 7,37 7,10 6,84 6,59 6,34 70 379,4 47,83 24,71 17,86 14,72 12,92 11,77 10,97 10,38 9,93 9,57 9,28 9,04 8,83 8,66 8,51 8,38 8,26 8,16 8,07 7,78 7,50 7,22 6,95 6,69 6,43 80 387,3 48,80 25,19 18,20 14,99 13,16 11,99 11,17 10,57 10,10 9,73 9,43 9,19 8,98 8,80 8,65 8,51 8,39 8,29 8,19 7,90 7,61 7,33 7,05 6,78 6,51 90 394,1 49,64 25,62 18,50 15,23 13,37 12,17 11,34 10,73 10,25 9,88 9,57 9,32 9,11 8,92 8,77 8,63 8,51 8,40 8,30 8,00 7,71 7,42 7,13 6,85 6,58 100 400,1 50,38 25,99 18,77 15,45 13,55 12,34 11,49 10,87 10,39 10,00 9,69 9,44 9,22 9,04 8,87 8,74 8,61 8,50 8,40 8,10 7,80 7,50 7,21 6,92 6,64
158
Tabela 5 - Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nvel de 5% de probabilidade n2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 I 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07 50,59 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83 59,56 6,09 8,33 9,80 10,88 11,74 12,44 13,03 13,54 13,99 14,39 14,75 15,08 15,38 16,65 15,91 16,14 16,37 16,57 16,77 4,50 5,91 6,83 7,50 8,04 8,48 8,85 9,18 9,46 9,72 9,95 10,15 10,35 10,53 10,69 10,84 10,98 11,11 11,24 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,60 7,83 8,03 8,21 8,37 8,53 8,66 8,79 8,91 9,03 9,13 9,23 3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 7,00 7,17 7,32 7,47 7,60 7,72 7,83 7,93 8,03 8,12 8,21 3,46 4,34 4,90 5,31 5,63 5,90 6,12 6,32 6,49 6,65 6,79 6,92 7,03 7,14 7,24 7,34 7,43 7,51 7,59 3,34 4,17 4,68 5,06 5,36 5,61 5,82 6,00 6,16 6,30 6,43 6,55 6,66 6,76 6,85 6,94 7,02 7,10 7,17 3,26 4,04 4,53 4,89 5,17 5,40 5,60 5,77 5,92 6,05 6,18 6,29 6,39 6,48 6,57 6,65 6,73 6,80 6,87 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,87 5,98 6,09 6,19 6,28 6,36 6,44 6,51 6,58 6,64 3,15 3,88 4,33 4,65 4,91 5,12 5,31 5,46 5,60 5,72 5,83 5,94 6,03 6,11 6,19 6,27 6,34 6,41 6,47 3,11 3,82 4,26 4,57 4,82 5,03 5,20 5,35 5,49 5,61 5,71 5,81 5,90 5,98 6,06 6,13 6,20 6,27 6,33 3,08 3,77 4,20 4,51 4,75 4,95 5,12 5,27 5,40 5,51 5,62 5,71 5,80 5,88 5,95 6,02 6,09 6,15 6,21 3,06 3,74 4,15 4,45 4,69 4,89 5,05 5,19 5,32 5,43 5,53 5,63 5,71 5,79 5,86 5,93 6,00 6,06 6,11 3,03 3,70 4,11 4,41 4,64 4,83 4,99 5,13 5,25 5,36 5,46 5,55 5,64 5,71 5,79 5,85 5,92 5,97 6,03 3,01 3,67 4,08 4,37 4,60 4,78 4,94 5,08 5,20 5,31 5,40 5,49 5,57 5,65 5,72 5,79 5,85 5,90 5,96 3,00 3,65 4,05 4,33 4,56 4,74 4,90 5,03 5,15 5,26 5,35 5,44 5,52 5,59 5,66 5,73 5,79 5,84 5,90 2,98 3,63 4,02 4,30 4,52 4,71 4,86 4,99 5,11 5,21 5,31 5,39 5,47 5,54 5,61 5,68 5,73 5,79 5,84 2,97 3,61 4,00 4,28 4,50 4,67 4,82 4,96 5,07 5,17 5,27 5,35 5,43 5,50 5,57 5,63 5,69 5,74 5,79 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 5,14 5,23 5,32 5,39 5,46 5,53 5,59 5,65 5,70 5,75 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,90 5,01 5,11 5,20 5,28 5,36 5,43 5,49 5,55 5,61 5,66 5,71 2,92 3,53 3,90 4,17 4,37 4,54 4,68 4,81 4,92 5,01 5,10 5,18 5,25 5,32 5,38 5,44 5,49 5,55 5,59 2,89 3,49 3,85 4,10 4,30 4,46 4,60 4,72 4,82 4,92 5,00 5,08 5,15 5,21 5,27 5,33 5,38 5,43 5,48 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,64 4,74 4,82 4,90 4,98 5,04 5,11 5,16 5,22 5,27 5,31 5,36 2,83 3,40 3,74 3,98 4,16 4,31 4,44 4,55 4,65 4,73 4,81 4,88 4,94 5,00 5,06 5,11 5,15 5,20 5,24 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 4,56 4,64 4,71 4,78 4,84 4,90 4,95 5,00 5,04 5,09 5,13 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47 4,55 4,62 4,69 4,74 4,80 4,85 4,89 4,93 4,97 5,01
159
Tabela 5 - Valores da amplitude total estudentizada (q), para uso no teste de Tukey, ao nvel de 5% de probabilidade (continuao).
I N2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 22 60,91 17,13 11,47 9,42 8,37 7,73 7,30 7,00 6,76 6,58 6,44 6,32 6,22 6,13 6,06 6,00 5,94 5,89 5,85 5,81 5,68 5,56 5,44 5,32 5,20 5,08 24 62,12 17,45 11,68 9,58 8,51 7,86 7,42 7,11 6,87 6,69 6,54 6,41 6,31 6,22 6,15 6,08 6,03 5,98 5,93 5,89 5,76 5,64 5,51 5,39 5,27 5,14 26 63,22 17,75 11,87 9,74 8,64 7,98 7,53 7,21 6,97 6,78 6,63 6,50 6,40 6,31 6,23 6,17 6,11 6,06 6,01 5,97 5,84 5,71 5,58 5,45 5,33 5,20 28 64,23 18,02 12,05 9,88 8,76 8,09 7,63 7,31 7,06 6,87 6,71 6,59 6,48 6,39 6,31 6,24 6,18 6,13 6,08 6,04 5,91 5,77 5,64 5,51 5,38 5,25 30 65,15 18,27 12,21 10,00 8,88 8,19 7,73 7,40 7,15 6,95 6,79 6,66 6,55 6,46 6,38 6,31 6,25 6,20 6,15 6,10 5,97 5,83 5,70 5,57 5,43 5,30 32 66,01 18,50 12,36 10,12 8,98 8,28 7,81 7,48 7,22 7,02 6,86 6,73 6,62 6,53 6,45 6,37 6,31 6,26 6,21 6,17 6,03 5,89 5,75 5,62 5,48 5,35 34 66,81 18,72 12,50 10,23 9,08 8,37 7,90 7,55 7,30 7,09 6,93 6,80 6,68 6,59 6,51 6,43 6,37 6,32 6,27 6,22 6,09 5,94 5,80 5,66 5,53 5,39 36 67,56 18,92 12,63 10,34 9,17 8,45 7,97 7,63 7,36 7,16 6,99 6,86 6,74 6,65 6,56 6,49 6,43 6,37 6,32 6,28 6,13 5,99 5,85 5,71 5,57 5,43 38 68,26 19,11 12,75 10,44 9,25 8,53 8,04 7,69 7,43 7,22 7,05 6,92 6,80 6,70 6,62 6,54 6,48 6,42 6,37 6,33 6,18 6,04 5,89 5,75 5,61 5,46 40 68,92 19,28 12,87 10,53 9,33 8,60 8,11 7,76 7,49 7,28 7,11 6,97 6,85 6,75 6,67 6,59 6,53 6,47 6,42 6,37 6,23 6,08 5,93 5,79 5,64 5,50 50 71,73 20,05 13,36 10,93 9,67 8,91 8,40 8,03 7,75 7,53 7,35 7,21 7,08 6,98 6,89 6,81 6,74 6,68 6,63 6,58 6,42 6,27 6,11 5,96 5,80 5,65 60 73,97 20,66 13,76 11,24 9,95 9,16 8,63 8,25 7,96 7,73 7,55 7,39 7,27 7,16 7,07 6,98 6,91 6,85 6,79 6,74 6,58 6,42 6,26 6,09 5,93 5,76 70 75,82 21,16 14,08 11,51 10,18 9,37 8,82 8,43 8,13 7,90 7,71 7,55 7,42 7,31 7,21 7,13 7,05 6,99 6,93 6,88 6,71 6,54 6,38 6,21 6,04 5,86 80 77,40 21,59 14,36 11,73 10,38 9,55 8,99 8,59 8,28 8,04 7,85 7,69 7,55 7,44 7,34 7,25 7,18 7,11 7,05 6,99 6,82 6,65 6,48 6,30 6,13 5,95 90 78,77 21,96 14,61 11,92 10,54 9,70 9,13 8,72 8,41 8,17 7,97 7,80 7,67 7,55 7,45 7,36 7,28 7,21 7,15 7,10 6,92 6,74 6,57 6,39 6,21 6,02 100 79,98 22,29 14,82 12,09 10,69 9,84 9,26 8,84 8,53 8,28 8,08 7,91 7,77 7,65 7,55 7,46 7,38 7,31 7,24 7,19 7,01 6,83 6,65 6,46 6,28 6,09
160
Tabela 6 - Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nvel de 1% de probabilidade n n2 2 3 4 5 6 7 8 9 10 12 14 16 18 20 1 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 90,00 2 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 14,00 3 8,26 8,50 8,60 8,70 8,80 8,90 8,90 9,00 9,00 9,00 9,10 9,20 9,30 9,30 4 6,51 6,80 6,90 7,00 7,10 7,10 7,20 7,20 7,30 7,30 7,40 7,40 7,50 7,50 5 5,70 5,96 6,11 6,18 6,26 6,33 6,40 6,44 6,50 6,60 6,60 6,70 6,70 6,80 6 5,24 5,51 5,65 5,73 5,81 5,88 5,95 6,00 6,00 6,10 6,20 6,20 6,30 6,30 7 4,95 5,22 5,37 5,45 5,53 5,61 5,69 5,73 5,80 5,80 5,90 5,90 6,00 6,00 8 4,74 5,00 5,14 5,23 5,32 5,40 5,47 5,51 5,50 5,60 5,70 5,70 5,80 5,80 9 4,60 4,86 4,99 5,08 5,17 5,25 5,32 5,36 5,40 5,50 5,50 5,60 5,70 5,70 10 4,48 4,73 4,88 4,96 5,06 5,13 5,20 5,24 5,28 5,36 5,42 5,48 5,54 5,55 11 4,39 4,63 4,77 4,86 4,94 5,01 5,06 5,12 5,15 5,24 5,28 5,34 5,38 5,39 12 4,32 4,55 4,68 4,76 4,84 4,92 4,96 5,02 5,07 5,13 5,17 5,22 5,24 5,26 13 4,26 4,48 4,62 4,69 4,74 4,84 4,88 4,94 4,98 5,04 5,08 5,13 5,14 5,15 14 4,21 4,42 4,55 4,63 4,70 4,78 4,83 4,87 4,91 4,96 5,00 5,04 5,06 5,07 15 4,17 4,37 4,50 4,58 4,64 4,72 4,77 4,81 4,84 4,90 4,94 4,97 4,99 5,00 16 4,13 4,34 4,45 4,54 4,60 4,67 4,72 4,76 4,79 4,84 4,88 4,91 4,93 4,94 17 4,10 4,30 4,41 4,50 4,56 4,63 4,68 4,72 4,75 4,80 4,83 4,86 4,88 4,89 18 4,07 4,27 4,38 4,46 4,53 4,59 4,64 4,68 4,71 4,76 4,79 4,82 4,84 4,85 19 4,05 4,24 4,35 4,43 4,50 4,56 4,61 4,64 4,67 4,72 4,76 4,79 4,81 4,82 20 4,02 4,22 4,33 4,40 4,47 4,53 4,58 4,61 4,65 4,69 4,73 4,76 4,78 4,79 22 3,99 4,17 4,28 4,36 4,42 4,48 4,53 4,57 4,60 4,65 4,68 4,71 4,74 4,75 24 3,96 4,14 4,24 4,33 4,39 4,44 4,49 4,53 4,57 4,62 4,64 4,67 4,70 4,72 26 3,93 4,11 4,21 4,30 4,36 4,41 4,46 4,50 4,53 4,58 4,62 4,65 4,67 4,69 28 3,91 4,08 4,18 4,28 4,34 4,39 4,43 4,47 4,51 4,56 4,60 4,62 4,65 4,67 30 3,89 4,06 4,16 4,22 4,32 4,36 4,41 4,45 4,48 4,54 4,58 4,61 4,63 4,65 40 3,82 3,99 4,10 4,17 4,24 4,30 4,34 4,37 4,41 4,46 4,51 4,54 4,57 4,59 60 3,76 3,92 4,03 4,12 4,17 4,23 4,27 4,31 4,34 4,39 4,44 4,47 4,50 4,53 100 3,71 3,86 3,98 4,06 4,11 4,17 4,21 4,25 4,29 4,35 4,38 4,42 4,45 4,48 3,64 3,80 3,90 3,98 4,04 4,09 4,14 4,17 4,20 4,26 4,31 4,34 4,38 4,41
50 90,00 14,00 9,30 7,50 6,80 6,30 6,00 5,80 5,70 5,55 5,39 5,26 5,15 5,07 5,00 4,94 4,89 4,85 4,82 4,79 4,75 4,74 4,73 4,72 4,71 4,69 4,66 4,64 4,60
100 90,00 14,00 9,30 7,50 6,80 6,30 6,00 5,80 5,70 5,55 5,39 5,26 5,15 5,07 5,00 4,94 4,89 4,85 4,82 4,79 4,75 4,74 4,73 4,72 4,71 4,69 4,66 4,65 4,68
161
Tabela 7 - Valores da amplitude total estudentizada (z), para uso no teste de Duncan, ao nvel de 5% de probabilidade n n2 2 3 4 5 6 7 8 9 10 12 14 16 18 20 50 1 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 18,0 2 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 6,09 3 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4,50 4 3,93 4,01 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 4,02 5 3,64 3,74 3,79 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 3,83 6 3,46 3,58 3,64 3,68 3,68 3,68 3,68 3,68 3,68 3,68 3,68 3,68 3,68 3,68 3,68 7 3,35 3,47 3,54 3,58 3,60 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 3,61 8 3,26 3,39 3,47 3,52 3,55 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 3,56 9 3,20 3,34 3,41 3,47 3,50 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 3,52 10 3,15 3,30 3,37 3,43 3,46 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,48 3,48 11 3,11 3,27 3,35 3,39 3,43 3,44 3,45 3,46 3,46 3,46 3,46 3,46 3,47 3,48 3,48 12 3,08 3,23 3,33 3,36 3,40 3,42 3,44 3,44 3,46 3,46 3,46 3,46 3,47 3,48 3,48 13 3,06 3,21 3,30 3,35 3,38 3,41 3,42 3,44 3,45 3,45 3,46 3,46 3,47 3,47 3,47 14 3,03 3,18 3,27 3,33 3,37 3,39 3,41 3,42 3,44 3,45 3,46 3,46 3,47 3,47 3,47 15 3,01 3,16 3,25 3,31 3,36 3,38 3,40 3,42 3,43 3,44 3,45 3,46 3,47 3,47 3,47 16 3,00 3,15 3,23 3,30 3,34 3,37 3,39 3,41 3,43 3,44 3,45 3,46 3,47 3,47 3,47 17 2,98 3,13 3,22 3,28 3,33 3,36 3,38 3,40 3,42 3,44 3,45 3,46 3,47 3,47 3,47 18 2,97 3,12 3,21 3,27 3,32 3,35 3,37 3,39 3,41 3,43 3,45 3,46 3,47 3,47 3,47 19 2,96 3,11 3,19 3,26 3,31 3,35 3,37 3,39 3,41 3,43 3,44 3,46 3,47 3,47 3,47 20 2,95 3,10 3,18 3,25 3,30 3,34 3,36 3,38 3,40 3,43 3,44 3,46 3,46 3,47 3,47 22 2,93 3,08 3,17 3,24 3,29 3,32 3,35 3,37 3,39 3,42 3,44 3,45 3,46 3,47 3,47 24 2,92 3,07 3,15 3,22 3,28 3,31 3,34 3,37 3,38 3,41 3,44 3,45 3,46 3,47 3,47 26 2,91 3,06 3,14 3,21 3,27 3,30 3,34 3,36 3,38 3,41 3,43 3,45 3,46 3,47 3,47 28 2,90 3,04 3,13 3,20 3,26 3,30 3,33 3,35 3,37 3,40 3,43 3,45 3,46 3,47 3,47 30 2,89 3,04 3,12 3,20 3,25 3,29 3,32 3,35 3,37 3,40 3,43 3,44 3,46 3,47 3,47 40 2,86 3,01 3,10 3,17 3,22 3,27 3,30 3,33 3,35 3,39 3,42 3,44 3,46 3,47 3,47 60 2,83 2,98 3,08 3,14 3,20 3,24 3,28 3,31 3,33 3,37 3,40 3,43 3,45 3,47 3,48 100 2,80 2,95 3,05 3,12 3,18 3,22 3,26 3,29 3,32 3,36 3,40 3,42 3,45 3,47 3,53 2,77 2,92 3,02 3,09 3,15 3,19 3,23 3,26 3,29 3,34 3,38 3,41 3,44 3,47 3,61
100 18,0 6,09 4,50 4,02 3,83 3,68 3,61 3,56 3,52 3,48 3,48 3,48 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,47 3,48 3,53 3,67
162
Tabela 8 - Valores crticos (dc) para o teste de Lilliefors (adaptado de Barbetta et al.2004) =5% 0,381 0,337 0,319 0,300 0,285 0,271 0,258 0,249 0,242 0,234 0,227 0,220 0,213 0,206 0,200 0,179 0,190 0,173 0,161 0,886 N>30 dc = N n 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 =1% 0,734 0,405 0,364 0,348 0,331 0,311 0,294 0,284 0,275 0,268 0,261 0,257 0,250 0,245 0,239 0,235 0,231 0,200 0,187 1,031 dc = N
163
Tabela 9 Valores da funo de distribuio acumulada da normal padro, Z, tal que F(z) = P(0 Z z)
z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 0.00 0.00000 0.03983 0.07926 0.11791 0.15542 0.19146 0.22575 0.25804 0.28814 0.31594 0.34134 0.36433 0.38493 0.40320 0.41924 0.43319 0.44520 0.45543 0.46407 0.47128 0.47725 0.48214 0.48610 0.48928 0.49180 0.49379 0.49534 0.49653 0.49744 0.49813 0.49865 0.49903 0.49931 0.49952 0.49966 0.49977 0.49984 0.49989 0.49993 0.49995 0.49997 0.01 0.00399 0.04380 0.08317 0.12172 0.15910 0.19497 0.22907 0.26115 0.29103 0.31859 0.34375 0.36650 0.38686 0.40490 0.42073 0.43448 0.44630 0.45637 0.46485 0.47193 0.47778 0.48257 0.48645 0.48956 0.49202 0.49396 0.49547 0.49664 0.49752 0.49819 0.49869 0.49906 0.49934 0.49953 0.49968 0.49978 0.49985 0.49990 0.49993 0.49995 0.49997 0.02 0.00798 0.04776 0.08706 0.12552 0.16276 0.19847 0.23237 0.26424 0.29389 0.32121 0.34614 0.36864 0.38877 0.40658 0.42220 0.43574 0.44738 0.45728 0.46562 0.47257 0.47831 0.48300 0.48679 0.48983 0.49224 0.49413 0.49560 0.49674 0.49760 0.49825 0.49874 0.49910 0.49936 0.49955 0.49969 0.49978 0.49985 0.49990 0.49993 0.49996 0.49997 0.03 0.01197 0.05172 0.09095 0.12930 0.16640 0.20194 0.23565 0.26730 0.29673 0.32381 0.34849 0.37076 0.39065 0.40824 0.42364 0.43699 0.44845 0.45818 0.46638 0.47320 0.47882 0.48341 0.48713 0.49010 0.49245 0.49430 0.49573 0.49683 0.49767 0.49831 0.49878 0.49913 0.49938 0.49957 0.49970 0.49979 0.49986 0.49990 0.49994 0.49996 0.49997 0.04 0.01595 0.05567 0.09483 0.13307 0.17003 0.20540 0.23891 0.27035 0.29955 0.32639 0.35083 0.37286 0.39251 0.40988 0.42507 0.43822 0.44950 0.45907 0.46712 0.47381 0.47932 0.48382 0.48745 0.49036 0.49266 0.49446 0.49585 0.49693 0.49774 0.49836 0.49882 0.49916 0.49940 0.49958 0.49971 0.49980 0.49986 0.49991 0.49994 0.49996 0.49997 0.05 0.01994 0.05962 0.09871 0.13683 0.17364 0.20884 0.24215 0.27337 0.30234 0.32894 0.35314 0.37493 0.39435 0.41149 0.42647 0.43943 0.45053 0.45994 0.46784 0.47441 0.47982 0.48422 0.48778 0.49061 0.49286 0.49461 0.49598 0.49702 0.49781 0.49841 0.49886 0.49918 0.49942 0.49960 0.49972 0.49981 0.49987 0.49991 0.49994 0.49996 0.49997 0.06 0.02392 0.06356 0.10257 0.14058 0.17724 0.21226 0.24537 0.27637 0.30511 0.33147 0.35543 0.37698 0.39617 0.41308 0.42785 0.44062 0.45154 0.46080 0.46856 0.47500 0.48030 0.48461 0.48809 0.49086 0.49305 0.49477 0.49609 0.49711 0.49788 0.49846 0.49889 0.49921 0.49944 0.49961 0.49973 0.49981 0.49987 0.49992 0.49994 0.49996 0.49998 0.07 0.02790 0.06749 0.10642 0.14431 0.18082 0.21566 0.24857 0.27935 0.30785 0.33398 0.35769 0.37900 0.39796 0.41466 0.42922 0.44179 0.45254 0.46164 0.46926 0.47558 0.48077 0.48500 0.48840 0.49111 0.49324 0.49492 0.49621 0.49720 0.49795 0.49851 0.49893 0.49924 0.49946 0.49962 0.49974 0.49982 0.49988 0.49992 0.49995 0.49996 0.49998 0.08 0.03188 0.07142 0.11026 0.14803 0.18439 0.21904 0.25175 0.28230 0.31057 0.33646 0.35993 0.38100 0.39973 0.41621 0.43056 0.44295 0.45352 0.46246 0.46995 0.47615 0.48124 0.48537 0.48870 0.49134 0.49343 0.49506 0.49632 0.49728 0.49801 0.49856 0.49896 0.49926 0.49948 0.49964 0.49975 0.49983 0.49988 0.49992 0.49995 0.49997 0.49998 0.09 0.03586 0.07535 0.11409 0.15173 0.18793 0.22240 0.25490 0.28524 0.31327 0.33891 0.36214 0.38298 0.40147 0.41774 0.43189 0.44408 0.45449 0.46327 0.47062 0.47670 0.48169 0.48574 0.48899 0.49158 0.49361 0.49520 0.49643 0.49736 0.49807 0.49861 0.49900 0.49929 0.49950 0.49965 0.49976 0.49983 0.49989 0.49992 0.49995 0.49997 0.49998
164
I 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120
165
Tabela 11 Valores crticos (dc) para o teste de Kolmogorov-Smirnov (adaptado de Barbetta et al.2004)
N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 40 45 50 N>50 =5% 0,975 0,842 0,708 0,624 0,563 0,519 0,483 0,454 0,430 0,430 0,409 0,391 0,375 0,361 0,349 0,338 0,327 0,318 0,309 0,301 0,294 0,264 0,242 0,224 0,210 0,198 =1% 0,995 0,929 0,829 0,734 0,669 0,617 0,576 0,542 0,513 0,490 0,468 0,449 0,432 0,418 0,404 0,392 0,81 0,371 0,361 0,352 0,317 0,290 0,269 0,252 0,238 0,227
dc =
136 , N
dc =
1,36 N
166
em que: X i = total observado para cada nvel de T. Este total se refere soma de todas as observaes contidas no i-simo nvel de T;
ri = nmero de observaes que foram somadas para se obter o total X i ; k = nmero de nveis de T. Em termos gerais, pode-se dizer que na frmula de SQT, cada valor elevado ao quadrado deve ser dividido pelo nmero de observaes que originou aquele valor. Pode-se tambm visualizar dois termos na frmula de SQT. O termo com sinal positivo, considera os totais individuais de cada i-simo nvel de T. J o termo com sinal negativo, considera a soma conjunta dos totais de todos os isimos nveis de T. Neste segundo termo, o numerador se refere soma de todos os totais ( X i ) includos no primeiro termo e, o denominador, se refere soma de todas as observaes ( ri ) includas no primeiro termo. O denominador da frmula de QMT, nmero de graus de liberdade, se refere diferena entre o nmero de termos que esto sendo somados e subtrados no clculo da SQT. De acordo com a definio da frmula geral, o nmero de graus de liberdade associado T igual a k 1, pois no clculo da k X2 SQT existem k valores sendo somados, ou seja, i , e existe um valor sendo i =1 ri
k Xi i =1
2
subtrado, ou seja,
r
i =1
167
Anexo 2 Frmula Geral para Clculo de Soma de Quadrados Para o uso da frmula geral, para cada fonte de variao, necessrio apenas identificar o que representa X i e o que representa ri . Como relatado anteriormente, X i o total observado para cada i-simo nvel da FV e ri o nmero de observaes que originou o respectivo total X i . Veja na tabela a seguir, o que representam X i e ri para algumas possveis fontes de variao de uma anlise de varincia. Fonte de Variao Total Tratamentos Blocos Linhas Colunas Fator A Fator A / BJ Xi cada observao total do i-simo tratamento total do i-simo bloco ri
Parcelas
igual a um nmero de observaes associado ao total do i-simo tratamento nmero de observaes associado ao total do i-simo bloco total da i-sima linha nmero de observaes associado ao total da i-sima linha total da i-sima coluna nmero de observaes associado ao total da i-sima coluna total do i-simo nvel de A nmero de observaes associado ao total do i-simo nvel de A total do i-simo nvel de A nmero de observaes associado ao dentro do j-simo nvel de total do i-simo nvel de A dentro do jB simo nvel de B total da i-sima parcela nmero de observaes associado ao total da i-sima parcela
OBSERVAES: - Esta frmula geral no se aplica para o clculo das fontes de variao: resduo, interao entre fatores e regresso; - Esta ser a nica frmula fornecida em prova para o clculo de soma de quadrados; - Cabe ao aluno praticar a aplicao desta frmula nos exerccios existentes.
168
169
Anexo 3 Introduo ao Uso do Programa SAS 8 aps isto, clicar duas vezes no cone do SAS. O programa agora deve conter 3 janelas abertas: Log, Output e Editor OBS: Estas instrues foram adaptadas do README que consta no computador estatisticos onde o SAS encontra-se instalado.
2.1.1 Janela do Editor de Programas (Editor Program window) A janela do Editor de Programas usada para editar programas e arquivos de dados. O usurio tambm pode submeter os seus programas usando esta janela. Na verso 8.0 existem dois tipos de editores: Program Editor e Enhanced Editor. O ltimo tem as mesmas caractersticas do primeiro com a vantagem de indicar erros de programao por meio de um jogo de cores no cdigo do programa. 170
EST 220 Estatstica Experimental I/2008 2.1.2 Janela de Mensagens (Log window) Nesta janela so apresentadas mensagens relacionadas a execuo de programas do usurio submetidos ao SAS. aconselhvel que, antes de submeter um novo programa, deletar as mensagens existentes. Aconselha-se tambm que, o usurio verifique as mensagens referentes ao programa que submeteu. Em geral, mensagens em azul indicam que no existem erros de programao. Mensagens em verde, indicam que pequenos erros de programao foram encontrados, mas que o prprio SAS concertou (com c mesmo, pois pode ser que o concerto dele no seja correto). Mensagens em vermelho, indicam que o SAS encontrou um erro de programao grave. Tais erros, podem impedir que uma programa seja executado e consequentemente nenhuma sada obtida. 2.1.3 Janela de Sada (Output window) Os resultados da execuo de um programa so apresentados nesta janela. Vale lembrar que sadas podero ser geradas mesmo quando existirem erros de programao. Portanto, sempre bom olhar a janela de mensagens, antes de comear a interpretar os resultados mostrados na janela de sada. 2.2 Elaborao de programas do SAS (SAS jobs) Um programa no SAS nada mais do que um conjunto de comandos prprios (palavras chaves) do SAS, que so usados em uma sequncia lgica, para realizar um conjunto de tarefas. Como mencionado anteriormente, os programas do SAS so normalmente editados na Janela do Editor de programas. Um programa no SAS, em geral, consiste de dois passos (steps) distintos:
2.2.1 1o Passo: Data step No data step, dados so lidos e convertidos em um arquivo de trabalho do SAS. Neste passo deve ser informado o nome de todas as variveis, bem como o seu tipo (caracter ou alfanumrica), suas posies no arquivo de dados. O conjunto de dados, se pequeno, pode ser inserido no programa. Se ao contrrio, o conjunto de dados for grande, o mesmo deve ser salvo em arquivo parte e o caminho para o SAS busc-lo deve ser informado no DATA step. Normalmente, arquivos de dados gerados em outros softwares (excel, word, etc...) devem ser importados para o programa SAS. Consulte o help do SAS para verificar como isto deve ser realizado. O exemplo a seguir ilustra um DATA step.
171
Data step
data a1; input x1 $ x2 x3; x4 = x2 + x3; cards; a 1 14.1 a 1 14.2 b 2 16.3 b 2 17.3 ; run;
Comentrios: 1) a palavra chave DATA informa que o SAS deve criar um novo arquivo de trabalho, cujo nome o que segue a palavra chave DATA. Este arquivo de trabalho, geralmente deletado ao sair do SAS. As seguintes regras devem ser observadas ao dar um nome para um arquivo de trabalho do SAS: - o nome deve conter de 1 a 8 caracteres; - comece com qualquer letra ou _ (sublinhado) ; - continue com nmeros, letras ou _ ; 2) a palavra chave INPUT informa ao SAS os nomes das variveis existentes no arquivo de dados. Neste exemplo, o conjunto de dados possui trs variveis cujos nomes so x1 x2 x3. O sinal $ depois do nome da primeira varivel, informa ao SAS que a varivel x1 alfanumrica. A ausncia deste sinal aps os nomes das variveis x2 e x3, indica que elas so apenas numricas. Como no foi informado as colunas que cada uma delas ocupa no arquivo de dados, supe-se que as mesmas ocupam as mesmas posies ao longo de todo o conjunto de dados e que tambm elas estejam separadas por pelo menos um espao em branco; 3) uma nova varivel, x4, criada. Esta o resultado da soma da varivel x2 e x3. As regras para nomear variveis so as mesmas dadas anteriormente para nomear SAS data sets; 4) a palavra chave CARDS informa ao SAS que, linhas a seguir so linhas que contm os valores das variveis declaradas em INPUT; 5) as linhas a seguir so os valores das variveis; 6) o ponto e vrgula na linha imediatamente aps a ltima linha de dados, informa ao SAS que o conjunto de dados chegou ao fim; 7) a palavra chave RUN informa ao SAS que aquele passo, no caso DATA step, acabou e que ele pode executar esta parte da anlise; 8) observe que ao final de cada linha de comandos (exceto as linhas que contm os dados, existe um ponto e vrgula. Este ponto e vrgula ao final de cada linha, informa ao SAS que aquele comando terminou. A falta de um ponto e vrgula em qualquer uma das linhas de comando, pode fazer com que o SAS no execute aquele passo. Este um erro muito comum para principiantes do SAS. Se o usurio estiver usando o Enhanced 172
EST 220 Estatstica Experimental I/2008 Editor, tais erros podem ser minimizados, pois a falta de um ponto e vrgula faz com que palavras chaves no apaream em cores distintas; 9) a identao das linhas no requerida, embora ajude ao usurio saber onde comea e termina cada passo do programa. Se o conjunto de dados enconta-se em arquivo separado, por exemplo no disco C, na pasta Meus Dados e arquivo arq1.txt, ento o caminho para o SAS ler este arquivo deve ser informado usando a palavra chave INFILE, como ilustrado a seguir: data a2 Infile C:\Meus Dados\arq1.txt input x1 $ x2 x3 x4 = x2 + x3 run
data step
Comentrios adicionais para este exemplo: 1) a palavra chave INFILE informa ao SAS que o conjunto de dados encontra-se em um arquivo em separado do programa, cujo caminho informado a seguir; 2) o caminho para o arquivo escrito entre apstrofes; 2.2.2 2o Passo: PROCedure step Neste passo deve-se informar que tipo tarefa (anlise estatstica, ordenao de valores, grficos, etc...) deseja-se realizar com um determinado arquivo de trabalho do SAS. O SAS possui uma variedade muito grande de procedimentos. O exemplo a seguir ilustra o uso do procedimento PRINT. proc step proc print data=a1; var x1 x2 x3; run;
O exemplo anterior um exemplo muito simples, pois vrias opes podem ser acrescentadas ao procedimento PRINT. No entanto, o objetivo agora apenas fornecer uma idia geral do passo PROC. Outros procedimentos e opes dos mesmos sero apresentados posteriormente. Comentrios: 1) um procedimento sempre inicia com a palavra chave PROC seguida do nome do procedimento que se deseja executar. No exemplo, o procedimento solicitado o PRINT. Este procedimento pode ser usado para imprimir na tela contedos de um arquivo de trabalho do SAS. 2) seguindo o nome do procedimento desejado, deve-se informar qual arquivo de trabalho do SAS deve ser utilizado neste passo. Caso o usurio no indique o nome do arquivo de trabalho, o SAS utilizar o arquivo de trabalho que foi mais recentemente criado. Ao final desta linha deve existir um ponto e vrgula;
173
Anexo 3 Introduo ao Uso do Programa SAS 3) a palavra chave VAR usada para informar ao SAS, quais variveis devem ter seus valores impressos; 4) a ltima linha do procedimento deve conter a palavra chave RUN, seguida de ponto e vrgula. A presena desta palavra chave informa ao SAS que os comandos contidos naquele passo podem ser executados. Em um nico programa, qualquer um destes dois passos podem se repetir inmeras vezes. Ou seja, diferentes procedimentos podem ser solicitados para um mesmo conjunto de dados, e diferentes conjunto de dados podem ser informados num mesmo programa. 2.3 Erros comuns na elaborao de um programa SAS Como todo qualquer programa computacional, erros de programas SAS podem comprometer parcial ou totalmente sua execuo. O SAS um programa robusto, no sentido que se alguma palavra chave for escrita errada, o programa por si procede a correo e continua a execuo com a verso corrigida. Neste caso, correes feitas pelo SAS so mostradas como linhas em verde na janela LOG. Erros deste tipo produzem sada. Vale lembrar, que cabe ao usurio verificar se a correo realizada pelo SAS coerente ao desejado pelo usurio, e assim o mesmo poder decidir se a sada obtida satisfatria ou no. Por outro lado, existem erros de programao que o SAS no corrige tais como: - esquecer um ponto e vrgula no final de uma declarao; - esquecer uma RUN statement; - esquecer de fechar aspas. Tais erros no produzem sadas. O SAS informa que identificou tais erros na janela LOG por meio de linhas vermelhas.
3 Anlises Estatsticas
3.1 Variveis classificatrias vs analticas Para realizar anlises estatsticas, o SAS faz distino entre variveis classificatrias e analticas. 3.1.1 Variveis classificatrias Em termos estatsticos, variveis classificatrias so aquelas que poderamos classificar como qualitativas. Por exemplo, a varivel que identifica tratamentos numa anlise de varincia. So tambm conhecidas, em alguns casos, como variveis independentes. Estas variveis podem ser: - numricas ou alfanumricas; - representar categorias discretas, se elas forem contnuas; - identificar classes ou categorias nas quais os clculos so efetuados.
174
EST 220 Estatstica Experimental I/2008 3.1.2 Variveis anliticas Em termos estatsticos, variveis analticas so as variveis que vamos usar para estudar o efeito de tratamentos, ou em outras palavras, elas so as variveis respostas, ou valores observados em um experimento. So tambm conhecidas como variveis dependentes. Por sua vez, estas variveis so: - numricas; - apropriadas para o clculo de mdias, somas, ou outras estatsticas; - contnuas (na maior parte dos casos).
175
Anexo 3 Introduo ao Uso do Programa SAS A declarao MODEL informa qual modelo estatstico deve ser adotado durante a anlise. No caso de um delineamento inteiramente casualizado, apenas a varivel que identifica tratamentos deve ser informada, uma vez que o efeito da mdia geral e do erro esto presentes no modelo de todos os delineamentos; A declarao MEANS opcional. Com ela possvel comparar mdias de tratamentos e estabelecer o nvel de significncia do teste de mdias. Dentre outros testes, pode ser solicitado o teste de Duncan, Tukey e Bonferroni; quit informa ao SAS que ele pode abandonar a execuo do procedimento ANOVA. Exemplo: Os dados deste programa so do exerccio 4.1 options nodate nocenter nonumber; title 'Delineamento Inteiramente Casualizado'; data exerc_4_1; input varied prod @@; cards; 1 25 2 31 3 22 4 33 1 26 2 25 3 26 4 29 1 20 2 28 3 28 4 31 1 23 2 27 3 25 4 34 1 21 2 24 3 29 4 28 ; run; proc anova data=exerc_4_1; class varied; model prod = varied; means varied / tukey alpha=0.05; means varied / duncan alpha=0.05; run; quit; A sentena options informa opes do formato da sada de um programa SAS. A opo nodate solicita ao SAS que no imprima a data da execuo, a opo nocenter solicita que o texto da sada seja alinhado esquerda; e a opo nonumber solicita que as pginas da sada no sejam numeradas. A sentena title possibilita personificar as sadas do SAS. Existem 10 nveis de ttulo de sada que podem ser definidos. O nvel identificado pelo nmero aps title, ou seja title2 se refere ao segundo nvel de ttulo. 4.2 Delineamento em Blocos Casualizados (DBC) As nicas diferenas para o programa anterior esto nas declaraes CLASS e MODEL. Ambas devem conter, adicionalmente, REP, pois, o fator repetio
176
EST 220 Estatstica Experimental I/2008 uma varivel classificatria e parte do modelo estatstico do DBC. Assim uma forma geral de programa para este tipo de delineamento seria: proc anova data=a1; class rep trt; model y = rep trt; means trt / duncan alpha=0.05; run; Exemplo Os dados deste programa so do exerccio 6.2 options nodate nocenter nonumber; title 'Delineamento em Blocos Casualizados'; data exerc_6_2; input ta grupo prod @@; cards; 1 1 30 1 2 32 1 3 33 1 4 34 1 5 29 1 6 30 1 7 33 2 1 29 2 2 31 2 3 34 2 4 31 2 5 33 2 6 33 2 7 29 3 1 43 3 2 47 3 3 46 3 4 47 3 5 48 3 6 44 3 7 47 4 1 23 4 2 25 4 3 21 4 4 19 4 5 20 4 6 21 4 7 22 ; run; proc anova data=exerc_6_2; class ta grupo; model prod = ta grupo; means ta / tukey alpha=0.05; means ta / duncan alpha=0.05; run; quit; 4.3 Delineamento em Quadrado Latino (DQL) Em relao ao DIC, as declaraes CLASS e MODEL devem ser alteradas para tambm conter as variveis que identificam a linha e a coluna de cada valor observado. Uma forma geral para anlise de um experimento instalado segundo o DQL seria: proc anova; class linha coluna trt; model y = linha coluna trt; means trt / duncan; run;
177
Anexo 3 Introduo ao Uso do Programa SAS Exemplo Os dados deste programa so do exerccio 7.4 options nodate nocenter nonumber; title 'Delineamento em Quadrado Latino'; data exerc_7_4; input leit faixa castracao $ ganho @@; cards; 1 1 A 93.0 1 2 C 115.4 1 3 E 116.9 1 4 D 110.2 1 5 B 110.4 2 1 C 110.6 2 2 E 96.5 2 3 B 108.9 2 4 A 97.6 2 5 D 112.0 3 1 B 102.1 3 2 D 108.6 3 3 A 77.9 3 4 E 102.0 3 5 C 111.7 4 1 D 115.4 4 2 A 94.9 4 3 C 114.0 4 4 B 100.2 4 5 E 118.5 5 1 E 117.6 5 2 B 114.1 5 3 D 118.7 5 4 C 108.8 5 5 A 80.2 ; run; proc glm data=exerc_7_4; class leit faixa castracao; model ganho = leit faixa castracao; means castracao / tukey alpha=0.05; means castracao / duncan alpha=0.05; run; quit; Experimentos Fatoriais Em experimentos fatoriais, existem no mnimo dois fatores sendo estudados simultaneamente num experimento. O interesse, nesta situao, verificar se significativo o efeito da interao e dos efeitos principais. Experimentos fatoriais podem ser instalados usando vrios tipo de delineamentos. Para contemplar anlises de experimentos fatoriais, o programa proposto para o DIC deve ser modificado nas declaraes CLASS e MODEL. Suponha que os dois fatores em estudos, ditos A e B, esto sendo estudados e que o experimento foi instalado segundo o DBC. Uma forma geral para um programa como este seria proc glm; class rep a b; model y = rep a b a*b; run; Veja que o termo da interao foi includo na declarao MODEL, para que seja realizado o teste F para o efeito da mesma. No caso da interao ser significativa, seria desejvel proceder ao estudo de um fator dentro de cada nvel do outro fator. Para atingir tal objetivo, inclua as seguintes linhas aps a declarao MODEL: lsmeans a*b / slice=b; lsmeans a*b / slice=a; 178 4.4
Se a interao for no significativa, podemos estudar um fator independente do outro. Neste caso as seguintes linhas poderiam ser includas no programa inicial: lsmeans a / tukey; lsmeans b / tukey; Exemplo O enunciado para este exemplo foi fornecido em sala de aula, o qual foi retirado do livro BANZATTO e KRONKA (1989). options nodate nocenter nonumber; title 'Experimentos Fatoriais'; data exemplo_8_extra; input recipiente especie altura @@; cards; 1 1 26.2 1 1 26.0 1 1 25.0 1 1 25.4 1 2 24.8 1 2 24.6 1 2 26.7 1 2 25.2 2 1 25.7 2 1 26.3 2 1 25.1 2 1 26.4 2 2 19.6 2 2 21.1 2 2 19.0 2 2 18.6 3 1 22.8 3 1 19.4 3 1 18.8 3 1 19.2 3 2 19.8 3 2 21.4 3 2 22.8 3 2 21.3 ; run; proc glm data=exemplo_8_extra; class recipiente especie; model altura = recipiente especie recipiente*especie; lsmeans recipiente*especie / slice=especie; lsmeans recipiente*especie / slice=recipiente; run; quit; 4.5 Experimentos em Parcelas Subdivididas Tal como no caso de experimentos fatoriais, experimentos em parcelas subdivididas so usados quando se deseja estudar dois ou mais fatores simultaneamente num mesmo experimento. A diferena que em experimentos em parcelas subdivididas um fator, dito principal, designado segundo um tipo de delineamento as parcelas que contm vrias unidades experimentais. O segundo fator, ento designado aleatoriamente s subparcelas de cada parcela. O objetivo em parcelas subdividas tambm verificar se os efeitos principais e interao entre fatores so significativos. O programa para esta situao difere no fato de ser necessrio indicar o resduo correto para testar o fator principal uma vez que o SAS assume que todos os fatores devem ser testados contra o erro(b). A seguir est uma forma geral para a anlise de um experimento em parcelas subdivididas, considerando que o fator A o fator
179
Anexo 3 Introduo ao Uso do Programa SAS principal e o fator B o secundrio e que o experimento foi instalado segundo o DBC: proc glm; class rep a b; model y = a rep a*rep b a*b; test h=a e=a*rep; run; quit; Exemplo Os dados deste programa so do exerccio 9.1 options nodate nocenter nonumber; title 'Experimentos em Parcelas Subdivididas'; data exemplo_9_1; input variedade defensivo bloco producao @@; cards; 1 1 1 42.9 1 1 2 41.6 1 1 3 28.9 1 1 4 30.8 1 2 1 53.8 1 2 2 58.5 1 2 3 43.9 1 2 4 46.3 1 3 1 49.5 1 3 2 53.8 1 3 3 40.7 1 3 4 39.4 1 4 1 44.4 1 4 2 41.8 1 4 3 28.3 1 4 4 34.7 2 1 1 53.3 2 1 2 69.6 2 1 3 45.4 2 1 4 35.1 2 2 1 57.6 2 2 2 69.6 2 2 3 42.4 2 2 4 51.9 2 3 1 59.8 2 3 2 65.8 2 3 3 41.4 2 3 4 45.4 2 4 1 64.1 2 4 2 57.4 2 4 3 44.1 2 4 4 51.6 3 1 1 62.3 3 1 2 58.5 3 1 3 44.6 3 1 4 50.3 3 2 1 63.4 3 2 2 50.4 3 2 3 45.0 3 2 4 46.7 3 3 1 64.5 3 3 2 46.1 3 3 3 62.6 3 3 4 50.3 3 4 1 63.6 3 4 2 56.1 3 4 3 52.7 3 4 4 51.8 4 1 1 75.4 4 1 2 65.6 4 1 3 54.0 4 1 4 52.7 4 2 1 70.3 4 2 2 67.3 4 2 3 57.6 4 2 4 58.5 4 3 1 68.8 4 3 2 65.3 4 3 3 45.6 4 3 4 51.0 4 4 1 71.6 4 4 2 69.4 4 4 3 56.6 4 4 4 47.4 ; run; proc glm data=exemplo_9_1; class variedade defensivo bloco; model producao = variedade defensivo bloco variedade*bloco variedade*defensivo; test h=variedade e=variedade*bloco; run; quit;
180
5 Regresso Linear
Regresso geralmente usada quando deseja-se verificar se um fator quantitativo exerce influncia sob uma varivel dependente. No programa SAS, existem dois procedimentos distintos para tal finalidade, GLM e REG. O procedimento REG mais usado quando se ajusta um modelo contendo apenas fatores quantitativos como variveis independentes. J o procedimento GLM possibilita o ajuste de modelos de covarincia, ou seja, modelos que incluem tanto fatores qualitativos como quantitativos como variveis independentes. A seguir fornecido explicaes mais detalhadas a respeito de cada um deles. 5.1 PROC REG O procedimento REG usa o mtodo dos quadrados mnimos para estimar os parmetros num modelo linear. Com este procedimento possvel. A estrutura geral de um programa usando o procedimento REG : proc reg data=a1; var variables; model y = x1 x2 ... / options; output out=newset keyword=name1 keyword=name2; test equation1, equation2; run; Comentrios: a declarao REG solicita que o SAS utilize o procedimento REG; a declarao DATA informa ao SAS qual DATA set deve ser utilizado neste procedimento; a declarao VAR especifica todas as variveis que sero utilizadas na anlise; a declarao MODEL especifica que y a varivel dependente e x1, x2, ... so as variveis independentes; a declarao OPTIONS solicita ao SAS que algumas sadas adicionais sejam impressas. Algumas das possibilidades so: + p: imprime valores preditos; + r: imprime resduos; + xpx: imprime a matriz XX; + i: imprime a inversa da matriz XX; + covb: imprime a matriz de varincia e covarincia das estimativas dos parmetros; a declarao OUTPUT statement cria um SAS DATA set com as variveis definidas nas declaraes KEYWORD. Para este procedimento as KEYWORDs podem ser PREDICT, RESIDUAL, etc ... TEST statement usada para realizar teste de significncia para cada uma das equaes listadas. Por exemplo, TEST X1=0, X2=0; testa se os coeficientes de X1 e X2 so simultaneamente iguais a zero.
181
Anexo 3 Introduo ao Uso do Programa SAS Exemplos 1) Regresso Linear Simples Os dados deste programa so do exerccio 10.5. O programa a seguir produz uma regresso linear de y em x. Usando a declarao OUTPUT, possvel salvar os valores preditos (yhat) e residuais (resid) em outro arquivo de trabalho (new). options nodate nocenter nonumber; title 'Regresso Linear Simples de 1o grau'; data exerc_10_5; input x y @@; cards; 50 1.2 75 1.7 100 2.0 125 2.1 150 2.5 ; run; proc reg data=exerc_10_5; model y = x; output out=new p=yhat r=resid; run; quit; 2) Regresso linear polinomial Para modelos de regresso polinomial, necessrio criar as potncias das variveis logo depois da declarao INPUT. Os dados deste programa so do exerccio 10.4. O programa ilustra anlise de dados segundo um modelo linear de 2o grau. options nodate nocenter nonumber; title 'Regresso Linear Simples de 2o grau'; data exerc_10_4; input x y @@; x2 = x*x; cards; 1.0 20.3 2.5 31.3 4.0 34.6 5.5 35.1 7.0 30.2 8.5 19.7 ; run; proc reg data=exerc_10_4; model y = x x2; output out=new p=yhat r=resid; run; quit;
182
OBSERVAO: O contedo das sadas aqui mostradas apenas um resumo de uma sada normal do SAS. Aqui so apresentadas apenas os resultados mais importantes de uma sada de um programa do SAS.
183
Tukey's Studentized Range (HSD) Test for y Alpha Error Degrees of Freedom Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are Tukey Grouping Mean N A 31.000 5 B A 27.000 5 B 26.000 5 B 23.000 5 0.05 16 7 4.04609 4.7874
Duncan's Multiple Range Test for y Alpha Error Degrees of Freedom Error Mean Square Number of Means Critical Range 2 3.547 0.05 16 7 3 3.720 4 3.828
Means with the same letter are not significantly different. Duncan Grouping A B C B C
N 5 5 5 5
var 4 2 3 1
184
F Value 59.76
Pr > F <.0001
y Mean 32.64286 Mean Square 708.428571 2.904762 F Value 177.81 0.73 Pr > F <.0001 0.6323
Tukey's Studentized Range (HSD) Test for y Alpha 0.05 Error Degrees of Freedom 18 Error Mean Square 3.984127 Critical Value of Studentized Range 3.99698 Minimum Significant Difference 3.0154 Means with the same letter are not significantly different. Tukey Grouping Mean N ta A 46.000 7 3 B 31.571 7 1 B 31.429 7 2 C 21.571 7 4 Duncan's Multiple Range Test for y Alpha 0.05 Error Degrees of Freedom 18 Error Mean Square 3.984127 Number of Means Critical Range 2 2.242 3 2.352 4 2.421
Means with the same letter are not significantly different. Duncan Grouping A B B C
N 7 7 7 7
ta 3 1 2 4
185
Values 1 2 3 4 5 1 2 3 4 5 A B C D E 25
Dependent Variable: ganho Source Model Error Corrected Total R-Square 0.775852 Source leit faixa castracao DF 12 12 24 Sum of Squares 2326.379200 672.103200 2998.482400 Root MSE 7.483889 Type I SS 257.826400 48.498400 2020.054400 Mean Square 193.864933 56.008600 F Value 3.46 Pr > F 0.0204
ganho Mean 106.2480 Mean Square 64.456600 12.124600 505.013600 F Value 1.15 0.22 9.02 Pr > F 0.3796 0.9242 0.0013
Tukey's Studentized Range (HSD) Test for ganho Alpha Error Degrees of Freedom Error Mean Square Critical Value of Studentized Range Minimum Significant Difference Tukey Grouping Mean A 112.980 A 112.100 A 110.300 A 107.140 B 88.720 0.05 12 56.0086 4.50760 15.086
N 5 5 5 5 5
castracao D C E B A
Duncan's Multiple Range Test for ganho Alpha 0.05 Error Degrees of Freedom 12 Error Mean Square 56.0086 Number of Means 2 3 Critical Range 10.31 10.79 Duncan Grouping Mean A 112.980 A 112.100 A 110.300 A 107.140 B 88.720
4 11.09
5 11.28
N 5 5 5 5 5
castracao D C E B A
186
Values 1 2 3 1 2 24
altura Mean 22.96667 Mean Square 46.43041667 19.08166667 31.88041667 F Value 36.20 14.88 24.85 Pr > F <.0001 0.0012 <.0001
recipiente*especie Effect Sliced by especie for altura Sum of especie DF Squares Mean Square F Value 1 2 87.121667 43.560833 33.96 2 2 69.500000 34.750000 27.09 recipiente*especie Effect Sliced by recipiente for altura Sum of Squares 0.211250 79.380000 3.251250
recipiente 1 2 3
DF 1 1 1
187
Values 1 2 3 4 1 2 3 4 1 2 3 4 64
Dependent Variable: producao Source Model Error Corrected Total R-Square 0.906225 DF 27 36 63 Sum of Squares 7066.191875 731.202500 7797.394375 Root MSE 4.506793 Type I SS 2848.021875 170.536875 2842.873125 618.294375 586.465625 Mean Square 261.710810 20.311181 F Value 12.89 Pr > F <.0001
producao Mean 52.80938 Mean Square 949.340625 56.845625 947.624375 68.699375 65.162847 F Value 46.74 2.80 46.66 3.38 3.21 Pr > F <.0001 0.0539 <.0001 0.0042 0.0059
Tests of Hypotheses Using the Type III MS for variedade*bloco as an Error Term Source DF Type III SS Mean Square F Value Pr > F Variedade 3 2848.021875 949.340625 13.82 0.0010
188
Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var
DF 1 3 4
F Value 67.50
Pr > F 0.0038
Variable Intercept x
DF 1 1
Parameter Estimates Parameter Standard Estimate Error 0.70000 0.15492 0.01200 0.00146
Regresso Linear Simples de 2o grau The REG Procedure Dependent Variable: y Analysis of Variance Sum of Mean Squares Square 234.81498 117.40749 1.35836 0.45279 236.17333 R-Square Adj R-Sq 0.9942 0.9904
Source Model Error Corrected Total Root MSE Dependent Mean Coeff Var
DF 2 3 5
F Value 259.30
Pr > F 0.0004
Variable Intercept x x2
DF 1 1 1
Parameter Estimates Parameter Standard Estimate Error 11.24222 0.97376 10.46770 0.47719 -1.11349 0.04895
189
Anexo 4 p-valor
O p-valor representa a probabilidade estimada no experimento, de rejeitar Ho quando Ho verdadeira, de acordo com o nmero de graus de liberdade (gl) e do teste de hipteses utilizado. Portanto, quanto menor for o pvalor, mais forte ser a evidncia de que Ho dever ser rejeitada. Em termos prticos, tem-se a seguinte regra de deciso em relao ao nvel de significncia de referncia: Se p-valor rejeitar Ho; Se p-valor > no rejeitar Ho. No Excel (inserir funo estatstica), os p-valores e os valores tabelados do teste t so obtidos, como seguem: DISTT (|tcal|; gl; 2) = p-valor Ha bilateral; DISTT (|tcal|; gl; 1) = p-valor Ha unilateral; INVT (; gl) = ttab Ha bilateral; INVT (2; gl) = ttab Ha unilateral. No Excel (inserir funo estatstica), os p-valores e os valores tabelados do teste F so obtidos, como seguem: DISTF (Fcal; gl numerador; gl denominador) = p-valor Ha unilateral; INVF (; gl numerador; gl denominador) = Ftab Ha unilateral.
190
Tratamentos 2 3 4 100 100 100 100 100 100 100 100 100 300 300 300 100 100 100
ANOVA 5 ................... FV GL SQ QM F 100 Tratamentos 4 0 0 100 Resduo 10 0 0 100 Total 14 0 300 100
Tratamentos 2 3 4 80 70 60 100 100 100 120 130 140 300 300 300 100 100 100
ANOVA 5 ................... FV GL SQ QM F 50 Tratamentos 4 0 0 0 100 Resduo 10 11000 1100 150 Total 14 11000 300 100
Tratamentos Repeties 1 2 3 4 1 98 99 100 101 2 98 99 100 101 3 98 99 100 101 Totais 294 297 300 303 Mdias 98 99 100 101
ANOVA 5 ................... FV GL SQ QM F 102 Tratamentos 4 30 7,5 Inf 102 Resduo 10 0 0 102 Total 14 30 306 102
Tratamentos Repeties 1 2 3 4 1 98 99 100 101 2 99 100 101 102 3 100 101 102 103 Totais 297 300 303 306 Mdias 100 100 100 100
ANOVA 5 ................... FV GL SQ QM F 102 Tratamentos 4 30 7,5 7,50 103 Resduo 10 10 1,0 104 Total 14 40 309 100
191
Yik = m + ti + eik em que, Yik: o valor observado para a varivel resposta obtido para o i-simo tratamento em sua k-sima repetio; m: a mdia fixa de todos os valores possveis da varivel resposta; ti: o efeito fixo do tratamento i no valor observadoYik;
t i = mi m
eik: o efeito aleatrio do erro ou resduo experimental associado ao valor observado Yik, definido por eik = Yik - mi As pressuposies para a validade dos resultados da anlise de varincia so que os erros experimentais 1. Sigam uma distribuio normal; 2. Tenham varincia comum e 3. Sejam independentes A estimativa do erro experimental, no DIC, obtida pela diferena entre
EST 220 Estatstica Experimental I/2008 t Yik = m + i t A estimativa do efeito do tratamento i, i , por sua vez obtida por i = m i m t Portanto temos que Yik = m i Ento a estimativa do resduo experimental, ik, de acordo como o modelo estatstico apresentado anteriormente obtida por
ik = Yik - m i .
Portanto, antes de interpretar os resultados da anlise de varincia recomenda-se verificar, por meios dos procedimentos descritos a seguir, se as estimativas dos resduos satisfazem as pressuposies da anlise de varincia.
S(e ik ) =
n de valores < e ik n
os resduos experimentais tendem a se aderir. Uma distribuio normal especificada pelos parmetros mdia e varincia. Na realizao deste teste, assume-se que os parmetros da suposta
193
Anexo 6 Pressuposies ANOVA distribuio normal dos resduos so iguais aos valores da mdia e varincia dos resduos experimentais. A partir da especificao dos parmetros da distribuio normal possvel calcular a freqncia acumulada terica. A distribuio acumulada definida como F(e ik ) = P(E ik e ik ) . Supondo que a distribuio dos resduos experimentais tenha sido
definida como ik N(m; 2), ento o valor de F(e ik ) obtido por
1 (e ik m ) 2 2
F(e ik ) =
e ik
f (e
ik
)d(e ik ) =
eik
1 2
d(e ik )
Uma representao genrica para os grficos de uma distribuio normal e respectiva distribuio acumulada terica so apresentados na Figura 1 - (a) e (b), respectivamente.
Espera-se que para cada valor ik os valores obtidos para S(e ik ) e F(e ik ) sejam
bem
similares,
caso
os
resduos
experimentais
sigam
a distribuio normal especificada. por esta razo que o teste de Lilliefors se baseia na comparao destes dois valores de distribuio acumulada. Aps a ordenao em ordem crescente (j = 1, 2, ... , n) dos resduos experimentais so obtidos, para cada ik, os mdulos das diferenas entre F(e ik ) j S(e ik ) j e entre F(e ik ) j S(e ik )( j1) . O teste de Lilliefors se baseia na maior diferena absoluta encontrada. Esta diferena definida como sendo a estatstica d obtida por 194
O valor da estatstica d ento comparado com o valor tabelado dtab de acordo com o nvel de significncia e do nmero de resduos experimentais na Figura 2 apresenta as situaes com um bom ajustamento a uma distribuio normal e outra com um mal ajustamento. Nesta Figura 2, a curva representa a distribuio acumulada terica, e a escada representa a distribuio acumulada emprica.
Figura 2 Ilustraes de um bom ajuste a um mal ajuste de uma distribuio normal
Suponha os dados do Exemplo 4.1 Para comparar a produtividade de quatro variedades de milho, um agrnomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais.
Totais Mdias
1 25 26 20 23 21 115 23
4 33 29 31 34 28 155 31
Neste caso como foi utilizado o DIC temos que o modelo estatstico Yik = m + ti + eik Portanto, segundo o exposto anteriormente, so apresentados na Tabela 1 os valores observados e respectivos valores preditos residuais.
195
Anexo 6 Pressuposies ANOVA Tabela 1 Valores observados (Yik) e respectivos valores preditos ( Yik ) e resduais (ik)
Variedade Repetio Yik
Yik
e ik
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 -
A partir da Tabela 1, podemos obter as distribuies de freqncia dos valores residuais apresentadas na Tabela 2 Estas distribuies de freqncias sero denominadas daqui para frente de distribuies de freqncia empricas.
196
respectivas freqncias acumuladas tericas nas quais os resduos aparecem em ordem (j) crescente
Freqncias Empricas Freqncia Terica Acumulada F( eik )
eik
Simples
Relativa
Acumulada S( eik )
0 0.0497 0.1083 0.2050 0.3402 0.5000 0.6598 0.7950 0.8917 0.9503 0.0497 0.0583 0.0050 0.0098 0.1000 0.0598 0.1450 0.0917 0.0003 0.0003 0.0917 0.1450 0.0598 0.1000 0.0098 0.0050 0.0583 0.0497
Para encontrar o valor da freqncia terica acumulada, por exemplo, para os valores dos resduos igual a 4 e 3, foram utilizados
e ik = -4 f (e)d(e) =
4
4 1 (e 0 ) 2 5,89
2 2
1 5,89 1
d(e) = 0,0497
e d(e) = 0,1083 5,89 Para obter estes valores sem calcular estas integrais basta converter tais valores usando a distribuio normal padro ou seja, 40 e ik = -4 z = = 1,65 P(Z < -1,65) = 0,0495 5,89
e ik = -3 f (e)d(e) =
1 (e 0 ) 2 5,89
e ik = -3 z =
30 5,89
Como pode ser notado os valores no so exatamente iguais aos apresentados na Tabela 2 Isto ocorre devido as aproximaes realizadas durante o clculo. Para gerar os valores apresentados na Tabela 2, foi utilizada a funo INV.NORMP do software Excel. Para os resduos -4 e -3 foram utilizadas INV.NORMP(-4;0;2,43) e INV.NORMP(-3;0;2,43), respectivamente. 197
para os dados do Exemplo 4.1 igual a 0,1450. O respectivo valor tabelado, obtido na Tabela 3, para =5% e n=20 dtab =0,220. As hipteses para este teste so: H0: os resduos experimentais seguem uma distribuio normal Ha: os resduos experimentais no seguem uma distribuio normal Como 0,1450 < 0,220 no devemos rejeitar H0. Portanto, conclui-se que os resduos experimentais segundo o modelo estatstico adotado no diferem de uma distribuio normal. As distribuies, emprica e terica, so apresentadas na Figura 3.
Figura 3 Distribuies emprica e terica obtida para o Exemplo 4.1
Emprica 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -5 -4 -3 -2 -1 0 Resduos
Terica
Freqncia Acumulada
198
Uma avaliao visual da distribuio normal tambm pode ser realizada por meio do grfico da probabilidade normal. Neste grfico so plotados os valores da varivel normal correspondente as distribuies acumulada emprica e acumulada terica. Os valores da distribuio terica ajustam-se
perfeitamente a uma reta. Caso os resduos apresentarem distribuio normal, os valores da distribuio emprica tenderam a se concentrar em torno da reta. Para os dados do Exemplo 4.1, os valores da varivel z, correspondentes aos valores das distribuies emprica e terica, so apresentados na Tabela 4 e o grfico da probabilidade normal apresentado na Figura 4.
Tabela 4 Valores do resduo, respectivas freqncias acumuladas terica e emprica e valores da distribuio normal (Z) Resduo -4 -3 -2 -1 0 1 2 3 4 Freqncia Acumulada Emprica Terica 0.05 0.0497 0.20 0.1083 0.35 0.2050 0.40 0.3402 0.60 0.5000 0.65 0.6598 0.80 0.7950 0.95 0.8917 1.00 0.9503 Z Emprico -1.64485 -0.84162 -0.38532 -0.25335 0.253347 0.38532 0.841621 1.644854 1.644854 Terico -1.64751 -1.23563 -0.82375 -0.41188 -1.4E-16 0.411877 0.823754 1.235632 1.647509
199
Ha: pelo menos um tratamento apresenta varincia residual diferente dos demais. Em termos prticos estamos querendo verificar se o efeito do erro experimental afetou igualmente todos os tratamentos. Caso isto ocorra, as varincias dentro de tratamentos tenderam a apresentar valores bem similares, sendo, portanto, vivel a obteno de um estimador comum para a varincia dentro de tratamentos. Na anlise de varincia, o clculo do quadrado mdio do resduo o estimador comum da varincia dentro de tratamentos. Portanto, antes de interpretar os resultados da anlise de varincia faz-se necessrio realizar um teste de hipteses para a homogeneidade da varincia dentro de tratamentos. Um dos testes que podem ser utilizados o teste de Cochran. Este teste s pode ser aplicado quando o nmero de graus de liberdade for o mesmo para todas as varincias, ou seja, quando o nmero de repeties por tratamento for o mesmo. A estatstica do teste de Cochran definida como 200
C cal =
s
i=1
2 Ei
Se Ccal Ctab (, I, K1), rejeita-se H0. Caso contrrio, se Ccal < Ctab, no se rejeita H0 e conclui-se que existe homogeneidade de varincias residuais entre os tratamentos. Para os dados do Exemplo 4.1 as varincias dentro de tratamento so apresentadas na Tabela 5.
Tabela 5 Valores originais e ajustados de Y e estimativas dos efeitos do erro experimental Trat 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 4 4 4 4 4 Rep 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Yik 25 26 20 23 21 31 25 28 27 24 22 26 28 25 29 33 29 31 34 28
Yik 23 23 23 23 23 27 27 27 27 27 26 26 26 26 26 31 31 31 31 31
2 sEi
ik 2 3 -3 0 -2 4 -2 1 0 -3 -4 0 2 -1 3 2 -2 0 3 -3
2 sE1 = 6,5
2 sE2 = 7,5
2 s E3 = 7,5
2 s E4 = 6,5
O valor da estatstica de Cochran, para os dados deste exemplo, obtido por C cal = 7,5 = 0,2679 e Ctab (5%, 4, 4) = 0,6287; 6,5 + 7,5 + 7,5 + 6,5
Como Ccal < Ctab no rejeita-se H0. Portanto, considera-se satisfeita a pressuposio de homogeneidade de varincias.
201
Anexo 6 Pressuposies ANOVA A anlise grfica da homogeneidade de varincias pode ser feita por meio da disperso dos valores observados para cada nvel do fator em estudo. Para o exemplo em estudo este grfico de disperso apresentado na Figura 5. Pode ser observado que a variabilidade da produo dentro de cada variedade, tende a ser a mesma em todas as variedades.
Figura 5 Disperso das produes observadas em cada variedade
40 35 30 Produo 25 20 15 10 5 0 0 1 2 Variedade 3 4
Um exemplo em que visualmente poderamos ter um indicativo de que a varincia no a mesma para todos os tratamentos apresentado na Figura 6.
Figura 6 - Exemplo de grfico de disperso quando as varincia dentro de tratamento no homognea
8 6 4 Resduo 2 0 -2 -4 -6 -8 0 1 2 Variedade 3 4
202
-2 -3 3 0 2 -4 2 -1 0 3 4 0 -2 1 -3 -2 2 0 -3 3
203
A Figura 8 apresenta o grfico de disperso em que os erros no so independentes. Nesta Figura 8 pode-se observar que nas primeiras coletas, os valores residuais tendem a ser maiores do que nas ltimas coletas. Uma possvel explicao para isto o aprendizado na realizao do experimento.
Figura 8 Disperso dos resduos em funo da ordem de coleta
Resduo
204
Exerccios extras
1) Considere que para o Exerccio 4.7 fornecida a ordem de coleta dos valores de ganho de peso, conforme tabela abaixo
Rao Repetio Ganho de Peso Ordem A 1 7.1 2 A 2 8.9 1 A 3 6.0 4 A 4 7.0 3 B 1 6.2 7 B 2 8.8 5 B 3 4.9 6 B 4 6.1 8 C 1 6.0 12 C 2 5.0 11 C 3 9.1 10 C 4 3.9 9 D 1 11.1 16 D 2 10.8 13 D 3 10.2 15 D 4 11.9 14 E 1 7.0 19 E 2 11.3 20 E 3 10.0 17 E 4 11.7 18
a) aplicar o teste de Liliefors; b) aplicar o teste de Cochran; c) avaliar a independncia dos erros; d) traar o grfico de probabilidade normal; e) traar o grfico para avaliar a homogeneidade de varincias.
205
Anexo 6 Pressuposies ANOVA 2) Considere que para um experimento em que foram avaliados 5 tratamentos com 4 repeties no DIC sejam fornecidas as seguintes informaes
Tratamento Repetio Yik Ordem 1 1 12.1 20 1 2 2.0 2 1 3 3.0 4 1 4 1.0 1 2 1 11.2 9 2 2 11.3 10 2 3 11.5 15 2 4 11.4 12 3 1 8.1 8 3 2 8.3 11 3 3 8.4 14 3 4 8.5 16 4 1 16.1 19 4 2 10.8 5 4 3 10.2 3 4 4 11.9 7 5 1 12.0 18 5 2 11.3 12 5 3 10.0 6 5 4 11.7 17
a) aplicar o teste de Liliefors; b) aplicar o teste de Cochran; c) avaliar a independncia dos erros; d) traar o grfico de probabilidade normal; e) traar o grfico para avaliar a homogeneidade de varincias.
206
1) a) d = 0.17337 b) C = 0.33 c)
4.0 3.0 2.0
Resduo
Ordem
d)
Z Terico 3 2 1 0 0.00 -1 -2 -3
Z Emprico
Z
-4.00
-3.00
-2.00
-1.00
1.00
2.00
3.00
4.00
Resduos
e)
14 12
Ganho de Peso
10 8 6 4 2 0 0 1 2 3 4 5
Rao
207
Resduo
Ordem
d)
Z Terico 4 3 2
Z Emprico
1 0 0.00 -1 -2
-6.00
-4.00
-2.00
2.00
4.00
6.00
8.00
10.00
Resduos
e)
18 16 14
Ganho de Peso
12 10 8 6 4 2 0 0 1 2 3 4 5
Rao
208
a) Proceda a ANOVA para R1, R2, R3 e R4; b) Para um ou mais dos resultados (R1, R2, R3 e R4) a SQ para uma ou mais FV apresentou valor zero. Explique a razo de ter sido obtido tais valores iguais a zero.
R1 Repeties 1 2 3 Totais Mdias 1 100 100 100 300 100 2 100 100 100 300 100 Tratamentos 3 4 100 100 100 100 100 100 300 300 100 100
R2 Repeties 1 2 3 Totais Mdias R3 Repeties 1 2 3 Totais Mdias R4 Repeties 1 2 3 Totais Mdias 1 98 99 100 297 99 1 98 98 98 294 98 1 90 100 110 300 100
Tratamentos 2 3 4 80 70 60 100 100 100 120 130 140 300 300 300 100 100 100 Tratamentos 3 4 100 101 100 101 100 101 300 303 100 101 Tratamentos 3 4 100 101 101 102 102 103 303 306 101 102
2 99 99 99 297 99
209