Sie sind auf Seite 1von 18

Probabilidade - Testes - P2 {1. Tstes de Hiptese {1.

1 Introduo O teste de hiptese um teste estatstico que nos perite rejeitar ou no rejeit ar uma hiptese estatstica com base nos resultados de uma amostra. Essas hipteses so, em geral, sob parmetros populacionais e a realizao do teste se baseia na distribuio amostral dos respectivos indicadores. } {1.2 Conceitos Bsicos (a) } {1.3 Testes de Hipteses } {1.4. Alguns Testes de Hipteses Paramtricos {1.4.1. Teste para Comparao de Duas Varincias Populacionais (Teste F) // No tenho! } {1.4.2. Teste T de Student (a) Teste de hipotses para uma Mdia Populacional { (i) Enunciar as hipteses nula e alternativa { { H0: = 0 Ha1: =!= 0 Teste Bilateral Ha2: > 0 Teste Unilateral Direita Ha3: < 0 Teste Unilateral Esquerda } Obs.: { Se a tabela Bilateral Teste Bilateral Entrar com alfa diretamente Teste Unilateral Entrar com 2*alfa Mais utilizado. Se a tabela Unilateral Teste Unilateral Entrar com alfa diretamente Teste Bilateral Entrar com alfa/2 } } (ii) Devemos utilizar a estatstica T de Student e fixar o alfa (nv el de significncia do teste). (iii) Obteno de Regies Crticas { Supondo Ha1: =/= 0 R.R.H0 T(calc)< -T(tab) e T(calc) > T(tab) T(tab [alfa; n-1]) } (iv) Clculo com base nas evidncias amostrais T(calc) = [x(media)-0]/[s/raiz(n)]

(v) Concluso T(calc) <= T(tab) => No rejeita-se H0 T(calc) > T(tab) => Rejeita-se H0 {Ex01. Determinada firma desejava comprar cabos tendo recebido determin ada afirmao do fabricante de que a tenso mdia de ruptura de 8000 kgf. Efetuou seu ensaio com seis cabos e obteve-se tenso mdia de ruptura de 775 0 kgf com Desvio Padro de 145 kgf. Efetuar um teste de hiptese para analisar se a afirmao do fabricante verdadeira ou se a tenso de ruptura inferior informada pelo abricante ao nvel de 5% de probabilidade. 0 = 8000 kgf N = 6 x(media) = 7750 kgf S(x) = 145 kgf (i) Enunciar as Hipteses (Nula e Alternativa) H0: = 8000 Ha1 : < 8000 (ii) Devemos utilizar a estatstica T de Student e fixar o alfa = 0,05 (5%) (iii) Obteno das Regies Crticas Teste Bilateral = 1 regio crtica. (grfico boca de sino com o centro em 0 e R. R. H0. em < t(tab) e > t(tab)) T(tab 5%, 5gl) = 2,02 (iv) Clculo com base nas evidncias amstrais T(calc) = (7750-8000)/(145/raiz(6))) (v) Concluso T(calc) > T(tab) => Rejeita-se H0 ao nivel de 5% d e probabilidade pelo teste k. Portanto, a informao do fabricante falsa, uma vez que a tenso de ru tpura foi significantemente inferior a declarada pelo mesmo. } {Ex02. Para um determinado produto a durabilidade distribuiuse normalmente em 12 dias. Deseja-se investigar com base em 5 amostras se a adio d e um determinado produto tem incluencia da durabilidade mdia. Os valores obtidos para as 5 amostras foram (14,4; 12,9; 15,-13,7, 13,5). Qual sua concluso ao nivel de 1% de probabilidade? 0 = 12,0 N = 5 x(media) = 13,9 S = 0,8155 (i) H0 = = 12,0 Ha1 - =/= 12,0 (ii) Teste T e alfa = 1%

(iii) t(tab 1%, 4gl) = 4,6 (iv) t(calc) = 5,21 (v) Concluso t(tab) < t(cac) ao nvel de 1% de significancia pelo teste T. Portanto, a incluso melhorou a durabilidade do produto de melhorou a durabilidade droduto avaliado. } } (b) Teste de hipteses para Amostras Independentes { Desejamos testar: H0: x = y Ha1: x =/= y (teste Bilateral) Ha2: x > y (teste Unilateral Direia) Ha3: x < y (teste Unilateral Esquerda) Antes, devemos verificar o comportamento das varincias, ou seja, devemos aplicar um teste F: {H'0: Sx = Sy }H'a: Smaior > Smenor Duas situaes so possveis: (i) Caso A: No rejeitarmos a H'0: Sx = Sy (as variancias so homo gneas) Ao testarmos H0: x = y, devemos utilizar a seguint e estatstica t: t(calc) = [x_mdia-y_mdia]/(raiz(Sc(1/Nx+1/Ny))) ~ t (tab)(alfa;Ny;Nx), em que: Sc: Varincia Comum = [(Nx-1)Sx+(Ny-1')Sy]/(N x+Ny-2) Regra de Deciso: (a) Se t(calc) >= t(tab) => Rejeita-se H0: x = y (ii) Caso B: Rejeitamos H'0: Sx = Sy Ento ao testarmos H0: x = y, devemos utilizar a seg uinte estatstica t: t(calc)= x_mdia-y_mdia]/[sqrt(Sx/Nx+Sy/Ny)] ~ t(tab) (alfa; N*) } Obs.: Vamos adotar como regra para obteno do N*, " O maior inteiro que no ultrapasse o valor calculado". Ex.: N* = 12,85 => N* = 12,00 Ex01.

N* = [(Sx/Nx+Sy/Ny)]/{[(Sx/Nx)/(Nx-1)]+[(Sy/Ny)/(Ny-

{ Suponhamos que duas tcnicas de memorizao X e Y deve ro ser comparadas, medindo-se eficincia pelo tempo exigido para assimilar certo tipo de material. O mesmo material foi apresentado para Nx=18 e Ny=13 pessoas que estud aram o material por meio das tcnicas X e Y, respectivamente. Verificar se existe difere na significativa adotando-se alfa de 5%. Os resultado experimentais esto abaixo: Tcnica N ^mi Si X 18 20 12 Y 13 17 15 Desejamos testar: H0: x = y Ha1: x =/= y { Antes, porm, devemos avaliar as varincias, ou seja: Teste F: (i) {H'0: Sx = Sy }H'a: Sx > Sy (ii) Teste F e alfa = 5% (iii) Obteno dos pontos (ou regio) crticos: F(tab: 5%; 12 e 17) = 2,38 (iv) Clculo com base nas evidncias amostra is: F(calc) = Sy/Sx = 15/12 = 1,25 (v) Concluso: F(calc) < F(tab) => No rejei ta-se H'0 ao nvel de 5% de significncia pelo teste F. Portanto, as varincias deve m ser consideradas homogneas. Caso A } Voltando as hipteses principais: (i) {H0: x = y }Ha1: x =/= y (Teste Bilateral => alfa) (ii) Teste T e alfa = 5% (iii) Pontos crticos: t(tab)(alfa, Nx+Ny-2): t(tab)(5%; 29) = +- 2,04 (iv) Clculos t(calc) = x_mdia-y_mdia]/(raiz(Sc(1/Nx+1/Ny))) = (1 8-13)/[raiz(13,2414*(1/18+1/13))] t(calc) = 2.2651 =~ t(calc) = 2.26 (v) Concluso t(calc) > t(tab); Rejeita-se H0 ao nvel de 5% de significacia pelo teste t. Portanto existe diferen significativa en tre as tcnicas de memorizao X e Y. }

Ex02. { Desejando-se saber se duas composies de fibrocimen to X e Y so equivalentes ou se a composio X melhor que a Y (hiptese), no sentido de aumentar a resistncia dos corpos de prova, a 11 amostras utilizou-se a formulao X e 19 da formulao Y, por meio dos dados fonecidos abaixo, a que concluso podemos cheg ar se adotar-mos 5% de probabilidade. Formul. N ^mi S n X 11 66 40 11 Y 19 63 16 19

Desejamos testar: H0: x = y Ha1: x > y { Antes, porm, devemos avaliar as varincias, ou seja : Teste F: (i) {H'0: Sx = Sy }H'a: Sx > Sy (ii) Teste F e alfa = 5% (iii) Obteno dos pontos (ou regio) crticos: F(tab 5%, 10 e 18) = 2,41 (iv) Clculo com base nas evidncias amostra is: F(calc) = Sy/Sx = 40/16 = 2,50 (v) Concluso: F(calc) > F(tab) => Rejeita -se H'0 ao nvel de 5% de significncia pelo teste F. Portanto, as varincias deve m ser consideradas heterogneas. Caso B } Voltando as hipteses principais: { (i) { H0: x = y } Ha1: x > y (Teste Unilateral Direita => 2* alfa) (ii) Teste T e alfa = 5%

(iii) Pontos crticos: t(tab)(2*alfa, N*) N* = [(Sx/Nx+Sy/Ny)]/{[(Sx/Nx)/(Nx-1)]+[(Sy/Ny)/(Ny} N* = 14,73 ~14 t(tab)(2*5%,14) = t(tab)(10%,14) = 1,76 (iv) Clculos t(calc) = x_mdia-y_mdia]/[sqrt(Sx/Nx+Sy/Ny)] ~ t(tab )(alfa; N*) t(calc) = 1,4176 ~1,42

(v) Concluso t(calc) < t(tab); No rejeita-se H0 ao nvel de 5% de significacia pelo teste t. Portanto a formulao X no melhor que a form ulao Y. } } } (c) Teste de Hipotese para o caso de dados emparelhados (ou pareados, ou dependentes) { As amostras constituem dados emparelhados quando esto relacionada s duas a duas segundo algum critrio que introduz uma influencia marcante entre os diversos pa res e que supomos influir igualmente sobre os valores de cada par. Avaliaes sobre a mesma un idade experimental utilizando dois equipamentos pode ser um exemplo de dados emparelhados. Ass im considere x1i como a leitura da amostra i utilizando o equipamento 1 e x2i como a leitura par a a mesma amostra i utilizando o equipamento 2. Tomando N amostras nestas mesmas condies, podemos montar a seguint e tabela: -----------------------------------Amostra x1i x2i di=(x2i-x1i) -----------------------------------1 x11 x21 d1 2 x12 x22 d2 3 x13 x23 d3 4 x14 x24 d4 ... ... ... ... n x1n x2n dn -----------------------------------d_media = (somatria de di, i=1 a n)/n (mdia) Sd = [(somatria de di, i=1 a n)-(somatria de di, i=1 a n)/n]/(n-1) (v arincia) Sd = raiz(Sd) (desvio padro) Desejamos testar: H0: D_pop_media = 0 ou Ha1: D_pop_media > 0 (Unilateral Direita, alfa) ou Ha2: D_pop_media < 0 (Unilateral Direita, alfa) ou Ha3: D_pop_media =/= 0 (Bilateral, alfa/2) Podemos utilizar a seguinte estatstica t: t(calc) = (d_media-D_pop_media)/(Sd/(raiz(n))) = (d_media-0)/(Sd /(raiz(n))) t(calc) = (d_media)/(Sd/(raiz(n))) t(calc) ~ t(tab alfa;N-1) Regra de Deciso: (i) Se t(calc) >= t(tab) => Rejeita-se H0; (ii) Se t(calc) < t(tab) => No rejeita-se H0; Ex01. Com a finalidade de testar se um determinado mtodo de secagem rpid a consegue retirar quantidade significativa de gua de gros de cereais, uma poro de cada cereal aba ixo foi exposta ao requerido mtodo de secagem. Os resultados obtidos para o peso da

poro em gramas amostradas por cereal so apresentadas abaixo. possvel concluir ao nvel de 5% d e significncia que o mtodo de secagem proposto reduz a umidade dos gros avaliados? --------------------------------------------Milho Cevada Trigo Arroz Sorgo --------------------------------------------Sem Secagem 30 34 41 25 36 Com Secagem 21 28 33 21 31 --------------------------------------------di=(x2i-x1i) -9 -6 -8 -4 -5 { d_media = -6,4 --------------------------------------------- } Sd = 2,0736 (i) Enunciar as hipteses: H0: D_pop_Media = 0 Ha1: D_pop_Media < 0 (Unilateral esquerda) (ii) Enunciar Estatstica a ser utilizada e significncia Teste t e alfa = 5% (iii) Obteno de regies crticas A tabela Unilateral esquerda, logo, h uma regio crtica. t(tab(2*alfa=5%,4)) = 2,13 (iv) Clculos com base em evidncias amostrais t(calc) = (d_media)/(Sd/(raiz(n))) = -6,9014 ~ -6,90 (v) t(calc) > t(tab) Concluso: Rejeita-se a H0 ao nvel de 5% de probabilidade pelo test e T. Portanto, o mtodo de secagem rpida reduziu significantivamente a umidade dos gros avali ados. } }

{1.4.3. Testes de Hipteses para Proporo (ou Propores) [n >= 200] // S ver as aplica e esto aqui. (a) Teste de Hipteses para uma Proporo { (i) Enunciar a hiptese nula e as hipteses alternativas H0: p = p0, onde p0 chamado de valor paramtrico/referncia ou Ha1: p > p0 (Teste Unilateral Direita) ou Ha2: p < p0 (Teste Unilateral Esquerda) ou Ha3: p != p0 (Teste Bilateral) (ii) Determinar estatstica e nvel de significncia do teste Dado o elevado nmero de objetos avaliados (n >= 200), uti liza-se a Distribuio Normal Padro X~N(0,1) e fixar o alfa. (iii) Obteno de regio(es) crtica(s) Supondo a Ha3: p != p0. Nesta situao a nossa Distribuio Normal Padro assume 2 Regies e Rejeio de Hipteses Nulas. Logo o alfa est dividido igualmente nessas regies. Portanto, subtrai-s e dos 50% de cada R. R. H0. meio alfa. Ex.: alfa = 5% -> Z(Bilateral, 5%) = 47,5% = 1,96 alfa = 1% -> Z(Bilateral, 1%) = 49,5% = 2,57

Supondo a Ha1: p > p0 ou Ha2: p < p0. Nesta situao a nossa Distribuio Normal Padro assume 2 Regies e Rejeio de Hipteses Nulas. Logo o alfa est distribuido em apenas um lado do grfico. Ex.: alfa = 5% -> Z(Unilateral, tab(5%)) = 45,0% = 1,64 alfa = 1% -> Z(Unilateral, tab(1%)) = 49,0% = 2,32 (iv) Clculo com base nas evidncias amostrais Z(calculado) = (^p - p0)/raiz(p0*(1-p0)/n) (v) Concluso (a) Z(calculado >= Z(tab) -> Rejeita-se a H0. (b) Z(calculado < Z(tab) -> No rejeita-se a H0. Ex01. Uma empresa sabe que para lanar um produto novo no mercado e ter lucro a aceitao deve ser de pelo menos 60%. Aps uma pesquisa de opiniao, voce verificou que em 1000 entrivist ados, 530 aprovaram o produto. Teste a Hiptese de que o produto a ser lanado atend e regra prtica acima descrito ao nvel de 5% de significncia. p0 = 0,60 ^p = 0,53 alfa = 5% (i) Enunciar a hiptese nula e as hipteses alternativas {H0: p = 0,60 }Ha1: p!= 0,60 Teste Bilateral (ii) Determinar estatstica e nvel de significncia do teste Distribuio N(0,1) e alfa = 0,05 (iii) Obteno de regies crticas Z(Bilateral, 5%) = 1,96 (Desenhar o grfico) (iv) Clculo com base nas evidncias amostrais Z(calculado) = (^p - p0)/raiz(p0*(1-p0)/n) Z(calculado) = (0,53 - 0,6)/raiz(0,60*(1-0,60)/1000) Z(calculado) = -4,52 Z(calculado) = 4,52 (v) Concluso Z(calculado) >= Z(tab) -> Rejeita-se a H0 ao nivel de 5% de significncia pelo teste para uma proporo. Portanto, o produto no deve ser lanado no mercado. } (b) Teste de Hipteses { (i) Enunciar a H0: p ou Ha1: p ou Ha2: p ou Ha3: p para Duas Propores hiptese nula e = p0, onde p0 > p0 < p0 != p0 (Teste as hipteses alternativas chamado de valor paramtrico/referncia (Teste Unilateral Direita) (Teste Unilateral Esquerda) Bilateral)

(ii) Determinar estatstica e nvel de significncia do teste Utilizar a Distribuio Normal Padro X~N(0,1) para N1 e N2 ma iores que 200 e fixar o alfa.

(iii) Obteno de regio(es) crtica(s) (igual ao de cima) Supondo a Ha3: p != p0. Nesta situao a nossa Distribuio Normal Padro assume 2 Regies e Rejeio de Hipteses Nulas. Logo o alfa est dividido igualmente nessas regies. Portanto, subtrai-s e dos 50% de cada R. R. H0. meio alfa. Ex.: alfa = 5% -> Z(Bilateral, 5%) = 47,5% = 1,96 alfa = 1% -> Z(Bilateral, 1%) = 49,5% = 2,57 Supondo a Ha1: p > p0 ou Ha2: p < p0. Nesta situao a nossa Distribuio Normal Padro assume 2 Regies e Rejeio de Hipteses Nulas. Logo o alfa est distribuido em apenas um lado do grfico. Ex.: alfa = 5% -> Z(Unilateral, tab(5%)) = 45,0% = 1,64 alfa = 1% -> Z(Unilateral, tab(1%)) = 49,0% = 2,32 (iv) Clculo com base nas evidncias amostrais Z(calculado) = (^p1-^p2)/raiz(^p(1-^p)(1/N1 + 1/N2)) Em que: ^p1 = frequncia relativa assosciada ao evento 1 na amostr a avaliada (X1/N1) ^p2 = frequncia relativa assosciada ao evento 2 na amostr a avaliada (X2/N2) ^p = (X1+X2)/(N1+N2) (v) Concluso (a) Z(calculado >= Z(tab) -> Rejeita-se a H0. (b) Z(calculado < Z(tab) -> No rejeita-se a H0. Ex01. Deseja-se testar se so iguais as propores de aceitacao de determina do produto entre homens e mulheres.Os resultados abaixo referem-se amostras alea trias independentes que aprovam o produto X e Y. X1 = 70 X2 = 50 N1 = 200 N2 = 200 Existe diferena significativa entre as percentagens de aceitao ao nv el de 5% de probabilidade? (i) {H0: p1=p2 }Ha1: p1!=p2 (ii) Distribuio N(0,1) e alfa = 0,05 (iii) Z(tab(Bilateral, 5%)) = 1,96 (Desenhar o grfico) (iv) ^p1 = X1/N1 = 70/200 = 0,35 ^p2 = X2/N2 = 50/200 = 0,25 ^p = (X1+X2)/(N1+N2) = (70+50)/(200+200) = 0,30 Z(calculado) = (^p1-^p2)/raiz(^p(1-^p)(1/N1 + 1/N2)) Z(calculado) = (0,35-0,25)/raiz(0,30*0,70*(1/200+1/200)) Z(calculado) = 2,18 Z(calculado) = 2,18 (v) Z(calculado) > Z(tab) -> Rejeita-se o H0 ao nvel de 5% de s ignificncia pelo teste para Duas Propores. Portanto, as propores de aceitao difere entre homens e mulhe

res. } } }

{1.5. Alguns Testes de Hipteses No-Paramtricos {1.5.1. Introduo Os testes so aplicados a todos os ramos da cincia. A aplicao dessas tcnicas n exige nenhuma suposio quanto distribuio da varivel da qual se tenha retirado a amostra para anlise. Podem ser aplicados a dados que se disponham em ordem ou mesmo para variveis nominais. Normalmente exigem poucos clculos e so aplicveis em anlises de pequenas amostras (n<30) so extremamente interessantes para anlises de dados qualit ativos. } {1.5.2. Teste Qui-Quadrado (X) {(a) Teste Qui-Quadrado de Adequao ao Ajustamento {Introduo Seja E um experimento aleatrio. Sejam E1, E2, ..., Ek, k eventos associados a E. Sejam fo1, fo2, ..., fok frequncias observadas (fo) nos k eventos. Seja fE1, fE2, ..., fEk , frequncias esperadas (ou tericas) (fE) nos k eventos. A ideia realizar um teste estatstico para verificar se as discrepn cias entre as fo e as fE so devidas ao acaso ou se realmente so atribudas aos fatores em anlise. } {Procedimento para realizao do teste (i) Enunciar as hipteses h0 e Ha da seguinte forma: {H0: dever afirmar que no h discrepncias emtre foi e fEi. }Ha: dever afirmar que h discrepncias entre foi e fEi. (ii) Distribuio (ou Teste) de Qui-Quadrado (X) e fixar alfa. (iii) Obteno da regio crtica Ver grfico (iv) Clculo com base nas Evidncias Amostrais X(calculado) = somatrio_(i=1 at k)[(foi-fEi)/fEi] (v) Concluir utilizando a regra de Deciso (a) X(calc) >= X (tab) -> Rejeita-se o H0. (b) X(calc) < X (tab) -> No rejeita-se o H0. } {Ex01. Em 100 lanamentos de uma moeda, observaram 65 caras e 35 coroas. T estar a hiptese da moeda ser honesta = 5% (i) Enunciar as Hipteses nula e alternativa {H0: A moeda honesta. }Ha1: A moedas no honesta (ii) Dustrubuio X e alfa = 0,05 (iii) Obteno da regio crtica X(tab(alfa,psi)) = X(tab(5%, 1)) = 3,841 (iv) Clculo com Base nas Evidncias amostrais Classes foi fEi (foi-fEi) (foi-fEi) i (foi-fEi)/fE

Cara Coroa

65 35

50 50

15 -15

225 225

4,5 4,5

X(calculado) = somatrio_(i=1 at k)[(foi-fEi)/fEi] X(calculado) = [(65-50)/50 + (35-50)/50] = 9,0 (v) Concluso X(calculado) > X(tab) -> Rejeita-se o H0 ao nvel de 5% de p robabilidade pelo Teste X de Adequao ao Ajustamento. Portanto, a moeda no honesta. } {Ex02. Deseja-se testar se o nmero de acidentes em determinada rodovia di stribui-se igualmente pelos dias da semana. Para tanto foi realizado o levantamento abaixo. Com base nesses dados utilize um teste desses bitos utilizando um teste de hiptese usando alfa = 5%. Dia otal N Acid. 33 26 21 22 17 20 36 175 (i) Enunciar as hipteses (nula e alternativa) {H0: Os acidentes so igualmente distribuidos durante a se mana. Ha: Os acidentes so igualmente distribuidos durante a se mana.} (ii) Distribuio X e alfa = 0,05. (iii) Obteno da Regio Crtica X(tab(5%, 6) = 12,592 (iv) Clculo com base nas evidncias amostrais X(calculado) = [(33-25)/25 + (26-25)/25 + (21-25)/25 + (22-2 5)/25 + (17-25)/25 + (20-25)/25 + (36-25)/25] X(calculado) = 12,00 (v) Concluso X(calculado) < X(tab) -> No rejeita-se a hiptese nula ao nvel de 5% de probabilidade pelo Teste X de Adequao ao Ajustamento. Portanto, os acidentes so igualment e distribuidos durante a semana. } } {(b) Teste Qui-Quadrado de Associao (ou Independncia) { Introduo Outra importante aplicao do teste Qui-Quadrado ocorre quando se qu er estudar a associao ou a dependncia entre duas variveis. A representao das frequncias observadas dada por uma tabela de dupla entrada ou tab ela de contingencia. O clculo das frequncias esperadas (fd(ij)) fundamenta-se na definio de variaveis aleatrias independentes, conforme visto no capt ulo de probabilidades. Sabe-se que X e Y so independentes se adistribuio conjunta de X e Y igual ao produto das distribuies marginais de X e de Y, ou seja P(Xi Yi) = P(Xi)*P(Yi), para todo i = 1, 2, ..., n. O Teste Qui-Quadrado de Associao ou de Independencia aconselhvel qu ando o tamanho da amostra razoavelmente grande e deve ser aplicado com maior cuidado se existirem frequncias esperadas menores que 5. Neste ca Dom. Seg. Ter Qua Qui Sex Sab T

so (fE(ij)<=5), a soluo juntar classes adjacentes evitando-se fE(ij) menores que 5. Quando uma das variveis possui nveis que contemplam todas as ca tegorias da populao (por exemplo, sexo: masculino e feminino), o teste denominado 'Teste de Homogeineidade'. Sempre que as variveis em e studo forem associveis, de interesse saber o grau de associao entre elas. Um indicador que pode ser utilizado com esta finalidade o coeficien te de contingncia que dado por C = raiz(X(calculado)/(X(calculado)+N)). Este coeficiente pode variar entre 0 e 1 estando mais associado s variv eis quanto maior o valor de C. O limite superior deste coeficiente depende do tamanho da tabela de contigncia. Assim, para tabelas 2x2 o mximo d e C 0,7071, sendo maior para tabelas maiores. } { Procedimentos para realizao do teste: (i) Enunciar H0 e Ha da seguinte forma: {H0: A varivel X independente da varivel Y; Ha: A varivel X no independente da varivel Y;} (ii) Distribuio X e fixar alfa. (iii) Obteno da Regio Crtica X(tab(alfa,psi)), com Psi = (Linhas-1)*(Colunas-1)gl. (iv) Clculo com base nas evidncias amostrais L C X(calculada) = somatrio{somatrio)[(fo(ij)-fe(ij))/fe(ij)]} i=1 j=1 fo(ij) = fE(ij) = [(Soma da Linha i)*(Soma Coluna j)]/(Total de O bservaes) (v) Concluir utilizando a regra de deciso: (a) Se X(calculado) >= X(tab( => Rejeita-se H0. (b) Se X(calculado) < X(tab( => No rejeita-se H0. } { Ex01. Testar ao nvel de 5% de probabilidade se existe associao entre pref erncia de sabor de sucos e supermercados de avaliao. O dados so fornecidos abaixo: Supermercado Sabores A B C Totais Limo Laranja Abacaxi Morango Totais 70 50 10 20 150 44 30 06 20 100 86 45 34 85 250 200 125 50 125 500

(i) {H0: Os sabores independem do supermercado avaliado; Ha: Os sabores dependem do supermercado avaliado;} (ii) Distribuio X e alfa = 0,05 (iii) Obteno de Regio Crtica

Psi = (L-1)(C-1) gl Psi = (4-1)(3-1) gl Psi = 3*2 = 6 gl X(tab(0,05, 6)) = 12,592 (iv) Clculo com base em evidncias amostrais L C X(calc) = somatrio{somatrio)[(fo(ij)-fe(ij))/fe(ij)]} i=1 j=1 fE(1,1) fE(2,1) fE(3,1) fE(4,1) fE(1,2) fE(2,2) fE(3,2) fE(4,2) fE(1,3) fE(2,3) fE(3,3) fE(4,3) = = = = = = = = = = = = (200*150)/500 (125*150)/500 ( 50*150)/500 (125*150)/500 (200*100)/500 (125*100)/500 ( 50*100)/500 (125*100)/500 (200*250)/500 (125*250)/500 ( 50*250)/500 (125*200)/500 = = = = = = = = = = = = 60,00 37,50 15,00 37,50 40,00 25,00 10,00 25,00 100,00 62,50 25,00 62,50

X(calc) = [(70-60)/60 + (44-40)/40 + ... + (85-62,5)/62,5] X(calc) = 37,88 (v) Concluso X(calc) > X(tab) => Rejeita-se a H0 ao nvel de 5% de probab ilidade pelo teste Qui-quadrado. Portanto a preferncia pelos sabores depende do supermercado av alliado. O Grau de associao pode ser avaliado por C(coeficiente de contingncia): C = raiz[(X(calc))/(X(calc)+N)] C = raiz[37,88/(37,88+500)] C = 0,2654 = 26,54% } { Ex02. Verificar se existe associao entre dias da semana e nmero de peas pr oduzidas por duas mquinas. Adote alfa = 1%. Dias Mquinas Totais 24 76 100 ana. Ha: As peas produzidas pelas mquinas independem do dia da semana.} (ii) Teste qui-quadrado e alfa = 0,01. Totais 400 1 124 2 276 72 28 44 120 42 78 108 30 78 S T Q Q

(i) {H0: As peas produzidas pelas mquinas independem do dia da sem

(iii) Regio crtica Psi = (2-1)(4-1) = 1*3 = 3 gl X(tab(1%, 3 gl) = 11,345 (iv) Clculo com base em evidncias amostrais L C X(calc) = somatrio{somatrio)[(fo(ij)-fe(ij))/fe(ij)]} i=1 j=1 fE(1,1) fE(1,2) fE(2,1) fE(2,2) fE(3,1) fE(3,2) fE(4,1) fE(4,2) 69)/69] X(calc) = 5,81 (v) Concluso X(calc) < X(tab) => No rejeita-se H0 ao nvel de 1% de probab ilidade pelo Teste Qui-Quadrado. Portanto as peas produzidas pelas mquinas independem do dia da semana aval iado. } } } {1.5.3. Teste de Main-Whitney {Introduo usado para testar se duas amostras independentes foram retiradas de populaes de mdias iguais uma interessante alternativa ra o teste paramtrico para igualdade de duas mdias, uma vez que no existe nenhuma considerao sobre as distribuies populacionais e suas varincias. } {(i) Organizao dos dados: (a) N1 = sempre menor conjunto de dados e N2 = sempre maior conj unto de dados. (b) Considere todos os dados dos dois grupos e coloque-os em ord em crescente. Atribua 1 ao score (valor) que algebricamente for menor e prossiga at N = N1+N2. Em casos de obs ervaes empatadas, atribua a mdia dos postos correspondentes. (c) Calcular R1 = (Soma dos postos associados a N1) e R2 = (Soma dos postos associados a N2) (d) Escolher a menor soma entre R1 e R2. (e) Calcular a estatstica: U1 = N1*N2+[N1(N1+1)/2]-R1 ou U2 = N1*N2+[N2(N2+1)/2]-R2 } {(ii) Procedimentos para realizao do teste (a) Enunciar as hipteses {H0: Afirmaremos que no h diferena entre os grupos. Ha: Afirmaremos que h diferena entre os grupos. Bilateral )} (b) Distribuio N(0,1) e fixar alfa. (c) Obteno de regies crticas = = = = = = = = (124* 72)/400 (276* 72)/400 (124*120)/400 (276*120)/400 (124*108)/400 (276*108)/400 (124*100)/400 (276*100)/400 = = = = = = = = 22,32 49,68 37,20 82,80 33,48 74,52 31,00 69,00

X(calc) = [(28-22,32)/22,32 + (42-37,20)/37,20 + ... + (76-

alfa = 5% -> Z(Bilateral, 5%) = 47,5% = 1,96 alfa = 1% -> Z(Bilateral, 1%) = 49,5% = 2,57 (d) Clculo com base nas evidncias amostrais Z(calc) = [(Ui - mi(U))/sigma(u)], em que mi(u) = N1*N2 /2 e sigma(u) = raiz([N1*N2*(N1_N2+1)]/12) (e) Concluso Se Z(calc) >= Z(tab) => Rejeita-se a H0. } {Ex01. Determine, ao nvel de 5% de probabilidade se as vendas de determi nado produto em dois shoppings so diferentes. Shopping 1 10 (11) 18 (19) 09 (8,5) 08 (6,5) 02 (01) 11 (13) 04 (03) 03 (02) 09 (8,5 12 (14) 10 (11) N2 = 11 R2 = 97,5 Shopping 2 22 17 15 10 07 07 08 14 15 ------------N1 = 9 R1 = 112,5 (20) (18) (16,5) (11) (4,5) (4,5) (6,5) (15) (16,5)

{Resoluo {(i) Organizao: U2 = N1*N2+[(N2(N2+1)/2]-R2 U2 = 9*11+[(11(11+1)/2 - 97,5 = 67,50 } {(ii)Procedimentos: (a) {H0: No h diferena entre os shopping e z para o produto em ques to. Ha: H diferena entre os shopping e z para o produto em qu esto.} (b) Distribuio N(0,1) e alfa = 0,05. (c) Regies crticas: Z(tab(5%)) = 1,96 (d) Calculo com base nas evidncias amostrais {Z(calc) = Ui-mi(u)/sigma(u), em que: mi(u) = N1*N2/2 - 9,11/2*2 = 49,50 Sigma(u) = raiz[(N1*N2*(N1+N2+01)/12)] = raiz(9*11*(9+11 +1)/12) = 13,16 Z(calc) = (67,5-49,5)/13,16 = 1,37} (e) Concluso Z(calc) < Z(tab) => N rejeita-se o H0 ao nvel de 5% de p robabilidade pelo Teste de Mann-Whiteney. Portanto no h diferena significativa entre as vendas de determinado pr oduto, entre os shoppings avaliados. } } } } {1.5.4. Teste de Kruskal-Wallis {Introduo Trata-se de um teste extremamente til para se testar se k amostra s (k>2) independentes provm de populaes com mdias iguais.

} {(i) Organizao dos dados: (a) Ordenar de forma crescente as observaes de todos os k eventos, atribuindo-lhes postos de 1 a n. Em caso de empate atribuir o posto mdio. (b) Obter o valor da soma dos postos para cada um dos k grupos, ou seja, obter os Ri, com i = 1, 2, ..., k. } {(ii) Procedimentos para realizao do teste (a) Enunciar as hipteses {H0: No h diferena entre os grupos Ha: H diferena entre, pelo menos, dois grupos} (b) Distribuio Qui-Quadrado e fixar o alfa. (c) Obteno de regio crtica x (tab(alfa, k-1)). (d) Clculo com base nas evidncias amostrais H = [12/(N(N+1))*somatrio_(i=1 at k)[(Ri)/Ni]-3(N+1)] (e) Concluso Se H >= Z(tab) => Rejeita-se a H0. Se H < Z(tab) => No rejeita-se a H0. } {Ex01. Foram avaliados trs equipamentos similares de marcas distintas co m relao aos valores obtidos. Verificar a hiptese de igualdade das mdias ao nvel de 5% de probabilidade utilizando o te ste de Kruskal-Wallis. Os dados do experimento encontram-se abaixo: Amostras A B C 1 65(08,0) 60(02,5) 61(04,0) 2 3 4 5 6 -Ni 5 Ri 39,5 39,5 57 5 6 62(05,0) 68(11,0) 70(13,0) 60(02,5) -71(14,0) 66(09,0) 63(06,0) 64(07,0) 69(12,0) 67(10,0) 72(15,0) 74(16,0)

59(01,0)

{Resoluo {(i) Organizao dos dados: Vide tabela acima } {(ii) Procedimentos para realizao do teste: (a) Enunciar as hipteses {H0: No h diferena entre os grupos Ha: H diferena entre, pelo menos, dois grupos} (b) Distribuio Qui-Quadrado e alfa = 5%. (c) Obteno de regio crtica x(tab(5%, 2)) = 5,99. (d) Clculo com base nas evidncias amostrais H = [12/(N(N+1))*somatrio_(i=1 at k)[(Ri)/Ni]-3(N+1 )]

H = [12/16(16+1)*somatrio_(i=1 at k)[(Ri)/Ni]-3(16+ 1)] H = [12/272]*((39,5/5)+(39,5/6)+(57/5))-3*17 H = 2,90 (e) Concluso Se H < Z(tab) => No rejeita-se a H0 ao nvel de 5% de probabilidade pelo Teste de Kruskal-Wallis. Portanto, no h diferenas entre os equipamentos avaliados. } } } } } } {2. Contraste {2.1 Definio (a) Contraste Considere a seguinte funo linear entre as mdias de tratamentos: Y = a1*m1 = a2*m2 + ... + an*mn Y ser um contraste se a soma dos coeficientes ai, com i variando de 1 a n, seja nula. (b) Estimador do Contraste Na prtica, no conhecemos ^mi, mas sim seus estimadores obtidos por meio de experimentos ou ensaios. Assim, na prtica, trabalhamos com o estimador do contraste, que dado por: ^Y = a1*^m1 + a2*^m2 + ... + an*^mn ^Y ser estimador do contraste Y se a soma dos coeficientes ai, co m i variando de 1 a n, seja nula. {Ex01. Considere os dados de um experimento com 4 tratamentos e 5 repet ies por tratamento. # Tratamento ^mi (km) 1 Programa A 53,5 2 Programa B 56,5 3 Programa A + Filtro X 62,0 4 Programa B + Filtro X 60,4 {Resoluo (1) Aplicao de filtro, independente do programa, vantajosa ? ^Y1 = ^m1+^m2-^m3-^m4 ^Y1 = 53,5+56,5-62,0-60,4 ^Y1 = -12,4 Quando no se utiliza filtro, qual programa melhor (qu programa)? ^Y2 = ^m1-^m2 ^Y2 = 53,5-56,5 ^Y2 = -3,0 Quando se utiliza o filtro X, qual programa melhor ( o programa)? ^Y3 = ^m3-^m4 ^Y3 = 62,0-60,4 ^Y3 = 1,6

(2) anto maior a rea, melhor o

(3) quanto maior a rea, melhor

} } (c) Varincia de um Contraste Considere o estimador do Contraste Y dado por:

^Y = a1*m1 = a2*m2 + ... + an*mn A varincia do Contraste : V(^Y) = V(a1*m1 = a2*m2 + ... + an*mn) Admitindo independncia das mdias dos tratamentos: V(^Y) = V(a1*^m1) + V(a2*^m2) + ... + V(an*^mn) V(^Y) = a1*V(^m1) + a2*V(^m2) + ... + an*V(^mn) A Varincia da mdia amostral : V(^mi) = (sigma_i)/ri V(^Y) = a1*(sigma_1)/r1 + a2*(sigma_2)/r2 + ... + an*(sigma_n )/rn Admitindo-se homogeneidade de varincias entre os tratamentos, ou seja, } }