Sie sind auf Seite 1von 17

2.4 EXERCICIOS RESOLVIDOS 1) A tabela abaixo mostra o resultado de uma pesquisa com 10 famlias de determinada regio.

Famlias Renda (R$) Poupana (R$) N de Filhos Mdia de Anos de Estudo da famlia A B C D E F G H I J 10 15 12 70 80 100 20 30 10 60 4 7 5 20 20 30 8 8 3 15 8 6 5 1 2 2 3 2 6 1 3 4 5 12 16 18 8 8 4 8

a) Calcular ao coeficiente de correlao Linear entre a renda familiar e a poupana. Soluo: RENDA (Y) POUPANA (X) X2 10 15 12 70 80 100 4 7 5 20 20 30 16 79 25 400 400 900 Y2 100 225 144 4.900 6.400 10.000 XY 40 105 60 1.400 1.600 3.000

20 30 10 60 y =407

8 8 3 15 x =120

64 64 9 225

400 900 100 3.600

160 240 30 900

x2=2.152 y2=26.769 xy=7.535

Aplicando na Frmula :

r = (10 x 7.535 ) (120 x 407 = 0,9835 (10x2.152) 1202 10x26.769 -4072 Existe uma forte correlao linear entre renda e a poupana familiar. O sinal do coeficiente mostra que as duas variveis variam no mesmo sentido. b) Calcular o coeficiente de correlao linear entre renda e nmeros de filhos para as dez famlias. Soluo: Renda (y) N de filhos (x) X 2 10 15 12 70 80 100 20 30 10 60 8 6 5 1 2 2 3 2 6 1 64 36 25 1 4 4 9 4 36 1 Y2 100 225 144 4.900 6.400 10.000 400 900 100 3.600 XY 80 90 60 70 160 200 60 60 60 60

407

36

184

26.769

900

y = 407 x = 36

x2 =184 y2 = 26.769 xy = 900

Aplicando a frmula obtemos:

r = (10 x 900) (36 x 407) = - 0,758 (10x184) 362 10x 26.769 -4072 O resultado revela uma correlao forte e inversa (negativa), ou seja, as famlias com maiores rendas tm menor nmero de filhos. 3.2 EXEMPLO RESOLVIDO Os dados abaixo referem-se ao volume de precipitao pluviomtrica (mm) e ao volume de produo de leite tipo C (milhes de litros), em determinada regio do pas. 1. Ajustar os dados atravs de um modelo linear 2. Admitindo-se, em 1980, um ndice pluviomtrico de 24 mm, qual dever ser o volume esperado de produo do leite tipo C?

Anos Produo de leite (1.000.000 l) ndice Pluviomtrico (mm) 1970 26 1917 25 1972 31 1973 29 1974 27 1975 31 1976 32 1977 28 23 21 28 27 23 28 27 22

1978 30 1979 30

26 25

Soluo: Y 26 25 31 29 27 31 32 28 30 30 X 23 21 28 27 23 28 27 22 26 25 X2 529 441 784 729 529 784 729 484 676 625 XY 598 525 868 783 621 868 864 616 780 750

y = 289 x = 250 x2 =6.310 xy = 7.273

I Determinar o valor do Parmetro b

b = (10x7.273)- (250x289) = 0,8 (10x6.310) 2502

II Determinar o valor do Parmetro a

a = 289 - 0,8. 250 = 8,9 10 10 III Equao da Reta Ajustada y = a + bx y = 8,9 +0,8x b) fazendo x = 24 mm temos: y = 8,9 +0,8x24 = 28,1. De acordo co o modelo, podemos esperar 28,1 milhes de litros produzidos para um ndice pluviomtrico de 24 mm.

Exemplo 1 Supondo uma coleo de irmandades, com N = 16, filhos de casais com um cnjuge afetado por uma anomalia endgena. 4 dentre os filhos tambm apresentam a doena. A caracterstica obedece o padro de transmisso autossmico, dominante e monognico? A genealogia seria:

Em 16 filhos espera-se 8 normais e 8 anormais. Mas foram observados 12 normais e 4 anormais. Obtm-se o valor de Qui quadrado: = [(12 - 8)2 / 8 + (4 - 8)2 / 8] = 2 + 2 = 4 Simplesmente analisando o valor de concluiria-se que como maior que (3,841) os desvios no so devidos ao acaso. Portanto, conclui-se que a doena no obedece o padro de transmisso autossmico, dominante e monognico. Entretanto, deve-se reparar que: N menor que 40 e o valor de Qui Quadrado obtido maior que o crtico Portanto, deve-se aplicar a correo de Yates: = [ (| o1 - e1 | - 0,5)2 / e1 + (| o2 - e2 | - 0,5)2 / e2)] = [( | 12 - 8 | - 0,5)2 / 8 + ( | 4 -8 | - 0,5)2 / 8)] = 1,51313 + 1,51313 = 3,062 importante notar que agora, aps ter sido aplicada a correo, deciso a que o teste permite chegar. < , ou seja, ser alterada a

Portanto, aceita-se que os desvios so devidos ao acaso. Assim, conclui-se que a doena obedece o padro de transmisso autossmico, dominante e monognico. Exemplo 2 Suponha que numa cidade X foram coletados os dados abaixo relacionando sexo do indiv'iduo com a alergia a plen. Sexo / Tem alergia? Mulheres Homens Total Sim 10 13 23 No 9 2 11 Total 19 15 34

Para calcular os esperados multiplica-se os totais parciais relativos a cada casela e divide-se pelo total geral (N). Depois calcula-se os qui quadrados parciais utilizando (o-e)2 /e. Depois, calcula-se a parcela de referente a cada casela. Ao final, soma-se as parcelas e obtm-se o : Sexo / Tem alergia? Tem alergia Mulheres 10 Esp 12,85 0,6333 (o-e)2 /e Homens Esp (o-e)2 /e Total 13 10,15 0,8021 23 No tem alergia 9 6,15 1,3241 2 4, 85 1,6772 11 = 4,4367 Total 19

15

34

= 0,6333 + 0,8021 + 1,3241 + 1,6772. Portanto,

Como o nmero de GL em tabelas 2x2 GL = (2 - 1) x (2 - 1) = 1, percebe-se que 3,841. Como obtido maior que o crtico os desvios no so devidos ao acaso. Portanto, concluiria-se que a alergia depende do sexo. Entretanto, deve-se reparar que: N menor que 40, o valor de Qui Quadrado obtido maior que o crtico e h pelo menos uma classe com nmero de esperados menor que 5. Portanto, deve-se aplicar a correo de Yates: Amostra Fuma Mulheres 10 = [( | on - en | - 0,5)2 / en )] No fuma Total 9 19

Esp (o-e)2

12,8529 /e 0,4307

6,1471 0,9006 2 4, 8529 1,1408 11 15

Homens 13 Esp 10,1471 (o-e)2 /e 0,5456 Total 23

34 = 3,0178 < , ou seja, ser alterada a

= 0,4307 + 0,5456 + 0,9006 + 1,1408. Portanto,

Novamente, ressalta-se que agora, aps ter sido aplicada a correo, deciso a que o teste permite chegar.

Nesse caso, aceita-se que os desvios so devidos ao acaso e conclui-se que a alergia no depende do sexo. Para facilitar os clculos utilize uma planilha especial: Qui Quadrado, em tabelas de contingncia, com ordem at 2 x 2, com correo de Yates Copie a planilha comprimida em formato xls ou em ods Exemplo Em 3 amostras de filhos de casais MN, obteve-se: Amostras MM MN NN Total Propores 1/4 1/2 1/4 esperadas Belm - PA 19 Macei - 18 AL So Carlos 8 - SP Total 38 25 23 23 17 9 80 60 40

45 86 49 180 Nota: Total construda somando-se os elementos de cada classe

Pergunta-se: As amostras so homogneas? Nesse caso, deve-se calcular o para cada amostra, a partir de propores esperadas (MM = 1/4, MN = 1/2 e NN = 1/4), obtendo-se: Amostras Belm - PA Clculo do (19-20)2 /20 + (38-40)2 /40 + (23-20)2 /20 0,600 GL 2

Macei - AL

(18-15)2 /15 + (25-30)2 /30 + (17-15)2 /15 1,700

So Carlos - SP ( 8-10)2 /10 + (23-20)2 /20 + ( 9-10)2 /10 0,950 Total Para obter a 1. Calcula-se o 2. Soma-se os

2 3,250 2 (45-45)2 /45 + (86-90)2 /90 + (49-45)2 /45 0,534 = obtidos em cada classe e os seus G.L.:

basta somar os valores de

e GL de cada amostra, inclusive de "Total" obtidos ( esse valor chamado ) e tambm os GL

0,600 + 1,700 + 0,950 = 3. Subtrai-se o

= 3,250

e GL = 2 + 2 + 2 = 6. (= -

do "Total" da somatria de

3,250 - 0,534 = 2,716 e GL = 6 - 2 = 4.

Portanto,

= 2,716. crtico = 9,488.

Na tabela verifica-se que

Conclui-se que, como o valor de

calculado menor que o de

aceita-se que os desvios so

devidos ao acaso, no sendo significativos. Portanto as amostras so homogneas. Exemplo Em 3 amostras de filhos de casais MN, obteve-se: Amostras MM MN NN Total Propores 1/4 1/2 1/4 esperadas Belm - PA 19 Macei - 18 AL So Carlos 8 - SP Total 38 25 23 23 17 9 80 60 40

45 86 49 180 Nota: Total construda somando-se os elementos de cada classe

Pergunta-se: As amostras so homogneas? Nesse caso, deve-se calcular o para cada amostra, a partir de propores esperadas (MM = 1/4, MN = 1/2 e NN = 1/4), obtendo-se:

Amostras Belm - PA Macei - AL

Clculo do (19-20)2 /20 + (38-40)2 /40 + (23-20)2 /20 0,600 (18-15)2 /15 + (25-30)2 /30 + (17-15)2 /15 1,700

GL 2 2

So Carlos - SP ( 8-10)2 /10 + (23-20)2 /20 + ( 9-10)2 /10 0,950 3,250 2 Total 2 (45-45)2 /45 + (86-90)2 /90 + (49-45)2 /45 0,534 = Para obter a 1. Calcula-se o 2. Soma-se os basta somar os valores de obtidos em cada classe e os seus G.L.:

e GL de cada amostra, inclusive de "Total" obtidos ( esse valor chamado ) e tambm os GL

0,600 + 1,700 + 0,950 = 3. Subtrai-se o

= 3,250

e GL = 2 + 2 + 2 = 6. (= -

do "Total" da somatria de

3,250 - 0,534 = 2,716 e GL = 6 - 2 = 4.

Portanto,

= 2,716. crtico = 9,488.

Na tabela verifica-se que

Conclui-se que, como o valor de

calculado menor que o de

aceita-se que os desvios so

devidos ao acaso, no sendo significativos. Portanto as amostras so homogneas. Exemplo Foram observados os seguintes nmeros de tripanossomos em 128 campos de um hemocitmetro Tripanossomos Freq. Obs. Freq. Esp. 0 1 2 3 4 5 6 7 >7 Total 26 37 31 18 10 3| 3|6 0| 0| 128 21,9 38,7 34,1 20,1 8,9 3,1 | 0,9 | 4,3 0,2 | 0,1 |

Portanto, os dados resultaram em Tripanossomos 0 1 2 3 4 >5 Total Freq. Obs. 26 37 31 18 10 6 128 Freq. Esp. 21,9 38,7 34,1 20,1 8,9 4,3 128,0 (o-e)2 /e 0,768 0,075 0,282 0,219 0,136 0,672 = 2,152

GL = 6 - 2 = 4 e

crtico = 9,488.

Como o

encontrado menor que o

crtico conclui-se que os desvios no so

significativos. Portanto, pode-se aceitar que o nmero de tripanossomos encontrado segue a distribuio de Poisson.

Os exemplos a seguir referem-se aos testes de diferena entre mdias para grupos relacionados ou independentes.

EXEMPLO 1 Dez cobaias foram submetidas ao tratamento de engorda com certa rao. Os pesos em gramas, antes e aps o teste so dados a seguir (supe-se que provenham de distribuies normais). A 1% de significncia, podemos concluir que o uso da rao contribuiu para o aumento do peso mdio dos animais? Cobaia 1 Antes 635 Depois 640 Resoluo: 2 704 712 3 662 681 4 560 558 5 603 610 6 745 740 7 698 707 8 575 585 9 633 635 10 669 682

Trata-se de uma situao em que queremos comparar as MDIAS DE DUAS distribuies normais, supondo que se trata da MESMA populao, mas em dois momentos diferentes: antes e aps um tratamento de engorda. H interesse em verificar se a dieta contribuiu para o peso mdio dos animais: ou seja, queremos verificar se a mdia de peso antes do tratamento MENOR do que a mdia de peso aps o tratamento (se a dieta fez efeito os animais estaro em mdia mais pesados ao final do tratamento). Reparem que exigido que se tome uma deciso, o que configura um problema de TESTE DE HIPTESES.

Iremos ento aplicar um TESTE DE DIFERENAS ENTRE MDIAS POPULACIONAIS, PARA DADOS PAREADOS (MESMA POPULAO: ANTES E DEPOIS). O roteiro deste teste est na pgina 4 da apostila de Roteiros e Tabelas. 1) Enunciar as hipteses De acordo com o que foi dito acima queremos verificar se a mdia antes menor do que a mdia depois; o melhor ponto de partida, que servir para a definio da hipteses H0, que a dieta NO FAZ EFEITO, ou seja as mdias antes e aps o tratamento so iguais (costumamos colocar em H0 o CONTRRIO do que queremos provar), ou seja a DIFERENA ENTRE AS MDIAS DEVE SER SUPOSTA IGUAL A ZERO, teremos ento:

2) Estabelecer o nvel de significncia ou nvel de confiana. Conforme foi estabelecido no enunciado do problema:

3) Identificar a varivel de teste. No presente problema temos uma amostra de apenas 10 elementos. Como a amostra tem menos de 30 elementos a varivel de teste que ser utilizada ser a varivel t

n-1 da distribuio t de Student.

4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel. Trata-se de um teste unilateral esquerda (com 1% de significncia), e a varivel de teste tn-1 (a amostra tem 10 elementos), ento o valor crtico (obtido da tabela da distribuio t de Student) ser:

Observe a regio de aceitao de H0 na figura abaixo:

Para valores maiores de -2,82 aceitaremos H0 (ou seja a dieta no faz efeito, a diferena entre as mdias nula). Se tn-1 for menor do que -2,82 rejeitaremos H0 (a mdia DEPOIS aumentou demais em relao mdia ANTES da dieta para que a diferena seja devida apenas ao acaso. Claro que h uma chance de 1% de que venhamos a rejeitar H0 sendo ela verdadeira. 5) Atravs dos valores das amostras antes e depois, calcular a diferena d entre cada par de

valores, onde

di = Xantes - Xdepois.
Para o conjunto sob anlise teremos: Cobaia Antes Depois di di2 1 635 640 -5 25 2 704 712 -8 64 3 662 681 -19 361 4 560 558 2 4 5 603 610 -7 49 6 745 740 5 25 7 698 707 -9 81 8 575 585 -10 100 9 633 635 -2 4 10 669 682 -13 169

6)e 7) Calcular a diferena mdia e o desvio padro da diferena mdia. Para o presente problema:

8) Calcular o valor da varivel de teste. Neste problema a varivel tn-1:

9) Decidir pela aceitao ou rejeio de H0. Conforme foi visto anteriormente, se o valor da varivel de teste fosse MENOR do que -2,82 a hiptese H0 seria rejeitada:

Assim, REJEITAMOS H0 a 1% de significncia. 10) Interpretar a deciso dentro do contexto do problema. Assim, conclumos com 99% de confiana (ou uma chance de erro de 1%) que a dieta contribuiu para o aumento do peso mdio dos animais.

EXEMPLO 2 Deseja-se saber se 2 mquinas de empacotar caf esto fornecendo o mesmo peso mdio em kg. Extraem-se duas amostras, uma de cada mquina (supondo que os pesos das amostras sigam uma distribuio normal): Mquina Nova - 36 amostras, mdia = 0,81 kg, varincia = 0,00020 kg2. Mquina Velha - 39 amostras, mdia = 0,78 kg, varincia = 0,00135 kg2. Qual a sua concluso a 5% de significncia?
Resoluo: Trata-se de uma situao em que queremos comparar as MDIAS DE DUAS distribuies normais, supondo que se tratam de duas populaes distintas, podemos supor que as amostras so independentes: esto sendo avaliadas as produes de 2 mquinas DIFERENTES. H interesse em verificar simplesmente se h diferena entre as mdias das duas populaes: em qualquer direo. Reparem que exigido que se tome uma deciso, o que configura um problema de TESTE DE HIPTESES. Iremos ento aplicar um TESTE DE DIFERENAS ENTRE MDIAS POPULACIONAIS, PARA DADOS NO PAREADOS (POPULAES DISTINTAS). O roteiro deste teste est nas pginas 5 e 6 da apostila de Roteiros e Tabelas. 1) Enunciar as hipteses De acordo com o que foi dito acima queremos verificar se as mdias diferem entre si; o melhor ponto de partida, que servir para a definio da hipteses H0, ser considerar que NO H DIFERENA entre as mdias, ou seja A MDIA DA MQUINA VELHA SERIA IGUAL DA MQUINA NOVA (costumamos colocar em H0 o CONTRRIO do que queremos provar), teremos ento:

2) Estabelecer o nvel de significncia ou nvel de confiana. Conforme foi estabelecido no enunciado do problema:

3) Identificar a varivel de teste. Neste ponto do roteiro necessrio ter muito cuidado. H 3 variveis de teste possveis, dependendo das condies do problema, mais especificamente das varincias das duas populaes. Se as varincias de ambas as populaes forem conhecidas (caso muito raro na prtica) dever ser usada a varivel Z da distribuio normal padro. Se as varincias populacionais forem desconhecidas, dever ser usada a varivel t da distribuio t de Student, mas a determinao dos GRAUS DE LIBERDADE desta varivel depender do fato de as variveis serem IGUAIS (quando a varivel ter n1+ n2 - 2 graus de liberdade, onde n1 e n2 so os tamanhos das amostras), ou DIFERENTES (quando a varivel ter graus de liberdade, cuja expresso de clculo est na pgina 5 da apostila de Roteiros e Tabelas e ser mostrada posteriormente). Uma pergunta bastante razovel que surge : "SE EU NO CONHEO AS VARINCIAS POPULACIONAIS COMO PODEREI SABER SE SO IGUAIS OU DIFERENTES"? Para resolver este problema necessrio usar o TESTE F DE DIFERENA ENTRE VARINCIAS POPULACIONAIS (ou teste de razo entre varincias, j que a varivel do teste um quociente entre as 2 varincias amostrais). Em suma, quando fazemos um teste de diferena entre mdias de duas populaes distintas devemos inicialmente fazer um teste para verificar se suas varincias, caso desconhecidas, so iguais ou diferentes. No presente problema as varincias populacionais so desconhecidas, portanto devemos realizar o teste F para obter a varivel de teste com o nmero correto de graus de liberdade. TESTE F

Queremos apenas verificar se h DIFERENA entre as varincias, por isso o teste ser sempre BILATERAL. Nvel de significncia: como a tabela da distribuio F (que est na apostila de Roteiros e Tabelas) apresenta valores apenas para 5% de significncia (teste bilateral) este ser o nvel adotado em todos os testes F (se for possvel obter outras tabelas, nveis diferentes podero ser utilizados). Encontrar a maior varincia amostral, que ser chamada de (e por conseguinte nA) e a

menor que ser chamada

(e por conseguinte nB). Neste problema teremos:

Ento a varivel de teste do teste F ser:

Esta varivel segue uma distribuio amostral chamada de distribuio F de Fisher (ou de Snedecor), trata-se de uma distribuio assimtrica, que somente pode assumir valores positivos, e que possui graus de liberdade associados ao numerador e ao denominador de um quociente. Veja a figura abaixo, de uma distribuio F com 38 e 35 graus de liberdade:

Esta varivel ser comparada com um valor crtico, que ser F38,35;0,025: bastaria procurlo em uma tabela adequada (como a tabela que est na apostila de Roteiros e Tabelas, sendo 38 o nmero de graus de liberdade do numerador da estatstica e 35 o nmero de graus de liberdade do denominador da estatstica). Usando a tabela citada acima, porm, s h os valores F30,30;0,025 = 2,07 e F40,40;0,025 = 1,88. O valor procurado F38,35;0,025 deve estar ENTRE estes 2 valores (na realidade ele vale 1,942). Como o valor da varivel F38,35(6,75) 3 vezes maior do que ambos os valores (2,07 e 1,88) podemos tranqilamente REJEITAR a hiptese de que as varincias populacionais, desconhecidas, so iguais, com uma chance de erro de 5%. Sendo assim, a nossa varivel t de Student ter graus de liberdade. Ento como as varincias populacionais so desconhecidas e supostas diferentes (de acordo com o teste F) a varivel t ter graus de liberdade, que sero calculados a seguir:

onde

(mquina nova)

(mquina velha)

Ento a varivel de teste t de Student ter 50 graus de liberdade. 4) Definir a regio de aceitao de H0, de acordo com o tipo de teste e varivel. Trata-se de um teste bilateral (com 5% de significncia), e a varivel de teste t com 50 graus de liberdade ento o valor crtico (obtido da tabela da distribuio t de Student) ser:

Observe a regio de aceitao de H0 na figura abaixo:

Para valores de t50 menores do que -2,01 ou maiores do que 2,01, ou seja valores em mdulo maiores do que 2,01, REJEITAREMOS H0, ou seja h diferena entre as mdias de peso dos pacotes das 2 mquinas (claro que h 5% de chance de que venhamos a rejeitar H0 sendo ela verdadeira). 5) Calcular o desvio padro das diferenas. Como as duas varincias so desconhecidas, e o teste F mostrou que so diferentes, iremos utilizar a terceira expresso para calcular o desvio padro das diferenas que est no roteiro (no item 5 da pgina 5 da apostila de Roteiros e Tabelas):

6) Calcular a varivel de teste.

Novamente, como as duas varincias so desconhecidas, e o teste F mostrou que so diferentes, iremos utilizar a terceira expresso para calcular o valor da varivel de teste que est no roteiro (no item 6 da pgina 6 da apostila de Roteiros e Tabelas):

7)Decidir pela aceitao ou rejeio de H0. Conforme foi visto anteriormente se o mdulo da varivel de teste fosse maior do que 2,01 a hiptese H0 seria rejeitada:

Assim, REJEITAMOS H0 a 5% de significncia. 8) Interpretar a deciso dentro do contexto do problema. Assim, conclumos com 95% de confiana (ou uma chance de erro de 5%) que h diferena entre os pesos mdios dos pacotes fornecidos pelas duas mquinas. Seria recomendvel descobrir qual das duas est com problemas para efetuar as correes necessrias.

Das könnte Ihnen auch gefallen