Sie sind auf Seite 1von 60

UNIVERSIDADE DE SO PAULO

Faculdade de Zootecnia e Engenharia de Alimentos Departamento de Cincias Bsicas

APOSTILA DE ESTATSTICA II
Prof. Dr. Csar Gonalves de Lima
E_mail: cegdlima@usp.br

Pirassununga - SP 2004
Av. Duque de Caxias Norte, 225 CEP: 13635-900 Pirassununga, SP Fone: (19) 3565-4117/4143 - Fax: (19) 3561-8606 - E-mail: zab@usp.br

SUMRIO
Pgina
1. Introduo Inferncia Estatstica ............................................................................................................. 1.1. Como selecionar uma amostra ............................................................................................................... 1.2. Outras tcnicas de Amostragem ............................................................................................................. 1.3. Definies iniciais .................................................................................................................................. 1.4. Distribuies amostrais .......................................................................................................................... 1.5. A distribuio amostral da mdia ............................................................................................................ 1.6. A distribuio amostral da proporo ...................................................................................................... 2. Algumas distribuies importantes ........................................................................................................... 2.1. A distribuio de Quiquadrado ............................................................................................................... 2.2. A distribuio t-Student .......................................................................................................................... 2.3. A distribuio F-Snedecor ..................................................................................................................... 3. Estimao ................................................................................................................................................ 3.1. Caractersticas de um bom estimador por ponto ...................................................................................... 3.2. Estimao por intervalo .......................................................................................................................... 3.2.1. Intervalo de confiana para a mdia populacional ................................................................................ 3.2.2. Intervalo de confiana para a proporo ............................................................................................... 4. Testes de hipteses .................................................................................................................................... 4.1. Procedimentos bsicos para a construo de um teste de hipteses .......................................................... 4.2. Teste sobre a mdia de uma distribuio normal quando a varincia conhecida ..................................... 4.3. Nvel descritivo do teste ......................................................................................................................... 4.4. Teste de hipteses para a proporo ........................................................................................................ 5. Outros testes de hipteses .......................................................................................................................... 5.1. Teste sobre a mdia de uma distribuio normal quando a varincia desconhecida ................................ 5.2. Teste para a varincia de uma distribuio normal .................................................................................. 5.3. Comparao das varincias de duas populaes normais ......................................................................... 5.4. Comparaes das mdias de duas populaes normais ............................................................................ 5.4.1. Comparaes das mdias de duas populaes normais quando as varincias so desconhecidas, mas iguais .......................................................................................................................................... 5.4.2. Comparaes das mdias de duas populaes normais quando as varincias so desconhecidas e diferentes ........................................................................................................................................... 5.4.3. Comparaes das mdias de duas populaes normais quando as observaes so pareadas .................. 6. Correlao e regresso linear simples ........................................................................................................ 6.1. Correlao linear de Pearson .................................................................................................................. 6.2. Regresso linear simples ........................................................................................................................ 6.2.1. O modelo para regresso linear simples ............................................................................................... 6.2.2. Inferncia sobre os estimadores dos parmetros da regresso ................................................................ 7. Testes de quiquadrado ............................................................................................................................... 7.1. Teste de aderncia, ajustamento ou adequao de um modelo ................................................................. 7.2. Testes em tabelas de contingncia ........................................................................................................... 7.2.1. Teste de homogeneidade ...................................................................................................................... 7.2.2. Teste de Independncia ....................................................................................................................... Distribuies de probabilidades ..................................................................................................................... Tbua I: Normal padro ................................................................................................................................ Tbua II: Quiquadrado .................................................................................................................................. Tbua III: t de Student .................................................................................................................................. Tbua IV: F-Snedecor ................................................................................................................................... Reviso de somatrios .................................................................................................................................. Exerccios propostos ..................................................................................................................................... Bibliografia recomendada ............................................................................................................................. Resoluo dos exerccios propostos ............................................................................................................... 2 2 2 3 3 4 5 6 6 7 8 9 9 10 10 12 13 16 16 17 17 18 18 19 20 21 22 23 24 25 25 28 29 31 32 32 34 35 35 37 38 39 40 41 43 45 50 51

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

1. INTRODUO INFERNCIA ESTATSTICA


Nas aulas anteriores (Estatstica I) aprendemos como resumir descritivamente uma massa de dados (atravs de medidas de tendncia central, disperso, assimetria e curtose), como apresentar esses resultados (atravs de grficos e tabelas) e conhecemos alguns modelos probabilsticos (binomial, Poisson e normal) usados para descrever fenmenos comuns em nossa rea de atuao. A partir de agora, veremos como reunir todas essas informaes com o intuito de estudar um ramo bastante importante da Estatstica, conhecido como Inferncia Estatstica, que estuda como fazer afirmaes sobre certas caractersticas de uma populao, baseando-se em resultados obtidos em uma amostra. Neste contexto, entende-se por populao qualquer conjunto de indivduos ou objetos que tm pelo menos uma varivel comum observvel e por amostra, qualquer subconjunto da populao. Exemplo 1.1. Consideremos uma pesquisa feita para estudar o ganho de peso dos bovinos de corte de um rebanho de 700 animais. Selecionamos uma amostra de 40 animais e anotamos os seus pesos no incio e no final de um determinado ms. A partir desses dados calculamos os ganhos de peso. Neste caso a populao formada pelos 700 animais e a amostra pelos 40 animais selecionados. Na verdade, como estamos interessados no ganho de peso, a populao formada pelos ganhos de peso dos 700 animais e a amostra pelos ganhos de peso dos 40 animais selecionados. Estudando a distribuio dos ganhos de peso da amostra, esperamos que esta reflita a distribuio dos ganhos de peso do plantel. Com os dados em mos, podemos estar interessados, simplesmente, em estimar o ganho de peso mdio dos bovinos de corte ou ento, em testar se o ganho de peso mdio desses bovinos, neste particular ms, foi superior a 10kg. A soluo desses problemas ser tratada com detalhes nas prximas aulas sobre Estimao de Parmetros e Testes de Hipteses, respectivamente.

1.1 COMO SELECIONAR UMA AMOSTRA As observaes colhidas numa amostra so to mais informativas quanto mais conhecemos sobre a populao de onde a amostra foi retirada. Por exemplo, para selecionarmos 40 animais de um lote de 700, devemos conhecer algumas caractersticas desses animais (raa, sexo, idade etc.) que podem influenciar nos resultados da varivel em estudo. A maneira de se obter uma amostra to importante e existem tantas formas de faz-la, que esses procedimentos constituem uma especialidade dentro da Estatstica, conhecida como Tcnicas de Amostragem. Distinguiremos dois tipos de amostragem: a probabilstica e a no-probabilstica. A amostragem ser chamada de probabilstica se todos os elementos da populao tiverem probabilidades conhecidas e diferentes de zero, de fazer parte da amostra; caso contrrio, a amostragem ser chamada de no-probabilstica. A amostragem probabilstica implica um sorteio com regras bem determinadas, cuja realizao somente ser possvel se a populao em estudo for finita e totalmente acessvel. As tcnicas de Inferncia Estatstica pressupem que as amostras utilizadas no estudo sejam probabilsticas, o que muitas vezes no se pode conseguir. Nesses casos, o bom senso dever indicar quando o processo de amostragem, mesmo no sendo probabilstico, pode ser, para efeitos prticos, considerado como tal. O caso mais simples de amostragem probabilstica chamado de Amostragem Casual Simples ou Aleatria, onde se atribui a cada elemento da populao a mesma probabilidade de seleo, ou seja, a mesma chance de fazer parte da amostra. Podemos obter uma amostra casual simples (a.c.s.) escrevendo o nome de cada elemento da populao num carto, misturando-os numa urna e sorteando tantos cartes quantos forem os elementos que desejamos na amostra. O sorteio poder ser feito com reposio (o carto sorteado volta urna antes do prximo sorteio) ou sem reposio (o carto sorteado no volta mais urna). Se a populao for muito numerosa, podemos utilizar uma tabela de nmeros aleatrios para facilitar o sorteio. Se estivermos interessados em sortear uma amostra casual simples de n elementos de uma populao n finita de tamanho N, o nmero de amostras possveis ser igual a (N) se o processo de retirada for com reposi N o, e se o processo de retirada for sem reposio. A relao n/N chamada frao de amostragem. n

1.2.. OUTRAS TCNICAS DE AMOSTRAGEM Amostragem Sistemtica: utilizada quando os elementos da populao apresentam-se ordenados e a retirada dos elementos da amostra feita periodicamente. Por exemplo, de um rebanho de N = 700 bovinos de corte, cujos dados esto registrados em fichas numeradas de 001 a 700, podemos retirar uma amostra de n = 10 animais utilizando o seguinte procedimento:
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

3 i) sorteamos um nmero de 1 a 70 (note que 700/10=70), que corresponder ao nmero da ficha do primeiro animal que far parte da amostra; ii) as demais fichas (animais) sero retiradas, periodicamente, de 70 em 70. Amostragem por Conglomerados: utilizada quando a populao apresenta uma subdiviso natural em pequenos grupos ou conglomerados. Para retirarmos uma amostra, sorteamos um nmero suficiente de conglomerados e os seus elementos constituiro a amostra. Neste caso, as unidades de amostragem so os conglomerados e no os elementos individuais da populao. Este tipo de amostragem adotado por motivos de ordem prtica e econmica. Amostragem Estratificada: utilizada quando a populao pode ser dividida em diferentes subpopulaes ou estratos, sendo razovel supor que a varivel de interesse apresenta um comportamento bastante diverso de estrato para estrato e um comportamento razoavelmente homogneo dentro de cada estrato. Neste caso, se o sorteio dos elementos da amostra no considerar tais estratos, pode ocorrer que os diversos estratos no sejam convenientemente representados na amostra, a qual estaria mais influenciada pelas caractersticas da varivel nos estratos mais favorecidos pelo sorteio. A amostragem estratificada consiste em especificar quantos elementos da amostra sero retirados de cada estrato. Geralmente so considerados trs tipos de amostragem estratificada: uniforme: quando se sorteia igual nmero de elementos em cada estrato; proporcional: quando o nmero de elementos sorteados em cada estrato proporcional ao nmero de elementos existentes no estrato tima: quando retiramos, em cada estrato, um nmero de elementos proporcional ao nmero de elementos e variabilidade da varivel de interesse no estrato, medida por seu desvio padro. Para maiores detalhes sobre estas e outras tcnicas de amostragem consulte, por exemplo: COCHRAN, W.G. Tcnicas de Amostragem, Fundo de Cultura, Rio de Janeiro, 1955.

1.3. DEFINIES INICIAIS Para facilitar a linguagem usada, iremos diferenciar as caractersticas da amostra e da populao. Chamaremos de parmetro qualquer medida usada para descrever uma caracterstica da populao e de estatstica, qualquer medida usada para descrever uma caracterstica da amostra, ou seja, qualquer funo dos elementos da amostra. Geralmente, usamos letras gregas minsculas para simbolizar os parmetros e letras do nosso alfabeto para as estatsticas, como por exemplo: Descrio Nmero de elementos Mdia Varincia Desvio padro Coeficiente de correlao Parmetro (populao) N 2 (X,Y) Estatstica (amostra) n x s s r(X,Y)
2

1.4. DISTRIBUIES AMOSTRAIS J sabemos que o problema bsico da Inferncia Estatstica consiste em se fazer uma afirmao sobre parmetros atravs de resultados obtidos na amostra. Suponhamos que o interesse esteja em fazer afirmaes sobre um parmetro (mdia, mediana, varincia ou coeficiente de correlao, por exemplo) de uma certa populao representada pela v.a. X. Desta populao, sorteamos, com reposio, uma a.c.s. de n elementos e a nossa deciso sobre ser baseada na estatstica T = f(X1, X2, ..., Xn) que uma funo dos valores amostrais (X1,X2, ...,Xn). Colhida uma amostra particular (x1, x2, ..., xn) calculamos o valor da estatstica T (t1, por exemplo) e baseado neste valor faremos uma afirmao (ou inferncia) sobre o parmetro . A afirmao sobre o parmetro ser mais bem compreendida se soubermos o que acontece com a estatstica T quando retiramos todas as possveis amostras de tamanho n da populao, de acordo com o plano amostral adotado. A distribuio dos possveis valores da estatstica T chamada de distribuio amostral ou por amostragem da estatstica T e desempenha um papel fundamental na teoria usada na Inferncia Estatstica. O procedimento utilizado para a obteno da distribuio amostral da estatstica T pode ser resumido da seguinte maneira:
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

4 i) Da populao X, estamos interessados no parmetro . ii) De acordo com um certo procedimento de amostragem, retiramos todas as amostras de tamanho n da populao X. iii) Para cada amostra (xi1, xi2, ...,xin) calculamos o valor ti da estatstica T, i = 1, 2, ... iv) Os valores ti formam uma nova populao cuja distribuio de probabilidades recebe o nome de distribuio amostral da estatstica T.

1.5. A DISTRIBUIO AMOSTRAL DA MDIA Para estudarmos a distribuio amostral da mdia, consideremos uma populao identificada pela v.a. 2 X, cuja mdia = E(X) e varincia = Var(X) so conhecidas. Exemplo 1.2. Consideremos, sem perda de generalidade, a populao X = {4, 10, 16} com N = 3 ele2 mentos, mdia = 10 e varincia 2 = 24. Para cada uma das 3 = 9 amostras de tamanho n = 2, retiradas, com reposio, da populao X, vamos calcular a mdia e a varincia amostrais utilizando os seguintes estimadores: n 1 1 n 2 X = Xi e S = (X i X ) 2 (n 1) i =1 n i =1 e obtemos: Amostra (4; 4) (4; 10) (4; 16) (10; 4) (10; 10) (10; 16) (16; 4) (16; 10) (16; 16)
x

4 7 10 7 10 13 10 13 16

s 0 18 72 18 0 18 72 18 0

Utilizando esses resultados, construmos a distribuio de probabilidades da estatstica X :

x
P( X = x )

4 1/9

7 2/9

10 3/9

13 2/9

16 1/9

e baseada nesta distribuio de probabilidades, temos que: E( X ) = 4.(1/9) + ... + 16.(1/9) = 10 E( X ) = 10 E( X 2 ) = 4 .(1/9) + ... + 16 .(1/9) = 112 Var( X ) = 112 - (10) = 12 Var( X ) = 12
2

ou seja, que E( X ) = = 10 Var( X ) = /n = 24/2 = 12


2

Observe que as diversas amostras produzem estimativas diferentes da mdia e da varincia populacionais. Esta flutuao das mdias amostrais ( X ) em torno da mdia populacional () pode ser quantificada atravs da varincia da mdia amostral , Var( X ). Esses resultados numricos obtidos independem da distribuio da v.a. X e podem ser generalizados no seguinte teorema: Teorema 1. Seja X uma populao com mdia e varincia e seja (X1, ..., Xn) uma a.c.s. de tamanho n 2 retirada desta populao. Ento, E( X ) = e Var( X ) = /n.
2

Precisamos determinar agora qual o modelo probabilstico da curva referente distribuio de X. A obteno dessa informao exige recursos matemticos que esto fora dos objetivos deste curso. Apresentaremos, somente, os resultados mais importantes. 2 Primeiramente, se X uma v.a. com distribuio normal de mdia e varincia , pode-se demonstrar 2 que a distribuio da estatstica X tambm ser normal de mesma mdia, , mas com varincia /n, isto : X ~ N(, )
2

X ~ N(, /n)
2

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

No caso mais geral, onde a distribuio da v.a. X no normal ou desconhecida, devemos usar os resultados do importante teorema apresentado a seguir. Teorema 2. Para amostras casuais simples de tamanho n retiradas de qualquer populao com mdia e 2 varincia , a distribuio amostral da mdia aproxima-se de uma distribuio normal com mdia e 2 varincia /n, quando n tende para infinito. (Teorema do Limite Central). A rapidez dessa convergncia depende da distribuio da populao da qual a amostra retirada: se a distribuio for simtrica e unimodal a convergncia bastante rpida. Para amostras com mais de 30 elementos, a aproximao pela distribuio normal pode ser considerada boa. Um outro resultado bastante interessante e que ser utilizado freqentemente nas prximas aulas est apresentado no seguinte corolrio: Corolrio 1: Se (X1, X2, ...,Xn) uma a.c.s. de tamanho n da populao X que tem mdia e varincia , X ento a varivel Z = ~ N(0, 1) quando n tende para infinito.
2

1.6 A DISTRIBUIO AMOSTRAL DA PROPORO Consideremos agora uma populao em que a proporo de elementos portadores de uma certa caracterstica p. Por exemplo: a proporo de funcionrios da lavoura que tem curso colegial completo; a proporo de eleitores de um determinado candidato; a proporo de animais com determinada doena etc.. Em qualquer um dos exemplos, cada elemento da populao pode assumir dois valores: X = 1 se o elemento apresenta a caracterstica e X = 0, se no apresenta a caracterstica, onde apresentar a caracterstica significa ter o curso colegial completo, ou ser eleitor de um determinado candidato, ou mesmo ter uma determinada doena. Assumindo que P(X=1) = p e P(X=0) = 1 p, temos: E(X) = 1.(p) + 0.(1-p) = p E(X) = p E(X2) = 1.(p) + 0.(1-p) = p Var(X) = p - (p) = p(1-p) Var(X) = p(1-p)
2

Retirada uma a.c.s., com reposio, de n elementos da populao X, indicamos por Sn o total de indivduos portadores da caracterstica na amostra. J sabemos que Sn ~ B(n; p), isto , Sn tem distribuio binomial de parmetros n e p. Definindo p como sendo a proporo (ou freqncia relativa) de indivduos que tm a caracterstica na amostra, isto , p = Sn /n, a distribuio amostral de p apresenta probabilidades iguais s probabilidades da distribuio de Sn, embora os valores assumidos por p e Sn sejam diferentes. Ento: E( p ) = p e Var( p ) = p(1-p)/n (Note a analogia de p com X ...) Para n grande, usando o Teorema do Limite Central, conclumos que p ~ N(p; p(1-p)/n) e Z = pp p(1 p) n Exemplo 1.3. Foi sorteada uma amostra de 500 coelhos de uma granja e os animais foram inspecionados com respeito presena de sarna de focinho e patas. Para estimar a "proporo de animais com sarna de focinho e patas", usamos a estatstica p = Sn n , onde Sn corresponde ao nmero de animais com sarna de focinho e patas e n ao nmero total de coelhos na amostra. Se Sn = 300 coelhos tm sarna de focinho e patas, uma estimativa da proporo de coelhos portadores de sarna, nessa granja, p = 300/500 = 0,60 e uma estimativa da varincia dessa proporo 0,60*0,40/500 = 0,00048. ~ N(0; 1)

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

6 Enfim, alm da mdia X e da proporo p , podemos estudar a distribuio amostral de qualquer estatstica T = f(X1, X2, ...,Xn), mas quanto mais complexa for esta funo f(.), mais difcil ser a derivao matemtica das propriedades da estatstica T.

2 ALGUMAS DISTRIBUIES IMPORTANTES Agora, conheceremos outras distribuies de probabilidades que sero usadas em alguns testes de hipteses e na construo de alguns intervalos de confiana bastante teis em situaes prticas. De cada distribuio sero conhecidas algumas caractersticas principais, como o grfico, a mdia, a varincia e os procedimentos usados no clculo de probabilidades usando as Tbuas apresentadas no final da apostila. Tambm sero informadas as situaes mais comuns onde essas distribuies so aplicadas. 2.1 DISTRIBUIO DE QUIQUADRADO (2) Definio 2.1 Seja {Z1, ..., Z} uma amostra aleatria de n elementos retirada de uma distribuio
2 2 normal padronizada N(0; 1). Ento, a varivel Q = Z1 + ... + Z = Zi2 tem distribuio i =1

quiquadrado com graus de liberdade (g.l.), isto , Q ~ 2 ) . ( Pode-se provar que E(Q) = e Var(Q) = 2. O nmero de graus de liberdade () refere-se ao nmero de variveis normais independentes Zi, ao quadrado, que compem a varivel Q. A Figura 1 apresenta o grfico da distribuio quiquadrado com = 5 g.l. :

Figura 1 - Distribuio quiquadrado com 5 g.l. A distribuio Quiquadrado tem diversas aplicaes em Estatstica e para o clculo de probabilidades usaremos a Tbua II, que fornece os valores crticos qc tais que P(Q > qc) = p, para alguns valores de p e de . Por exemplo, se Q ~ (210 ) e procuramos o valor crtico, qc, tal que 0,05 = P(Q > qc), iremos encontr-lo na interseo da linha correspondente a = 10gl e da coluna correspondente a p = 0,05, ou seja, q = 18,307. De modo
c

anlogo, se procuramos qc tal que P(Q > qc) = 0,95, iremos encontrar o valor 3,940. Esses resultados esto representados na Figura 2.

PROBABILIDADE p ... 10 ... ... ... ... ... 0,100 ... 15,987 ... 0,05 18,307 ... 0,04 ... 19,021 ... ... ... ... ...

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

2 Figura 2 - Valores crticos bilaterais da distribuio (10) para 1- = 90%

Uma estatstica importante que ser utilizada na construo de intervalos de confiana e nos testes de hipteses sobre a varincia de uma populao normal X X 1 n = 2 Xi X i i =1 i =1
n 2

(n 1)S 2 ~ (2n 1) 2

2.2 DISTRIBUIO t DE STUDENT uma das mais importantes distribuies usadas na inferncia estatstica sobre mdias de populaes normais.
2 Definio 2.2 Sejam as variveis Z ~ N(0,1) e Q ~ ( ) , independentes. Ento, a varivel

T=

Z Q

tem distribuio t de Student com graus de liberdade.

Pode-se provar que E(T) = 0 e Var(T) = v/(v2). O grfico da distribuio t- Student muito parecido com o da distribuio N(0; 1), sendo o primeiro apenas um pouco mais achatado que o segundo. Quando o nmero de graus de liberdade grande, os grficos das distribuies Normal e t-Student so praticamente iguais. O grfico da distribuio t-Student com = 12 g.l. est apresentado na Figura 3.

Figura 3 - Grfico da distribuio t-Student com = 12 graus de liberdade A Tbua III fornece valores crticos tc tais que P(T > tc) = p, para alguns valores de p e de . Por exemplo, se T ~ t(12) e p = 0,025, o valor tc = 2,179 ser encontrado na interseo da linha correspondente a 12 g.l. e da coluna correspondente probabilidade p = 0,025. ... 12 ... ... ... ... ... PROBABILIDADE p 0,030 0,020 0,025 ... ... 2,076 2,179 2,303 ... ... ... ... ... ... ...

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

8 Quando o nmero de graus de liberdade da distribuio t-Student grande, podemos usar a Tbua I da distribuio N(0,1) para obter os valores crticos tc. Uma estatstica importante que ser usada na construo de X Intervalos de Confiana e nos testes de hipteses sobre mdias de populaes normais : T = ~ t(n-1) , ou S2 n seja, tem distribuio t-Student com = n-1 graus de liberdade.

2.3 DISTRIBUIO F DE SNEDECOR Essa distribuio bastante usada na comparao de varincias de duas populaes com distribuio normal. U Definio 2.3. Sejam as v.a. U ~
2 1

eV ~

22

, independentes. Ento a varivel F =

1 2

tem dis-

tribuio F de parmetros 1 e 2 onde os parmetros 1 e 2 correspondem, respectivamente, ao nmero de graus de liberdade do numerador e do denominador da varivel F. Pode-se provar que: E(F) = 2 2 2 e Var(F) = 2 2 (1 + 2 2 ) 2 . 2 1 ( 2 2 ) ( 2 4)

A Figura 4 apresenta o grfico da distribuio F(1 = 10; 2 = 12)

Figura 4 - Grfico da distribuio F(10; 12). Os valores crticos fc tais que P(F > fc) = 0,05, para alguns valores de 1 e 2 podem ser encontrados na Tbua IV. Por exemplo, para uma varivel com distribuio F(10,12), o valor 2,75 encontrado na interseo da linha correspondente a 2=12gl (denominador) e 1=10 g.l. (numerador):

1 GRAUS DE LIBERDADE DO NUMERADOR 2 ... 12 ... ... ... ... ... 9 ... 2,80 ... 10 2,75 ... 12 ... 2,69 ... ... ... ... ...

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

9 Com a Tbua IV podemos tambm encontrar os valores crticos tais que P(F < fc) = 0,05 usando a 1 identidade F(1; 2) = . Por exemplo, se F ~ F(10; 12) e estamos interessados no valor crtico inferior, F( 2 ; 1 ) fc, que P(F < fc) = 0,05, devemos primeiramente procurar o valor crtico na interseo da linha correspondente a (2 =) 10 g.l. com a coluna correspondente a (1 =) 12 g.l.. A partir deste valor (2,91), obtemos o valor crtico de interesse fazendo: fc = 1/2,91 = 0,34. Uma estatstica importante que ser utilizada na construo de Intervalos de Confiana para o quociente de duas varincias e nos testes de hipteses envolvendo as varincias de duas populaes normais : F=
2 S1

S2 2

~ F(n1-1; n2-1)

ou seja, tem distribuio F-Snedecor com 1 = (n1-1) e 2 = (n2-1) graus de liberdade, onde n1 e n2 so os tamanhos das amostras retiradas das populaes 1 e 2, respectivamente, cujos resultados so utilizados no clculo das 2 estimativas das varincias S1 e S2 . 2

3. ESTIMAO Na produo de generalizaes sobre a populao com base em resultados obtidos de uma amostra, esto envolvidos a estimao e o teste de hipteses sobre parmetros. Basicamente, a estimao de parmetros pode ser feita de duas maneiras: por ponto e por intervalo. Par a obteno de bons estimadores pontuais, existem alguns mtodos como: o Mtodo dos Mnimos Quadrados, o Mtodo da Mxima Verossimilhana, o Mtodo dos Momentos etc. No entanto, estes mtodos no sero apresentados com detalhes nesta apostila, podendo ser encontrados em outros textos bsicos de Inferncia Estatstica (ver a bibliografia sugerida no final da apostila). Exemplo 3.1 A cada eleitor de uma amostra de 500 eleitores feita uma pergunta a respeito da eleio de um determinado candidato. A resposta pergunta poder ser sim (favorvel) ou no (contrrio eleio do candidato). A estimao da proporo (p) de eleitores favorveis eleio do candidato feita utilizando-se o estimador p = (nmero de eleitores favorveis eleio)/(nmero de eleitores na amostra) Deste modo, se 320 eleitores responderam sim pergunta, uma estimativa da proporo de eleitores favorveis eleio do candidato p = 320/500 = 0,64 = 64%. Dvidas: Ser que p um bom estimador de p? Ser que p proporciona boas estimativas de p? Para responder a estas (e outras) perguntas iremos conhecer as caractersticas de um bom estimador por ponto, que sero apresentadas a seguir.

3.1 CARACTERSTICAS DE UM BOM ESTIMADOR POR PONTO Os estimadores por ponto ou pontuais so assim denominados porque especificam um nico valor para o parmetro. Em algumas situaes podemos estar interessados em saber se um estimador tem boas qualidades; j em outras, podemos ter mais de um estimador para o mesmo parmetro e desejamos escolher o melhor deles. Neste caso o julgamento pode ser feito analisando as seguintes propriedades desses estimadores: i) T um estimador justo, no viesado ou no tendencioso do parmetro se E(T) = . ii) T um estimador consistente do parmetro se for justo e se lim Var(T) = 0.
n

iii) Se T1 e T2 so dois estimadores justos do parmetro e ainda Var(T1) < Var(T2), ento T1 dito ser mais eficiente que o estimador T2.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

10 Dos estimadores que j conhecemos, pode-se provar que X e p so estimadores justos e consistentes dos parmetros e p, respectivamente. Um estimador no viesado e consistente para a varincia populacional :
2
2 n Xi n 1 X 2 - i =1 = i (n 1) i =1 n

S =

n 1 Xi X (n 1) i =1

(para maiores detalhes, ver FONSECA & MARTINS, 1982, pg.155-157)

3.2 ESTIMAO POR INTERVALO A estimativa por ponto de um parmetro bastante til, embora no d qualquer indicao da preciso a ela associada. desejvel que uma estimativa por ponto esteja acompanhada por alguma medida do erro da estimativa. Por exemplo, uma estimativa pontual pode ser acompanhada de algum intervalo a respeito dessa estimativa, juntamente com alguma medida de segurana ou de confiana de que o verdadeiro valor do parmetro caia neste intervalo. Nesta situao, estamos falando da estimao de parmetros por intervalo. O estimador por intervalo que tem associada uma probabilidade, recebe o nome de Intervalo de Confiana (I.C.). Os limites inferior e superior desse intervalo so chamados de limites (inferior e superior) de confiana. A probabilidade de que o I.C. contenha o verdadeiro valor do parmetro chamada de Coeficiente de Confiana e denotada pela letra grega (gama). A amplitude de um I.C. calculada fazendo-se a diferena entre os dois limites de confiana (superior e inferior). Nosso objetivo encontrar um estimador por intervalo que produza intervalos pequenos, se possvel, e incluam o verdadeiro valor do parmetro com uma confiana () alta. 3.2.1 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL J sabemos que se uma varivel aleatria X tem distribuio N(; ), a mdia X obtida a partir de uma X 2 amostra de tamanho n tem distribuio N(; /n ) e a varivel Z = ~ N(0, 1). 2 n
2

Fixando uma probabilidade , iremos considerar um intervalo simtrico em relao origem, tal que = P(-zc< Z < zc), onde zc (ver Figura 5) pode ser obtido da Tbua I e o seu valor depende exclusivamente da confiana () que desejamos na estimativa. Ento Figura 5 - Distribuio normal padro X = P z c z c = P X z c X + zc n n 2 n e o I.C. para a mdia populacional, , com um coeficiente de confiana , ; X + zc I.C.(; 100%) = X z c n n e dizemos que este intervalo contem o verdadeiro valor da mdia populacional com uma confiana de 100%.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

11

Note que este I.C. centrado na mdia X e tem uma amplitude igual a 2 z c

. O coeficiente de confiana () n deve ser entendido da seguinte maneira: se a partir de k amostras independentes de tamanho n, calculamos k intervalos de confiana (diferentes) para a mdia , pelo menos k* desses intervalos devero cobrir (incluir) o verdadeiro valor de . Exemplo 3.2. Sabemos que o peso de bovinos Nelore aos 210 dias de idade tem distribuio normal com varincia 400kg2. Baseado numa amostra de 30 animais, com peso mdio de 186kg: (a) construir um I.C. para o peso mdio (populacional) desses bovinos com uma confiana = 0,95; (b) idem, para = 0,99; (c) calcular a confiana em afirmar que o verdadeiro peso mdio desses bovinos [180; 192] kg. Resoluo: (a) Da Tbua I, o valor de zc, tal que 0,95 = P(-zc < Z < zc) zc = 1,96. Com os valores amostrais e a frmula acima definida calcular os limites de confiana: 20 20 I.C.(; =95%) = [ 186 + 1,96 0,95 = P186 1,96 178,84; 193,16] kg, ou seja, este 30 30 intervalo (de amplitude 14,32kg) contem o verdadeiro valor do peso mdio dos bezerros com 95% de confiana. (b) 0,99 = P(-zc < Z < zc) zc = 2,58. Assim, o I.C.(; =99%) = [176,58; 195,42] kg, contem o verdadeiro valor do peso mdio dos bezerros, com uma confiana de 99%. 20 zc = 1,64 = P(-1,64<Z<1,64) = (c) a amplitude do I.C.() 192 180 = 12kg 12 = 2zc 30 2P(0<Z<1,64) = 2(0,4495) = 0,8990, ou seja, de 89,9% a confiana na afirmao de que o verdadeiro peso mdio dos bezerros est contido no intervalo [180; 192]kg.
2

Geralmente no conhecemos a varincia populacional ( ) e neste caso precisamos estim-la com base em 2 dados de uma amostra representativa da populao, usando um bom estimador como S , por exemplo. Quando o X tamanho da amostra relativamente grande (n>30), o Teorema do Limite Central garante que a v.a. T = S2 n tem distribuio N(0; 1) e, neste caso, o I.C.() calculado atravs de: S S I.C.(; 100%) = X z c ; X + zc n n Quando o tamanho da amostra pequeno, no podemos usar o Teorema do Limite Central e a estatstica T, definida anteriormente, no tem distribuio N(0; 1), mas sim, distribuio t-Student com = n 1 graus de liberdade.

Por exemplo: vamos encontrar o valor crtico tc = 2,093, tal que = 0,95 = P(-tc <T< tc) e T~t , na interseo da linha correspondente a = 19g.l. e coluna correspondente a p = 0,025 (ver Figura 6). Verifique que na Tbua III tc = 1,729 para = 90% e tc = 2,861 para = 99%. Figura 6 - Distribuio t(19) Fixado um valor para o coeficiente de confiana () e obtido o valor crtico, tc, na Tbua III, o I.C.(, 100%) calculado atravs da frmula:
(19)

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

12 S S ; X + tc I.C.(; 100%) = X t c n n

Exemplo 3.3. Dez animais foram alimentados com uma certa rao durante 15 dias e verificou-se que os ganhos de peso foram: 2,71; 2,93; 3,10; 3,12; 3,23; 3,76; 3,89; 4,01; 4,16 e 4,23 kg. Construir um intervalo de confiana para o ganho mdio de peso com = 0,90. Resoluo: uma estimativa da varincia populacional s2 = 1 (35,14) 2 126, 2546 = 0,3081. (10 1) 10

da Tbua III, com = 0,90 e 9 g.l. obtemos tc = 1,833; da amostra temos x = 3,51 e ento: 0,3081 I.C.(; =90%) = 3,51 1,833 = 3,51 0,32 = [3,19; 3,83] kg, ou seja, este intervalo contem o 10 verdadeiro valor do ganho de peso mdio com 90% de confiana.

3.2.2 INTERVALO DE CONFIANA PARA A PROPORO Fixando-se um coeficiente de confiana e obtendo-se o respectivo valor zc da Tbua I, o intervalo de confiana para a proporo de sucessos, p, obtido por: I.C.(p; 100%) = p z c p(1 p) n ; p + z c p(1 p) n

onde p = (nmero de sucessos)/(nmero de tentativas) uma estimativa da proporo p, calculada a partir dos n valores amostrais. Porm, na maioria das vezes, o valor do parmetro p no conhecido, impossibilitando o uso desta ltima frmula. As possveis solues para este problema so: (a) no caso de grandes amostras, substituir na frmula o valor de p pelo valor de sua estimativa p , calculada a partir dos resultados amostrais (b) no caso de pequenas amostras, usar a frmula do Intervalo de Confiana Conservativo para a proporo, que est baseada no fato de que o produto p(1-p) 0,25, cuja frmula : IC*(p; 100%) = p z c 0,25 / n ; p + z c 0,25 / n

Exemplo 3.4 Construir um IC para a proporo de eleitores favorveis ao candidato X, com um coeficiente de confiana de = 0,99, sabendo-se que de uma pesquisa eleitoral envolvendo uma amostra de 1000 eleitores, somente 248 foram favorveis sua eleio. Resoluo: na amostra: p = 248/1000 = 0,248 a proporo de eleitores favorveis ao candidato X; = 0,99 = P(-zc Z zc) zc = 2,58 como n = 1000 grande, I.C.(p; 99%) = 0,248 2,58 0,248(1 0,248) 1000 = 0,248 0,035 = [0,213; 0,283], ou seja, este intervalo (amplitude 0,07) contem a verdadeira proporo de eleitores favorveis eleio do candidato X com uma confiana de 99%. se resolvssemos construir um I.C. Conservativo para a proporo teramos: IC*(p; 99%) = 0,248 2,58 0,25 1000 = 0,248 0,041 = [0,207; 0,289], que tem uma amplitude de 0,082 unidades.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

13 4. TESTES DE HIPTESES Outro problema fundamental da Inferncia Estatstica envolve a execuo de testes de hipteses sobre o valor de parmetros de interesse de uma populao de estudo. Se conhecermos todos os elementos da populao (o que bem pouco provvel...) tambm deveremos conhecer o verdadeiro valor de um particular parmetro de interesse e no precisaremos estim-lo nem testar hipteses sobre o seu valor. Porm, na maioria das vezes, no teremos acesso a todos os elementos da populao e as nossas concluses devero ser baseadas em resultados obtidos de uma amostra representativa da populao. Para resolver este problema, buscaremos definir algumas ferramentas estatsticas que permitam validar ou refutar uma hiptese sobre algum parmetro (desconhecido) de interesse. O procedimento bsico para a execuo de um teste de hiptese sobre a mdia () de uma populao normal cuja varincia (2) conhecida, ser introduzido atravs do Exemplo 3.1. Exemplo 4.1. Est sendo realizado um leilo de bezerros Nelore com idade de 210 dias, aproximadamente. Os bezerros so procedentes de duas grandes fazendas: FAZ-1 e FAZ-2. Sabe-se que os animais da FAZ1 tm peso mdio de 145kg e desvio padro de 12kg, enquanto os animais da FAZ-2 tm peso mdio de 155kg e desvio padro de 20kg. Um lote desses animais, de procedncia ignorada, vai para leilo a um preo convidativo e um comprador leigo, para fazer ou no uma oferta, precisa conhecer a procedncia dos animais. O edital do leiloeiro informa que um pouco antes do leilo ser divulgado o peso mdio ( x ) de um lote de 25 animais. Com base neste valor, que regra de deciso o comprador deve usar para saber se o lote de animais que vai para leilo da FAZ-1 ou da FAZ-2 ? Uma resposta imediata a de considerar que os animais so da FAZ-1 se o valor de x estiver prximo de 145, e da FAZ-2 se o valor de x estiver prximo de 155. Podemos definir a seguinte regra de deciso: Se x < 150, os animais so da FAZ-1 e se x 150, os animais so da FAZ-2 Suponhamos que o comprador seja informado que x = 148kg. Ento, de acordo com a regra de deciso adotada, ele conclui que o lote de animais procedente da FAZ-1. Porm, ficam algumas dvidas sobre esta deciso: Ser que o comprador pode estar enganado quanto procedncia dos animais? possvel que o peso mdio de um lote de 25 animais da FAZ-2 seja igual a 148kg? possvel que o peso mdio de um lote de 25 animais da FAZ-1 seja superior a 150kg? Note que estas dvidas sobre a real procedncia dos animais continuariam existindo mesmo se o peso mdio da amostra de 25 animais fosse igual a 154kg, ao invs de 148kg... Estudemos os dois tipos de erro que o comprador pode cometer ao tomar uma deciso numerando-os para facilitar a linguagem: Erro tipo I: concluir que os animais so da FAZ-1, quando na verdade so da FAZ-2. Isto acontece quando a amostra de 25 animais da FAZ-2 apresenta x < 150. Erro tipo II: concluir que os animais so da FAZ-2, quando na verdade so da FAZ-1. Isto acontece quando a amostra de 25 animais da FAZ-1 apresenta x 150. De forma anloga, vamos definir tambm duas hipteses numeradas: H0: os animais so da FAZ-2, ou seja, o peso dos animais tem uma distribuio com mdia 2 = 155kg e desvio padro 2 = 20kg. H1: os animais so da FAZ-1, ou seja, o peso dos animais tem uma distribuio com mdia 1 = 145kg e desvio padro 1 = 12kg. Indiquemos por R.C. (Regio Crtica) a regio correspondente aos valores de X iguais ou inferiores a 150, que nos levam a rejeitar a hiptese H0, ou seja, RC = { X R: X < 150}. Com esta notao, a probabilidade de cometer cada um dos erros pode ser escrita como: P(Erro tipo I) = P( X RC | H0 verdadeira) = P(Erro tipo II) = P( X RC | H1 verdadeira) = Supondo que o peso dos bezerros Nelore tem distribuio normal e que a hiptese H0 verdadeira (os animais so da FAZ-2), X ~ N(155; 16). Assim, a probabilidade de cometer o erro do tipo I igual a: 150 155 = P(Z < -1,25) = 0,10565 = P(Erro tipo I) = P X < 150 | X ~ N(155,16) = P Z < 16

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

14 Assumindo que a hiptese H1 verdadeira, X ~ N(145; 5,76) e a probabilidade de cometer o erro do tipo II igual a: = P(Erro II) = P (X 150 | X ~ N(145; 5,76) ) 150 145 = P(Z 2,08) = 0,01876 = PZ 5,76 Resumindo, temos: DECISO os animais so da FAZ-1 os animais so da FAZ-2 ORIGEM REAL DOS ANIMAIS FAZ-1 sem erro Erro tipo II ( = 1,88%) FAZ-2 Erro tipo I ( = 10,56%) sem erro

De acordo com a regra de deciso adotada o comprador estar cometendo o Erro tipo I com maior probabilidade ( = 10,56%) que o Erro tipo II ( = 1,88%). De certo modo, a regra de deciso estipulada parece privilegiar a afirmao de que os animais so originrios da FAZ-1. Em relao ao mecanismo dos erros, vale observar que: i) o tamanho dos erros tipo I e II depende exclusivamente da regra de deciso adotada, que por sua vez est diretamente relacionada com a regio crtica do teste; ii) para cada regra de deciso adotada, teremos outros valores de e ; se escolhermos um valor para X <150, o valor de diminuir, enquanto que o valor de aumentar. Se, ao contrrio, escolheremos um valor para X > 150, a probabilidade diminuir mas aumentar. iii) existe um ponto X em que os valores de e so iguais. Com os dados deste exemplo, este ponto X = 148,75 e os valores de e so iguais a 5,94% (Verifique este resultado, como exerccio!!). iv) no caso geral, onde a hiptese alternativa H1 corresponde a uma desigualdade, o valor de no pode ser calculado porque no temos um nico valor alternativo para . v) os erros envolvidos num teste de hiptese podem ser generalizados como: Erro tipo I: consiste em rejeitar H0 quando H0 verdadeira Erro tipo II: consiste em aceitar H0 quando H1 verdadeira

Para testarmos uma hiptese qualquer, mais comum fixarmos um valor para (nvel de significncia do teste) e encontrarmos a regra de deciso que ir corresponder a P(Erro I) = . Por exemplo, fixando-se = 5% (o que bastante comum!) tem-se: x 155 = 0,05 = P X < x c: X~ N(155,16) = P(Z < -1,645) -1,645 = c x c = 148,42kg 16 onde x c o valor mdio crtico, ao nvel de 5% de significncia. Neste caso, a regra de deciso pode ser escrita como:

"Se X < 148,42 kg conclumos que os animais so da FAZ-1 e se X 148,42 kg, conclumos que os animais so da FAZ-2" Fixando-se = 5%, = P(Erro do tipo II) = P X 148,42 : X ~ N(145; 5,76) = P(Z 1,425) = 0,0793. Na Figura 7 esto apresentados os valores das probabilidades de ocorrncia dos erros dos tipos I e II.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

15

Figura 7 - Identificao das probabilidades e .

A especificao da hiptese alternativa H1 depende do grau de informao que temos sobre o problema. A seguir sero apresentadas duas outras situaes que ocorrem freqentemente na prtica e as respectivas hipteses alternativas e regies crticas associadas. Situao 1: suponhamos que os animais possam vir de muitas outras fazendas alem da FAZ-2 e que o interesse do comprador continua sendo por animais da FAZ-2, porque aos 210 dias esses animais tm um peso mdio nunca inferior ao dos animais das outras fazendas. Neste caso, s iremos desconfiar que os animais no so da FAZ-2 se o peso mdio dos animais for bem inferior a 155 kg. Neste caso as hipteses nula e alternativa so, respectivamente: H0: os animais so da FAZ-2, ou = 155kg; H1: os animais no so da FAZ-2, ou < 155kg e a regra de deciso, pode ser escrita como: "Se X x c conclumos que os animais so da FAZ-2, mas se X < x c conclumos que os animais no so da FAZ-2." Se, por exemplo, fixarmos = 5%, o valor crtico xc obtido fazendo-se: 0,05 = P( X < x c | X ~ N(155; 16) = P(Z < -1,65) -1,65 =

x c 155 16

x c = 148,40 kg

a regio crtica fica: RC = { x R: x <148,40} e concluiremos que os animais so da FAZ-2, ao nvel de significncia de 5%, somente se x 148,40kg. Situao 2: suponhamos agora que no exista razo para o comprador acreditar que a FAZ-2 melhor, ou seja, existem algumas fazendas melhores e outras piores que a FAZ-2. Porm, o comprador continua interessado nos animais desta fazenda. Neste caso, somente iremos desconfiar que os animais no so da FAZ-2, quando o peso mdio deles for muito diferente (muito abaixo ou muito acima) de 155 kg. Neste caso, as hipteses so escritas como: H0: os animais so da FAZ-2, ou = 155kg; H1: os animais no so da FAZ-2, ou 155kg e a regra de deciso, pode ser escrita como: "Se x c1 X x c2 conclumos que os animais so da FAZ-2, mas, se X < x c1 ou X > x c2 conclumos que os animais no so da FAZ-2." Se fixarmos = 5%, existiro muitos valores crticos, x c1 e x c 2 , que satisfazem a condio acima, mas daremos preferncia aos valores crticos que so simtricos mdia X . Ento: 0,05 = P( X < x c1 ou X > x c2 | ~ X ~ N(155,16) = P(Z < -1,96 ou Z > 1,96) x c2 = 162,84kg 16 16 e a regio crtica fica: RC = { x R | x < 147,16 ou x >162,84} e concluiremos que os animais so da FAZ-2, ao nvel de significncia de = 5%, somente se 147,16 x 162,84kg. -1,96 = 1,96 = x c1 155 x c1 = 147,16kg x c2 155

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

16 4.1 PROCEDIMENTOS BSICOS PARA A CONSTRUO DE UM TESTE DE HIPTESE Os procedimentos bsicos para a construo de um teste de hiptese sobre o valor de um parmetro genrico podem ser enumerados da seguinte maneira: i) Fixe a hiptese que ser colocada prova, H0: = 0 (hiptese da nulidade), bem como a hiptese alternativa, H1, que ser considerada verdadeira se H0 for rejeitada: H1: 0 (hiptese bilateral ou bicaudal), ou H1: > 0 (hiptese unilateral direita), ou H1: < 0 (hiptese unilateral esquerda). Quanto escolha das hipteses, FONSECA & MARTINS (1982) afirmaram que a hiptese H1 geralmente representa a suposio que o pesquisador quer provar, sendo H0 formulada com o expresso propsito de ser rejeitada. Esse procedimento conveniente, pois o equvoco de erroneamente rejeitar H0 considerado mais srio do que o equvoco de erroneamente aceitar H1 ii) Use a teoria estatstica e as informaes disponveis, para decidir qual o estimador de ser usado para julgar H0. Por exemplo, se o parmetro em estudo for , o estimador a ser usado X . iii) Fixe = P(Erro tipo I) e, assumindo que a hiptese H0 verdadeira, construa a regio crtica (R.C.) do teste. iv) Use as informaes fornecidas pela amostra, para encontrar o valor da estatstica que definir a deciso. v) Se o valor da estatstica calculada na amostra pertencer R.C. rejeite a hiptese H0 ao nvel de significncia fixado e aceite a hiptese H1 como verdadeira; se o valor da estatstica no pertencer R.C., aceite a hiptese H0 como verdadeira. 4.2 TESTE SOBRE A MDIA DE UMA POPULAO NORMAL QUANDO A VARINCIA CONHECIDA Usando os procedimentos apresentados na seo 4.1, vamos formalizar o teste sobre a mdia de uma 2 populao normal cuja varincia conhecida (situao que na prtica uma situao pouco comum!!). Exemplo 4.2 O peso ao desmame de bezerros Nelore do Campus tem um desvio padro de 12 kg. Com o objetivo de testar a hiptese de que o peso mdio dos bezerros igual a 220 kg, sorteou-se uma amostra de 80 animais obtendo-se x = 216kg. Ao nvel de significncia de 5%, podemos confirmar a hiptese feita? Resoluo: X = "peso ao desmame de bezerros Nelore", X ~ N(220,144) Obs: como no temos qualquer informao sobre o "sinal" da hiptese alternativa, optamos pela hiptese bilateral. O resultado x = 216kg, que ocasionalmente menor que 220kg, no deve influenciar a escolha da hiptese alternativa. H0: = 220 (o peso mdio ao desmame 220 kg) H1: 220 (o peso mdio ao desmame no 220 kg) estimador: X , que sob H0, tem distribuio N(220; 144/80), ou seja, X ~ N(220; 1,80)

-1,96 =

x c1 220 1,80 x c2 220 1,80

x c1 = 217,37kg

1,96 = Figura 8. Valores crticos da distribuio normal reduzida

x c1 = 222,63 kg

= 0,05 = P X < x c1 ou X > x c2 |X~N(220; 1,80) R.C. = { x R: x < 217,37 ou x > 222,63} como x = 216 kg R.C., rejeitamos a hiptese H0 ao nvel de significncia de 5% e conclumos que o peso mdio ao desmame dos bezerros Nelore no igual a 220kg.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

17 Uma maneira alternativa de realizar este teste de hiptese consiste em escrever a regio crtica em funo da v.a. padronizada Z e calcular, com base na mdia amostral e supondo que a hiptese H0 verdadeira, um valor zcalc. Posteriormente, verificamos se este valor pertence ou no R.C. e tiramos a concluso sobre o teste de hiptese. Com os dados do Exemplo 3.2, ficaramos com 216 220 RC = {z R: |z| > 1,96} e zcalc = = 2,98 1,80 concluindo (mais uma vez, claro!) que a hiptese H0 deve ser rejeitada, pois zcalc R.C. ao nvel de 5% de significncia.

4.3. NVEL DESCRITIVO DO TESTE O procedimento usual de teste de hipteses baseado na adoo de um critrio ou regra de deciso, de tal modo que = P(Erro tipo I) no exceda um valor pr-fixado. Porem, na maioria das vezes, a escolha de arbitrria. Um procedimento alternativo consiste em calcular o menor nvel de significncia para o qual a hiptese H0 rejeitada, baseado nos resultados amostrais. Este valor chamado nvel descritivo do teste e ser denotado por (ou p-value). Os passos usados neste procedimento alternativo so bastante parecidos com os do procedimento clssico, sendo que a principal diferena consiste em no construir uma regio crtica para o teste. Ao invs disto, calculamos a probabilidade de ocorrerem valores da estatstica mais favorveis rejeio da hiptese H0 que o valor observado. Agindo dessa maneira, se for um valor pequeno, rejeitamos a hiptese H0 a este nvel de significncia (no mnimo) e assumimos que a hiptese H1 verdadeira; caso contrrio, aceitamos que a hiptese H0 verdadeira. Podemos considerar como pequeno um nvel descritivo de at 5%. Exemplo 4.3. Sabe-se atravs de pesquisas, que o desvio padro da produo leiteira de uma certa raa, no Brasil, 2,3 kg/vaca/dia. Desejando-se testar a afirmao que a produo mdia do rebanho leiteiro de um certo pecuarista superior a 6,0 kg/vaca/dia, foi sorteada uma amostra de 36 vacas, que forneceu uma mdia de 6,7 kg/vaca/dia. Com base neste resultado, pede-se: a) calcular o nvel descritivo do teste e concluir se a afirmao do pecuarista est correta; b) usando o procedimento clssico, testar se a afirmao do pecuarista est correta, para = 5% e 1%. Resoluo: as hipteses envolvidas no teste so: H0: = 6,0 (a afirmao do pecuarista no est confirmada) H1: > 6,0 (a afirmao do pecuarista est confirmada) informaes: x = 6,7, = 2,3 e n = 36 o clculo de envolve o clculo da probabilidade de ocorrerem valores de X favorveis ao pecuarista, ou seja, valores que nos levem a rejeitar H0, baseado na informao da amostra: 6,7 6 = P(Z >1,83) = 0,0336 = P( X > 6,7) = P Z > 2,3 36 e conclumos que a afirmao do pecuarista somente estar correta se assumirmos um nvel de significncia igual ou superior a 3,36%. para = 5%, a RC(5%) = {z R: z > 1,65} e para = 1%, a RC(1%) = {z R: z > 2,33}. Como o valor zcalc = 1,83 pertence RC(5%), mas no pertence RC(1%), a hiptese H0 dever ser rejeitada se assumirmos = 5%, mas dever ser aceita se assumirmos = 1%. 4.4. TESTE DE HIPTESE PARA A PROPORO A seguir, apresentaremos, atravs de um exemplo, a construo de um teste de hiptese para a proporo de sucessos, baseada no roteiro descrito na seo 3.1. Exemplo 4.4. O consumidor de uma certa vacina acusou o laboratrio fabricante, dizendo que "mais de 3% das suas vacinas esto vencidas". Para confirmar (ou no) sua acusao, ele usou uma amostra de n = 80 vacinas, das quais k = 4 estavam vencidas. Com base nestes resultados, pede-se: a) O que podemos concluir sobre a acusao do consumidor, ao nvel = 0,06? b) Calcular o nvel descritivo do teste e concluir sobre a rejeio da hiptese H0.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

18 Resoluo: (a) H0: p = 0,03 (hiptese do fabricante) H1: p > 0,03 (hiptese do consumidor) 0,03(1 0,03) sob H0, p = k ~ N 0,03; ou p ~ N(0,03; 0,000364) n 80 fixando = 0,06 e assumindo H0 verdadeira, obtemos RC = {z R | z > 1,560} 0,05 0,03 da amostra: p = 4/80 = 0,05 sob H0: zcalc = = 1,05 0,000364 como zcalc RC, no rejeitamos H0 e conclumos que o consumidor no pde confirmar a sua acusao, ao nvel de significncia = 0,06. (b) = P(p > 0,05) = P(Z > zcalc) = P(Z >1,05) = 0,5 - 0,35314 = 0,147 = 14,7%, ou seja, o consumidor somente conseguir confirmar sua acusao, usando os resultados dessa amostra, se assumir um nvel de significncia 14,7% (que um valor muito alto...).

5. OUTROS TESTES DE HIPTESES Baseados nas distribuies de probabilidades Quiquadrado, t-Student e F-Snedecor ns definiremos alguns testes de hipteses envolvendo mdia e varincia de uma ou duas populaes normais.

5.1. TESTE SOBRE A MDIA DE UMA DISTRIBUIO NORMAL QUANDO A VARINCIA POPULACIONAL DESCONHECIDA Quando a varincia 2 de uma populao X ~ N(; 2) desconhecida, podemos estim-la atravs do estimador S2, j definido anteriormente. Porm, quando a estimativa est baseada numa amostra de tamanho x 0 pequeno, a estatstica T = no tem distribuio N(0; 1), mas sim t(n-1). Baseado no roteiro apresentado S2 n na seo 3.1 e nesta estatstica T iremos apresentar o teste para a mdia de uma populao normal, quando a varincia desconhecida, atravs do Exemplo 5.1. Exemplo 5.1. As mudanas observadas no teor de colesterol do sangue de coelhos aps o tratamento com um novo produto, foram medidas em 15 coelhos, cujos resultados foram: 17; 18; 22; 20; 23; 22; 21; 19; 21; 24; 22; 17; 19; 19 e 20 mg/100ml. Podemos afirmar que a mudana mdia no teor de colesterol foi inferior a 21 mg/100ml, ao nvel de significncia = 0,05? Resoluo: X: "mudana no teor de colesterol no sangue de coelhos", X ~ N(; 2). hipteses: H0 : = 21 vs. H1 : < 21 X 21 estatstica do teste: T = , que sob H0, tem distribuio t(14) S2 15 fixado = 0,05 e assumindo H0 como verdadeira, obtemos a regio crtica do teste fazendo: 0,05 = P( X < x c = P (T < t c ) tc = -1,761 (Tbua III) RC = {t R: t < -1,761} Figura 9 - Valor crtico da distribuio t(14) e = 5%
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

19 com os dados da amostra de n = 15 animais obtemos: 1 15 1 15 2 2 x = x i = 304 / 15 = 20,27 mg/100ml e s = (x i 20,27 ) = 4,4952 15 i=1 14 i=1 calculamos tcalc = 20,27 21 4, 4952 15 = -1,33 e verificamos se este valor pertence ou no RC;

como tcalc = -1,33 RC, no rejeitamos H0 e conclumos, ao nvel = 5%, que a mudana no teor de colesterol do sangue de coelhos no foi inferior a 21 mg/100ml. um intervalo de confiana para a mdia com = 95% de confiana obtido fazendo: 2,1202 2,1202 ; 20,27 + 2,14 I.C.(; 100%) = 20,27 2,14 = [19,10; 21,44] mg/100ml. 15 15

5.2 TESTE PARA A VARINCIA DE UMA DISTRIBUIO NORMAL Agora estamos interessados em testar hipteses sobre a varincia (2) de uma populao normal que, como sabemos, mede a disperso dos dados em relao mdia populacional. O teste baseado na distribuio de quiquadrado. Resumidamente temos: 1) Hipteses: H0 : 2 = 2 0 H1 : 2 2 (ou H1 : 2 < 2 ou H1: 2 > 2 ) 0 0 0 2) Estatstica do teste: Q = (n 1)S 2 , que sob H0, tem distribuio (2n 1) 2 0

3) Fixado um nvel de significncia, , a regio crtica para o teste bilateral : 2 R.C. = Q < 1 ou Q > 2 2 onde e so os valores crticos obtidos da Tbua II, tais que:
2 1 2 2 2 1- = P( 1 < Q < 2 ). 2

Figura 10 - Valores crticos do teste bilateral ao nvel . 4) Com os dados da amostra e assumindo que a hiptese H0 verdadeira, calculamos S2 e o valor da estatstica: (n 1)S 2 Qcalc = . 2 0 5) Se Qcalc R.C. rejeitamos a hiptese H0 e conclumos que a hiptese H1 verdadeira, ao nvel de significncia ; se Qcalc R.C., a hiptese H0 no dever ser rejeitada. 6) Para calcularmos um intervalo de confiana para a varincia populacional de tamanho = 1- usamos a expresso: (n 1)S 2 (n 1)S2 ; I.C.(2; 100%) = 2 2 1 2

Exemplo 5.2. Um fabricante de um tipo de ao especial afirma que seu produto tem um severo controle de qualidade, traduzido pelo desvio padro da resistncia tenso no superior a 5 kg/cm. Um comprador querendo testar essa informao, tomou uma amostra de 11 cabos e submeteu-os a um teste de tenso, obtendo x = 263 e s2 = 30. Esses resultados trazem alguma evidncia contrria afirmao do fabricante, ao nvel de significncia = 0,10?

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

20 Resoluo: hipteses: H0 : 2 = 25 H1 : 2 > 25 estatstica do teste: Q = (hiptese do fabricante) (hiptese do comprador)

(11 1)S 2 , que sob H0 tem distribuio (210 ) . 25 da Tbua II, com = 0,10 e = 10 g.l. obtemos: qc = 15,987 RC= {2 R: 2 > 15,987} (11 1)30 da amostra temos que s2 = 30 e Qcalc = = 12. 25 concluso: como Qcalc = 12 RC, no rejeitamos H0 e conclumos, ao nvel = 0,10, que o desvio padro da resistncia tenso no superior a 5 kg/cm, no trazendo evidncia contrria afirmao do fabricante. (11 1)30 (11 1)30 I.C.(2; = 90%) = ; = [ ,39; 76,14] (kg/cm)2 ou seja, este intervalo contem o verdadei16 18,307 3,940 ro valor da varincia da resistncia tenso, com 90% de confiana.

5.3. COMPARAO DAS VARINCIAS DE DUAS POPULAES NORMAIS


2 Agora, o nosso problema envolve duas populaes normais e independentes: X1 ~ N(1; 1 ) e X2 ~

N(2; 2 ), das quais retiramos amostras de tamanhos n1 e n2, respectivamente, com o objetivo de comparar suas 2 varincias. Como o teste baseado na distribuio F-Snedecor, temos uma restrio na escolha do nvel de significncia para o teste: somente encontraremos valores crticos tabelados (Tbua IV) para testes unilaterais com = 0,05 ou bilaterais com = 0,10. O procedimento bsico para a execuo do teste de hipteses comparando varincias de duas populaes normais envolve: 1) Hipteses:
2 H0: 1 = 2 = 2 2 2 H1: 1 2 2 2 2) Estatstica do teste: F = S1 2 ou H1: 1 > 2 2 2 ou H1: 1 < 2 2

2 que, sob H0, tem distribuio F(n1-1,n2-1), onde S1 e S 2 so as varincias das 2 S2 2 amostras de tamanho n1 e n2, retiradas das populaes X1 e X2, respectivamente.

3) Para facilitar a construo da regio crtica para o teste bilateral ( = 0,10) ou para o teste unilateral ( = 0,05) tomaremos o cuidado de colocar no numerador da estatstica F a maior das duas varincias amostrais. Na Tbua IV obtemos o valor crtico fc, com 1 = (n1 -1) e 2 = (n2 -1) graus de liberdade, tal que 0,05 = P(F > fc) e ento escrevemos R.C. = {F R: F > fc}, mesmo se a hiptese alternativa for bilateral.
2 4) Com as varincias amostrais, s1 e s 2 , calculamos Fcalc = 2 2 maior das varincias amostrais, ou seja, s1 > s 2 ). 2 2 s1

s2 2

(por convenincia, colocamos no numerador a

5) Concluso: se Fcalc RC rejeitamos H0 (ao nvel de significncia ) e aceitamos H1 como verdadeira; se Fcalc RC, aceitamos H0 como verdadeira. Realizado o teste e no rejeitada a hiptese de igualdade das varincias, podemos calcular uma estimativa para a varincia comum s duas populaes, combinando as duas estimativas atravs da frmula: S2 comum =
2 (n 1 1)S1 + (n 2 1)S 2 2 (n 1 + n 2 2)

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

21 Exemplo 5.3. Num experimento com frangos de corte alojados em boxes com 10 aves foram comparadas duas raes (A e B). Avaliou-se o peso mdio (em kg) das aves aos 49 dias de idade. Os resultados encontrados foram os seguintes: Rao A Rao B 2,10 1,89 2,34 1,92 2,24 1,85 2,07 1,82 2,10 1,96 2,03 1,94 2,20

Baseado nesses dados podemos afirmar, ao nvel de significncia = 10%, que os pesos dos dois grupos de aves so igualmente homogneos? Ou seja, que tm varincias iguais ?
Resoluo: 2 2 hipteses: H0: 1 = 2 = 2 vs. H1: 1 2 2 2 S2 estatstica do teste: F = 1 S2 2 , que sob H0, tem distribuio F(6; 5).

fixando = 0,10, da Tbua IV temos fc = 4,95 RC = {F R: F > 4,95}


2 s1 = 0,0121 e s 2 = 0,0029 Fcalc = 0,0121/0,0029 = 4,17 e como Fcalc = 4,17 RC, no rejeitamos H0 e 2

conclumos, ao nvel = 10%, que as varincias dos pesos dos dois grupos de frangos de corte so iguais. uma estimativa da varincia (comum) dos pesos dos dois grupos de frangos de corte : (7 1) 0,0121 + (6 1) 0,0029 s2 = 0,0079 kg2 comum = (7 + 6 2)

5.4 COMPARAES DAS MDIAS DE DUAS POPULAES NORMAIS


2 Desejamos comparar as mdias de duas populaes: X1 ~ N(1; 1 ) e X2 ~ N(2; 2 ), cujas varincias 2 podem ser conhecidas ou no. As hipteses envolvidas nas comparaes entre as mdias podem ser escritas:

H0: 1 = 2 (ou H0: 1 - 2 = 0) H1: 1 2 (ou H0: 1 - 2 0) (hiptese bilateral) ou H1: 1 > 2 (ou H0: 1 - 2 > 0) (hiptese unilateral direita) ou H1: 1 < 2 (ou H0: 1 - 2 < 0) (hiptese unilateral esquerda) A partir de amostras independentes de n1 elementos da populao X1 e de n2 elementos da populao X2 podemos estimar a mdia e a varincia (se esta for desconhecida) de cada populao usando os estimadores X e

S 2 , j conhecidos. De estudos anteriores, tambm j sabemos que:


a) E(X1 X 2 ) = E (X1 ) - E (X 2 ) = 1 - 2 b) Var (X1 X 2 ) = Var (X1 ) + Var (X 2 ) - 2Cov (X1 ; X 2 ) =
2 1 2 + 2 - 2Cov (X1 ; X 2 ) n1 n2

2 Quando as populaes X1 e X2 so independentes (Cov ( X1 ; X 2 ) = 0 ) e as varincias 1 e 2 so conhecidas, a 2 estatstica definida por

Z =

(X

X 2 ) (1 2 )
2 1 2 + 2 n1 n 2

tem distribuio N(0; 1) e deve ser utilizada nas comparaes envolvendo as mdias de duas populaes normais. Um intervalo de confiana para a diferena entre as mdias pode ser obtido atravs da expresso:
2 2 1 2 1 2 I.C.( 1 - 2; 100%) = (X1 X 2 ) z c + 2 ; (X1 X 2 )+ z c + 2 n1 n 2 n1 n 2

onde zc o valor crtico obtido na Tbua I, tal que = P(-zc < Z < zc).
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

22 Porm, mais comum desconhecermos tanto as mdias quanto as varincias populacionais e antes de compararmos as mdias, precisamos saber se as varincias das duas populaes podem ser consideradas iguais ou no. Se ainda no temos esta informao, podemos obt-la atravs do teste apresentado na seo 5.3. Em uma outra situao bastante comum, precisaremos comparar as mdias de duas populaes que no so independentes, caso em que so feitas observaes de uma varivel resposta nos mesmos indivduos ou em pares deles, em duas situaes diferentes.

5.4.1 COMPARAES ENTRE AS MDIAS DE DUAS POPULAES NORMAIS QUANDO AS VARINCIAS SO DESCONHECIDAS, MAS IGUAIS Caso a hiptese de igualdade das varincias seja aceita, a estatstica do teste usado para comparar as mdias de duas populaes normais : T =

(X

X 2 (1 2 )

1 1 + S2 comum n1 n 2

onde S2 comum a estimativa da varincia comum das duas populaes. Sob H0: 1 = 2, a estatstica T tem distribuio t-Student com (n1 + n2 - 2) graus de liberdade. Um intervalo de confiana para a diferena entre as mdias, 1 e 2, pode ser obtido por: 1 1 1 1 2 2 I.C.( 1 - 2; 100%) = (X1 X 2 ) t c Scomum + ; (X1 X 2 )+ t c Scomum + n n 1 n2 1 n2 onde tc o valor crtico obtido na Tbua I, tal que = P(-tc < T < tc).

Exemplo 5.4 Duas solues qumicas, Q1 e Q2, vo ser avaliadas quanto ao valor do pH. A anlise de 21 amostras da soluo Q1 acusou um pH mdio de 7,68 e desvio padro 0,016, enquanto que a anlise de 31 amostras de Q2 acusou pH mdio de 7,23 e desvio padro 0,022. Ao nvel = 1% de significncia, podemos afirmar que as duas solues tm pH mdios iguais? Resoluo: (a) comparao das varincias:
2 2 hipteses: H0: 1 = 2 = 2 vs. H1: 1 2 2 2 2 estatstica do teste: F = S2

2 S1

, que sob H0, tem distribuio F com 1 = 31-1 = 30 e 2 = 21-1 = 20 g.l.

fixando alfa = 0,10, da Tbua IV, fc = 2,04 RC = {F R: F > 2,04} das amostras: Fcalc = (0,022)2/(0,016)2 = 1,89 e como Fcalc = 1,89 RC, no rejeitamos H0 e conclumos, = 10%, que as varincias dos pHs das duas solues podem ser considerados iguais. uma estimativa da varincia comum do pH das duas solues : s2 comum = (31 1)(0,022) + (21 1)(0,016) = 0,00039 (31 + 21 2)
2 2

(b) comparao das mdias: hipteses: H0: 1 = 2 vs. H1: 1 2 estatstica T =

(X

X 2 ) 0

1 1 2 S comum + 21 31

, que sob H0, tem distribuio t(50).

fixando = 0,01, da Tbua III, obtemos tc = 2,678 R.C. = {t R: t < -2,678 ou t > 2,678}
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

23 das amostras: Tcalc =

(7,68 7,23) 0
1 1 0,00039 + 21 31

0,45 = 80,645 0,00558

como Tcalc = 80,645 R.C., rejeitamos a hiptese de igualdade dos pHs mdios e conclumos, ao nvel = 1%, que os pHs mdios das duas solues so diferentes. 1 1 o intervalo: I.C.(1-2; 99%) = (7,68 - 7,23) 2,678 0,00039 + = [0,435; 0,465] , contem a real 21 31 diferena entre os pH' s mdios das duas solues, com uma confiana de 99%.

5.4.2 COMPARAES ENTRE AS MDIAS DE DUAS POPULAES NORMAIS QUANDO AS VARINCIAS SO DESCONHECIDAS E DIFERENTES Caso a hiptese de igualdade das varincias seja rejeitada, no existe um teste exato para comparar as mdias das populaes normais, mas de varincias diferentes e desconhecidas. Este problema pode ser contornado utilizando-se a estatstica T* =

(X

X 2 (1 2 )
2 S1 S 2 + 2 n 1 n2

que tem distribuio aproximada t-Student com graus de liberdade, onde calculado por:
2

2 s1 s 2 + 2 n n2 1 = 2 2 2 s1 s2 2 n 1 + n2 n1 1 n 2 1

(Frmula de Sattertweit)

Um intervalo de confiana aproximado para a diferena entre as mdias, 1 e 2, pode ser obtido atravs da expresso: S2 S2 S2 S 2 I.C.*( 1 -2; 100%) = (X1 X 2 ) t 1 + 2 ; (X1 X 2 )+ t 1 + 2 c c n1 n 2 n1 n 2 onde t o valor crtico obtido na Tbua III, tal que = P(- t < T*< t ), com T* ~ t() e calculado usandoc c c se a Frmula de Sattertweit.

Exemplo 5.5. Queremos testar se os dois tipos de vigas de ao, A e B, tm a mesma resistncia mdia (em t/cm2), ao nvel = 5% de significncia. Avaliando-se 15 vigas do tipo A e 20 vigas do tipo B, os resultados foram: Viga A B Resoluo:
2 2 (a) comparao das varincias: H0: 1 = 2 = 2 vs. H1: 1 2 2 2 2 F = SB

amostra 15 20

mdia 70,5 84,3

varincia 81,6 246,3

, que sob H0, tem distribuio F(19; 14) fixando alfa = 0,10, da Tbua IV, fc = 2,40 RC = S2 A {F R: F > 2,40}

das amostras: Fcalc = 246,3/81,6 = 3,02 RC, rejeitamos H0 e conclumos, ao nvel = 10%, que as varincias das resistncias dos dois tipos de vigas so diferentes.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

24 (b) comparao das mdias: H0: 1 = 2 vs. H1: 1 2 como as varincias populacionais foram consideradas diferentes, a estatstica do teste (aproximado) T* = (X1 X 2 ) 0 , que sob H0 tem distribuio t(), onde = 315,240025 31 g.l da Tbua III t = 2,042 c 2 10,095893 S1 S 2 2 + 15 20 RC = { T* R: T* > 2,042} 81,6 246,3 + 20 15 e conclumos, = 5% que as resistncias mdias das vigas A e B so diferentes.
Tcalc =

(70,5 84,3) 0

13,8 = -3,28 RC rejeitamos a hiptese de igualdade resistncias mdias 4,2137

81,6 246,3 I.C.(1-2; 95%) = (70,5 - 84,3) 2,042 + = -13,8 8,60 = [ 22,4; 5,2]t/cm2. 20 15

5.4.3 COMPARAES ENTRE AS MDIAS DE DUAS POPULAES NORMAIS QUANDO AS OBSERVAES SO PAREADAS Muitas vezes a comparao de mdias de duas populaes normais pode ser prejudicada pela ao de fatores externos que no podem ser controlados. Por exemplo, um tratamento com suplementao de alfafa (Trat-A) usado na alimentao de coelhos pode ser considerado melhor que um tratamento sem suplementao (Trat-B), somente porque os animais escolhidos para receber o Trat-A tm maior facilidade em ganhar peso que os animais escolhidos para receber o Trat-B e no porque a suplementao melhora o desempenho. Este problema pode ser contornado utilizando-se um artifcio que consiste em coletar as observaes da varivel resposta em pares de indivduos que sejam bastante homogneos em todos os sentidos, exceto no que diz respeito quele fator (ou tratamento) que desejamos comparar. No exemplo da suplementao de alfafa em coelhos, ns podemos utilizar pares de coelhos semelhantes quanto raa, filiao, peso inicial, sexo e idade. Um dos coelhos de cada par recebe o Trat-A e o outro recebe o Trat-B. Com isso, conseguimos um maior controle de fatores secundrios que podem influenciar os resultados da comparao das mdias. Um outro artifcio utilizado nessas situaes consiste em fazer observaes da varivel antes e depois da aplicao do tratamento, nos mesmos indivduos. Para a comparao das mdias das duas populaes X ~ N(X; 2 ) e Y ~ N(Y; 2 ), sero utilizados n X Y pares de valores (Xi; Yi), para i = 1, 2, 3, ..., n. Definimos uma nova varivel D = X Y e, conseqentemente, teremos uma amostra de n diferenas D1, D2 , ..., Dn que sero utilizadas na comparao das mdias das duas populaes. Supondo que a varivel D = X Y tenha distribuio N(D; 2 ), segue que D ~ N D ; 2 n , D D 2 1 onde 2 pode ser estimada utilizando-se o estimador justo S2 = (D i D ) . D D n 1 Como D = E(X Y) = E(X) E(Y) = X Y, qualquer hiptese feita sobre o parmetro D corresponde a uma hiptese feita sobre as mdias das populaes X e Y. Por exemplo, as hipteses Ho: X = Y e H1: X > Y correspondem s hipteses H0: D = 0 e H1: D > 0, respectivamente. Deste modo, as hipteses a serem testadas podem ser escritas como H0: D = * (onde * um valor qualquer)

H1: D * ou H1: D > * ou H1: D < * e a estatstica do teste T = D D S2 D n , que sob Ho: D = *, tem distribuio t(n-1).

Um intervalo de confiana para a diferena de mdias D = X Y, com uma confiana pode ser obtido atravs de:
2 2 I.C.(d; 100%) = D t c S D ; D + t c SD n n

onde tc o valor crtico obtido da Tabela III, tal que P(-tc < T < tc) = , com T ~ t(n-1).
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

25 Exemplo 5.6. Com o objetivo de testar ( = 5%) se a suplementao de alfafa aumenta o ganho mdio de peso de coelhos em mais de 0,10kg, foram utilizados 8 pares de coelhos, cujos resultados foram: Par no X (com) Y (sem) D=XY 1 0,72 0,32 0,40 2 0,90 0,49 0,41 3 0,67 0,51 0,16 4 0,83 0,45 0,38 5 0,67 0,70 -0,03 6 0,93 0,52 0,41 7 0,80 0,35 0,45 8 0,75 0,60 0,15

Resoluo: hipteses: H0: D = 0,10 vs. H1: D > 0,10, com D = X Y. estatstica: T = D 0,10 S2 D 8 0,29 0,10 0,0305 , que sob H0, tem distribuio t(7).

da Tbua III, para = 5% = P(T > tc), tc = 1,895 R.C. = {t R: t > 1,895}. das amostras: d = 0,29 e s 2 = 0,0305 tcalc = D = 3,08 R.C. rejeitamos a hiptese H0 e con-

8 clumos, ao nvel de 5% de significncia, que a suplementao de alfafa aumenta o ganho mdio de peso de coelhos em mais de 0,10kg. I.C.(D; 90%) = 0,19 1,895 0,0305 ; 0,19 + 1,895 0,0305 = [0,073; 0,307] kg, ou seja, este intervalo 8 8 contem o verdadeiro aumento de ganho mdio de peso de coelhos resultante da suplementao com alfafa, com uma confiana de 90%.

6 CORRELAO E REGRESSO LINEAR SIMPLES


Um problema freqentemente encontrado na prtica o da determinao do valor de uma grandeza, partindo do conhecimento do valor de outras, ou porque estas ltimas so de mais fcil medida, ou porque estas antecedem no tempo primeira. Em qualquer dos casos, so utilizadas frmulas (ou modelos) para relacionar os valores desconhecidos e conhecidos das diversas grandezas. Algumas destas frmulas resultam do emprego do mtodo dedutivo a uma srie de postulados e definies, como por exemplo, as de geometria ou da mecnica racional. Outras resultam apenas da observao. Por exemplo: a partir de vrios valores simultneos da altura pluviomtrica de um rio e sua vazo, estabelecemos uma expresso (um modelo), relacionando as duas grandezas. As frmulas obtidas dedutivamente so ditas tericas e as que resultam indutivamente das observaes so ditas empricas. A Anlise de Regresso um metodo para o estabelecimento de frmulas empricas. Um outro problema bastante freqente simplesmente verificarmos se duas grandezas se relacionam entre si. Ao invs de procurarmos estabelecer modelos, buscamos quantificar o grau de relacionamento entre as grandezas. Na soluo dos dois problemas expostos acima podemos utilizar uma ferramenta preciosa que deve nos auxiliar a entender melhor "o que est acontecendo": o Grfico de Disperso. Neste tipo de grfico plotamos os valores das variveis envolvidas no estudo e procuramos visualizar uma relao funcional entre elas.

6.1 CORRELAO LINEAR Um problema de correlao surge quando queremos saber se existe alguma relao (de dependncia) entre um par de variveis quantitativas e ao invs de procurarmos um modelo que as relacionam, buscamos quantificar o possvel relacionamento entre elas. Por exemplo, quantificar a relao entre o consumo de fumo e incidncia de doenas do corao, ou entre o peso do animal ao nascer e o seu peso ao abate. Uma medida do grau de relacionamento entre duas variveis quantitativas X e Y obtida atravs do Coeficiente de Correlao Linear de Pearson, que definido por: (X,Y) = cov( X, Y) Var(X) Var(Y)

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

26 e pode assumir valores entre -1 e 1, isto -1 (X,Y) 1. O sinal de (X,Y) indica o sentido da dependncia entre as variveis X e Y: o sinal positivo indica que os valores de X e Y crescem no mesmo sentido, enquanto que o sinal negativo indica que os valores de Y decrescem com o crescimento de X (ou vice-versa). Um valor de (X,Y) prximo a zero indica que no existe qualquer relao linear entre estas variveis. Nos grficos de disperso apresentados a seguir (Figura 11), idealizamos essas situaes extremas e relativamente freqentes: (X,Y) +1 (X,Y) -1 (X,Y) 0

Figura 11. Grficos de disperso e coeficientes de correlao. Como geralmente no temos acesso a todos os resultados possveis das duas variveis X e Y, podemos sortear uma amostra de n pares de valores (x, y) e estimar o coeficiente de correlao linear de Pearson atravs da frmula:

(X i X )(Yi Y )
n

r(X,Y) =

i =1

(X
n i =1

X ) (Yi Y )
2 n i =1

n n X i Yi i =1 i=1 X i Yi n i =1 2 2 n n Xi n Yi n X 2 i=1 Y 2 i=1 i i i=1 i=1 n n


n

Nos testes de hipteses sobre o parmetro (X,Y) usamos o valor de r(X,Y), como sua melhor estimativa. Os testes mais comuns so: Teste de independncia das variveis X e Y: hipteses: H0: (X,Y) = 0 vs. H1: (X,Y) 0 estatstica: t = r(X, Y ) (n 2)

(1 r

( X, Y)

, que sob H0, tem distribuio t(n-2).

Teste H0: (X,Y) = 0 (onde -1< 0 < 1 e 0 0, um nmero real): hipteses: H0: (X,Y) = 0 vs. H1: (X,Y) 0 (H1: (X,Y) > 0, ou H1: (X,Y) < 0) estatstica: Z = z= z z (transformada Z de Fisher), que sob H0, tem distribuio N(0; 1) e z e = Z 1 (n 3)

1 1 + 0 1 1 + r (X, y) Ln 1 r(X, Y) , Z = 2 Ln 1 2 0

Exemplo 6.1 Com o objetivo de estudar a relao entre o peso mdio de coelhos ao abate (Y), em quilogramas, e o tamanho de ninhada (X), foram coletados na granja do Campus os dados apresentados a seguir. X Y 4 2,125 8 1,980 6 2,270 1 2,300 7 1,880 3 2,320 7 1,860 5 2,050

Com base nesses dados, pede-se: (a) calcular o coeficiente de correlao; (b) testar a independncia entre as variveis X e Y, ao nvel de significncia de 5%.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

27 Resoluo: (a)
2,40

2,30 Peso mdio ao abate (kg)

2,20

2,10

2,00

1,90

1,80 0 1 2 3 4 5 6 7 8 9 Tamanho da ninhada

Figura 12 Grfico de disperso do peso mdio de coelhos ao abate e tamanho de ninhada. Uma dependncia linear negativa entre o tamanho da ninhada e o peso mdio de coelhos ao abate pode ser visualizado na Figura 12. Para estimar o coeficiente de correlao, usaremos
2 2 X i = 41; X i = 249; Yi = 16,785; Yi = 35,458 e X i Yi = 83,650 i =1 i =1 i =1 i =1 i =1 8 8 8 8 8

r(X,Y) =

83,650
2

(41)(16,785) 8
2

(41) (16,785) 249 35,458 8 8

2,373 = -0,775 3,061

confirmando a existncia da dependncia linear negativa e relativamente alta entre o peso mdio de coelhos ao abate e o tamanho de ninhada, significando que quanto maior ninhada, menor o peso mdio ao abate. (b) hiptese: H0: (X,Y) = 0 (independncia) H1: (X,Y) 0 r ( X, Y) 8 2 sob H0, a estatstica t = tem distribuio t(6). [1 r 2 (X, Y)] da Tbua III, tc = 2,45 R.C. = {t R: t > 2,45} com os dados amostrais, calculamos tcalc = = -3,00 RC rejeitamos a hiptese H0 e con1 (0,775) 2 clumos, ao nvel de significncia de 5%, que as variveis X e Y no so independentes, ou ainda, que existe uma dependncia linear negativa entre o peso mdio de coelhos ao abate e o tamanho da ninhada. 0,775 6

Exemplo 6.2 Com o intuito de testar a hiptese de que a correlao entre o ganho de peso e a quantidade de matria seca ingerida por bovinos da raa Nelore superior a 0,70, foram utilizados os dados de um experimento com 18 desses animais, resultando em r(X,Y) = 0,81. O que podemos concluir ao nvel de significncia de = 1%? Resoluo: hipteses: H0: (X,Y) = 0,70 vs. H1: (X,Y) > 0,70 z z 1 1 + 0,70 sob H0, a estatstica Z = = 0,8673 e Z = ~ N(0; 1), com Z = Ln z 2 1 0,70 da Tbua I, para = 1%, zt = 2,33 R.C. = {Z R: Z > 2,33} 1 (18 3)

= 0,2582.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

28 da amostra: z = 1 1 + 0,81 1,1270 0,8673 Ln = 1,01 RC no rejeitamos H0 e con 1 0,81 = 1,1270 e Zcalc = 2 0,2582

clumos (=1%) que a correlao entre o ganho de peso e a quantidade de matria seca ingerida por bovinos da raa Nelore no superior a 0,70.

6.2 REGRESSO LINEAR SIMPLES Existem situaes em que desejamos estudar o comportamento conjunto de duas ou mais variveis, como por exemplo: relacionar o peso do animal com sua idade, a quantidade de adubo com a produo de matria seca, etc. Quando o interesse est em procurar expressar essa relao sob a forma de uma equao matemtica, estamos fazendo uma Anlise de Regresso. Essa equao de regresso pode ser um polinmio (uma reta, parbola ou um polinmio de grau mais elevado), uma funo do tipo exponencial (curva logstica, de Gompertz ou von Bertalanfy) etc. Nesta aula estudaremos o ajuste de uma reta em problemas envolvendo somente duas variveis: Y, denominada varivel dependente e X, denominada varivel independente ou covariada. Para visualizar a relao funcional entre essas variveis construmos um Grfico de Disperso. A distribuio dos pontos no grfico pode sugerir qual funo explica bem o comportamento dos dados.

Exemplo 6.3 Determinar a reta que relaciona a Absorbncia (Y) com a concentrao de nitrito (X, em mg/100ml) em amostras de mortadela. Os dados experimentais so: X: nitrito Y: Absorbncia 0,5 0,040 1,0 0,078 2,0 0,145 3,0 0,215
. 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0 1 2 3 4 5 6 7 8 9 10 Quantidade de nitrito (mg/100ml)

4,0 0,300

5,0 0,340

6,0 0,395

7,0 0,460

8,0 0,560

9,0 0,715

Figura 13 Grfico de disperso dos dados de Absorbncia e quantidade de nitrito. Analisando a Figura 13, podemos concluir que a relao entre X e Y pode ser explicada por uma reta (funo linear), cuja equao Y = a + bX. Teoricamente, esta reta deve passar pela origem significando que para uma quantidade de nitrito na soluo nula, a absorbncia tambm ser nula. Tendo decidido que uma reta explica bem a relao funcional entre X e Y precisamos calcular os valores dos seus coeficientes linear e angular. Isso pode ser feito, por exemplo, mo livre, traando-se uma reta que "passe pelo meio dos pontos", e a partir desta reta obter um valor para o coeficiente "a", que o intercepto do eixo das ordenadas (que esperamos, seja nulo) e outro valor para o coeficiente "b" = y/x, que o coeficiente angular da reta. Porem, este mtodo tem o inconveniente de observadores diferentes obterem valores diferentes para os coeficientes... A seguir, definiremos um mtodo de estimao que independe do usurio e sempre fornece as melhores estimativas dos coeficientes de uma reta de regresso.

Absorbncia

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

29 6.2.1 O MODELO PARA REGRESSO LINEAR SIMPLES Dados n pares de valores: (X1, Y1), (X2, Y2), ...,(Xn, Yn) podemos estabelecer uma regresso linear simples atravs do modelo: Yi = a + bXi + ei onde a e b so os parmetros da reta e ei o erro associado Yi. Ao estabelecer este modelo, pressupomos que: (a) a relao entre X e Y linear; (b) os valores da varivel X no so sujeitos a erros (so fixos); (c) a mdia dos erros nula, isto , E(ei) = 0; (d) para um dado valor Xi, a varincia do erro constante e igual a 2, denominada varincia residual, isto , Var(ei) = 2; (e) a correlao entre os erros de duas observaes nula, isto , Corr(ei,ej) = 0, para i j; (f) os erros tm distribuio normal, isto , ei ~ N(0, 2). As estimativas dos parmetros da reta so obtidas atravs do Mtodo dos Mnimos Quadrados (MMQ), que consiste em "obter estimativas de a e de b, que minimizam a soma dos quadrados dos erros", ou seja, que minimizam a funo SQE = (Yi a bX i )
n i =1 2

Para obtermos o mnimo desta funo derivamos parcialmente SQE em relao aos parmetros a e b: n SQE = (Yi a bX i )(2) a i =1 n SQE = (Yi a bX i )(2X i ) b i =1 Igualando essas derivadas a zero (para calcular os pontos crticos!), vamos procurar os estimadores de a e b que satisfazem o seguinte Sistema de Equaes Normais:
n n Yi = na + b X i i 1 i =1 n = n n X i Yi = a X i + b X i2 i =1 i =1 i=1

Resolvendo o sistema (duas equaes e duas incgnitas), obtemos os seguintes estimadores de mnimos quadrados dos parmetros do modelo:

b =

(X i X )(Yi Y )
i =1

X i Yi
=
i =1

X i Yi
i =1 i =1

n
2

(X i X )
i =1

n Xi n i =1 X2 i n i =1

a = Y bX Com os valores de a e b , a observao Yi pode ser estimada por: Yi = a + bX i e o resduo de regresso pode ser calculado por: e = Yi Y = Yi ( a + bX ).
i i i

Do Exemplo 6.3, temos: X i = 45,5; X 2 = 285,25; Yi = 3,240; Yi2 = 1,473 e X i Yi = i


i =1 i =1 i =1 i =1 i =1

10

10

10

10

10

20,438. Com esses valores calculamos as estimativas dos parmetros da reta de regresso: (45,5 3,248) 20,438 5,6596 3,248 10 = b = = 0,07235 e a = - (0,0724)(4,55) = 0,0044 78,2250 10 (45,5) 2 285,25 10
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

30 a reta que melhor se ajusta aos dados : Yi = 0,0046 + 0,07235Xi. O coeficiente angular da reta (0,07235) pode ser entendido como o nmero de unidades que ser acrescido a Y, quando X sofrer um acrscimo de 1 mg/100ml; j o intercepto (-0,0044) pode ser entendido como a absorbncia de uma concentrao nula de nitrito. A qualidade do ajuste de uma regresso pode ser avaliada atravs de grficos de resduos e do coeficiente de determinao. O Coeficiente de Determinao pode ser calculado atravs da frmula: R = b
2

()

( X i X)
i =1 n

(Yi Y )
i =1

,
2

com 0 R2 1

e quanto mais prximo de 1 (um) estiver o valor de R2, melhor a qualidade do ajuste. Pelas pressuposies do modelo, esperamos que os pontos (Xi; e i ) estejam distribudos aleatoriamente em relao reta X = 0, sem apresentar qualquer tendncia. Porm, se os resduos apresentarem alguma tendncia, quadrtica, por exemplo, deveremos propor um novo modelo que inclua um componente quadrtico, do tipo c X 2 , ajustar este novo modelo e estudar a qualidade do ajuste deste novo modelo. i O grfico de disperso dos resduos tambm serve para evidenciar a presena de pontos discrepantes (resultantes de grandes erros de medidas, de digitao etc.) que, aps um estudo mais detalhado, podero at ser excludos do conjunto de dados originais. 78,2250 = 0,97 (verifique!) indica que a relao entre a 0,42324 concentrao de nitrito e a absorbncia est muito bem explicada pela reta. Para construir o grfico de disperso (Xi; e i ), calculamos os valores ajustados Yi = 0,0044 + 0,07235 X i e os resduos do ajuste, e i = Yi Yi : No Exemplo 6.3, o valor de R2 = (0,07235) 2

Xi Yi
Yi ei

0,5 0,0400 0,0318 0,0082

1,0 0,0780 0,0680 0,0100


0,08 0,06 0,04 0,02 Resduo 0,00 -0,02 -0,04 -0,06 -0,08 0 1

2,0 0,1450 0,1403 0,0047

3,0 0,2150 0,2127 0,0023

4,0 0,3000 0,2850 0,0150

5,0 0,3400 0,3574 -0,0174

6,0 0,3950 0,4297 -0,0347

7,0 0,4600 0,5021 -0,0421

8,0 0,5600 0,5744 -0,0144

9,0 0,7150 0,6468 0,0682

ponto discrepante (?)

10

Quantidade de nitrito (mg/100ml)

Figura 14 - Grfico dos resduos vs. quantidade de nitrito.

Atravs do grfico de disperso dos resduos (Figura 14) podemos perceber que o comportamento dos resduos no bem aleatrio e que ponto (9,0; 0,715) tem um resduo grande, sendo um candidato a ponto discrepante. Como alternativas para continuar a anlise podemos: (i) excluir o ponto (9,0; 0,715) e ajusta novamente uma reta aos dados (fica como exerccio), ou (ii) manter este ponto e incluir algum termo quadrtico no modelo (o que mais trabalhoso!).

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

31

6.2.2. INFERNCIA SOBRE OS ESTIMADORES DOS PARMETROS DA RETA DE REGRESSO


Quanto aos estimadores dos parmetros da regresso, pode-se provar que: (i) a e b so estimadores justos ou no viesados dos parmetros a e b, respectivamente, o que quer dizer: E( a ) = a e E( b )= b. (ii) as varincias e covarincias dos estimadores so: 1 X2 Var( a ) = + n n (X i X ) 2 i =1
2

2 X , Var( b ) = e Cov( a , b ) = 2 2 (X i X ) (X i X ) n 1 que podem ser estimadas, substituindo-se 2 por S2 = (Yi Yi ) 2 (n 2) i=1 (iii) Intervalos de Confiana para os parmetros da reta: 1 X2 S + n n (X i X ) 2 i =1
2

I.C.(a; 100%) = a tc

I.C.(b; 100%) = b tc

S2

(X i X )
i =1

,
2

onde tc o valor crtico obtido da Tbua III, tal que = P(-tc T tc) e T ~ t(n-2). (iv) Intervalo de Predio: Para um valor Xp, que pertence ao domnio da varivel X mas no foi usado na esti mao de a e b podemos calcular Y = a + b Xp e um intervalo de confiana para Yp, chamado Intervalo de
p

Predio, utilizando: 2 Xp X 1 S + n n (X i X ) 2 i =1
2

I.C.( Yp; 100%) = Yp tc

(v) Teste de hiptese para os parmetros da reta de regresso. Intercepto: H0: a = a0 vs. H1: a a0 (ou H1: a < a0 ou H1: a > a0) a a0 Estatstica do teste: T = , que sob H0, tem distribuio t(n-2). 1 X2 S2 + n n 2 (X i X ) i =1 Coeficiente angular: H0: b = b0 vs. H1: b b0 (ou H1: b < b0 ou H1: b > b0) b b0 Estatstica do teste: T = , que sob H0, tem distribuio t(n-2). S2

( X i X) 2
i =1

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

32 Aproveitando os dados do Exemplo 6.3, vamos estimar a varincia, calcular um intervalo de confiana para a inclinao da reta ( = 95%) , um intervalo de predio para Xp = 9,5 mg/100ml e testar a hiptese de que o intercepto da reta nulo, ao nvel de 5% de significncia. Resoluo: s2 = 1 0,00856 = 0,0011 10 2

I.C.(b; 95%) = 0,07235 2,306

0,0011 = 0,07235 0,00865 = [0,0637; 0,0810] , ou seja, este intervalo 78,2250 contem o verdadeiro valor da inclinao da reta, com uma confiana de 95%.

1 (9,5 4,55) 2 Para Xp = 9,5, I.C.(Yp; 95%) = 0,6832 2,306 + 0,0011 = 0,6834 0,0492 78,2250 10 I.C.(Yp; 95%) = [0,6342; 0,7326] Hipteses: H0: a = 0 vs. H1: a 0 Estatstica do teste: T = a 0 X2 1 + n 10 2 (X i X ) i =1 S2 , que sob H0, tem distribuio t(8).

Para = 5%, tc = 2,306 R.C. = {T R: T > 2,306} 0,0044 0 0,0044 Da amostra: Tcalc = = = -0,22 R.C. no rejeitamos H0 ao nvel 0,0200 1 (4,55) 2 + 10 78,2250 0,0011 = 5% e conclumos que o intercepto da reta pode ser considerado nulo.

7. TESTES DE QUI-QUADRADO
At a aula anterior, vimos como testar hipteses sobre um parmetro (populacional) ou mesmo sobre a comparao de parmetros de duas populaes normais. Vamos agora, estudar alguns testes que no dependem dos parmetros nem de suas respectivas estimativas.

7.1 TESTE DE ADERNCIA, AJUSTAMENTO OU ADEQUAO DE UM MODELO Como j foi evidenciado anteriormente, os resultados amostrais nem sempre concordam exatamente com os resultados tericos esperados, o que parcialmente justificado pelas leis probabilsticas. Suponhamos uma amostra de n elementos de uma determinada populao. Seja E1, E2, ..., Ek um conjunto de eventos e Fo1, Fo2, ..., Fok suas respectivas freqncias observadas na amostra. Podemos estabelecer algumas hipteses sobre as freqncias observadas e as freqncias esperadas ou tericas Fe1, Fe2, ..., Fek e verificar se essas freqncias (observadas e esperadas) diferem significativamente entre si atravs de um teste de hiptese. Neste caso, iremos efetuar um teste de aderncia, adequao ou ajustamento de um modelo terico. As hipteses a serem testadas podem ser escritas como: H0: o modelo terico se adeqa bem aos dados. H1: o modelo terico no se adeqa bem aos dados. Uma medida de discrepncia entre as freqncias Foi e Fi proporcionada pela estatstica Q=
i =1 k

(Foi Fei )2
Fei

(Fo1 Fe1 )2
Fe1

(Fe 2 Fe 2 )2
Fe 2

+ ... +

(Fok Fek )2
Fek

que, sob H0, tem distribuio quiquadrado com graus de liberdade, onde
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

33 i) = k 1, se as freqncias esperadas puderem ser calculadas sem que sejam feitas estimativas de parmetros. ii) = (k 1) m, se para a determinao das freqncias esperadas for necessrio estimar m parmetros a partir das distribuies amostrais. Note que valores pequenos da estatstica Q ocorrero sempre que as discrepncias entre Foi e Fei forem pequenas, indicando uma boa adequao do modelo proposto. O teste de hipteses feito de maneira tradicional e a deciso ser tomada com base no valor da estatstica Q, calculada a partir dos valores observados. Assim, a rejeio da hiptese H0 ocorrer quando o valor Qcalc > Qc, onde Qc um valor crtico encontrado na Tbua II. As limitaes impostas ao uso dos testes de Quiquadrado so: i) S deve ser usado quando o tamanho da amostra n > 20; ii) A menor das freqncias esperadas Fei no pode ser inferior a 1 (um); iii) Se alguma classe apresentar Fei < 5, esta deve ser agrupada classe mais prxima.

Exemplo 7.1 Na descendncia obtida de cruzamentos entre plantas com sementes amarelas lisas e outras sementes verdes rugosas, obtemos na primeira gerao (F1) ervilhas amarelas lisas. Estas ervilhas cruzadas entre si, do uma gerao F2 com ervilhas de 4 tipos. Pela teoria mendeliana, esses tipos de ervilhas devero aparecer nas propores 9:3:3:1, respectivamente. Ao nvel de 5% de significncia, podemos afirmar que as freqncias observadas apresentadas na tabela a seguir esto de acordo com essa teoria? lisa 315 Resoluo: Hipteses: H0: os tipos de ervilhas aparecem na proporo 9:3:3:1, H1: os tipos de ervilhas no aparecem na proporo 9:3:3:1 Amarela rugosa 101 Verde lisa 108 rugosa 32

com base no modelo terico calculamos as freqncias esperadas: 9 3 1 Fe1 = 556 = 312,75; Fe2 = Fe3 = 556 = 104,25 e Fe4 = 556 = 34,75 16 16 16 Qcalc = (315 312,75) 2 (101 104,25) 2 (108 104,25) 2 (32 34,75) 2 + + + = 0,48 312,75 104,25 104,25 34,75

para = 5% e = 4-1 = 3 g.l. R.C. = {Q R: Q > 7,82} como Qcalc < 7,82, no rejeitamos H0 ao nvel = 5% e conclumos que os dados concordam com a hiptese de que os tipos de ervilhas ocorrem na proporo 9:3:3:1.

Exemplo 7.2 Verificar se podemos assumir que a altura dos alunos do curso de Zootecnia (varivel X) tem distribuio normal (com = 5%), a partir dos dados amostrais apresentados na tabela a seguir: Altura (cm) 150 156 156 162 162 168 168 174 174 180 180 186 Total Resoluo: Hipteses: H0: X ~ N(; 2) H1: X no tem distribuio N(; 2)

Foi 4 12 22 40 20 2 100

Como no conhecemos os valores dos parmetros da distribuio normal, devemos estim-los a partir dos dados amostrais: x = 168,96 e s2 = 44,5236 (verifique!).

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

34 Para obtermos o valor das freqncias esperadas, Fei, primeiramente, calculamos a probabilidade de ocorrncia de um aluno com altura (X) em cada uma das 6 classes de freqncia. Para tanto, padronizamos os limites inferior e superior das k = 6 classes e usamos a Tbua I para calcular as probabilidades. Por exemplo, para a primeira classe: P(X <156) = P(Z < -1,94) = 0,0260 Fe1 = 100(0,0260) = 2,60. Como Fe1 < 5, iremos agrupar as duas primeiras classes de freqncias, ficando com 5 classes e a nova primeira classe (150 162) com Fo1 = 16 e P(X < 162) = 0,1484 Fe1 = 14,8 (verificar!). As probabilidades e freqncias esperadas esto apresentadas na tabela a seguir:

Altura (cm) 150 162 162 168 168 174 174 180 180 186 Total

Foi 16 22 40 20 2 100

P(li < X < ls) 0,1484 0,2944 0,3323 0,1760 0,0489 1,0000

Fei 14,8 29,4 33,2 17,6 4,9 100,00

Vale observar que para a ltima classe, foi calculado P(X>180) e que, apesar de Fe5 5, os dados desta classe no foram agrupados com os da classe anterior. Qcalc = (16 14,8) 2 (22 29,4) 2 (2 4,9) 2 + + ... + = 5,40 29,4 4,9 14,8

para = 5% e = (5 - 1) - 2 = 2 g.l. R.C. = {Q R: Q > 5,99} como Qcalc R.C., no rejeitamos a hiptese H0 ao nvel de significncia de 5% e podemos concluir que a altura dos alunos de Zootecnia tem distribuio normal.

7.2. TESTES EM TABELAS DE CONTINGNCIA Uma importante aplicao do teste de Quiquadrado ocorre quando queremos estudar a relao entre duas ou mais variveis de classificao. Neste caso, a representao das freqncias observadas pode ser feita utilizando-se uma tabela de contingncia. Considerando-se dois critrios de classificao teremos tabelas de dupla entrada e, genericamente, tabelas de classificao LxC, onde L = nmero de linhas e C = nmero de colunas. A cada freqncia observada em uma tabela de contingncia teremos uma freqncia esperada, que ser calculada com base na hiptese H0 e de acordo com as regras das distribuies conjuntas de probabilidades. Para investigar a concordncia entre as freqncias observadas (Foij) e as esperadas (Feij) utilizamos a estatstica, Q =
L C

(F

oij

Feij Feij

i =1 j=1

2 que sob a hiptese H0, Q ~ , isto , tem distribuio quiquadrado com graus de liberdade, onde

i) = (L1)(C1) se as freqncias esperadas forem calculadas sem a necessidade de estimar qualquer parmetro; ii) = (L1)(C1) m se as freqncias esperadas s puderem ser calculadas estimando-se m parmetros. Vale observar que os testes de hipteses associados s tabelas de contingncias esto sujeitos s mesmas limitaes de aplicao de um teste de aderncia, j definido anteriormente.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

35 7.2.1 TESTE DE HOMOGENEIDADE O teste de homogeneidade usado quando pretendemos saber se os dados associados aos atributos de uma das variveis se comporta de modo homogneo ou similar nas diversas classes ou subpopulaes definidas pelos atributos da outra varivel classificatria. Exemplo 7.3 Testar se a proporo de vacas fecundas igual nos quatro grupos raciais, ao nvel de significncia de 5%, utilizando os dados apresentados a seguir. Natureza das vacas Charolesa Indubrasil Nelore 1/2Charoles-Zeb Totais Resoluo: Hipteses: Acasalamentos fecundos infecundos 515 1287 506 665 58 70 205 93 1284 2115 Totais 1802 1171 128 298 3399

H0: existe homogeneidade de fecundidade entre os grupos H1: no existe homogeneidade de fecundidade entre os grupos

Assumindo que o nmero de vacas fecundas igual nos quatro grupos raciais, esperamos obter 1284/3399 = 37,78% de acasalamentos fecundos. Neste caso, 37,78% do total dos acasalamentos (1802 com vacas Charoles, 1171 com vacas Indubrasil, 128 com vacas Nelore e 298 com vacas 1/2Charoles-Zeb) devem ser fecundos. Conseqentemente, esperamos tambm obter 62,22% de acasalamentos infecundos. A freqncia esperada referente a i-sima linha (Natureza das vacas) e j-sima coluna (Tipo de Acasalamento) pode ser calculada de uma maneira mais simples, atravs de: , para i = 1, 2, 3, 4 e j = 1, 2 Fo onde Foi o total das freqncias observadas na i-sima linha; Foj o total das freqncias observadas na jsima coluna e Fo o total das freqncias observadas. A partir dessa frmula, calculamos as Feij que esto (1284,1)(1802) apresentadas na tabela a seguir. Note, por exemplo, que 680,8 = = (0,3778)(1802) e que 3398,9 (2114,8)(1802) 1121,2 = = (0,6222)(1802) 3398,9 Acasalamentos fecundos infecundos 680,8 1121,2 442,4 728,6 48,3 79,6 112,6 185,4 1284,1 2114,8 Feij = (Foi )(Fo j )

Natureza das vacas Charolesa Indubrasil Nelore 1/2Charoles-Zeb Totais

Totais 1802,0 1171,0 128,9 298,0 3398,9

Q calc =

(515 680,8) 2 (1287 1121,2) 2 (93 185,4) 2 + + ... + = 204,57 680,8 1121,2 185,4

2 como = 5% e sob H0, Q ~ onde = (4-1)(2-1) = 3 g.l., R.C. = {Q R: Q > 7,82}

como Q calc > 7,82, rejeitamos a hiptese H0 ( = 5%) e conclumos que a fecundidade no homognea nos grupos raciais estudados. Ou ainda, que as propores de acasalamentos fecundos e infecundos so diferentes entre estes grupos raciais.

7.2.2 TESTE DE INDEPENDNCIA O teste de independncia usado quando o pesquisador est interessado em testar o grau de dependncia ou de associao entre as variveis classificatrias, cujos atributos, neste caso, no identificam, necessriaMaterial elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

36 mente diferentes classes ou subpopulaes. Uma medida do grau de associao ou de dependncia entre as variveis classificatrias em uma tabela de contingncia dada pelo Coeficiente de Contingncia, calculado atravs da frmula: e quanto mais prximo de 1 (um) estiver o valor de C, maior ser o grau de associao entre as variveis. Exemplo 7.4 Baseado nos conceitos finais obtidos por 435 alunos nas disciplinas de Estatstica e Clculo Diferencial e Integral, apresentados na tabela a seguir, testar a hiptese de que os resultados obtidos em Estatstica independem dos resultados obtidos em Clculo, ao nvel de significncia de 2,5%. Estatstica B 35 (63,6) 120 (93,6) 70 (67,8) 225 C= Q calc , com 0 C 1 Q calc + n

Clculo A B C Total Resoluo: Hipteses:

A 75 (33,7) 29 (49,5) 15 (35,8) 119

C 13 (25,7) 32 (37,9) 46 (27,4) 91

Total 123 181 131 435

H0: os conceitos finais em Estatstica independem dos conceitos em Clculo H1: existe dependncia entre os dois conceitos

Assumindo independncia entre os conceitos, a freqncia esperada referente a i-sima linha (conceito em Clculo) e j-sima coluna (conceito em Estatstica) calculada por: Feij = (Foi )(Fo j ) Fo , para i = 1, 2, 3 e j = 1, 2, 3

onde Foi o total das freqncias observadas na i-sima linha; Foj o total das freqncias observadas na jsima coluna e Fo o total das freqncias observadas. A partir dessa frmula, calculamos as Feij que esto apresentadas entre parntesis na Tabela n3. Q calc = (75 33,7) 2 (35 63,6) 2 46 27,4) 2 + + ... + = 111,39 33,7 63,6 27,4

2 como = 2,5% e sob H0, Q ~ onde = (3-1)(3-1) = 4 g.l. R.C. = {Q R: Q > 11,144}

como Q calc > 11,144, rejeitamos H0 ( = 2,5%) e conclumos que existe uma dependncia entre os conceitos finais de Clculo e de Estatstica. uma medida do grau de dependncia entre os dois conceitos estimada por: C = no um valor numericamente muito alto. 111,39 = 0,50, que 111,39 + 435

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

37

DISTRIBUIES DE PROBABILIDADES

TBUA I. NORMAL PADRO

TBUA II. QUI-QUADRADO

TBUA III. t DE STUDENT

TBUA IV. F-SNEDECOR

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

38

TBUA I: DISTRIBUIO NORMAL REDUZIDA- N(0; 1)

Probabilidades p tais que p = P(0 < Z < Zc)

SEGUNDA DECIMAL DE Zc Zc 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4773 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,5000 1 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,5000 2 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4983 0,4987 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 3 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 4 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 5 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 6 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 7 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3079 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 8 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000 0,5000 9 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,5000 0,5000 Zc 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

39

TBUA II: DISTRIBUIO QUI-QUADRADO COM GRAUS DE LIBERDADE

Valores qc tais que p = P(Q > qc)

PROBABILIDADES p 0,900 0,016 0,211 0,584 1,064 1,610 2,204 2,833 3,490 4,168 4,865 5,578 6,304 7,042 7,790 8,547 9,312 10,085 10,865 11,651 12,443 13,240 14,041 14,848 15,659 16,473 17,292 18,114 18,939 19,768 20,599 0,064 0,446 1,005 1,649 2,343 3,070 3,822 4,594 5,380 6,179 6,989 7,807 8,634 9,467 10,307 11,152 12,002 12,857 13,716 14,578 15,445 16,314 17,187 18,062 18,940 19,820 20,703 21,588 22,475 23,364 0,148 0,713 1,424 2,195 3,000 3,828 4,671 5,527 6,393 7,267 8,148 9,034 9,926 10,821 11,721 12,624 13,531 14,440 15,352 16,266 17,182 18,101 19,021 19,943 20,867 21,792 22,719 23,647 24,577 25,508 0,455 1,386 2,366 3,357 4,351 5,348 6,346 7,344 8,343 9,342 10,341 11,340 12,340 13,339 14,339 15,339 16,338 17,338 18,338 19,337 20,337 21,337 22,337 23,337 24,337 25,336 26,336 27,336 28,336 29,336 1,074 2,408 3,665 4,878 6,064 7,231 8,383 9,524 10,656 11,781 12,899 14,011 15,119 16,222 17,322 18,418 19,511 20,601 21,689 22,775 23,858 24,939 26,018 27,096 28,172 29,246 30,319 31,391 32,461 33,530 1,642 3,219 4,642 5,989 7,289 8,558 9,803 11,030 12,242 13,442 14,631 15,812 16,985 18,151 19,311 20,465 21,615 22,760 23,900 25,038 26,171 27,301 28,429 29,553 30,675 31,795 32,912 34,027 35,139 36,250 2,706 4,605 6,251 7,779 9,236 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 29,615 30,813 32,007 33,196 34,382 35,563 36,741 37,916 39,087 40,256 3,841 5,991 7,815 9,488 11,070 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,143 31,410 32,671 33,924 35,172 36,415 37,653 38,885 40,113 41,337 42,557 43,773 4,218 6,438 8,311 10,026 11,644 13,198 14,703 16,171 17,608 19,021 20,412 21,785 23,142 24,485 25,816 27,136 28,445 29,745 31,037 32,321 33,597 34,867 36,131 37,389 38,642 39,889 41,132 42,370 43,604 44,834 4,709 7,013 8,947 10,712 12,375 13,968 15,509 17,010 18,480 19,922 21,342 22,742 24,125 25,493 26,848 28,191 29,523 30,845 32,158 33,462 34,759 36,049 37,332 38,609 39,881 41,146 42,407 43,662 44,913 46,160 5,024 7,378 9,348 11,143 12,833 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,526 32,852 34,170 35,479 36,781 38,076 39,364 40,647 41,923 43,195 44,461 45,722 46,979 0,800 0,700 0,500 0,300 0,200 0,100 0,050 0,040 0,030 0,025 0,020 5,412 7,824 9,837 11,668 13,388 15,033 16,622 18,168 19,679 21,161 22,618 24,054 25,471 26,873 28,259 29,633 30,995 32,346 33,687 35,020 36,343 37,660 38,968 40,270 41,566 42,856 44,140 45,419 46,693 47,962 0,010 6,635 9,210 11,345 13,277 15,086 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 38,932 40,290 41,638 42,980 44,314 45,642 46,963 48,278 49,588 50,892 0,005 7,879 10,597 12,838 14,860 16,750 18,548 20,278 21,955 23,589 25,188 26,757 28,300 29,819 31,319 32,801 34,267 35,718 37,156 38,582 39,997 41,401 42,796 44,181 45,559 46,928 48,290 49,645 50,994 52,336 53,672 0,001 10,828 13,816 16,266 18,467 20,515 22,458 24,322 26,125 27,877 29,588 31,264 32,910 34,528 36,124 37,697 39,254 40,789 42,312 43,819 45,315 46,797 48,270 49,726 51,179 52,622 54,054 55,477 56,893 58,303 59,703

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0,990

0,980

0,975

0,950

0,000 0,020 0,115 0,297 0,554 0,872 1,239 1,646 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 8,897 9,542 10,196 10,856 11,524 12,198 12,879 13,565 14,256 14,953

0,001 0,040 0,185 0,429 0,752 1,134 1,564 2,032 2,532 3,059 3,609 4,178 4,765 5,368 5,985 6,614 7,255 7,906 8,567 9,237 9,915 10,600 11,293 11,992 12,697 13,409 14,125 14,847 15,574 16,306

0,001 0,051 0,216 0,484 0,831 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 10,283 10,982 11,689 12,401 13,120 13,844 14,573 15,308 16,047 16,791

0,004 0,103 0,352 0,711 1,145 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 11,591 12,338 13,091 13,848 14,611 15,379 16,151 16,928 17,708 18,493

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

40

TBUA III:DISTRIBUIO t-STUDENT COM GRAUS DE LIBERDADE

Valores tc tais que P(T > tc) = p

PROBABILIDADES p 0,150 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,052 1,050 1,047 1,045 1,044 1,042 0,100 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,306 1,303 1,299 1,296 1,294 1,290 0,050 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,690 1,684 1,676 1,671 1,667 1,660 0,040 7,916 3,320 2,605 2,333 2,191 2,104 2,046 2,004 1,973 1,948 1,928 1,912 1,899 1,888 1,878 1,869 1,862 1,855 1,850 1,844 1,840 1,835 1,832 1,828 1,825 1,822 1,819 1,817 1,814 1,812 1,803 1,796 1,787 1,781 1,776 1,769 0,030 10,579 3,896 2,951 2,601 2,422 2,313 2,241 2,189 2,150 2,120 2,096 2,076 2,060 2,046 2,034 2,024 2,015 2,007 2,000 1,994 1,988 1,983 1,978 1,974 1,970 1,967 1,963 1,960 1,957 1,955 1,944 1,936 1,924 1,917 1,912 1,902 0,025 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,030 2,021 2,009 2,000 1,994 1,984 0,020 15,895 4,849 3,482 2,999 2,757 2,612 2,517 2,449 2,398 2,359 2,328 2,303 2,282 2,264 2,249 2,235 2,224 2,214 2,205 2,197 2,189 2,183 2,177 2,172 2,167 2,162 2,158 2,154 2,150 2,147 2,133 2,123 2,109 2,099 2,093 2,081 0,015 21,205 5,643 3,896 3,298 3,003 2,829 2,715 2,634 2,574 2,527 2,491 2,461 2,436 2,415 2,397 2,382 2,368 2,356 2,346 2,336 2,328 2,320 2,313 2,307 2,301 2,296 2,291 2,286 2,282 2,278 2,262 2,250 2,234 2,223 2,215 2,202 0,010 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,438 2,423 2,403 2,390 2,381 2,364 0,005 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,724 2,704 2,678 2,660 2,648 2,626 0,002 127,322 14,089 7,453 5,598 4,773 4,317 4,029 3,833 3,690 3,581 3,497 3,428 3,372 3,326 3,286 3,252 3,222 3,197 3,174 3,153 3,135 3,119 3,104 3,091 3,078 3,067 3,057 3,047 3,038 3,030 2,996 2,971 2,937 2,915 2,899 2,871 0,001 318,317 22,327 10,215 7,173 5,893 5,208 4,785 4,501 4,297 4,144 4,025 3,930 3,852 3,787 3,733 3,686 3,646 3,611 3,579 3,552 3,527 3,505 3,485 3,467 3,450 3,435 3,421 3,408 3,396 3,385 3,340 3,307 3,261 3,232 3,211 3,174 0,0005 636,607 31,598 12,924 8,610 6,869 5,959 5,408 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,768 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,591 3,551 3,496 3,460 3,435 3,391

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 50 60 70 100

0,400 0,325 0,289 0,277 0,271 0,267 0,265 0,263 0,262 0,261 0,260 0,260 0,259 0,259 0,258 0,258 0,258 0,257 0,257 0,257 0,257 0,257 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,255 0,255 0,255 0,254 0,254 0,254

0,300 0,727 0,617 0,584 0,569 0,559 0,553 0,549 0,546 0,543 0,542 0,540 0,539 0,538 0,537 0,536 0,535 0,534 0,534 0,533 0,533 0,532 0,532 0,532 0,531 0,531 0,531 0,531 0,530 0,530 0,530 0,529 0,529 0,528 0,527 0,527 0,526

0,250 1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,682 0,681 0,679 0,679 0,678 0,677

0,200 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,852 0,851 0,849 0,848 0,847 0,845

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

41

TBUA IV: DISTRIBUIO F-SNEDECOR COM (1;2) GRAUS DE LIBERDADE

1 = nmero de graus de liberdade do numerador 2 = nmero de graus de liberdade do denominador Valores fc tais que P(F > fc) = 0,05

1 GRAUS DE LIBERDADE DO NUMERADOR 5 230,16 19,30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3,33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2,68 2,66 2,64 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,49 2,45 2,37 2,33 2,31 6 233,99 19,33 8,94 6,16 4,95 4,28 3,87 3,58 3,37 3,22 3,09 3,00 2,92 2,85 2,79 2,74 2,70 2,66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,37 2,34 2,25 2,21 2,19 7 236,77 19,35 8,89 6,09 4,88 4,21 3,79 3,50 3,29 3,14 3,01 2,91 2,83 2,76 2,71 2,66 2,61 2,58 2,54 2,51 2,49 2,46 2,44 2,42 2,40 2,39 2,37 2,36 2,35 2,33 2,29 2,25 2,17 2,13 2,10 8 238,88 19,37 8,85 6,04 4,82 4,15 3,73 3,44 3,23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2,34 2,32 2,31 2,29 2,28 2,27 2,22 2,18 2,10 2,06 2,03 9 240,54 19,38 8,81 6,00 4,77 4,10 3,68 3,39 3,18 3,02 2,90 2,80 2,71 2,65 2,59 2,54 2,49 2,46 2,42 2,39 2,37 2,34 2,32 2,30 2,28 2,27 2,25 2,24 2,22 2,21 2,16 2,12 2,04 2,00 1,97 10 241,88 19,40 8,79 5,96 4,74 4,06 3,64 3,35 3,14 2,98 2,85 2,75 2,67 2,60 2,54 2,49 2,45 2,41 2,38 2,35 2,32 2,30 2,27 2,25 2,24 2,22 2,20 2,19 2,18 2,16 2,11 2,08 1,99 1,95 1,93 12 243,90 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3,07 2,91 2,79 2,69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,04 2,00 1,92 1,88 1,85 14 245,36 19,42 8,71 5,87 4,64 3,96 3,53 3,24 3,03 2,86 2,74 2,64 2,55 2,48 2,42 2,37 2,33 2,29 2,26 2,22 2,20 2,17 2,15 2,13 2,11 2,09 2,08 2,06 2,05 2,04 1,99 1,95 1,86 1,82 1,79 16 246,46 19,43 8,69 5,84 4,60 3,92 3,49 3,20 2,99 2,83 2,70 2,60 2,51 2,44 2,38 2,33 2,29 2,25 2,21 2,18 2,16 2,13 2,11 2,09 2,07 2,05 2,04 2,02 2,01 1,99 1,94 1,90 1,82 1,77 1,75 18 247,32 19,44 8,67 5,82 4,58 3,90 3,47 3,17 2,96 2,80 2,67 2,57 2,48 2,41 2,35 2,30 2,26 2,22 2,18 2,15 2,12 2,10 2,08 2,05 2,04 2,02 2,00 1,99 1,97 1,96 1,91 1,87 1,78 1,73 1,71 20 248,01 19,45 8,66 5,80 4,56 3,87 3,44 3,15 2,94 2,77 2,65 2,54 2,46 2,39 2,33 2,28 2,23 2,19 2,16 2,12 2,10 2,07 2,05 2,03 2,01 1,99 1,97 1,96 1,94 1,93 1,88 1,84 1,75 1,70 1,68 30 250,09 19,46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2,70 2,57 2,47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1,96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,79 1,74 1,65 1,60 1,57 50 251,77 19,48 8,58 5,70 4,44 3,75 3,32 3,02 2,80 2,64 2,51 2,40 2,31 2,24 2,18 2,12 2,08 2,04 2,00 1,97 1,94 1,91 1,88 1,86 1,84 1,82 1,81 1,79 1,77 1,76 1,70 1,66 1,56 1,51 1,48 70 252,49 19,48 8,57 5,68 4,42 3,73 3,29 2,99 2,78 2,61 2,48 2,37 2,28 2,21 2,15 2,09 2,05 2,00 1,97 1,93 1,90 1,88 1,85 1,83 1,81 1,79 1,77 1,75 1,74 1,72 1,66 1,62 1,52 1,46 1,43 100 253,04 19,49 8,55 5,66 4,41 3,71 3,27 2,97 2,76 2,59 2,46 2,35 2,26 2,19 2,12 2,07 2,02 1,98 1,94 1,91 1,88 1,85 1,82 1,80 1,78 1,76 1,74 1,73 1,71 1,70 1,63 1,59 1,48 1,43 1,39 Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 60 80 100

1 161,45 18,51 10,13 7,71 6,61 5,99 5,59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4,38 4,35 4,32 4,30 4,28 4,26 4,24 4,23 4,21 4,20 4,18 4,17 4,12 4,08 4,00 3,96 3,94

2 199,50 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4,10 3,98 3,89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3,40 3,39 3,37 3,35 3,34 3,33 3,32 3,27 3,23 3,15 3,11 3,09

3 215,71 19,16 9,28 6,59 5,41 4,76 4,35 4,07 3,86 3,71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3,10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,87 2,84 2,76 2,72 2,70

4 224,58 19,25 9,12 6,39 5,19 4,53 4,12 3,84 3,63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2,93 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,64 2,61 2,53 2,49 2,46

42

REVISO DE SOMATRIOS
Define-se a soma dos n valores x1, x2, ..., xn da varivel quantitativa X por: x = x i = x1 + x2 + ... + xn
i =1 n

e l-se: somatrio de x ndice i, para i = 1 at n. Quando estivermos acostumados com a notao do somatrio, poderemos simplific-la (se no houver chance de confuso!) utilizando somente x , ao invs de x i .
i =1 n

Exemplo 1. Seja a varivel X que descreve o peso corporal, em gramas de frangos de corte aos 42 dias de vida e est assumindo os seguintes valores: X= { 1900, 2050, 1950, 2100, 1950, 2050} Ento:

x i = 1900 + 2050 + ... + 2050 = 12000 gramas o peso total dos n = 6 frangos.
i =1

xi
x =
i =1

12000 = 2000 gramas o peso mdio dos n = 6 frangos. 6

ALGUMAS PROPRIEDADES IMPORTANTES DO SOMATRIO: P.1) Se k R ( k uma constante real) ento k = nk


i =1 n

P.2) kX i = k x i
i =1 n i =1

P.3) (x i k ) = (x1 - k) + (x2 - k) + ... + (xn - k) = x i nk


n i =1 n i =1 2 P.4) x i2 = x 1 + x 2 + ... + x 2 2 n i =1

(soma de quadrados) (quadrado da soma)

n P.5) x i = (x1 + x2 + ... + xn)2 = (x)2 i =1


2

n n n P.6) (x i k ) = (x1 k) 2 + (x 2 k)2 + ... + (x n k) 2 = x i2 - 2k x i + nk2 i =1 i =1 i=1 (soma dos quadrados dos desvios em relao constante k)

P.7) x i y i = x1y1 + x2y2 + ... + xnyn


i =1

(soma de duplos produtos)

Exerccio Os resultados experimentais apresentados na tabela a seguir, foram obtidos de um ensaio de irrigao onde se estudou a produo de alfafa (t/ha) como uma funo da quantidade de gua aplicada (ml/cm2). X: gua Y: Produo 12 5,27 18 5,68 24 6,25 30 7,21 36 8,02 42 8,71 48 8,42

Com base nestes dados, pede-se: 1) Desenhe um grfico de disperso Y vs. X e tente visualizar que o relacionamento entre as variveis pode ser bem explicado por uma reta.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

43

2) Calcule: (a) x i = x
i =1 7 7

(b) yi = y
i =1 7

(c) x i2
i =1 7

(d) yi2
i =1

(e) x i y i
i =1

(f) (2x i 3y i )
i =1

xi
(g) x = (i) s 2 = x
i =1

yi
(h) y =
2 i =1

1 7 1 7 2 (x ) 2 ( x i x ) = x i 7 i =1 6 i=1 7

(j)

s2 = y

1 7 1 7 (y )2 ( y i y) 2 = y i 2 7 i =1 6 i=1 7

(X i X )(Yi Y )
7

(k) r(X,Y) =

i =1

(X i X ) (Yi Y )
7 2 7 i =1 i =1

7 X 7 Y i i i =1 i=1 X i Yi 7 i =1
7 2 2 7 7 Xi 7 Yi 7 X 2 i=1 Yi2 i=1 i i=1 i=1 7 7

(l)

b =

(X i X )(Yi Y )
i =1 2 (X i X ) i =1 7

X i Yi
=
i =1

X i Yi
i =1 i =1

7
2

7 Xi 7 2 i =1 Xi 7 i =1

(m) a = Y b X 3) Para perceber para que serve a maioria dos clculos feitos no item 2, desenhe no grfico pedido no item 1, a reta Y = a + b X (reta ajustada) e atente para o fato de que ela passa pelo meio dos pontos. Utilizando esta reta voc pode obter estimativas da produo de alfafa (Y) para diversas quantidades de gua aplicada (X). Por exemplo: calcule a produo (estimada) de alfafa para X = 20, 25 e 40 ml/cm2.

Respostas do item 2: (a) 210 (b) 49,56 (c) 7308 (d) 362,1630 (e) 1590,58 (f) 271,32 (g) 30 (h) 7,08 (i) 168 (j) 1,8797 (k) 0,9724 (l) 0,1029 (m) 3,9943

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

44

EXERCCIOS PROPOSTOS
1. Seja X1 , X2 , ..., Xn uma amostra aleatria de uma certa populao X de mdia e varincia 2. Foram propostos trs estimadores para a mdia: X* = X1 + X 2 , X** = (2X1X3) e X = 2

Xi
i =1

Mostrar que: (a) os trs estimadores so imparciais ou no viesados; (b) X o estimador mais eficiente. 2. Seja X uma populao com varincia unitria e de onde foram extradas todas as amostras possveis de tamanho n = 3. Dos estimadores definidos a seguir: 1 1 1 1 1 1 1 1 1 1 = X1 + X 2 + X 3 , 2 = X1 + X 2 + X 3 e 3 = X 1 + X 2 + X 3 6 3 2 3 3 3 4 6 3 (a) qual ou quais deles so estimadores no viesados de ? Por qu? (b) qual o estimador de varincia mnima? 3. De estudos anteriores, sabe-se que a altura de crianas de 6a srie tem distribuio normal com desvio padro igual a = 5cm. (a) Calcule o I.C.(; =0,95) sabendo-se que a altura mdia de uma amostra de 36 crianas foi 150cm. (b) Quantas crianas devem fazer parte de uma amostra para que seja de 95% a confiana na estimativa: 150 0,98cm? 4. O peso de sunos da raa Landrace tem distribuio aproximadamente normal com desvio padro de 10kg, na fase de acabamento. Que tamanho deve ter uma amostra desses sunos para que, com probabilidade 8%, o erro em estimar o peso mdio (populacional) seja, em mdulo, superior a 1kg? 5. Um criador de frangos de corte tem disponvel um lote de 1000 aves e deseja testar uma nova rao. Supondo que o desvio padro do ganho de peso (GP) mensal seja = 0,3kg, qual deve ser o tamanho da amostra a ser usada para fins experimentais, de tal modo que a estimativa do GP mdio no esteja errada em mais de 0,15 kg, com uma probabilidade de (a) 95% ? (b) 90% ? 6. Um lote de 12 bovinos Nelore do Campus forneceu os seguintes pesos: 250; 265; 267; 269; 271; 275; 277; 281; 283; 284; 287 e 289 kg. Com base nestes dados, pede-se: (a) construir um intervalo de confiana para o peso mdio dos bovinos com um coeficiente de confiana de 95% e apresentar o resultado por extenso; (b) conclua, baseado no IC() obtido acima, se podemos afirmar que o peso mdio dos bovinos Nelore do Campus igual a 281 kg. 7. Dos bovinos de corte do Campus foi sorteada uma amostra de 64 animais obtendo-se um peso mdio ( x ) de 260 kg e um desvio padro (S) de 16 kg. Com base nestes dados, pede-se: (a) quais os limites de confiana para o peso mdio dos bovinos de corte do Campus, para um coeficiente de confiana de 95% ? (b) qual a confiana (aproximada) que se tem na afirmao que o peso mdio dos bovinos de corte 260 0,834 kg ? (c) resolva os itens anteriores considerando que o desvio padro populacional () igual a 16 kg. 8. Com o objetivo de verificar o desempenho de sunos, foram consideradas duas amostras desses animais. De uma amostra de 16 sunos da raa Duroc obteve-se xD = 72kg e s D = 3,10kg e de uma amostra de 25 sunos da raa Landrace obteve-se xL = 61kg e s L = 3,80kg. Com base nesses resulta-dos pede-se: (a) construir um I.C. para o peso mdio de cada raa, com = 95% de confiana; (b) concluir sobre o desempenho dos dois grupos, comparando os I.C.() obtidos no item (a).

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

45

9. Numa amostra de 86 bezerros da raa Nelore foram encontrados 22 com baixo peso. Baseado nesta amostra, calcular um I.C. para a proporo de bezerros com baixo peso, com coeficiente de confiana igual a (i) 90% e (ii) 95%. Compare a amplitude dos intervalos obtidos. 10. Foi feita uma pesquisa eleitoral entre os alunos do curso de Zootecnia, tendo em vista a eleio do prximo prefeito do Campus. Dos 80 alunos entrevistados, somente 36 foram favorveis reeleio do atual prefeito. Conclua sobre a reeleio do atual prefeito, baseando-se em um I.C. para a proporo (p) de alunos favorveis reeleio, com = 99% i) substituindo na frmula apropriada o valor do parmetro p pelo valor da estatstica p ; ii) usando a frmula do I.C. conservativo; 11. Utilizando os dados do Exemplo 3.1 da Apostila de Estatstica II, pede-se: (a) fixando = 1%, calcular o valor de = P(Erro II); (b) sugerir (inventar!) uma nova regra de deciso (diferente das apresentadas no texto), escrever a Regio Crtica correspondente e calcular as probabilidades e ; (c) para esta nova regra de deciso, calcule o valor crtico (zc ou x c ) tal que = . 12. No ano de 1993, a produo mensal de rao da Fbrica de Rao da escola tinha distribuio normal com mdia de 8000kg e varincia de 300kg2. Nos nove primeiros meses de 1994, aps a adoo de uma nova filosofia de trabalho, a produo de rao foi de: 8200; 9100; 8430; 8540; 8050; 8350; 8560; 8390 e 8180kg. Com base nestes resultados, pede-se: (a) podemos admitir, ao nvel de significncia = 1%, que houve um aumento na produo mdia mensal de rao? (b) calcular o nvel descritivo do teste acima e concluir sobre a rejeio da hiptese da nulidade H0: = 8000kg. 13. Sabe-se que o consumo anual per capita de um determinado produto tem distribuio aproximada-mente normal com desvio padro = 2kg e mdia desconhecida. A diretoria da indstria que fabrica tal produto resolveu retir-lo da linha de produo se o seu consumo mdio per capita for inferior a 8kg. Foi feita uma pesquisa de opinio numa amostra de 80 indivduos, obtendo-se um consumo total de 620kg. (a) construa um teste de hiptese adequado usando = 5% e determine qual a deciso que a diretoria deve tomar; (b) se o teste fosse feito usando-se = 1%, a deciso seria a mesma? (c) se o desvio padro populacional fosse = 4kg, qual deve ser a deciso da diretoria, ao nvel de significncia = 5%? (d) calcule o nvel descritivo do teste apresentado nos itens (a) e (c). 14. A precipitao pluviomtrica anual da regio de Pirassununga tem distribuio normal com desvio padro = 2,7mm e mdia desconhecida. Nos ltimos 12 anos, ocorreram as seguintes precipitaes: 31,3; 30,6; 35,2; 33,4; 30,2; 28,7; 30,0; 32,7; 33,4; 29,1; 32,5 e 34,6mm. Pede-se: (a) testar a hiptese de que a precipitao anual, em mdia, superior a 31,4mm, ao nvel de significncia de 5%; (b) calcular o nvel descritivo do teste e conclua sobre a rejeio da hiptese H0. 15. O perodo de prenhez de vacas Holandesas tem distribuio aproximadamente normal com desvio padro = 19 dias. Para testar se o perodo mdio de prenhez de exatamente 260 dias, de uma amostra de n vacas obteve-se x = 264 dias. Qual deve ser o tamanho da amostra para que a afirmao feita ( = 260 dias) seja rejeitada ao nvel = 5%? E ao nvel = 1%? 16. Baseados na tabela apresentada a seguir, testar as seguintes hipteses: Cigarros sem filtro 12 8 20 Cigarros com filtro 64 26 90 No fumantes 14 16 30 Total 90 50 140

Homens Mulheres Total

(a) A proporo de fumantes superior a 80% ( = 0,04). (b) A proporo de fumantes que fumam cigarros com filtro igual a 70%. (c) Dentre as mulheres, a proporo de fumantes superior a 40%.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

46

17. Um fabricante garante que mais de 90% dos equipamentos que fornece a uma indstria esto de acordo com as especificaes exigidas. O exame de uma amostra de 200 peas desse equipamento revelou 25 defeituosas. Testar a afirmativa do fabricante, aos nveis de 5% e 1% (se achar conveniente, calcule antes o nvel descritivo do teste). 18. Use a Tbua II para obter o valor crtico (qc) da distribuio quiquadrado com graus de liberdade, tal que P(Q>qc) = p. (a) = 10, p = 50% (b) = 19, p = 1% (c) = 21, p = 10% (d) = 30, p = 0,1% (e) = 1, p = 2% (f) = 8, p = 30% 19. Use a Tbua III para obter o valor crtico (tc) da distribuio t-Student com graus de liberdade, tal que P(T>tc) = p. (a) = 1, p = 5% (b) = 6, p = 10% (c) = 10, p = 95% (d) = 15, p = 2,5% (e) = 20, p = 80% (f) = 120, p = 0,1% 20. Use a Tbua IV para obter o valor crtico (Fc) da distribuio F-Snedecor com 1 e 2 graus de liberdade, tal que P(F>Fc) = p. (a) 1=1; 2=3; p = 5% (b) 1=3; 2=2; p = 95% (c) 1=1; 2=; p = 5% (d) 1=120; 2=120; p=5% (e) 1=15; 2=15; p = 95% (f) 1; 2=35; p = 5% 21. Dez animais foram alimentados com uma nova rao durante quinze dias, conseguindo neste perodo os seguintes ganhos de peso: 2,71; 2,93; 3,10; 3,12; 3,23; 3,76; 3,89; 4,01; 4,16 e 4,23 kg. Concluir se o ganho mdio de peso foi superior a 3,10kg usando: (a) = 5% (b) = 1% (c) = 10%. 22. A precipitao pluviomtrica anual da regio de Pirassununga tem distribuio normal. Nos ltimos 12 anos, ocorreram as seguintes precipitaes: 31,3; 30,6; 35,2; 33,4; 30,2; 28,7; 30,0; 32,7; 33,4; 29,1; 32,5 e 34,6mm. Pede-se: (a) testar a hiptese de que a precipitao anual, em mdia, superior a 32mm, ao nvel de significncia de 5%; (b) calcular o nvel descritivo do teste; (c) testar se a varincia da precipitao pluviomtrica anual igual a 7 mm2 (=5%). 23. Um lote de 12 bovinos forneceu os seguintes pesos: 250; 265; 267; 269; 271; 275; 277; 281; 283; 284; 287 e 289 kg. Baseado nestes dados pede-se: (a) construir um I.C.(, = 95%); (b) testar a hiptese de que o peso mdio dos animais igual a 281kg, ao nvel de confiana de 5% (escreva a regio crtica, RC, em funo dos pesos mdios x ); (c) compare a regio de aceitao do teste feito em (b) com o I.C.() obtido em (a). 24. Testar se o desempenho em peso (kg) dos sunos da raa Duroc melhor que os da raa Landrace ( = 2%) admitindo que as varincias dos pesos dos dois grupos so iguais. RAA Duroc Landrace n 16 25 Mdia 72,0 61,0 Desvio Padro 3,1 3,8

25. Os pesos (em kg) de vinte sunos que foram separados em dois grupos e alimentados com raes diferentes so apresentados a seguir. Concluir se existem evidncias de que as raes propiciaram ganhos de peso mdios diferentes, usando = 2% e = 5%. Rao A Rao B 6,5 - 5,8 - 5,3 - 5,9 - 6,7 - 7,0 - 7,2 - 6,8 - 6,8 - 6,9 5,0 - 6,0 - 7,3 - 7,5 - 8,9 - 9,0 - 9,6 - 8,9 - 9,9 - 6,2

26. Dois fertilizantes (A e B) usados na cultura de uma certa variedade de tomates precisam ser comparados. Utilizando os dados de produo (kg) de 10 ps de tomate tratados com o fertilizante A e de 12 ps tratados com o fertilizante B, podemos concluir que o ltimo (B) melhor que o primeiro (A), ao nvel = 5%? E para = 1%? A B 1,6 - 1,7 - 1,8 - 1,4 - 1,5 - 1,9 - 2,3 - 2,1 - 1,9 - 1,7 2,0 - 2,1 - 1,8 - 1,9 - 1,9 - 2,3 - 1,8 - 1,9 - 2,1 - 2,4 - 2,5 - 2,7
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

47

27. Um certo estimulante deve ser testado atravs de seu efeito na presso sangunea. Nove sunos Wessex tiveram as suas presses arteriais medidas antes e depois da ingesto do estimulante. Os resultados (mm Hg) foram os seguintes: Antes Depois 106 109 105 112 103 107 110 109 100 111 101 115 100 107 104 109 102 101

Pergunta-se: (a) Podemos acreditar que, ao nvel = 5%, o estimulante aumenta a presso sangunea mdia em mais de 4 mm Hg? (b) A concluso ser a mesma se adotarmos = 1% ou = 10%? 28. Os pesos de 10 pintinhas Hyline White foram observados nas 1a e 2a semanas de vida. Testar se o ganho mdio de peso (em gramas) dessas aves foi superior a 30g, ao nvel: (a) = 1% (b) = 5% (c) = 10% 1a semana 56 75 71 65 67 66 73 71 65 56 2a semana 85 111 122 99 104 102 116 100 93 78 29. Os dados a seguir representam a quantidade de gua aplicada (ml/cm2) e a produo de alfafa (t/ha), obtidos em uma fazenda experimental: X (gua) Y (produo) 12 5,27 18 5,68 24 6,25 30 7,11 36 8,02 42 8,71 48 8,42

Baseados nesses resultados pede-se: (a) esboar o diagrama de disperso; (b) supondo que a relao funcional entre X e Y seja linear, estime os parmetros da reta de regresso; (c) qual o significado prtico da estimativa do coeficiente angular? (d) calcule o coeficiente de determinao e comente sobre a qualidade do ajuste da reta; (e) esboce o grfico dos resduos e comente sobre a qualidade do ajuste da reta; (f) testar a hiptese H0: b = 0, ao nvel de significncia de 5%; (g) que quantidade de gua deve ser aplicada para obtermos uma produo de 7,5t/ha de alfafa? 30. A tabela abaixo apresenta os teores de fosfato (mg) de 7 solues padro e as respectivas densidades ticas (D.O.), que foram medidas em um colormetro: X (teor) Y (densidade) 2,28 0,056 6,84 0,174 11,4 0,268 15,96 0,387 18,24 0,432 22,80 0,523 27,86 0,638

Com base nesses dados, pede-se: (a) esboar o diagrama de disperso; (b) estimar os parmetros da reta de regresso da densidade tica em funo do teor de fosfato; (c) obter o intervalo de confiana para o coeficiente angular da reta, com uma confiana de 95%; (d) testar a hiptese de que o coeficiente angular da reta igual a 0,02 ( = 2%); (e) calcular o coeficiente de determinao, desenhar o grfico de resduos e comentar sobre a qualidade do ajuste; (f) estimar o teor de fosfato para as solues com D.O. de 0,35; 0,40 e 0,50. 31. Considere os seguintes dados referentes s temperaturas ambiente (X) e do abdome (Y) de insetos (C):
X Y 25,5 25,4 25,0 24,8 27,3 27,1 25,7 25,6 26,1 25,9 23,0 22,7 24,6 24,5 25,8 25,7 24,5 24,4 22,0 21,7 24,0 23,9 27,3 27,0 25,0 24,9 25,7 25,5 24,4 24,4

Com base nestes dados, pede-se (a) desenhar o diagrama de disperso; (b) estimar o coeficiente de correlao entre X e Y e interpretar o resultado; (c) testar se existe independncia entre X e Y (=1%); (d) testar se podemos afirmar que a correlao entre as duas temperaturas superior a 0,70, ao nvel = 1%. 32. Verifique se os dados abaixo, referentes ocorrncia de acidentes de trabalho no Campus, se ajustam a uma distribuio de Poisson de mdia = 1,4 acidentes/dia (usar =5%). Nmero de acidentes (xi) Nmero de dias (fi) 0 25 1 19 2 10 3 9 4 4 5 3

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

48

33. Num experimento com ervilhas foram observadas 1600 plantas e classificadas segundo os fatores: aspecto e cor das sementes. A partir dos resultados apresentados a seguir, verifique se a hiptese de que a classificao ocorre na proporo 9 : 3 : 3 : 1, ao nvel . Amarela lisa rugosa 890 280 Verde lisa 320 rugosa 110

34. Testar a hiptese de que o peso final de frangos de corte aos 49 dias de idade tem distribuio normal de mdia = 1,90 e varincia 2 = 0,0150, a partir dos dados tabelados a seguir: Peso (kg) 1,60 1,70
 

2,10 2,20 Total


 

35. A partir dos dados apresentados na tabela a seguir, testar ( = 5%) a hiptese de que as propores de estudantes aprovados e reprovados pelos professores de Qumica, Fsica e Biologia so iguais. Qumica 45 15 60 Professor Fsica 55 10 65 Biologia 60 15 75 Total 160 40 200

Aprovados Reprovados Total

36. Duzentos e quinze bovinos de trs raas foram avaliados quanto ao desempenho. Baseado nos resultados apresentados abaixo, testar a hiptese que o desempenho independe das raas, ao nvel = 5%. Raa Gir Nelore Guzer Bom 30 32 28 Desempenho Regular 35 30 30 Pssimo 8 12 10

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

1,70 1,80 1,90 2,00

1,80 1,90 2,00 2,10

Foi 2 8 15 14 8 3 50

49

REFERNCIAS BIBLIOGRFICAS IMPORTANTES BERQU, E. S. Bioestatstica. So Paulo, Editora Pedaggica e Universitria, 1980. CENTENO, A. J. Curso de Estatstica aplicada Biologia. Goinia, Editora da Universidade Federal de Gois, 1981. COCHRAN, W.G. Tcnicas de Amostragem. Rio de Janeiro, Fundo de Cultura, 1955. FONSECA, J.S. & MARTINS, G.A. Curso de Estatstica. So Paulo, Atlas, 3.ed., 1982. HOEL, P.G. Estatstica Elementar. So Paulo, Atlas. 1977. HOFFMAN, R. & VIEIRA, S. Anlise de Regresso - uma Introduo Econometria. So Paulo, Hucitec. 1977. MAGALHES, M. N. & PEDROSO DE LIMA, A. C. Noes de Probabilidade e Estatstica. 4 ed. So Paulo: EDUSP, 2002. MEYER, P.L. Probabilidade: Aplicaes Estatstica. Rio de Janeiro, Ao Livro Tcnico, 1970. MORETTIN,P.A. & BUSSAB, W.O. Mtodos Quantitativos para Economistas e Administradores Estatstica Bsica. So Paulo, Atual. 1981. SOUNIS, E. Bioestatstica: princpios fundamentais, metodologia estatstica, aplicao s cincias biolgicas. So Paulo, McGraw-Hill do Brasil, 2 ed. rev., 1976. SPIEGEL, M. R. Estatstica. So Paulo, McGraw-Hill do Brasil, 1977. TRIOLA, M. F. Introduo Estatstica. [Traduo: FARIAS, A. A. et al.], 7 ed., Rio de Janeiro: LTC, 1998 VIEIRA, S. Introduo Bioestatstica. Rio de Janeiro, Campus, 2.ed., 1983.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

50

RESOLUO DOS EXERCCIOS PROPOSTOS


Exerccio 1 (a) os trs estimadores so imparciais ou no viesados 1 1 1 X + X2 E(X*) = E 1 = 2 E(X1+X2) = 2 [E(X1) + E(X2)] = 2 ( + ) = 2 E(X**) = E(2X1 X3) = 2 E(X1) E(X3) = 2 - = 1 1 1 n 1 E( X ) = E X i = E(X1+ X2+ ...+ Xn) = [E(X1) +...+ E(Xn)] = (n ) = n n n i =1 n (b) X o estimador mais eficiente 1 1 2 X + X2 1 = Var(X1+X2) = [Var(X1) + Var(X2)] = (2+ 2) = Var(X*) = Var 1 2 4 4 2 2
2

Var(X**) = Var(2X1 X3) = (2)2 Var(X1) + Var(X3) = 42 + 2 = 52 1 1 2 1 n 1 Var( X ) = Var X i = Var(X1+ X2+ ...+ Xn) = 2 [Var(X1) +...+ Var(Xn)] = 2 (n2 ) = n n n n i =1 n Para n > 2, Var( X ) < Var(X*) < Var(X**) X o estimador mais eficiente. Exerccios 2. (Vamos assumir que E(Xi) = e Var(Xi) = 2) (a) qual ou quais deles so estimadores no viesados de ? Por qu? 1 1 1 1 1 1 E( 1 ) = E X 1 + X 2 + X 3 = E(X1) + E(X2) + E(X3) = 3 2 6 3 2 6 1 1 1 1 1 1 E( 2 ) = E X 1 + X 2 + X 3 = E(X1) + E(X2) + E(X3) = 3 3 3 3 3 3 1 1 1 1 1 1 E( 3 ) = E X 1 + X 2 + X 3 = E(X1) + E(X2) + E(X3) = 4 6 3 4 6 3 (b) qual o estimador de varincia mnima? 1 1 1 1 1 1 Var( 1 ) = Var X 1 + X 2 + X 3 = Var(X1) + Var(X2) + Var(X3) 6 3 2 36 9 4 1 1 1 2 14 2 Var( 1 ) = + + = 36 36 9 4 1 1 1 + + = 6 3 2
2

1 1 1 + + = 3 3 3 3 1 1 1 + + = 4 6 3 4

Somente 1 e 2 so estimadores no viesados da mdias , porque E( 1 ) = E( 2 ) = .

2 1 1 1 1 Var( 2 ) = Var X 1 + X 2 + X 3 = [Var(X1) +Var(X2) +Var(X3)] = < Var( 1 ) dentre 3 3 9 3 3 os estimadores justos, 2 o de menor varincia.
Exerccio 3. X = altura dos alunos da 6a srie, X ~ N(; = 5 cm) a) I.C. (; = 95%) = [148,37; 151,63] cm, ou seja, este intervalo contem a altura mdia dos alunos da 6a srie com 95% de confiana. 5 b) I.C. (; = 95%) = 150 0,98 = [149,02; 150,98] cm 0,98 = 1,96 = n = 10 n = 100 crianas n

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

51

Exerccio 4. X = peso de sunos Landrace, X ~ N(; = 10 kg) X 1 = P Z > 1 = P Z > n n = 1,75 0,08 = P(| X - | > 1) = P > 10 n 10 n 10 10 10 n n 307 sunos Exerccio 5. X = ganho de peso mensal de aves, X ~ N(; = 0,3 kg) X 0,15 a) 95% = 0,95 = P(| X - | < 0,15) = P > 0,3 n 0,3 n n 16 frangos X 0,15 b) 90% = 0,90 = P(| X - | < 0,15) = P > 0,3 n 0,3 n n 11 frangos = P Z > 0,15 0,3 n = P Z > 0,15 0,3 n z0,475 = 1,96 = 0,15 0,3 n z0,450 = 1,65 = 0,15 0,3 n

Exerccio 6. X = peso de bovinos Nelore do Campus; X ~ N(; ) Da amostra: n = 12 bovinos, x = 274,83, s = 11,14 a) I.C.(; =95%) = [267,75; 281,91] kg, ou seja, este intervalo contem o verdadeiro valo do peso mdio dos bovinos Nelore do Campus, com 95% de confiana. b) Como o valor 281 kg um elemento do (ou pertence ao) I.C. obtido em (a), podemos afirmar que existe muita chance de que este seja o verdadeiro valor do peso mdio dos animais. Exerccio 7. X = peso de bovinos de corte do Campus amostra: n = 64 animais, x = 260, s = 16 a) usando a distribuio t-Student: I.C. (; = 95%) = 260 2,00 16 b) I.C.(; = ?) = 260,0 0,834 kg 0,834 = tc 16 64 64 = [ 256,0; 264,0] kg

tc = 0,4174 40% 64 = [256,08; 263.92] kg

c) usando a distribuio normal: I.C. (; = 95%) = 260 1,96 16 d) I.C.(; = ?) = 260,0 0,834 kg 0,834 = Zc 16 64

zc = 0,4174 32%

Exerccio 8. XD : peso de sunos Duroc , nD = 16, x D = 72 kg, sD = 3,10 kg XL: peso de sunos Landrace, nL = 25, x L = 61 kg, sL = 3,80 kg a) I.C.(D, 95%) = [ 70,34; 73,66 ] kg e I.C.(L, 95%) = [ 59,43; 62,57 ] kg b) como os dois intervalos de confiana calculados em (a) no se sobrepem, existem pouqussimas chances do desempenho dos sunos Landrace ser melhor que os Duroc. Exerccio 9. X = nmero de bovinos da raa Nelore com baixo peso amostra: n = 86, k = 22 com baixo peso p = 22/86 = 0,2558 a) I.C.(p, 90%) = 0,2558 1,65 0,2558(0,7442) = [ 0,1784, 0,3332], ou seja, este intervalo contem o verda86 deiro valor da proporo de bovinos Nelore com baixo peso, com 90% de confiana 0,2558(0,7442) = [0,1636; 0,3480], ou seja, este intervalo contem o verda86 deiro valor da proporo de bovinos Nelore com baixo peso, com 95% de confiana
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

b) I.C.(p, 95%) = 0,2558 1,96

52

Exerccio 10. X = nmero de alunos do curso de Zootecnia favorveis reeleio do atual prefeito do Campus. amostra: n = 80 alunos, k = 36 favorveis p = 36/80 = 0,45 a) I.C.(p; 99%) = 0,45 2,57 0,45(0,55) = [0,3071; 0,5929] [0,31; 0,59] 80

se a reeleio depender exclusivamente da opinio dos alunos, existe alguma chance do atual diretor do Campus ser reeleito, j que pode receber mais da metade dos votos dos alunos. b) I.C.(p; 99%) = 0,45 2,57 0,25 = [0,3063; 0,5937] [0,31; 0,59] (intervalo conservativo) 80

se a reeleio depender exclusivamente da opinio dos alunos, existe alguma chance do atual diretor do Campus ser reeleito, j que pode receber mais da metade dos votos dos alunos. Exerccio 11. H0: os animais so da Faz-2 (2 = 155 kg; 2 = 20 kg) H1: os animais so da Faz-1 (1 = 145 kg; 1 = 12 kg) a) 0,01 = = P( X x c | X ~ N(155; 16) = P(Z zc) onde -zc = -2,33 = R.C. = { X R: X 145,68 } = P(Erro tipo II) = P( X > 145,68 | X ~ 145; 5,76) = P(Z > 0,28) = 0,3897 39% b) R.C. = { X R: X 152} = P(Erro tipo I) = P( X 152| X ~ N(155; 16) = 0.2266 23% = P(Erro tipo II) = P( X > 152 | X ~ 145; 5,76) = 1 - 0.9982 = 0,0018 0,2% c) P( X x c | X ~ N(155; 16) = P( X > x c | X ~ 145; 5,76) ou zc = 1,56 (Note que = = 10.9406 = 0,0594 6%) Exerccio 12. X: produo mensal de rao, em kg. X ~ N( = 8000; 2 = 300) Amostra: n = 9, x = 8422,22 kg a) H0: = 8000 vs. H1: > 8000 = 1% RC = {z > 2,326} z calc = 8422,22 8000 300 9 = 73,13 x c 155 x 145 = c 2,4 4 x c = 148,75 x c 155 16 x c = 145,68

Como z calc RC, rejeitamos H0 ao nvel = 1% e conclumos que houve um aumento significativo da produo de rao. b) Nvel descritivo do teste: = P(Z > 73,13) zero, ou seja, corremos um risco muito pequeno de cometer o erro do tipo I (concluir que houve aumento de produo quando, na verdade, no houve aumento...) Exerccio 13. X: consumo anual per capita, em kg, de um determinado produto. X ~ N(; 2 = 4) Amostra: n = 80, x = 620/80 = 7,75 kg a) H0: = 8,0 (no retira o produto da linha de produo) H1: < 8,0 (retira o produto da linha de produo) 7,75 8,00 = 1,12 = 5% RC = (z < 1,65) z calc = 4 80 Como z calc RC(5%), no rejeitamos H0 ao nvel = 5% e conclumos que a diretoria no deve retirar o produto da linha de produo. b) Se = 1%, RC(1%) = { z < 2,326}, a concluso do teste seria exatamente a mesma.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

53

c) Se = 4kg e = 5% RC = (z < 1,65) e z calc =

= 0,56, a hiptese H0 no deve ser 16 80 rejeitada e a concluso no se altera: a diretoria no deve retirar o produto da linha de produo.

7,75 8,00

d) no item (a): = P(Z < 1,12) = 0,1314, ou seja, para rejeitarmos H0, devemos assumir um nvel de signi ficncia de, no mnimo, 13,14% no item (c): = P(Z < 0,56) = 0,2877, ou seja, para rejeitarmos H0, devemos assumir um nvel de signifi` cncia de, no mnimo, 28,77% Exerccio 14. X: precipitao pluviomtrica anual, em mm, na regio de Pirassununga, X ~ N[, 2 = (2,7)2] Amostra: n = 12, x = 31,808mm 31,808 31,4 a) H0: = 31,4 vs. H1: > 31,4 z calc = = 0,52 = 5% RC = {z > 1,65} 7,29 12 Como zcalc RC(5%), no rejeitamos H0 ao nvel = 5% e conclumos que a precipitao anual mdia na regio de Pirassununga no superior a 31,4mm. b) =P(Z > 0,52) = 0,50 0,1985 = 0,3015 30% Exerccio 15. X: perodo de prenhez, em dias, de vacas Holandesas. X ~ N[ = ?, 2 = 192] Amostra: n = ?, x = 264 dias H0: = 260 vs. H1: 260 (hiptese bilateral !! ) 264 260 Para rejeitarmos H0, com essa amostra, z calc = > z tab 361 n = 5% RC(5%) = {z < 1,96 ou z > 1,96} 264 260 361 n = 1,96 n = (9,31) 2 = 86,68 a amostra

deveria ter, pelo menos, 87 vacas = 1% RC(1%) = {z < 2,58 ou z > 2,58} 264 260 361 n = 2,58 n = (12, 26) 2 = 150,31 a

amostra deveria ter, pelo menos, 151 vacas. Exerccio 16. a) H0: p = 0,80 vs. H1: p > 0,80 , onde p = proporo de fumantes Da amostra: p = 110/140 = 0,7857 (observe que n = 140 indivduos) = 0,04 RC = {z > 1,7507} z calc = 0,7857 0,80 0,80(1 0,80) 140 = 0,42

Como zcalc RC(4%) no rejeitamos H0 ao nvel = 4% e conclumos que a proporo de fumantes no superior a 0,80. b) H0: p = 0,70 vs. H1: p 0,70 , onde p = proporo de fumantes que fumam cigarros com filtro Da amostra: p = 90/110 = 0,8182 (observe que n = 110 fumantes) = 0,04 RC = {z > 2,05} z calc = 0,8182 0,70 0,70(1 0,70) 110 = 2,70

Como zcalc RC(4%) rejeitamos H0 ao nvel = 4% e conclumos que dentre os fumantes, a proporo dos que usam cigarros com filtro no igual a 0,70.
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

54

c) H0: p = 0,40 vs. H1: p > 0,40 , onde p = proporo de fumantes na populao feminina. Da amostra: p = 34/50 = 0,68 (observe que n = 50 mulheres) = 0,04 RC = {z > 1,7507} z calc = 0,68 0,40 0,40(1 0,40) 50 = 4,04

Como z calc RC(4%) rejeitamos H0 ao nvel = 4% e conclumos que dentre as mulheres, a proporo de fumantes superior a 0,40. Exerccio 17. p = proporo de peas no defeituosas (esto de acordo com as especificaes!) H0: p = 0,90 vs. H1: p > 0,90 (afirmao do fabricante) 0,8750 0,90 Amostra: p = 175/200 = 0,8750 = 1,18 z calc = 0,90(1 0,90) 200 Como RC(5%) = {z > 1,65} e RC(1%) = {z > 2,33}, com os dados dessa amostra, no rejeitaremos H0 nem para = 5%, nem para = 1%. Para rejeitarmos H0, precisamos assumir um nvel de significncia igual ou superior a = P(Z > 1,18) = 0,881 = 88,1% Exerccio 18. Use a Tbua II para obter o valor crtico (qc) da distribuio quiquadrado com graus de liberdade, tal que P(Q>qc) = p. a) = 10, p = 50% qc = 9,3418 c) = 21, p = 10% qc = 29,6151 e) = 1, p = 2% qc = 5,4119 b) = 19, p = 1% qc = 36,1907 d) = 30, p = 0,1% qc = 59,703 f) = 8, p = 30% qc = 9,5245

Exerccio 19. Use a Tbua III para obter o valor crtico (tc) da distribuio t-Student com graus de liberdade, tal que P(T>tc) = p. a) = 1, p = 5% tc = 6,3138 b) = 6, p = 10% tc = 1,4398 c) = 10, p = 95% tc = 1,8125 e) = 20, p = 80% tc = 0,86 d) = 15, p = 2,5% tc = 2,1315 f) = 120, p = 0,1% tc = 3,1596

Exerccio 20. Use a Tbua IV para obter o valor crtico (Fc) da distribuio F-Snedecor com 1 e 2 graus de liberdade, tal que P(F>Fc) = p. a) 1=1; 2=3; p = 5% Fc = 10,1280 c) 1=1; 2=; p = 5% Fc = 3,9361 e) 1=15; 2=15; p = 95% Fc = 0,4161 b) 1=3; 2=2; p = 95% Fc = 0,1047 d) 1=120; 2=120; p=5% Fc = 1,3519 f) 1 = 28; 2=35; p = 5% Fc = 1,7995

Exerccio 21. X = ganho de peso de animais alimentados com uma nova rao durante 15 dias H0: = 3,10 vs. H1: > 3,10 RC(5%) = {t > 1,833} e RC(1%) = {t > 2,821} 3,514 3,10 Amostra: n = 15; x = 3,514 e s2 = 0,3081 = 2,36 t calc = 0,3081 10 Rejeitamos H0 ao nvel de 5%, mas no a rejeitamos ao nvel de 1%. Nvel descritivo: = P(t > 2,36) 0,02, ou seja, rejeitamos H0 e conclumos que o ganho de peso dos ani mais foi superior a 3,10kg, a um nvel igual ou superior a 2%

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

55

Exerccio 22. X = precipitao pluviomtrica anual da regio de Pirassununga a) H0: = 32 vs. H1: > 32 = 5% RC = {t > 1,796} 31,808 32 Amostra: n = 12, x = 31,808 e s 2 = 4,5645 t calc = = 0,31 4,5645 12 No rejeitamos H0 ao nvel = 5% e conclumos que a precipitao mdia anual em Pirassununga no superior a 32mm b) nvel descritivo = = P(t > 0,31) (0,50 0,40) + 0,50 0,60 c) H0: 2 = 7 mm2 vs. H1: 2 7 mm2 q calc = RC(5%) = {q R: q < 3,816 ou q > 21,920} (12 1)4,5645 = 7,17 no rejeitamos H0 ao nvel = 5% e podemos concluir que a varincia 7 da precipitao em Pirassununga no diferente de 7 mm2. Exerccio 23. X = peso de bovinos Amostra: n = 12 x = 274,83 e s 2 = 124,1515 a) I.C.(, = 95%) = 274,83 2,201 124,1515 = [267,75; 281,91] kg 12

b) H0: = 281 vs. H1: 281 Regio crtica: RC(5%) = { t < 2,201 ou t > 2,201} = { x R: x <273,92 ou x > 288,08} Regio de aceitao: RA(5%) = { x R: 273,92 < x < 288,08} c) As amplitudes da regio de aceitao (RA) do teste feito em (b) e do I.C.() obtido em (a) so exatamente iguais Exerccio 24. X: peso de sunos da raa Duroc e Y: peso de sunos da raa Landrace H0: X Y = 0 H1: X Y > 0 Das amostras: Duroc: n x = 16, x = 72,0 e s 2 = 9,61 x Assumindo que as varincias so iguais: s 2 comum = (72 61) 0 1 1 12,5823 + 16 25 Landrace: n Y = 25, y = 61,0 e s 2 = 14,44 Y (16 1)9,61 + (25 1)14,44 = 12,5823 16 + 25 2 A estatstica do teste t-Student com 16+25-2 = 39 gl RC(2%) = { t > 2,123 } t calc = = 9,69

rejeitamos H0 ao nvel = 2 % e conclumos que o desempenho em peso dos sunos da raa Duroc superior ao dos sunos da raa Landrace. Exerccio 25. X: ganho de peso dos animais que receberam a rao A; Y: ganho de peso dos animais que receberam a rao B. Rao A: n x = 10, x = 6,49 e s 2 = 0,3788 x Rao B: n Y =10, y = 7,83 e s 2 = 2,8312 Y
2 2 Parte 1. Comparao das varincias: H0: X = Y vs. H1: 2 2 X Y

2,8312 = 7,47 rejeitamos H0 ao nvel = 10% e 0,3788 conclumos que as varincias populacionais dos dois grupos so diferentes = 10% RC(10%) = {F R: F > 3,18} Fcalc = Parte 2. Comparao das mdias: = 11 (Frmula de Sattertwaite) H0: X Y = 0 vs. H1: X Y 0 RC(2%) = { | t | > 2,718 } RC(5%) = { | t | > 2,201}

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

56

= 2,37 a hiptese H0 (igualdade das mdias) rejeitada ao nvel = 5% mas 0,3788 2,8312 + 10 10 no rejeitada ao nvel = 2%. Ou seja, podemos concluir que os ganhos mdios de peso dos dois grupos so diferentes ao nvel = 5%, mas iguais, ao nvel = 2%. t calc = Exerccio 26. X: produo de tomates (em kg) tratados com dois fertilizantes (A e B) diferentes A: n A = 10, x A = 1,790 e s 2 = 0,0743 B: n B = 12, x B = 2,117 e s 2 = 0,0870 A B Parte1: Fcalc =
2 2 2 2 H0: A = B vs. H1: A B

(6,49 7,83) 0

RC = { F(11,9) > 3,10}

0,0870 = 1,17 no rejeitamos H0 ao nvel = 10% e podemos admitir que as varincias dos 0,0743 (10 1) 0,0743 + (12 1) 0,0870 dados de produo dos dois grupos de so iguais s 2 = 0,0813 comum = 10 + 12 2 H0: A B = 0 vs. H1: B A > 0 RC(5%) = { t > 1,725} RC(1%) = { t > 2,528} Parte 2: = 2,68 rejeitamos H0 ao nvel de 5% e de 1% e conclumos que o fertilizante B 1 1 0,0813 + 10 12 melhor que o fertilizante A. t calc = Exerccio 27. D = Depois Antes (diferena de presso arterial medida antes e depois da ingesto de um estimulante) n = 9, D = 5,44 e s 2 = 25.0278 D = 0,87 25,0278 9 no rejeitamos H0 ao nvel = 5% e conclumos que o estimulante no aumenta a presso arterial em mais de 4 mm Hg. b) RC(1%) = {t > 2,896 } e RC(10%) = {t > 1,397 } a concluso obtida em (a) seria a mesma se admitissemos = 1% ou = 10% Exerccio 28. D = ganho de peso de pintinhas Hyline White entre a 1a e 2a semana de vida n = 10, D = 34,50 e s 2 = 68,2778 D 34,50 30 H0: D = 30 vs. H1: D > 30 t calc = = 1,72 = P( t > 1,72) = 0,060 68,2778 10 o menor nvel de significncia para o qual a hiptese H0 ser rejeitada = 0,060, ou seja, conclumos que o ganho mdio de peso das pintinhas superior a 30g para = 10% e que o ganho mdio de peso das pintinhas no superior a 30g, para = 1% e = 5%. Exerccio 29. X = quantidade de gua aplicada (ml/cm2) e Y = produo de alfafa (t/ha) b) Equao da reta: Y = 3,9800 + 0,10286 X
i i

(2,117 1,790) 0

a) H0: D = 4 vs. H1: D > 4

RC(5%) = { t > 1.8595 } t calc =

5,44 4

c) o coeficiente angular (0,10286) indica o acrscimo na produo de produo correspondente ao acrscimo de 1 ml//cm2 de gua aplicada d) R 2 = 0,947 e indica uma boa qualidade do ajuste, ou seja, a reta parece explicar bem o comporta-mento da produo de alfafa em funo da quantidade de gua aplicada. f) H0: b = 0 vs. H1: b 0 RC(5%) = { | t | > 2.5706 }
Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

57

= 9,46 rejeitamos H0 ao nvel = 5% e conclumos que o coefi0,1193 7308 ciente angular da reta no nulo. g) para obtermos uma produo Y = 7,5 t/ha de alfafa deveremos aplicar X = 34,22 ml/cm2 de gua
9 0.6 0.4 8 Y: produo (t/ha) 0.2 Resduos 20 30 X: quantidade de gua (ml/cm2) 40 50

s 2 = 0,1193 t calc =

0,10286 0

0.0

-0.2 6 -0.4

5 10

-0.6 10

20

30 X

40

50

a) grfico de disperso

e) grfico dos resduos

Exerccio 30. X = teor de fosfato (mg) e Y = densidade tica


0.7 0.6 0.5 Y: Densidade tica 0.01 Resduo 0 6 12 18 24 30 0.4 0.3 0.2 0.1 0.0 X: teor de fosfato (mg) -0.02 0.03 0.02

0.00

-0.01

-0.03 0 6 12 18 24 30 X: teor de fosfato (mg)

a) grfico de disperso b) Equao da reta: Yi = 0,0138 + 0,0226 Xi

e) grfico dos resduos s 2 = 0,000078

0,000078 0,000078 c) IC(b; 95%) = 0,0226 2,571 ; 0,0226 + 2,571 = [0,0216; 0,0236] 478,96 478,96 d) H0: b = 0,02 vs. H1: b 0,02 RC(2%) = { | t | > 3,365} 0,0226 0,02 t calc = = 6,44 rejeitamos H0 ao nvel = 2% e conclumos que o coeficiente angular da 0,000078 478,96 reta no igual a 0,02. e) Baseado no valor do coeficiente de determinao (R2 = 0,998) e no grfico dos resduos, podemos admitir que a reta explica muito bem o comportamento da D.O. em funo do teor de fosfato. f) teor de fosfato D.O. (estimado) 0,35 14,88 0,40 17,09 0,50 21,51

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

58

Exerccio 31. X : temperatura ambiente e Y: temperatura do abdome de insetos (C): a) diagrama de disperso
28 27 Y (Temperatura do abdome) 26 25 24 23 22 21 21 22 23 24 25 26 27 28 X (Temperatura ambiente)

b) r(X, Y) = 0,998, ou seja, existe uma alta correlao linear positiva entre as temperaturas ambiente e do abdome de insetos, quando a temperatura ambiente aumenta, a temperatura do abdome tambm aumenta, quase que na mesma proporo. c) H0: (X, Y) = 0 vs. H1: (X, Y) 0 = 56,92 1 (0,998) 2 rejeitamos H0: (X, Y) = 0 ao nvel = 1% e conclumos que a temperatura ambiente e a temperatura do abdome dos insetos no so independentes. RC(1%) = {| t | > 3,012} t calc = RC(1%) = {Z > 2,33} 1 1 + 0,7 ln = 0,8673 2 1 0,7 0,998 15 2

d) H0: (X, Y) = 0,70 vs. H1: (X, Y) > 0,70 z= 1 1 + 0,998 ln = 3,4534 2 1 0,998

Z =

Z =

1 15 3

= 0,2887

3,4534 0,8673 = 8,96 rejeitamos H0: (X, Y) = 0,70 ao nvel = 1% e conclumos que o 0,2887 coeficiente de correlao entre as temperaturas ambiente e do abdome de insetos superior a 0,70. Z calc = Exerccio 32. X: nmero de acidentes de trabalho, por dia, no Campus H0: X ~ Poisson( = 1,4 acidentes/dia) vs. H1: X tem outra distribuio P(X = k) = k e 1, 4 (1,4) k , para k = 0, 1, 2, ... Fek = 70P(X=k) k! 0 25 0,2466 17,3 1 19 0,3452 24,2 2 10 0,2417 16,9 3 ou + 16 0,1665 11,6 Total 70 1 = 41 = 3 g.l. RC(5%) = {Q > 7,815} Obs: as categorias 3, 4 e 5 foram agrupadas porque as Fes das duas ltimas categorias resultaram inferiores a 5.

Fo
P(X=k)

Fe

Q calc = 9,03 rejeitamos H0 e conclumos que o nmero de acidentes de trabalho no Campus no tem distribuio de Poisson de mdia = 1,4 acidentes/dia. Exerccio 33. H0: classificao ocorre na proporo 9 : 3 : 3 : 1 vs. H1: no ocorre nessa proporo Fo Fe AL 890 900 AR 280 300 VL 320 300 VR 110 100 = 41 = 3 g.l. RC(5%) = {Q > 7,815} Qcalc = 3,778

no rejeitamos H0 ao nvel = 5% e conclumos que a classificao das sementes de ervilha segundo os fatores aspecto e cor das sementes, ocorre na proporo 9 : 3 : 3 : 1

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

59

Exerccio 34. X: peso final de frangos de corte aos 49 dias de idade H0: X ~ N( = 1,90; 2 = 0,0150) vs. H1: outra distribuio OBS: como a mdia () e a varincia (2) j so conhecidas, no precisam ser estimadas m = 0. Peso (kg) 1,60 1,70 1,70 1,80 1,80 1,90 1,90 2,00 2,00 2,10 2,10 2,20 Total
           

Foi 2 8 15 14 8 3 50

P(x inf < X < x sup ) 0,0512 0,1559 0,2929 0,2929 0,1559 0,0512 -

Fei 2,6 7,8 14,6 14,6 7,8 2,6 -

Classe 1 2 3 4 -

Foi 10 15 14 11 -

Fei 10,4 14,6 14,6 10,4 -

Q calc = 0,053 no rejeitamos H0 ao nvel = 5% e con = 41 = 3 g.l. RC(5%) = {Q > 7,815} clumos que o peso final de frangos de corte aos 49 dias de idade X ~ N( = 1,90; 2 = 0,0150). Exerccio 35. H0: as propores de estudantes aprovados e reprovados em Qumica, Fsica e Biologia so iguais. H1: as propores no so iguais Qumica 45 (48) 15 (12) 60 Professor Fsica 55 (52) 10 (13) 65 Biologia 60 (60) 15 (15) 75 Total 160 40 200

Aprovados Reprovados Total

Q calc = 1,80 no rejeitamos H0 ao nvel = 5% e con = (21)(31) = 2 g.l. RC(5%) = 5,991 clumos que as propores de estudantes aprovados e reprovados em Qumica, Fsica e Biologia so as msmas. Exerccio 36. H0: o desempenho dos bovinos independe das raas H1: o desempenho dos bovinos depende das raas Raa Gir Nelore Guzer Total Bom 30 (30,6) 32 (31,0) 28 (28,4) 90 Desempenho Regular 35 (32,3) 30 (32,7) 30 (30,0) 95 Pssimo 8 (10,2) 12 (10,3) 10 (9,5) 30 Total 73 74 68 215

Q calc = 1,276 no rejeitamos H0 ao nvel = 5% e con = (31)(31) = 4 g.l. RC(5%) = 9,488 clumos que o desempenho dos bovinos independe das raas.

Material elaborado pelo Prof. Dr. Csar Gonalves de Lima <cegdlima@usp.br>

Das könnte Ihnen auch gefallen