Beruflich Dokumente
Kultur Dokumente
1.2 Diferena entre mdias de duas populaes normais com varincias conhecidas 2
1.3 Diferena entre mdias de duas populaes normais com varincias desconhe-
cidas, mas iguais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Diferena entre mdias de duas populaes normais com varincias desconhe-
cidas e diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5.1 A Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 Dados Emparelhados 23
i
CONTEDO
Sejam duas populaes representadas pelas variveis aleatrias X1 e X2 e sejam X11 , X12 , . . .,
X1n1 e X21 , X22 ,. . ., X2n2 amostras aleatrias simples de tamanhos n1 e n2 retiradas dessas
populaes.
Mdia 1 2 X1 X2 x1 x2
2 2
X 1 X 2 N 1 2 ; 1 + 2 (1.1)
n1 n2
ou equivalentemente,
(X 1 X 2 ) (1 2 )
s N(0; 1) (1.2)
1 2
2
+ 2
n1 n2
testar
H0 : 1 2 = 0 (1.3)
e rejeitar H0 nos leva s seguintes possveis hipteses alternativas:
H1 : 1 2 6= 0 H0 : 1 2 < 0 H0 : 1 2 > 0
Para teste de hiptese sobre a diferena de mdias de populaes normais com va-
rincias conhecidas, a estatstica de teste dada em (1.2) e probabilidades pequenas cor-
respondem cauda da distribuio normal. Lembrando que sob H0 , 1 2 = 0 , isso
nos leva s seguintes regras de deciso para um nvel de significncia (lembre-se que
= P(rejeitar H0 |H0 verdadeira):
Teste bilateral
Hipteses
H0 : 1 2 = 0 (1.4)
H1 : 1 2 6= 0
Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.5)
12
2
+ 2
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
|Z0 | > z/2 s > z/2
(1.6)
1
2
2
2
+
n1 n2
Valor P
O valor P, ou a probabilidade de significncia, a probabilidade de se obter
um valor to ou mais extremo que o valor observado da estatstica de teste. Na
situao em estudo, vamos denotar por z0 o valor observado da estatstica de teste,
isto
(x 1 x 2 ) 0
z0 = s (1.7)
12
2
+ 2
n1 n2
Ento, o valor P
P = 2 P(Z > |z0 |) (1.8)
Aqui multiplicamos por 2 porque o teste bilateral, ou seja, podemos obter valores
observados da estatstica de teste positivos ou negativos, ou seja, podemos errar
por cima ou por baixo na distribuio. Rejeitamos a hiptese nula para qualquer
nvel de significncia tal que P. A hiptese nula ser rejeitada para
pequenos valores de P.
Hipteses
H0 : 1 2 = 0 (1.9)
H1 : 1 2 > 0
Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.10)
12 22
+
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
Z0 > z s > z (1.11)
12 22
+
n1 n2
Valor P
O valor P
P = P(Z > z0 ) (1.12)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P (veja Figura 1.1).
Hipteses
H0 : 1 2 = 0 (1.13)
H1 : 1 2 6= 0
Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.14)
12
2
+ 2
n1 n2
Figura 1.1 Valor P para um teste unilateral direita e comparao com o nvel de significncia
(X 1 X 2 ) 0
Z0 < z s < z (1.15)
12 22
+
n1 n2
Valor P
O valor P
P = P(Z < z0 ) (1.16)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P (veja Figura 1.2).
Figura 1.2 Valor P para um teste unilateral esquerda e comparao com o nvel de significncia
Logo,
s s
12 22 12 22
P (X 1 X 2 ) z/2 + < (1 2 ) < (X 1 X 2 ) + z/2 + =1
n1 n2 n1 n2
Note que os limites so variveis aleatrias e, assim, faz sentido falar que a probabilidade
1 . Isso significa que se repetirmos vrias vezes o processo de amostragem e subsequente
construo do intervalo de confiana correspondente, acertaremos em 100(1 )% das
vezes, ou seja, o intervalo conter o verdadeiro parmetro 1 2 .
s s
(x 1 x 2 ) z/2 12 22 12 22
+ ; (x 1 x 2 ) + z/2 + (1.18)
n1 n2 n1 n2
(X 1 X 2 ) (1 2 )
T = s tn1 +n2 2 (1.21)
1 1
Sp2 +
n1 n2
H0 : 1 2 = 0 (1.22)
Teste bilateral
Hipteses
H0 : 1 2 = 0 (1.23)
H1 : 1 2 6= 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s tn1 +n2 2 (1.24)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
|T0 | > tn1 +n2 2;/2 s > tn1 +n2 2;/2
(1.25)
1 1
Sp2 +
n1 n2
Valor P
Na situao agora em estudo, vamos denotar por t0 o valor observado da estatstica
de teste, isto
(x 1 x 2 ) 0
t0 = s (1.26)
1 1
s2p +
n1 n2
em que s2p a estimativa da varincia. Ento, o valor P
P = 2 P[t(n1 + n2 2) > |t0 |] (1.27)
Hipteses
H0 : 1 2 = 0 (1.28)
H1 : 1 2 > 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s tn1 +n2 2 (1.29)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
T0 > tn1 +n2 2; s > tn1 +n2 2; (1.30)
1 1
Sp2 +
n1 n2
Valor P
O valor P
P = P[tn1 +n2 2 > t0 ] (1.31)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P
Hipteses
H0 : 1 2 = 0 (1.32)
H1 : 1 2 < 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s (1.33)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
T0 < tn1 +n2 2; s < tn1 +n2 2; (1.34)
1 1
Sp2 +
n1 n2
Valor P
O valor P
P = P[tn1 +n2 2 < t0 ] (1.35)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P
Logo,
s
1 1
P (X 1 X 2 ) tn1 +n2 2;/2 Sp2
+ < (1 2 )
n1 n2
s !
1 1
< (X 1 X 2 ) + tn1 +n2 2;/2 Sp2 + =1
n1 n2
s s !
1 1 1 1
(X 1 X 2 ) tn1 +n2 2;/2 Sp2 + ; (X 1 X 2 ) + tn1 +n2 2;/2 Sp2 + (1.36)
n1 n2 n1 n2
Como antes, os limites so variveis aleatrias e, assim, faz sentido falar que a pro-
babilidade 1 . Isso significa que se repetirmos vrias vezes o processo de amostra-
gem e subsequente construo do intervalo de confiana correspondente, acertaremos em
100(1 )% das vezes, ou seja, o intervalo conter o verdadeiro parmetro 1 2 .
s s !
1 1 1 1
(x 1 x 2 ) tn1 +n2 2;/2 Sp2 + ; (x 1 x 2 ) + tn1 +n2 2;/2 Sp2 + (1.37)
n1 n2 n1 n2
Consideremos, agora, o caso mais geral em que X1 N(1 ; 12 ) e X2 N(2 ; 22 ) e que ambas
as varincias sejam desconhecidas. Cada uma das varincias amostrais S12 e S22 estima a
varincia populacional correspondente, mas a padronizao fornece apenas uma estatstica
de teste aproximadamente distribuda como uma t de Student. Mais precisamente
(X 1 X 2 ) (1 2 )
T = s t (1.38)
S12 S22
+
n1 n2
2
s21 s22
+
n1 n2
2 (1.39)
(s1 /n1 )2 (s22 /n2 )2
+
n1 1 n2 1
Hipteses
H0 : 1 2 = 0 (1.40)
H1 : 1 2 6= 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s t (1.41)
S12 S22
+
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
|T0 | > t;/2 s > t;/2
(1.42)
S12
S2
2
+
n1 n2
Valor P
Seja t0 o valor observado da estatstica de teste, isto
(x 1 x 2 ) 0
t0 = s (1.43)
s21 s2
+ 2
n1 n2
Ento, o valor P
P = 2 P[t > |t0 |] (1.44)
Hipteses
H0 : 1 2 = 0 (1.45)
H1 : 1 2 > 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s t (1.46)
S12 S22
+
n1 n2
Valor P
O valor P
P = P[t > t0 ] (1.48)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P
Hipteses
H0 : 1 2 = 0 (1.49)
H1 : 1 2 < 0
Estatstica de teste
(X 1 X 2 ) 0
T0 = s (1.50)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
T0 < t; s < t; (1.51)
S12 S22
+
n1 n2
Valor P
O valor P
P = P[t < t0 ] (1.52)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P
Logo,
s s !
1 1 1 1
P (X 1 X 2 ) t;/2 Sp2 + < (1 2 ) < (X 1 X 2 ) + t;/2 Sp2 +
n1 n2 n1 n2
=1
s s !
1 1 1 1
(X 1 X 2 ) t;/2 Sp2 + ; (X 1 X 2 ) + t;/2 Sp2 + (1.53)
n1 n2 n1 n2
s s !
1 1 1 1
(x 1 x 2 ) t;/2 Sp2 + ; (x 1 x 2 ) + t;/2 Sp2 + (1.54)
n1 n2 n1 n2
e esse intervalo ou contm, ou no contm o verdadeiro parmetro. O que podemos dizer
que o mtodo de obteno dos intervalos garante uma probabilidade de acerto de 100(1)%.
1.5.1 A Distribuio F
Na Figura 1.5 ilustra-se o conceito do valor crtico de uma distribuio F que so exibidos
nas Tabelas 3 e 4 ao final dessa apostila para = 0, 05 e = 0, 025 com graus de liberdade
especficos.
Esses valores crticos sero usados na inferncia sobre varincias de duas populaes
normais. Mas precisaremos tambm de valores na cauda inferior da distribuio F , ou seja,
precisaremos de valores k tais que
A ttulo de ilustrao, vamos determinar k tal que P(F5,10 < k) = 0, 05, o que equiva-
lente a determinar F5,10;0,95 . Usando (1.61) temos que
1 1
F5,10;0,95 = = = 0, 21119
F10,5;0,05 4, 735
Consideremos, agora, a situao em que nosso interesse est na comparao das varincias
de duas populaes, 12 e 22 . Os estimadores no viesados para essas varincias so S12 e
S22 em que
n1 n2
1 X 1 X
S1 =
2
(X1i X 1 )2
S2 =
2
(X2i X 2 )2
n1 1 i=1 n2 1 i=1
(n1 1)S12
U1 = n21 1
12
(n2 1)S22
U2 = n22 1
22
U1
n1 1
Fn1 ,n2
U2
n2 1
ou seja,
S12 /12
Fn1 ,n2 (1.62)
S22 /22
ou ainda
S12 /S22
Fn1 ,n2 (1.63)
12 /22
12
Teste de hiptese sobre 2
2
Hiptese nula
H0 : 12 = 22 (1.64)
Estatstica de teste
12
Note que, sob H0 , 2 = 1 e, portanto , a estatstica
2
S12
F0 = Fn1 1,n2 1 (1.65)
S22
1
F0 < Fn1 ,n2 ;1/2 = (1.66)
Fn2 ,n1 ;/2
ou
F0 > Fn1 ,n2 ;/2
1
F0 < Fn1 ,n2 ;1 = (1.68)
Fn2 ,n1 ;
12
Intervalo de confiana para
22
S12 /S22 S12 /S22
; (1.69)
Fn1 ,n2 ;/2 Fn1 ,n2 ;1/2
ou
S12 /S22 S12 /S22
; (1.70)
Fn ,n ;/2 1
1 2
EXEMPLO 1.1
duas grandes firmas, e o nmero de horas pro bono durante o ano anterior foi registrado
para cada advogado. As estatsticas-resumo so apresentadas na tabela que segue. Admita
que as populaes subjacentes sejam normais.
(a) H alguma evidncia que sugira que o nmero mdio de horas anuais pro bono seja
diferente nessas duas firmas de advocacia? Use ? = 0,05.
(b) Construa um intervalo de confiana de 95% para a diferena nas horas mdias pro bono.
Esse intervalo de confiana apia sua concluso da parte (a)? Explique.
Soluo
(a) Para decidir qual teste usar para a comparao das mdias, temos, inicialmente, que
testar a igualdade das varincias.
H0 : 12 = 22
H0 : 12 6= 22
S12
F0 = F17,13
S22
F17,13;0,025 = 3, 004
1 1
F17,13;0,975 = = = 0, 3589
F13,17;0,025 2, 786
A regio critica F0 > 3, 004 ou F0 < 0, 3589. O valor observado da estatstica de teste
5, 92
f0 = = 1, 048, que no pertence s regio crtica. Logo, no rejeitamos a hiptese
5, 65
de igualdade das varincias e passamos a realizar o teste para comparao de mdias
com base na hiptese de igualdade de varincias populacionias.
O estimador combinado da varincia
n1 1 n2 1 17 13
Sp2 = S12 + S22 = 5, 92 + 5, 65 = 5, 803
n1 + n2 2 n1 + n2 2 30 30
Queremos testar
H 0 : 1 = 2
H0 : 1 6= 2
e a estatstica de teste
X1 X2
T0 = s t30
1 1
Sp2 +
n1 n2
O valor crtico t30,0,025 = 2, 042 e rejeitamos H0 se |t0 | > 2, 042. Os dados fornecem
75, 1 80, 9
t0 = s = 6, 5349
1 1
5, 803 +
17 13
que est na regio crtica. Assim, rejeita-se a hiptese de que o nmero mdio de horas
pro bono seja o mesmo para as duas firmas.
Na Tabela 2, vemos que, para 30 graus de liberdade, a mairo abscissa 3,385, que
menor que |t0 | = 6, 5349. assim, podemos afirmar que o valor P menor que 0,001.
2. Magnsio usado por todas as clulas de seu corpo e ajuda os nervos a funcionarem
adequadamente. De acordo com a Base de Dados sobre Nutrientes do Departamento
de Agricultura dos Estados Unidos, meia xcara de feijo vegetariano cozido e uma
batata mdia cozida sem a casca tm a mesma quantidade de magnsio (40 miligramas).
Para verificar essa afirmao, obtiveram-se amostras aleatrias independentes de feijo
cozido e batatas cozidas, e mediu-se a quantidade de magnsio em cada poro (em
miligramas). As estatsticas-resumo e as varincias conhecidas so apresentadas na
tabela que segue.
(a) Admita que as distribuies subjacentes sejam normais. H alguma evidncia para
se refutar a afirmativa? Use = 0, 01. Ache o valor P para esse teste de hiptese.
(b) Suponha que os tamanhos amostrais sejam n1 = n2 = 38. Agora, h alguma
evidncia para se refutar a afirmativa? Ache o valor P para esse teste de hiptese.
(c) Quais devem ser os tamanhos amostrais (n1 = n2 ) para que o teste de hiptese
seja significante ao nvel ? = 0, 01?
3. Latas de alumnio so feitas a partir de grandes lingotes slidos, prensados sob rolos de
alta presso e cortados como biscoitos a partir de folhas finas. O alumnio ideal para
latas porque leve, forte e reciclvel. Uma companhia afirma que um novo processo
de fabricao diminui a quantidade de alumnio necessria para se fazer uma lata e,
portanto, diminui o peso. Obtiveram-se amostras aleatrias independentes de latas de
alumnio feitas pelos processos velho e novo, e o peso (em onas) de cada uma dado
na tabela que segue.
H alguma evidncia de que as latas de alumnio feitas pelo novo processo tenham
um peso mdio populacional menor? Admita que as populaes sejam normais, com
varincias iguais, e use = 0, 01. Por que voc acha que um nvel de significncia
pequeno seja importante aqui?
4. Para ajudar os lojistas em seu planejamento, a cada ano se realiza um estudo para se
determinar quanto as pessoas pretendem gastar com presentes nas festas de fim de
ano. Em uma pesquisa de novembro de 2008, obteve-se uma amostra de compradores
e lhes foi pedido que estimassem a quantia que pretendiam gastar (em dlares) com
presentes. A mdia amostral dos gastos antecipada foi relatada por gnero, grupo de
idade, e nvel de renda.4 Considere as estatsticas-resumo dadas na tabela que segue.
Historicamente, os homens relatam gastos maiores do que os das mulheres. Com base
nos dados de 2008, h alguma evidncia que sugira que a quantidade mdia que os
homens pretendem gastar seja maior do que a quantidade mdia que as mulheres
pretendem gastar? Use = 0, 10, e admita que as populaes sejam normais.
5. Em 2008, Minnesota e Carolina do Norte criaram a maioria dos perus dos Estados Uni-
dos, aproximadamente 49 milhes e 39 milhes de aves, respectivamente. Obtiveram-se
amostras aleatrias independentes de perus congelados de cada estado, e cada peru
foi pesado. Os dados resultantes (em libras) so apresentados nas tabela que segue.
Minnesota
10,1 11,5 17,1 13,4 15,9 17,9 14,9 9,5
14,5 12,5 14,2 16,8 13,7 16,0 19,4 11,4
Carolina do Norte
19,9 14,0 19,9 12,3 17,0 25,2 23,9 7,8
15,8 21,2 13,8 7,4 15,1 10,1 3,2 17,2
H alguma evidncia que sugira que haja maior variabilidade no peso de perus conge-
lados da Carolina do Norte do que de Minnesota? Use = 0, 01 e admita normalidade.
Dados Emparelhados
Consideremos, agora, o caso em que para cada indivduo na ampstra, so medidas duas
variveis X1 e X2 . Como antes, vamos supor que X1 N(1 ; 12 ) e X2 N(2 ; 22 ). Nosso
interesse continua sendo a diferena 1 2 2 . O que muda agora que X 1 e X 2 no so
mais independentes, pois ambas se baseam nos mesmo indivduos.
Sejam, ento, X11 , X12 , . . . , X1n e X21 , X22 , . . . , X2n as amostras retiradas das populaes
X1 e X2 , respectivamente. Para cada indivduo na amostra calculamos uma nova varivel,
definida por
Di = X1i X2i
Segue que D1 , D2 , . . . , Dn formam uma amostra aleatoria simples da varivel D = X1 X2 , pois
cada uma delas se refere a um indivduo ou objeto diferente e, portanto, so independentes.
Como X1 e X2 tm distribuio normal, segue que D tambm tem distribuio normal com
mdia 1 2 . A varincia de D pode ser estimada a partir da amostra D1 , D2 , . . . , Dn como
n n
! n Pn 2 !
1 X 1 X 1 X i=1 D i
SD2 = (Di D)2 = D 2 nD D2
2
n 1 i=1 i n 1 i=1 i
= (2.1)
n 1 i=1 n
em que
n
1X
D= Di (2.2)
n i=1
Estatstica de teste
D 0
TD0 = tn1 (2.4)
Sd / n
23
CAPTULO 2. DADOS EMPARELHADOS
EXEMPLO 2.1
O gerente de uma loja de convenincias loja est considerando colocar novas caixas regis-
tradoras visando aumentar a preciso e diminuir o tempo de sada. Reuniu-se uma amostra
aleatria de sete compras tpicas de itens da loja. Cada sacola de compras dos itens foi to-
talizada por um operador de caixa usando a mquina antiga e, depois, pelo mesmo operador
usando a mquina nova. Os tempos (em segundos) so apresentados na tabela que segue.
H alguma evidncia que sugira que a nova mquina registradora mude o tempo mdio de
sada? Admita que as populaes subjacentes sejam normais, use = 0, 01, e encontre
limites para o valor P associado a esse teste de hiptese.
Sacola de compras 1 2 3 4 5 6 7
Registadora antiga 45 83 62 65 39 66 62
Registadora nova 42 55 45 44 17 66 69
Soluo
Note que, nesse exemplo, a caracterstica comum, que emparelha os dados, o operador
de caixa. Vamos tomar os tempos associados registradora antiga como a populao 1 e os
tempos associados registradora nova como populao 2.
Sacola de compras 1 2 3 4 5 6 7
Registadora antiga X1 45 83 62 65 39 66 62
Registadora nova X2 42 55 45 44 17 66 69
Diferena D = X1 X2 3 28 17 21 22 0 -7
Queremos testar
H0 : 1 2 = 0 (1 = 2 )
H1 : 1 2 6= 0 (1 6= 2 )
A estatstica de teste
D
T = SD
t6
n
3 + 28 + 17 + 21 + 22 + 0 7 84
d= = = 12
7 7
e a varincia amostral (note a frmula de clculo mais simples)
n n
!
1 X 1 X
s2D = (di d)2 = d2 nd
2
n 1 i=1 n 1 i=1 i
1 1048
= (9 + 784 + 289 + 441 + 484 + 0 + 49 7 144) = = 174, 6667
6 6
Logo, o valor observado da estatstica de teste
12
t0 = q = 2, 4023 < 3, 707
174,6667
7
Sendo assim, no se rejeita a hiptese nula, ou seja, os dados indicam que os tempos
gastos com as registradoras novas no so, em mdia, diferentes dos tempso gastos com as
registradoras antigas.
C++
44,4 43,0 46,6 41,2 44,6 44,3 47,3 49,5 46,5 46,2 42,8
47,5 43,3 41,5 45,3 45,2 48,7 47,1 44,1 43,6 45,1
Java
52,0 52,6 1,8 51,4 64,3 62,1 41,2 58,0 49,9 51,1 50,6
54,9 50,6 54,0 44,1 59,4 56,0 31,3 49,6 49,4 48,8
2. Um consultor que trabalha para o quartel da Polcia Estadual afirma que as armas de
servio dispararo com uma velocidade de boca maior se o cano estiver adequadamente
limpo. Obteve-se uma amostra aleatria de armas de 9 mm, e mediu-se a velocidade
de boca (em ps por segundo) de um nico tiro de cada arma. Cada arma foi profissio-
nalmente limpa e a velocidade de boca de um segundo tiro (com o mesmo tipo de bala)
foi medida. Os dados so apresentados na tabela que segue.
Arma 1 2 3 4 5 6
Antes 1505 1419 1504 1494 1510 1506
Depois 1625 1511 1459 1441 1472 1521