Sie sind auf Seite 1von 33

Universidade Federal Fluminense

Instituto de Matemtica e Estatstica

Estatstica Aplicada para Engenharia


Inferncia para Duas Populaes

Ana Maria Lima de Farias


Departamento de Estatstica
Contedo

1 Amostras Independentes de Populaes Normais 1

1.1 Definies e notao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Diferena entre mdias de duas populaes normais com varincias conhecidas 2

1.2.1 Teste de hiptese sobre 1 2 . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2.2 Intervalo de confiana para 1 2 . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Diferena entre mdias de duas populaes normais com varincias desconhe-
cidas, mas iguais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3.1 Teste de hiptese sobre 1 2 . . . . . . . . . . . . . . . . . . . . . . . . 7

1.3.2 Intervalo de confiana para 1 2 . . . . . . . . . . . . . . . . . . . . . . 9

1.4 Diferena entre mdias de duas populaes normais com varincias desconhe-
cidas e diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4.1 Teste de hiptese sobre 1 2 . . . . . . . . . . . . . . . . . . . . . . . . 11

1.4.2 Intervalo de confiana para 1 2 . . . . . . . . . . . . . . . . . . . . . . 12

1.5 Comparao de Duas Varincias Populacionais . . . . . . . . . . . . . . . . . . . 13

1.5.1 A Distribuio F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.5.2 Inferncia sobre varincias de duas populaes normais . . . . . . . . . 15

1.6 Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2 Dados Emparelhados 23

2.1 Teste de hiptese sobre 1 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2 Intervalo de confiana para 1 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

i
CONTEDO

2.3 Exerccios Propostos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Departamento de Estatstica - Ana Maria Farias ii


Captulo 1

Amostras Independentes de Populaes


Normais

1.1 Definies e notao

Sejam duas populaes representadas pelas variveis aleatrias X1 e X2 e sejam X11 , X12 , . . .,
X1n1 e X21 , X22 ,. . ., X2n2 amostras aleatrias simples de tamanhos n1 e n2 retiradas dessas
populaes.

DEFINIO Amostras Independentes

As amostras so independentes se o processo de seleo dos indivduos ou


objetos na amostra 1 no tem qualquer efeito sobre, ou qualquer relao
com, a seleo dos indivduos ou objetos na amostra 2. Se as amostras
no so independentes, elas so dependentes.

DEFINIO Amostras Emparelhadas

Em um conjunto de dados emparelhados, cada indivduo ou objeto na


amostra 1 est associado com um indivduo ou objeto semelhante na amos-
tra 2. Experimentos que envolvem medidas antes e depois de cada indiv-
duo ou objeto resultam em dados emparelhados cada observao antes
associada a, ou emparelhada com uma observao depois. Semelhante
significa que os indivduos ou objetos compartilham alguma caracterstica
fundamental, comum, podendo, ou no, ser o mesmo indivduo ou objeto.
CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Na Tabela 1.1 apresentamos a notao referente aos parmetros dessas populaes e


seus respectivos estimadores.

Tabela 1.1 Notao: Inferncia para duas populaes

Parmetros Estatstica Amostral Valor observado


Popul. 1 Popul. 2 Am. 1 Am. 2 Am. 1 Am. 2

Mdia 1 2 X1 X2 x1 x2

Varincia 12 22 S12 S22 s21 s22

1.2 Diferena entre mdias de duas populaes normais com


varincias conhecidas

Suponhamos, inicialmente, que X1 N(1 ; 12 ) e X2 N(2 ; 22 ) e que 12 e 22 sejam conhe-


cidas. Sabemos, ento, que
 
12
X 1 N 1 ;
n1
 
22
X 2 N 2 ;
n2

Como estamos supondo que as amostras sejam independentes, resulta que X 1 e X 2 so


independentes. Logo,

 
2 2
X 1 X 2 N 1 2 ; 1 + 2 (1.1)
n1 n2
ou equivalentemente,
(X 1 X 2 ) (1 2 )
s N(0; 1) (1.2)
1 2
2
+ 2
n1 n2

1.2.1 Teste de hiptese sobre 1 2

Vamos, agora, estabelecer os procedimentos para o teste de hipteses referentes diferena


entre as mdias de maneira anloga ao caso de uma populao. Nosso objetivo, ento,

Departamento de Estatstica - Ana Maria Farias 2


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

testar
H0 : 1 2 = 0 (1.3)
e rejeitar H0 nos leva s seguintes possveis hipteses alternativas:

H1 : 1 2 6= 0 H0 : 1 2 < 0 H0 : 1 2 > 0

O procedimento de teste consiste em rejeitar a veracidade da hiptese nula H0 sempre


que obtivermos valores da estatstica de teste com pequenas probabilidades de ocorrncia
sob H0 .

Para teste de hiptese sobre a diferena de mdias de populaes normais com va-
rincias conhecidas, a estatstica de teste dada em (1.2) e probabilidades pequenas cor-
respondem cauda da distribuio normal. Lembrando que sob H0 , 1 2 = 0 , isso
nos leva s seguintes regras de deciso para um nvel de significncia (lembre-se que
= P(rejeitar H0 |H0 verdadeira):

Teste bilateral

Hipteses

H0 : 1 2 = 0 (1.4)
H1 : 1 2 6= 0

Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.5)
12
2
+ 2
n1 n2
Regio crtica (ou de rejeio)




(X 1 X 2 ) 0
|Z0 | > z/2 s > z/2
(1.6)

1
2
2
2

+
n1 n2

Valor P
O valor P, ou a probabilidade de significncia, a probabilidade de se obter
um valor to ou mais extremo que o valor observado da estatstica de teste. Na
situao em estudo, vamos denotar por z0 o valor observado da estatstica de teste,
isto
(x 1 x 2 ) 0
z0 = s (1.7)
12
2
+ 2
n1 n2

Departamento de Estatstica - Ana Maria Farias 3


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Ento, o valor P
P = 2 P(Z > |z0 |) (1.8)
Aqui multiplicamos por 2 porque o teste bilateral, ou seja, podemos obter valores
observados da estatstica de teste positivos ou negativos, ou seja, podemos errar
por cima ou por baixo na distribuio. Rejeitamos a hiptese nula para qualquer
nvel de significncia tal que P. A hiptese nula ser rejeitada para
pequenos valores de P.

Teste unilateral direita

Hipteses

H0 : 1 2 = 0 (1.9)
H1 : 1 2 > 0

Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.10)
12 22
+
n1 n2
Regio crtica (ou de rejeio)

(X 1 X 2 ) 0
Z0 > z s > z (1.11)
12 22
+
n1 n2

Valor P
O valor P
P = P(Z > z0 ) (1.12)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P (veja Figura 1.1).

Teste unilateral esquerda

Hipteses

H0 : 1 2 = 0 (1.13)
H1 : 1 2 6= 0

Estatstica de teste
(X 1 X 2 ) 0
Z0 = s N(0; 1) (1.14)
12
2
+ 2
n1 n2

Departamento de Estatstica - Ana Maria Farias 4


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Figura 1.1 Valor P para um teste unilateral direita e comparao com o nvel de significncia

Regio crtica (ou de rejeio)

(X 1 X 2 ) 0
Z0 < z s < z (1.15)
12 22
+
n1 n2

Valor P
O valor P
P = P(Z < z0 ) (1.16)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P (veja Figura 1.2).

interessante observar que o teste de igualdade de mdias equivale a fazer 0 = 0.

1.2.2 Intervalo de confiana para 1 2

Temos, a partir de (1.2), que




(X X ) ( )
z/2 < < z/2
=1
1 2 1 2
P s
1 2
2
+ 2
n1 n2

Departamento de Estatstica - Ana Maria Farias 5


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Figura 1.2 Valor P para um teste unilateral esquerda e comparao com o nvel de significncia

Logo,
s s
12 22 12 22
P (X 1 X 2 ) z/2 + < (1 2 ) < (X 1 X 2 ) + z/2 + =1
n1 n2 n1 n2

o que nos d o seguinte intervalo de confiana de 100(1 )% para 1 2 .


s s
(X 1 X 2 ) z/2 1 + 2 ; (X 1 X 2 ) + z/2 1 + 2
2 2 2 2
(1.17)
n1 n2 n1 n2

Note que os limites so variveis aleatrias e, assim, faz sentido falar que a probabilidade
1 . Isso significa que se repetirmos vrias vezes o processo de amostragem e subsequente
construo do intervalo de confiana correspondente, acertaremos em 100(1 )% das
vezes, ou seja, o intervalo conter o verdadeiro parmetro 1 2 .

Para uma amostra especfica, o intervalo de confiana

s s
(x 1 x 2 ) z/2 12 22 12 22
+ ; (x 1 x 2 ) + z/2 + (1.18)
n1 n2 n1 n2

e esse intervalo ou contm, ou no contm o verdadeiro parmetro. No faz sentido dizer


que o intervalo dado em (1.18) contm o parmetro com probabilidade 1 . O que podemos
dizer que o mtodo de obteno dos intervalos garante uma probabilidade de acerto de
100(1 )%.

Departamento de Estatstica - Ana Maria Farias 6


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

1.3 Diferena entre mdias de duas populaes normais com


varincias desconhecidas, mas iguais

Suponhamos, agora, que X1 N(1 ; 2 ) e X2 N(2 ; 2 ) e que 2 , a varincia comum, seja


desconhecida. Neste caso, as varincias amostrais S12 e S22 fornecem, ambas, um estimador
no viesado para 2 . Usamos essas informaes para gerar o estimador combinado Sp2 como
uma mdia ponderada, em que os pesos so definidos pelo nmero de graus de liberdade,
ou seja,
(n1 1)S12 + (n2 1)S22
Sp2 = (1.19)
n1 1 + n2 1
ou seja    
n1 1 n2 1
Sp =
2
S1 +
2
S22 (1.20)
n1 + n2 2 n1 + n2 2

Como estamos supondo que as amostras sejam independentes, resulta que

(X 1 X 2 ) (1 2 )
T = s   tn1 +n2 2 (1.21)
1 1
Sp2 +
n1 n2

em que tk representa a distribuio t-Student com k graus de liberdade.

A construo de testes de hipteses e intervalos de confiana se faz de maneira anloga,


mas agora com base na distribuio t.

1.3.1 Teste de hiptese sobre 1 2

Consideremos novamente a hiptese nula

H0 : 1 2 = 0 (1.22)

Como antes, o procedimento de teste consiste em rejeitar a veracidade da hiptese


nula H0 sempre que obtivermos valores da estatstica de teste com pequenas probabilidades
de ocorrncia sob H0 . Na distribuio t, assim como na normal, probabilidades pequenas
correspondem s caudas da distribuio e isso nos leva aos seguintes procedimentos.

Teste bilateral

Hipteses

H0 : 1 2 = 0 (1.23)
H1 : 1 2 6= 0

Departamento de Estatstica - Ana Maria Farias 7


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Estatstica de teste
(X 1 X 2 ) 0
T0 = s   tn1 +n2 2 (1.24)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)




(X 1 X 2 ) 0
|T0 | > tn1 +n2 2;/2 s   > tn1 +n2 2;/2
(1.25)
1 1
Sp2 +
n1 n2

Valor P
Na situao agora em estudo, vamos denotar por t0 o valor observado da estatstica
de teste, isto
(x 1 x 2 ) 0
t0 = s   (1.26)
1 1
s2p +
n1 n2
em que s2p a estimativa da varincia. Ento, o valor P
P = 2 P[t(n1 + n2 2) > |t0 |] (1.27)

Teste unilateral direita

Hipteses
H0 : 1 2 = 0 (1.28)
H1 : 1 2 > 0

Estatstica de teste
(X 1 X 2 ) 0
T0 = s   tn1 +n2 2 (1.29)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
T0 > tn1 +n2 2; s   > tn1 +n2 2; (1.30)
1 1
Sp2 +
n1 n2

Valor P
O valor P
P = P[tn1 +n2 2 > t0 ] (1.31)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P

Departamento de Estatstica - Ana Maria Farias 8


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Teste unilateral direita

Hipteses

H0 : 1 2 = 0 (1.32)
H1 : 1 2 < 0

Estatstica de teste
(X 1 X 2 ) 0
T0 = s   (1.33)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)

(X 1 X 2 ) 0
T0 < tn1 +n2 2; s   < tn1 +n2 2; (1.34)
1 1
Sp2 +
n1 n2

Valor P
O valor P
P = P[tn1 +n2 2 < t0 ] (1.35)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P

1.3.2 Intervalo de confiana para 1 2

Temos, a partir de (1.21), que




(X X ) ( )
t < < t =1
1 2 1 2
P
n1 +n 2 2;/2 s   n 1 +n 2 2;/2
1 1
Sp2 +
n1 n2

Logo,
s 

1 1
P (X 1 X 2 ) tn1 +n2 2;/2 Sp2
+ < (1 2 )
n1 n2
s  !
1 1
< (X 1 X 2 ) + tn1 +n2 2;/2 Sp2 + =1
n1 n2

o que nos d o seguinte intervalo de confiana de 100(1 )% para 1 2 .

Departamento de Estatstica - Ana Maria Farias 9


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

s   s  !
1 1 1 1
(X 1 X 2 ) tn1 +n2 2;/2 Sp2 + ; (X 1 X 2 ) + tn1 +n2 2;/2 Sp2 + (1.36)
n1 n2 n1 n2

Como antes, os limites so variveis aleatrias e, assim, faz sentido falar que a pro-
babilidade 1 . Isso significa que se repetirmos vrias vezes o processo de amostra-
gem e subsequente construo do intervalo de confiana correspondente, acertaremos em
100(1 )% das vezes, ou seja, o intervalo conter o verdadeiro parmetro 1 2 .

Para uma amostra especfica, o intervalo de confiana

s   s  !
1 1 1 1
(x 1 x 2 ) tn1 +n2 2;/2 Sp2 + ; (x 1 x 2 ) + tn1 +n2 2;/2 Sp2 + (1.37)
n1 n2 n1 n2

e esse intervalo ou contm, ou no contm o verdadeiro parmetro. O que podemos dizer


que o mtodo de obteno dos intervalos garante uma probabilidade de acerto de 100(1)%.

1.4 Diferena entre mdias de duas populaes normais com


varincias desconhecidas e diferentes

Consideremos, agora, o caso mais geral em que X1 N(1 ; 12 ) e X2 N(2 ; 22 ) e que ambas
as varincias sejam desconhecidas. Cada uma das varincias amostrais S12 e S22 estima a
varincia populacional correspondente, mas a padronizao fornece apenas uma estatstica
de teste aproximadamente distribuda como uma t de Student. Mais precisamente

(X 1 X 2 ) (1 2 )
T = s t (1.38)
S12 S22
+
n1 n2

em que o nmero de graus de liberdade dado por

 2
s21 s22
+
n1 n2
2 (1.39)
(s1 /n1 )2 (s22 /n2 )2
+
n1 1 n2 1

A construo de testes de hipteses e intervalos de confiana se faz de maneira anloga,


mas agora com base na distribuio t .

Departamento de Estatstica - Ana Maria Farias 10


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

1.4.1 Teste de hiptese sobre 1 2


Teste bilateral

Hipteses

H0 : 1 2 = 0 (1.40)
H1 : 1 2 6= 0

Estatstica de teste
(X 1 X 2 ) 0
T0 = s t (1.41)
S12 S22
+
n1 n2
Regio crtica (ou de rejeio)




(X 1 X 2 ) 0
|T0 | > t;/2 s > t;/2
(1.42)

S12
S2
2
+
n1 n2

Valor P
Seja t0 o valor observado da estatstica de teste, isto

(x 1 x 2 ) 0
t0 = s (1.43)
s21 s2
+ 2
n1 n2

Ento, o valor P
P = 2 P[t > |t0 |] (1.44)

Teste unilateral direita

Hipteses

H0 : 1 2 = 0 (1.45)
H1 : 1 2 > 0

Estatstica de teste
(X 1 X 2 ) 0
T0 = s t (1.46)
S12 S22
+
n1 n2

Departamento de Estatstica - Ana Maria Farias 11


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Regio crtica (ou de rejeio)


(X 1 X 2 ) 0
T0 > t; s > t; (1.47)
S12
S 2
+ 2
n1 n2

Valor P
O valor P
P = P[t > t0 ] (1.48)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P

Teste unilateral direita

Hipteses
H0 : 1 2 = 0 (1.49)
H1 : 1 2 < 0

Estatstica de teste
(X 1 X 2 ) 0
T0 = s   (1.50)
1 1
Sp2 +
n1 n2
Regio crtica (ou de rejeio)
(X 1 X 2 ) 0
T0 < t; s < t; (1.51)
S12 S22
+
n1 n2

Valor P
O valor P
P = P[t < t0 ] (1.52)
e como antes, rejeitamos a hiptese nula para qualquer nvel de significncia
tal que P, ou ainda, para pequenos valores de P

1.4.2 Intervalo de confiana para 1 2

Temos, a partir de (1.21), que




(X X ) ( )
t;/2 < < t;/2
1
1 2 1 2
P s
S1 2
S 2
+ 2
n1 n2

Departamento de Estatstica - Ana Maria Farias 12


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Logo,
s   s  !
1 1 1 1
P (X 1 X 2 ) t;/2 Sp2 + < (1 2 ) < (X 1 X 2 ) + t;/2 Sp2 +
n1 n2 n1 n2
=1

o que nos d o seguinte intervalo de confiana de 100(1 )% para 1 2 .

s   s  !
1 1 1 1
(X 1 X 2 ) t;/2 Sp2 + ; (X 1 X 2 ) + t;/2 Sp2 + (1.53)
n1 n2 n1 n2

Para uma amostra especfica, o intervalo de confiana

s   s  !
1 1 1 1
(x 1 x 2 ) t;/2 Sp2 + ; (x 1 x 2 ) + t;/2 Sp2 + (1.54)
n1 n2 n1 n2
e esse intervalo ou contm, ou no contm o verdadeiro parmetro. O que podemos dizer
que o mtodo de obteno dos intervalos garante uma probabilidade de acerto de 100(1)%.

Observao: Quando ambos os tamanhos amostrais n1 e n2 so grandes, X 1 X 2


aproximadamente normal e podemos usar a distribuio normal como aproximao das
distribuis amostrais acima. lembre-se que a t de Student se aproxima da normal padro
quando o nmero de graus de liberdade grande.

1.5 Comparao de Duas Varincias Populacionais

1.5.1 A Distribuio F

No estudo comparativo de varincias de populaes normais, faremos uso da distribuio F ,


assim denominada em homenagem ao estatstico Ronald Fisher (1890-1962), e cuja funo
densidade    1 1 2
1 + 2
2
x 2
f(x) = x>0
2 1
21 22
 
2   1 + 2
(1.55)
1 x 2
1+
2

Essa distribuio depende dos dois parmetros, 1 e 2 e usaremos a notao X F1 ,2


para indicar que a varivel aletria X tem distribuio F com parmetros 1 e 2 . Temos os

Departamento de Estatstica - Ana Maria Farias 13


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

seguintes reultados sobre a mdia e a varincia dessa dsitribuio:


2
E(X ) =
2 2



X F1 ,2 = (1.56)


222 (1 + 2 2)
Var(X ) =
1 (2 2)2 (2 4)

Os parmetros da distribuio F so chamados graus de liberdade do numerador e do


denominador, respectivamente, denominao essa que vem do seguinte resultado.

TEOREMA 1.1 Sejam U e V duas variveis aleatrias independentes tais que U n2 e


V m2 . Ento
U
n
W = V
Fn,m (1.57)
m
Assim, os graus de liberdade da distribuio F referem-se aos graus de liberdade das duas
variveis qui-quadrado.
N

Na Figura 1.3 temos o grfico da distrbuio F com 1 = 5 graus de liberdade no


numerador e 2 = 5, 10, 40 graus de liberdade no denominador. Na Figura 1.4 fixa-se 2 = 5
e varia-se n1 = 5, 10, 40.

Figura 1.3 F1 ,2 : 1 = 5; 2 = 5, 10, 40 Figura 1.4 F1 ,2 : 1 = 5, 10, 40; 2 = 5


Vamos denotar por Fn,m, o valor crtico da distribuio Fn,m , isto

P(Fn,m Fn,m, ) = (1.58)

Na Figura 1.5 ilustra-se o conceito do valor crtico de uma distribuio F que so exibidos
nas Tabelas 3 e 4 ao final dessa apostila para = 0, 05 e = 0, 025 com graus de liberdade
especficos.

Departamento de Estatstica - Ana Maria Farias 14


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Figura 1.5 Valor crtico Fn,m, da distribuio Fn,m

Esses valores crticos sero usados na inferncia sobre varincias de duas populaes
normais. Mas precisaremos tambm de valores na cauda inferior da distribuio F , ou seja,
precisaremos de valores k tais que

P(Fn,m < k) = P(Fn,m > k) = 1 k = Fn,m;1 (1.59)

Por outro lado, usando o teorema 1.1, temos que



 
n2 /n 1 1
P(Fn,m < k) = P <k = P > =
m2 /m n2 /n k
m2 /m
 
m2 /m 1 1
P > = = Fm,n; (1.60)
n2 /n k k

De (1.59) e (1.60) resulta que


1
Fm,n; = (1.61)
Fn,m;1

A ttulo de ilustrao, vamos determinar k tal que P(F5,10 < k) = 0, 05, o que equiva-
lente a determinar F5,10;0,95 . Usando (1.61) temos que

1 1
F5,10;0,95 = = = 0, 21119
F10,5;0,05 4, 735

1.5.2 Inferncia sobre varincias de duas populaes normais

Consideremos, agora, a situao em que nosso interesse est na comparao das varincias
de duas populaes, 12 e 22 . Os estimadores no viesados para essas varincias so S12 e
S22 em que
n1 n2
1 X 1 X
S1 =
2
(X1i X 1 )2
S2 =
2
(X2i X 2 )2
n1 1 i=1 n2 1 i=1

Departamento de Estatstica - Ana Maria Farias 15


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Se as populaes so normais, isto , X1 (N1 ; 12 ) e X2 N(2 ; 22 ) ento

(n1 1)S12
U1 = n21 1
12
(n2 1)S22
U2 = n22 1
22

Como estamos supondo que as amostras so independentes, as duas variveis aleatrias U1


e U2 acima tambm so independentes e, portanto, pelo Teorema 1.1, resulta que

U1
n1 1
Fn1 ,n2
U2
n2 1
ou seja,
S12 /12
Fn1 ,n2 (1.62)
S22 /22
ou ainda
S12 /S22
Fn1 ,n2 (1.63)
12 /22

12
Teste de hiptese sobre 2
2

Hiptese nula

H0 : 12 = 22 (1.64)

Estatstica de teste
12
Note que, sob H0 , 2 = 1 e, portanto , a estatstica
2

S12
F0 = Fn1 1,n2 1 (1.65)
S22

Regio crtica para o teste bilateral H1 : 12 6= 22

1
F0 < Fn1 ,n2 ;1/2 = (1.66)
Fn2 ,n1 ;/2
ou
F0 > Fn1 ,n2 ;/2

Departamento de Estatstica - Ana Maria Farias 16


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Figura 1.6 Valores crticos para o teste bilateral H1 : 12 6= 22

Regio crtica para o teste unilateral direita H1 : 12 > 22

F0 > Fn1 ,n2 ; (1.67)

Figura 1.7 Valores crticos para o teste unilateral H1 : 12 > 22

Regio crtica para o teste unilateral esquerda H1 : 12 < 22

1
F0 < Fn1 ,n2 ;1 = (1.68)
Fn2 ,n1 ;

Departamento de Estatstica - Ana Maria Farias 17


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Figura 1.8 Valores crticos para o teste unilateral H1 : 12 < 22

12
Intervalo de confiana para
22

Usando (1.63) e os valores criticos da distribuio Fn1 ,n2 obtemos que


 
S12 /S22
P Fn1 ,n2 ;1/2 < 2 2 < Fn1 ,n2 ;/2 = 1
1 /2
 
Fn1 ,n2 ;1/2 1 Fn1 ,n2 ;/2
P < 2 2 < = 1
S12 /S22 1 /2 S12 /S22
 2 2 
S1 /S2 12 S12 /S22
P < 2 < = 1
Fn1 ,n2 ;/2 2 Fn1 ,n2 ;1/2

e, portanto, o intervalo de confiana

 
S12 /S22 S12 /S22
; (1.69)
Fn1 ,n2 ;/2 Fn1 ,n2 ;1/2
ou
S12 /S22 S12 /S22
; (1.70)
Fn ,n ;/2 1
1 2

Fn2 ,n1 ;/2

EXEMPLO 1.1

Em muitos estados americanos, os advogados so encorajados a realizar trabalhos pro bono,


tanto por suas firmas quanto pelos conselhos de assessoramento judicial. No entanto, em
anos recentes, os advogados tm dedicado mais tempo a clientes particulares e menos tempo
a ajuda legal pro bono. Obtiveram-se amostras aleatrias independentes de advogados de

Departamento de Estatstica - Ana Maria Farias 18


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

duas grandes firmas, e o nmero de horas pro bono durante o ano anterior foi registrado
para cada advogado. As estatsticas-resumo so apresentadas na tabela que segue. Admita
que as populaes subjacentes sejam normais.

Firma Dados da amostra


Tamanho Mdia Varincia
A 18 75,1 5,92
B 14 80,9 5,65

(a) H alguma evidncia que sugira que o nmero mdio de horas anuais pro bono seja
diferente nessas duas firmas de advocacia? Use ? = 0,05.

(b) Construa um intervalo de confiana de 95% para a diferena nas horas mdias pro bono.
Esse intervalo de confiana apia sua concluso da parte (a)? Explique.

Soluo

(a) Para decidir qual teste usar para a comparao das mdias, temos, inicialmente, que
testar a igualdade das varincias.

H0 : 12 = 22
H0 : 12 6= 22

S12
F0 = F17,13
S22
F17,13;0,025 = 3, 004
1 1
F17,13;0,975 = = = 0, 3589
F13,17;0,025 2, 786
A regio critica F0 > 3, 004 ou F0 < 0, 3589. O valor observado da estatstica de teste
5, 92
f0 = = 1, 048, que no pertence s regio crtica. Logo, no rejeitamos a hiptese
5, 65
de igualdade das varincias e passamos a realizar o teste para comparao de mdias
com base na hiptese de igualdade de varincias populacionias.
O estimador combinado da varincia
n1 1 n2 1 17 13
Sp2 = S12 + S22 = 5, 92 + 5, 65 = 5, 803
n1 + n2 2 n1 + n2 2 30 30

Queremos testar

H 0 : 1 = 2
H0 : 1 6= 2

Departamento de Estatstica - Ana Maria Farias 19


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

e a estatstica de teste
X1 X2
T0 = s   t30
1 1
Sp2 +
n1 n2
O valor crtico t30,0,025 = 2, 042 e rejeitamos H0 se |t0 | > 2, 042. Os dados fornecem

75, 1 80, 9
t0 = s   = 6, 5349
1 1
5, 803 +
17 13

que est na regio crtica. Assim, rejeita-se a hiptese de que o nmero mdio de horas
pro bono seja o mesmo para as duas firmas.
Na Tabela 2, vemos que, para 30 graus de liberdade, a mairo abscissa 3,385, que
menor que |t0 | = 6, 5349. assim, podemos afirmar que o valor P menor que 0,001.

(b) O intervalo de confiana


s  
1 1
(75, 1 80, 9) 2, 042 5, 803 + = (7, 6124; 4, 9125)
17 13

que no contm o 0, o que corrobora a rejeio da hipotese de igualdade das mdias no


item anterior.



1.6 Exerccios Propostos


1. O peso total (com a caixa) de uma mquina de costura porttil uma considerao
importante. Suponha que Singer afirme ter a mquina mais leve, com menos 5 libras
(2,77 kg) em relao s demais. Obtiveram-se amostras aleatrias independentes de
uma Singer e de uma mquina comparvel Simplicity, e os pesos (em libras) de cada
uma foi registrado. As estatsticas-resumo e as varincias conhecidas so apresentadas
na tabela que segue.

Mquina de Tamanho Mdia Varincia


costura amostral amostral populacional
Simplicity 42 17,99 2,89
Singer 38 13,26 2,25

(a) H alguma evidncia para se refutar a afirmativa da Singer? Use = 0, 01.


(b) Ache o valor P associado a esse teste.
(c) A hiptese de normalidade necessria nesse problema? Por que ou por que no?

Departamento de Estatstica - Ana Maria Farias 20


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

2. Magnsio usado por todas as clulas de seu corpo e ajuda os nervos a funcionarem
adequadamente. De acordo com a Base de Dados sobre Nutrientes do Departamento
de Agricultura dos Estados Unidos, meia xcara de feijo vegetariano cozido e uma
batata mdia cozida sem a casca tm a mesma quantidade de magnsio (40 miligramas).
Para verificar essa afirmao, obtiveram-se amostras aleatrias independentes de feijo
cozido e batatas cozidas, e mediu-se a quantidade de magnsio em cada poro (em
miligramas). As estatsticas-resumo e as varincias conhecidas so apresentadas na
tabela que segue.

Alimento Tamanho Mdia Varincia


amostral amostral populacional
Feijo vegetariano cozido 18 39,58 2,47
Batata cozida 18 40,12 0,87

(a) Admita que as distribuies subjacentes sejam normais. H alguma evidncia para
se refutar a afirmativa? Use = 0, 01. Ache o valor P para esse teste de hiptese.
(b) Suponha que os tamanhos amostrais sejam n1 = n2 = 38. Agora, h alguma
evidncia para se refutar a afirmativa? Ache o valor P para esse teste de hiptese.
(c) Quais devem ser os tamanhos amostrais (n1 = n2 ) para que o teste de hiptese
seja significante ao nvel ? = 0, 01?

3. Latas de alumnio so feitas a partir de grandes lingotes slidos, prensados sob rolos de
alta presso e cortados como biscoitos a partir de folhas finas. O alumnio ideal para
latas porque leve, forte e reciclvel. Uma companhia afirma que um novo processo
de fabricao diminui a quantidade de alumnio necessria para se fazer uma lata e,
portanto, diminui o peso. Obtiveram-se amostras aleatrias independentes de latas de
alumnio feitas pelos processos velho e novo, e o peso (em onas) de cada uma dado
na tabela que segue.

Processo antigo (1)


0,52 0,49 0,47 0,47 0,48 0,52 0,55 0,49 0,52 0,50 0,50
0,50 0,51 0,51 0,50 0,53 0,49 0,51 0,52 0,51 0,51
Processo novo (2)
0,51 0,51 0,50 0,48 0,47 0,49 0,46 0,46 0,52 0,50 0,48
0,51 0,50 0,48 0,51 0,44 0,48 0,47 0,50 0,51 0,48

H alguma evidncia de que as latas de alumnio feitas pelo novo processo tenham
um peso mdio populacional menor? Admita que as populaes sejam normais, com
varincias iguais, e use = 0, 01. Por que voc acha que um nvel de significncia
pequeno seja importante aqui?
4. Para ajudar os lojistas em seu planejamento, a cada ano se realiza um estudo para se
determinar quanto as pessoas pretendem gastar com presentes nas festas de fim de
ano. Em uma pesquisa de novembro de 2008, obteve-se uma amostra de compradores
e lhes foi pedido que estimassem a quantia que pretendiam gastar (em dlares) com
presentes. A mdia amostral dos gastos antecipada foi relatada por gnero, grupo de
idade, e nvel de renda.4 Considere as estatsticas-resumo dadas na tabela que segue.

Departamento de Estatstica - Ana Maria Farias 21


CAPTULO 1. AMOSTRAS INDEPENDENTES DE POPULAES NORMAIS

Grupo de Tamanho Mdia Desvio padro


amostral amostral amostral
Homens 21 784,00 37,50
Mulheres 19 652,00 17,01

Historicamente, os homens relatam gastos maiores do que os das mulheres. Com base
nos dados de 2008, h alguma evidncia que sugira que a quantidade mdia que os
homens pretendem gastar seja maior do que a quantidade mdia que as mulheres
pretendem gastar? Use = 0, 10, e admita que as populaes sejam normais.

5. Em 2008, Minnesota e Carolina do Norte criaram a maioria dos perus dos Estados Uni-
dos, aproximadamente 49 milhes e 39 milhes de aves, respectivamente. Obtiveram-se
amostras aleatrias independentes de perus congelados de cada estado, e cada peru
foi pesado. Os dados resultantes (em libras) so apresentados nas tabela que segue.

Minnesota
10,1 11,5 17,1 13,4 15,9 17,9 14,9 9,5
14,5 12,5 14,2 16,8 13,7 16,0 19,4 11,4
Carolina do Norte
19,9 14,0 19,9 12,3 17,0 25,2 23,9 7,8
15,8 21,2 13,8 7,4 15,1 10,1 3,2 17,2

H alguma evidncia que sugira que haja maior variabilidade no peso de perus conge-
lados da Carolina do Norte do que de Minnesota? Use = 0, 01 e admita normalidade.

Departamento de Estatstica - Ana Maria Farias 22


Captulo 2

Dados Emparelhados

Consideremos, agora, o caso em que para cada indivduo na ampstra, so medidas duas
variveis X1 e X2 . Como antes, vamos supor que X1 N(1 ; 12 ) e X2 N(2 ; 22 ). Nosso
interesse continua sendo a diferena 1 2 2 . O que muda agora que X 1 e X 2 no so
mais independentes, pois ambas se baseam nos mesmo indivduos.

Sejam, ento, X11 , X12 , . . . , X1n e X21 , X22 , . . . , X2n as amostras retiradas das populaes
X1 e X2 , respectivamente. Para cada indivduo na amostra calculamos uma nova varivel,
definida por
Di = X1i X2i
Segue que D1 , D2 , . . . , Dn formam uma amostra aleatoria simples da varivel D = X1 X2 , pois
cada uma delas se refere a um indivduo ou objeto diferente e, portanto, so independentes.
Como X1 e X2 tm distribuio normal, segue que D tambm tem distribuio normal com
mdia 1 2 . A varincia de D pode ser estimada a partir da amostra D1 , D2 , . . . , Dn como
n n
! n Pn 2 !
1 X 1 X 1 X i=1 D i
SD2 = (Di D)2 = D 2 nD D2
2
n 1 i=1 i n 1 i=1 i
= (2.1)
n 1 i=1 n

em que
n
1X
D= Di (2.2)
n i=1

2.1 Teste de hiptese sobre 1 2


Hiptese nula
H0 : D = 1 2 = 0 (2.3)

Estatstica de teste
D 0
TD0 = tn1 (2.4)
Sd / n

23
CAPTULO 2. DADOS EMPARELHADOS

Regio crtica para o teste bilateral H1 : D 6= 0


|TD0 | > tn1;/2 (2.5)

Regio crtica para o teste unilateral direita H1 : D > 0


TD0 > tn1; (2.6)

Regio crtica para o teste unilateral esquerda H1 : D < 0


TD0 < tn1; (2.7)

2.2 Intervalo de confiana para 1 2


O intervalo de confiana
 
SD SD
(X 1 X 2 ) tn1;/2 ; (X 1 X 2 ) + tn1;/2 (2.8)
n n

EXEMPLO 2.1

O gerente de uma loja de convenincias loja est considerando colocar novas caixas regis-
tradoras visando aumentar a preciso e diminuir o tempo de sada. Reuniu-se uma amostra
aleatria de sete compras tpicas de itens da loja. Cada sacola de compras dos itens foi to-
talizada por um operador de caixa usando a mquina antiga e, depois, pelo mesmo operador
usando a mquina nova. Os tempos (em segundos) so apresentados na tabela que segue.
H alguma evidncia que sugira que a nova mquina registradora mude o tempo mdio de
sada? Admita que as populaes subjacentes sejam normais, use = 0, 01, e encontre
limites para o valor P associado a esse teste de hiptese.

Sacola de compras 1 2 3 4 5 6 7
Registadora antiga 45 83 62 65 39 66 62
Registadora nova 42 55 45 44 17 66 69

Soluo

Note que, nesse exemplo, a caracterstica comum, que emparelha os dados, o operador
de caixa. Vamos tomar os tempos associados registradora antiga como a populao 1 e os
tempos associados registradora nova como populao 2.

Sacola de compras 1 2 3 4 5 6 7
Registadora antiga X1 45 83 62 65 39 66 62
Registadora nova X2 42 55 45 44 17 66 69
Diferena D = X1 X2 3 28 17 21 22 0 -7

Departamento de Estatstica - Ana Maria Farias 24


CAPTULO 2. DADOS EMPARELHADOS

Queremos testar

H0 : 1 2 = 0 (1 = 2 )
H1 : 1 2 6= 0 (1 6= 2 )

A estatstica de teste
D
T = SD
t6

n

e o valor crtico t6;0,005 = 3, 707. Os dados nos fornecem a mdia amostral

3 + 28 + 17 + 21 + 22 + 0 7 84
d= = = 12
7 7
e a varincia amostral (note a frmula de clculo mais simples)
n n
!
1 X 1 X
s2D = (di d)2 = d2 nd
2
n 1 i=1 n 1 i=1 i
1 1048
= (9 + 784 + 289 + 441 + 484 + 0 + 49 7 144) = = 174, 6667
6 6
Logo, o valor observado da estatstica de teste

12
t0 = q = 2, 4023 < 3, 707
174,6667
7

Sendo assim, no se rejeita a hiptese nula, ou seja, os dados indicam que os tempos
gastos com as registradoras novas no so, em mdia, diferentes dos tempso gastos com as
registradoras antigas.

Olhando na Tabela 2, na linha correspondente a 6 graus de liberdade, vemos que o


valor observado t0 = 2, 4023 est entre os valores 2,313 e 2,612, que correspondem s
probabilidades 0,03 e 0,02. Assim, podemos dizer que a probabilidade na cauda direita,
acima de 2,4023, est no intervalo (0, 02; 0, 03). Como o teste bilateral, o valor P estar no
intervalo (0, 04; 0, 06). Um softaware (Excel) nos fornece P = 0, 053128136.


2.3 Exerccios Propostos


1. Vinte e um programadores de computador de firmas TI (Tecnologia da Informao) em
todo o pas foram selecionados aleatoriamente. Pediu-se a cada um para escrever um
cdigo em C++ e em Java para uma aplicao especfica. O tempo de execuo (em
segundos) de cada programa, por linguagem de computador, dado a seguir.

Departamento de Estatstica - Ana Maria Farias 25


CAPTULO 2. DADOS EMPARELHADOS

C++
44,4 43,0 46,6 41,2 44,6 44,3 47,3 49,5 46,5 46,2 42,8
47,5 43,3 41,5 45,3 45,2 48,7 47,1 44,1 43,6 45,1
Java
52,0 52,6 1,8 51,4 64,3 62,1 41,2 58,0 49,9 51,1 50,6
54,9 50,6 54,0 44,1 59,4 56,0 31,3 49,6 49,4 48,8

(a) Qual a caracterstica comum que torna esses dados emparelhados?


(b) Admita normalidade. Realize o teste de hiptese apropriado para determinar se h
alguma evidncia de que o tempo mdio de execuo seja maior para programas
Java do que para programas C++. Use = 0, 001.
(c) Ache limites para o valor P associado a esse teste de hiptese.

2. Um consultor que trabalha para o quartel da Polcia Estadual afirma que as armas de
servio dispararo com uma velocidade de boca maior se o cano estiver adequadamente
limpo. Obteve-se uma amostra aleatria de armas de 9 mm, e mediu-se a velocidade
de boca (em ps por segundo) de um nico tiro de cada arma. Cada arma foi profissio-
nalmente limpa e a velocidade de boca de um segundo tiro (com o mesmo tipo de bala)
foi medida. Os dados so apresentados na tabela que segue.

Arma 1 2 3 4 5 6
Antes 1505 1419 1504 1494 1510 1506
Depois 1625 1511 1459 1441 1472 1521

(a) Qual a caracterstica comum que torna esses dados emparelhados?


(b) Admita normalidade. Realize o teste de hiptese apropriado para determinar se h
alguma evidncia de que uma arma limpa dispara com velocidade de boca maior.
Use = 0, 01.
(c) Ache limites para o valor P associado a esse teste de hiptese.

Departamento de Estatstica - Ana Maria Farias 26


27
28
29
30

Das könnte Ihnen auch gefallen