Beruflich Dokumente
Kultur Dokumente
Introduo
A teoria de amostragem dedica-se ao desenvolvimento, anlise e melhoramento dos mtodos de
recolha de informao necessria num inqurito, a seleco da amostra, a obteno de
informao da amostra, na traduo da informao em afirmaes relacionadas com os
objectivos do inqurito e na avaliao dessas afirmaes.
O problema da inferncia Indutiva do ponto de vista de estatstica, encarado da seguinte
forma: A finalidade da investigao descobrir algo sobre determina caracterstica da
populao ou universo. Por isso importante definir alguns conceitos fundamentais na teoria da
amostragem.
Exemplos:
1. Pases produtores de ouro.
2. O nmero de habitantes dum determinado pas, ou cidade.
1. O nmero de desempregados dum pas, duma provncia, num determinado perodo de tempo,
etc.
Plano de Amostragem constitudo por todas as etapas necessrias para seleccionar uma
amostra depois da definio da populao.
Variveis Discretas
So no numricas
So normalmente codificadas;
Mtodos de Amostragem
Amostragem Aleatria Simples
Amostragem Estratificada
Amostragem por Conglomerados
Amostragem por Estgios Mltiplos
Fontes de Erro em levantamentos por Amostragem
Amostragem Sistemtica
uma variao da amostragem aleatria simples. A sua aplicao requer que a populao seja
ordenada de tal modo que cada um de seus elementos possa ser unicamente identificado pela
posio. Apresentam condies para satisfao desse requisito uma populao identificada a
partir de uma lista que englobe todos os seus elementos, uma fila de pessoas ou um conjunto de
candidatos a um concurso identificado pela ficha de inscrio.
Amostragem Estratificada
Caracteriza-se pela seleco de uma amostra de cada subgrupo da populao considerada.
O fundamento para delimitar os subgrupos ou estratos pode ser encontrados em propriedades
como sexo, idade ou classe social. Muitas vezes essas propriedades so combinadas, o que
exige uma matriz de classificao. Por exemplo quando se compara homem e mulher com
"maior de 18 anos" e menor de 18 anos" resultam quatros extractos: homem menor de 18 anos,
mulher menor de 18 anos, homem maior de 18 anos, mulher maior de 18 anos.
A amostragem estratificada pode ser proporcional ou no-proporcional.
No primeiro caso, selecciona-se de cada grupo uma amostra aleatria que seja proporcional
extenso de cada subgrupo determinada por alguma propriedade tida como relevante. Este
tipo de amostragem tem como principal vantagem o fato de assegurar representatividade em
Nota: Nos levantamentos por Amostragem usam-se os Questionrios. Este tpico sera tratado
mais tarde no curso.
2. ESTIMAO DE PARMETROS
Nesta seco introduziremos alguns conceitos aplicados na rea de inferncia Estatstica que
sero dados nos captulos seguintes. A inferncia estatstica inclui assim trs grandes tipos de
aplicao:
1. Estimao pontual;
2. Estimao por intervalos;
3. Testes de Hipteses;
Exemplo:
Para estimar o parmetro (mdia da populao) duma populao normal poder-se-ia
utilizar, entre outros estimadores, o estimador:
X
x i
n
ou seja a mdia amostral.
2.2.1 No Enviesamento
Um estimador diz-se no enviesado (no viciado) se o valor mdio da estimativa (valor
esperado), para todas as amostras possveis do tamanho n, for exactamente igual ao valor real
da populao ou seja se para o parmetro se tem E[] .
Exemplos:
A mdia amostral X e a varincia amostral s 2 so exemplos de estimadores no viciados j
que demonstra que:
E[ X ]
.
E[ s 2 ] 2
2.2.2 Eficincia
Um estimador diz-se eficiente, de dentro da classe dos estimadores no viciado ou centrados
tiver a menor varincia. Assim, dados dois estimadores 1 e 2 ambos no viciados, 1 ser mais
E[ X ]
, Onde designa qualquer outro estimador no viciado para .
Var[ X ] Var[ ]
2.2.3 Suficincia
O estimador diz-se suficiente, se utiliza toda a informao disponvel na amostra, relevante
para estimao de .
Exemplo: Os estimadores Mo e Me so estimadores suficientes para a mdia duma populao
normal .
Inquritos por amostragem envolvem a escolha de amostras duma populao que contem um
nmero finito N de unidades. Se essas unidades podem ser distinguidas uma da outra, o nmero
de amostras diferentes de tamanho n que podem ser formadas a partir de N unidades, 1qual
a:
N N!
n n! N n !
Exemplo: Se uma populao contm 5 unidades, representadas por A, B, C, D e E,
respectivamente, existem 10 amostras diferentes de tamanho 3, que so.
Em cada etapa da escolha, este processo d aos nmeros a mesma chance de serem escolhidos.
Se o nmero escolhido no devolvido para a lista, pois isso daria a possibilidade de a mesma
unidade entrar na amostra mais do que uma vez, na prtica no se repete. Por essa razo este
tipo de amostragem se d o nome de amostragem sem reposio.
Desta forma, ao usarmos a tabela dos nmeros aleatrio, o nmero que j foi escolhido
anteriormente ignorado.
Muitas vezes, no plausvel o uso deste tipo de amostragem preferindo-se outros tipos de
amostragem, por razes de convenincia ou mesmo aumento de preciso.
Assim:
Os valores obtidos para cada item nas N unidades que compem a populao so
representados por: y1, y2, y3,..., yN .
E os valores correspondentes na amostra por: y1, y2, y3, ..., yn ou simplismente yi (i =1, 2, ...,n)
N n
N N n n
Embora a amostragem seja realizada para diferentes objectivos, geralmente o interesse centras
em quatro caractersticas da populao, nomeadamente:
O Simbolo ^ usado para indicar a estimativa duma caracterstica da populao obtida atravs
da amostra. Nesta seco ns somente consideraremos as estimativas mais simples:
Estimativa (estimante)
Media da populao Y
Y y mdia da amostra
n
Total da populao Y
y i
Y N y N i 1
n
n
y
y i
R i 1
n
Razo da populao R x
x
i 1
i
N
Em Y o factor a que se multiplica o total da amostra chamado de factor de expanso, ou
n
n
factor de inflao. O seu inverso , a razo entre o tamanho da amostra e o tamanho da
N
populao, chamado de fraco de amostragem e representado por f.
N
valor de y para todas as amostras e depois achamos a mdias das estimativas. O
n
Smbolo E denota, mdia de todas possveis amostras, ou seja o valor esperados das mdias
amostrais
Teorema 3.1:
A mdia amostral y um estimador no viciado de Y , isto : E[ X ] Y
( y1 y 2 ... y n )
Ey
y n
n!( N n)! ( y1 y 2 ... y n )
(3.1)
N N! N! n
n n!( N n)!
N
Onde o somatrio se estende para todas as amostras. Para calcular esta soma, ns
n
determinamos em quantas amostras um dado valor especfico yi aparece. Dado que existem
outras (N-1) unidades para o resto da amostra e (n-1) lugares para preencher na amostra, o
nmero de amostras contendo yi :
N 1 ( N 1)!
n 1 (n 1)!( N n)!
Consequentemente,
( N 1)!
(y 1 y 2 ... y n )
(n 1)!( N n)!
( y1 y 2 ... y N )
De (a) teremos
( N n)! n!( N _ n)!
Ey ( y1 y 2 ... y N )
(n 1)!( N n)! nN!
( y y 2 ... y N )
1 Y
N
Corolrio 3.1:
Y N y um estimador no viciado do total da populao Y. (3.2)
(y i Y )2
2 i 1
(3.4)
N
Agora vamos considerar a varincia de y a mdia amotral, considerada para todas as
N 2
mostras possveis, ou seja E y Y .
n
Teorema 3.2: A varincia da mdia amostral para Amostragem Aleatria Simples igual a:
S 2 N n S 2
V y E y Y
2
n n
n
1 f (3.5)
n
Onde f a fraco amostral.
N
y
S
N n / N
S
1 f (3.6)
n n
Corolrio 3.3: A varincia de Y N y , como estimador do total da populao Y, na
amostragem Aleatria Simples dada pela frmula:
N 2 S 2 ( N n) N 2 S 2
V (Y ) E (Y Y ) 2 1 f (3.7)
n N n
Sabemos que para qualquer populao infinita, para uma amostra de tamanho a varincia
da mdia amostral igual a:
V y
2
n
( N n)
Quando a populao finita, introduz-se o factor para a varincia e o factor
N
( N n)
para o desvio padro.
N
(y i y) 2
s2 i 1
(n 1)
um estimador no viciado para
N
(y i Y )2
S2 i 1
N 1
Nota: Ns tivemos um resultado idntico para populao infinita, onde provamos que
E[S 2 ] 2 . A nica diferena que na demonstrao entra o factor de correco.
da populao Y N y so:
ss N n s2
v( y ) s 1 f
2
(3.9)
n N n
y
e,
N 2ss N n N 2s2
v(Y ) sY
2
1 f (3.10)
n N n
Respectivamente.
Para os erros padro toma-se.
s Ns
sy 1 f e sY 1 f (3.11)
s n
ts
Y y 1 f (3.12)
n
b) Para o Total:
tNs
Y N y 1 f (3.13)
n
O smbolo t o valor do desvio da mdia na distribuio Normal e depende do intervalo de
confiana desejado ( ou da probabilidade de confiana desejada)
NOTA: Se o tamanho da amostra for menor do que 60, os pontos percentuais acima referidos
so tirados da tabela de distribuio t de Student com (n-1) graus de liberdade, graus
liberdades usados no calcula da varincia s 2 .
Exerccio:
Numa localidade com 250 Famlias (Agregados familiares), fez-se um levantamento por
amostragem com o objectivo de determinar o nmero de crianas com idades compreendias
entre 0 e 14 anos na aldeia independentemente de quem so os pais. Decidiu-se trabalhar com
uma amostra de 80 famlias (AF). A tabela abaixo indica os resultados do inqurito.
# filhos yi 2 3 5 6 7 8
Fi 13 19 15 20 10 3
x
Numero total de hom ens adultos
i
i 1
y i
y
R i 1
n
(3.14)
x
i 1
i
x
Exemplos dessa natureza ocorrem, frequentemente, quando a unidade de amostragem (no caso
do AF) e o nosso interesse est no valor mdio da populao por elemento. Os ndices tambm
aparecem em muitas outras aplicaes, como, por exemplo, o ndice de emprstimos para
construes imobilirias no total de emprstimos de um banco, ou o ndice de acres plantadas
com trigo, no total dos acres cultivados de uma fazenda.
Teorema 3.4:
(y Rx i ) 2
i
1 f
Var R (3.15)
nX
2
N 1
Onde
Y n
R o ndice dos valores mdios da populao e f .
X N
Demonstrao:
y y Rx
R R R (3.16)
x x
y Rx
R R
X
E R R
E y Rx Y R X
X
X
0
Y
Visto que R . Isto mostra que a ordem de aproximao usada, ou seja R um estimador
X
no viciado de R .
1
Var ( R ) E ( R R) 2 E ( y R x) 2
X
D Y R X 0.
(y
i 1
i Rx i ) 2
N 1
comum tomar-se
(y
i 1
i R xi ) 2
n 1
s( R )
1 f (y i R xi ) 2
(3.17)
nX n 1
s( R )
1 f y i 2 R yi xi R 2 xi2
(3.18)
X n n 1
Se yjk (k= 1, 2,.., nj ) so as medies nessas unidades, a mdia da populao Y j para o domnio
jht estimado por
nj
y jk
yj (3.19)
k 1 nj
Assim:
Sj nj
sy 1 (3.20)
j
nj Nj
Onde
Sj
2
Nj
y jk Y j
2
(3.21)
k 1 N j 1
sj nj
1 (3.22)
nj Nj
Onde
sj
2
Nj
y jk yj
2
(3.23)
k 1 n j 1
n nj
Se o valor de Nj for desconhecido, a quantidade pode ser utilizada em llugar de , no
N Nj
calculo do cpf.
Yj N j y j (3.24)
nj
N
Yj
n
y
k 1
jk (3.25)
NS ' n
(Y j ) 1 (3.26)
n N
Onde
1 Yj
( yi )
2
S'
2
(3.27)
N 1 sec tor j N
^
Assim, uma estimativa amostral do erro padro de Y j para ser:
s Yj
Ns i
n
1
n
N
(3.28)
a
Teorema 4.1: A proporo amostral p um estimador no viciado da proporo da
n
A
populao P .
N
S 2 N n PQ N n
Var ( p) E ( p P) 2
N N n N
Corolrio 1:
N 2 PQ N n
Var ( A ) (37)
n N 1
N n
var( p) s p
2
pq (3.8)
(n 1)
Demonstrao:
N ( N n)
var( A ) s Np
2
pq (3.11)
n 1
Pr p P d (3.12)
N n PQ
p (3.13)
N 1 n
N n PQ
d t (3.14)
N 1 n
Onde t a abcissa da curva normal que corta a rea nas regio em dois lados.
t 2 PQ
n d2 (3.15)
1 t 2 PQ
1 2 1
N d
Para o uso prtico, como estimador aproximado para P, toma-se p na frmula. Se N for grande,
como primeira aproximao para n, toma-se:
t 2 pq pq
n0 (3.16)
d2 V
Onde
d2
V = Varincia da populao desejada.
t2
n0
Na prtica, primeiro calcula-se n0 . Se for negligencivel, n0 uma aproximao
N
satisfatria de n. Se no, o n obtido atravs da frmula:
n0 n0
n (3.17)
(n0 1) n
1 1 0
N N
Pr y Y d (3.18)
N n S
y (3.19)
N n
Ento
N n S
d t (3.20)
N n
2
tS
n 2
d
(3.21)
1 tS
1
Nd
Como para o caso das propores, toma-se como primeira aproximao para o tamanho da
amostra n o nmero:
2
tS S2
n0 (3.22)
d V
n0
Esta frmula da resultado aceitvel, a no que seja grande. Caso seja, ento calculamos
N
n, como
n0
n (3.23)
n
1 0
N
Se o que se pretende estimar o total da populao Y, com a margem de erro d , toma-se como
a primeira aproximao para n
NtS
n0
2
NS 2
(3.24)
d V
2
s1 2
n 1 . (3.23)
V n1
2
1 . (3.24)
n1
Com este mtodo o estimador binomial de p obtido atravs duma amostra completa de
tamanho n, ligeiramente viciado. Para corrigir este enviesamento, use:
V (1 2 p)
p p (3.26)
pq
Para n toma-se
q1 3 1
n (3.27)
Cp1 p1 q1 Cp1 n1
A estimativa torna-se:
Cp
P p (3.28)
q
Notaes
nk
fh = a fraco amostral no estrato
Nh
Nh
Wh = O peso do estrato h
N
Nk
y hi
Yh i 1
= A mdia do estrato h na populao = h
Nh
nh
y hi
yh i 1
= Mdia amostral do estrato h
nh
Sh
2 1 Nh
N h 1 i 1
Yhi Y h 2
== a varincia verdadeira do estrato h;
sh
2 1 nh
nh 1 i 1
y hi y h 2
= a varincia amostral do estrato h
N h yh
y st h 1
(6.1)
N
na qual N N1 N 2 ... N L .
A estimativa y st , de modo geral, no o mesmo valor mdio amostral. Esse valor mdio
n h yh
y h 1
(6.2)
n
Nh
correctos correspondentes Wh .
N
evidente que y coincide com y st , desde que em cada estrato se verifique a condio
nh N h nh n
ou seja fh f (6.3)
n N Nh N
Teorema 6.1: Se, em todos os estratos, a estimativa amostral yh for sem tendncia, ento o y st
Corolrio 6.1: Uma vez que yh um estimador no viciado para Y h para a amostragem
N h yh
y st h 1
(6.4)
N
Teorema 6.2: Para a amostragem estratificada, a varincia do estimador y st , sendo este uma
N h
2
Var ( y h ) L
Var ( y st ) h 1
Wh Var ( y h )
2
2
(6.5)
N h 1
Onde
V Var ( y h ) E y h Y h
2
(6.6)
Nota Importante: A varincia de y st depende das varincias dos estimadores das mdias Y h
de cada.
2 2
1 L Sh L
2 S
V ( y st ) 2 N h ( N h nh ) Wh h (1 f h ) (6.8)
N h1 nh h1 nh
nh
Corolrio 6.2: Se as fraces de amostragem forem desprezveis em todos os estratos,
Nh
tem-se:
L 2 2L 2 2
1 Nh Sh Wh S h
V ( y st )
N2
h 1 nh
h 1 nh
(6.9)
Esta frmula apropriada quando se podem desprezar as correces das para populaes
finitas.
Corolrio 6.3:
No caso em que a repartio proporcional, pode-se substituir nh por seu valor na frmula
(6.8),
nN h
nh
N
N S N n 1 f
L 2 L
V ( y st ) h h W S 2
h h (6.10)
h 1 N n N n h 1
S N n Sw
2 2
V y st w 1 f (6.11)
n N n
2
S
V (Yst ) N n ( N n nn ) h (6.12)
nh
nh N h
(6.1)
n N
Autor: Filipe Mahaluca mahaluca@gmail.com 34
Inferncia Estatstica
L
custo C C0 C h nh (6.2)
i 1
Onde
C 0 = Custo de contingncias
C h = Custo por unidade em cada estrato e pode variar de unidade por unidade, e para cada
estrato, este custo proporcional ao tamanho da amostra.
Se a amostra alocada ao estrato de tal modo que a varincia do estimador seja mnima, na
condio de que o total oramento disponvel para cobrir a varivel custos fixa e igual a C e
que o custo de amostragem por unidade no estrato h Ch . Essa alocao dada por:
nn Wh S h / Ch N h S h / Ch
(6.3)
W S N S
L L
n
h h / Ch h h / Ch
i 1 i 1
A equao (6.3) d nh em termo de n . Se os custos so fixos, ento n pode ser expresso como:
C C0 N h S h /
L
Ch
n i 1
N S
L (6.4)
h h Ch
i 1
Se V Var y est for fixo, ento n dado por:
L
Wh S h Wh S h / C h
i 1
n (6.5)
1 L
V Wh S h
2
N i 1
Onde, Wh N h / N .
nn WS N S
L h h L h h (6.7)
Wh S h N h S h
n
i 1 i 1
CONFECAO DO QUESTIONRIO
Sob a denominao genrica de " formulrio " se inclui toda forma impressa destinada a colecta
de dados, tal como pronturios, formulrios de declarao de imposto de renda, formulrio de
atestado de bito ou questionrio que por sua vez permitem recolher dados ou sirvam para sua
apuraro.
Os formulrios devem ser planejados cuidadosamente, de tal forma que sejam realmente teis e
que facilitem e no dificultem a obteno de dados. Eles devem ajudar a colectar informaes
de maneira completa e eficiente, permitindo uniformidades nas diferentes observaes e
evitando a colecta de dados inteis ou irrelevantes ao estudo.
Desvantagens:
O primeiro tem importncia para se decidir sobre os dados que em ultima estncia se recolhero
e o seguro para a adopo do tamanho, forma e tamanho mais conveniente.
Embora seja impossvel dar regras fixas para a correcta elaborao de um questionrio, os
seguintes princpios devem ser usados:
Fazer uma lista de todas as informaes que so " desejveis " colectar de acordo com a
finalidade do estudo;
O questionrio deve ser dividido em grupos de questes que denominamos de Blocos .As
questes de um bloco so de um mesmo assunto;
Perguntas Abertas - informante expressa livremente sua opinio sobre determinado assunto.
Perguntas Fechadas - informante selecciona sua resposta dentre um conjunto de opes.
A Forma
O Tamanho
O Material
A Cor
Reformular se necessrio
No entanto antes de entramos nos temas especficos introduziremos alguns conceitos necessrios
para compreenso dessas matrias.
Exerccios Resolvidos
Um pesquisador deseja estimar a proporo de ratos nos quais se desenvolve um certo tipo de
tumor quando submetidos a radiao. Ele deseja que sua estimativa no se desvie da proporo
verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%.
(a) Quantos animais ele precisa examinar para satisfazer essa exigncia?
2
.
2
z 1
,
64
n
pp
(
1
)
0
,
02
0
,2
5
1681
Logo, para que o erro cometido na estimao da proporo de ratos nos quais se desenvolve
certo tipo de tumor quando submetidos a radiao seja no mximo 0,02 com probabilidade
igual a 0,90, o pesquisador precisa examinar 1.681 animais.
Autor: Filipe Mahaluca mahaluca@gmail.com 40
Inferncia Estatstica
(b) Como seria possvel diminuir o tamanho da amostra utilizando a informao adicional de que
em geral esse tipo de radiao no afeta mais que 20% dos ratos?
n
p
(
1
p
)
0
,
02
0
,
20*
0
,8
0
1076
Logo, se p for no mximo 20%, para que o erro cometido na estimao da proporo de
ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiao seja no mximo
0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.
Exerccio 02
Antes de uma eleio, um determinado partido est interessado em estimar a proporo de
eleitores favorveis a seu candidato.
(a) Determine o tamanho de amostra necessrio para que o erro cometido na estimao seja de,
no mximo 0,01, com probabilidade de 80%.
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,90, portanto,
z=1,28.
Como no dispomos de uma informao preliminar sobre p, devemos usar p=0,5, que maximiza
p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2
.
2
z 1
,
28
n
pp
(
1
)
0
,
01
0
,2
54096
Logo, para que o erro cometido na estimao seja de no mximo 0,01, com probabilidade de
80%, o tamanho da amostra teria que ser de 4.096 eleitores.
(b) Uma amostra piloto revelou que entre 60% e 70% dos eleitores eram favorveis ao
candidato em questo. Com base nessa informao, qual deve ser o tamanho de amostra de
modo que as condies em (a) estejam satisfeitos?
n
p
(
1
p
)
0
,
01
0
,
60*
0
,4
0
3933
ou seja, sabendo que p dever estar entre 0,60 e 0,70, o tamanho da amostra teria que ser
3.933, para que as condies em (a) sejam satisfeitas.
(c) Se na amostra com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram
favorveis ao candidato, construa um intervalo de confiana para a proporo de eleitores
do candidato com coeficiente de confiana de 0,95.
Temos que:
n = 4096
p =0,55
P()= 0,95
Logo, pela tabela da distribuio Normal Padro, temos que z tal que A(z)=0,975, portanto,
z=1,96.
p(
1)
p
I
C(
p
;0
,9
5
) z
p
n .
0,
5
5
(
10
,
5
5
)
I
C
(
p;
0
,
9
5
)
0
,
5
5
1,
9
6
0
,
5
5
0,
0
1
5
2
0
,
53
4
8
;0
,
5
6
5
2
4
0
96
Exerccio 03
Um cientista resolve estimar a proporo p de indivduos com certa molstia numa regio. Ele
deseja que a probabilidade de que a sua estimativa no se desvie do verdadeiro valor de p
por mais que 0,02 seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que
essas condies sejam satisfeitas? Um outro cientista descobre que a doena em questo est
relacionada com a concentrao da substncia A no sangue e que considerado doente todo
indivduo para o qual a concentrao A menor que 1,488 mg/cm3. Sabe-se que a
concentrao da substncia A no sangue tem distribuio normal com desvio padro 0,4 mg/cm3
e mdia maior que 2,0 mg/cm3. Voc acha que essas novas informaes podem ser utilizadas
pelo primeiro cientista para diminuir o tamanho amostral? Em caso afirmativo, qual seria o novo
tamanho amostral?
= 0,02
P()= 0,95
z tal que A(z) = 0,975 ,z = 1,96
Como no temos uma informao sobre p, devemos usar p=0,5, que maximiza p(1-p).
Assim, podemos calcular o tamanho da amostra da seguinte forma:
2 2
z 1
,
96
n
pp
(
1
)
0
,
02
0
,2
5
2401 .
O tamanho da amostra deve ser 2.401 indivduos para que as condies acima sejam satisfeitas.
A informao acima podem ser utilizada pelo primeiro cientista para reduzir o tamanho da
amostra, pois como o valor de p no mximo 0,1, o valor mximo de p(1-p) atingido quando
p=0,10, e assim:
2 2
z 1
,
96
n
p
(
1
p
)
0
,
02
0
,
10*
0
,9
0
865
Neste caso, a informao do segundo cientista ajuda a reduzir o tamanho de amostra para
aproximadamente 865 indivduos.
Exerccio 04
Um centro de estudos de pesquisa de opinio realizou uma pesquisa para avaliar a opinio dos
telespectadores de uma regio, sobre um certo comentarista desportivo. Para isso entrevistou
380 telespectadores, seleccionados ao acaso da regio, e constatou que 180 desejavam que o
comentarista fosse afastado da TV.
(a) Determine um intervalo de confiana de 90% para p:proporo de telespectadores,
favorveis ao afastamento do comentarista.
p(
1)
p
I
C(
p
;0
,9
0
) z
p
n
0,
4
7
(
10
,
4
7
)
I
C
(
p
;
0
,9
0
)
0
,
4
7
1,
6
4
0
,
4
70
,
0
4
0
,
43
;
0,
5
1
3
80
(b) Suponha agora que o centro decida que um intervalo de confiana, com coeficiente de 90%
para p, deve ter comprimento 0,05. Voc acha que os dados do item (a) atingem esse
objetivo? Justifique e comente.
Os dados do item (a) no atingiram o objectivo, j que, o intervalo obtido no item (a) tem
comprimento igual a 0,08.
0
,
47(
10
,4
7)
1
,
64 *
0
,
02
5n*
=1072.
n
Assim, os dados do item(a) atingem os objectivos se o nmero de telespectadores
entrevistados aumentar para 1.072.
Exerccios
1. Seja X1, X2, ..., X6, variveis aleatrias independentes, identicamente distribudas de forma
normal com a mdia, e varincia, 2 . Defina os seguintes estimadores:
X X 2 X 3 3X 5 X X2 X3 X4
a) 1 1 b) 2 1
5 4
2X1 X 2 X 3 X 4 X X2 X3 X4 X5
c) 3 d) 4 1
4 6
X X2 X3 X4 X5
e) 5 1
5
Diga qual desses estimadores no viciado e qual o mais eficiente.
2. Sejam X1 = 25, X2 = 30, X3 = 27, X4 = 35, X5 = 40, as idades dos estudantes duma turma
do DMI (Departamento de Matemtica e Informtica).
a) Com base nesses dados determine a idade mdia da turma.
b) Forme todas as amostras de tamanho trs e calcule as mdias de cada amostra e
comprove que E X e
2
var[ X ] .
n
c) Quantas amostras de tamanho 4 so possveis formar? Forme essas amostras e repita o
exerccio da alnea b).
3. Determine a distribuio por amostragem da diferena entre duas mdias amostrais, isto
determine E X 1 X 2 e var X 1 X 2 .
5. Num estudo sobre a relao existente entre uma atitude de criana e a idade na qual ela
fala primeiro, os pesquisadores registaram a idade (em meses) da primeira fala da criana e
o nmero de pontos (escore) obtido pela criana num teste sobre a atitude. Seguem-se os
dados para 21 crianas:
criana 1 2 3 4 5 6 7 8 9 10 11
Idade 15 2 10 9 15 20 18 11 8 20 7
Criana 12 13 14 15 16 17 18 19 20 21
Idade 9 10 11 11 10 12 42 17 11 10
Escore 96 83 84 102 100 105 57 121 86 100
a) Fazendo o uso da tabela de nmeros aleatrios seleccione uma amostra de tamanho 8. Inicie
a sua leitura da tabela em anexo na linha um, coluna dois. A leitura deve ser feita atravs das
colunas.
b) Com base na sua amostra determine:
(i) a idade mdia da primeira fala;
(ii) o nmero mdio de pontos (escores) dessa amostra e a sua varincia;
(iii) estime o nmero total de pontos para a populao em estudo;
(iv) estime o erro padro da estimativa do total e, d o intervalo de confiana de 95%
dessa estimativa.
6. Numa Biblioteca Privada, os livros esto arrumados em 130 estantes de igual tamanho. Duma
amostra aleatria de 15 estantes deu as seguintes quantidades de livros em cada estante:
28, 23, 25, 33, 31, 18, 22, 29, 30, 22, 26, 20, 21, 28, 25
a) Estimar o valor total de livros dessa biblioteca e o intervalo de confiana dessa estimativa do
total.
b) Suponha agora que o resultado da estimativa no suficientemente correcto e pretendemos ser
95% certos de que a estimativa do do total duma amostra aleatria esteja a 100 de unidades
do valor verdadeiro. Quantas estantes devero ser inclusos na amostra?
7. Num sector particular duma fbrica foi realizado um inquerido para tentar investigar at que
ponto o absentismo no este ligado com doenas ou frias oficiais. Uma amostra de 500
pessoas, num total de 36000 trabalhadores foi perguntada sobre o nmero de dias que eles
j tinham solicitado para descansar, nos anteriores seis meses.
Os resultados do inqurito foram os seguintes:
8. Uma amostra aleatria simples de 30 Agregados Familiares (AF) foi seleccionada em uma
zona urbana que contem 14848 AFs. O nmero de pessoas (membros do AF) em cada um
dos AFs que integram a mostra o seguinte:
3, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2, 4, 3, 4, 2, 4.
b) Dada a mesma populao, calcular s 2 para todas as amostras aleatrias simples de tamanho
3 e provar que E[s 2 ] S 2 .
respectivamente. Cada estudante foi perguntado sobre a distncia entre a sua casa e a
universidade. Os resultados amostrais foram os seguintes:
y 1 5.14 y 2 4.90
13.Numa Amostra Aleatria simples de tamanho 100, duma populao de tamanho 500, existem
37 unidades na classe C. Determine o intervalo de confiana de 95% da proporo para o
nmero total de unidades em C na populao
Para uma amostra de 100 farmas, calcule o tamanho da amostra para cada estrato, usando:
a) A alocao proporcional;
b) A alocao ptima
16. Um amostrista pretende seleccionar uma amostra aleatria estratificada e suspeita que os
custos do trabalho de campo sero da forma C n
h h . As estimativas das quantidades relativas
para os dois estratos so:
Estrato Wh Sh Ch
1 0.4 10 $4
2 0.6 20 $9
a) Determine valores de n1 / n e n2 / n que minimizam o custos para dado valor de Var y est .
b) Determine o tamanho da amostra necessrio, para esta alocao, de modo que Var y 1. est
Introduo
Z=
Ou seja:
P( -Z/2ZZ/2)=1-
Substituindo se o valor de Z,
P(-Z/2 Z/2)=1-
Resolvendo -se as duas inequaes para , tem-se o intervalo de confiana para a mdia
populacional () quando a varincia (2) conhecida:
P( X -Z/2 X +Z/2 )
Exemplo:
A durao da vida de uma pea de equipamento tal que = 5 horas.
Foram amostradas 100 dessas peas obtendo-se a mdia de 500 horas. Deseja-se construir um
intervalo de confiana para a verdadeira durao mdia da pea com um nvel de 95%.
Resolucao:
Do problema se tem: = 5; n = 100; X = 500; (1 a).100 = 95%
Z/2=1.96
Lembre-se que para descobrir a abcissa 1,96, entrou-se na tabela com 0.475= 47.5%, j que a
tabela da faixa central.
Substituindo se os dados na formula:
P(500-1,96. 500+1,96. ) =95%
Efectuando os clculos:
P(499.02500.98)=95%
que o intervalo solicitado.
ERRO DE ESTIMACAO
O intervalo de confiana bilateral tem a forma;
X Z/2
Logo = Z/2
n= ( )2
t=
Exemplo:
A amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao normal. Construir um
intervalo de confiana para a mdia a nvel de 95%.
Resolucao:
Calculando-se a mdia e o desvio-padro da amostra obtm-se: X = 8,7 e S = 2.
Como: 1 - = 95% e g. l. = = n 1 = 10 1 = 9
t/2=2.2622 (tabela)
Logo
P(8.7-2.2622. 8.7+2.2622. )=95%
Ou
P(7.2710.13)=95%
) )
P( )
Exemplo:
Admita n = 10, S2=4 e que se deseja construir um IC para a varincia a nvel de 90%
Resolucao:
Tem se n=10, S2=4, (1-).100=90% e =(n-1)=(10-1)+9
Logo:
P( )=90%
P(2,13 )=90%
A interpretao que o intervalo [2,13; 10,81] contm a verdadeira varincia com 90% de
confiana.
) )
P( S. )=1-
f ( )
f ( )
Assim, para o caso de populaes infinitas, a varivel padronizada de f dada por:
Z=
Substituindo-se o valor de Z:
P( -Z/2 Z/2)=1-
P(f-Z/2 f+ )=1-
Para amostras grandes (n > 30) pode-se substituir p e q = (1 p) do radicando por f e (1 f).
Assim, o IC para a proporo ser:
) )
P(f-Z/2 f+ )=1-
) )
P(f-Z/2 f+ )=1-
Exemplo: Examinadas 500 peas de uma grande produo encontrou-se 260 defeituosas. No
nvel de 90% construir um IC para a verdadeira proporo de peas defeituosas.
Z/2=1.64
Ento, o IC ser:
) )
P(0.52-1.64 (0.52+1.64 =1-
Ou
P(0.483 )
Ou ainda
P(48.3% )
INTRODUO
Teste de Hipteses uma tcnica para se fazer inferncia estatstica. Ou seja, a partir
de um teste de hipteses, realizado com os dados amostrais, pode-se inferir sobre a populao.
No caso das inferncias atravs dos IC, busca-se cercar o parmetro populacional
desconhecido. Aqui formula-se uma hiptese quanto ao valor do parmetro populacional, e pelos
elementos amostrais faz-se um teste que indicar a aceitao ou rejeio da hiptese formulada.
Teste de hipteses uma regra de deciso para aceitar ou rejeitar uma hiptese estatstica com
base nos elementos amostrais.
Uma hiptese pode ser definida como uma afirmativa sobre a populao.
Por exemplo, um psiclogo pode levantar a hiptese de que as meninas tm melhor desempenho
verbal do que os meninos, ou um mdico pode levantar a hiptese de que os fumantes vivem
menos do que os no-fumantes. O testes de hipteses permitem estabelecer se tais afirmativas
so confirmadas pelos dados disponveis.
Para decidir por uma das hipteses isto , para decidir se as mdias na populao so, ou
no so, iguais o pesquisador submete os dados da sua amostra a um teste de hipteses. Mas
em que consiste este teste? O pesquisador supe que as mdias, na populao, so iguais. Se
sob essa hiptese for pouco provvel ocorrer uma diferena de mdias to grande ou maior
do que a que se observou na amostra, o pesquisador rejeita a hiptese inicial e conclui que as
mdias, na populao, so diferentes.
Exemplo:
Um professor quer saber se dois mtodos de alfabetizao, A e B, tm a mesma eficincia. Na
amostra, as mdias das notas dos alunos foram 5,0 para o mtodo A e 7,0 para o mtodo B. Se
sob a hiptese de que, na populao, as mdias so iguais for pouco provvel ocorrer, na
amostra, uma diferena de dois pontos ou mais entre mdias, lgico rejeitar a hiptese inicial e
concluir que B mais eficiente do que A.
Mas preciso insistir neste ponto pouco provvel no significa impossvel. Ento, o
pesquisador pode cometer erro quando conclui que, na populao, as mdias so diferentes s
porque seria pouco provvel ocorrer uma diferena de mdias to grande, ou maior do que a
que ele prprio observou, se as mdias da populao fossem iguais. O pesquisador no sabe se
est ou no cometendo esse tipo de erro, embora a probabilidade de ocorrer o erro seja
conhecida. o que os estatsticos denominam nvel de significncia do teste (probabilidade de
rejeitar H0 quando H0 verdadeira).
Finalmente, toda vez que se rejeita H0, ao nvel de significncia de 5%, usual afirmar que o
resultado significante e indicar isso com um asterisco. Quando se rejeita H0 ao nvel de
significncia de 1%, usual afirmar que o resultado altamente significante e indicar isso com
dois asteriscos.
b) H0: =1.65m
H1: 1.65m Dar origem a um teste unicaudal direita
c) H0: =1.65m
H1: 1.65m Dar origem a um teste unicaudal esquerda
1) H0: =0
onde:
X = Media amostral
0= Valor da hiptese nula
S= desvio padro amostral
n = tamanho da amostra
5) Concluses
a) Se -t/2 tcal t/2 no se rejeita H0
Se tcal> t/2 ou tcal <-t/2, rejeita se H0
b) Se tcal t no se rejeita H0
Se tcal> t rejeita se H0
c) Se tcal -t no se rejeita H0
Se tcal <- t rejeita se H0
Exemplo: Os dois registos dos ltimos anos de uma Universidade atestam, para os calouros
admitidos, uma nota mdia 115 (teste vocacional). Para testar a hiptese de que a mdia de
uma nova turma a mesma, tirou-se, ao acaso, uma amostra de 20 notas, obtendo-se mdia 118
e desvio-padro 20. Admitir que = 0,05, para efectuar o teste.
Resoluo
1) H0: =1.65m
H1: 1.65m
2) = 0,05
Varivel t com 19 graus de liberdade.
3) t/2=2,093
4) =0,67
5) Como 2,093 tcal 2,093, no se pode rejeitar H0: = 115 com esse nvel de
significncia.
onde:
n = tamanho da amostra;
S2= varincia amostral;
2 = valor da hiptese nula.
6) Conclusoes:
a) Se 2inf 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup ou 2cal < 2inf rejeita se H0
b) Se 2cal 2sup no se pode rejeitar H0
Se 2cal> 2sup rejeita se H0
c) 2ca 2inf no se pode rejeitar H0
2ca 2inf rejeita se H0
Exemplo: Para testar a hiptese de que a varincia de uma populao 25, tirou-se uma
amostra aleatria de 25 elementos obtendo se S2=18,3. Admitindo-se = 0,1, efectuar o teste
de significncia unicaudal esquerda.
Resolucao:
1) H0: 2= 25
2< 25
3) 2inf=15.7
)
4) 2cal= =17,56
p<p0 (c)
5) Concluses
a) Se -Z/2ZcalZ/2 no se pode rejeitar H0;
Se Zcal> Z/2 ou Zcal <-Z/2 rejeita se H0
Exemplo:
As condies de mortalidade de uma regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 0,6. Testar essa hiptese ao nvel de 5% se em 1000 nascimentos
amostrados aleatoriamente, verificou-se 530 sobreviventes at 60 anos.
1) H0: p=0.6
H1: p
3) RA e RC
Z/2=1.96
4) Zcal= = =-4,51
) )
5) Como Zcal <-1,96, rejeita se H0, concluindo se, ao nvel de 5% de significncia que
p
1) H0: 21= 22
H1: 21 22
Podem-se testar as desigualdades < ou >, todavia, o mais comum
Fcal=
6) Concluses
Se Fint Fsup no se pode rejeitar H0;
Se Fcal > Fsup ou Fcal < Fint, rejeita se H0
Exemplo
Dois programas de treinamento de funcionrios foram efectuados. Os 21 funcionrios treinados
no programa antigo apresentam uma varincia 146 em suas taxas de erro. No novo programa,
13 funcionrios apresentaram uma varincia de 200. Sendo = 0,1, pode-se concluir que a
varincia diferente para os dois programas?
1) H0: 21= 22
H1: 21 22
3) RA e RC
Fint=0,43 e Fsup=2.54
4) Fcal= = =0.73
( X X )
Zcal =
5) Conclusoes
Se -Z/2ZcalZ/2 no se pode regeitar H0;
Se Zcal> Z/2 ou Zcal<-Z/2 , regeita se H0.
Exemplo
Um fabricante de pneus produz dois modelos. Para o modelo A, = 2500 milhas, e para o
modelo B, = 3000 milhas. Um txi testou 50 pneus do modelo A e 40 do modelo B, obtendo
24000 milhas e 26000 milhas de durao mdia dos respectivos modelos. Adoptando-se um
risco = 0,04 testar a hiptese de que a vida mdia dos dois modelos a mesma.
Resolucao:
1) H0: A=B
H1: A B
3) RA e RC
Z/2=2.05
4) Zcal = =-3,38
5) Como Zcal <-2,05, rejeita-se H0, concluindo-se com risco de 4% que as mdias dos pneus
so diferentes.
1) H0: 1=2 ou 1-2=d onde d>0 uma diferena admitida entre as medias.
H1: 1 2 ou 1-2 d
( X X )
tcal =
5) Concluses
Se -t/2tcalt/2 no se pode rejeitar H0;
Se tcal> t/2 ou tcal < -t/2 , rejeita se H0.
Exemplo: Dois tipos de tinta foram testados sob as mesmas condies meteorolgicas. O tipo A
registou uma mdia de 80 com um desvio de 5 em 5 partes. O tipo B, uma mdia de 83 com um
desvio de 4 em 6 partes. Adoptando-se = 0,05 testar a hiptese da igualdade das mdias.
Resolucao:
1) H0: A=B
H1: A B
3) RA e RC
t/2=2.2622
)
) )
4) Sc=
)
Sc= =4.47
Tcal= =-1.12
02) Dados: n=10, x = 112 e s = 11, determinar os intervalos de confiana, para os nveis de
95% e 90%, para a mdia populacional.
03) Um conjunto, composto por 12 animais em experincia, foi alimentado com uma dieta
especial durante certo tempo e verificou-se que os aumentos de peso foram:
25 22 30 26 24 39 32 26 32 33 28 30.
Encontrar os limites de confiana para a mdia, ao nvel de confiana de 90%.
04) Supondo populaes normais, determinar o intervalo de confiana para a mdia dos
seguintes conjuntos de dados (considere = 0,05):
a) 64,9 64,1 63,8 64,0 62,0 61,2 65,9 60,7.
b) 1,19 1,23 1,18 1,21 1,27 1,17 1,15 1,14 1,19 1,20.
05) Numa fbrica, colhida uma amostra de parafusos, foram obtidos os seguintes valores de
dimetro (medidas em mm)
10 11 11 11 12 12 12 12 13 13 13 13 13 13 13
13 13 13 13 13 14 14 14 14 14 15 15 15 16 16
Pede-se para construir o intervalo de confiana para:
a) o dimetro mdio real de toda a produo de parafusos , bem como para o desvio padro
desse dimetro, ao nvel de 95% de confiana ;
b) a proporo real de parafusos que medem de 12 a 14 mm , ao nvel de 88% de confiana.
07) Numa pesquisa de opinio pblica, entre 600 pessoas, 240 responderam que sim a certa
pergunta. Determinar o intervalo de confiana para a percentagem populacional que deve
responder sim, ao nvel de confiana de 95%.
08) Uma amostra de 300 habitantes de uma cidade mostrou que 180 desejavam a fluorao da
gua. Encontrar limites de confiana para a proporo real de habitantes no favorveis
fluorao, para:
a) nvel de confiana de 90% ;
b) nvel de confiana de 95%.
09) Numa cidade, entre 1000 residncias, 288 assinam TV cabo. Determinar o intervalo de
confiana para a proporo de assinantes de TV cabo, nesta cidade, ao nvel de confiana
de 98%.
10) Dada a distribuio a seguir, pede-se para construir o intervalo de confiana para a mdia
ao nvel de 95%
11) Com uma amostra de 25 elementos de uma populao obtivemos: mdia 8; desvio padro
1,58 e f =60%. Determinar os intervalos de confiana para :
a) a mdia , com = 10% ;
b) a proporo , com = 4% .
01) Uma amostra de 10 elementos apresentou x = 230. Sabe-se que a varincia da populao
igual a 160. Testar a hiptese de = 218, contra a alternativa 218, ao nvel de
significncia de 10%.
02) Uma indstria produz lmpadas que seguem uma distribuio N (800, 1600) horas. Testar a
hiptese de que = 800, contra a alternativa 800, se uma amostra aleatria de 30
lmpadas teve um tempo mdio de vida de 788 horas e adoptando nvel de 5%.
03) Numa amostra de 20 elementos de uma populao normal obteve-se mdia 42 e desvio
padro 5. Ao nvel de significncia de 5%, testar a hiptese de que a mdia populacional
50, contra a alternativa de ser diferente de 50.
07) Em 60 lances de uma moeda observaram-se 37 caras. Testar a hiptese da moeda ser
honesta, aos nveis de 5% e 1%.
08) As condies de mortalidade de uma certa regio so tais que a proporo de nascidos que
sobrevivem at 60 anos de 60%. Testar essa hiptese, ao nvel de 5% , sabendo-se que ,
em 1000 nascimentos amostrados, verificaram-se 530 sobreviventes at 60 anos.
09) Medidos os dimetros (em mm) de 32 peas de uma produo, resultou a distribuio
abaixo:
Valores 56,5 56,6 56,7 56,8 56,9 57,0 57,1 57,2 57,3
Fi 1 3 2 4 10 5 4 1 2
10) Uma amostra com 25 elementos, provinda de uma populao normal, apresentou mdia
amostral 81. Uma outra com 36 elementos apresentou mdia 76. Sendo os desvios padres
populacionais de 5,2 e 3,4 respectivamente, testar a hiptese das mdias das duas populaes
serem iguais, contra a hiptese alternativa de serem diferentes, ao nvel de 6%.
11) Dois tipos de solues qumicas A e B foram ensaiados para determinar os pH. Observando-
se nA = 6, obteve-se mdia 7,52 e com nB = 5 obteve-se mdia 7,49. Sendo os desvios padres
populacionais de 0,024 e 0,032, respectivamente, testar a hiptese das mdias serem iguais,
contra a alternativa de serem diferentes, ao nvel de significncia de 5%.
12) Num levantamento de opinio pblica para previso de uma eleio, foram ouvidos 500
eleitores escolhidos ao acaso; 236 declararam que iriam votar no candidato A e os demais no
candidato B. Verificar se, com base nesta previso, podemos concluir que o candidato B j
venceu a eleio, ao nvel de significncia de 1%.
13) Testar se h diferena significativa entre as mdias populacionais com base nas duas
amostras, para um nvel de significncia de 5% e 1%.
a) (supor que as varincias populacionais so iguais )
8 12 3 10 15 2
14) Numa amostra de 250 elementos verificaram-se 24 sucessos e noutra de 100 elementos
verificaram-se 15 sucessos. Podemos supor idnticas as probabilidades de sucesso nas duas
populaes, ao nvel de 5%?
15) Numa pesquisa com os telespectadores de uma cidade, 60 de 200 homens desaprovam
certo programa, acontecendo o mesmo com 75 de 300 mulheres. Ao nvel de significncia de
10%, h diferena real entre as opinies de homens e mulheres?
16) Dados: n1 = 25, x1 = 8, s1 = 1,58, f1 = 60% para uma certa populao, e para outra
populao: n2 = 31, x2 = 7, s2 = 1,24, f2 = 35%. Testar:
a) H0: 1 = 7,5 H1 : 1 7,5 = 5%
b) H0 : p1 = 55% H1 : p1 55% = 4%
c) H0 : 1 = 2 H1 : 1 2 = 5%
d) H0 : p1 = p2 H1 : p1 p2 = 7%
02) Suponhamos que se pretenda estimar a renda mdia por famlia numa grande cidade. Com
base em informaes passadas, admite-se que o desvio padro das rendas das famlias de
200,00mt. Qual deve ser o tamanho da amostra, a fim de que o erro de estimativa da renda
mdia seja no mximo de 10,00mt, com probabilidade igual a 96%?
03) Para se estimar a proporo de pessoas interessadas em gua fluorada, qual o tamanho da
amostra, para se estar confiante em 95% de que o erro seja de no mximo 1% ?
INTRODUO
Muitas vezes, na prtica, necessitamos estudar o relacionamento de duas variveis, colectadas
como pares de valores, para resolver questes, como por exemplo:
O sucesso de um emprego pode ser predito com base no resultado de testes:
Quanto maior for a produo, maior ser o custo total.
Quanto maior for a idade de um imvel, menor ser seu preo de venda.
Problemas como esses podem ser estudados atravs uma analise de correlao simples, onde
podemos determinar a fora do relacionamento entre asa duas variveis estudadas.
As variveis estudadas sero: X, denominada de varivel independente, e Y, denominada de
varivel dependente.
Se o relacionamento entre X e Y for consistente e necessitamos fazer uma predio para o valor
de Y, conhecido um valor de X, atravs de uma frmula matemtica adequada, podemos aplicar
a chamada anlise de regresso simples.
A localizao precisa desta linha determinada pelo Mtodo dos Mnimos Quadrados
(MMQ).
Exemplos de diagramas de disperso:
Y x u
onde
Y a bx
onde a= estimador do coeficiente linear;
b= estimador do coeficiente angular;
sxy
b
sxx
a y b.x
x. y
sxy xy
n
x 2
sxx x 2
n
y 2
syy y 2
u ( y Y )
n2
Divide-se por n-2 pois perde-se dois graus de liberdade com as estimativas de
e .
Frmula alternativa
u y 2
a y b x. y
n2
Para construir um intervalo de predio para Y dado X, usa-se u e duas hipteses
bsicas:
1. a disperso de y a mesma em todos os pontos da recta;
2. a cada ponto, os valores de y so normalmente distribudos em relao recta de
regresso.
u
b
x2 n X
2
b t n 2 ; / 2
. b
Se o valor zero estiver no intervalo, no h declividade.
H0: = 0
H1: 0 ou > 0 ou < 0
b 0
tc ~ t n 2 gl
b
a y b xy n( y ) 2
Amostra: r
2
y n( y )
2 2
Populao:
2
Amostra: r r 2
sxy
r
sxx . syy
que no requer o conhecimento dos coeficientes a e b da equao de regresso. O sinal do
coeficiente obtido directamente, sem necessidade de observar ou calcular a declividade da
linha de regresso.
O coeficiente amostral de correlao r tem uma leve tendenciosidade como um estimador de .
4.9 Signific
ncia do coeficiente de correlao
Hipteses:
H0 : 0 H0 : 0 H0 : 0
H1 : 0 ou H1 : 0 ou H1 : 0
Se a hiptese nula, ao nvel de significncia , for rejeitada podemos concluir que efetivamente
existe uma relao entre as variveis.
A estatstica de teste
r n2
tc
1 r 2 com n-2 graus de liberdade na tabela t
Exerccios Resolvidos
Exerccio 01
esperado que a massa muscular de uma pessoa diminua com a idade. Para estudar essa
relao, uma nutricionista seleccionou 18 mulheres, com idade entre 40 e 79 anos, e observou em
cada uma delas a idade (X) e a massa muscular (Y).
Massa muscular (Y) Idade (X)
82.0 71.0
91.0 64.0
100.0 43.0
68.0 67.0
87.0 56.0
73.0 73.0
78.0 68.0
80.0 56.0
65.0 76.0
84.0 65.0
116.0 45.0
76.0 58.0
97.0 45.0
100.0 53.0
105.0 49.0
77.0 78.0
73.0 73.0
78.0 68.0
(a) Construa o diagrama de disperso e interprete-o.
120
110
100
M.muscular
90
80
70
60
40 50 60 70 80
Idade
No grfico de disperso entre a varivel massa muscular e idade, pode-se observar que h um
forte indcio de relao linear decrescente entre as variveis em estudo. Nota-se que a massa
muscular das pessoas diminui medida que a idade aumenta.
(b) Calcule o coeficiente de correlao linear entre X e Y.
Denotamos as variveis: Y = Massa Muscular e X = Idade n=18
18 18 18
X 61,556 Y 85 X i2 70362
i 1
Yi 2 133300
i 1
Y X
i 1
i i 91964
18
S XX X i2 18 X
2
70362 18(61,556) 2 2157,460
i 1
18
S YY Yi 2 18 Y
2
133300 18(85) 2 3250
i 1
18 18
( X i X )(Yi Y ) X Y i i 18 XY
91964 18(85)(61,556)
r i 1
i 1
-0,837
S XX SYY S XX SYY (2157,460)(3250)
Segundo o resultado da correlao obtida, pode-se notar que h uma forte correlao linear
entre a varivel massa muscular e idade. Nota-se que medida que a idade da pessoa
aumenta a massa muscular diminui, o que coerente com o grfico de disperso apresentada
anteriormente.
(c) Ajuste uma recta de regresso para a relao entre as variveis Y: massa muscular
(dependente) e X: idade (independente).
S XY 91964 18(85)(61,556)
1 -1,027
S XX 2157,460
e
0 Y 1 X 85 1,027(61,556) 148,218
A recta de regresso estimada da varivel Massa muscular (Y) em funo da Idade (X)
Y 148,218 1,027 X
(d) Considerando a recta estimada dada no item (c), estime a massa muscular mdia de mulheres
com 50 anos.
Exerccio 02
Os dados a seguir correspondem varivel renda familiar e gasto com alimentao (em
unidades monetrias) para uma amostra de 25 famlias.
Renda Familiar (X) Gasto com Alimentao (Y)
3 1,5
5 2,0
10 6,0
10 7,0
20 10,0
20 12,0
20 15,0
30 8,0
40 10,0
50 20,0
60 20,0
70 25,0
70 30,0
80 25,0
100 40,0
100 35,0
100 40,0
120 30,0
120 40,0
140 40,0
150 50,0
180 40,0
180 50,0
200 60,0
200 50,0
(a) Construa o diagrama de disperso do varivel gasto com alimentao (Y) em funo da
renda familiar (X).
60
Gasto com Alimentao
50
40
30
20
10
0
0 100 200
Renda Familiar
25 25 25
X 83,120 Y 26,660 X i2 271934
i 1
Yi 2 24899,250
i 1
Y X
i 1
i i 80774,500
25
S XY X Y i i 25 XY
r i 1
0,954
S X SY S X SY
(c) Obtenha a equao de regresso do gasto com alimentao em funo da renda familiar.
25
S X Y i i 25 X Y
80774,5 25(83,12)(26,66)
1 XY i 1
0,256
S XX S XX 271934 25(83,12) 2
e
0 Y 1 X 26,66 0,256(83,120) 5,380
A recta de regresso estimada da varivel Gasto de alimentao (Y) em funo da Renda
familiar (X)
Y 5,380 0,256X
(d) Qual o significado prtico do valor da inclinao da recta de regresso do item (c)?
O valor 1 =0,256 significa que estima-se que para cada aumento de uma unidade
monetria da renda familiar ocorre um acrscimo em mdia de 0,256 unidades no gasto com
alimentao.
Exerccio 03
Um pesquisador deseja verificar se um instrumento para medir a concentrao de determinada
substncia no sangue est bem calibrado. Para isto, ele tomou 15 amostras de concentraes
conhecidas (X) e determinou a respectiva concentrao atravs do instrumento (Y), obtendo:
X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0
Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1
Diagrama de Disperso
10,5
9,5
8,5
7,5
6,5
Y
5,5
4,5
3,5
2,5
1,5
2 3 4 5 6 7 8 9 10
X
(b) Trace no grfico a recta com 45 de inclinao passando pela origem. Como essa reta pode
ser til na avaliao do instrumento?
10
5
y
0 5 10
x
Esta recta til, pois, quanto mais prximos os pontos estiverem nela, maior preciso do
instrumento, j que o ideal Y=X.
15
(X i X )(Yi Y )
r i 1
0,996
S X SY
Y 0,160 0,980X
(e) Com base nos itens anteriores tire concluses sobre a eficincia do instrumento.
Com base nos itens anteriores, nota-se que, o instrumento para medir a concentrao de
determinada substncia no sangue encontra-se bem calibrado. Observa-se que existe uma alta
correlao entre as medidas feitas pelo instrumento e a concentrao da determinada
substncia, o que pode ser confirmado nos grficos apresentados anteriormente. Alm disso, a
reta de regresso obtida bem prxima da reta Y=X, indicando grande proximidade entre as
medidas. O mtodo formal para verificar se o instrumento esta bem calibrado testar as
hipteses: (=0,05)
H 0: 1 1
H 1 : 1 1
Estatstica do teste:
1 1
T ~
T(15 2)
2 / S XX SobH 0
R.C. (=0,05)
R.C. {T R :| T | 2,16}
Valores observados
0,980 1 0.02
T0bs 0.828
/ S XX
2
0.06984/ 120
Como T0bs R.C. , ento aceita-se Ho. Ou seja, o instrumento esta bem calibrado.
2- Uma cadeia de supermercados financiou um estudo dos gastos realizados por famlia de
quatro pessoas com renda mensal lquida entre oito e vinte salrios mnimos. A pesquisa levou a
X Y
1 10
2 30
3 40
4 50
5 65
6 70
9- Para cada um dos casos abaixo teste, a 5%, a significncia do coeficiente angular da recta
de regresso:
a) b=4; b 1; n=12;
X Y
0,91 0,10
1,33 1,10
4,19 3,40
2,68 2,10
1,86 2,60
1,17 1,00
comprimento largura
12 10
15 14
11 9
16 13
13 10
12 12
10 8
9 7
17 13
15 14
13- A tabela abaixo mostra a frequncia do pulso mdio em diferentes perodos etrios:
Idade Pulso
2 112
4 104
6 100
8 92
10 88
12 86
14 84
16 80
14- A tabela abaixo mostra o volume de vendas (em 1.000 unidades) e os gastos promocionais
(em 100.000 mt ).
Vendas Promoo
80 2
90 4
95 5
95 6
100 8
110 8
115 10
110 10
120 12
130 15
Tempo-X
Qualidade - Y
1 23
2 31
3 40
4 46
5 52
6 63
17- A tabela seguinte mostra os resultados de uma pesquisa com 10 famlias de determinada
regio.
Famlias Renda Poupana Nmero de Mdia de Anos de
(10000 mt) (1000 mt) Filhos Estudo da Famlia
A 10 4 8 3
B 15 7 6 4
C 12 5 5 5
D 70 20 1 12
E 80 20 2 16
F 100 30 2 18
G 20 8 3 8
H 30 8 2 8
I 10 3 6 4
J 60 15 1 8
18- Um grupo de pesquisa estabeleceu uma escala de quocientes de violncia para programas
de televiso. Classificou cada um dos 6 programas e colectou dados sobre o percentual de
pessoas que assistem cada programa. Verifique se existe correlao significativa entre as
variveis com um nvel de significncia de 5%.
Programa Quociente de violncia (X) % que assistem (Y)
1 10 15
2 30 20
3 40 24
4 50 30
5 65 35
6 70 35
19- Os dados abaixo representam o Consumo (Y) e Renda disponvel (X) num perodo de 14
anos. As variveis so expressas em milhes de meticais.
2 2
X 3915,5 Y 3273,4 X 1150349,73 Y 800330,16
XY 959198,36
a) Determine as estimativas de a e b dos parmetros da recta estimada;
b) Qual o significado econmico dessas estimativas?
20-Uma empresa est estudando como varia a demanda de certo produto em funo de seu
preo de venda. Para isso levantou as seguintes informaes:
Meses Unidades Vendidas Preo/unidade
(Y) (X)
J 248 162
F 242 167
M 234 165
A 216 173
M 230 170
J 220 176
J 213 178
A 205 180
S 198 182
O 195 187
N 197 190
D 260 200
5.1. Situaes
Diariamente ouvimos frases como estas:
A inflao do ms de Janeiro de 2005 foi de 0,69%.
A inflao acumulada de 2004 foi de 8,19%.
O rendimento da caderneta de poupana com database 28/01/05 foi de 0,65%.
A indstria automobilstica trabalha com a taxa de 3,72% nos financiamentos dos
carros.
Um jornal, por ocasio de um pleito eleitoral publicou uma tabela com os seguintes resultados da
apuraro na regio:
5.2 Definio
Um nmero-ndice uma medida estatstica que serve para comparar grupos de variveis
relacionadas entre si e obter um quadro simples e resumido das mudanas em reas
relacionadas como preos de matrias-primas, preos de produtos acabados, volume fsico de
produo, etc.
5.4 Nmeros-ndices
Consideremos a tabela abaixo, relativa s matrculas efectivadas em certo estabelecimento de
ensino durante o perodo de 1999 a 2004:
TABELA
ANOS 1999 2000 2001 2002 2003 2004
MATRCULA 1050 1150 1200 1400 1560 1700
NMERO-NDICE 100 109,5
c
I b, c .100
b
p0 ------- 100
pt
pt ------- p(0, t) p ( 0, t ) .100
p0
Exemplo: O preo do ventilador em 2002 era de 450,00mt e em 2003 foi para R$ 600,00mt.
Tomando por base o ano de 2002, determinar o preo relativo em 2003.
qt
q(o, t ) .100
qo
Exemplo:
v t p1q1
v( o, t ) .100
vo po q o
Exemplo: Uma empresa vendeu em 1995, 10000 unidades de um artigo ao preo unitrio de
100,00mt. Em 1996 vendeu 20000 unidades do mesmo artigo ao preo unitrio de 120,00mt.
Qual foi o valor relativo da venda em 1996?
pt p 300
p(0, t ) .100 2002 .100 .100 125
p0 p 2001 240
p( 2002,2003)
p( 2003, 2004)
Utilizando como exemplo os dados do item anterior e considerando 2001 como ano
base, otm-se:
pt p 300
p(0, t ) .100 2002 .100 .100 125
p0 p 2001 240
p( 2001, 2003)
p( 2001, 2004)
Exemplo: No exemplo anterior, considerar 2001 como ano base, determinar os relativos em
cadeia, em porcentagem.
Anos 2001 2002 2003 2004
Relativos 100 125 150 225
200
ndice (%)
150
100
50
0
2001 2002 2003 2004
Ano
n i
pt
I p 0 ,t i 1 .100 => ndice agregativo simples de preo
n i
p0
i 1
n i
qt
Iq i 1 .100 => ndice agregativo simples de quantidade
0 ,t n i
q0
i 1
n i i
ptqt
I v 0 ,t i 1 .100 => ndice agregativo simples de valor.
n i i
p 0q 0
i 1
Exemplo: Uma famlia efectuou duas compras num supermercado em duas pocas diferentes. Os
preos e as quantidades dos produtos adquiridos encontram-se na tabela abaixo:
2003 2003 2004 2004
Produtos Preo Quantidade Preo Quantidade
1 - carne ( kg ) 4,60 0,50 5,20 0,60
2 - leite ( l ) 0,80 10 0,90 14
3 - ovos (dz ) 1,20 2 1,40 4
Total 6,60 12,5 7,50 18,60
Construir o ndice agregativo simples de preo, de quantidade e de valor para 2004 com base
em 2003.
p i0 .q i0
w i
0 n
p i0 .q i0
i 1
pt qo
Lp 0, t .100
poq o
2002 2003
p q p q
Bens
A 20 4 28 3
B 40 3 56 3
C 15 8 30 12
q t po
L'0, t .100
q o po
p it .q it
w i
t n
p it .q it
i 1
ptq t
P0, t .100
poq t
2002 2003
p q p q
Bens
A 20 4 28 3
B 40 3 56 3
C 15 8 30 12
qt pt
P'0, t .100
qopt
Tambm conhecido como forma ideal. a mdia geomtrica dos nmeros ndices de Laspeyres e
de Paasche.
I 0, t L 0, t .P0, t
Exemplo: Nos dois exemplos anteriores, tem-se que o ndice de Laspeyres de Preo = 1,625 e
o ndice de Paasche de Preo = 1,700, calcule o ndice de Fisher de Preo.
Exerccio: Voc proprietrio de uma padaria, e deseja comparar vendas e preos de 2008
com as vendas e preos de 2007. Os produtos escolhidos, preos e quantidades vendidas esto
apresentados na tabela abaixo.
2007 2008
Produto Unidade
Preo Qtde. Preo Qtde.
Pretzels kg 5,60 0,700 5,90 0,840
Cuca kg 6,80 1,000 8,10 0,800
Po integral kg 9,10 0,320 9,90 0,450
Croissant kg 15,20 0,300 16,30 0,350
ANEXOS
DISTRIBUIO DE STUDENT
DISTRIBUIO DE 2