Sie sind auf Seite 1von 27

Inferncia Estatstica:

decidindo na presena de incerteza


1. Distribuio de probabilidade da mdia
amostral
2. Intervalo de confiana para a mdia
Ilka Afonso Reis DEST - UFMG
Inferncia Estatstica
Conjunto de mtodos de anlise estatstica que permitem tirar
concluses sobre uma populao com base em somente uma
parte dela, a amostra.
Parmetros
populacionais: ,
POPULAO
AMOSTRA
Estatsticas
amostrais: , s x
Tipos de Inferncia Estatstica
Inferncia sobre
o parmetro
Teste de Hipteses
sobre
Estimao de
Intervalo de
Confiana
Teste de
Hipteses
Estimao
Exemplo: de posse de uma amostra de 1000 eleitores de um
Estado, deseja-se estimar a proporo de eleitores desse Estado
que votaro no candidato Fulano.
O valor de desconhecido e pode ser estimado de duas formas:
somente um valor dado como estimativa para .
Exemplo: proporo amostral de eleitores de
Fulano, p=0.60
Estimao
pontual:
Estimao
intervalar:
um intervalo de valores dado como estimativa
para . Exemplo: p erro de estimao,
0.60 0.03

Datafolha: Candidato A tem cinco pontos de


vantagem sobre Candidato B
Estado de Minas - Atualizao: 23/09/2010 19:19
Nova rodada da pesquisa Datafolha revela que Candidato A tem 42%
da preferncia do eleitorado mineiro, contra 37% de seu principal
concorrente, Candidato B. Em relao ltima pesquisa do instituto, o
Candidato A oscilou dois pontos para cima e o Candidato B manteve
o mesmo percentual.
(...)
O levantamento, encomendado pela Rede Globo e pelo Jornal Folha
de So Paulo, foi feito nos dias 21 e 22 de setembro, com 1.974
eleitores. A margem de erro de dois pontos percentuais, para mais
ou para menos. A pesquisa est registrada no Tribunal Regional
Eleitoral sob o nmero 73576/2010.
Conceitos Bsicos em Estimao
Parmetro
Estimador
(do parmetro)
Estimativa
(do parmetro)
Valor populacional desconhecido, geralmente
representando por letras gregas (, , , , )
Funo das variveis aleatrias que compem a
amostra. Ex:
1
n
i
i
X
X
n
=
=

( )
2
1
1
n
i
i
X X
s
n
=

Valor do estimador quando aplicado aos dados


observados na amostra. Ex: 34.5 x =
Estimao Intervalar
Intervalo de
Confiana
= Estimativa pontual Erro de estimao
Exemplo:
Em uma amostra de 40 alunos da UFMG, encontrou-se uma
renda familiar mdia de 1600 reais (estimativa pontual), com
desvio-padro s=323 reais.
O erro de estimao foi calculado em 100 reais.
Assim, a estimativa intervalar para a renda familiar mdia do
aluno da UFMG de [1600 100] = [1500 ; 1700] reais.
Como calcular o erro de estimao ?
Utilizando a distribuio de probabilidade
do estimador do parmetro
Distribuio de Probabilidade
da Mdia Amostral
Assim, a mdia amostral tambm uma varivel aleatria.
A mdia amostral uma funo das variveis aleatrias que
compem a amostra.
1
n
i
i
X
X
n
=
=

A mdia amostral tambm tem uma distribuio de


probabilidade.
A distribuio amostral da mdia
Distribuio de Probabilidade da Mdia Amostral
Exemplo: suponha uma populao com N=5 elementos
com os seguintes valores
{ 3, 5, 7, 9, 11 }
A mdia desta populao = 7 e o desvio-padro 8 =
Se tirarmos amostras de tamanho n=2 desta populao,
teremos amostras possveis (com reposio)
5
10
2
| |
=
|
\
Distribuio de Probabilidade da Mdia Amostral
So elas:
(3;3) (3;5) (3;7) (3;9) (3;11)
(5;3) (5;5) (5;7) (5;9) (5;11)
(7;3) (7;5) (7;7) (7;9) (7;11)
(9;3) (9;5) (9;7) (9;9) (9;11)
(11;3) (11;5) (11;7) (11;9) (11;11)
{ 3, 5, 7, 9, 11 }
Mdias amostrais:
3 4 5 6 7
4 5 6 7 8
5 6 7 8 9
6 7 8 9 10
7 8 9 10 11
Distribuio de Probabilidade da Mdia Amostral
2/10 10
1/25 3
1/10 11
3/10 9
4/10 8
5/10 7
4/10 6
3/10 5
2/25 4
Probabilidade Mdia Amostral
X
3 4 5 6 7 8 9 10 11
P
r
o
b
a
b
i
l
i
d
a
d
e
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
Distribuio de Probabilidade da Mdia Amostral
X
O valor esperado de
1 2 3 4 5
[ ] 3 4 5 6 7
25 25 25 25 25
4 3 2 1
8 9 10 11 7
25 25 25 25
E X = + + + + +
+ + + =
X
A varincia de
2 2 2
2 2 2
1 2 3
[ ] (3 7) (4 7) (5 7) ...
25 25 25
3 2 1
(9 7) (10 7) (11 7) 4
25 25 25
Var X = + + + +
+ + =
Distribuio de Probabilidade da Mdia Amostral
[ ] 7 E X = =
[ ] 4 8 dp X = < =
Ou seja, a distribuio da mdia amostral
est centrada no valor da mdia populacional e
tem variabilidade menor do que a variabilidade da
populao original.
Distribuio de
probabilidade
dos valores
populacionais
Distribuio de
probabilidade dos
valores da mdia
amostral em
amostras de
tamanho n=50
da populao
esquerda.
Resultados importantes
Resultado 1:
Seja uma amostra aleatria x
1
, x
2
, . . . , x
n
de uma varivel
aleatria Normal X com mdia e desvio padro . Ou seja,
X ~ Normal ( ; ).
A distribuio de probabilidade deX, o estimador de ,
Normal com mdia e desvio padro / n
Ilustrao do
Resultado 1
Populacao
Valor do individuo
0 50 100 150
0
5
0
0
0
0
1
5
0
0
0
0
n = 5
Valor da media amostral
0 50 100 150
0
5
0
1
0
0
1
5
0
2
0
0
n = 10
Valor da media amostral
0 50 100 150
0
5
0
1
5
0
2
5
0
n = 100
Valor da media amostral
0 50 100 150
0
5
0
1
0
0
1
5
0
Resultados importantes
Resultado 2: (TEOREMA CENTRAL DO LIMITE)
Seja uma amostra aleatria x
1
, x
2
, . . . , x
n
de uma varivel
aleatria X com mdia e desvio padro .
medida que n cresce, a distribuio de probabilidade deX, o
estimador de , aproxima-se de uma Normal com mdia e
desvio padro / n
Populacao
Valor do individuo
40 60 80 100 120 140 160
0
2
0
0
0
0
n = 5
Valor da media amostral
40 60 80 100 120 140 160
0
1
0
0
2
0
0
n = 10
Populacao
Valor do individuo
2 4 6 8 10
0
1
5
0
0
0
0
Media = 2.80
n = 5
Valor da media amostral
2 3 4 5 6
0
1
0
0
2
0
0
n = 10
Ilustrao do Teorema Central do Limite
n = 10
Valor da media amostral
40 60 80 100 120 140 160
0
5
0
1
5
0
n = 100
Valor da media amostral
40 60 80 100 120 140 160
0
1
0
0
2
0
0
n = 10
Valor da media amostral
2 3 4 5 6
0
5
0
1
5
0
n = 100
Valor da media amostral
2 3 4 5 6
0
1
0
0
2
0
0
Ilustrao do Teorema Central do Limite (cont.)
Teorema Central do Limite (TCL)
cresce
(0;1)
/
~
n
x
Z N
n

=
Intervalo de 100(1-)%de Confiana para
/ 2
100(1 )%
. IC x z
n

(
=
(

Erro de estimao
estimativa
pontual de
estimativa da
variabilidade
de x
Fator para reduo
da confiana
/ 2
z

/2 o percentil da distribuio Normal-


padro que deixa uma rea de /2 acima dele
/ 2
z

Intervalo de 100(1-)%de Confiana para


/ 2
100(1 )%
. IC x z
n

(
=
(

A Confiana de um Intervalo
1. um valor maior do que 0 e menor do que 100;
2. expressa a confiana de que este intervalo contenha o valor
desconhecido de .
Exemplo
95%
5, 5
45, 6 1, 96.
25
IC

(
=
(

Em um levantamento sobre o perfil dos clientes de seguro de
vida, foram pesquisados 25 clientes atravs de visita domiciliar.
Umas das questes abordadas era a idade do titular. A idade
mdia encontrada na amostra foi 45,6 anos.
Supondo que o desvio-padro idade nesta populao = 5,5
anos, calcule um intervalo de 95% de confiana para a idade
mdia dessa populao.
[ ]
95%
45, 6 2, 2 IC

=
[ ]
95%
43, 4 ; 47, 8 IC

=
A idade mdia dessa populao est entre 43,4 e 47,8
anos, com 95% de confiana.
0,025
100(1 )% 95% 0, 05 / 2 0, 025 1, 96 z = = = =
/ 2
100(1 )%
. IC x z
n

(
=
(

Essa expresso para o IC de pode ser usada quando:
1. a varivel em estudo tiver distribuio Normal
2. a varivel em estudo no tiver distribuio Normal,
mas o tamanho da amostra (n) for grande ( n > 30).
preciso conhecer , o desvio-padro
populacional
Resultado 1
TCL
PROBLEMA:
Essa substituio resulta em uma nova varivel
n s
x
T
/

=
RESULTADO IMPORTANTE
Se x
1
, x
2
, . . . x
n
uma amostra aleatria de Normal com mdia
e desvio-padro , a varivel T tem distribuio t de student com
(n-1) graus de liberdade.
T ~ t
n-1
Substituir por s no erro de estimao
SOLUO (quando no se conhece )
Distribuio t-Student
A distribuio t-Student aproxima-se de uma distribuio Normal-
padro medida que seus graus de liberdade, k, crescem.
Tabela t
Distribuio t-Student
A distribuio t-Student simtrica em torno de 0.
Assim, somente os percentis positivos so tabelados.
Intervalo de 100(1-)%de Confiana para
quando for desconhecido
/ 2;( 1)
100(1 )%
.
n
s
IC x t
n

(
=
(

o percentil da distribuio
t-Student com (n-1) graus de liberdade que
deixa uma rea de /2 acima dele
/ 2;( 1) n
t

/ 2;( 1) n
t

/2
( 1) n
t

O que entendemos por confiana ?
EXEMPLO: estimar , a renda mdia familiar dos alunos que
ingressaram na UFMG este ano
Experimento:
1. cada um de vocs tem acesso a uma amostra de 100 calouros
para estimarmos .
2. Todos vocs construiro um intervalo de 95% de confiana
utilizando os dados da nossa amostra.
Resultado esperado:
Intervalos de confiana com limites e comprimentos diferentes
para cada um de vocs.
Como saber qual o intervalo correto ?
Interpretao Grfica do Nvel de
Confiana na Estimao Intervalar
O que entendemos por confiana ?
Para um intervalo de 95% de confiana para , temos a
uma confiana de 95% de que este intervalo em
especial contenha o valor desconhecido de .
RESUMO: Intervalo de Confiana para
a mdia populacional
A amostra
grande
(n > 30) ?
SIM
NO
SIM
NO
/ 2
100(1 )%
. IC x z
n

(
=
(

/ 2
100(1 )%
.
s
IC x z
n


(
=
(


conhecido ?
Os dados
so
Normais ?
SIM
NO
/ 2;( 1)
100(1 )%
.
n
s
IC x t
n

(
=
(

Mtodos no-
paramtricos
Exemplo 2: estimar o gasto mdio com seguro-
sade, em reais, de um grupo de segurados
1
0
0
1
5
0
2
0
0
2
5
0
n = 20 indivduos
Nvel de confiana : 95%
100(1-) = 0.95 = 0.05
162.66 x =
33.77 s =
19;0.025
2.093 t =
( 1); / 2
100(1 )%
.
n
s
IC x t
n

(
=
(

Tabela t
Exemplo 1: continuao
95%
33.77
162.66 2.093
20
IC

(
=
(

[ ]
95%
162.66 15.80 IC

=
[ ]
95%
146.86 ; 178.46 IC

=
O gasto mdio com seguro-sade do grupo de
segurados est 146.86 e 178.46 reais, com 95%
de confiana.
QUESTO: como diminuir o comprimento
do Intervalo de Confiana ?
/ 2
100(1 )%
. IC x z
n

(
=
(

Intervalo de Confiana para a
Proporo
A proporo amostral de sucessos pode ser vista com
uma mdia de variveis binrias
1, se sucesso
0, c. c.
i
X

=

1
0 1 1 0 ... 1 # de sucessos

n
i
i
X
p
n n n
=
+ + + + +
= = =

( )
cresce

~ ; (1 ) /
n
p N p p p n
Assim, pelo TCL,
Intervalo de Confiana para a
Proporo
(

n
p p
z p IC
p
)

/
)% (
1
2
1 100

Vlido somente quando n > 30 (amostras grandes)


Proporo
amostral
Estimativa do desvio-padro
da proporo amostral
Exemplo: estimao da proporo de segurados
que possuem residncia em seu nome
Em outro levantamento sobre o perfil dos clientes de
seguro de vida, foram pesquisados 50 clientes atravs de
visita domiciliar. Uma das questes abordadas era se o
titular possua residncia em seu nome. Deseja estimar
P = proporo de clientes de seguro de vida que tem
residncia em seu nome
Dos 50 entrevistados, 45 tinham residncia em seu
nome.
Estimativa Pontual: a proporo amostral

45/ 50 0.90 p = =
Estimativa Intervalar
100(1 )%
/ 2

(1 )

.
p
p p
IC p z
n

=
(

(
[ ]
/ 2
/ 2
0.9(0.1)
0.9
50
.
0.9 0.04
z
z


(
=
(

=
Exemplo: estimao da proporo de segurados
que possuem residncia em seu nome
Exemplo: estimao da proporo de pessoas
curam com um novo tratamento
Intervalo de 90% de confiana: 100(1-)%=90%
1- = 0.90 = 0.10 /2 = 0.05 z
/2
=
z0.05
=1.64
[ ] [ ] [ ]
[ ]
90%
90%
0.9 1.64 0.04 0.9 0.07 0.9 0.07; 0.9 0.07
0.83 ; 0.97
p
p
IC
IC
= = = +
=
Assim, com base nesta amostra, estimamos que a
proporo de clientes de seguro de vida que possem
residncia em seu nome entre 83% e 97%, com 90%
de confiana.
Intervalo de Confiana para a Varincia
(ou desvio-padro)
Se quisermos construir um intervalo de confiana para a
varincia de uma populao (
2
), precisaremos saber
qual o comportamento de seu estimador, varincia
amostral s
2
.
Um resultado conhecido de probabilidade diz que, se a
amostra vem de uma populao com distribuio Normal,
ento
2
2
( 1) n s

tem distribuio Qui-quadrado com (n-1)


graus de liberdade
A distribuio de probabilidade Qui-quadrado
(
2
)
Caracteriza-se por
ser assimtrica;
Depende do
parmetro
chamado grau de
liberdade.
Intervalo de Confiana para a Varincia (ou desvio-padro)
2
2
( 1)
2
( 1)
n
n s

( ) ( ) ( ) ( )
2
2 2
1 ; 1 / 2 1 ; / 2 2
( 1)
1
n n
n s
P

< < =
(

/2
/2
2
( 1) n


Intervalo de Confiana para a Varincia (ou desvio-padro)
( ) ( ) ( ) ( )
2
2 2 2
1 ; 1 / 2 1 ; / 2
1 1
1
( 1)
n n
P
n s



(
(
> > =
(


( ) ( ) ( ) ( )
2
2 2 2
1 ; / 2 1 ; 1 / 2
1 1
1
( 1)
n n
P
n s



(
(
< < =
(


( ) ( ) ( ) ( )
2 2
2
2 2
1 ; / 2 1 ; 1 / 2
( 1) ( 1)
n n
n s n s




< <
Intervalo de Confiana para a
Varincia (ou desvio-padro)
2
2 2
100(1 )%
2 2
( 1); / 2 ( 1);1 / 2
( 1) ( 1)
;
n n
n s n s
IC


(

=
(
(

Exemplo: consistncia da pontuao de um
jogador
Um jogador de boliche ganhou 20 jogos em um torneio e
fez mdia de 227,4 pontos, com desvio-padro de 16,6
pontos.
Construa um IC de 95% de confiana para , que fornece
uma medida da consistncia do jogador.
Intervalo de 95% de confiana: 100(1-)%=95%
1- = 0.95 = 0.05 /2 = 0.025
2
19;0.025
32,852 =
2
19;0.975
8, 907 =
2
2 2
100(1 )%
(20 1)16, 6 (20 1)16, 6
;
32, 852 8, 907
IC

(

=
(

Exemplo: consistncia da pontuao de um
jogador
[ ]
2
2 2
100(1 )%
(20 1)16, 6 (20 1)16, 6
;
32, 852 8, 907
= 159,37 ; 587,82
IC

(

=
(

2
100(1 )% 2 2
(12,62) ; (24,24) IC

(
=

O desvio-padro do desempenho do jogador est entre
12,62 pontos e 24,24 pontos, com 95% de confiana.
Prxima aula
Estimadores de Mxima Verossimilhana
Propriedades dos Estimadores
Introduo aos Testes de Hipteses