Sie sind auf Seite 1von 193

Tcnicas de Amostragem (parte 2)

(2
a
verso)
Zlia Magalhes Bianchini
Agosto/2003
2
Contedo
1 Estimadores Especiais 1
1.1 Informaes auxiliares em amostragem . . . . . . . . . . . . . 1
1.2 Estimao de uma razo . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Propriedades do estimador de uma razo . . . . . . . . 3
1.2.2 Varincia do estimador de uma razo . . . . . . . . . . 9
1.2.3 Estimao da varincia do estimador de uma razo . . 14
1.2.4 Preciso do estimador de uma razo . . . . . . . . . . . 14
1.3 Estimadores de razo para o total e a mdia . . . . . . . . . . 16
1.3.1 Varincias dos estimadores de razo para o total e a
mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2 Estimao das varincias dos estimadores de razo para
o total e a mdia . . . . . . . . . . . . . . . . . . . . . 19
1.3.3 Comparao da preciso do estimador de razo com a
do estimador simples em amostragem aleatria simples 19
1.4 Estimadores de razo em amostragem estraticada . . . . . . 20
1.4.1 Estimador de razo combinada . . . . . . . . . . . . . 20
1.4.2 Estimador de razo separada . . . . . . . . . . . . . . . 26
1.4.3 Comparao dos estimadores de razo separada e com-
binada . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.4.4 O uso de estimadores de razo . . . . . . . . . . . . . . 32
1.5 Estimadores de Regresso . . . . . . . . . . . . . . . . . . . . 33
1.5.1 Comparao dos estimadores de regresso, razo e sim-
ples da mdia sob amostragem aleatria simples . . . . 36
1.5.2 O uso de estimadores de regresso . . . . . . . . . . . . 37
1.6 Ps-estraticao . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6.1 Estimao do total e da mdia . . . . . . . . . . . . . . 39
1.6.2 Preciso dos estimadores com ps-estraticao . . . . 40
1.7 O uso de informaes auxiliares na estimao . . . . . . . . . . 43
1.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3
4 CONTEDO
2 Amostragem de Conglomerados 53
2.1 Conceituao Bsica . . . . . . . . . . . . . . . . . . . . . . . 53
2.2 Amostragem de reas . . . . . . . . . . . . . . . . . . . . . . 55
2.3 Conglomerados em 1 estgio . . . . . . . . . . . . . . . . . . 56
2.3.1 Probabilidades iguais de seleo . . . . . . . . . . . . . 56
2.3.2 Estimao de propores na Ac1 . . . . . . . . . . . . 65
2.3.3 Coeciente de Correlao Intraclasse . . . . . . . . . . 69
2.3.4 Estimao do coeciente de correlao intraclasse . . . 75
2.3.5 Ecincia da Ac1 em relao AAS com conglomera-
dos de tamanhos iguais . . . . . . . . . . . . . . . . . . 77
2.4 Controle na variao de tamanho . . . . . . . . . . . . . . . . 82
2.5 Probabilidades desiguais de seleo . . . . . . . . . . . . . . . 83
2.5.1 Seleo dos conglomerados comprobabilidades desiguais
e com reposio . . . . . . . . . . . . . . . . . . . . . . 83
2.6 Estraticao de conglomerados . . . . . . . . . . . . . . . . . 93
2.6.1 Estimadores e respectivas precises . . . . . . . . . . . 94
2.7 Estimador de razo . . . . . . . . . . . . . . . . . . . . . . . . 97
2.7.1 Estimador de razo baseado no tamanho dos conglom-
erados . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.7.2 Estimador de razo baseado em uma caracterstica que
no seja o tamanho do conglomerado . . . . . . . . . . 101
2.8 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3 Conglomerados em 2 estgios 109
3.1 Probabilidades iguais de seleo . . . . . . . . . . . . . . . . . 109
3.1.1 Introduo e denies bsicas . . . . . . . . . . . . . . 109
3.1.2 Parmetros da caracterstica y . . . . . . . . . . . . . . 112
3.1.3 Estatsticas da amostra em cada estgio . . . . . . . . 113
3.1.4 Estimadores de total e mdias e respectivas varincias . 114
3.1.5 Estimadores das varincias dos estimadores de total e
mdias . . . . . . . . . . . . . . . . . . . . . . . . . . 119
3.1.6 Amostra autoponderada . . . . . . . . . . . . . . . . . 123
3.1.7 Dimensionamento da amostra de conglomerados em 2
estgios . . . . . . . . . . . . . . . . . . . . . . . . . . 127
3.1.8 Efeito de conglomerao . . . . . . . . . . . . . . . . . 135
3.2 Controle de variao de tamanho das UPAs . . . . . . . . . . 137
3.2.1 Probabilidades desiguais de seleo das unidades primrias138
3.2.2 Estraticao das unidades primrias e seleo com
probabilidades desiguais de seleo . . . . . . . . . . . 147
3.2.3 Estimador de razo . . . . . . . . . . . . . . . . . . . . 149
3.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
CONTEDO i
4 Conglomerados em 3 estgios 161
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
4.2 Seleo com probabilidades desiguais . . . . . . . . . . . . . . 161
4.2.1 Estimador no viciado de Y . . . . . . . . . . . . . . . 162
4.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
5 Estimao de varincias 165
5.1 Porque importante estimar varincias? . . . . . . . . . . . . 165
5.2 Problemas para estimar varincias . . . . . . . . . . . . . . . 165
5.3 Mtodos para estimar varincias . . . . . . . . . . . . . . . . . 166
5.3.1 Mtodo de Linearizao de Taylor ou -mtodo . . . . 166
5.3.2 Mtodo do Conglomerado Primrio (Ultimate Cluster
- Hansen et al, 1953) . . . . . . . . . . . . . . . . . . . 168
5.3.3 Mtodos de Replicao . . . . . . . . . . . . . . . . . . 170
5.4 Sistemas para estimao de varincias . . . . . . . . . . . . . . 172
6 Dupla amostragem 175
6.1 Descrio da tcnica . . . . . . . . . . . . . . . . . . . . . . . 175
6.2 Consideraes sobre o custo . . . . . . . . . . . . . . . . . . . 176
6.3 Dupla amostragem para estraticao . . . . . . . . . . . . . . 177
6.3.1 Estimador no viciado para V

y
d,est

. . . . . . . . . . 180
6.3.2 Estimao de uma proporo na dupla amostragem
para estraticao . . . . . . . . . . . . . . . . . . . . 180
6.4 Dupla amostragem para estimadores de razo . . . . . . . . . 181
6.5 Dupla amostragem para probabilidades desiguais . . . . . . . 183
Prefcio
Estas notas de aula vm sendo ministradas na disciplina de Tecnologia da
Amostragem II do Curso de Graduao em Estatstica da Escola Nacional
de Cincias Estatsticas - ENCE. Trata-se da apresentao da teoria e apli-
cao de estimadores especiais e das tcnicas de seleo e de estimao em
amostras de conglomerados em um ou mais estgios e de dupla amostragem.
As notas de aula preparadas por Pedro Luis do Nascimento Silva quando
de sua atuao como professor no referido curso, bem como as referncias
bibilogrcas bsicas, serviram como base para a elaborao deste material.
ii CONTEDO
Cabe esclarecer que inteno incorporar num mesmo volume o contedo
da disciplina de Tecnologia de Amostragem I, que corresponde aos funda-
mentos e tcnicas bsicas para selecionar amostras e realizar estimao em
pesquisas por amostragem: conceitos bsicos de amostragem, amostragem
aleatria simples come semreposio, distribuies amostrais e erro amostral,
estimao de propores e domnios, clculo de tamanhos de amostra, amostra-
gem sistemtica, amostragem estraticada e amostragem com probabilidades
desiguais.
A realizao deste trabalho deve-se em grande parte ao incentivo de Pedro
Luis do Nascimento Silva para a preparao de um livro de amostragem em
portugus com o objetivo de facilitar o aprendizado dos alunos de graduao
em Estatstica na aplicao de tcnicas para selecionar amostras e realizar
estimao em pesquisas por amostragem.
Uma primeira verso dessas notas vinha sendo utilizada no curso de Gra-
duao da ENCE no 6
o
perodo, desde o 2
o
semestre de 1999. Agradeo aos
alunos pelas indicaes de correes efetuadas, em especial a Adrian Heringer
Pizzinga, Ralph dos Santos Silva e Rodrigo Lage de Sousa, do 6
o
perodo do
2
o
semestre de 1999.
Agradeo a Waldecir Bianchini pela colaborao no aprendizado para a
utilizao do processador de texto Scientic Workplace e pela sua compreen-
so e de nossos lhos (Renata, Fernanda e Henrique) das inmeras horas
extraordinrias de trabalho desviadas do convvio familiar para a realizao
desta empreitada para a primeira verso.
Esta verso ainda passar por outras revises e quaisquer sugestes sobre
eventuais falhas e omisses e sobre a incorporao de novos temas so bem
vindas em busca do aprimoramento do texto, do uso adequado da teoria e
aplicaes em amostragem e da prepararao do prossional de Estatstica
para os desaos que a carreira certamente lhe proporcionar.
Zlia Magalhes Bianchini
Rio de Janeiro, agosto de 2003.
Captulo 1
Estimadores Especiais
1.1 Informaes auxiliares em amostragem
Alm da varivel de interesse y
i
, uma ou mais variveis x
i
podem estar
associadas com a i-sima unidade da populao. Por exemplo, se a varivel
de interesse o nmero de cabeas de gado em uma determinada fazenda,
variveis auxiliares pode incluir a rea da fazenda, o tipo de vegetao, etc.
Em algumas situaes, os valores para a caracterstica x so conhecidos
para toda a populao, enquanto que em outras situaes os valores de x so
conhecidos s para as unidades da amostra. Em muitas pesquisas, o valor
da varivel de interesse de um censo anterior pode servir como uma varivel
auxiliar.
Informaes auxiliares podem ser usadas no desenho amostral ou na es-
timao. Variveis usadas na estraticao, ou como medidas de tamanho
para a seleo com probabilidades proporcional ao tamanho, representam o
uso de informaes auxiliares no desenho amostral.
Na estimao de total ou de mdia de uma caracterstica y, a relao entre
y
i
e x
i
pode muitas vezes ser aproveitada para produzir estimativas mais
precisas do que estimativas que utilizam apenas as informaes dos dados da
caracterstica y. Estimadores de razo, de regresso e de ps-estraticao
so exemplos do uso de informaes auxiliares na estimao.
1.2 Estimao de uma razo
Freqentemente na prtica de pesquisas por amostragem, o valor a ser esti-
mado com a amostra uma razo entre duas variveis que varia de unidade
para unidade da populao.
Um exemplo, que pode ser citado, a necessidade de se estimar a razo
1
2 CAPTULO 1. ESTIMADORES ESPECIAIS
entre os gastos das famlias com alimentao e a renda das famlias. Outro
exemplo seria a razo entre a quantidade colhida de certo produto pela rea
plantada, medindo a produtividade da lavoura. Ainda outro exemplo se-
ria a razo entre o salrio dos trabalhadores da indstria e o nmero de
trabalhadores da indstria, medindo o salrio mdio dos trabalhadores da
indstria.
Em todos estes exemplos, o que se procura conhecer o valor de uma
razo R onde R =
Y
X
.
Considere-se a populao P
N
= {U
1
, U
2
, , U
N
}, onde sero investigadas
duas caractersticas, x e y, gerando uma populao-matriz bivariada
P
N
(x, y) = {(X
1
, Y
1
), (X
2
, Y
2
), , (X
N
, Y
N
)} ,
onde:
_
_
_
X
I
= x(U
I
)
Y
I
= y(U
I
)
I {1, 2, , N}
Pode-se ento denir o parmetro razo na populao, R, de forma
que:
R =
Y
X
=
N
P
I=1
Y
I
N
P
I=1
X
I
=
Y
X
Ponha-se ento, o problema de estimar a razo R a partir de uma amostra
aleatria simples sem reposio de n unidades de P
N
,{u
1
, u
2
, , u
n
}, onde
sero investigadas as caractersticas x e y, fornecendo
{(x
1
, y
1
), (x
2
, y
2
), , (x
n
, y
n
)} .
Note-se que:
P [(x
i
, y
i
) = (X
I
, Y
I
)] =
1
N
i {1, 2, , n} e I {1, 2, , N} .
Conclui-se que os vetores (x
i
, y
i
), i {1, 2, , n}, so identicamente
distribudos e que no so independentes, devido se tratar de amostragem
sem reposio.
Como R = Y / X = Y / X , um estimador intuitivamente razovel para
R dado por:
b
R =
y
x
onde y =
1
n
n
X
i=1
y
i
e x =
1
n
n
X
i=1
x
i
.
1.2. ESTIMAO DE UMA RAZO 3
1.2.1 Propriedades do estimador de uma razo
Como vericar se
b
R um estimador razovel? Em primeiro lugar, nota-
se que
b
R deve ser um estimador viciado de R, porm se pode mostrar que
b
R assintoticamente no viciado; pode-se mostrar tambm que
b
R um
estimador consistente de R.
Para provar que
b
R um estimador consistente de R, necessrio intro-
duzir a denio de consistncia.
Diz-se que um estimador
b

n
baseado numa amostra sem reposio de
tamanho n da populao consistente para o parmetro se e somente se
b

N
= , isto , se P
h
b

N
=
i
= 1.
Assim, a prova de que
b
R consistente para R imediata devido x se
igualar a X e y a Y quando a amostra cobrir todas as unidades da populao.
Alm disto,
y =
1
n
n
X
i=1
y
i
=
1
n
n
X
i=1

Y +
i

= Y +
1
n
n
X
i=1

i
= Y +
onde:
=
1
n
n
X
i=1

i
De modo anlogo se tem que:
x = X + onde =
1
n
n
X
i=1

i
.
Sabe-se ainda que:
N n
N
S
2
y
n
= V ( y ) = V (Y + ) = V ( ) = E(
2
)

E()

2
= E(
2
)
pois, E() = 0.
Analogamente,
E(
2
) = V () =
N n
N
S
2
x
n
Note-se que:
S
2
x
=
1
N 1
N
X
I=1

X
I
X

2
e S
2
y
=
1
N 1
N
X
I=1

Y
I
Y

2
.
4 CAPTULO 1. ESTIMADORES ESPECIAIS
Desta forma, se pode escrever:
b
R =
y
x
=
Y +
X +
=
Y

1 +

Y

X

1 +

X

= R

1 +

Y

1 +

X

1
Suponha-se que Y 6= 0 e X 6= 0. Suponha-se, ainda que

< 1, isto ,
que a amostra foi dimensionada de forma que se pode esperar que

< X
ou

x X

< X.
Ento, desenvolvendo-se o fator

1 +

X

1
como srie de potncias de
, vem:
b
R = R

1 +

Y

1 +

X

1
= R

1 +

Y

1

X
+

2
X
2


3
X
3
+
!
b
R = R
(
1

X
+

2
X
2


3
X
3
+
!
+

Y


Y X
+

2
Y X
2

!)
Desprezando-se na expresso entre parnteses todos os termos com grau
superior a 2, obtm-se uma aproximao para o valor de
b
R.
b
R

= R

1

X
+

2
X
2
+

Y


Y X
!
Agora calculando-se o valor esperado de
b
R vem:
E(
b
R)

= E

1

X
+

Y
+

2
X
2


Y X
!!
= R

1

X
+

Y
+

2
X
2


Y X
!!
= R

1 E

+E

+E

2
X
2
!
E


Y X

!
= R

1 +
1
X
2
E

1
Y X
E

No entanto:
E

= V () =
N n
N
S
2
x
n
1.2. ESTIMAO DE UMA RAZO 5
Por outro lado:
E

= E

y Y

x X

= COV ( x, y) =
N n
N
S
xy
n
onde:
S
xy
=
1
N 1
N
X
I=1

X
I
X

Y
I
Y

De qualquer forma, a tendenciosidade do estimador


b
R dada aproximada-
mente por:
T (
b
R) = E(
b
R) R

= R

1 +
1
X
2
E

1
Y X
E

R
= R

1
X
2
V

1
Y X
COV ( x, y)

ou ainda:
T (
b
R)

= R

1
X
2
N n
N
S
2
x
n

1
Y X
N n
N
S
xy
n

= R
N n
N
1
n

S
2
x
X
2

S
xy
Y X

Agora note-se que a correlao entre x e y na populao, (x, y),


denida por:
(x, y) =
E

x
i
X

y
i
Y

p
V (x
i
) V (y
i
)
=
6 CAPTULO 1. ESTIMADORES ESPECIAIS
(x, y) =
1
N
N
P
I=1

X
I
X

Y
I
Y

1
N
N
P
I=1

X
I
X

2 1
N
N
P
I=1

Y
I
Y

=
N
P
I=1

X
I
X

Y
I
Y

N
P
I=1

X
I
X

N
P
I=1

Y
I
Y

=
1
N 1
N
P
I=1

X
I
X

Y
I
Y

1
N 1
N
P
I=1

X
I
X

1
N 1
N
P
I=1

Y
I
Y

(x, y) =
S
xy
p
S
2
x
S
2
y
=
S
xy
S
x
S
y
Denotando-se ento (x, y) simplesmente por , vem:
S
xy
= S
x
S
y
Ento:
T (
b
R)

= R
N n
N
1
n

S
2
x
X
2

1
Y X
S
x
S
y

= R
N n
N
1
n

C
2
x
C
x
C
y

onde C
2
x
a varincia relativa de caracterstica x na populao.
Agora, imediato provar que lim
nN
T (
b
R) = 0
No entanto, uma anlise de expresso de T (
b
R) nos mostra que T (
b
R) se
anula exatamente quando:
C
2
x
C
x
C
y
= 0
Isto , quando:
S
2
x
X
2
=
S
x
X
S
y
Y
1.2. ESTIMAO DE UMA RAZO 7
Ou melhor, quando:
Y =

S
x
S
y
X
S
2
x
X
2
=
S
y
S
x
X
Assim, a condio para que
b
R seja um estimador no viciado de R que
Y = ( S
y
/S
x
) X, que a condio para a reta de regresso entre y e x
passar pela origem, com coeciente angular ( S
y
/S
x
) .
Foi vericado que, quando a condio anterior no satisfeita,
b
R um
estimador tendencioso, embora com tendncia que tende a se anular quando
o tamanho n da amostra for grande.
Com o objetivo de calcular uma medida da preciso do estimador
b
R, ser
estabelecida uma cota superior a tendenciosidade de
b
R que permitir tambm
a determinao do tamanho de amostra necessrio para tomar desprezvel a
tendenciosidade.
Inicialmente, quando se trata de um estimador viciado, a medida de sua
preciso deve ser o seu erro quadrtico mdio, dado por:
EQM(
b
R) = E(
b
R R)
2
= E

b
R E(
b
R) +E(
b
R) R

= E

b
R E(
b
R)

b
RR

2
2

E(
b
R) R

b
R E(
b
R)

= V (
b
R) +
h
T (
b
R)
i
2
.
Note-se que se a tendenciosidade se anula, isto , se o estimador for no
viciado, ento o erro quadrtico mdio igual varincia do estimador.
Note-se, ainda, que a expresso de EQM pode ser escrita como:
EQM(
b
R) = V (
b
R) +
h
T (
b
R)
i
2
= V (
b
R)
_

_
1 +
h
T (
b
R)
i
2
V (
b
R)
_

_
Analisando-se a expresso acima, note-se que:
V (
b
R)

= EQM(
b
R)
quando:
h
T (
b
R)
i
2
V (
b
R)

= 0
8 CAPTULO 1. ESTIMADORES ESPECIAIS
Um critrio prtico para avaliar quo prximos esto V (
b
R) e EQM(
b
R)
consiste em vericar se:
h
T (
b
R)
i
2
V (
b
R)
0, 01
Ora. isto eqivale a vericar se:

T (
b
R)

q
V (
b
R)
0, 10 ou

E(
b
R) R

q
V (
b
R)
0, 10
Por outro lado, note-se que:
COV (
b
R, x) = E(
b
Rx) E(
b
R) E(x)
= E( y) E(
b
R) X
= Y E(
b
R) X
Donde:
COV (
b
R, x)
X
=
Y
X
E(
b
R)
ou seja:
E(
b
R) =
Y
X

COV (
b
R, x)
X
= R
COV (
b
R, x)
X
ou ainda:
T(
b
R) = E(
b
R) R =
COV (
b
R, x)
X
Seja (
b
R, x) =

o coeciente de correlao entre


b
R e x. Logo:
COV (
b
R, x) =

q
V (
b
R)
p
V (x)
Substituindo na expresso anterior, segue-se que:
T(
b
R) =

q
V (
b
R)
p
V (x)
X
T(
b
R)
q
V (
b
R)
=

p
V (x)
X
ou ainda:

T(
b
R)
q
V (
b
R)

= |

| CV (x)
1.2. ESTIMAO DE UMA RAZO 9
Lembrando a condio de |

| 1 segue-se que:

T(
b
R)
q
V (
b
R)

CV (x).
Considere a expresso do tamanho de uma amostra aleatria simples
dada por:
n =
N z
2
/2
S
2
x
X
2
N d
2
r
+ z
2
/2
S
2
x
X
2
=
N z
2
/2
C
2
x
N z
2
/2
(CV (x))
2
+ z
2
/2
C
2
x
=
C
2
x
(CV (x))
2
+
C
2
x
N
j que a preciso relativa da mdia amostral pode ser escrita como:
d
r
= z
/2
CV (x) e C
2
x
= S
2
x
/X
2
a varincia relativa da caracterstica x
na populao (ou coeciente de variao da populao ao quadrado da car-
acterstica x).
Assim, para se ter tendenciosidade desprezvel no estimador de razo
b
R,
deve-se ter:
CV (x) 0, 10
Sendo assim, basta tomar n tal que:
n
C
2
x
0, 01 +
C
2
x
N
Por exemplo, se C
x
= 0, 4 e N = 5.000, ento n 16 bastaria para tornar
desprezvel a tendenciosidade do estimador de razo
b
R.
1.2.2 Varincia do estimador de uma razo
Agora o objetivo obter uma expresso para a varincia do estimador de
razo
b
R, que seja adequada para medir sua preciso. De fato, isto s tem
sentido quando se puder admitir que T(
b
R) /
q
V (
b
R) < 0, 10, isto , quando
o vcio de
b
R for pequeno.
Ora, j foi visto na demonstrao anterior que:
b
R

= R +R

Y


X

+R

2
X
2


Y X
!
10 CAPTULO 1. ESTIMADORES ESPECIAIS
e que:
E(
b
R)

= R +R E

2
X
2


Y X
!
logo,
b
RE(
b
R)

= R

Y


X

+R

2
X
2


Y X
!
R E

2
X
2


Y X
!
Da, a varincia de
b
R dada por:
V (
b
R) = E

b
RE(
b
R)

= E
"
R

Y


X

+R

2
X
2


Y X
!
R E

2
X
2


Y X
!#
2
Nesta ltima expresso, desprezar todos os termos com grau superior a
2. Ento:
V (
b
R)

= R
2
E

Y


X

2
!
= R
2

2
Y
2
!
+E

2
X
2
!
2E


Y X

!
= R
2

1
Y
2
V (y) +
1
X
2
V (x)
2
Y X
Cov(x, y)

= R
2
N n
N
1
n

S
2
y
Y
2
+
S
2
x
X
2
2
S
xy
Y X

=
N n
N
1
n

R
2
S
2
y
Y
2
+R
2
S
2
x
X
2
2 R
2
S
xy
Y X

=
N n
N
1
nX
2

S
2
y
+R
2
S
2
x
2 RS
xy

ou ainda:
V (
b
R)

=
N n
N
1
nX
2

S
2
y
+R
2
S
2
x
2 R S
x
S
y

H outra maneira de escrever a expresso da varincia de


b
R, certas vezes
mais conveniente para ns de clculo que as expresses j apresentadas:
V (
b
R)

=
N n
N
1
nX
2
1
N 1
N
X
I=1
(Y
I
RX
I
)
2
1.2. ESTIMAO DE UMA RAZO 11
Exemplo 1.1
Ovcio e erro quadrtico mdio do estimador de uma razo, sob amostragem
aleatria simples, pode ser ilustrado imaginando a aplicao de amostragem
em uma populao muito pequena e examinando o espao amostral, isto ,
o conjunto de todas as possveis amostras. Suponha que os valores de duas
variveis x e y nas 4 unidades da populao so:
U
i
Y
i
X
i
U
1
1 1
U
2
2 3
U
3
3 4
U
4
4 6
(a) Calcule o valor da razo populacional
Y
X
, obtenha todas as possveis
amostras de tamanho 2, a serem selecionadas aleatoriamente e sem
reposio e estime essa razo para cada possvel amostra.
(b) Calcule os valores exatos do vcio, do erro quadrtico mdio e da var-
incia desse estimador.
(c) Calcule os valores aproximados do vcio e da varincia desse estimador.
(d) Compare os resultados obtidos em (b) com os resultados obtidos em
(c).
Soluo:
a) A razo populacional dada por:
R =
Y
X
=
N
P
i=1
Y
i
N
P
i=1
X
i
=
10
14
=
5
7
O nmero de possveis amostras dado por:

N
n

=

4
2

=
4!
2!(4 2)!
= 6
12 CAPTULO 1. ESTIMADORES ESPECIAIS
Amostras possveis Probabilidades y =
n
P
i=1
y
i
x =
n
P
i=1
x
i
b
R =
y
x
U
1
U
2
1
6
3 4
3
4
U
1
U
3
1
6
4 5
4
5
U
1
U
4
1
6
5 7
5
7
U
2
U
3
1
6
5 7
5
7
U
2
U
4
1
6
6 9
6
9
U
3
U
4
1
6
7 10
7
10
b) Os valores exatos do vcio e do erro quadrtico mdio deste estimador
podem ser obtidos a partir da distribuio de todas as possveis amostras:
E(
b
R) =
1
6

3
4
+
4
5
+
5
7
+
5
7
+
6
9
+
7
10

=
365
504
o valor exato do vcio de
b
R dado por:
T(
b
R) = E(
b
R) R =
365
504

5
7
=
5
504
= 0, 0099
O erro quadrtico mdio dado por:
E(
b
R R)
2
=
1
6

(
3
4

5
7
)
2
+ (
4
5

5
7
)
2
+ (
6
9

5
7
)
2
+ (
7
10

5
7
)
2

= 0, 00185
e a varincia dada por:
V (
b
R) = E(
b
RR)
2

h
T (
b
R)
i
2
= 0, 00185 0, 0000009 = 0, 0018491
c) O vcio aproximado dado por:
T(
b
R)

= R
N n
N
1
n

S
2
x
X
2

S
xy
Y X

=
1 f
nX
2

RS
2
x
S
xy

1.2. ESTIMAO DE UMA RAZO 13


sendo: f =
1
2
n = 2 X =
7
2
S
2
x
=
N
P
I=1
X
2
i
N X
2
N 1
=
62 49
3
=
13
3
S
xy
=
N
P
I=1
X
i
Y
i
N X Y
N 1
=
43 35
3
=
8
3
T(
b
R)

=
1 f
nX
2

RS
2
x
S
xy

=
1
2
2

7
2

5
7

13
3

8
3

=
3
343
= 0, 0087
com respeito varincia aproximada tem-se:
V (
b
R)

=
N n
N
1
nX
2

S
2
y
+R
2
S
2
x
2 R S
xy

=
1 f
nX
2

S
2
y
+R
2
S
2
x
2 R S
xy

sendo:
S
2
y
=
N
P
I=1
Y
2
i
N Y
2
N 1
=
30 25
3
=
5
3
portanto:
V (
b
R)

=
1 f
nX
2

S
2
y
+R
2
S
2
x
2 R S
xy

=
1
2
2

7
2

5
3
+

5
7

13
3

5
7

8
3

!
= 0, 00139
d) Observe que o vcio aproximado subestima ligeiramente o valor ver-
dadeiro do vcio e a varincia aproximada subestima ligeiramente o valor
verdadeiro da varincia.
14 CAPTULO 1. ESTIMADORES ESPECIAIS
1.2.3 Estimao da varincia do estimador de uma razo
Um estimador consistente para V (
b
R), quando X for conhecido, dado por:
v
1
(
b
R) =
N n
N
1
nX
2

s
2
y
+
b
R
2
s
2
x
2
b
R s
xy

onde:
s
2
y
=
1
n 1
n
X
i=1
(y
i
y)
2
s
2
x
=
1
n 1
n
X
i=1
(x
i
x)
2
s
xy
=
1
n 1
n
X
i=1
(x
i
x)(y
i
y)
que so estimadores no viciados de S
2
y
, S
2
x
e S
xy
, respectivamente.
Um estimador para V (
b
R), quando X for conhecido, expresso de outra
forma dado por:
v
1
(
b
R) =
N n
N
1
nX
2
1
n 1
n
X
i=1
(y
i

b
Rx
i
)
2
Quando X no for conhecido, um estimador alternativo para V (
b
R)
dado por:
v
2
(
b
R) =
N n
N
1
nx
2

s
2
y
+
b
R
2
s
2
x
2
b
R s
xy

ou
v
2
(
b
R) =
N n
N
1
nx
2
1
n 1
n
X
i=1
(y
i

b
Rx
i
)
2
.
1.2.4 Preciso do estimador de uma razo
A preciso do estimador de uma razo depende da distribuio de probabil-
idades do estimador
b
R, que se vericou ser bastante intratvel e intrincada,
devido ao fato de tanto os x
i
como os y
i
variarem de amostra para amostra.
Os resultados tericos conhecidos se distanciam muito do que seria desejvel
e necessrio possuir nas aplicaes prticas.
Assim, os principais resultados sero aqui apresentados semdemonstrao.
1.2. ESTIMAO DE UMA RAZO 15
Inicialmente, j foi demonstrado que o estimador de razo consistente.
Alm disso, se viu tambm que ele viciado, exceto para certos tipos especiais
de populao, embora o vcio seja desprezvel para amostras grandes.
Outro aspecto que a distribuio assinttica do estimador de razo
normal para amostras bastantes grandes, sujeito apenas a restries muito
fracas quanto ao tipo de populao de que se esteja selecionando a amostra.
Em amostras de tamanhos moderados, a distribuio de
b
R mostra certa
tendncia a uma assimetria positiva para os tipos de populao para as quais
o mtodo comumente usado.
Estes resultados indicam que no h problemas para calcular a preciso
ou a preciso relativa do estimador de razo quando:
a) a distribuio de
b
R for aproximadamente normal;
b) a frmula para estimao da varincia de
b
R possa ser utilizada.
Em termos prticos, as hipteses a) e b) podem ser assumidas sem risco
aprecivel para amostras de no mnimo 30 unidades, sucientemente grandes
para que se tenha CV (x) < 0, 10 e CV (y) < 0, 10, isto , o tamanho n da
amostra deve ser tal que:
n max
_

_
30;
C
2
x
0, 01 +
C
2
x
N
;
C
2
y
0, 01 +
C
2
y
N
_

_
Nestas condies, se pode armar que:
b
RR
q
V (
b
R)

= N(0, 1)
Da segue-se que:
P
_
_

b
R R
q
V (
b
R)

z
/2
_
_
= 1 =P

b
RR

z
/2
q
V (
b
R)

= 1
onde:
z
/2
a abscissa da distribuio Normal padro tal que
P
_
_
b
RR
q
V (
b
R)
> z
/2
_
_
=

2
e o nvel de signicncia.
16 CAPTULO 1. ESTIMADORES ESPECIAIS
Portanto,
D(
b
R) = z
/2
q
V (
b
R) a preciso do estimador
b
R; e
D
r
(
b
R) = z
/2

V (
e
R)
R
= z
/2
CV (
b
R) a preciso relativa do estimador
b
R;
Pode-se utilizar como estimador da preciso do estimador de
b
R, o valor
d(
b
R) tal que:
d(
b
R) = z
/2
q
v(
b
R)
com v(
b
R) dado por v
1
(
b
R) ou v
2
(
b
R) conforme a convenincia.
O estimador da preciso relativa do estimador de
b
R, o valor d
r
(
b
R) tal
que:
d
r
(
b
R) = z
/2
q
v(
b
R)
b
R
= z
/2
cv(
b
R)
Estas informaes podem ser utilizadas para a construo de intervalos
de conana para R.
Aesse respeito, consultar Fieller (1932) e Paulson (1942), caso as condies
para aproximao pela normal no sejam satisfeitas.
1.3 Estimadores de razo para o total e a m-
dia
Uma forma usualmente ecaz de aproveitar o conhecimento de informaes
existentes sobre a populao, com o objetivo de melhorar a qualidade das
estimativas de uma amostra, a utilizao de estimadores de razo.
Se para determinada caracterstica x, correlacionada com a caracterstica
de interesse y so conhecidos:
i) o valor verdadeiro da mdia ou total da populao; e
ii) os valores observados na amostra.
Ento possvel construir estimadores cuja preciso deve ser melhor que
a dos estimadores simples ou naturais j apresentados. A dia bsica
aproveitar a interdependncia de x e y e a existncia de informaes sobre x
livres de erro de amostragem para conseguir estimativas mais precisas.
Muitas vezes, desejvel incorporar informao de fontes externas in-
dependentes para aumentar a conabilidade das estimativas da pesquisa e
tambm para promover consistncia nos resultados publicados por diferentes
pesquisas.
1.3. ESTIMADORES DE RAZO PARA O TOTAL E A MDIA 17
As tcnicas que foram apresentadas para estimao de uma razo podem
ser adaptadas e utilizadas para melhorar as estimativas da mdia e total
de uma dada caracterstica y, bastando que seja conhecido o total popula-
cional (X) ou a mdia (X) da caracterstica x na populao, sem erro de
amostragem.
Ora, se X for conhecido, tem-se:
R =
Y
X
e
b
R =
y
x
Y =
Y
X
X = R X =
b
Y
R
=
b
RX
Y =
Y
X
X = R X =y
R
=
b
R X =
b
Y
R
N
sendo:
b
Y
R
o estimador de razo para estimar o total da caracterstica y; e
y
R
o estimador de razo para estimar a mdia da caracterstica y.
Em pesquisas domiciliares, por exemplo, prtica corrente no IBGE o uso
de estimadores de razo para estimar o total, utilizando como varivel auxil-
iar a estimativa da populao residente, obtida pela projeo de populao.
Neste caso feito um ajuste das estimativas provenientes da amostra de tal
modo que os totais da populao estimados coincidam com os resultados da
populao projetada que o IBGE elabora e divulga. O estimador do total
de uma caracterstica y qualquer, para uma determinada rea da Pesquisa
Nacional por Amostra de Domiclios (PNAD) pode ser escrito genericamente
como um estimador de razo da forma:
b
Y
PNAD
=
b
RX
p
=
b
Y
b
X
X
p
=
n
P
i=1
w
i
y
i
n
P
i=1
w
i
x
i
X
p
=
n
X
i=1
w
i
y
i
=
n
X
i=1
(w
i
) y
i
=
n
X
i=1

i
y
i
onde:
b
Y
PNAD
o estimador de razo para o total da caracterstica y ajustado
pela projeo de populao, utilizado na PNAD, para a rea em questo;
b
Y o estimador de total da caracterstica y, obtido considerando os pesos
simples da amostra;
b
X o estimador de total da populao residente, obtido considerando os
pesos simples da amostra;
X
p
a estimativa da populao residente, obtida pela projeo de popu-
lao.
18 CAPTULO 1. ESTIMADORES ESPECIAIS
w
i
o peso amostral associado ao i-simo domiclio da amostra, obtido
considerando os pesos simples da amostra;
n o nmero de domiclios na amostra da PNAD, para a rea em questo;
y
i
o valor da caracterstica y associado ao i-simo domiclio da amostra,
para a rea em questo;
x
i
o total de pessoas associado ao i-simo domiclio da amostra, para a
rea em questo;
=
X
p
b
X
o fator de ajuste dos pesos simples w
i
;

i
=
i
o peso nal ajustado associado ao i-simo domiclio da
amostra.
A ttulo de ilustrao, o valor do fator de ajuste dos pesos da PNAD
95 para Sergipe de = 1, 05, que corresponde razo entre a populao
residente projetada para a data da pesquisa (1.611.711) e o valor da estima-
tiva do total da populao residente obtida considerando os pesos simples da
amostra para a rea em questo (1.535.111).
1.3.1 Varincias dos estimadores de razo para o total
e a mdia
Todas as tcnicas para estimao da preciso anteriormente apresentadas
foram feitas supondo que o desenho da amostra era com seleo aleatria
simples sem reposio. Para esse mesmo desenho amostral, as expresses so
adaptadas e utilizadas, bastando notar que
b
Y
R
igual a
b
R vezes a constante
X.
Dessa forma, tem-se:
E(
b
Y
R
)
b
Y
R
= X

E(
b
R)
b
R

V (
b
Y
R
) = X
2
V (
b
R)

= X
2
N n
N
1
nX
2

S
2
y
+R
2
S
2
x
2 RS
xy

= N
N n
n

S
2
y
+R
2
S
2
x
2 RS
xy

ou
V (
b
Y
R
) = N
N n
n
1
N 1
N
X
I=1
(Y
I
RX
I
)
2
De modo anlogo, para a mdia y
R
tem-se:
E(y
R
) y
R
= X

E(
b
R)
b
R

1.3. ESTIMADORES DE RAZO PARA O TOTAL E A MDIA 19


V (y
R
) = V (
b
Y
R
N
)

=
N n
N
1
n

S
2
y
+R
2
S
2
x
2 RS
xy

ou
V (y
R
)

=
N n
N
1
n
1
N 1
N
X
I=1
(Y
I
RX
I
)
2
1.3.2 Estimao das varincias dos estimadores de razo
para o total e a mdia
Um estimador para V (
b
Y
R
) dado por:
v(
b
Y
R
) = X
2
v(
b
R) = N
N n
n
h
s
2
y
+
b
R
2
s
2
x
2
b
R s
xy
i
ou
v(
b
Y
R
) = X
2
v(
b
R) = N
N n
n
1
n 1
n
X
i=1
(y
i

b
Rx
i
)
2
e um estimador para V (y
R
) dado por:
v(y
R
) = X
2
v(
b
R) =
N n
N
1
n
h
s
2
y
+
b
R
2
s
2
x
2
b
R s
xy
i
ou
v(y
R
) =
N n
N
1
n
1
n 1
n
X
i=1
(y
i

b
Rx
i
)
2
1.3.3 Comparao da preciso do estimador de razo
coma do estimador simples emamostragemaleatria
simples
A partir de uma amostra aleatria simples sem reposio de n unidades se
conhece expresses para as varincias do estimador simples e do estimador
de razo para estimar o total (ou a mdia). Portanto, possvel comparar a
preciso alcanada comcada umatravs da comparao entre suas varincias.
Sendo assim, para o caso do estimador de total, sabe-se que:
V (
b
Y ) = N
2
N n
N
S
2
y
n
V (
b
Y
R
) = X
2
N n
N
1
nX
2

S
2
y
+R
2
S
2
x
2 RS
xy

= N
2
N n
N
1
n

S
2
y
+R
2
S
2
x
2 RS
xy

20 CAPTULO 1. ESTIMADORES ESPECIAIS


Note-se que:
V (
b
Y
R
) < V (
b
Y ) S
2
y
+R
2
S
2
x
2 R S
x
S
y
< S
2
y
R
2
S
2
x
< 2 R S
x
S
y
>
RS
x
2 S
y

>
Y S
x
2 X S
y
>
S
x
/X
2 S
y
/Y
= >
1
2
C
x
C
y
Na prtica, esta relao pode ser utilizada para vericar, quando conve-
niente o uso do estimador de razo ao invs do estimador simples do total ou
da mdia, j que muitas vezes possvel conhecer aproximadamente o valor
de = (x, y) e tambm a relao entre C
x
e C
y
.
1.4 Estimadores de razo em amostragem es-
traticada
Nas seo 1.3 foi tratado o caso de utilizao do estimador de razo para
estimar o total populacional (Y ) a partir de uma amostra aleatria simples
sem reposio de tamanho n. No caso de uma amostra estraticada, h dois
estimadores de razo para estimar o total populacional (Y ):
estimador de razo combinada; e
estimador de razo separada.
1.4.1 Estimador de razo combinada
Considere ento, o problema de estimar o total Y a partir de uma amostra
aleatria estraticada selecionada de uma populao comL estratos de tamanho
N
h
(h = 1, 2, , L), tendo sido selecionadas n
h
unidades e investigadas as
caractersticas x e y em cada unidade da amostra de cada estrato. Suponha
que seja tambm conhecido o total populacional para a caracterstica x. O
estimador de razo combinada
b
Y
RC
para estimar o total populacional (Y )
denido por:
b
Y
RC
=
b
Y
est
b
X
est
X =
y
est
x
est
X
onde:
b
Y
est
=
L
P
h=1
N
h
y
h
o estimador simples do total da caracterstica y na
amostra estraticada;
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA21
b
X
est
=
L
P
h=1
N
h
x
h
o estimador simples do total da caracterstica x na
amostra estraticada;
X o total da caracterstica x, conhecido de alguma fonte externa a
amostra, livre de erros de amostragem;
1
y
est
=
b
Y
est
N
o estimador simples da mdia da caracterstica y na amostra
estraticada; e
x
est
=
b
X
est
N
o estimador simples da mdia da caracterstica x na amostra
estraticada.
O estimador de razo combinada
b
Y
RC
consistente para o total Y .
Isto ,
b
Y
RC
|
n=N
= Y
Prova: se n = N com n
h
= N
h
h = 1, 2, , L vem:
b
Y
est
=
L
X
h=1
N
h
y
h
=
L
X
h=1
N
h
Y
h
= Y
b
X
est
=
L
X
h=1
N
h
x
h
=
L
X
h=1
N
h
X
h
= X
donde:
b
Y
RC
|
n=N
=
Y
X
X = Y
sabido que os estimadores de razo so viciados exceto se a populao
for de um tipo muito especial em termos de relao entre x e y.
Apesar disso, temse armado que em muitos casos o estimador de razo
prefervel ao estimador natural (simples) por que d melhor preciso. Entre-
tanto, esta armao s verdadeira, quando se consegue tornar desprezvel
o vcio ou tendenciosidade do estimador de razo.
Acontece que, como

Y
RC
um estimador de razo se pode demonstrar
que:
| E(
b
Y
RC
Y |
q
V (
b
Y
RC
)
CV (
b
X
est
) = CV (x
est
)
1
O estimador
b
Y
RC
depende apenas do conhecimento do total X, e no dos totais X
h
dos estratos.
22 CAPTULO 1. ESTIMADORES ESPECIAIS
usual considerar a tendensiosidade desprezvel quando
CV (
b
X
est
) = CV (x
est
) 0, 10.
Assim ao dimensionar a amostra para estimar Y indispensvel garantir
um tamanho mnimo tal que se tenha CV (x
est
) 0, 10
Isto signica em:
V (x
est
)
X
2
0, 01
1
X
2

L
X
h=1
N
2
h
N
2
S
2
h
(x)
n
h

L
X
h=1
N
2
h
N
2
S
2
h
(x)
N
h
!
0, 01

L
X
h=1
N
2
h
N
2
S
2
h
(x)
n
h
0, 01 X
2
+
L
X
h=1
N
2
h
N
2
S
h
(x)
N
h
n
L
P
h=1
S
2
h
(x)

h
N
2
h
N
2
0, 01 X
2
+
L
P
h=1
N
2
h
N
2
S
2
h
(x)
N
h
onde:

h
=
n
h
n
depende do critrio de alocao da amostra em cada estrato;
S
2
h
(x) =
1
N
h
1
N
h
P
j=1

X
hj
X
h

2
X
hj
o valor da caracterstica x associada unidade j do estrato h.
Esta condio quanto preciso na estimao de X ser tambm usada no
estabelecimento de uma expresso aproximada para a varincia do estimador
de razo combinada.
Alm disto, h que notar a equivalncia de xar um coeciente de variao
de 10% para x
est
e de admitir um erro mximo de 20% na estimao de X
com 95% de conana.
No se dispe de uma expresso exata para a varincia do estimador de
razo combinada. Porm, se a amostra de tamanho sucientemente grande
para tornar desprezvel a tendenciosidade do estimador, podese obter uma
expresso aproximada para a varincia:
V (
b
Y
RC
)

= E

b
Y
RC
Y

2
= E

y
est
x
est
X Y

2
!
= E

y
est
x
est
X
Y
X
X
x
est
x
est

2
!
= E

X
2
x
2
est
(y
est
Rx
est
)
2

= N
2
E

X
2
x
2
est
(y
est
R x
est
)
2
!
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA23
supondose n grande, tem se
X
x
est

= 1
Da
V (
b
Y
RC
)

= N
2
E (y
est
Rx
est
)
2
= N
2
E

y
2
est
+R
2
x
2
est
2Ry
est
x
est

Porm:
E(y
2
est
) = V (y
est
) + [E(y
est
)]
2
= V (y
est
) +Y
2
E(x
2
est
) = V (x
est
) +X
2
E(x
est
y
est
) = COV (x
est
, y
est
) +E(x
est
)E(y
est
) = COV (x
est
, y
est
) +X Y
Da
V (
b
Y
RC
)

= N
2
[V (y
est
) +R
2
V (x
est
) 2 RCOV (x
est
, y
est
)]
+N
2
[Y
2
+R
2
X
2
2RX Y ]
como:
Y
2
+R
2
X
2
2RX Y = (Y RX)
2
= 0
2
= 0
V (
b
Y
RC
)

= N
2
[V (y
est
) +R
2
V (x
est
) 2RCOV (x
est
, y
est
)]
agora:
V (y
est
) =
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
S
2
h
(y)
n
h
V (x
est
) =
L
X
h=1
N
2
h
N
h
N
h
n
h
N
h
S
2
h
(x)
n
h
onde:
S
2
h
(y) =
1
N
h
1
N
h
X
j=1
(Y
hj
Y
h
)
2
S
2
h
(x) =
1
N
h
1
N
h
X
j=1
(X
hj
X
h
)
2
24 CAPTULO 1. ESTIMADORES ESPECIAIS
e nalmente:
COV (x
est
, y
est
) = E[x
est
X)(y
est
Y )]
= E
"
L
X
h=1
N
h
N
x
h

L
X
h=1
N
h
N
X
h
!
L
X
h=1
N
h
N
y
h

L
X
h=1
N
h
N
Y
h
!#
= E
("
L
X
h=1
N
h
N
(x
h
X
h
)
#"
L
X
h=1
N
h
N
(y
h
Y
h
)
#)
= E
"
L
X
h=1
N
2
h
N
2
(x
h
X
h
)(y
h
Y
h
)
#
+E
_

_
L
X
h=1
L
X
k=1
k6=h
N
h
N
N
k
N
(x
h
X
h
)(y
k
Y
k
)
_

_
=
L
X
h=1
N
2
h
N
2
E(x
h
X
h
)(y
h
Y
h
) + 0
=
L
X
h=1
N
2
h
N
2
COV (x
h
, y
h
)
Lembrandose que a amostra dentro de cada estrato aleatria simples,
vem:
COV (x
h
, y
h
) =
N
h
n
h
N
h
S
h
(x, y)
n
h
onde
S
h
(x, y) =
1
N
h
1
N
h
X
j=1
(X
hj
X
h
)(Y
hj
Y
h
)
Ento nalmente:
COV (x
est
, y
est
) =
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
S
h
(x, y)
n
h
Da, obtm-se:
V (
b
Y
RC
)

= N
2
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
1
n
h
[S
2
h
(y) +R
2
S
2
h
(x) 2 RS
h
(x, y)]
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA25
Substituindo-se nesta expresso os valores de S
2
h
(y), S
2
h
(x) e S
h
(x, y) vem:
V (
b
Y
RC
)

=
L
X
h=1
N
2
h
N
h
1
N
h
n
h
N
h
1
n
h
"
N
h
X
j=1
(Y
hj
Y
h
)
2
+R
2
(X
hj
X
h
)
2
2R(X
hj
X
h
)(Y
hj
Y
h
)
#
V (
b
Y
RC
)

=
L
X
h=1
N
h
N
h
1
N
h
n
h
n
h
(
N
h
X
j=1
[(Y
hj
Y
h
) R(X
hj
X
h
)]
2
)
Um estimador de V (
b
Y
RC
) dado por:
v(
b
Y
RC
) =
L
X
h=1
N
h
(N
h
n
h
)
n
h
h
s
2
h
(y) +
b
R
2
est
s
2
h
(x) 2
b
R
est
s
h
(x, y)
i
onde:
b
R
est
=
y
est
x
est
e s
2
h
(y), s
2
h
(x) e s
h
(x, y) so estimadores no viciados de S
2
h
(y), S
2
h
(x) e
S
h
(x, y), respectivamente, ou seja:
s
2
h
(y) =
1
n
h
1
n
h
X
j=1
(y
hj
y
h
)
2
s
2
h
(x) =
1
n
h
1
n
h
X
j=1
(x
hj
x
h
)
2
s
h
(x, y) =
1
n
h
1
n
h
X
j=1
(x
hj
x
h
)(y
hj
y
h
)
O estimador de razo combinada para estimar a mdia Y dado por:
y
RC
=
b
Y
RC
N
Neste caso a varincia V (y
RC
) dada por:
V (y
RC
) =
1
N
2
V (
b
Y
RC
)
e um estimador de V (y
RC
) dado por:
v(y
RC
) =
1
N
2
v(
b
Y
RC
)
26 CAPTULO 1. ESTIMADORES ESPECIAIS
1.4.2 Estimador de razo separada
Uma outra forma de utilizar estimadores de razo para conseguir maior pre-
ciso na amostragem estraticada o chamado estimador de razo separada.
b
Y
RS
=
L
X
h=1
y
h
x
h
X
h
=
L
X
h=1
y
h
x
h
X
h
=
L
X
h=1
b
R
h
X
h
Notese que necessrio conhecer os totais por estrato X
h
da caracterstica
auxiliar x.
A principal diferena do estimador de razo separada para o estimador
de razo combinada est no nvel em que se faz uso da estimao por razo:
no estimador de razo separada so feitas razes em cada um dos estratos,
enquanto que no estimador de razo combinada uma nica razo feita para
os estimadores de total disponveis.
O estimador de razo separada
b
Y
RS
consistente para o total Y . Isto
:

Y
RS
|
n=N
= Y
Prova: se n = N com n
h
= N
h
=y
h
= Y
h
b
Y
RS
|
n=N
=
L
X
h=1
y
h
x
h
X
h
=
L
X
h=1
Y
h
X
h
X
h
=
L
X
h=1
N
h
Y
h
= Y
Quanto tendendiosidade, este estimador precisa ser analisado com
maior cuidado, porque depende de razes constudas em cada um dos es-
tratos.
Denindo
b
Y
hR
=
y
h
x
h
X
h
Vem:
b
Y
RS
=
L
X
h=1
b
Y
hR
Em cada estrato, sabese que:
| E(
b
Y
hR
) Y
h
|
q
V (
b
Y
hR
)
CV (x
h
) h = 1, 2, , L
Se os n
h
forem todos sucientemente grandes, podese admitir que o
vcio de
b
Y
RS
desprezvel. Caso isto no acontea o uso deste estimador
no aconselhvel, pois o vcio do estimador pode ser signicativo impedindo
mesmo o clculo de uma estimativa da preciso como ser visto mais adiante
Para ver porque isto ocorre, basta um raciocnio intuitivo:
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA27
Suponha que o vcio tenha o mesmo nvel em todos os estratos, como
pode ocorrer, e ento o vcio de
b
Y
RS
ser aproximadamente L vezes o
vcio em
b
Y
hR
. Porm, o erro padro de

Y
RS
apenas da ordem de

L
vezes o erro padro de
b
Y
hR
. Logo:
| E(
b
Y
RS
) Y |
q
V AR(
b
Y
RS
)
poderia ser to grande quanto

LCV (x
h
)
Exemplo: Se tivermos 50 estratos com CV (x
h
) = 0, 1 em cada estrato,
o vcio de
b
Y
RS
poderia ser da ordem de 0,7 vezes seu erro padro.
Uma regra prtica a adotar contra-indica o uso do estimador de razo
separada a menos que:

L(CV (x
h
) < 0, 20 L = 1, 2, , L.
Talvez esta regra seja conservadora demais pois o vcio pode ser bem
menor que o limite superior conhecido; mas a menos que haja forte evidncia
disso no se deve usar o estimador de razo separada.
Tambm no existe uma expresso exata para a varincia de
b
Y
RS
. Ser
obtida uma expresso aproximada no caso em que os n
h
so sucientemente
grandes para tornar desprezvel o vcio em cada um dos estratos. Caso esta
condio no se verique, a expresso obtida para a varincia no convel,
e o estimador de razo separada no deve ser usado.
Supondo os n
h
sucientemente grandes, vem:
V (
b
Y
RS
)

= E[(
b
Y
RS
Y )
2
] = E
_
_

L
X
h=1
b
Y
hR

L
X
h=1
Y
h
!
2
_
_
= E
_
_

L
X
h=1
(
y
h
x
h
X
h
Y
h
)
!
2
_
_
=
L
X
h=1
E
"

y
h
x
h
X
h
Y
h

2
#
+
+
L
X
h=1
L
X
k=1
k6=h
E

y
h
x
h
X
h
Y
h

y
k
x
k
X
k
Y
k

=
L
X
h=1
V (
b
Y
hR
) + 0
=
L
X
h=1
N
2
h
N
h
n
h
N
h
1
n
h

S
2
h
(y) +R
2
h
S
2
h
(x) 2R
h
S
h
(x, y)

28 CAPTULO 1. ESTIMADORES ESPECIAIS


onde: R
h
=
Y
h
X
h
e S
2
h
(y), S
2
h
(x) e S
h
(x, y) so como denidos anteriormente.
Esta varincia pode ainda ser escrita:
V (
b
Y
RS
)

=
L
X
h=1
N
2
h
N
h1
N
h
n
h
N
h
1
n
h
(
N
h
X
j=1
[(Y
hj
Y
h
) R
h
(X
hj
X
h
)]
2
)
Um estimador de V (
b
Y
RS
) dado por:
v(
b
Y
RS
) =
L
X
h=1
N
h
(N
h
n
h
)
n
h
h
s
2
h
(y) +
b
R
2
h
s
2
h
(x) 2
b
R
h
s
h
(x, y)
i
onde:
b
R
h
=
y
h
x
h
=
y
h
x
h
e s
2
h
(y), s
2
h
(x) e s
h
(x, y) so como denidos anterior-
mente.
O estimador de razo separada para estimar a mdia Y dado por:
y
RS
=
b
Y
RS
N
Neste caso a varincia V (y
RS
) dada por:
V (y
RS
) =
1
N
2
V (
b
Y
RS
)
e um estimador de V (y
RS
) dado por:
v(y
RS
) =
1
N
2
v(
b
Y
RS
)
v(y
RS
) =
X
N
h
N
2
(N
h
n
h
)
n
h
[s
2
h
(y) +
b
R
2
h
s
2
h
(x) 2
b
R
h
s
h
(x, y)]
1.4.3 Comparao dos estimadores de razo separada
e combinada
Em geral, para amostras de tamanho idntico, o estimador de razo combi-
nada deve ter vcio bem menor que o estimador de razo separada.
No uso do estimador de razo separada, h que vericar sempre se

LCV (x
h
) 0, 20 h
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA29
Em ambos os casos, os tamanhos de amostra que garantem uma tendenciosi-
dade desprezvel podem ser determinados.
Atravs da comparao das varincias feita a avaliao da melhor pre-
ciso alcanada entre os estimadores de razo em amostragem estraticada:
V (
b
Y
RC
) V (
b
Y
RS
)

=
L
X
h=1
N
2
h
N
h
n
h
N
h
1
n
h
[S
2
h
(y) +R
2
S
2
h
(x) 2RS
h
(x, y)]

L
X
h=1
N
2
h
N
h
n
h
N
h
1
n
h
[S
2
h
(y) +R
2
h
S
2
h
(x) 2R
h
S
h
(x, y)]

=
L
X
h=1
N
h
N
h
n
h
n
h
[(R
2
R
2
h
)S
2
h
(x) 2(RR
h
)S
h
(x, y)]
Os dois estimadores sero igualmente precisos se R
h
= R ou Y
h
/X
h
=
Y/X para todos os estratos.
A medida que os R
h
sejam mais distantes de R, o estimador da razo
separada tende a dar maior preciso, inclusive por se basear num conheci-
mento mais detalhado dos dados do universo da caracterstica x.
Exemplo 1.2 (Cochran (1977), pg.167)
Os dados so provenientes do Censo Agropecurio de todas as fazendas
do municpio de Jeerson em Iowa. A varivel y investigada em cada fazenda
a rea (em acres) com plantao de milho e a varivel x a rea de cada
fazenda. A populao dividida em 2 estratos, sendo que o primeiro contm
as fazenda com menos de 160 acres. Suponha que se deseja selecionar uma
amostra de 100 fazendas, sendo que 70 sero selecionadas do estrato 1 e 30
do estrato 2. A idia comparar a preciso de estimadores alternativos para
estimar a mdia da rea com plantao de milho por fazenda.
Calcule a varincia do estimador da mdia segundo cada uma das 5 es-
tratgias:
1 - estimador simples, supondo que a amostra ser aleatria simples sem
considerar a estraticao;
2 - estimador de razo, supondo que a amostra ser aleatria simples sem
considerar a estraticao;
3 - estimador simples da amostragem estraticada, supondo que em cada
estrato a amostra ser aleatria simples;
4 - estimador de razo combinada da amostragem estraticada, supondo
que em cada estrato a amostra ser aleatria simples;
5 - estimador de razo separada da amostragem estraticada, supondo
que em cada estrato a amostra ser aleatria simples;.
30 CAPTULO 1. ESTIMADORES ESPECIAIS
Os dados so apresentados na tabela a seguir:
Estratos
Tamanho
(acres)
N
h
Y
h
X
h
S
2
h
(y) S
2
h
(x) S
h
(x, y) R
h
1 160 1580 19,40 82,56 312 2055 494 0,2350
2 > 160 430 51,63 244,85 922 7357 858 0,2109
Total - 2010 26,30 117,28 620 7619 1453 0,2242
Os fatores de correo de populao nita podem ser ignorados, ou seja,
considerar
N n
N

= 1 e
N
h
n
h
N
h

= 1, h = 1 e 2.
Considere Q
h
=
N
2
h
N
2
1
n
h
e que Q
1
= 0,008828 e Q
2
=0,001525.
Compare os resultados e comente.
Soluo:
1 - Amostra aleatria simples (AAS): y =
1
n
n
P
i=1
y
i
o estimador simples
da mdia da rea com plantao de milho por fazenda
V (y) =
N n
N
S
2
y
n

=
S
2
y
n
=
620
100
= 6, 20
2 - Amostra aleatria simples (AAS): y
R
=
y
x
X o estimador de razo
da mdia da rea com plantao de milho por fazenda
V (y
R
)

=
N n
N
1
n

S
2
y
+R
2
S
2
x
2 RS
xy

=
1
n

S
2
y
+R
2
S
2
x
2 RS
xy

=
1
100
[620 + (0, 2242)
2
(7619) 2(0, 2242)(1453)] = 3, 51
3 - Amostra aleatria estraticada (AAE): y
est
=
L
P
h=1
N
h
N
y
h
o estimador
simples da mdia da rea com plantao de milho por fazenda
V (y
est
) =
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
S
2
h
(Y )
n
h

=
L
X
h=1
N
2
h
N
2
S
2
h
(y)
n
h
=
L
X
h=1
Q
h
S
2
h
(y) = (0, 008828)(312) + (0, 001525)(922) = 4, 16
1.4. ESTIMADORES DERAZOEMAMOSTRAGEMESTRATIFICADA31
4 - Amostra aleatria estraticada (AAE): y
RC
=
y
est
x
est
X o estimador
de razo combinada da mdia da rea com plantao de milho por fazenda
V ( y
RC
)

=
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
1
n
h

S
2
h
(y) +R
2
S
2
h
(x) 2RS
h
(x, y)

=
L
X
h=1
Q
h

S
2
h
(y) +R
2
S
2
h
(x) 2RS
h
(x, y)

= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2242)


2
(2055) +
+(0, 001525)(0, 2242)
2
(7357) 2(0, 008828)(0, 2242)(494) +
2(0, 001525)(0, 2242)(858)
= 3, 10
5 - Amostra aleatria estraticada (AAE): y
RS
=
1
N
L
P
h=1
y
h
x
h
X
h
o es-
timador de razo separada da mdia da rea com plantao de milho por
fazenda
V ( y
RS
)

=
L
X
h=1
N
2
h
N
2
N
h
n
h
N
h
1
n
h

S
2
h
(y) +R
2
h
S
2
h
(x) 2R
h
S
h
(x, y)

=
L
X
h=1
Q
h

S
2
h
(y) +R
2
h
S
2
h
(x) 2R
h
S
h
(x, y)

= (0, 008828)(312) + (0, 001525)(922) + (0, 008828)(0, 2350)


2
(2055) +
+(0, 001525)(0, 2109)
2
(7357) 2(0, 008828)(0, 2350)(494) +
2(0, 001525)(0, 2109)(858)
= 3, 06
32 CAPTULO 1. ESTIMADORES ESPECIAIS
Resumo e comentrios:
Estrat egia
Desenho
amostral
M etodo de
estima ao
V ari ancias
Ganhos de
precis ao
1 AAS simples V (y) = 6, 20 -
2 AAS razo V (y
R
) = 3, 51
V (y)
V (y
R
)
= 1, 77
3 AAE simples V (y
est
) = 4, 16
V (y)
V (y
est
)
= 1, 49
4 AAE razo combinada V ( y
RC
) = 3, 10
V (y)
V ( y
RC
)
= 2, 00
5 AAE razo separada V ( y
RS
) = 3, 06
V (y)
V ( y
RS
)
= 2, 03
Os resultados mostram que h ganhos de preciso com as estratgias 2 a
5 quando comparadas com a estratgia 1. Verica-se que o ganho de preciso
quando utilizar o estimador de razo com amostragem aleatria simples de
77%, enquanto que ao utilizar o estimador de razo separada em relao ao
estimador simples da amostragem aleatria simples de 103%. Porm, pode-
se vericar que ao se adotar amostragem estraticada, o ganho de preciso
ao utilizar o estimador de razo separada em relao ao estimador simples
da amostragem estraticada de apenas 36%, pois: V (y
est
) / V ( y
RS
) =
4, 16 / 3, 06 = 1, 36. Isto ocorre porque a varivel de estraticao (tamanho
da rea) a mesma varivel auxiliar utilizada no estimador de razo.
1.4.4 O uso de estimadores de razo
No planejamento das pesquisas a deciso entre utilizar uma determinada
varivel na estraticao ou na estimao depende de uma srie de circuns-
tncias. Alguns pontos relevantes so:
Fatores como localizao geogrca, so mais fceis de serem introduzi-
dos na estraticao do que no mtodo de estimao.
A deciso depende da natureza da relao entre x e y.Todos os mtodos
de estimao de razo estudados dependem da efetividade da propor-
cionalidade da relao entre os x
i
e y
i
. Com relaes complexas ou
discontnuas, a estraticao pode ser mais eciente.
Se para algumas variveis da pesquisa existir uma relao proporcional
com a varivel x
i
e para outras variveis existir uma relap propor-
cional a uma outra varivel z
i
, ento, melhor utilizar x
i
e z
i
como
1.5. ESTIMADORES DE REGRESSO 33
variveis auxiliares em estimadores de razo do que estraticar por uma
delas.
Algumas restries devem ser consideradas ao tomar a deciso de usar
estimadores de razo:
Os tamanhos de amostra devem satisfazer s condies para tornar
desprezvel o vcio do estimador empregado.
Quanto maior a associao entre a caractertica auxiliar x e a car-
acterstica de interresse y maior o ganho de preciso no uso de esti-
madores de razo.
No existem frmulas exatas para o vcio nem para a varincia dos es-
timadores, embora as aproximaes da varincia existentes sejam sat-
isfatrias para amostras cujo tamanho satisfaz a condio de tornar
desprezvel o vcio.
1.5 Estimadores de Regresso
O estimador de regresso tem sua denio baseada num modelo de regresso
usado para representar a distribuio condicional da varivel de interesse y
dada a varivel auxiliar x.
Assim como o estimador de razo, o estimador de regresso utilizado
para melhorar a preciso atravs do uso de uma varivel auxiliar x que
correlacionada com y. Quando a relao entre y e x examinada, pode ser
notado que embora haja uma relao linear, a reta no necessariamente passa
pela origem. Neste caso sugere-se a utilizao de um estimador baseado na
regresso linear de y e x.
O papel do modelo o de descrever a disperso condicional da varivel
de interesse y dada a varivel auxiliar x na populao nita. Espera-se que
o modelo represente bem a relao de y e x. A idia pensar que os valores
populacionais poderiam ter sido gerados pelo modelo. Entretanto, no
necessrio supor que os valores populacionais foram de fato gerados pelo
modelo.
Suponha que seja selecionada uma amostra aleatria simples de tamanho
n, que sejam investigados os valores da caracterstica de interesse y e da
caracterstica x, cuja mdia populacional (X) seja conhecida. O estimador
de regresso linear de Y denido por:
y
reg
= y +b(X x)
34 CAPTULO 1. ESTIMADORES ESPECIAIS
onde:
b o estimador usual de mnimos quadrados baseado na amostra.
b =
s
xy
s
2
x
=
n
P
i=1
(y
i
y)(x
i
x)
n
P
i=1
(x
i
x)
2
O papel desempenhado pelo modelo ser essencialmente de sugerir um
estimador adequado b para usar no estimador de regresso.
possvel demonstrar que o estimador de regresso y
reg
consistente e
tem vcio de ordem
1
n
.
Sua varincia pode ser aproximada por:
V (y
reg
)

=
N n
N
1
n
S
2
y
(1
2
xy
)
onde:
xy
= (x, y) a correlao entre as variveis x e y na populao.
Esta varincia pode ser estimada usando:
v(y
reg
) =
N n
N
1
n
n 1
n 2

s
2
y
+b
2
s
2
x
2bs
xy

=
N n
N
1
n
1
n 2
n
X
i=1
[(y
i
y) b(x
i
x)]
2
Outros estimadores de varincia podem ser usados, oferecendo melhor
desempenho.
O estimador de regresso para estimar o total Y dado por:
b
Y
reg
= N y
reg
Neste caso, a varincia aproximada por:
V (
b
Y
reg
)

= N
2
N n
N
1
n
S
2
y
(1
2
xy
)
e a varincia pode ser estimada por:
v(
b
Y
reg
) = N
2
N n
N
1
n
1
n 2
n
X
i=1
[(y
i
y) b(x
i
x)]
2
Exemplo 1.3 (Thompson (1992), pg. 80)
1.5. ESTIMADORES DE REGRESSO 35
Para estimar a produo total de uma plantao numa regio com N =
100 reas, foram selecionadas aleatoriamente 4 reas e medida a quantidade
y
i
da produo de cada rea da amostra. A produo de uma rea depende
da quantidade x
i
de fertilizante aplicada na rea, que conhecida para cada
rea da regio, resultando numa mdia populacional 100.
Os 4 pares de valores (x
i
, y
i
) da amostra so: (50, 1410), (100, 1690),
(150, 1680) e (200, 1850).
As mdias amostrais so: y = 1657, 5 e x = 125 e
b o estimador usual de mnimos quadrados baseado na amostra:
b =
n
P
i=1
(y
i
y)(x
i
x)
n
P
i=1
(x
i
x)
2
=
(50 125)(1410 1657, 5) + + (200 125)(1850 1657, 5)
(50 125)
2
+ + (2200 125)
2
=
32750
12500
= 2, 62
A estimativa da produo total da referida plantao, obtida atravs do
estimador de regresso, dada por:
b
Y
reg
= N y
reg
= N

y +b(X x)

= 100 (1657, 5 + 2, 62 (100 125))


= 100 (1592) = 159 200
Para obter a estimativa da varincia, vamos considerar o valor da linha
de regresso ajustada para a i-sima unidade da amostra estimada por:
b y
i
= a +bx
i
onde: a = y bx = 1675, 5 2, 62 (125) = 1330.
Neste caso, tem-se:
b y
1
= 1330 + 2, 62 (50) = 1461
b y
2
= 1330 + 2, 62 (100) = 1592
b y
3
= 1330 + 2, 62 (150) = 1723
b y
4
= 1330 + 2, 62 (200) = 1854
36 CAPTULO 1. ESTIMADORES ESPECIAIS
v(
b
Y
reg
) = N
2
v(y
reg
) =
N (N n)
n
1
n 2
n
X
i=1
[(y
i
y) b(x
i
x)]
2
=
N (N n)
n(n 2)
n
X
i=1
(y
i
b y
i
)
2
=
100 (100 4)
4 (4 2)

(1410 1461)
2
+ + (1850 1854)
2

=
100 (96)
4
(7035) = 16 884 000
cujo desvio padro estimado por:
q
v(
b
Y
reg
) = 4 109.
Por outro lado, a estimativa da produo total da referida plantao,
obtida atravs do estimador simples da amostragem aleatria simples, dada
por:
b
Y = N y = 100 (1657, 5) = 165 750
e a respectiva estimativa da varincia dada por:
v(
b
Y ) = N
2
v(y) =
N (N n)
n
4
X
i=1
(y
i
y)
2
=
100 (96)
4
(33292) = 79 900 000
cujo desvio padro estimado por:
q
v(
b
Y ) = 8 939.
Portanto, o estimador de regresso mais preciso que o estimador simples
no exemplo com essa pequena amostra. Isto ocorre em funo da pequena
variao dos resduos sobre a reta de regresso ajustada.
1.5.1 Comparao dos estimadores de regresso, razo
e simples da mdia sob amostragem aleatria
simples
V (y
reg
)

=
N n
N
1
n
S
2
y
(1
2
xy
)
V (y
R
)

=
N n
N
1
n

S
2
y
+R
2
S
2
x
2 RS
xy

1.5. ESTIMADORES DE REGRESSO 37


V (y) =
N n
N
1
n
S
2
y
Examinando as expresses acima, imediato notar que o estimador de
regresso mais preciso que o estimador simples da mdia a no ser
xy
= 0,
caso em que os estimadores so igualmente precisos.
O estimador de regresso prefervel ao estimador de razo quando:

2
xy
S
2
y
< R
2
S
2
x
2 RS
xy
ou, equivalentemente quando:

2
xy
S
2
y
< R
2
S
2
x
2 R
xy
S
y
S
x

xy
S
y
RS
x

2
> 0 =

xy
S
y
S
x
S
2
x
R

2
> 0
isto , quando:

S
xy
S
2
x
R

2
> 0 =(B R)
2
> 0
B corresponde ao ajuste populacional (hipottico) do modelo aos dados da
populao.
Logo, o estimador de regresso mais preciso que o estimador de razo
a menos que B = R, o que ocorre somente quando a regresso entre y e x
linear passando pela origem.
1.5.2 O uso de estimadores de regresso
O estimador de regresso til por pelo menos trs motivos:
oferece calibrao na varivel auxiliar, isto , se aplicado a varivel
auxiliar replica exatamente seu total conhecido na populao;
oferece ganhos de ecincia em relao ao estimador simples;
tem grande exibilidade, podendo ser utilizado com um vetor de var-
iveis auxiliares e ser facilmente generalizado para o uso em desenhos
amostrais complexos.
Algumas desvantagens e problemas devem ser consideradas ao tomar a
deciso de usar estimadores de regresso:
o vcio pode ser no desprezvel com pequenas amostras;
38 CAPTULO 1. ESTIMADORES ESPECIAIS
os pesos podem ser negativos ou menores que 1, o que indesejvel.
a preciso pode no ser boa caso o modelo linear no se ajuste bem.
maior complicao na estimao da varincia.
quando h mais de uma varivel auxiliar, necessrio usar mtodo
para escolha das que vo ser incorporadas na estimao. Acrescentar
variveis auxiliares nem sempre traz bom resultado.
usar pesos diferentes para diferentes variveis de interesse da pesquisa
uma tentao, mas aumenta a complexidade e cria diculdades prticas.
1.6 Ps-estraticao
muito comum na prtica a ocorrncia de situaes onde a tcnica de estrat-
icao poderia ser aplicada para melhorar a qualidade da amostra, porm
no se dispe de uma lista completa das unidades da populao com os re-
spectivos valores da caracterstica a ser usada na estraticao, ou seja, o
estrato para o qual a unidade pertence no conhecido at que os dados da
amostra sejam coletados. Caractersticas de pessoas, tais como: idade, sexo,
raa e nvel educacional so exemplos prticos dessa aplicao.
Nestes casos, quando forem conhecidos os limites dos estratos, e os seus
respectivos tamanhos (atravs de um censo anterior, por exemplo), possvel
fazer uso da estraticao para melhorar a qualidade das estimativas, atravs
da tcnica de ps-estraticao que consiste no seguinte:
i) selecionase uma amostra aleatria simples sem reposio de tamanho
n da populao
N
(sem considerar a estraticao);
ii) observase para cada unidade selecionada o valor da caracterstica de
estraticao x;
iii) de acordo com os valores observados de x, distribui-se a amostra em
L estratos previamente delimitados;
iv) considera-se a parte da amostra em cada um dos estratos como uma
amostra aleatria simples sem reposio do estrato (vide estimao em sub-
populaes), de tal forma que n
1
+n
2
+ +n
L
= n
Neste caso n
1
, n
2
, n
L
so variveis aleatrias. A amostra em cada
estrato considerada como uma amostra aleatria simples sem reposio da
subpopulao formada pelas unidades pertencentes ao estrato.
Assim sendo, a maneira de estimar ser derivada da teoria apresentada
para estimao em subpopulaes.
1.6. PS-ESTRATIFICAO 39
1.6.1 Estimao do total e da mdia
De acordo com o que foi visto no estudo de estimao em subpopulaes um
estimador no tendencioso para o total y da populao com ps-estraticao
dado por:
b
Y
p os
=
L
X
h=1
N
h
y
h
=
L
X
h=1
N
h
n
h
n
h
X
j=1
y
hj
Note que em termos de expresso, o estimador
b
Y
p os
idntico ao esti-
mador
b
Y
est
. A diferena existente entre ambos que no caso de
b
Y
est
as
mdias amostrais nos estratos (y
h
) so calculadas com amostras de taman-
hos n
h
conhecidos a priori, enquanto que no caso de
b
Y
p os
estes tamanhos
so variveis aleatrias dependendo da particular amostra selecionada.
A seguir, ser demonstrada a armao de que
b
Y
p os
estimador no
viciado para Y .
Inicialmente, devese recordar que, se Z e T so variveis aleatrias,
ento:
E(Z) = E
T
[E(Z/T)]
Neste caso conveniente considerar internamente a esperana condi-
cionada quando se xa uma dada seleo de amostra de tamanhos n
1
, n
2
, , n
L
,
e depois a esperana sobre todas as possveis selees de amostra. Vericase
que:
E(y
h
) = E

1
n
h
n
h
X
j=1
y
hj
!
= E
n
1
,n
2
, ,n
L
[E
1
n
h
n
h
X
j=1
y
hj
| n
1
, n
2
, , n
L
]
= E
n
1
,n
2
, ,n
L
[Y
h
] = Y
h
h = 1, 2, , L
Seguindose imediatamente que:
E(
b
Y
p os
) = E
"
L
X
h=1
N
h
y
h
#
=
L
X
h=1
N
h
E(y
h
) =
L
X
h=1
N
h
Y
h
= Y
Uma consequncia imediata disto que um estimador no tendencioso da
mdia y dado por :
y
p os
=
1
N
b
Y
p os
=
L
X
h=1
N
h
N
y
h
40 CAPTULO 1. ESTIMADORES ESPECIAIS
Na psestraticao, concluise ento que, os estimadores do total e da
mdia so obtidos da mesma forma que na estraticao comum, uma vez
selecionada a amostra. O que ser diferente a preciso resultante deste
processo de estimao, como ser visto adiante.
1.6.2 Preciso dos estimadores com ps-estraticao
Nosso objetivo aqui o clculo das medidas da preciso dos estimadores com
psestraticao, e a comparao dessa preciso com aquela resultante da
aplicao convencional da estraticao.
Inicialmente vale notar que no se dispe de expresso exata para a var-
incia de
b
Y
p os
ou de y
p os
. Isto se deve ao fato de ambas dependerem da
razo
1
n
h
onde agora n
h
varivel aleatria. Mas vamos ao problema,
calculando uma aproximao para V (y
p os
).
Varincia aproximada de y
p os
.
Se Z e T so variveis aleatrias pode se escrever:
V (Z) = E
T
(V (Z/T)) +V
T
[E(Z/T)]
Ento:
V (y
p os
) = E
n
1
,n
2
, ,n
L

V (y
p os
| n
1
, n
2
, , n
L

+
+V
n
1
,n
2
, ,n
L
[E(y
p os
| n
1
, n
2
, , n
L
]
Mas:
E(y
p os
| n
1
, n
2
, , n
L
) = Y
Donde:
V
n
1
,n
2
, ,n
L
[E(y
p os
| n
1
, n
2
, , n
L
] = V
n
1
,n
2
, ,n
L
(Y ) = 0
Logo:
V (y
p os
) = E
n
1
,n
2
, ,n
L

V (y
p os
| n
1
, n
2
, , n
L

= E
n
1
,n
2
, ,n
L

L
X
h=1
N
2
h
N
2
(
1
n
h

1
N
h
)S
2
h
!
Da:
V (y
p os
) =
L
X
h=1
N
2
h
N
2
E(
1
n
h
)S
2
h

L
X
h=1
N
2
h
N
2
S
2
h
N
h
1.6. PS-ESTRATIFICAO 41
Para calcular E(
1
n
h
) vamos usar a aproximao em srie de Taylor em
torno do ponto E(n
h
) da funo
1
n
h
. Esta funo pode ser escrita como:
1
n
h
=
1
E(n
h
)
E(n
h
)
n
h
=
1
E(n
h
)
1
n
h
E(n
h
)
=
1
E(n
h
)
1
1 +
n
h
E(n
h
)
E(n
h
)
agora sabese que:
1
1 +
= 1 +
2

.
= 1 +
2
Para
=
n
h
E(n
h
)
E(n
h
)
vem:
1
1 +
n
h
E(n
h
)
E(n
h
)

= 1
n
h
E(n
h
)
E(n
h
)
+

n
h
E(n
h
)
E(n
h
)

2
Donde:
1
n
h

=
1
E(n
h
)
"
1
n
h
E(n
h
)
E(n
h
)
+

n
h
E(n
h
)
E(n
h
)

2
#
Tomando expectncias nos 2 membros vem:
E(
1
n
h
)

=
1
E(n
h
)

1
E(n
h
E(n
h
))
E(n
h
)
+
E[(n
h
E(n
h
))
2
]
[E(n
h
)]
2

=
1
E(n
h
)

1 +
V (n
h
)
[E(n
h
)]
2

Agora n
h
/n um estimador no viciado da proporo N
h
/N de unidades
pertencentes ao estrato h.
Logo:
V

n
h
n

=
N n
N
1
n

N
N 1
N
h
N

1
N
h
N

=
N n
N
1
n

N
h
N

1
N
h
N

Tambm:
E
h
n
h
n
i
=
N
h
N
42 CAPTULO 1. ESTIMADORES ESPECIAIS
Logo:
E(n
h
) = n
N
h
N
V (n
h
) = n
2
N n
N
1
n

N
h
N

1
N
h
N

Isto :
E(n
h
) = n
N
h
N
V (n
h
) = n
(N n)
N

N
h
N

1
N
h
N

Levando na expresso de E(
1
n
h
) vem:
E(
1
n
h
)

=
1
n
N
h
N
_
_
_
_
1 +
n
(N n)
N
N
h
N

1
N
h
N

n
2
N
2
h
N
2
_
_
_
_
=
1
n
N
h
N
_
_
_
1 +
(N n)
N
1
n
_
_
_
1
N
h
N
1
_
_
_
_
_
_
=
1
n
N
h
N

1 +
(N n)
N
1
n

N
h
N
1

Substituindo, nalmente, na expresso de V (y


p os
), vem:
V (y
p os
)

=
L
X
h=1
N
2
h
N
2
N
nN
h

1 +
N n
N
1
n

N
N
h
1

S
2
h

L
X
h=1
N
2
h
N
2
S
2
h
N
h
=
L
X
h=1
N
2
h
N
2

N
nN
h

1
N
h

S
2
h
+
L
X
h=1
N
2
h
N
2
N
nN
h
N n
N
1
n

N
N
h
1

S
2
h
=
N n
N
1
n
L
X
h=1
N
h
N
S
2
h
+
N n
N
1
n
2
L
X
h=1
(1
N
h
N
)S
2
h
Da:
V (y
p os
)

= V (y
(p)
est
) +
N n
N
1
n
2
L
X
h=1
(1
N
h
N
)S
2
h
1.7. O USO DE INFORMAES AUXILIARES NA ESTIMAO 43
onde: V (y
(p)
est
) a varincia do estimador da mdia no desenho de amostragem
estraticada com alocao proporcional.
medida que n cresce, a segunda parcela de V (y
p os
) tende a zero.
V (y
p os
) V (y
(p)
est
)
Seguese que, para amostras grandes, a ecincia da ps-estraticao em
relao amostragem aleatria simples equivale alocao proporcional. Um
critrio habitualmente empregado na prtica para ter uma ps estraticao
efeciente tornar cada n
h
20, este pode ser obtido de 2 maneiras, a saber:
i) dimensionar a amostra aleatria simples de tal sorte que esta condio
ocorra com elevada probabilidade;
ii) utilizar um esquema de amostragem por cotas, onde os tamanhos de
amostra em cada um dos estratos seriam previamente xados por alocao
proporcional e as unidades de populao iriam sendo selecionadas por AAS
e alocadas nos estratos respectivos, at preencher a cota de cada estrato;
cada nova unidade selecionada um estrato j com a cota preenchida seria re-
jeitada, e uma nova unidade deveria ser selecionada, repetindose o processo
at satisfazer as cotas xadas para todos os estratos.
A desvantagem deste esquema de amostragem por cotas o aumento do
custo da pesquisa, em funo da seleo, investigao e posterior rejeio de
unidades pertencentes a estratos j completos.
Devese enfatizar que a adoo deste esquema s vlida se o proced-
imento da seleo das unidades da amostra for realmente o de uma AAS
sem reposio.
1.7 O uso de informaes auxiliares na esti-
mao
Silva (1996a) nos aponta que o aproveitamento de informaes populacionais
auxiliares para estimao em pesquisas por amostragem uma das partes
da teoria de amostragem que mais progrediu desde os anos 70. O livro que
representava o estado da arte da amostragem at ento (Cochran (1977))
contempla o uso de informaes auxiliares atravs de estimadores de razo
ou de regresso simples (ambos incorporando apenas uma varivel auxiliar)
ou de ps-estraticao. Entretanto, essas tcnicas eram apresentadas como
ferramentas separadas, sem uma ligao comum.
O livro que corresponde ao estado da arte da amostragem no incio
dos anos 90 (Srndal, Swensson e Wretman (1992)) apresenta as tcnicas de
ps-estraticao, estimao de razo e de regresso como casos particulares
44 CAPTULO 1. ESTIMADORES ESPECIAIS
do estimador de regresso generalizado, o qual fornece uma estrutura exvel
e eciente para incorporar informaes auxiliares na etapa de estimao.
Neste livro enfatizada uma abordagem model assisted, em que o modelo
de regresso usado para motivar o estimador, mas em que as propriedades
do mesmo so avaliadas com respeito distribuio gerada por repetidas
aplicaes do processo de seleo da amostra.
Tambmrecentemente, Deville e Srndal (1992) identicaramo estimador
de regresso como um dos membros de uma famlias de estimadores de cali-
brao, em que os pesos so ajustados, cujos os fatores de ajuste so obtidos
de forma a minimizar uma funo de distncia sujeita a restries que so
funes das variveis auxiliares. Empregando-se distintas funes de dis-
tncia se gera uma ampla famlia de estimadores que inclui raking ratio
estimators, estimadores de regresso, de razo, de ps-estraticao e out-
ros.
O IBGE j adquiriu larga experincia e tem feito uso efetivo dos desen-
volvimentos recentes da teoria. Para corroborar essa armao apresentada
a aplicao de estimadores especiais para a obteno dos fatores de expanso
das amostras utilizadas na coleta de Censos Demogrcos brasileiros.
O IBGE, desde 1960, tem usado dois modelos de questinrios na coleta
das informaes dos Censos Demogrcos: um questionrio bsico, que con-
tm os quesitos necessrios ao conhecimento de certas caractersticas bsi-
cas da populao e dos domiclios, referentes a 100% da populao, e um
questionrio de amostra (ampliado) que contm, alm dos quesitos bsicos
que tambm constam do questionrio bsico, outos quesitos mais detalhados
sobre caractersticas dos domiclios e das pessoas, tais como religio, cor,
migrao, escolaridade, fecundidade, mo-de-obra, rendimento, etc.
O conhecimento de totais da populao para um subconjunto de car-
actersticas investigadas (as quais so pesquisadas a 100%) torna vivel a
aplicao de estimadores especiais.
Nos censos demogrcos de 1960 e 1970 foram utilizados estimadores
de ps-estraticao, com 46 ps-estratos em 1970, aplicado separadamente
para cada municpio. Cada ps-estrato era formado por combinaes de
valores das variveis auxiliares, as quais foram investigadas a 100% atravs
do questionrio bsico.
Na expanso da amostra do Censo Demogrco de 1980 foi adotado raking
ratio estimator aqui denominado Processo Iterativo de Estimao por Totais
Marginais - PIETOM (IBGE (1983)) aplicado separadamente para cada uma
das 4219 reas de ponderao.
2
Esse mtodo consistia em denir uma tabela
2
rea de ponderao a menor rea para a qual se calculava estimativas, e coincidia
na maior parte das vezes com um municpio, podendo ser subdiviso deste nos de maior
1.7. O USO DE INFORMAES AUXILIARES NA ESTIMAO 45
(ou matriz) de ps-estraticao de dupla entrada, cujas linhas e colunas
eram dadas por combinaes de valores das variveis auxiliares, as quais
foram investigadas a 100% atravs do questionrio bsico. Eram portanto
conhecidos os totais populacionais das celas, linhas e colunas dessa tabela.
Os pesos amostrais para unidades em cada cela eram calculados por um
processo iterativo de ajuste dos pesos iniciais, de tal forma que as estimativas
amostrais eram sucessivamente calibradas nos totais das linhas e depois das
colunas, at que fosse observada convergncia dos pesos.
O uso dese mtodo permitiu ampliar bastante o nmero de variveis aux-
iliares consideradas para a calibrao das estimativas amostrais: a tabela de
ps-estraticao empregada no censo de 1980 tinha 720 celas, em compara-
o com os 46 ps-estratos adotados no Censo de 70.
A metodologia adotada para a expanso da amostra do Censo de 1991 foi
baseada no ajuste de um modelo linear generalizado sujeito a restries, en-
tendidas como condies que buscam igualar estimativas dos valores conheci-
dos do universo para um conjunto de variveis auxiliares comuns amostra
e toda populao de cada rea de ponderao. Essa metodologia baseada
num dos membros da famlia de estimadores de calibrao identicada por
Deville e Srndal (1992), identicada por estimao de mnimos quadrados
generalizados em duas etapas - MQG2 (Silva, Bianchini e Albieri (1993);
Albieri e Dias (1994)).
Essa metodologia foi desenvolvida por tcnicos do Statistics Canada e
aplicada na expanso da amostra do Censo de Populao canadense de 91e 96,
que parecido com o Censo Demogrco brasileiro. Foi possvel contar com
programas cedidos ao IBGE pelo Statistics Canada para a implementao do
mtodo para uso no censo brasileiro.
A metodologia MQG2 adotada para expandir a amostra do Censo De-
mogrco de 1991 permite incorporar grande nmero de variveis auxiliares,
mas no oferece uma teoria para a escolha tima das mesmas. Esse um dos
aspectos do emprego de estimadores de regresso que tem merecido ateno
da comunidade de pesquisa recentemente. Em particular, Silva e Skinner
(1996) apresentam um mtodo para seleo de variveis auxiliares quando se
utiliza estimadores de regresso cuja ecincia para estimar a mdia de uma
varivel resposta especicada foi maior que a de vrios competidores. Silva
e Skinner (1996) apontam ainda uma perda de preciso deo estimador de
regresso quando o nmero de variveis auxiliares cresce demasiadamente,
alertando para a necessidade de establecer um compromisso entre a cali-
brao no maior nmero possvel de variveis auxiliares sem impor grande
perda de ecincia no estimador.
populao.
46 CAPTULO 1. ESTIMADORES ESPECIAIS
Na rea de estimao em amostragem h hoje em dia vrias opes de
sistemas genricos: SUDAAN - SUrvey DAta ANalysis (Shah et al. (1992)),
GES - Generalized Estimation System (Estevao, Hidiroglou e Srndal (1995)),
CLAN (Andersson e Nordberg (1994)), WESVARPC (Westat (1995)). Todos
esses sistemas so capazes de calcular estimativas de totais e mdias, e re-
spectivas medidas de preciso para uma ampla gama de desenhos amostrais
e tipos de estimadores. Em particular, o sistema GES desenvolvido pelo
Statistics Canada implementa a metodologia de estimadores de regresso
generalizados tal como descrita no livro de Srndal, Swensson e Wretman
(1992).
1.8. EXERCCIOS 47
1.8 Exerccios
1.8.1 (Thompson (1992), pg. 76) Numa cidade com 75.000 habitantes,
uma amostra aleatria simples de 4 domiclios selecionada dos 25.000
domiclios da cidade para estimar o custo mdio de alimentao por
domiclio em uma semana. O primeiro domiclio selecionado tinha 4
pessoas e gastou R$150,00 com alimentao naquela semana. O se-
gundo domiclio tinha 2 pessoas e gastou R$100,00. O terceiro, com 4
pessoas, gastou R$200,00. O quarto, com 3 pessoas, gastou R$140,00.
Considere:
N n
N

= 1 s
2
y
= 1691, 70 s
2
x
= 0, 9166 s
xy
= 37, 5
a) Identique as unidades de amostragem, a varivel de interesse, e
alguma informao auxiliar associada com as unidades.
b) Descreva dois tipos de estimadores para estimar a despesa m-
dia por domiclio para a alimentao por uma semana na cidade.
Sumarize algumas propriedades de cada estimador.
c) Estime a despesa mdia por domiclio usando o primeiro estimador
e estime a varincia do estimador.
d) Estime a despesa mdia por domiclio usando o segundo estimador
e estime a varincia do estimador.
e) Baseado nos dados, qual estimador prefervel nesta situao?
1.8.2 Seja {u
1
, u
2
, , u
n
}uma amostra aleatria simples sem reposio da
populao
N
, onde so observadas as caractersticas x e y. Mostre
que a covarincia amostral
s
xy
=
1
n 1
n
X
i=2
(x
i
x)
2
um estimador no viciado para a covarincia populacional
S
xy
=
1
N 1
N
X
I=1
(X
I
X)(Y
I
Y )
1.8.3 De uma populao com 40 domiclios foi selecionada uma amostra
aleatria simples sem reposio de tamanho n = 4 que proporciona
48 CAPTULO 1. ESTIMADORES ESPECIAIS
os seguintes valores semanais expressos em reais.
Gastos com alimentao Gastos total
(y
i
) (x
i
)
125 250
135 300
70 200
158 350
4
P
i=1
y
i
= 488
4
P
i=1
x
i
= 1.100
4
P
i=1
y
2
i
= 63.714
4
P
i=1
x
2
i
= 315.000
4
P
i=1
x
i
y
i
= 141.050
Estime a porcentagem de gasto com alimentao e o respectivo erro
amostral medido pelo coeciente de variao.
1.8.4 Oobjetivo estimar o total de despesa comgastos sociais das prefeituras
de uma regio que abrange 281 municpios. Foi selecionada uma amostra
aleatria sem reposio de 50 municpios. Sabe-se que a populao to-
tal da regio de 6.818 (em milhares). Calcule a estimativa de total
da caracterstica y, que representa a despesa com gastos sociais, e o re-
spectivo intervalo com 95% de conana para essa estimativa de total
baseada em cada um dos seguintes estimadores:
a) Estimador simples.
b) Estimador de razo, utilizando como varivel auxiliar a populao,
representada pela caracterstica x.
c) Comente os resultados.
So dadas as seguintes informaes provenientes da amostra:
50
P
i=1
y
i
= 128.080
50
P
i=1
x
i
= 1.067
s
2
y
= 6.244.516 s
2
x
= 454, 51 s
xy
= 45.399
Obs: Tanto os valores de x com de y esto representados em milhares.
1.8. EXERCCIOS 49
1.8.5 Dena estimadores consistentes e suas respectivas varincias aproxi-
madas para a mdia de Y baseados em:
a) estimador de razo simples;
b) estimador de razo combinada;
c) estimador de razo separada.
Quando razovel a utilizao de estimadores de razo, luz das re-
stries existentes para esse tipo de estimador? e
A partir das frmulas aproximadas para as varincias dos estimadores
de (a), (b) e (c), obtenha estimadores consistentes que possam ser cal-
culados a partir da amostra.
1.8.6 Uma pesquisa piloto, onde foram selecionados aleatoriamente 21 domi-
clios (d
i
i = 1, 2, , 21), forneceu os seguintes dados para o nmero
de pessoas no domiclio (x), nmero de crianas (y
1
), nmero de carros
(y
2
) e nmero de televisores (y
3
).
d
i
x y
1
y
2
y
3
d
i
x y
1
y
2
y
3
d
i
x y
1
y
2
y
3
d
1
5 3 1 3 d
8
2 0 0 1 d
15
6 3 2 0
d
2
2 0 1 1 d
9
3 1 1 1 d
16
4 2 1 1
d
3
4 1 2 0 d
10
2 0 2 0 d
17
4 2 1 1
d
4
4 2 1 1 d
11
6 4 2 1 d
18
3 1 0 1
d
5
6 4 1 1 d
12
3 1 0 0 d
19
2 0 2 1
d
6
3 1 1 2 d
13
4 2 1 1 d
20
4 2 1 1
d
7
5 3 1 1 d
14
5 3 1 1 d
21
3 1 1 1
Assumindo que a populao total X conhecida, voc recomendaria
que os estimadores de razo fossem utilizados ao invs do estimador
simples para estimar o total de crianas, carros e televisores?
1.8.7 Em uma determinada localidade de 500 famlias se deseja fazer um
estudo sobre o hbito de fumar entre as pessoas maiores de 16 anos.
A populao foi estraticada em 2 estratos: famlias com renda alta
(estrato 1), onde foram classicadas 200 famlias; e famlias com renda
mais baixa (estrato 2), onde foram classicadas as outras 300 famlias.
conhecido que o nmero de pessoas com mais de 16 anos no estrato 1
520 e no estrato 2 1230. De cada um dos estratos foi selecionada uma
amostra aleatria de 5 famlias, apresentando os seguintes resultados:
50 CAPTULO 1. ESTIMADORES ESPECIAIS
Estrato 1
Famlias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 4 3 2 1 2
Fumantes com mais de 16 anos 1 1 0 1 1
Estrato 2
Famlias na amostra 1 2 4 4 5
Pessoas com mais de 16 anos 5 6 4 4 3
Fumantes com mais de 16 anos 3 3 1 2 2
Estimar o total de fumantes entre as pessoas maiores de 16 anos na
localidade, utilizando:
a) o estimador simples da amostragem estraticada;
b) o estimador de razo combinada; e
c) o estimador de razo separada.
Calcule os intervalos com 95% de conana para estimar os totais de fu-
mantes entre as pessoas maiores de 16 anos na localidade, considerando
os estimadores utilizados em (a), (b) e (c).
Comente os resultados.
1.8.8 Considere uma populao de pomares de plantio de pssegos. A var-
ivel y a produo de pssegos e a varivel auxiliar x o nmero de
ps de pssego do pomar.
A idia comparar a preciso dos estimadores alternativos da produo
total de pssegos na populao, que tem 256 pomares, com base numa
amostra aleatria de 100 pomares.
Os dados bsicos obtidos de um censo anterior so:
S
2
y
= 6.409 S
2
x
= 3.898 S
xy
= 3.898 e R = 1, 270
Calcule a varincia do estimador de total segundo cada uma das es-
tratgias: estimador simples, razo e regresso. Comente o resultado.
1.8.9 De um Censo Agropecurio foram obtidas 1200000 fazendas e a rea
(x) de cada fazenda foi investigada fornecendo uma mdia de 31,25
acres por fazenda. Uma amostra aleatria simples de 2055 fazendas foi
selecionda e foram obtidas as seguintes informaes sobre o nmero de
cabeas de gado (y) em cada fazenda e a rea de cada fazenda.
1.8. EXERCCIOS 51
2.055
P
i=1
y
i
= 25. 751
2.055
P
i=1
x
i
= 62. 989
s
2
y
= 1.334, 470 s
2
x
= 490, 4300 b = 0, 354585
(Considere
N n
N

= 1)
a) Calcule as estimativas do total de cabeas de gado utilizando o
estimador simples, de razo e de regresso.
b) Calcule a estimativa da varincia de cada estimativa obtida em
(a).
c) Obtenha o intervalo com 95% de conana para cada uma das
estimativas obtida em (a).
d) Comente os resultados.
1.8.10 Para estimar o total de cabeas de gado em uma determinada regio, foi
selecionada aleatoriamente uma amostra de 24 fazendas dentre as 1.238
fazendas daquela regio. O nmero de cabeas de gado de cada fazenda
da amostra foi coletado (caracterstica y) e alm disso dispunha-se do
correspondente nmero de cabeas de gado obtido no ltimo Censo
Agropecurio. Usando como varivel auxiliar (x) a informao do
nmero de cabeas de gado coletado no ltimo censo e sabendo-se que:
24
P
i=1
y
i
= 13.646
24
P
i=1
x
i
= 13.638 s
2
y
= 256.154, 86
s
2
x
= 278.836, 89 s
xy
= 256.262, 02
a) Compare a ecincia do estimador de regresso em relao ao
estimador simples.
b) Compare a ecincia do estimador de regresso em relao ao
estimador de razo.
1.8.11 Uma amostra aleatria simples de 546 domiclios foi selecionada de
uma rea que continha 2097 domiclios. As caractersticas tamanho
do domiclio e idade do chefe foram investigadas em todo universo e
a varivel sexo do chefe do domiclio foi investigada apenas atravs da
amostra, fornecendo os seguintes resultados.
52 CAPTULO 1. ESTIMADORES ESPECIAIS
Nmero de domiclios no universo
Tamanho do Idade do chefe
domiclio 0 a 39 anos 40 e mais Total
1 a 3 moradores 303 464 767
4 e 5 moradores 426 339 765
6 e mais moradores 171 394 565
Total 900 1197 2097
Nmero de domiclios na amostra
Tamanho do Idade do chefe
domiclio 0 a 39 anos 40 e mais Total
1 a 3 moradores 103 154 257
4 e 5 moradores 120 80 200
6 e mais moradores 32 57 89
Total 255 291 546
Nmero de domiclios na amostra, cujo chefe mulher
Tamanho do Idade do chefe
domiclio 0 a 39 anos 40 e mais Total
1 a 3 moradores 1 8 9
4 e 5 moradores 1 3 4
6 e mais moradores 0 3 3
Total 2 14 16
Estimar o nmero de domiclios cujo chefe mulher
a) usando o estimador simples.
b) usando o estimador de ps-estraticao, considerando como ps-
estrato a varivel idade do chefe.
c) usando o estimador de ps-estraticao, considerando como ps-
estrato o tamanho do domiclio.
d) usando o estimador de ps-estraticao, considerando como ps-
estrato a varivel idade do chefe cruzada como tamanho do domiclio.
Captulo 2
Amostragem de Conglomerados
2.1 Conceituao Bsica
Oobjetivo pretendido coma aplicao da tcnica de amostragem a obteno
de estimativas para certos parmetros da populao a partir de uma amostra
de unidades dessa populao, cuja preciso seja conhecida e satisfatria.
As unidades dessa amostra podem ser obtidas selecionando-se direta-
mente unidades na populao com probabilidades conhecidas. Elas podem
ainda ser obtidas por um outro esquema de amostragem onde grupos de
unidades so selecionados com probabilidades conhecidas.
A amostragem de conglomerados (cluster sampling) consiste num es-
quema de amostragem em estgios, sendo que em cada estgio a unidade
amostral, para a qual atribuda a probabilidade de seleo, grupada em
um subconjunto (CONGLOMERADO) de unidades populacionais.
O termo unidade populacional usado para denotar um membro de uma
particular populao para a qual as anlises dos resultados do levantamento
so feitas.
1
A formao dos conglomerados pode ser:
- natural (exemplos: um cacho de uvas, uma turma de alunos, um edifcio,
um quarteiro, um municpio); ou
- articial, construdo pelo estatstico de acordo como objetivo da pesquisa
(exemplos: conglomerados de seis pessoas, de dez peas industriais do mesmo
tipo, de cinco domiclios do mesmo edifcio).
1
Nos esquemas de amostragem at ento apresentados (amostragem aleatria simp-
ples, amostragem estraticada e amostragem sistemtica) a unidade amostral era igual a
unidade de anlise.
53
54CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
A unidade populacional depende da anlise que est sendo feita e de-
terminada pelo propsito do levantamento e no pelo plano amostral. Pode
acontecer de mais de uma unidade populacional estar envolvida no levanta-
mento, quando por exemplo, caractersticas de domiclios e de pessoas so
investigadas no mesmo levantamento.
No h uma nica denio possvel para os conglomerados. Por exemplo,
a turma tanto pode ser uma unidade populacional (se estivermos interessados
em investigar o nmero de alunos por turma), como pode ser um conglom-
erado de alunos (se estivermos interessados em investigar o aproveitamento
dos alunos).
A m de exemplicar, seguem-se algumas ilustraes de possveis con-
glomerados associados com a populao, a varivel de interesse e a unidade
de referncia para anlise.
Populao Variveis de Unidade de Conglome-
Interesse Referncia rados
Turmas de Alunos por turma Turma Escolas
alunos
Estudantes de Aproveitamento Estudante Turmas
escolas de 2
o
grau dos estudantes
Visitantes de Facilidades do Visitante de Veculos que
parques parque parque entram no
nacionais nacional parque
Passageiros Propsito da Passageiro de Lotaes de
de avio Viagem avio passageiros
Domiclios Caractersticas Domiclio Setores
de domiclios
Moradores Caractersticas Morador de Domiclios
em favelas de pessoas favela em favelas
do Rio do Rio do Rio
Cabe lembrar que os vrios esquemas de amostragem: amostragem aleat-
ria simples (AAS), amostragem estraticada e amostragem sistemtica dis-
cutidos anteriormente podem ser aplicados a amostragem de conglomerados,
onde os conglomerados so as unidades amostrais.
2.2. AMOSTRAGEM DE REAS 55
2.2 Amostragem de reas
O cadastro ou marco de referncia a fonte de materiais que serve de guia e
permite identicar a populao a ser coberta para a seleo de amostras.
Os esquemas probabilsticos propostos para seleo de amostras pres-
supem a existncia de uma lista completa das unidades da populao a ser
pesquisada. Porm, uma lista pode no estar disponvel, ou estar desatual-
izada, ou o custo de preparar uma lista atualizada pode ser proibitivo. Alm
disso, uma amostra selecionada de uma populao dispersa geogracamente
provavelmente ser muito dispersa tambm.
Para reduzir custos muito freqente o uso de amostragem de conglom-
erados denidos por reas geogrcas com limites naturais ou articiais bem
denidos, Neste caso a amostra resultante pode ser concentrada dentro de
um nmero de reas geogrcas.
Portanto, a utilizao de amostras de reas se d quando no existe um
cadastro de boa qualidade disponvel e/ou quando a populao for muito
dispersa e o fator custo de deslocamento for preponderante. Neste caso a
necessidade de uma lista atualizada das unidades para as quais se requer a
informao restrita s reas que forem selecionadas para a amostra.
A grande vantagem da amostra de conglomerados a sua convenincia
operacional vinculada a possveis redues no custo.
Num levantamento de populao, por exemplo, operacionalmente mais
conveniente pesquisar todas as pessoas numa amostra de domiclios do que
selecionar o mesmo nmero de pessoas espalhadas por toda a populao ou
mesmo pesquisar todos os domiclios de uma amostra de reas (por exemplo,
setores) do que selecionar uma amostra do mesmo nmero de domiclios
selecionados aleatoriamente de uma lista de todos os domiclios. Tal lista
nem sempre disponvel e o seu preparo torna a pesquisa bem mais cara.
Suponha-se que uma AAS de n=400 domiclios deva ser selecionada de
uma populao de N=10.000 domiclios de uma cidade. Como no dispomos
de uma lista atualizada com todos os domiclios, optamos por uma amostra
de domiclios localizados dentro de uma amostra de quarteires. Isto pode
ser feito dividindo a rea toda da cidade em quarteires e selecionando 1/25
quarteires. A probabilidade de selecionar um domiclio na cidade a prob-
abilidade de selecionar um quarteiro, ou seja, 1/25=400/10.000.
Portanto, as unidades amostrais so quarteires selecionados de uma lista
completa. A seleo da amostra de quarteires determina a seleo dos
domiclios que esto localizados nos quarteires.
Mesmo se a lista de todos os domiclios fosse disponvel, consideraes na
reduo do custo pode ser observada na amostra de conglomerados. Pois a
56CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
localizao e identicao dos 400 domiclios espalhados aumentaria o custo
com gastos com transporte, bem como um maior tempo para a coleta em
comparao com a localizao dos quarteires e visita a todos os domiclios
nestes quarteires.
Mas para um dado tamanho de amostra, uma unidade menor em geral
d resultados mais precisos do que uma unidade maior.
Portanto, se compararmos uma amostra de conglomerados comuma amostra
de unidades elementares compreendida do mesmo nmero de elementos, em
geral na amostra de conglomerados tem-se:
- o custo por unidade elementar mais baixo, devido ao mais baixo custo
da listagem ou da localizao, ou de ambos;
- a varincia amostral mais alta dependendo da homogeneidade dos
elementos nos conglomerados.
Entretanto, levando em conta os aspectos operacionais e a reduo de
custos (devido ao possvel ganho no tempo de coleta, identicao, contato,
etc.) que a amostragem de conglomerados proporciona, em muitas situaes
prticas a perda na ecincia amostral balanceada com essas vantagens.
2.3 Conglomerados em 1 estgio
2.3.1 Probabilidades iguais de seleo
Denies bsicas e notao
Seja
N
a populao, com suas N unidades grupadas em M conglomerados
disjuntos. Seleciona-se uma amostra aleatria simples sem reposio de m
desses M conglomerados. As unidades de
N
pertencentes aos m conglom-
erados selecionados formam a amostra de conglomerados em 1 estgio de

N
(Ac1).
Se a caracterstica y observada nas unidades da amostra, tem-se uma
amostra de conglomerados em 1 estgio de y.
Pode-se representar esquematicamente a populao por:
C
1
C
2
C
M
U
11
Y
11
U
21
Y
21
. . . U
M1
Y
M1
U
12
Y
12
U
22
Y
22
. . . U
M2
Y
M2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
U
1N
1
Y
1N
1
U
2N
2
Y
2N
2
. . . U
MN
M
Y
MN
M
onde:
2.3. CONGLOMERADOS EM 1 ESTGIO 57
U
ij
a j-sima unidade de
N
no i-simo conglomerado C
i
;
i {1, 2, ..., M} e j {1, 2, ..., N
i
} ;
Y
ij
o valor da caracterstica y associada a U
ij
;
N
i
o tamanho do conglomerado C
i
;
M
P
i=1
N
i
= N
Selecionando-se atravs de amostragem aleatria simples sem reposio
m conglomerados dentre os M existentes, pode-se representar esquematica-
mente a amostra por:
C
0
1
C
0
2
C
0
m
U
0
11
Y
0
11
U
0
21
Y
0
21
. . . U
0
m1
Y
0
m1
U
0
12
Y
0
12
U
0
22
Y
0
22
. . . U
0
m2
Y
0
m2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
U
0
1N
0
1
Y
0
1N
0
1
U
0
2N
0
2
Y
0
2N
0
2
. . . U
0
mN
0
m
Y
0
mN
0
m
Note-se que como os conglomerados so selecionados por amostragem
aleatria simples:
C
0
i
pode ser qualquer um dos conglomerados C
1
, C
2
, , C
M
.
N
0
i
o tamanho do conglomerado selecionado C
0
i
e pode ser qualquer um
dos valores N
1
, N
2
, , N
M
.
Consequentemente os Y
0
ij
(i = 1, 2, ..., m e j = 1, 2, ..., N
0
i
) e os N
0
i
(i = 1, 2, ..., m) so variveis aleatrias.
A amostra constituda pelas unidades:
n
U
0
11
, ..., U
0
1N
0
1
; ...; U
0
m1
, ..., U
0
mN
0
m
o
e os valores da caracterstica y associados s unidades da amostra so:
n
Y
0
11
, ..., Y
0
1N
0
1
; ...; Y
0
m1
, ..., Y
0
mN
0
m
o
O tamanho total da amostra : n =
m
P
i=1
N
0
i
que uma varivel aleatria,
cujos valores dependem dos conglomerados selecionados.
Pode-se calcular o valor esperado de n, n que ser dado por:
n = E

m
X
i=1
N
0
i
!
=
m
X
i=1
E(N
0
i
) = m
M
P
i=1
N
i
M
= m
N
M
=
m
M
N = f
1
N
58CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
sendo: f
1
=
m
M
, a frao de amostragem do primeiro estgio.
A gura 2.1 apresenta uma ilustrao da seleo das unidades de uma
amostra de conglomerados em 1 estgio.
Figura 2.1: Ilustrao da seleo das unidades de uma Ac1
Aamostragemde conglomerados em1 estgio caracterizada pelos seguintes
fatos:
Pertencem amostra todas as unidades dos conglomerados seleciona-
dos.
S necessrio listar as unidades da populao nos m conglomera-
dos selecionados para a amostra. Isto acarreta evicente economia de
tempo e custo quando comparado amostragem aleatria simples ou
amostragem estraticada, nas quais so listadas todas as unidades da
populao.
O tamanho da amostra no pode ser exatamente prexado, pois de-
pender dos conglomerados selecionados.
Cada unidade da populao tem a mesma probabilidade de participar
da amostra, e esta probabilidade igual frao de amostragem no
primeiro estgio
m
M
.
Mais adiante se ver que em muitas ocasies, a preciso da amostragem
de conglomerados inferior preciso da amostragem aleatria simples.
2.3. CONGLOMERADOS EM 1 ESTGIO 59
Entretanto, a vantagem do menor custo e tempo pode compensar a
perda de preciso.
Parmetros da caracterstica y
Total da caracterstica y no conglomerado C
i
:
Y
i
=
N
i
X
j=1
Y
ij
Mdia da caracterstica y no conglomerado C
i
:
Y
i
=
Y
i
N
i
Varincia da caracterstica y em C
i
:
S
2
i
=
1
N
i
1
N
i
X
j=1
(Y
ij
Y
i
)
2
Total da caracterstica y em toda populao:
Y =
M
X
i=1
Y
i
Mdia da caracterstica y por unidade da populao:
Y =
Y
N
Mdia da caracterstica y por conglomerado:
Y =
Y
M
Varincia da caracterstica y em toda populao:
S
2
=
1
N 1
M
X
i=1
N
i
X
j=1
(Y
ij
Y )
2
60CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Estatsticas da amostra em cada conglomerado selecionado
Como resultado da amostragem de conglomerados tem-se as seguintes es-
tatsticas:
Total da caracterstica y no i-simo conglomerado selecionado C
0
i
:
Y
0
i
=
N
0
i
X
j=1
Y
0
ij
Mdia da caracterstica y no conglomerado C
0
i
:
Y
0
i
=
Y
0
i
N
0
i
Varincia da caracterstica y em C
0
i
:
S
0
2
i
=
1
N
0
i
1
N
0
i
X
j=1
(Y
0
ij
Y
0
i
)
2
Estimadores do total e da mdia na Ac1
Quando os conglomerados so selecionados por amostragem aleatria simples
sem reposio, um estimador no viciado do total Y dado por:
b
Y
Ac1
=
M
m
m
X
i=1
Y
0
i
Prova:
E(
b
Y
Ac1
) =
M
m
m
X
i=1
E(Y
0
i
) =
M
m
m
X
i=1
E(Y
0
i
)
=
M
m
m
X
i=1
1
M

M
X
k=1
Y
k
!
=
M
m
m
M

M
X
k=1
Y
k
!
=
M
X
k=1
Y
k
= Y
Conseqentemente, um estimador no viciado de Y , mdia por unidade
da populao, dado por:
y
Ac1
=
b
Y
Ac1
N
=
1
N
M
m
m
X
i=1
Y
0
i
=
1
mN
m
X
i=1
Y
0
i
2.3. CONGLOMERADOS EM 1 ESTGIO 61
onde: N =
N
M
o tamanho mdio por conglomerado.
E

y
Ac1

= E

b
Y
Ac1
N
!
=
1
N
E

b
Y
Ac1

=
1
N
Y = Y
E um estimador no viciado de Y , mdia por conglomerado dado por:
y
Ac1
=
b
Y
Ac1
M
=
1
m
m
X
i=1
Y
0
i
E(y
Ac1
) = E

b
Y
Ac1
M
!
=
1
M
E

b
Y
Ac1

=
Y
M
= Y
62CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Varincias dos estimadores do total e da mdia na Ac1
V (
b
Y
Ac1
) = V

M
m
m
X
i=1
Y
0
i
!
= E

M
m
m
X
i=1
Y
0
i
Y
!
2
= E
_

_
_
_
_
_
M
m
P
i=1
Y
0
i
mY
m
_
_
_
_
_

_
2
= E
_
_
M
2
m
2

m
X
i=1
Y
0
i
mY
!
2
_
_
=
M
2
m
2
E
_
_

m
X
i=1
Y
0
i
mY
!
2
_
_
=
M
2
m
2
E
_
_

m
X
i=1

Y
0
i
Y

!
2
_
_
=
M
2
m
2
E
_

_
m
X
i=1

Y
0
i
Y

2
+
m
X
i=1
m
X
k=1
i6=k

Y
0
i
Y

Y
0
k
Y

_
=
M
2
m
2
_

_
m
X
i=1
E

Y
0
i
Y

2
+
m
X
i=1
m
X
k=1
i6=k
E

Y
0
i
Y

Y
0
k
Y

_
=
M
2
m
2
_

_
m
M
M
X
i=1

Y
i
Y

2
+
m(m1)
M(M 1)
M
X
i=1
M
X
k=1
i6=k

Y
0
i
Y

Y
0
k
Y

_
=
M
m
_

_
M
X
i=1

Y
i
Y

2
+
(m1)
(M 1)
M
X
i=1
M
X
k=1
i6=k

Y
0
i
Y

Y
0
k
Y

_
fazendo:
S
2
e
=
1
M 1
M
X
i=1

Y
i
Y

2
2.3. CONGLOMERADOS EM 1 ESTGIO 63
e notando que:
0 =
M
X
i=1

Y
i
Y

M
X
i=1

Y
i
Y

!
2
=
M
X
i=1

Y
i
Y

2
+
M
X
i=1
M
X
k=1
i6=k

Y
i
Y

Y
k
Y

=
M
X
i=1
M
X
k=1
i6=k

Y
i
Y

Y
k
Y

=
M
X
i=1

Y
i
Y

2
Segue-se que:
V (
b
Y
Ac1
) =
M
m
"
(M 1) S
2
e

(m1)
(M 1)
M
X
i=1

Y
i
Y

2
#
=
M
m

(M 1) S
2
e
(m1) S
2
e

=
M(M m)
m
S
2
e
=
M
2
(M m)
M
S
2
e
m
Observe que a varincia do estimador
b
Y
Ac1
depende somente da frao
de amostragem do primeiro estgio e da variabilidade entre os totais dos
conglomerados. Em termos de expresso, a varincia de
b
Y
Ac1
idntica
varincia do estimador de total com amostragem aleatria simples.
Estimador da varincia do estimador de total na Ac1
Agora que se conhece a expresso da varincia do estimador
b
Y
Ac1
, trata-se da
obteno de um estimador para essa varincia. Isto feito usando a teoria j
conhecida da amostragem aleatria simples e supondo que os conglomerados
so as unidades investigadas.
Assim,
s
2
e
=
1
m1
m
X
i=1
(Y
0
i
y
Ac1
)
2
deve ser um estimador no viciado de S
2
e
.
64CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Para vericar este fato, note-se que:
s
2
e
=
1
m1
m
X
i=1
(Y
0
i
y
Ac1
)
2
=
1
m1
m
X
i=1

Y
0
i
Y ) (y
Ac1
Y

2
=
1
m1
m
X
i=1

Y
0
i
Y )
2
2(y
Ac1
Y

(Y
0
i
Y ) + (y
Ac1
Y )
2

=
1
m1
"
m
X
i=1
(Y
0
i
Y )
2
+
m
X
i=1
(y
Ac1
Y )
2
2(y
Ac1
Y )
m
X
i=1
(Y
0
i
Y )
#
s
2
e
=
1
m1
"
m
X
i=1
(Y
0
i
Y )
2
+m(y
Ac1
Y )
2
2m(y
Ac1
Y )
2
#
=
1
m1
"
m
X
i=1
(Y
0
i
Y )
2
m(y
Ac1
Y )
2
#
da pode-se obter:
E(s
2
e
) = E
(
1
m1
"
m
X
i=1
(Y
0
i
Y )
2
m(y
Ac1
Y )
2
#)
=
1
m1
(
m
X
i=1
E(Y
0
i
Y )
2
mE(y
Ac1
Y )
2
)
=
1
m1
(
m
M
M
X
i=1
(Y
i
Y )
2
mV (y
Ac1
)
)
=
1
m1

m
M
(M 1) S
2
e
m
(M m)
M
S
2
e
m

=
m
M
1
m1

M S
2
e
S
2
e
(M m)
S
2
e
m

=
m
M
1
m1
M(1
1
m
) S
2
e
=
m
M
1
m1
M(
m1
m
) S
2
e
= S
2
e
Conseqentemente, um estimador no viciado para V (
b
Y
Ac1
) dado por:
v(
b
Y
Ac1
) =
M
2
(M m)
M
s
2
e
m
2.3. CONGLOMERADOS EM 1 ESTGIO 65
2.3.2 Estimao de propores na Ac1
Considere-se a populao dividida em 2 classes A e
e
A (no A), de acordo
com algum atributo associado s unidades da populao
N
.
Ento, se a populao grupada em M conglomerados disjuntos, cada
conglomerado pode ser dividido nas classes A e
e
A.
Denindo uma caracterstica y tal que:
Y
ij
=
_
_
_
1 se U
ij
A
0 se U
ij
A
i = 1, 2, , M e j = 1, 2, , N
i
Sejam A
i
e
e
A
i
o nmero de unidades de
N
em A e
e
A, respectivamente,
no conglomerado i.
A
i
pode assumir os valores 0, 1, 2, , N
i
e se tem:
A
i
+
e
A
i
= N
i
Segue-se que:
A
i
= Y
i
=
N
i
P
j=1
Y
ij
o nmero de unidades em A, do conglomerado i;
P
Ai
=
A
i
N
i
=
Y
i
N
i
= Y
i
a proporo de unidades em A, do conglomerado
i.
Assim, a proporo global de unidades em A na populao
N
dada
por:
P
A
=
M
P
i=1
A
i
M
P
i=1
N
i
=
M
P
i=1
Y
i
M
P
i=1
N
i
=
Y
N
= Y
ou ainda,
P
A
=
M
P
i=1
A
i
N
=
M
X
i=1
N
i
N
P
Ai
Em vista dessas expresses, e considerando a teoria j apresentada para
obteno dos parmetros de
N
, imediata a obteno de estimadores no
viciados para a proporo P
A
:
p
Ac1
=
M
m
m
X
i=1
N
0
i
N
P
0
Ai
=
1
mN
m
X
i=1
N
0
i
P
0
Ai
=
1
mN
m
X
i=1
A
0
i
66CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
onde:
A
0
i
= Y
0
i
=
N
0
i
P
i=1
Y
0
ij
o nmero de unidades em A, do i-simo conglomerado
selecionado;
P
0
Ai
=
A
0
i
N
0
i
=
Y
0
i
N
0
i
= Y
0
i
a proporo de unidades em A, do i-simo
conglomerado selecionado.
Alm disto, a varincia de p
Ac1
dada por:
V (p
Ac1
) =
M m
M
S
2
e
m
=
1
N
2
M m
M
S
2
e
m
onde:
S
2
e
=
1
M 1
M
X
i=1

Y
i
N
P
A

2
=
1
M 1
M
X
i=1
1
N
2

N
i
P
Ai
NP
A

2
=
1
M 1
1
N
2
M
X
i=1

N
2
i
P
2
Ai
2NN
i
P
Ai
P
A
+N
2
P
2
A

=
1
N
2
1
M 1
(
M
X
i=1
N
2
i
P
2
Ai
2NP
A
M
X
i=1
N
i
P
Ai
+
M
X
i=1
N
2
P
2
A
)
=
1
N
2
1
M 1
(
M
X
i=1
N
2
i
P
2
Ai
2NP
A
NP
A
+MN
2
P
2
A
)
=
1
N
2
1
M 1
(
M
X
i=1
N
2
i
P
2
Ai
MN
2
P
2
A
)
=
1
N
2
1
M 1
(
M
X
i=1
Y
2
i
M
N
2
M
2
P
2
A
)
=
1
N
2
1
M 1
(
M
X
i=1
Y
2
i
M
Y
2
M
2
)
=
1
N
2
1
M 1
(
M
X
i=1
Y
2
i
MY
2
)
=
1
N
2
1
M 1
M
X
i=1

Y
i
Y

2
=
1
N
2
S
2
e
Esta varincia pode ser estimada por:
v(p
Ac1
) =
M m
M
s
2
e
m
=
1
N
2
M m
M
s
2
e
m
com:
s
2
e
=
1
m1
m
X
i=1

Y
0
i
N
p
Ac1

2
2.3. CONGLOMERADOS EM 1 ESTGIO 67
e
s
2
e
=
1
m1
m
X
i=1

Y
0
i

1
m
m
X
i=1
Y
0
i
!
2
mas:
s
2
e
=
1
N
2
(m1)
m
X
i=1

Y
0
i
N p
Ac1

2
=
1
N
2
(m1)
m
X
i=1

Y
0
i

N
mN
m
X
i=1
Y
0
i
!
2
=
1
N
2
(m1)
m
X
i=1

Y
0
i

1
m
m
X
i=1
Y
0
i
!
2
=
1
N
2
(m1)
_
_
m
X
i=1
Y
02
i

1
m

m
X
i=1
Y
0
i
!
2
_
_
=
1
N
2
s
2
e
conseqentemente:
v(p
Ac1
) =
1
N
2
M m
M
1
m
1
(m1)
_
_
m
X
i=1
Y
02
i

1
m

m
X
i=1
Y
0
i
!
2
_
_
Exemplo 2.1
Com o objetivo de avaliar a proporo de fumantes, entre os alunos da 3
a
srie do 2
o
grau da rede de ensino publico de certa localidade, foram formados
conglomerados a partir de uma relao de 3500 turmas existentes, grupando-
se cada 5 turmas em aproximadamente 150 alunos, supondo uma base de 30
alunos por turma.
Uma amostra de 10 conglomerados foi selecionada, observando-se:
68CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Conglomerados Nmero de Nmero de alunos
da amostra alunos (N
0
i
) fumantes (A
0
i
)
1 162 50
2 170 63
3 145 47
4 151 48
5 166 68
6 162 59
7 145 36
8 148 45
9 171 71
10 178 75
Soma 1592 562
M = 700, N = 150 e m = 10
Uma estimativa da proporo de alunos fumantes dada por:
p
Ac1
=
1
mN
m
X
i=1
A
0
i
=
1
10 (150)
562 = 0, 375 ou 37, 5%
Uma estimativa da varincia dada por:
v(p
Ac1
) =
1
N
2
M m
M
s
2
e
m
sendo:
s
2
e
=
1
m1
_
_
m
X
i=1
A
02
i

1
m

m
X
i=1
A
0
i
!
2
_
_
=
1
9

33074
(562)
2
10
!
= 165, 51
ento:
v(p
Ac1
) =
1
N
2
M m
M
s
2
e
m
=
1
(150)
2
700 10
700
165, 51
10
= 0, 000725
Uma estimativa do erro padro dada por:
p
v(p
Ac1
) =
p
0, 000725 = 0, 0269 = 2, 69%
2.3. CONGLOMERADOS EM 1 ESTGIO 69
e uma estimativa do coeciente de variao pode ser obtida atravs da ex-
presso:
cv(p
Ac1
) =
p
v(p
Ac1
)
p
Ac1
cv(p
Ac1
) =

0, 000725
0, 375
= 0, 0717 = 7, 17%
2.3.3 Coeciente de Correlao Intraclasse
O objetivo neste item comparar a ecincia da amostragem por conglo-
merados com a da amostragem aleatria simples. Inicialmente, ser estudado
o caso em que os conglomerados so de tamanhos iguais. Ocorre que para
comparar a preciso da amostragem de conglomerados em 1 estgio com a
amostrgem aleatria simples muito til a introduo do coeciente de
correlao intraclasse.
Seja a populao
N
distribuda em M conglomerados de tamanho N =
N
M
cada um.
Imagine o seguinte experimento aleatrio:
Seleciona-se aleatoriamente 1 entre os M conglomerados.
Seleciona-se aleatoriamente sem reposio 2 unidades dentro deste con-
glomerado.
Sejam Y
0
ij
e Y
0
ik
as variveis aleatrias resultantes da observao nas 2
unidades selecionadas da caracterstica y.
possvel calcular a correlao entre essas 2 variveis aleatrias:
(Y
0
ij
, Y
0
ik
) =
E

Y
0
ij
E(Y
0
ij
)

(Y
0
ik
E(Y
0
ik
))

r
E
h

Y
0
ij
E(Y
0
ij
)

2
i
E

(Y
0
ik
E(Y
0
ik
))
2

Agora, notando que:


E(Y
0
ij
) =
M
X
i=1
1
M
N
X
j=1
1
N
Y
ij
=
1
M N
M
X
i=1
N
X
j=1
Y
ij
= Y
E(Y
0
ik
) = Y
E
h

Y
0
ij
E(Y
0
ij
)

2
i
=
M
X
i=1
N
X
j=1
1
M N

Y
ij
Y

2
=
MN 1
M N
S
2
70CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
S
2
=
1
MN 1
M
X
i=1
N
X
j=1

Y
ij
Y

2
Donde tambm:
E
h
(Y
0
ik
E(Y
0
ik
))
2
i
=
MN 1
M N
S
2
Finalmente:
E

Y
0
ij
E(Y
0
ij
)

(Y
0
ik
E(Y
0
ik
))

=
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y

Y
ik
Y

M N

N 1

Logo, esta correlao ser:


(Y
0
ij
, Y
0
ik
) =
1
M N

N 1

M
P
i=1
N
P
j=1
N
P
k=1
j6=k

Y
ij
Y

Y
ik
Y

MN 1
M N
S
2
Esta correlao expressa uma medida de homogeneidade dentro dos con-
glomerados da populao, e ser denominada coeciente de correlao
intraclasse e denotada por :
= (Y
0
ij
, Y
0
ik
) =
1
M N

N 1

M
P
i=1
N
P
j=1
N
P
k=1
j6=k

Y
ij
Y

Y
ik
Y

MN 1
M N
S
2
Agora ser tratado o problema de obter uma expresso adequada para o
coeciente de correlao intraclasse, que permita visualizar este coeciente
como uma medida de homogeneidade dentro dos conglomerasdos.
Note-se que:
=
1
M N

N 1

M
P
i=1
N
P
j=1
N
P
k=1
j6=k

Y
ij
Y

Y
ik
Y

MN 1
M N
S
2
2.3. CONGLOMERADOS EM 1 ESTGIO 71
Ento pode-se escrever:
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y

Y
ik
Y

=
=
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y
i
+Y
i
Y

Y
ik
Y
i
+Y
i
Y

=
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y
i

(Y
ik
Y
i
) +

Y
i
Y

=
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y
i

(Y
ik
Y
i
) +N(N 1)
M
X
i=1

Y
i
Y

2
=
M
X
i=1
_
_
N
X
j=1

Y
ij
Y
i

_
_
2

M
X
i=1
N
X
j=1

Y
ij
Y
i

2
+N(N 1)
M
X
i=1

Y
i
Y

2
Note que:
N
X
j=1

Y
ij
Y
i

= 0
Lembrando que:
S
2
i
=
1
N 1
N
X
j=1

Y
ij
Y
i

2
e fazendo:
S
2
d
=
1
M
M
X
i=1
S
2
i
Segue-se que:
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y

Y
ik
Y

=
M
X
i=1

N 1

S
2
i
+N(N1)
M
X
i=1

Y
i
Y

2
72CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Como tambm:
S
2
e
=
1
M 1
M
X
i=1

Y
i
Y

2
vem:
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y

Y
ik
Y

=

N 1

M S
2
d
+N(N1) (M 1) S
2
e
Assim pode-se escrever:
=
1
M N

N 1

h
N(N 1) (M 1) S
2
e

N 1

M S
2
d
i
MN 1
M N
S
2
=
(M 1) S
2
e
M

1
N
S
2
d
MN 1
M N
S
2
Se o nmero de conglomerados M for grande, vem:

=
S
2
e

1
N
S
2
d
S
2
Para compreender melhor o signicado desta expresso, deve-se notar que:

MN 1

S
2
=
M
X
i=1
N
X
j=1

Y
ij
Y

2
=
M
X
i=1
N
X
j=1

Y
ij
Y
i
+Y
i
Y

MN 1

S
2
=
M
X
i=1
N
X
j=1
h
(Y
ij
Y
i
)
2
+ 2(Y
ij
Y
i
)(Y
i
Y ) + (Y
i
Y )
2
i
=
M
X
i=1
N
X
j=1
(Y
ij
Y
i
)
2
+ 2
M
X
i=1
(Y
i
Y )
N
X
j=1
(Y
ij
Y
i
) +N
M
X
i=1
(Y
i
Y )
2
=
M
X
i=1
(N 1)S
2
i
+N
M
X
i=1
(Y
i
Y )
2
= (N 1) M S
2
d
+N (M 1) S
2
e
2.3. CONGLOMERADOS EM 1 ESTGIO 73
ou seja:
S
2
=
(N 1) M S
2
d
+N (M 1) S
2
e

MN 1

Assim estamos agora em posio para analisar melhor a inuncia na


variao de da maior homogeneidade dos conglomerados.
Supondo que os conglomerados fossem homogneos devemos ter:
S
2
d
= 0
portanto:
=
(M 1) S
2
e
M

1
N
S
2
d
MN 1
M N
S
2
=
(M 1) S
2
e
M
N (M 1) S
2
e
M N
= 1
Logo, quando h homogeneidade mxima dentro dos conglomerados =
= 1.
Por outro lado, se h heterogeneidade dentro dos conglomerados com
homogeneidade entre eles, o valor de deve diminuir. Se admitirmos que
S
2
e
= 0 vem:

MN 1

S
2
= (N 1) M S
2
d
donde:
=

1
N
S
2
d
(N 1) M S
2
d
M N
=
1
(N 1)
Logo, conclui-se que:

1
(N 1)
; 1

Assim uma medida de homogeneidade ou heterogeneidade dentro dos


conglomerados.
Exemplo 2.2
74CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Seja uma populao com exatamente 6 unidades.
U
1
U
2
U
3
U
4
U
5
U
6

Y
1
Y
2
Y
3
Y
4
Y
5
Y
6
q q q q q q
3 5 3 7 2 8
Essas unidades sero grupadas em 2 conglomerados para o clculo do co-
eciente de correlao intraclasse. A conglomerao ser feita de de 2 modos
diferentes a m de medir a variao do coeciente de correlao intraclasse
em funo da maior ou menor homogeneidade dos conglomerados.
1
a
tentativa: conglomerados homogneos
C
1
C
2
U
1
3 U
2
5
U
3
3 U
4
7
U
5
2 U
6
8
M = 2 N = 3 Y
1
= 2, 66667 Y
2
= 6, 66667 Y = 4, 66667
S
2
d
=
1
2
(0, 3333 + 2, 3333) = 1, 3333 S
2
e
= 4 + 4 = 8
=
(M 1) S
2
e
M

1
N
S
2
d
M(N 1) S
2
d
+N (M 1) S
2
e
M N
=
3, 5556
4, 8889
= 0, 7273
2
a
tentativa: conglomerados heterogneos
C
1
C
2
U
2
5 U
1
3
U
5
2 U
3
3
U
6
8 U
4
7
M = 2 N = 3 Y
1
= 5, 0000 Y
2
= 4, 3333 Y = 4, 66667
S
2
d
=
1
2
(9+5, 3333) = 7, 16667 S
2
e
= 0, 1111+0, 1111 = 0, 2222
=
(M 1) S
2
e
M

1
N
S
2
d
M(N 1) S
2
d
+N (M 1) S
2
e
M N
=
2, 2778
4, 8889
= 0, 4659
2.3. CONGLOMERADOS EM 1 ESTGIO 75
Note-se que:
1
N 1
=
1
2
= 0, 50
Portanto, est bem prximo do valor mnimo que pode assumir, indi-
cando alto grau de heterogeneidade.
2.3.4 Estimao do coeciente de correlao intraclasse
Um problema que falta solucionar o da estimao do coeciente de corre-
lao intraclasse atravs de uma amostra de conglomerados.
Para tanto, basta considerar a expresso de :
=
(M 1) S
2
e
M

1
N
S
2
d
M(N 1) S
2
d
+N (M 1) S
2
e
M N
Agora, lembrando que:
s
2
e
=
1
m1
m
X
i=1

Y
0
i
y
Ac1

2
um estimador no viciado para S
2
e
, e notando que:
s
2
d
=
1
m
m
X
i=1
S
0
2
i
um estimador no viciado para S
2
d
, basta substituir estes estimadores na
expresso de para obter um estimador consistente para .
b
=
(M 1) s
2
e
M

1
N
s
2
d
M(N 1) s
2
d
+N (M 1) s
2
e
M N
Alm disso, notando-se que:
MN 1
M N
S
2
=
M(N 1) S
2
d
+N (M 1) S
2
e
M N
Segue-se que um estimador no viciado para S
2
dado por:
s
2
=
M(N 1) s
2
d
+N (M 1) s
2
e
MN 1
76CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
e conseqentemente, que
b
pode ser escrito:
b
=
(M 1) s
2
e
M

1
N
s
2
d
MN 1
M N
s
2
ou ainda, para M muito grande:
b


=
s
2
e

1
N
s
2
d
s
2
Exemplo 2.3 (Nascimento (1981), pg.32)
Tem-se um chrio de 20.000 segurados de uma Companhia de Seguros,
em um plano A. As 20.000 chas esto dispostas em 400 gavetas, com 50
chas cada.
Considerando as gavetas como conglomerados, tem-se:
M = 400 e N = 50
Selecionou-se uma amostra aleatria sem reposio de 10 gavetas, correspon-
dendo a 500 chas. Nas gavetas selecionadas foram calculadas as reservas
tcnicas de todas as chas, obtendo-se:
Gavetas da Reserva Varincia das
amostra total (Y
0
i
) reservas (S
02
i
)
1 321 25
2 170 17
3 610 30
4 405 32
5 350 35
6 155 20
7 254 40
8 328 18
9 652 25
10 269 35
Soma 3.514 277
O objetivo estimar a mdia por cha da reserva tcnica do plano A e o
coeciente de correlao intraclasse.
Estimativa de Y
y
Ac1
=
1
mN
m
X
i=1
Y
0
i
=
3.514
10 (50)
= 7, 028
2.3. CONGLOMERADOS EM 1 ESTGIO 77
Estimativa de S
2
d
s
2
d
=
1
m
m
X
i=1
S
0
2
i
=
277
10
= 27, 7
Estimativa de S
2
e
s
2
e
=
1
m1
1
N
2
m
X
i=1
(Y
0
i
y
Ac1
)
2
=
1
m1
1
N
2
_

_
m
X
i=1
Y
02
i

m
P
i=1
Y
0
i

2
m
_

_
=
1
9 (50)
2
"
1.484.156
(3.514)
2
10
#
= 11, 082
Estimativa de S
2
s
2
=
M(N 1) s
2
d
+N (M 1) s
2
e
M N 1
=
400(50 1) (27, 7) + 50 (399) (11, 082)
20.000 1
= 38, 20
Estimativa do coeciente de correlao intraclasse
b

=
s
2
e

1
N
s
2
d
s
2
=
11, 0832 0, 554
38, 20
= 0, 276
2.3.5 Ecincia da Ac1 em relao AAS com con-
glomerados de tamanhos iguais
Para comparar a preciso de um estimador, obtido atravs de um plano
amostral proveniente de uma amostra de conglomerados em 1 estgio (Ac1),
com a de outro estimador, obtido atravs de uma amostra aleatria simples
(AAS), vamos denir uma medida de ecincia baseada nas varincias dos
estimadores de Y com os dois desenhos. Assim:
Ef =
V (y
AAS
)
V (y
Ac1
)
78CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
onde:
y o estimador de Y na AAS; e
y
Ac1
o estimador de Y na Ac1.
A ecincia Ef > 1 se V (y
Ac1
) < V (y
AAS
).
Mas:
V (y
Ac1
) =
M m
M
1
N
2
S
2
e
m
e:
V (y
AAS
) =
N n
N
S
2
n
aqui N = MN
onde:
S
2
e
=
1
M 1
M
X
i=1

Y
i
Y

2
S
2
=
1
M N 1
M
X
i=1
N
X
j=1

Y
ij
Y

2
sob a hiptese de conglomerados de tamanhos iguais.
Supondo que todos os conglomerados tenham o mesmo tamanho N, o
tamanho n da AAS equivalente Ac1 com m conglomerados na amostra
dado por : n = mN.
Assim, pode-se escrever:
V (y
AAS
) =
MN mN
MN
S
2
mN
=
M m
M
S
2
mN
logo, tem-se:
Ef =
M m
M
S
2
mN
M m
M
1
N
2
S
2
e
m
=
N S
2
S
2
e
Agora, notando que:
2.3. CONGLOMERADOS EM 1 ESTGIO 79
M
X
i=1

Y
i
Y

2
=
M
X
i=1
_
_
N
X
j=1
Y
ij
N Y
_
_
2
=
M
X
i=1
N
X
j=1

Y
ij
Y

2
+
M
X
i=1
N
X
j=1
N
X
k=1
j6=k

Y
ij
Y

Y
ik
Y

=

M N 1

S
2
+

N 1

MN 1

S
2

como:
M
X
i=1

Y
i
Y

2
= (M 1) S
2
e
vem:
S
2
e
=
M N 1
M 1
S
2
+
M N 1
M 1

N 1

S
2

=
M N 1
M 1
S
2

1 +

N 1

Da segue-se que:
Ef =
N S
2
M N 1
M 1
S
2

1 +

N 1

supondo: M 1

= M e MN 1

= MN vem:
Ef

=
1
1 +

N 1


Ef > 1 1 +

N 1

< 1

N 1

< 0 < 0
O termo

1 +

N 1

mostra quanto a varincia afetada pelo uso


de conglomerado ao invs de um elemento como unidade amostral. Kish
(1965) dene este fator como o efeito de desenho de uma amostra de
conglomerados de tamanho N ou efeito de conglomerao. Este fator
mede a inuncia da conglomerao na preciso do estimador.
Portanto:
Se > 0 Ef < 1 ento V (y
Ac1
) > V (y
AAS
), a amostra de conglomerados
menos eciente que a AAS.
80CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Se = 0 Ef = 1 ento V (y
Ac1
) = V (y
AAS
), a amostra de conglomerados
equivalente a AAS.
Se < 0 Ef > 1 ento V (y
Ac1
) < V (y
AAS
), a amostra de conglomerados
mais eciente que a AAS.
Como

1
(N 1)
; 1

, isto indica que os valores negativos de so


raros, uma vez que lim
N+

1
(N 1)

= 0, isto , medida que o


tamanho N cresce, diminui a ecincia da Ac1 em relao AAS.
Lembrando que:
Ef =
V (y
AAS
)
V (y
Ac1
)

=
1
1 +

N 1


vem:
Ef

1
N
; +

e
V (y
Ac1
)

= V (y
AAS
)

1 +

N 1

isto , a varincia do estimador da mdia na Ac1 a varincia do estimador


da mdia na AAS vezes o fator

1 +

N 1

.
Para o caso de conglomerados de mesmo tamanho, se estivermos inte-
ressados na mesma preciso, qual dever ser o tamanho da amostra de con-
glomerados?
V (y
Ac1
) equivale a V (y
AAS
) quando:
V (y
Ac1
)

1 +

N 1


= V (y
AAS
)
ou seja, quando:
1
N
2
S
2
e
m

1 +

N 1


=
S
2
mN
S
2
e
m

1 +

N 1


=
S
2
mN
o que implica que o nmero de conglomerados na amostra equivale a
m

1 +

N 1

2.3. CONGLOMERADOS EM 1 ESTGIO 81


e, portanto, haver umacrscimo de

N 1

conglomerados na amostra.
Conseqentemente, o nmero de unidades populacionais na amostra equivale
a:
m

1 +

N 1

N = mN +mN

N 1


ou seja, haver um acrscimo de

mN

N 1

unidades em relao a
AAS sem reposio.
Exemplo 2.4 (Nascimento (1981), pg. 34)
Considere as informaes do exemplo 2.3 e calcule o nmero de conglom-
erados necessrios na amostra, para dar a mesma preciso de uma amostra
aleatria simples ao estimar a mdia por cha da reserva tcnica do plano A.
Nesste caso, o efeito de conglomerao :
1 +

N 1

= 1 + 49 (0, 276) = 14, 524


O tamanho da amostra de conglomerados para dar a mesma preciso de
uma amostra aleatria simples :
m

1 +

N 1

= 10 (14, 524)

= 145 conglomerados
O elevado efeito de conglomerao, mostra que o desenho amostral de
conglomerados em 1 estgio que considera a gaveta com 50 chas como con-
glomerado pouco eciente.
Ilustraes
A seguir, so apresentadas algumas ilustraes para mostrar que mede
homogeneidade e como afeta a varincia por unidades amostrais elementares
ou por conglomerados.
a) Suponha que se deseja analisar a composio da populao em relao
a renda e que o conglomerado seja o setor censitrio. Suponha que a
maioria das pessoas em certos setores tm uma renda alta e a maioria
das pessoas em outros setores tm renda baixa. Neste caso a varincia
entre as mdias dos setores ser relativamente grande e a correlao en-
tre as pessoas dentro do setor ser alta e positiva. Assim uma amostra
aleatria simples de setores consistindo de todas pessoas dos setores
dar pouca informao com relao composio da renda da popu-
lao.
b) Agora, um caso extremo onde a composio da renda exatamente
a mesma em cada setor. Neste caso, a varincia entre as mdias dos
setores ser zero e a correlao entre as pessoas de mesmo setor ser
negativa. Neste caso, uma amostra aleatoria simples de setores con-
sistindo de todas as pessoas no setor daria uma completa informao
com relao composio da renda da populao.
82CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
c) Finalmente, suponha que a composio da renda dira de setor para
setor e que a varincia entre as mdias dos setores seja aproximada-
mente a varincia entre as mdias amostrais baseada numa amostra
aleatria simples. A correlao entre as pessoas de um mesmo setor
ser nula. Uma amostra aleatria de setores consistindo de todas as
pessoas no setor daria informaes com respeito composio da renda
da populao da mesma forma que uma amostra aleatria simples de
mesmo tamanho selecionada sem considerar o conglomerado setor.
Em geral, os conglomerados so denidos por populaes geogrcas con-
tiguas.
O coeciente de correlao em geral positivo e diminui com o aumento
do tamanho do conglomerado, pois se as unidades includas na amostra so
poucas e imediatamente contiguas, haver uma correlao mais alta entre as
unidades dentro de um conglomerado do que quando os conglomerados so
maiores e h portanto, um maior espalhamento entre as unidades dentro do
conglomerado.
2.4 Controle na variao de tamanho
Observe que a V (
b
Y
Ac1
) =
M
2
(M m)
M
S
2
e
m
aumenta e a Ef =
N S
2
S
2
e
diminui
quando S
2
e
aumenta. Mas de acordo com a expresso:
S
2
e
=
1
M 1
M
X
i=1

Y
i
Y

2
o aumento de S
2
e
tanto maior quanto mais diferentes forem os totais dos
conglomerados. Em geral, os totais de uma caracterstica y tendem a crescer
quando os tamanhos dos conglomerados crescem. Ento, usual controlar a
variao de tamanho dos conglomerados na expectativa de reduo da varin-
cia e de aumento da ecincia com o uso da amostragem de conglomerados.
Os processos usuais de controle do tamanho dos conglomerados so:
a) selecionar os conglomerados comprobabilidades proporcionais ao tamanho
dos conglomerados;
b) estraticar os conglomerados, de modo que a caracterstica de estrati-
cao seja o tamanho; e
c) usar um estimador de razo, com caracterstica auxiliar denida pelo
tamanho do conglomerado.
2.5. PROBABILIDADES DESIGUAIS DE SELEO 83
2.5 Probabilidades desiguais de seleo
Como vimos anteriormente, a ocorrncia de variabilidade nos tamanhos dos
conglomerados causa acentuada perda de preciso nos estimadores at agora
abordados com amostragem de conglomerados em 1 estgio.
Na prtica, a formao de conglomerados com tamanhos iguais para con-
trolar a variao de tamanho na varincia do estimador, e tambm na vari-
ao do tamanho nal da amostra nem sempre possvel, sendo que a ocor-
rncia de conglomerados de tamanhos iguais pouco comum.
Assim, ao invs de tentar controlar articialmente os tamanhos dos con-
glomerados, procura-se uma sada diferente: mantendo os conglomerados
com os tamanhos desiguais, estuda-se uma forma de seleo da amostra de
conglomerados com probabilidades desiguais (Probabilidades Proporcionais
a uma medida de Tamanho - PPT).
Como objetivo de manter a simplicidade da exposio ser tratada primei-
ramente a seleo da amostra de conglomerados com probabilidades desiguais
e com reposio.
2.5.1 Seleo dos conglomerados com probabilidades
desiguais e com reposio
As unidades de
N
so grupadas emM conglomerados, que podemter taman-
hos desiguais.
C
i
U
i1
Y
i1
U
i2
Y
i2
.
.
.
.
.
.
U
iN
i
Y
iN
i
i = 1, 2, , M.
Seja P
i
a probabilidade de seleo do conglomerado i com
M
P
i=1
P
i
= 1.
Seleciona-se uma amostra com reposio de m conglomerados de acordo
com as probabilidades P
i
.
C
0
i
U
0
i1
Y
0
i1
U
0
i2
Y
0
i2
.
.
.
.
.
.
U
0
iN
0
i
Y
0
iN
0
i
84CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
i = 1, 2, , m.
A partir dos conglomerados selecionados pode-se calcular as seguintes
estatsticas:
Y
0
i
=
N
0
i
X
j=1
Y
0
ij
Mdia da caracterstica y no conglomerado C
0
i
:
Y
0
i
=
Y
0
i
N
0
i
Varincia da caracterstica y em C
0
i
:
S
0
2
i
=
1
N
0
i
1
N
0
i
X
j=1
(Y
0
ij
Y
0
i
)
2
Agora, para obter um estimador no viciado do total Y da populao
basta tomar:
b
Y
P
Ac1
=
1
m
m
X
i=1
Y
0
i
P
0
i
onde: P
0
i
a probabilidade de seleo associada ao i-simo conglomerado
selecionado. P
0
i
igual a algum dos P
k
(k = 1, 2, , M).
Para mostrar que
b
Y
P
Ac1
no viciado, basta mostrar que:
E

b
Y
P
Ac1

= E

1
m
m
X
i=1
Y
0
i
P
0
i
!
=
1
m
m
X
i=1
E

Y
0
i
P
0
i

=
1
m
m
X
i=1
"
M
X
k=1
Y
k
P
k
P
k
#
=
M
X
k=1
Y
k
= Y
Assim, um estimador no viciado da mdia Y dado por:
y
P
Ac1
=
1
mN
m
X
i=1
Y
0
i
P
0
i
Varincia do estimador de total
2.5. PROBABILIDADES DESIGUAIS DE SELEO 85
V

b
Y
P
Ac1

= E

b
Y
P
Ac1

Y
2
= E
_
_

1
m
m
X
i=1
Y
0
i
P
0
i
!
2
_
_
Y
2
=
1
m
2
E
_
_
_
_
m
X
i=1

Y
0
i
P
0
i

2
+
m
X
i=1
m
X
k=1
i6=k
Y
0
i
P
0
i
Y
0
k
P
0
k
_
_
_
_
Y
2
=
1
m
2
m
X
i=1
E

Y
0
i
P
0
i

2
+
1
m
2
m
X
i=1
m
X
k=1
i6=k
E

Y
0
i
P
0
i
Y
0
k
P
0
k

Y
2
=
1
m
2
m
M
X
i=1

Y
i
P
i

2
P
i
+
1
m
2
m(m1)E

Y
0
i
P
0
i

Y
0
k
P
0
k

Y
2
=
1
m
M
X
i=1
Y
2
i
P
i
+
(m1)
m
Y
2
Y
2
=
1
m
M
X
i=1
Y
2
i
P
i

Y
2
m
=
1
m

M
X
i=1
Y
2
i
P
i
Y
2
!
Porm, notando que:
M
X
i=1
Y
2
i
P
i
Y
2
=
M
X
i=1
Y
2
i
P
2
i
P
i
2Y
2
+Y
2
=
M
X
i=1
Y
2
i
P
2
i
P
i
2

M
X
i=1
Y
i
P
i
P
i
!
Y +Y
2
M
X
i=1
P
i
=
M
X
i=1

Y
2
i
P
2
i
2
Y
i
P
i
+Y
2

P
i
=
M
X
i=1

Y
i
P
i
Y

2
P
i
= S
2
eP
86CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Segue-se que:
V

b
Y
P
Ac1

=
S
2
eP
m
e um estimador no viciado de V

b
Y
P
Ac1

obtido por:
v

b
Y
P
Ac1

=
s
2
eP
m
onde:
s
2
eP
=
1
m1
m
X
i=1

Y
0
i
P
0
i

b
Y
P
Ac1

2
Para mostrar que v

b
Y
P
Ac1

no viciado para V

b
Y
P
Ac1

, escreve-se:
v

b
Y
P
Ac1

=
1
m(m1)
m
X
i=1

Y
0
i
P
0
i

b
Y
P
Ac1

2
=
1
m(m1)
"
m
X
i=1

Y
0
i
P
0
i

2
m

b
Y
P
Ac1

2
#
Da, segue-se que:
E
h
v

b
Y
P
Ac1
i
= E

1
m(m1)
m
X
i=1

Y
0
i
P
0
i

b
Y
P
Ac1

2
!
=
1
m(m1)

m
X
i=1
E

Y
0
i
P
0
i

2
mE

b
Y
P
Ac1

2
!
=
1
m(m1)

m
M
X
i=1

Y
i
P
i

2
P
i
m

V

b
Y
P
Ac1

b
Y
P
Ac1

!
=
1
(m1)

M
X
i=1

Y
i
P
i

2
P
i
V

b
Y
P
Ac1

Y
2
!
=
1
(m1)

M
X
i=1
Y
2
i
P
i
Y
2
!
V

b
Y
P
Ac1

!
=
1
(m1)

mV

b
Y
P
Ac1

V

b
Y
P
Ac1

= V

b
Y
P
Ac1

2.5. PROBABILIDADES DESIGUAIS DE SELEO 87


Probabilidades proporcionais a uma medida de tamanho
At agora tratamos de um desenho onde a seleo dos conglomerados feita
com probabilidades desiguais, sem preocupao a respeito do clculo dessas
probabilidades.
Agora vamos atentar para esse problema e procurar um conjunto de prob-
abilidades que traga uma estimao eciente. Para tanto consideremos:
V

b
Y
P
Ac1

=
1
m
M
X
i=1

Y
i
P
i
Y

2
P
i
Nesta expresso, se tomarmos:
P
i
=
Y
i
Y
segue-se que:
V

b
Y
P
Ac1

=
1
m
M
X
i=1
_
_
_
Y
i
Y
i
Y
Y
_
_
_
2
P
i
= 0
Logo, se as probabilidades P
i
fossem exatamente proporcionais aos totais
Y
i
dos conglomerados, o estimador
b
Y
P
Ac1
teria varincia zero.
Acontece que os totais Y
i
so desconhecidos e no podem ser utilizados
para determinao das probabilidades de seleo.
Assim que ser necessrio denir as P
i
a partir de outra forma, porm
tentando fazer com que elas tenham valores aproximadamente iguais queles
sugeridos pela denio anterior. Isto , as P
i
devem ser aproximadamente
proporcionais aos totais dos conglomerados.
Fundamentalmente, existem 3 maneiras para fazer isto:
1. Fazer as probabilidades P
i
proporcionais aos tamanhos N
i
dos conglom-
erados. P
i
=
N
i
N
(i = 1, 2, , M). Esta soluo boa quase sempre,
entretanto no sempre vivel pois em certas situaes os tamanhos
N
i
tambm no so conhecidos para todos os conglomerados.
2. Fazer as probabilidades P
i
proporcionais a uma medida de tamanho
dos conglomerados, x, conhecida para todos os conglomerados e cor-
relacionada com a caracterstica y de interesse:
P
i
=
X
i
X
(i = 1, 2, , M)
onde: X =
M
P
i=1
X
i
.
88CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Exemplo: se o conglomerado uma partio geogrca, usar a rea total
x do conglomerado como medida de tamanho.
3. Fazer as probabilidades P
i
exatamente proporcionais aos valores da
mesma caracterstica y observadas num censo anterior.
O estatstico examina a situao e recomenda o uso de probabilidades pro-
porcionais a x sempre que os valores
y
x
puderem ser admitidos aproximada-
mente constantes, pois neste caso a varincia de
b
Y
P
Ac1
dever ser pequena.
Deve ser enfatizado que o sucesso da adoo da alternativa da amostragem
com probabilidades proporcionais ao tamanho depende fortemente do acerto
na escolha da medida de tamanho. Se esta for ruim, no sentido de que
no h proporcionalidade entre y e x, este desenho no deve ser melhor que
amostragem com equiprobabilidades. Pode ser demonstrado que em certas
condies, este desenho pode ser pior que amostragem com equiprobabili-
dades.
Algoritmo para seleo da amostra com probabilidade proporcional
ao tamanho (mtodo dos totais cumulativos - seleo aleatria)
1. Calcular os totais parciais acumulados T
k
dados por:
T
k
=
K
X
i=1
X
i
K {1, 2, , M}
T
0
= 0 e X =
M
X
i=1
X
i
2. Selecionar um nmero aleatoriamente no intervalo [1, X]. Seja u o
nmero selecionado.
3. Vericar em que intervalo (T
k
, T
k+1
] , K {1, 2, , M} , o nmero
selecionado caiu. Caso u (T
k
, T
k+1
] ento incluir na amostra o con-
glomerado k + 1. Caso a amostra no tenha sido completada, repetir
o processo a partir da etapa 2. Caso contrrio, a amostra est sele-
cionada.
Note-se que o procedimento com reposio, donde se pode obter uma
amostra contendo vrias repeties de uma mesma unidade da populao.
Exemplo 2.5
2.5. PROBABILIDADES DESIGUAIS DE SELEO 89
Suponha-se que os conglomerados so quarteires e que desejamos amostrar
os domiclios. Numa populao de 10 quarteires, selecionar uma amostra
de 5 quarteires com probabilidade proporcional ao nmero de domiclios no
quarteiro.
Seleo dos quarteires da amostra
n
o
do medidas medida designao
quarteiro de tamanho acumulada da amostra
1 50 50 x
2 12 62
3 20 82 x
4 31 113
5 10 123
6 60 183
7 55 238 xx
8 13 251
9 30 281
10 20 301 x
Selecionar aleatoriamente um nmero entre 1 e 301. (Cochran pg. 19,
linha 1 e coluna 17). O nmero selecionado 226, ento o primeiro con-
glomerado a ser selecionado o nmero 7. Os nmeros aleatrios seguintes
menores ou iguais a 301 so: 15, 218, 79 e 294. Logo, os conglomerados 1, 3,
7 e 10 esto tambm designados para a amostra.
Observe que o conglomerado 7 foi selecionado duas vezes.
Se M grande, a probabilidade de um conglomerado ser selecionado mais
de uma vez muito pequena e, como aproximao, pode-se usar a seleo
sistemtica.
Algoritmo para seleo da amostra com probabilidade proporcional
ao tamanho (mtodo dos totais cumulativos - seleo sistemtica)
Se a seleo proporcional a uma medida de tamanho, a probabilidade de
incluso do conglomerado i na amostra :
m
X
i
X
=
X
i
X
m
1. Divide-se X em partes sendo
X
m
o intervalo da amostra para ns de
seleo sistemtica.
90CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
2. Seleciona-se aleatoriamente um ponto de partida no intervalo

1,
X
m

;
ponto esse que vai determinar o 1
o
conglomerado da amostra.
3. Somando-se ao ponto de partida o intervalo vai determinar o 2
o
con-
glomerado da amostra; e assim por diante at selecionar os m conglom-
erados.
No exemplo anterior
X
m
= 60, 2. Se o nmero aleatrio 22,5, os con-
glomerados selecionados so aqueles cujos totais cumulativos so: 22,5; 60,2
+ 22,5 = 82,7; 82,7 + 60,2 = 142,9; 142,9 + 60,2 = 213,1; 213,1 +60,2 =
273,3, que correspondem respectivamente, aos conglomerados 1, 4, 6, 7 e 9.
Seleo dos conglomerados com probabilidades desiguais e sem
reposio
Suponha agora que a amostra de mconglomerados tenha sido selecionada me-
diante algum procedimento aleatrio sem reposio, tal que a probabilidade
de que o conglomerado i, C
i
, pertena a amostra seja
i
, e a probabilidade de
que o par de conglomerados (C
i
, C
j
) pertena a amostra em qualquer ordem
seja
ij
, i = 1, 2, , m e j = 1, 2, , m, com i 6= j.
Horvitz e Thompson (1952) desenvolveramuma teoria geral de amostragem
com probabilidades desiguais de seleo e sem reposio, baseada no uso
de um estimador no viciado de total populacional, dado pela seguinte ex-
presso:
b
Y
HT
=
m
X
i=1
Y
0
i

0
i
com
0
i
igual a algum dos
k
,
k
> o, k = 1, 2, , M.
Caso particular de equiprobabilidade:
i
=
m
M
i = 1, 2, , M.
A varincia de
b
Y
HT
dada pela seguinte expresso:
V

b
Y
HT

=
M
X
i=1
(1
i
)

i
Y
2
i
+
M
X
i=1
M
X
j=1
i6=j
(
ij

j
)

j
Y
i
Y
j
Prova: Seja t
i
a indicadora se o conglomerado i a amostra:
t
i
=
_
_
_
1 se C
i
a amostra
0 se C
i
no a amostra
i {1, 2, , M}
2.5. PROBABILIDADES DESIGUAIS DE SELEO 91
Ento, t
i
tem distribuio binomial para uma amostra de tamanho m,
com probabilidade
i
.
Assim,
E(t
i
) =
i
V (t
i
) =
i
(1
i
)
COV (t
i
, t
j
) = E(t
i
t
j
) E(t
i
) E(t
j
) =
ij

j
Logo:
b
Y
HT
=
m
X
i=1
Y
0
i

0
i
=
M
X
i=1
Y
i

i
t
i
E

b
Y
HT

=
M
X
i=1
Y
i

i
E (t
i
) =
M
X
i=1
Y
i

i
=
M
X
i=1
Y
i
= Y
V

b
Y
HT

= V

M
X
i=1
Y
i

i
t
i
!
=
M
X
i=1
Y
2
i

2
i
V (t
i
) +
M
X
i=1
M
X
j=1
i6=j
Y
i
Y
j

j
COV (t
i
, t
j
)
=
M
X
i=1
Y
2
i

2
i

i
(1
i
) +
M
X
i=1
M
X
j=1
i6=j
Y
i
Y
j

j
(
ij

j
)
=
M
X
i=1
Y
2
i

i
(1
i
) +
M
X
i=1
M
X
j=1
i6=j
Y
i
Y
j

j
(
ij

j
)
Um estimador no viciado da V

b
Y
HT

dado por:
v

b
Y
HT

=
m
X
i=1
(1
0
i
)

0
i
Y
0
2
i
+
m
X
i=1
m
X
j=1
i6=j

0
ij

0
i

0
j

0
i

0
j
Y
0
i
Y
0
j
com
0
ij
igual a algum dos
kl
,
kl
> o, k = 1, 2, , M; l = 1, 2, , M e
l 6= k.
92CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Grande parte dos procedimentos de seleo com probabilidades desiguais
e sem reposio que aparecem na literatura de amostragem apresentam ex-
presses complexas ou aproximadas para os estimadores da varincia, con-
siderando o tamanho da amostra de conglomerados xo. Este fato jus-
ticado pelas diculdades matemticas encontradas na avaliao dos
ij
-
probabilidade de incluso conjunta da i-sima e j-sima unidades na amostra.
Hanif e Brewer (1980) apresentam uma lista de vrios procedimentos
de seleo com probabilidades desiguais sem reposio. Estes procedimen-
tos podem ser classicados por diferentes modos, tais como: classicao na
maneira da seleo, classicao por classe de equivalncia (os procedimentos
pertencem a mesma classe de equivalncia quando as probabilidades de se-
leo conjunta de todas as combinaes possveis so idnticas), classicao
por tipo de estimador apropriado.
Dentre os procedimentos apresentados destaca-se o mtodo dos Grupos
Aleatrios de Rao Hartley e Cochran (1962). Uma descrio e compara-
es deste mtodo com mtodos de seleo com probabilidades desiguais sem
reposio pode ser vista em Lima (1985).
Mtodo dos Grupos Aleatrios de Rao Hartley e Cochran
Propriedades:
1. Permite a computao de um estimador para o total populacional que
tem varincia sempre inferior ao estimador padro da amostragem com
probabilidades desiguais com reposio.
2. No acarreta computao rdua para seleo ou para computaodo
estimador da varincia e da respectiva estimativa.
3. Fornece frmula exata da varincia para qualquer tamanho de
populao e de amostra xa.
4. Encontra-se disponvel um estimador no viciado e sempre no
negativo para a varincia amostral do estimador do total, quais-
quer que sejam os tamanhos de amostra e da populao.
Algoritmo
1. Divide-se a populao composta de M conglomerados, aleatoriamente,
em m grupos de tamanhos M
1
, M
2
, , M
m
;
M =
m
X
i=1
M
i
onde m o tamanho da amostra.
2.6. ESTRATIFICAO DE CONGLOMERADOS 93
2. Selecionar um conglomerado de cada um dos m grupos, independente-
mente, com probabilidade proporcional probabilidade de seleo P
t
da t-sima unidade. Se a t-sima unidade cair no grupo i, ento a
probabilidade real da seleo desta unidade
P
t

i
,onde:
i
=
P
grupo i
P
i
.
Se estiver sendo usada probabilidade proporcional ao tamanho X
i
, ento:
P
t
=
X
t
X
.
Neste caso, o estimador do total populacional dado por:
b
Y
RHC
=
m
X
i=1
Y
0
i

i
P
i
onde: Y
0
i
o valor da caracterstica y no i-simo grupo.
A varincia de
b
Y
RHC
dada por:
V

b
Y
RHC

m
P
i=1
M
2
i
M

M (M 1)

M
X
i=1
Y
2
i
P
i
Y
2
!
e um estimador de v

b
Y
RHC

dado por:
v

b
Y
RHC

m
P
i=1
M
2
i
M

M (M 1)
m
X
i=1

Y
0
i
P
0
i

b
Y
RHC

2
2.6 Estraticao de conglomerados
Uma outra forma de controlar a variao dos tamanhos dos conglomerados
estratic-los segundo alguma caracterstica que mea seu tamanho, isto
grupar os conglomerados em estratos homogneos segundo alguma medida
de tamanho.
Esta alternativa praticamente equivalente seleo dos conglomerados
com proporcionais ao tamanho, pois indispensvel conhecer, para todos os
M conglomerados da populao, o valor de uma medida de tamanho que
permita separar os conglomerados em estratos homogneos, para poder ento
selecionar a amostra.
Em termos de ecincia em relao seleo dos conglomerados com
probabilidades proporcionais ao tamanho, no parece haver vantagem ntida
94CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
de qualquer das duas alternativas, sendo bastante semelhante os resultados
obtidos com ambas as tcnicas em termos da preciso nal das alternativas.
2.6.1 Estimadores e respectivas precises
Inicialmente, suponhamos que os M conglomerados so grupados em L es-
tratos E
1
, E
2
, , E
L
, tendo-se associado a cada conglomerado o total da
caracterstica y:
E
1
E
L
C
11
Y
11
C
L1
Y
L1
C
12
Y
12
C
L2
Y
L2
.
.
.
.
.
.
.
.
.
.
.
.
C
1M
1
Y
1M
1
C
LM
L
Y
LM
L
Denotando por E
h
um estrato genrico (h = 1, 2, , L), segue-se que:
M
h
o nmero de conglomerados no estrato h;
Y
h
=
M
h
P
i=1
Y
hi
o total da caracterstica y no estratro h;
Y
h
=
Y
h
M
h
o total mdio por conglomerado do estrato h;
S
2
he
=
1
M
h
1
M
h
P
i=1
(Y
hi
Y
h
)
2
a varincia entre os totais dos conglomerados
dentro do estrato h.
Agora, selecionando-se em cada um dos L estratos amostras aleatrias
simples de conglomerados, sem reposio de tamanhos m
1
, m
2
, , m
L
e
investigando-se todas as unidades pertencentes aos conglomerados da amostra
tem-se:
E
1
E
L
C
0
11
Y
0
11
C
0
L1
Y
0
L1
C
0
12
Y
0
12
C
0
L2
Y
0
L2
.
.
.
.
.
.
.
.
.
.
.
.
C
0
1m
1
Y
0
1m
1
C
0
Lm
L
Y
0
Lm
L
Como as amostras nos estratos so amostras de conglomerados em 1 es-
tgio, pode-se estimar os totais dos estratos por:
b
Y
h.Ac1
=
M
h
m
h
m
h
X
i=1
Y
0
hi
h = 1, 2, , L
2.6. ESTRATIFICAO DE CONGLOMERADOS 95
e tem-se que:
V (
b
Y
h.Ac1
) =
M
2
h
(M
h
m
h
)
M
h
S
2
he
m
h
h = 1, 2, , L
e a estimao no viciada de V (
b
Y
h.Ac1
) pode ser feita por:
v(
b
Y
h.Ac1
) =
M
2
h
(M
h
m
h
)
M
h
s
2
he
m
h
h = 1, 2, , L
onde:
s
2
he
=
1
m
h
1
m
h
X
i=1
(Y
0
hi
y
h.Ac1
)
2
sendo:
y
h.Ac1
=
1
m
h
m
h
X
i=1
Y
0
hi
=
b
Y
h.Ac1
M
h
Assim pode-se estimar o total Y da populao por:
b
Y
est
Ac1
=
L
X
h=1
b
Y
h.Ac1
=
L
X
h=1
M
h
m
h
m
h
X
i=1
Y
0
hi
com:
E

b
Y
est
Ac1

=
L
X
h=1
E

b
Y
h.Ac1

=
L
X
h=1
Y
h
= Y
Alm disto,
V (
b
Y
est
Ac1
) =
L
X
h=1
V (
b
Y
h.Ac1
) =
L
X
h=1
M
2
h
(M
h
m
h
)
M
h
S
2
he
m
h
e esta varincia pode ser estimada por:
v(
b
Y
est
Ac1
) =
L
X
h=1
v(
b
Y
h.Ac1
) =
L
X
h=1
M
2
h
(M
h
m
h
)
M
h
s
2
he
m
h
Se a frao de amostragem
m
h
M
h
(h = 1, 2, , L) for constante e igual
a f nos estratos (equivalendo a uma alocao proporcional nos estratos),
obtm-se:
m
h
M
h
= f (h = 1, 2, , L)
96CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
b
Y
est
Ac1
=
1
f
L
X
h=1
m
h
X
i=1
Y
0
hi
V (
b
Y
est
Ac1
) =
1 f
f
L
X
h=1
M
h
S
2
he
v(
b
Y
est
Ac1
) =
1 f
f
L
X
h=1
M
h
s
2
he
Exemplo 2.5 (Nascimento (1981), pg 63)
Em certa localidade, existem 1.200 setores censitrios que vo ser con-
siderados como conglomerados de domiclios. Foram formados 6 estratos,
de acordo com a populao do ltimo Censo, cujos nmeros de setores por
estrato constam da tabela abaixo.
A populao total da localidade, de acordo com o Censo, foi de 1.960.800
habitantes, o que corresponde a uma mdia de 1.634 habitantes por setor ou
380 domiclios por setor ( na base de 4,3 pessoas por domiclio, com base em
pesquisa anterior).
Considerando as disponibilidades de tempo e custo, foi xada uma amostra
de 24 setores ou, aproximadamente, 9.120 domiclios, o que corresponde
frao de amostragem de
24
1200
=
1
50
.
A tabela abaixo apresenta o nmero de setores na populao e na amostra
e o nmero de habitantes nos setores da amostra.
Estimar a populao atual da localidade e o respectivo coeciente de
variao associado essa estimativa.
Setores na Setores na Habitantes nos
Estratos populao amostra setores da amostra
(M
h
) (m
h
) (Y
0
hi
)
1 90 2 3.450; 3.120
2 100 2 2.890; 3060
3 140 3 2.320; 2.850; 2.010
4 250 5 1.910; 1.990; 1.300; 1.400; 1.520
5 295 6 1.040; 1.090; 1.200; 990; 1.460; 1.310
6 325 6 980; 1.010; 870; 1.100; 900; 930
Estimativa do nmero de habitantes da localidade:
b
Y
est
Ac1
=
M
m
L
X
h=1
m
h
X
i=1
Y
0
hi
= 50 (40.730) = 2.036.500 habitantes
2.7. ESTIMADOR DE RAZO 97
Em cada estrato calcula-se a mdia da amostra por setor, no estrato h:
y
h.Ac1
=
1
m
h
m
h
X
i=1
Y
0
hi
e a varincia da amostra entre os setores de cada estrato h:
s
2
he
=
1
m
h
1
m
h
X
i=1
(Y
0
hi
y
h.Ac1
)
2
obtendo-se os seguintes resultados:
Mdia da amostra Varincia entre
Estratos por setor os setores
(y
h.Ac1
) (s
2
he
)
1 3.285 54.450
2 3.020 3.200
3 2.393 360.867
4 1.624 381.720
5 1.172 129.084
6 965 34.950
Estimativa da varincia da estimativa do nmero de habitantes da loca-
lidade:
v(
b
Y
est
Ac1
) =
1 f
f
L
X
h=1
M
h
s
2
he
= 49 (64.226.395) = 3.147.093.351
o respectivo erro padro estimado por:
q
v(
b
Y
est
Ac1
) = 56.098, 96
e o respectivo coeciente de variao estimado por:
cv(
b
Y
est
Ac1
) =
q
v(
b
Y
est
Ac1
)
b
Y
est
Ac1
=
56.098, 96
2.036.500
= 0, 0276
2.7 Estimador de razo
H situaes prticas em que o controle da variao nos tamanhos dos con-
glomerados no pode ser feito mudando as probabilidades de seleo ou es-
traticando os conglomerados, em virtude de no se dispor de nenhuma me-
dida de tamanho com valores conhecidos para todos os conglomerados.
98CAPTULO 2. AMOSTRAGEM DE CONGLOMERADOS
Nestas situaes, a alternativa que resta a estimao por um outro pro-
cesso. Neste caso, o processo mais comumente empregado o da estimao
por razo.
Para que esse processo possa ser empregado, basta que sejam conhecidos
os valores N
0
i
e Y
0
i
, respectivamente, tamanho e total da caracterstica y dos
conglomerados da amostra.
2.7.1 Estimador de razo baseado no tamanho dos con-
glomerados
Sabe-se que:
Y =
Y
N
=
M
P
i=1
Y
i
M
P
i=1
N
i
Assim, lembrando que um estimador no viciado de Y dado por:
b
Y
Ac1
=
M
m
m
X
i=1
Y
0
i
e tambm, notando que um estimador no viciado do tamanho total N
dado por:
b
N
Ac1
=
M
m
m
X
i=1
N
0
i
Segue-se que um estimador consistente de Y dado por:
y
R
Ac1
=
b
Y
Ac1
b
N
Ac1
=
M
m
m
P
i=1
Y
0
i
M
m
m
P
i=1
N
0
i
=
m
P
i=1
Y
0
i
m
P
i=1
N
0
i
Aqui pode-se notar que este estimador depende s dos tamanhos N
0
i
e
dos totais Y
0
i
dos conglomerados da amostra, no dependendo do tamanho
total da populao (N) como o estimador no viciado y
Ac1
que vimos ante-
riormente.
2.7. ESTIMADOR DE RAZO 99
Varincia de y
R
Ac1
Se considerarmos uma amostra aleatria simples de m unidades de uma
populao de tamanho M, a varincia do estimador de razo dada por:
V (
b
R)

=
M m
M X
2
S
2
eR
m
onde:
b
R =
b
Y
b
X
e R =
Y
X
S
2
eR
=
1
M 1
M
X
i=1
(Y
i
RX
i
)
2
Supondo que m sucientemente grande para tornar desprezvel o vcio
do estimador de razo, e substituindo X por N segue-se que:
V (y
R
Ac1
)

=
M m
MN
2
S
2
eR
m
com:
S
2
eR
=
1
M 1
M
X
i=1
(Y
i

Y
N
N
i
)
2
=
1
M 1
M
X
i=1
(Y
i
Y N
i
)
2
=
1
M 1
M
X
i=1
N
2
i
(Y
i
Y )
2
Alm disso, um estimador consistente desta varincia dado por:
v(y
R
Ac1
) =
M m
M N
2
s
2
eR
m
com:
s
2
eR
=
1
m1
m
X
i=1
(Y
0
i
y
R
Ac1
N
0
i
)
2
=
1
m1
m
X
i=1
N
02
i
(Y
0
i
y
R
Ac1
)
2
100CAPTULO 2. AMOSTRAGEMDE CONGLOMERADOS
Se N no for conhecido, pode ser estimado por:
N
Ac1
=
1
m
m
X
i=1
N
0
i
A partir do que foi visto at agora, imediata a obteno do estimador
de razo consistente para o total Y .
b
Y
R
Ac1
= MN y
R
Ac1
= MN
m
P
i=1
Y
0
i
m
P
i=1
N
0
i
com:
V (
b
Y
R
Ac1
) =

MN

2
V (y
R
Ac1
)

=

MN

2 M m
MN
2
S
2
eR
m
= M
2
M m
M
S
2
eR
m
Alm disso, se o parmetro que se deseja estimar a proporo P
A
de
unidades da populao com certo atributo A, segue-se que um estimador de
razo consistente de P
A
dado por:
p
R
Ac1
=
m
P
i=1
N
0
i
P
0
Ai
m
P
i=1
N
0
i
com:
V (p
R
Ac1
)

=
M m
MN
2
S
2
eR
m
e
S
2
eR
=
1
M 1
M
X
i=1
N
2
i
(P
Ai
P
A
)
2
e o estimador dessa varincia dado por:
v(p
R
Ac1
) =
M m
M N
2
s
2
eR
m
com:
s
2
eR
=
1
m1
m
X
i=1
N
02
i
(P
0
Ai
p
R
Ac1
)
2
2.7. ESTIMADOR DE RAZO 101
2.7.2 Estimador de razo baseado em uma caracters-
tica que no seja o tamanho do conglomerado
Aqui a caracterstica auxiliar x que se utiliza para construir o estimador
de razo outra qualquer que no o tamanho dos conglomerados. Para
que o estimador de razo possa ser construdo com esta caracterstica x,
indispensvel conhecer o total X da populao e observar os totais X
0
i
dos
conglomerados da amostra. Assim, o estimador de razo do total Y dado
por:
b
Y
R
Ac1
=
m
P
i=1
Y
0
i
m
P
i=1
X
0
i
X
V (
b
Y
R
Ac1
)

= M
2
M m
M
S
2
eR
m
com:
S
2
eR
=
1
M 1
M
X
i=1
(Y
i
RX
i
)
2
sendo:
R =
Y
X
e
v(
b
Y
R
Ac1
)

= M
2
M m
M
s
2
eR
m
com:
s
2
eR
=
1
m1
m
X
i=1
(Y
0
i

b
RX
0
i
)
2
e
b
R =
b
Y
Ac1
b
X
Ac1
=
m
P
i=1
Y
0
i
m
P
i=1
X
0
i
102CAPTULO 2. AMOSTRAGEMDE CONGLOMERADOS
2.8 Exerccios
2.8.1 Considere uma populao de 100 conglomerados de mesmo tamanho
de 4 unidades elementares, em que a proporo de pessoas com certo
atributo P = 0, 5. Em uma amostra de 5 conglomerados foram obtidos
os seguintes resultados:
Conglomerado (i) 1 2 3 4 5
Unidades elementares 2 3 1 2 1
com o atributo (A
i
)
Estime a ecincia da amostra de conglomerados emrelao amostragem
aleatria simples.
2.8.2 Seja P
N
uma populao de N = 20 unidades, cujos valores associados
a uma certa caracterstica y so relacionadas a seguir:
U
1
U
2
U
3
U
4
U
5
U
6
U
7
U
8
U
9
U
10

Y
1
Y
2
Y
3
Y
4
Y
5
Y
6
Y
7
Y
8
Y
9
Y
10
q q q q q q q q q q
66 70 37 56 61 38 55 05 23 47
U
11
U
12
U
13
U
14
U
15
U
16
U
17
U
18
U
19
U
20

Y
11
Y
12
Y
13
Y
14
Y
15
Y
16
Y
17
Y
18
Y
19
Y
20
q q q q q q q q q q
94 51 85 65 92 49 10 87 31 02
Grupando essas 20 unidades em 4 conglomerados como sugerido a
seguir, calcular o coeciente de correlao intraclasse .
C
1
= {U
1
, U
6
, U
11
, U
16
, U
20
} C
2
= {U
2
, U
3
, U
7
, U
8
, U
19
}
C
3
= {U
4
, U
5
, U
14
, U
15
, U
18
} C
4
= {U
9
, U
10
, U
12
, U
13
, U
17
}
Comente o resultado!!!
2.8.3 Segue-se uma tabela contendo os dados de uma amostra de 20 quar-
teires selecionados aleatoriamente sem reposio entre os 270 quar-
teires de uma cidade que continha 6.786 domiclios. Nesta pesquisa
considerou-se como unidade de investigao o domiclio. H interesse
em estimar a proporo de domiclios alugados e o intervalo dessa es-
timativa com 95% de conana.
2.8. EXERCCIOS 103
Quarteiro N
o
de Domiclios N
o
de Domiclios
(i) (N
0
i
) Alugados

Y
0
i

1 5 3
2 9 5
3 18 5
4 68 52
5 32 21
6 48 34
7 11 3
8 1 0
9 1 0
10 4 0
11 29 17
12 31 14
13 5 0
14 2 0
15 4 2
16 102 54
17 20 11
18 15 11
19 1 0
20 29 23
Total 435 255
20
X
=1
N
02
i
= 22.239
20
X
=1
Y
02
i
= 8.545
2.8.4 Segue-se uma tabela contendo os dados de uma amostra de 20 quar-
teires selecionada comprobabilidade proporcional ao nmero de domiclios,
dentre os 270 quarteires considerados na populao que continha 6.786
domi-clios, do exerccio 2.8.3. Estimar a proporo de domiclios alu-
gados e comparar a preciso obtida com aquela do exerccio 2.8.3 (cuja
seleo dos conglomerados havia sido com equiprobabilidade). Justi-
que o resultado.
104CAPTULO 2. AMOSTRAGEMDE CONGLOMERADOS
Quarteiro N
o
de Domiclios N
o
de Domiclios
(i) (N
0
i
) Alugados (Y
0
i
)
1 45 30
2 22 13
3 76 69
4 4 2
5 4 2
6 33 27
7 46 34
8 81 43
9 58 42
10 89 84
11 76 69
12 48 46
13 46 36
14 18 6
15 76 69
16 102 54
17 44 24
18 39 26
19 22 7
20 30 25
Total 959 708
2.8.5 Estimar a proporo de domiclios alugados, a partir da amostra aleatria
simples de 20 quarteires selecionada, cujos resultados foram dados no
exerccio 2.8.3 deste captulo, utilizando o estimador de razo baseado
no tamanho dos conglomerados.
Calcule tambm o intervalo dessa estimativa com 95% de conana e
compare com os intervalos obtidos nos exerccios 2.8.3 e 2.8.4.
2.8. EXERCCIOS 105
2.8.6 dada uma populao com N unidades distribudas em M conglom-
erados de tamanhos desiguais. Deseja-se selecionar uma amostra de
m conglomerados para estimar o total de uma determinda caracters-
tica. Quais as medidas que devem ser tomadas na denio do desenho
amostral para controlar a variao do tamanho dos conglomerados, se o
tamanho de cada conglomerado for conhecido? E se no for conhecido?
2.8.7 Os habitantes de um bairro esto distribudos em 170 quarteires, onde
se estima que h um total de 8.500 domiclios. Sabendo-se que uma
amostra aleatria simples de 500 domiclios anteriormente selecionada
forneceu uma preciso de cerca de 10% (em termos do coeciente de
variao) para estimar o total de domiclios alugados e, que o coe-
ciente de correlao intraclasse foi estimado na mesma amostra em
torno de 0,30. Usando a frmula aproxi-mada que relaciona a varin-
cia da amostra aleatria simples e da amostra de conglomerados em 1
estgio, supondo conglomerados de igual tamanho:
a) Estime a preciso que seria obtida para estimar o total de domiclios
alugados se fosse selecionada uma amostra de quarteires corre-
spondente ao mesmo nmero de domiclios que a amostra aleatria
simples.
b) Determine o tamanho de amostra de quarteires necessrio para
estimar o total de domiclios alugados no bairro em questo, com
a mesma preciso da amostra aleatria simples.
2.8.8 Uma amostra aleatria simples sem reposio de 8 caixas de laranjas
foi retirada de um lote que continha 1.000 caixas, tendo-se examinado
cada fruto das caixas selecionadas para vericar se estavam com bicho.
Os dados observados foram:
Caixa Total de frutos Total de frutos com
na amostra na caixa bicho na caixa
1 50 4
2 40 21
3 45 6
4 55 30
5 70 50
6 65 4
7 35 20
8 40 15
Total 400 150
106CAPTULO 2. AMOSTRAGEMDE CONGLOMERADOS
a) Estime a proporo de frutos com bicho no lote.
b) Calcule o intervalo com 95% de conana para a estimativa obtida
em a) e d a sua opinio a respeito da dimenso da amostra uti-
lizada. ( s
2
eR
= 625).
2.8.9 Compare as seguintes 2 amostras, cada uma delas baseada em 3.600
unidades elementares selecionadas de uma populao com 1.800.000
unidades.
(1) Uma amostra aleatria simples de 3.600 unidades elementares com:
y = 513 e v(y) = 10, 89
(2) Uma amostra aleatria de 180 conglomerados selecionados dentre
90.000 conglomerados, com cada conglomerado contendo N = 20
unidades elementares e
y
Ac1
= 524 e v(y
Ac1
) = 102, 01
Note que a varincia estimada para estimar a mdia da caracterstica
y para a segunda amostra quase 10 vezes maior que a da primeira
amostra. Isto indica que: (complete com (V) se a armativa for ver-
dadeira e (F) se for falsa, justicando a escolha para cada item.)
a) O coeciente de correlao intraclasse dos 90.000 conglomerados
maior que zero.
b) Todos os elementos dentro de cada conglomerado so iguais (Y
ij
=
Y
ik
j e k).
c) O estimativa da varincia da segunda amostra pode ser reduzida,
para atingir o valor da varincia estimada com a primeira amostra,
aumentando em menos de 1.000 o nmero de conglomerados na
segunda amostra.
d) Se a primeira amostra for reduzida para 1.200 unidades elementares,
ela teria a mesma preciso estimada para estimar a mdia da car-
acterstica y que a segunda amostra.
2.8. EXERCCIOS 107
2.8.10 De uma populao com 10.000 conglomerados e 50.000 unidades el-
ementares uma amostra aleatria simples sem reposio de 10 con-
glomerados foi selecionada. Desses conglomerados temos as seguintes
informaes:
Conglomerado Valor da caracterstica Total de unidades
(i) y no conglomerado i no conglomerado i
1 80 3
2 110 4
3 95 5
4 55 3
5 150 5
6 120 6
7 175 7
8 90 4
9 50 3
10 100 5
Total 1.025 45
a) D 2 estimativas da mdia por unidade elementar.
b) Qual estimativa provavelmente melhor? Justique.
2.8.11 De uma populao formada por M conglomerados foi selecionada
uma amostra de m conglomerados com o seguinte procedimento: o 1
o
conglomerado foi selecionado com probabilidades desiguais P
i
, sendo
M
P
i=1
P
i
= 1 e os (m1) conglomerados restantes da amostra foram
selecionados com probabilidades iguais, sendo que todas as selees
foram sem reposio.
a) Obtenha a probabilidade z
i
de que o conglomerado C
i
pertena a
amostra; e
b) Prove que:
M
P
i=1
z
i
= m.
108CAPTULO 2. AMOSTRAGEMDE CONGLOMERADOS
Captulo 3
Conglomerados em 2 estgios
3.1 Probabilidades iguais de seleo
3.1.1 Introduo e denies bsicas
Quando foi estudada a ecincia da amostragem de conglomerados em 1 es-
tgio em relao amostragem aleatria simples, mostrou-se que o efeito
de conglomerao

1 +

N 1

costuma determinar uma perda de pre-


ciso da amostra de conglomerados em 1 estgio, comparada a uma amostra
aleatria simples de mesmo tamanho, porque o coeciente de correlao in-
traclasse costuma ser positivo. De fato, constatou-se ainda que a perda da
preciso tanto maior quanto maior o tamanho do conglomerado.
Neste captulo ser estudada uma maneira de reduzir a inuncia do
tamanho dos conglomerados na ecincia da amostra de conglomerados em
1 estgio. Esta soluo consiste em fazer subamostragem nos conglomerados
da amostra, ao invs de investigar todas as unidades desses conglomerados.
A subamostragem mencionada consiste na seleo de amostras de unidades
elementares de
N
dentro de cada um dos conglomerados da amostra.
Por exemplo, se os quarteires de uma cidade so considerados conglom-
erados de domiclios, selecionando-se uma amostra de quarteires e depois
uma amostra de domiclios em cada quarteiro da amostra se obtm uma
amostra de conglomerados em 2 estgios.
O plano amostral de conglomerados em 2 estgios (Ac2) constitudo de
uma amostra de conglomerados com subamostragem.
Na exposio seguinte ser adotada a seguinte terminologia:
conglomerado = unidade primria de amostragem (UPA ou UP)
unidade elementar = unidade secundria de amostragem (USA ou US).
Assim, se
N
uma populao com N unidades, ela pode ser vista como
109
110 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
se segue:
UP
1
UP
2
UP
M
US
11
Y
11
US
21
Y
21
. . . US
M1
Y
M1
US
12
Y
12
US
22
Y
22
. . . US
M2
Y
M2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
US
1N
1
Y
1N
1
US
2N
2
Y
2N
2
. . . US
MN
M
Y
MN
M
Assim verica-se que na UP
i
h N
i
unidades secundrias (US
ij
) e, portanto:
M
X
i=1
N
i
= N
Agora, seleciona-se uma amostra aleatria simples, semreposio de munidades
primrias:
Amostra de 1
o
estgio
UP
0
1
UP
0
2
UP
0
m
US
0
11
Y
0
11
US
0
21
Y
0
21
. . . US
0
m1
Y
0
m1
US
0
12
Y
0
12
US
0
22
Y
0
22
. . . US
0
m2
Y
0
m2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
US
0
1N
1
Y
0
1N
0
1
US
0
2N
0
2
Y
0
2N
0
2
. . . US
0
mN
0
m
Y
0
mN
0
m
E agora, em cada UP da amostra de 1
o
estgio, seleciona-se uma amostra
aleatria simples de unidades secundrias, obtendo-se:
Amostra de 2
o
estgio
UP
0
1
UP
0
2
UP
0
m
us
00
11
y
11
us
00
21
y
21
. . . us
00
m1
y
m1
us
00
12
y
12
us
00
22
y
22
. . . us
00
m2
y
m2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
us
00
1n
0
1
y
1n
0
1
us
00
2n
0
2
y
2n
0
2
. . . us
00
mn
0
m
y
mn
0
m
Finalmente, a amostra resultante :

y
11
, y
12
, , y
1n
0
1
; ; y
m1
, y
m2
, , y
mn
0
m

Eassim, ao invs de se ter os conglomerados na amostra comN


0
1
, N
0
2
, , N
0
m
unidades, tem-se as subamostras de tamanho n
0
1
, n
0
2
, , n
0
m
.
A gura 3.1 apresenta uma ilustrao da seleo das unidades de uma
amostra de conglomerados em 2 estgios.
3.1. PROBABILIDADES IGUAIS DE SELEO 111
Figura 3.1: Ilustrao da seleo das unidades de uma Ac2
Neste caso tem-se: M = 10 e m = 6
UPs N
o
de USs UPs N
o
de USs N
o
de USs
da UP
i
selecionadas da UP
0
i
selecionadas
(UP
i
) (N
i
) (UP
0
i
) (N
0
i
) da UP
0
i
(n
0
i
)
UP
1
N
1
= 4 UP
0
1
N
0
1
= 4 n
0
1
= 2
UP
2
N
2
= 4 - - -
UP
3
N
3
= 5 UP
0
2
N
0
2
= 5 n
0
2
= 3
UP
4
N
4
= 5 UP
0
3
N
0
3
= 5 n
0
3
= 2
UP
5
N
5
= 3 - - -
UP
6
N
6
= 3 UP
0
4
N
0
4
= 3 n
0
4
= 2
UP
7
N
7
= 3 UP
0
5
N
0
5
= 3 n
0
5
= 2
UP
8
N
8
= 3 - - -
UP
9
N
9
= 2 UP
0
6
N
0
6
= 2 n
0
6
= 1
UP
10
N
10
= 4 - - -
Afrao de amostragemcorrespondente seleo equiprovvel das unidades
primrias no 1
o
estgio representada por:
f
1
=
m
M
e a frao de amostragem de 2
o
estgio para cada unidade primria sele-
cionada representada por:
f
2i
=
n
0
i
N
0
i
(i = 1, 2, , m)
112 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Na situao usual (mais simples) comum fazer a frao de amostragem do
2
o
estgio constante, representando-a por f
2
, ou seja:
f
2i
= f
2
(i = 1, 2, , m)
Alm disto, h que se notar que o tamanho nal da amostra uma varivel
aleatria n, com:
n =
m
X
i=1
n
0
i
Os valores da varivel aleatria n dependem das unidades primrias sele-
cionadas no 1
o
estgio. Tem-se que:
n = E(n) = E

m
X
i=1
n
0
i
!
= E

m
X
i=1
f
2
N
0
i
!
= f
2
m
1
M
M
X
i=1
N
i
= f
1
f
2
N
No caso de frao de amostragem constante no 2
o
estgio, qualquer unidade
da populao tem a mesma probabilidade de pertencer amostra, dada por
f
1
f
2
.
3.1.2 Parmetros da caracterstica y
Vamos denir agora a notao dos parmetros de
N
quando a populao
est representada de acordo com a congurao de conglomerados denida:
Total da caracterstica y em UP
i
:
Y
i
=
N
i
X
j=1
Y
ij
(i = 1, 2, , M)
sendo: Y
ij
o valor da caracterstica y associada j-sima unidade se-
cundria da unidade primria i.
Mdia da caracterstica y em UP
i
:
Y
i
=
Y
i
N
i
(i = 1, 2, , M)
3.1. PROBABILIDADES IGUAIS DE SELEO 113
Varincia da caracterstica y dentro da UP
i
:
S
2
i
=
1
N
i
1
N
i
X
j=1
(Y
ij
Y
i
)
2
(i = 1, 2, , M)
Total da caracterstica y em toda populao:
Y =
M
X
i=1
Y
i
Mdia da caracterstica y por unidade da populao:
Y =
Y
N
Mdia da caracterstica y por conglomerado:
Y =
Y
M
Varincia da caracterstica y em toda populao:
S
2
=
1
N 1
M
X
i=1
N
i
X
j=1
(Y
ij
Y )
2
3.1.3 Estatsticas da amostra em cada estgio
De acordo com o desenho de amostragem de conglomerados em 2 estgios,
sero denidas as seguintes estatsticas da amostra:
Total da caracterstica y em UP
0
i
:
Y
0
i
=
N
0
i
X
j=1
Y
0
ij
(i = 1, 2, , m)
sendo: Y
0
ij
o valor da caracterstica y associada j-sima unidade se-
cundria da unidade primria selecionada i.
114 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Mdia da caracterstica y em UP
0
i
:
Y
0
i
=
Y
0
i
N
0
i
(i = 1, 2, , m)
Varincia da caracterstica y em UP
0
i
:
S
0
2
i
=
1
N
0
i
1
N
0
i
X
j=1
(Y
0
ij
Y
0
i
)
2
(i = 1, 2, , m)
Total da caracterstica y na subamostra de UP
0
i
:
y
i
=
n
0
i
X
j=1
y
ij
(i = 1, 2, , m)
sendo: y
ij
o valor da caracterstica y associada j-sima unidade se-
cundria selecionada da unidade primria selecionada i.
Mdia da caracterstica y na subamostra de UP
0
i
:
y
i
=
y
i
n
0
i
(i = 1, 2, , m)
Varincia da caracterstica y na subamostra de UP
0
i
:
s
2
i
=
1
n
0
i
1
n
0
i
X
j=1
(y
ij
y
i
)
2
(i = 1, 2, , m)
3.1.4 Estimadores de total e mdias e respectivas var-
incias
Estimadores de total e mdias
Trata-se de obter estimadores para os parmetros de
N
. Para isso, ser
empregado um princpio de construo de estimadores no viciados a partir
do desenho da amostra cuja aplicabilidade geral na amostragem. O princ-
pio consiste consiste em ir construindo o estimador de dentro para fora (ou
de baixo para cima).
No nosso caso, a aplicao deste princpio resulta no seguinte raciocnio:
Seja UP
0
i
uma unidade primria qualquer selecionada da amostra. O total
de y emUP
0
i
dado por Y
0
i
, que no caso desconhecido visto se dispor apenas
de uma amostra das unidades de UP
0
i
. Entretanto, essa amostra pode ser
usada para estimar Y
0
i
,levando em conta que:
3.1. PROBABILIDADES IGUAIS DE SELEO 115
i) a amostra aleatria simples na UP
0
i
; e
ii) so conhecidos os valores y
i1
, y
i2
, , y
i n
0
i
da amostra na UP
0
i
.
Assim um estimador no viciado de Y
0
i
dado por:
b
Y
0
i
=
N
0
i
n
0
i
y
i
=
N
0
i
n
0
i
n
0
i
X
j=1
y
ij
= N
0
i
y
i
(i = 1, 2, , m)
Por outro lado, dado que as UP
s
da amostra so selecionadas comequiprob-
abilidade, o estimador de total conhecido da Ac1 para o total da populao
depende somente dos totais dos conglomerados da amostra: Y
0
1
, Y
0
2
, , Y
0
m
,
e dado por:
b
Y
Ac1
=
M
m
m
X
i=1
Y
0
i
Usando as idias anteriormente expostas, e lembrando que na Ac2 os
totais dos conglomerados da amostra so estimados por
b
Y
0
1
,
b
Y
0
2
, ,
b
Y
0
m
, segue-
se que um estimador do total Y dado por:
b
Y
Ac2
=
M
m
m
X
i=1
b
Y
0
i
=
M
m
m
X
i=1
N
0
i
n
0
i
y
i
=
M
m
m
X
i=1
N
0
i
n
0
i
n
0
i
X
j=1
y
ij
=
M
m
m
X
i=1
N
0
i
y
i
b
Y
Ac2
um estimador no viciado de Y, isto , E

b
Y
Ac2

= Y.
Para fazer essa demonstrao, utiliza-se esperanas condicionais. Assim,
lembrando que:
Se Z e X so variveis aleatrias ento:
E (Z) = E
X
[E (Z |X)]
Neste caso conveniente considerar internamente a esperana condi-
cionada sobre todas as possveis selees de subamostra quando se xa uma
dada seleo de unidades primrias UP
0
1
, , UP
0
m
, e depois a esperana
sobre todas as possveis selees de amostras de unidades primrias.
116 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Segue-se, ento que:
E

b
Y
Ac2

= E
UP
0
1
, ,UP
0
m

b
Y
Ac2
|UP
0
1
, , UP
0
m

= E
UP
0
1
, ,UP
0
m

M
m
m
X
i=1
N
0
i
y
i
|UP
0
i
!!
= E
UP
0
1
, ,UP
0
m

M
m
m
X
i=1
E(N
0
i
y
i
|UP
0
i
)
!
= E
UP
0
1
, ,UP
0
m

M
m
m
X
i=1
N
0
i
Y
0
i
!
= E
UP
0
1
, ,UP
0
m

M
m
m
X
i=1
Y
0
i
!
= E

b
Y
Ac1

= Y
Um estimador no viciado para Y dado por:
y
Ac2
=
b
Y
Ac2
N
=
M
mN
m
X
i=1
N
0
i
y
i
=
1
mN
m
X
i=1
N
0
i
y
i
pois,
E

y
Ac2

= E

b
Y
Ac2
N
!
=
1
N
E

b
Y
Ac2

=
Y
N
= Y
Um estimador no viciado para Y dado por:
y
Ac2
=
b
Y
Ac2
M
=
M
mM
m
X
i=1
N
0
i
y
i
=
1
m
m
X
i=1
N
0
i
y
i
pois,
E (y
Ac2
) = E

b
Y
Ac2
M
!
=
1
M
E

b
Y
Ac2

=
Y
M
= Y
Varincia dos estimadores de total e das mdias
Na obteno da expresso da varincia de
b
Y
Ac2
tambm ser utilizado o
emprego de esperanas condicionais, o que ir facilitar bastante essa deduo.
Deve-se lembrar que: Se Z e X so variveis aleatrias ento:
V (Z) = E
X
[V (Z |X)] +V
X
[E (Z |X)]
Da, segue-se que:
V

b
Y
Ac2

= E
UP
0
1
, ,UP
0
m
h
V

b
Y
Ac2
|UP
0
1
, , UP
0
m
i
+
+V
UP
0
1
, ,UP
0
m
h
E

b
Y
Ac2
|UP
0
1
, , UP
0
m
i
3.1. PROBABILIDADES IGUAIS DE SELEO 117
Porm, foi demonstrado anteriormente que:
E

b
Y
Ac2
|UP
0
1
, , UP
0
m

=
M
m
m
X
i=1
Y
0
i
=
b
Y
Ac1
Segue-se que:
V
UP
0
1
, ,UP
0
m
h
E

b
Y
Ac2
|UP
0
1
, , UP
0
m
i
= V
UP
0
1
, ,UP
0
m
h
b
Y
Ac1
i
= M
2
M m
M
S
2
e
m
onde:
S
2
e
=
1
M 1
M
X
i=1
(Y
i
Y )
2
Por outro lado:
V

b
Y
Ac2
|UP
0
1
, , UP
0
m

= V

M
m
m
X
i=1
N
0
i
y
i
|UP
0
i
!
=
M
2
m
2
m
X
i=1
N
02
i
V (y
i
|UP
0
i
)
=
M
2
m
2
m
X
i=1
N
02
i
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i
Logo:
E
UP
0
1
, ,UP
0
m
h
V

b
Y
Ac2
|UP
0
1
, , UP
0
m
i
= E
UP
0
1
, ,UP
0
m
"
M
2
m
2
m
X
i=1
N
02
i
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i
#
=
M
2
m
2
m
X
i=1
E
UP
0
i

N
02
i
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i

=
M
2
m
2
m
X
i=1
M
X
i=1

N
2
i
N
i
n
i
N
i
S
2
i
n
i

1
M
=
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
E assim, obtm-se nalmente:
V

b
Y
Ac2

= M
2
M m
M
S
2
e
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
118 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
onde as parcelas do 2
o
membro representam as componentes da varincia
devidas ao 1
o
e ao 2
o
estgios de seleo, respectivamente.
Segue-se, imediatamente, que as varincias dos estimadores das mdias
y
Ac2
e y
Ac2
so, respectivamente:
V

y
Ac2

= V

b
Y
Ac2
N
!
=
1
N
2
V

b
Y
Ac2

V (y
Ac2
) = V

b
Y
Ac2
M
!
=
1
M
2
V

b
Y
Ac2

Note-se que:
i) Se m = M ento, a 1
a
componente da varincia nula, ou seja:
V

b
Y
Ac2

=
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= V

b
Y
est

e este plano amostral equivale ao de uma amostra estraticada.


ii) Se n
i
= N
i
(i = 1, 2, , m) ento, a 2
a
componente da varincia
nula, ou seja:
V

b
Y
Ac2

= M
2
M m
M
S
2
e
m
= V

b
Y
Ac1

e este plano amostral equivale ao de uma amostra de conglomerados


em um estgio.
Uma anlise pouco cuidadosa do problema a partir deste resultado pode-
ria levar concluso de que:
V

b
Y
Ac2

V

b
Y
Ac1

posto que:
V

b
Y
Ac2

= V

b
Y
Ac1

+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
Isto verdadeiro se o nmero de conglomerados m for o mesmo nos dois
planos amostrais. Porm, como no plano amostral de conglomerados em 2
estgios feita a subamostragem, as amostras no tm o mesmo tamanho
em termos de unidades elementares. O tamanho da Ac2, em mdia, tem em
termos de unidades elementares f
2
% do nmero de unidades elementares da
Ac1.
A maneira correta de comparar os 2 desenhos de amostragem xando
o tamanho total da amostra, em termos de unidades elementares, e no o
nmero de conglomerados da amostra, como ser visto mais adiante.
3.1. PROBABILIDADES IGUAIS DE SELEO 119
3.1.5 Estimadores das varincias dos estimadores de
total e mdias
Em primeiro lugar, vamos nos ocupar para a obteno de um estimador no
viciado para a V

b
Y
Ac2

, propondo o seguinte estimador:


v

b
Y
Ac2

= M
2
M m
M
s
2
e
m
+
M
m
m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i
onde:
s
2
e
=
1
m1
m
X
i=1
(N
0
i
y
i
y
Ac2
)
2
A seguir ser demonstrado que o estimador v

b
Y
Ac2

no viciado para
V

b
Y
Ac2

.
Para esta prova, vamos mostrar que:
i) E(s
2
e
) = S
2
e
+
1
M
M
P
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
e
ii) E

M
m
m
P
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i

=
M
P
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
.
Demostrao da parte (i):
E(s
2
e
) = E

1
m1
m
X
i=1
(N
0
i
y
i
y
Ac2
)
2
!
=
1
m1
E

m
X
i=1
(N
0
i
y
i
y
Ac2
)
2
!
=
1
m1
E

m
X
i=1
(N
0
i
y
i
)
2
m(y
Ac2
)
2
!
=
1
m1
E

m
X
i=1
(N
0
i
y
i
)
2
!

m
m1
E

y
2
Ac2

Segue-se que:
120 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
E

m
X
i=1
(N
0
i
y
i
)
2
!
= E
UP
0
1
, ,UP
0
m

m
X
i=1
(N
0
i
y
i
)
2
|UP
0
i
!!
= E
UP
0
1
, ,UP
0
m

m
X
i=1
E

(N
0
i
y
i
)
2
|UP
0
i

!
= E
UP
0
1
, ,UP
0
m

m
X
i=1
V

(N
0
i
y
i
)
2
|UP
0
i

+
m
X
i=1
[E(N
0
i
y
i
|UP
0
i
)]
2
!
= E
UP
0
1
, ,UP
0
m

m
X
i=1
N
02
i
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i
+
m
X
i=1

N
0
i
Y
i

2
!
= mE
UP
0
1
, ,UP
0
m

N
02
i
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i

+mE
UP
0
1
, ,UP
0
m

N
i
Y
i

= m
M
X
i=1

N
2
i
N
i
n
i
N
i
S
2
i
n
i

1
M
+
m
M
M
X
i=1

N
i
Y
i

2
=
m
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
M
M
X
i=1
Y
2
i
Por outro lado, segue-se que:
E

y
2
Ac2

= V (y
Ac2
) + [E (y
Ac2
)]
2
= V

b
Y
Ac2
M
!
+
"
E

b
Y
Ac2
M
!#
2
= V

b
Y
Ac2
M
!
+
"
E

b
Y
Ac2
M
!#
2
=
1
M
2
(
M
2
M m
M
S
2
e
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+Y
2
)
=
M m
M
S
2
e
m
+
1
mM
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+Y
2
Assim, segue-se que:
3.1. PROBABILIDADES IGUAIS DE SELEO 121
E(s
2
e
) =
1
m1
E

m
X
i=1
(N
0
i
y
i
)
2
!

m
m1
E

y
2
Ac2

=
1
m1
(
m
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
M
M
X
i=1
Y
2
i
)
+

m
m1
(
M m
M
S
2
e
m
+
1
mM
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+Y
2
)
=

m
(m1) M

m
m1
1
mM

M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
+
m
(m1) M
M
X
i=1
Y
2
i

m
m1
Y
2

m
m1
M m
M
S
2
e
m
=
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
(m1)
1
M
"
M
X
i=1
Y
2
i
MY
2
#
+

m
m1
M m
M
S
2
e
m
E(s
2
e
) =
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
(m1)
1
M
"
M
X
i=1

Y
i
Y

2
#
+

m
m1
M m
M
S
2
e
m
=
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
(m1)

M 1
M

M m
Mm

S
2
e
=
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
m
(m1)

mM mM +m
Mm

S
2
e
=
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
mM
(m1)

m1
Mm

S
2
e
=
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+S
2
e
Agora resta a demonstrao de (ii):
122 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
E

M
m
m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i
!
= E
UP
0
1
, ,UP
0
m

M
m
m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i
|UP
0
i
!!
=
M
m
E
UP
0
1
, ,UP
0
m

m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
E(s
2
i
)
n
0
i
|UP
0
i
!
=
M
m
E
UP
0
1
, ,UP
0
m

m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
S
0
2
i
n
0
i
!
=
M
m
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
1
M
=
M
m
m
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
=
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
Finalizando:
E
h
v

b
Y
Ac2
i
= M
2
M m
M
E(s
2
e
)
m
+E

M
m
m
X
i=1
N
0
2
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i
!
= M
2
M m
M
1
m
"
S
2
e
+
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
#
+
+
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= M
2
M m
M
S
2
e
m
+M
2
M m
M
1
m
1
M
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
+
+
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= M
2
M m
M
S
2
e
m
+

M m
m
+ 1

M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= M
2
M m
M
S
2
e
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= V

b
Y
Ac2

3.1. PROBABILIDADES IGUAIS DE SELEO 123


3.1.6 Amostra autoponderada
Na amostragem de conglomerados em 2 estgios, existe uma frao de amos-
tragem no 1
o
estgio (f
1
=
m
M
) e existem fraes correspondentes ao 2
o
estgio
(f
2i
=
n
0
i
N
0
i
), que podem ser diferentes.
Todos os estimadores que trabalhamos anteriormente foram preparados
nessa hiptese. Supondo-se que:
f
21
6= f
22
6= 6= f
2m
Sabe-se que a probabilidade de US
ij
pertencer a amostra dada por:
P {US
ij
amostra} =
m
M
n
0
i
N
0
i
i, j
Foi dito anteriormente que comum na prtica trabalhar com uma frao
de amostragem f
2
constante em todos os conglomerados. Isto usual devido
principalmente simplicidade que resulta em termos de frmulas dos esti-
madores, como tambm simplicidade de operacionalizao da seleo da
amostra. neste caso, devemos ter:
f
2
=
n
N
onde:
n =
m
P
i=1
n
0
i
m
e N =
M
P
i=1
N
i
M
Da resulta que todas as unidades secundrias tero a mesma probabili-
dade de pertencer amostra, dada por:
P {US
ij
amostra} =
m
M
n
N
= f
1
f
2
= f =
n
N
O que veremos a seguir como se dene amostra autoponderada e, como
se modicam os estimadores de total e da respectiva varincia da amostragem
de conglomerados em 2 estgios.
Denio
Diz-se que a amostra de conglomerados em 2 estgios autoponderada
se e somente se as unidades secundrias tiverem a mesma probabilidade de
incluso na amostra, isto , se e somente se:
n
N
= P {US
ij
amostra} =
m
M
n
0
i
N
0
i

n
0
i
N
0
i
=
Mn
mN

n
0
i
N
0
i
=
n
N
124 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Adaptao dos estimadores do total e respectiva varincia
A expresso do estimador de total
b
Y
Ac2
pode ser reescrita como:
b
Y
Ac2
=
M
m
m
X
i=1
N
0
i
n
0
i
n
0
i
X
j=1
y
ij
=
M
m
N
n
m
X
i=1
n
0
i
X
j=1
y
ij
=
N
n
m
X
i=1
n
0
i
X
j=1
y
ij
=
1
f
m
X
i=1
n
0
i
X
j=1
y
ij
e a expresso da varincia de
b
Y
Ac2
ca:
V

b
Y
Ac2

= M
2
M m
M
S
2
e
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
= M
2
M m
M
S
2
e
m
+
M
m

N
n
1

M
X
i=1
N
i
S
2
i
= M
2
M m
M
S
2
e
m
+
M
m
N
n

N n
N

M
X
i=1
N
i
S
2
i
fazendo:
S
2
d
=
1
MN
M
X
i=1
N
i
S
2
i
Segue-se que:
V

b
Y
Ac2

= M
2

M m
M

S
2
e
m
+

MN

N n
N

S
2
d
mn
ou, em termos das fraes de amostragem:
V

b
Y
Ac2

= M

1
f
1
1

S
2
e
+N

1 f
2
f
1
f
2

S
2
d
Notando-se que:
s
2
d
=
1
mN
m
X
i=1
N
0
i
s
2
i
um estimador no viciado de S
2
d
, segue-se a expresso adaptada de v

b
Y
Ac2

b
Y
Ac2

= M
2

M m
M

s
2
e
m
+

MN

N n
N

s
2
d
mn
3.1. PROBABILIDADES IGUAIS DE SELEO 125
ou ainda, em termos das fraes de amostragem:
v

b
Y
Ac2

= M

1
f
1
1

s
2
e
+N

1 f
2
f
1
f
2

s
2
d
Uma vez mais convm ressaltar que a vantagem da amostra autopon-
derada advm da facilidade prtica de seleo da amostra e do clculo dos
estimadores e suas respectivas precises.
Exemplo 3.1 (Nascimento (1981), pg. 80)
Em determinada rea, de acordo com o ltimo Censo Demogrco, h 150
setores com aproximadamente 36.400 domiclios. Seleciona-se uma amostra
de 364 domiclios, com o objetivo de estimar o nmero de habitantes da rea.
Isto corresponde a uma frao geral de amostragem:
f =
364
36.400
=
1
100
H em mdia
36.400
150

= 243 domiclos por setor na rea.
Sero selecionados com equiprobabilidade 10 setores, o que corresponde
a uma frao de amostragem de 1
o
estgio de:
f
1
=
10
150
=
1
15
Para que a amostra seja autoponderada deve-se ter: f
1
f
2
= f.
Logo:
f
2
=
f
f
1
=
1
100
1
15
= 15%
Supondo que a amostra forneceu os seguintes dados, estimar o nmero
total de habitantes da rea e sua preciso.
126 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Setores Domiclios Domiclios da Moradores nos Varincia de y
da no setor subamostra domiclios da na subamos-
amostra (N
0
i
) no setor (n
0
i
) subamostra (y
i
) tra (s
2
i
)
1 320 48 168 4,018
2 210 32 138 5,224
3 180 27 130 5,905
4 400 60 222 1,044
5 250 38 201 2,840
6 221 33 149 4,345
7 120 18 97 6,000
8 500 75 300 2,012
9 262 39 199 3,484
10 238 36 108 3,000
Total 2.701 406 1.712 -
b
Y
Ac2
=
1
f
m
X
i=1
n
0
i
X
j=1
y
ij
=
1
1
100
(1.712) = 171.200 habitantes
s
2
e
=
1
m1
m
X
i=1
(N
0
i
y
i
y
Ac2
)
2
=
1
9
(1.502.364, 65) = 166.929, 41
y
Ac2
=
b
Y
Ac2
M
=
171.200
150
= 1.141, 33
s
2
d
=
1
mN
m
X
i=1
N
0
i
s
2
i
=
1
10 (243)
(8.886, 353) = 3, 657
v

b
Y
Ac2

= M

1
f
1
1

s
2
e
+N

1 f
2
f
1
f
2

s
2
d
= 150

1
1
15
1

166.929, 41 + 36.400

1
15
100
1
100

3, 657
= 350.551.750, 8 + 11.314.558, 1 = 361.866.308, 9
Logo:
cv

b
Y
Ac2

=
r
v

b
Y
Ac2

b
Y
Ac2
= 11, 11%
3.1. PROBABILIDADES IGUAIS DE SELEO 127
3.1.7 Dimensionamento da amostra de conglomerados
em 2 estgios
Na amostragem de conglomerados em um estgio, o dimensionamneto da
amostra pode ser feito xando-se uma preciso desejada, e calculando-se o
nmero de conglomerados da amostra, atravs da expresso da varincia.
Na amostragem de conglomerados em 2 estgios, o dimensionamento con-
siste em determinar no s o nmero de unidades primrias (conglomerados)
na amostra de 1
o
estgio, como tambm o nmero de unidades secundrias
da subamostra em cada unidade primria selecionada.
Uma soluo para o problema pode ser obtida utilizando-se a expresso
da varincia e introduzindo-se uma funo custo, que indica o custo da apli-
cao do desenho da amostra para os tamanhos de 1
o
e 2
o
estgios a serem
escolhidos.
Aqui ser considerado o caso simples emque o tamanho mdio das unidades
primrias N e o tamanho mdio da subamostra n so determinados de acordo
com um dos critrios possveis:
a) minimizar a varincia com custo xado;
b) minimizar o custo com varincia xada.
Denio de uma funo custo
A funo custo que vamos considerar no a nica possvel, mas a ade-
quada para muitas situaes prticas, e possibilita a soluo do problema de
determinao dos tamanhos de amostra segundo os dois critrios j denidos
de maneira simples.
Funo Custo:
C
T
= C
f
+C
1
m+C
2
mn
onde:
C
f
o custo xo;
C
1
o custo unitrio por unidade primria selecionada;
C
2
o custo unitrio por unidade secundria selecionada.
Na prtica, as despesas dever ser atribudas a cada umdos custos denidos
como segue:
Custo xo: C
f
- planejamento e orientao do trabalho, incluindo os salrios do pessoal
tcnico e as despesas de administrao;
128 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
- preparao de mapas e outras informaes que no dependamdo tamanho
da amostra a ser selecionada;
- impresso de tabelas e treinamento de pessoal de campo que no de-
penda do tamanho da amostra a ser selecionada.
Anal, devem ser includas como custo xo, as despesas que no variam
com o processo de seleo nem com o tamanho da amostra.
Custo de seleo das unidades primrias: C
1
m
- despesas de seleo das unidades primrias;
- preparao de roteiros de viagem para as unidades primrias;
- impresso do material para a amostra de unidades primrias;
- tempo de treinamento para investigao das unidades primrias;
- gastos de transporte para as unidades primrias e entre as mesmas.
Anal, devem ser includas aqui todas as despesas que variam com o
nmero de unidades primrias na amostra.
Custo de seleo das unidades secundrias: C
2
mn
- custo de entrevista de cada unidade secundria;
- impresso do material referente s unidades secundrias da amostra;
- despesas de transporte dentro das unidades primrias.
Enm, devemser includas aqui todas as despesas diretamente relacionadas
com o nmero de unidades secundrias na amostra.
3.1. PROBABILIDADES IGUAIS DE SELEO 129
Tamanho de amostra com custo xado e mnima varincia
Agora, vamos resolver o problema de determinao dos tamanhos de
amostra segundo o critrio de minimizao da varincia com o custo xado.
Para tanto, considere-se a seguinte funo Lagrangeana:
F = V (y
Ac2
) +(C
f
+C
1
m+C
2
mn C
T
)
que pode ser reescrita como:
F =
M m
M
S
2
e
m
+
N n
N
S
2
d
mn
+(C
1
m+C
2
mn C)
onde:
C = C
T
C
f
o multiplicador de Lagrange.
Tomando as derivadas parciais em relao a m e a n e igualando a zero
vem:
F
n
=
S
2
d
mn
2
+C
2
m = 0 (3.1)
F
m
=
S
2
e
m
2

N n
N
S
2
d
m
2
n
+(C
1
+C
2
n) = 0 (3.2)
De (1) obtm-se:
C
2
m
2
n
2
= S
2
d
(3.3)
De (2) obtm-se:
(C
1
+C
2
n) Nm
2
n = S
2
e
Nn +

N n

S
2
d
(3.4)
Dividindo-se (4) por (3), tem-se:
(C
1
+C
2
n) Nm
2
n
C
2
m
2
n
2
=
S
2
e
Nn +

N n

S
2
d
S
2
d
=
(C
1
+C
2
n) N
C
2
n
=
S
2
e
Nn +

N n

S
2
d
S
2
d
=(C
1
+C
2
n) N S
2
d
= S
2
e
C
2
N n
2
+

N n

C
2
nS
2
d
=

C
1
N +C
2
nN N C
2
n +C
2
n
2

S
2
d
= S
2
e
C
2
N n
2
130 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
=C
1
N S
2
d
= S
2
e
C
2
N n
2
C
2
n
2
S
2
d
=C
1
N S
2
d
= C
2
n
2

S
2
e
N S
2
d

=n
2
=
C
1
N S
2
d
C
2

S
2
e
N S
2
d

=n
otimo
=
v
u
u
t
C
1
N S
2
d
C
2

S
2
e
N S
2
d
(3.5)
Derivando a F em relao a , vem:
F

= C
1
m+C
2
mn C = 0
=m(C
1
+C
2
n) = C
=m =
C
C
1
+C
2
n
(3.6)
substituindo-se na expresso (6) o valor n
otimo
, obtm-se o valor timo de m:
m
otimo
=
C
C
1
+C
2
n
otimo
=
C
C
1
+C
2
v
u
u
t
C
1
N S
2
d
C
2

S
2
e
N S
2
d

(3.7)
Assim pode-se observar que:
i) n
otimo
cresce se C
1
cresce em relao a C
2
, ou seja, se cresce a parte do
custo referente seleo das unidades primrias, cabe aumentar n
otimo
e diminuir m
otimo
.
ii) Para achar n
otimo
, basta conhecer a razo
C
1
C
2
. Pequenas variaes deste
valor tm pouca inuncia sobre o valor de n
otimo
, visto que n
otimo
depende de
r
C
1
C
2
.
3.1. PROBABILIDADES IGUAIS DE SELEO 131
iii) o valor de n
otimo
pode ser estimado por:
b
n
otimo
=
v
u
u
u
t
C
1
C
2
s
2
d

s
2
e

s
2
d
n

pois:
E

s
2
d

= S
2
d
e
E

s
2
e

s
2
d
n

= E

s
2
e

N n
N
s
2
d
n

s
2
d
N

= E

s
2
e

s
2
d
N

= S
2
e

S
2
d
N
Note-se que isto vale somente se:
s
2
e

s
2
d
n
> 0
se isto no ocorrer, n
otimo
pode ser obtido considerando a funo custo:
C = m(C
1
+C
2
n)
- Se C > C
1
+C
2
N, ento:
n
otimo
= m aximo de n = N
implicando que
m
otimo
=
C
C
1
+N C
2
- Se C C
1
+C
2
N , ento n
otimo
a soluo para n da equao
C = C
1
+C
2
n =n
otimo
=
C C
1
C
2
e m
otimo
= 1
132 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Tamanho de amostra com varincia xada e custo mnimo
Aqui o problema a resolver minimizar a funo:
G = C +V (y
Ac2
)
onde:
o multiplicador de Lagrange.
Assim:
G = (C
1
m+C
2
mn) +

M m
M
S
2
e
m
+
N n
N
S
2
d
mn
!
Tomando as derivadas parciais em relao a m e a n e igualando a zero vem:
G
n
= C
2
m
S
2
d
mn
2
= 0 (3.8)
G
m
= C
1
+C
2
n

S
2
e
m
2
+
N n
N
S
2
d
m
2
n
!
= 0 (3.9)
imediato notar que estas equaes so idnticas quelas anterior-
mente obtidas com =
1

. Em conseqncia, a soluo para o valor timo


de n a mesma, seja xando o custo e minimizando a varincia, seja xando
a varincia e minimizando o custo.
Quanto ao valor timo de m obtido xando-se V (y
Ac2
) e substituindo-se
n
otimo
no lugar de n.
V (y
Ac2
) =
M m
M
S
2
e
m
+
N n
N
S
2
d
mn
=

1
m

1
M

S
2
e
+

1
n

1
N

S
2
d
m
= V (y
Ac2
)
=
1
m

S
2
e
+

1
n

1
N

S
2
d

= V (y
Ac2
) +
1
M
S
2
e
m =
S
2
e
+

1
n

1
N

S
2
d
V (y
Ac2
) +
1
M
S
2
e
3.1. PROBABILIDADES IGUAIS DE SELEO 133
m
otimo
=
S
2
e
+

1
n
otimo

1
N

S
2
d
V (y
Ac2
) +
1
M
S
2
e
sendo que V (y
Ac2
) deve ser xada.
Tamanho de amostra em funo do coeciente de correlao intra-
classe
Considere as expresses j encontradas no caso de amostragem de con-
glomerados em 1 estgio:
=
(M 1) S
2
e
M

1
N
S
2
d
MN 1
M N
S
2
(3.10)

MN 1

S
2
= (N 1) M S
2
d
+N (M 1) S
2
e
(3.11)
Substituindo-se (11) em (10), obtm-se:
=
(M 1) S
2
e
M

1
N
S
2
d
(N 1)
N
S
2
d
+
M 1
M
S
2
e
Logo:
1 =
S
2
d
(N 1)
N
S
2
d
+
M 1
M
S
2
e
1

=
S
2
d
(M 1) S
2
e
M

1
N
S
2
d

=
S
2
d
S
2
e

1
N
S
2
d
Assim, pode-se escrever:
n
otimo
=
v
u
u
t
C
1
C
2
N S
2
d

S
2
e
N S
2
d
=
v
u
u
u
t
C
1
C
2
S
2
d

S
2
e

1
N
S
2
d

ou
n
otimo
=
r
C
1
C
2
1

(3.12)
134 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
E assim verica-se, uma vez mais, a importncia prtica de conhecer o
valor do coeciente de correlao intraclasse.
Exemplo 3.2 (Nascimento (1981), pg. 88)
Em certa rea existem 740 setores censitrios rurais. Trata-se de estimar
a produo total de caf da rea, atravs e uma amostra de conglomerados
em 2 estgios, sendo os setores as unidades primrias e os estabelecimentos
produtores as unidades secundrias.
De uma pesquisa anterior sabe-se que para a caracterstica produo de
caf e o setor como conglomerado tem-se:
= 0, 201 e
C
1
C
2
= 10
Logo, o tamanho da subamostra em cada setor selecionado :
n
otimo
=
r
C
1
C
2
1

=
r
10
1 0, 201
0, 201

= 6
O custo da investigao de um estabelecimento foi orado em R$ 30,00
de modo que a funo custo :
C = 300m+ 30mn
A quantia total para a pesquisa R$ 35.000,00, sendo R$5.000,00 para a
parte xa dos custos.
Logo:
m =
30.000
300 + 30(6)
= 62 setores
correspondendo a um total de 6 (62) = 372 estabelecimentos produtores na
amostra.
A frao de amostragem do 1
o
estgio :
f
1
=
m
M
=
62
740
=
1
12
Considerando que cada setor tem em mdia N = 30 estabelecimentos, a
frao de amostragem do 2
o
estgio :
f
2
=
n
N
=
6
30
=
1
5
Logo, a frao geral de amostragem :
f = f
1
f
2
=

1
12

1
5

=
1
60
3.1. PROBABILIDADES IGUAIS DE SELEO 135
3.1.8 Efeito de conglomerao
O objetivo desta seo a comprovao de que a amostragem de conglomera-
dos em 2 estgios pode ser mais precisa que a amostragem de conglomerados
em 1 estgio. Isto ser feito comparando-se os respectivos efeitos de con-
glomerao em relao amostragem aleatria simples.
Para atingir esse objetivo necessrio, no entanto, escrever a expresso da
varincia V (y
Ac2
) em termos do coeciente de correlao intraclasse , o que
ser feito somente para o caso em que o tamanho mdio por conglomerado
N for admitido constante para os M conglomerados.
Assim, recordando as seguintes expresses:

MN 1

S
2
= (N 1) M S
2
d
+N (M 1) S
2
e
(3.13)
S
2
e
=
M N 1
(M 1) N
S
2
N

1 +

N 1

(3.14)
Substituindo-se (14) em (13) tem-se:

MN 1

S
2
= (N 1) M S
2
d
+
M N 1
N
S
2

1 +

N 1

MN 1

M N 1
N

1 +

N 1

S
2
= (N 1) M S
2
d
=

MN 1

N 1

N 1

N
!
S
2
= (N 1) M S
2
d
=

MN 1

N 1

(1 )
N
!
S
2
= (N 1) M S
2
d
=S
2
d
=

MN 1

N 1

(1 )
(N 1) MN
S
2
=S
2
d
=

MN 1

(1 )
MN
S
2
Lembrando que a varincia V (y
Ac2
) dada por:
V (y
Ac2
) =
M m
M
S
2
e
m
+
N n
N
S
2
d
mn
136 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
e supondo as seguintes aproximaes:
M m
M

= 1 e
N n
N

= 1 (3.15)
obtm-se:
V (y
Ac2
)

=
S
2
e
m
+
S
2
d
mn
V (y
Ac2
)

=
S
2
mN
M N 1
(M 1) N

1 +

N 1

+
1
mn

MN 1

(1 )
MN
S
2
Mas pela hiptese em (15) tem-se:
MN 1
MN

= 1 e
M N 1
(M 1) N

= 1 (3.16)
Logo:
V (y
Ac2
)

=
S
2
mN

1 +

N 1

+
1
mn
(1 ) S
2
V (y
Ac2
)

=
S
2
m
"
1
N
+

N 1

N
+
1
n


n
#
se N for grande =
1
N
0 e

N 1

N
1
Ento:
V (y
Ac2
)

=
S
2
mn
[ n + 1 ]
=
S
2
mn
[1 + ( n 1) ]
Se lembrarmos que
S
2
mn
a expresso aproximada para a varincia da
mdia de y da amostragem aleatria simples de tamanho mn (desprezando-
se a correo de populao nita), segue-se que:
V (y
Ac2
)

= V (y
AAS
) [1 + ( n 1) ]
Donde se conclui que o efeito de conglomerao da amostragem de
conglomerados em 2 estgios dado por [1 + ( n 1) ] .
De imediato segue-se que:
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 137
i) se > 0 = [1 + ( n 1) ] <<

1 +

N 1

que o efeito de
conglomerao na amostragem de conglomerados em 1 estgio.
Logo interessante manter n pequeno, o que implica em ter m grande.
Isto , a amostra deve ter mais unidades primrias e subamostras menores
(f
1
deve crescer e f
2
decrescer).
ii) se < 0 =[1 + ( n 1) ] >

1 +

N 1

Logo, a melhor alternativa fazer n = N, isto , fazer amostragem de


conglomerados em 1 estgio, tomando menos unidades primrias ( f
1
deve
decrescer e f
2
crescer).
Vale o comentrio: se f
1
cresce e, como em geral
C
1
C
2
>> 1, ento o custo
da pesquisa tende a crescer bastante, de modo que este fator no deve ser
ignorado na determinao dos tamanhos da amostra.
No exerccio 3.2, o efeito de conglomerao :
1 + ( n 1) = 1 + (6 1)0, 201 = 1 + 5(0, 201)

= 2
Para baixar esse efeito de conglomerao, poderia reduzir a relao de
custos
C
1
C
2
ou partir para a denio de uma nova unidade primria com
menor .
A ecincia da amostragem de conglomerados em 2 estgios em
relao amostragem aleatria simples de mesmo tamanho dada
por:
Ef =
V (y
AAS
)
V (y
Ac2
)

=
1
1 + ( n 1)
3.2 Controle de variao de tamanho das UPAs
Se o coeciente de correlao intraclasse positivo, a subamostragem melhora
e ecincia, posto que se substitui N por n no efeito de conglomerao.
No entanto, a inuncia da variao do tamanho das unidades primrias
ainda persiste na estimao e total, uma vez que a varincia do estimador:
V

b
Y
Ac2

= M
2
M m
M
S
2
e
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
ainda depende da variabilidade das unidades prrimrias.
Desse modo, as diversas formas de controle da variao de tamanho enun-
ciadas na amostragem de conglomerados em 1 estgio, podem ser repetidas
na amostragem de conglomerados em 2 estgios.
138 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
3.2.1 Probabilidades desiguais de seleo das unidades
primrias
Seja P
i
a probabilidade de seleo da unidade primria i (i = 1, 2, , M).
Valem as consideraes feitas na Ac1, com relao probabilidade pro-
porcional ao tamanho do conglomerado, denida por:
P
i
=
N
i
N
(i = 1, 2, , M)
ou probabilidade proporcional a uma medida de tamanho denida por:
P
i
=
X
i
X
(i = 1, 2, , M)
Seleciona-se uma amostra de m unidades primrias de acordo com as
probabilidades de seleo P
i
e com reposio.
Emcada uma dessas unidades primrias da amostra de 1
o
estgio, seleciona-
se uma subamostra com igual probabilidade de seleo e sem reposio.
Um estimador no viciado do total da caracterstica y dado por:
b
Y
p
Ac2
=
1
m
m
X
i=1
N
0
i
P
0
i
y
i
onde:
P
0
i
a probabilidade de seleo associada i-sima unidade primria sele-
cionada (UP
0
i
). P
0
i
igual a algum dos P
k
(k = 1, 2, , M);
N
0
i
o nmero de unidades secundrias na UP
0
i
;
n
0
i
o nmero de unidades secundrias selecionadas na UP
0
i
;
y
i
o total da caracterstica y na subamostra de UP
0
i
;
y
ij
o valor da caracterstica y na j-sima unidade selecionada da UP
0
i
.
y
i
=
y
i
n
0
i
=
n
0
i
P
j=1
y
ij
n
0
i
(i = 1, 2, , m)
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 139
Para mostrar que
b
Y
p
Ac2
no viciado, basta mostrar que: E

b
Y
p
Ac2

= Y
E

b
Y
p
Ac2

= E

1
m
m
X
i=1
N
0
i
P
0
i
y
i
!
= E
UP
0
1
, ,UP
0
m
"
E

1
m
m
X
i=1
N
0
i
P
0
i
y
i
|UP
0
i
!#
= E
UP
0
1
, ,UP
0
m
"
1
m
m
X
i=1
N
0
i
P
0
i
E(y
i
|UP
0
i
)
#
= E
UP
0
1
, ,UP
0
m
"
1
m
m
X
i=1
N
0
i
P
0
i
Y
0
i
#
= E
UP
0
1
, ,UP
0
m
"
1
m
m
X
i=1
Y
0
i
P
0
i
#
= E
UP
0
1
, ,UP
0
m
h
b
Y
P
Ac1
i
= Y
Um estimador no viciado da mdia da caracterstica y por unidade pop-
ulacional

Y

dado por:
y
p
Ac2
=
1
Nm
m
X
i=1
N
0
i
P
0
i
y
i
Varincia de
b
Y
p
Ac2
V

b
Y
p
Ac2

= V
UP
0
1
, ,UP
0
m
h
E

b
Y
p
Ac2
|UP
0
1
, , UP
0
m
i
+
+E
UP
0
1
, ,UP
0
m
h
V

b
Y
p
Ac2
|UP
0
1
, , UP
0
m
i
= V
UP
0
1
, ,UP
0
m
"
E

1
m
m
X
i=1
N
0
i
P
0
i
y
i
|UP
0
i
!#
+
+E
UP
0
1
, ,UP
0
m
"
V

1
m
m
X
i=1
N
0
i
P
0
i
y
i
|UP
0
i
!#
Mas,
V
UP
0
1
, ,UP
0
m
"
E

1
m
m
X
i=1
N
0
i
P
0
i
y
i
|UP
0
i
!#
= V
UP
0
1
, ,UP
0
m
"
1
m
m
X
i=1
N
0
i
P
0
i
E(y
i
|UP
0
i
)
#
= V
UP
0
1
, ,UP
0
m
"
1
m
m
X
i=1
N
0
i
P
0
i
Y
0
i
#
= V

b
Y
P
Ac1

=
1
m
M
X
i=1

Y
i
P
i
Y

2
P
i
140 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
e
E
UP
0
1
, ,UP
0
m
"
V

1
m
m
X
i=1
N
0
i
P
0
i
y
i
|UP
0
i
!#
= E
UP
0
1
, ,UP
0
m
"
1
m
2

m
X
i=1

N
0
i
P
0
i

2
V (y
i
|UP
0
i
)
!#
= E
UP
0
1
, ,UP
0
m
"
1
m
2

m
X
i=1

N
0
i
P
0
i

2
N
0
i
n
0
i
N
0
i
S
0
2
i
n
0
i
!#
=
1
m
2
m
M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
=
1
m
M
X
i=1
N
2
i
P
i
N
i
n
i
N
i
S
2
i
n
i
Logo,
V

b
Y
p
Ac2

=
1
m
M
X
i=1

Y
i
P
i
Y

2
P
i
+
1
m
M
X
i=1
N
2
i
P
i
N
i
n
i
N
i
S
2
i
n
i
Um estimador no viciado de V

b
Y
p
Ac2

dado por:
v

b
Y
p
Ac2

=
1
m(m1)
m
X
i=1

N
0
i
y
i
P
0
i

b
Y
p
Ac2

2
Prova que E

b
Y
p
Ac2

= V

b
Y
p
Ac2

:
E

b
Y
p
Ac2

= E

1
m(m1)
m
X
i=1

N
0
i
y
i
P
0
i

b
Y
p
Ac2

2
!
=
1
m(m1)
E

m
X
i=1

N
0
i
y
i
P
0
i

2
m

b
Y
p
Ac2

2
!
=
1
m(m1)

m
X
i=1
E

N
0
i
y
i
P
0
i

2
mE

b
Y
p
Ac2

2
!
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 141
mas:
E

N
0
i
y
i
P
0
i

2
= E
UP
0
1
, ,UP
0
m
"
E

N
0
i
y
i
P
0
i

2
|UP
0
i
#
= E
UP
0
1
, ,UP
0
m
"
V

N
0
i
y
i
P
0
i

|UP
0
i

N
0
i
y
i
P
0
i
|UP
0
i

2
#
= E
UP
0
1
, ,UP
0
m
_
_

N
0
i
P
0
i

2
N
0
i
n
0
i
N
0
i
S
0
2
i
n
0
i
+

N
0
i
Y
0
i
P
0
i
!
2
_
_
=
M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
+
M
X
i=1

N
i
Y
i
P
i

2
P
i
e
E

b
Y
p
Ac2

2
= V

b
Y
p
Ac2

+
h
E

b
Y
p
Ac2
i
2
= V

b
Y
p
Ac2

+Y
2
ento:
E

b
Y
p
Ac2

=
1
m(m1)

m
X
i=1
E

N
0
i
y
i
P
0
i

2
mE

b
Y
p
Ac2

2
!
1
m(m1)
m
X
i=1
E

N
0
i
y
i
P
0
i

m
m(m1)
E

b
Y
p
Ac2

2
=
1
m1

M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
+
M
X
i=1

N
i
Y
i
P
i

2
P
i
!
+

1
m1

V

b
Y
p
Ac2

+Y
2

=
1
m1

M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
+
M
X
i=1

Y
i
P
i

2
P
i
Y
2
!
+

1
m1
V

b
Y
p
Ac2

142 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS


E

b
Y
p
Ac2

=
1
m1

M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
+
M
X
i=1

Y
i
P
i

2
P
i
Y
2
M
X
i=1
P
i
!

1
m1
V

b
Y
p
Ac2

=
1
m1

M
X
i=1

N
i
P
i

2
N
i
n
i
N
i
S
2
i
n
i
P
i
+
M
X
i=1

Y
i
P
i
Y

2
P
i
!

1
m1
V

b
Y
p
Ac2

=
1
m1
mV

b
Y
p
Ac2

1
m1
V

b
Y
p
Ac2

=

m1
m1

V

b
Y
p
Ac2

= V

b
Y
p
Ac2

Amostra autoponderada
A probabilidade de uma unidade secundria qualquer (US
ij
) pertencer
a amostra, num esquema de amostragem em 2 estgios com probabilidade
desigual no primeiro estgio e equiprobabilidade no segundo estgio dada
por:
P {US
ij
amostra} = mP
0
i
n
0
i
N
0
i
i, j
Com este plano amostral, a amostra autoponderada se essa probabili-
dade constante e igual a frao de amostragem geral
n
N
. Tem-se, ento:
mP
0
i
n
0
i
N
0
i
=
n
N
= f
Observe que, em mdia,
m
P
i=1
n
0
i
d o tamanho pr-xado, pois: se n
0
i
=
nN
0
i
mNP
0
i
, ento:
E

m
X
i=1
n
0
i
!
=
n
mN
E

m
X
i=1
N
0
i
P
0
i
!
=
n
mN

m
X
i=1
M
X
i=1
N
i
P
i
P
i
!
=
nmN
mN
= n
Adaptao dos estimadores do total e da respectiva varincia
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 143
A expresso do estimador de total
b
Y
p
Ac2
pode ser reescrita como:
b
Y
p
Ac2
=
1
m
m
X
i=1
N
0
i
P
0
i
y
i
=
1
m
m
X
i=1
N
0
i
P
0
i
1
n
0
i
n
0
i
X
j=1
y
ij
=
1
f
m
X
i=1
n
0
i
X
j=1
y
ij
mesma expresso j encontrada com equiprobabilidades nos 2 estgios.
v

b
Y
p
Ac2

=
1
m(m1)
m
X
i=1

N
0
i
y
i
P
0
i

b
Y
p
Ac2

2
=
1
m(m1)
m
X
i=1
_
_
N
0
i
P
0
i
n
0
i
n
0
i
X
j=1
y
ij

b
Y
p
Ac2
_
_
2
=
1
m(m1)
m
X
i=1
_
_
m
f
n
0
i
X
j=1
y
ij

1
f
m
X
i=1
n
0
i
X
j=1
y
ij
_
_
2
=
m
2
m(m1) f
2
m
X
i=1
_
_
n
0
i
X
j=1
y
ij

1
m
m
X
i=1
n
0
i
X
j=1
y
ij
_
_
2
=
m
(m1) f
2
m
X
i=1
_
_
n
0
i
X
j=1
y
ij

1
m
m
X
i=1
n
0
i
X
j=1
y
ij
_
_
2
Exemplo 3.3 (Nascimento (1981), pg. 112)
Numa determinada localidade com 53 povoados, selecionam-se 14, com
reposio e probabilidade de seleo proporcional populao do ltimo
Censo. No povoado i da amostra, faz-se uma listagem das N
0
i
fazendas de
gado e seleciona-se uma subamostra de fazendas com tamanho suciente
para se obter uma frao geral de amostragem f =
1
100
das fazendas, com o
objetivo de estimar o nmero total de cabeas de gado.
Considerando:
P
0
i
a probabilidade de seleo do i-simo povoado selecionado;
N
0
i
o nmero de fazendas no i-simo povoado selecionado;
n
0
i
o nmero de fazendas na subamostra do i-simo povoado selecionado;
144 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
y
i
=
n
0
i
P
j=1
y
ij
o nmero de cabeas de gado na subamostra do i-simo povoado
selecionado; e a igualdade:
mP
0
i
n
0
i
N
0
i
=
n
N
= f
obtm-se a frao de amostragem de 2
o
estgio:
n
0
i
N
0
i
=

1
100

1
mP
0
i

=
1
1.400P
0
i
Feita a seleo dos 14 povoados e a listagem das fazendas, aplicou-se a
frao de amostragem de 2
o
estgio, obtendo-se as fazendas da subamostra e
levantando, em cada uma, o nmero de cabeas de gado.
Povoados (i) P
0
i
N
0
i
n
0
i
N
0
i
n
0
i
y
i
1 0,0026 19 0,2747 5 2.200
2 0,0098 23 0,0729 2 820
3 0,0146 31 0,0489 2 760
4 0,0167 40 0,0428 2 1.100
5 0,0187 54 0,0382 2 600
6 0,0187 54 0,0382 2 510
7 0,0220 39 0,0325 1 300
8 0,0249 55 0,0385 2 1.200
9 0,0258 46 0,0277 1 500
10 0,0298 83 0,0240 2 880
11 0,0362 74 0,0197 1 300
12 0,0370 70 0,0193 1 410
13 0,0465 60 0,0154 1 570
14 0,0465 60 0,0154 1 350
Total - - - 25 10.500
b
Y
p
Ac2
=
1
f
m
X
i=1
n
0
i
X
j=1
y
ij
= 100 (10.500) = 1.050.000 cabeas de gado.
v

b
Y
p
Ac2

=
m
(m1) f
2
m
X
i=1
_
_
n
0
i
X
j=1
y
ij

1
m
m
X
i=1
n
0
i
X
j=1
y
ij
_
_
2
=
14
13
(100)
2
(3.305.100) = 3.559.230, 77 (1000)
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 145
r
v

b
Y
p
Ac2

= 188.659, 24
cv

b
Y
p
Ac2

=
r
v

b
Y
p
Ac2

b
Y
p
Ac2
= 0, 1797
Estimao de proporo
Suponha que a populao seja dividida nas classes A e
e
A.
A unidade primria i ca dividida nas classes, com A
i
e
e
A
i
unidades,
respectivamente.
A subamostra de tamanho n
i
ca tambm dividida nas duas classes com
a
i
e ea
i
unidades, em cada unidade primria i.
Um estimador no viciado para estimar a proporo P
A
=
M
S
i=1
A
i
N
dado
por:
p
p
Ac2
= y
p
Ac2
=
1
Nm
m
X
i=1
N
0
i
P
0
i
y
i
=
1
Nm
m
X
i=1
N
0
i
P
0
i
p
i
onde:
p
i
=
a
0
i
n
0
i
a proporo de A na subamostra.
Um estimador no viciado de V (p
p
Ac2
) dado por:
v (p
p
Ac2
) =
1
m(m1)
m
X
i=1

N
0
i
NP
0
i
p
i
p
p
Ac2

2
Se a amostra autoponderada, ocorre a condio:
mP
0
i
n
0
i
N
0
i
=
n
N
= f
logo:
p
p
Ac2
=
1
n
m
X
i=1
a
0
i
v (p
p
Ac2
) =
1
m(m1)
m
X
i=1

m
n
a
0
i
p
p
Ac2

2
Exemplo 3.4
146 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Considere o exerccio 3.3. Suponha que as fazendas da subamostra foram
classicadas de acordo com o tipo de criao de gado: para corte ou no (
para leite e/ou reproduo). Deseja-se estimar a proporo das fazendas cujo
tipo de criao de gado para corte e o coecente de variao associado a
essa estimativa.
Os valores obtidos na subamostra foram:
Povoados N
o
de fazendas N
o
de fazendas com
da amostra na subamostra criao de gado para corte
1 5 3
2 2 1
3 2 1
4 2 0
5 2 2
6 2 1
7 1 0
8 2 1
9 1 0
10 2 0
11 1 0
12 1 0
13 1 0
14 1 1
Total 25 10
p
p
Ac2
=
1
n
m
X
i=1
a
0
i
=
10
25
= 0, 40
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 147
v (p
p
Ac2
) =
1
m(m1)
m
X
i=1

m
n
a
0
i
p
p
Ac2

2
=
1
m(m1)

m
X
i=1

m
n
a
0
i

2
m(p
p
Ac2
)
2
!
=
m
m1

m
X
i=1

a
0
i
n

(p
p
Ac2
)
2
m
!
=
14
13

1
(25)
2
(9 + 4 + 1 + 1 + 1 + 1 + 1)

10
25

2
14
!
=
14
13

18
625

100
625 (14)

=
14
13

18 (14) 100
625 (14)

=
1
13

18 (14) 100
625

=
1
13

18 (14) 100
625

=
1
13

152
625

= 0, 0187076
q
v (p
p
Ac2
) = 0, 1367757
cv (p
p
Ac2
) =
p
v (p
p
Ac2
)
p
p
Ac2
= 0, 342
3.2.2 Estraticao das unidades primrias e seleo
com probabilidades desiguais de seleo
A estraticao das unidades primrias feita grupando em mesmo estrato
as unidades primrias de tamanhos aproximadamente iguais. A seleo
das unidades primrias, dentro de cada estrato feita com probabilidade
proporcional ao tamanho.
O processo para denir os estimadores muito simples. Basta consid-
erar as expresses do item anterior e adapt-las a um estrato genrico h,
acrescentando aos smbolos um ndice h (h=1,2, , L).
Recorde que o estimador de Y num esquema com 2 estgios de seleo e
probabilidades desiguais de seleo no 1
o
estgio (sem considerar a estrati-
cao das unidades de 1
o
estgio) e com reposio e equiprobabilidades no
2
o
estgio dado por:
b
Y
p
Ac2
=
1
m
m
X
i=1
N
0
i
P
0
i
y
i
148 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
No estrato h, o estimador do total do estrato h, Y
h
, dado por:
b
Y
p
h.Ac2
=
1
m
h
m
h
X
i=1
N
0
hi
P
0
hi
y
hi
conseqentemente, o estimador de Y dado por:
b
Y
p.est
Ac2
=
L
X
h=1
b
Y
p
h.Ac2
=
L
X
h=1
1
m
h
m
h
X
i=1
N
0
hi
P
0
hi
y
hi
Recorde-se que a varincia de
b
Y
p
Ac2
:
V

b
Y
p
Ac2

=
1
m
M
X
i=1

Y
i
P
i
Y

2
P
i
+
1
m
M
X
i=1
N
2
i
P
i
N
i
n
i
N
i
S
2
i
n
i
No estrato h, a varincia do estimador do total do estrato h, V

b
Y
p
h.Ac2

,
dado por:
V

b
Y
p
h.Ac2

=
1
m
h
M
h
X
i=1

Y
hi
P
hi
Y
h

2
P
hi
+
1
m
h
M
h
X
i=1
N
2
hi
P
hi
N
hi
n
hi
N
hi
S
2
hi
n
hi
conseqentemente, a varincia de
b
Y
p.est
Ac2
dada por:
V

b
Y
p.est
Ac2

=
L
X
h=1
V

b
Y
p
h.Ac2

=
L
X
h=1
1
m
h
M
h
X
i=1

Y
hi
P
hi
Y
h

2
P
hi
+
L
X
h=1
1
m
h
M
h
X
i=1
N
2
hi
P
hi
N
hi
n
hi
N
hi
S
2
hi
n
hi
O estimador da V

b
Y
p.est
Ac2

dado por:
v

b
Y
p.est
Ac2

=
L
X
h=1
1
m
h
(m
h
1)
m
X
i=1

N
0
hi
y
hi
P
0
hi

b
Y
p
h.Ac2

2
Amostra autoponderada
A probabilidade de uma unidade secundria qualquer do estrato h per-
tencer a amostra, num esquema de amostragem em 2 estgios dada por:
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 149
m
h
P
0
hi
n
0
hi
N
0
hi
Esta probabilidade pode ser constante no estrato ou variar de estrato para
estrato. , neste caso:
m
h
P
0
hi
n
0
hi
N
0
hi
=
n
h
N
h
(h = 1, 2, , L)
ou ser constante para todos os estratos:
m
h
P
0
hi
n
0
hi
N
0
hi
=
n
N
(h = 1, 2, , L)
No primeiro caso, a amostra autoponderada no estrato e no segundo
caso autoponderada em geral.
3.2.3 Estimador de razo
Estuda-se agora o estimador de razo, tendo como caracterstica auxiliar o
tamanho das unidades primrias, num esquema de amostragem de conglom-
erados em 2 estgios com equiprobabilidade nos 2 estgios.
Sabe-se que a mdia por unidade secundria :
Y =
M
P
i=1
Y
i
M
P
i=1
N
i
=
Y
N
o que mostra que Y pode ser entendida como uma razo de duas mdias.
Um estimador consistente de Y obtido substituindo-se o numerador e
denominador por estimadores no viciados.
Desse modo, representando por y
R
Ac2
esse estimador consistente, tem-se:
y
R
Ac2
=
1
m
m
P
i=1
N
0
i
y
i
1
m
m
P
i=1
N
0
i
=
m
P
i=1
N
0
i
y
i
m
P
i=1
N
0
i
cuja varincia dada por:
150 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
V

y
R
Ac2

=
M m
MN
2
S
2
eR
m
+
1
Mm
M
X
i=1

N
i
N

2
N
i
n
i
N
i
S
2
i
n
i
S
2
eR
=
1
M 1
M
X
i=1
N
2
i

Y
i
Y

2
e um estimador consistente para essa varincia :
v

y
R
Ac2

=
M m
Mm(m1)
m
X
i=1

N
0
i
N

2
y
i
y
R
Ac2

2
+
1
Mm
m
X
i=1

N
0
i
N

2
N
0
i
n
0
i
N
0
i
S
02
i
n
0
i
Estimador de razo para o total Y :
b
Y
R
Ac2
= MN y
R
Ac2
= MN
_
_
_
_
m
P
i=1
N
0
i
y
i
m
P
i=1
N
0
i
_
_
_
_
e a varincia de
b
Y
R
Ac2
dada por:
V

b
Y
R
Ac2

=

MN

2
V

y
R
Ac2

= M
2
M m
M
S
2
eR
m
+
M
m
M
X
i=1
N
2
i
N
i
n
i
N
i
S
2
i
n
i
e um estimador consistente para essa varincia :
v

b
Y
R
Ac2

=
M
2
m

M m
M

1
m1

m
X
i=1
N
02
i

y
i
y
R
Ac2

2
+
+
M
m
m
X
i=1
N
0
i
2
N
0
i
n
0
i
N
0
i
s
02
i
n
0
i
Supondo M >> m =
M
2
m
>>
M
m
, ento a expresso acima pode ser
aproximada para:
v

b
Y
R
Ac2

=
M
2
m

M m
M

1
m1

m
X
i=1
N
02
i

y
i
y
R
Ac2

2
3.2. CONTROLE DE VARIAO DE TAMANHO DAS UPAS 151
ou
v

b
Y
R
Ac2

= M
2
s
2
eR
m
com
s
2
eR
=
1
m1
m
X
i=1
N
02
i

y
i
y
R
Ac2

2
Amostra autoponderada
Sabe-se que a condio para que a amostra seja autoponderada dada
pela igualdade:
m
M
n
i
N
i
=
n
N
= f
ou seja, todas as unidades secundrias tm a mesma probabilidade
n
N
de
pertencer amostra. Nesta condio, tem-se:
y
R
Ac2
=
N
n
m
P
i=1
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
=
1
f
2
m
P
i=1
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
sendo f
2
=
n
N
a frao de amostragem de 2
o
estgio.
Para o estimador da varincia aproximada de
v

y
R
Ac2

=
s
2
eR
N
2
m
com M >> m e
s
2
eR
=
1
m1
m
X
i=1
N
02
i

y
i
y
R
Ac2

2
=
1
m1
m
X
i=1
N
02
i
n
02
i
_
_
_
_
_
_
n
0
i
X
j=1
y
ij

m
P
i=1
N
0
i
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
_
_
_
_
_
_
2
=
1
m1

mN
nM

2 m
X
i=1
_
_
_
_
_
_
n
0
i
X
j=1
y
ij

m
P
i=1
N
0
i
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
_
_
_
_
_
_
2
152 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
ou
v

y
R
Ac2

=
s
2
eR
N
2
m
=
m
(m1) n
2
m
X
i=1
_
_
_
_
_
_
n
0
i
X
j=1
y
ij

m
P
i=1
N
0
i
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
_
_
_
_
_
_
2
Exemplo 3.5
Suponha que se deseja estimar o consumo mdio semanal por domiclio
(em unidades de produto) de determinado produto para alimentao.
Dispe-se de um mapa da localidade onde podem ser identicados 400
quarteires, que sero considerados unidades primrias de amostragem. Sabe-
se que existem na localidade cerca de 26.000 domiclios dando uma mdia de
65 domiclios por quarteiro. Seleciona-se uma amostra autoponderada de
650 domiclios com 2 estgios de seleo e com equiprobabilidade em cada
estgio, tendo xado a frao de amostragem do 1
o
estgio em
1
8
, o que
implicou na seleo de 50 quarteires.
Neste caso f =
n
N
=
650
26.000
=
1
40
. Logo a frao de amostragem do 2
o
estgio dada por: f
2
=
f
f
1
=
1
5
.
Sabendo-se que:
i) o nmero de domiclios nos quarteires da amostra
m
P
i=1
N
0
i
= 3.152;
ii) o nmero de domiclios selecionados na subamostra dos quarteires
selecionados
m
P
i=1
n
0
i
= 710;
iii) o total de unidades consumidas nos domiclios selecionados na sub-
amostra dos quarteires selecionados
m
P
i=1
n
0
i
P
j=1
y
ij
= 1.910; e que
iv)
m
P
i=1
_
_
_
_
_
_
n
0
i
P
j=1
y
ij

m
P
i=1
N
0
i
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
_
_
_
_
_
_
2
= 4.500.
3.3. EXERCCIOS 153
a estimativa do consumo mdio semanal por domiclio dada por:
y
R
Ac2
=
1
f
2
m
P
i=1
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
= (5)
1.910
3.152
= 3, 03
e a estimativa aproximada da varincia dada por:
v

y
R
Ac2


=
m
(m1) n
2
m
X
i=1
_
_
_
_
_
_
n
0
i
X
j=1
y
ij

m
P
i=1
N
0
i
n
0
i
P
j=1
y
ij
m
P
i=1
N
0
i
_
_
_
_
_
_
2
=
50
49 (710)
2
(4.500) = 0, 0091
cv

y
R
Ac2

=
r
v

y
R
Ac2

y
R
Ac2
= 0, 031
3.3 Exerccios
3.3.1 Compare a preciso de uma amostra de conglomerados em 2 estgios
(Ac2) com a frao de subamostragem de 50% com a de uma amostra
de conglomerados em um estgio (Ac1)de igual tamanho, supondo que
o tamanho mdio do conglomerado de 50 unidades e que o coeciente
de correlao intraclasse igual a 0,1.
Indicar se h ganho ou perda relativa da Ac2 em relao a Ac1.
(Devem ser usadas as frmulas aproximadas relacionando as varincias
da Ac1 com a amostra aleatria simples (AAS), e da Ac2 com a AAS).
3.3.2 Os habitantes de um bairro esto distribudos em 149 quarteires, onde
se estima que h um total de 8.500 domiclios. Deseja-se estimar o
nmero total de domiclios alugados no bairro.
a) Represente esquematicamente a populao de interesse, denindo
adequadamente:
154 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
unidades primrias; e
unidades secundrias.
b) Para uma caracterstica genrica y, dena:
a notao dos parmetros das unidades primrias (total, m-
dia e varincia); e
a notao dos parmetros da populao (total, total mdio por
unidade primria, mdia por unidade da populao e varincia
global).
c) Dena um esquema de amostragem de conglomerados em 2 est-
gios que permita selecionar uma amostra probabilstica das unidades
da populao com o objetivo de estimar o total de domiclios alu-
gados no bairro.
d) Considerando o esquema apresentado em c), obtenha um esti-
mador no viciado para o total de domiclios alugados no bairro,
e uma expresso para a varincia desse estimador.
3.3.3 Deseja-se selecionar uma amostra de m conglomerados, de uma pop-
ulao de 90 conglomerados, nos quais ser selecionada uma sub-
amostra de n unidades em cada conglomerado da amostra. Ser usada
amostragem aleatria simples sem reposio em ambos os estgios para
estimar a mdia por unidade elementar de uma dada caracterstica.
Assume-se que a funo custo da forma:
C
t
= C
0
+C
1
m+C
2
mn
Dado que C
t
= 1.000, C
0
= 300, C
1
= 9 e C
2
= 1 encontre os val-
ores timos do nmero de conglomerados da amostra e do nmero de
unidades a serem selecionadas por conglomerado, sabendo-se que:
S
2
d
= 49, 5 S
2
e
= 9, 045 N = 20
3.3.4 Numa grande cidade, um bairro continha 100 quarteires dos quais 10
foramselecionados comprobabilidade proporcional a umdado tamanho,
com reposio. Uma amostra autoponderada foi selecionada com frao
geral f = 2%. Utilize os dados observados, mostrados a seguir:
3.3. EXERCCIOS 155
Quarteiro n
o
de pessoas dos n
o
de cmodos nos domi-
na amostra domiclios selecionados clios selecionados nos
nos quarteiro da amostra quarteires da amostra
1 115 60
2 80 52
3 82 58
4 93 56
5 105 62
6 109 51
7 130 72
8 93 48
9 109 71
10 95 58
Total 1.011 588
a) Estime o n
o
total de pessoas no bairro e o respectivo coeciente
de variao.
b) Estime o n
o
total de comdos dos domiclios do bairro e o respec-
tivo coeciente de variao.
c) Estime o n
o
mdio de pessoas por cmodo nos domiclios do bairro.
3.3.5 Os habitantes de um bairro esto distribudos em 150 quarteires, onde
se estima que h um total de 9.000 domiclios. Deseja-se estimar o
nmero total de domiclios alugados no bairro. De um censo anterior
se conhece o nmero de domiclios por quarteiro. O oramento e o
tempo disponveis para fazer a pesquisa permitem que se realize cerca
de 300 entrevistas.
a) Dena um esquema de amostragem de conglomerados em 2 est-
gios que permita selecionar uma amostra probabilstica das unidades
da populao com o objetivo de estimar o total de domiclios alu-
gados no bairro.
b) Considerando o esquema apresentado em a), apresente um esti-
mador no viciado para o total de domiclios alugados no bairro,
e uma expresso para a varincia desse estimador.
156 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
3.3.6 De uma populao de 100 conglomerados de 40 elementos cada um
foi selecionada uma amostra de 2 estgios, com seleo aleatria sem
reposio em cada estgio. Foram selecionadas 6 unidades primrias
no primeiro estgio e a frao de subamostragem de 10%.
Sabendo-se que para uma determinada caracterstica y:
m
P
i=1
y
i
= 84 s
2
d
= 1, 33 s
2
e
= 1338, 65
a) Calcule a estimativa de total para a caracterstica y e o respectivo
coeciente de variao.
b) Calcule a participao da componente da varincia devida ao 1
o
estgio.
c) O que voc faria para diminuir a contribuio dessa componente de
varincia devida ao 1
o
estgio?
3.3.7 Uma pesquisa realizada com a nalidade de fornecer informaes so-
bre a produo de uma certa planta que s pode ser produzida com
autorizao do governo. As permisses concedidas no incio da estao
de cultivo foram usadas como fonte de informao. Essas permisses
so concedidas pelas prefeituras dos municpios. A amostra ser feita
em 2 estgios: primeiramente seleciona-se uma amostra de municpios;
em seguida, os entrevistadores visitaro as prefeituras dos municpios
selecionados, preparando ento uma lista dos produtores que tm per-
misso e selecionaro uma amostra de produtores. A seguir, visitaro
as fazendas coletando os dados necessrios. Como nem todos os mu-
nicpios possuem produtores dessa planta, cada municpio selecionado
ter um entrevistador exclusivo.
A seguir voc encontrar alguns itens que compemo custo da pesquisa.
Indique com um X na coluna apropriada se os custos podem ser con-
siderados parte do custo geral, custo de unidade de primeiro estgio ou
custo de unidade de segundo estgio. (Marque um nico X para cada
item de custo apresentado).
3.3. EXERCCIOS 157
Item (descrio) Geral 1
o
estgio 2
o
estgio
a) Impresso dos questionrios.
b)Treinamento dos entrevistadores.
c) Obteno da lista de municpios
que fornecem permisso.
d) Viagem aos municpios que for-
necem permisso selecionados, para
selecionar amostra de produtores.
e) Seleo da amostra de municpios
com permisso.
f) Obteno de informao dos pro-
dutores selecionados.
g) Vericao do trabalho de campo
dos entrevistadores, feita pelos super-
visores.
h) Crtica dos questionrios coletados.
i) Preparao de um programa para ta-
bulao dos resultados.
j) Preparao e divulgao dos resulta-
dos nais da pesquisa.
3.3.8 Uma populao est formada por N unidades elementares agrupadas
em 50 conglomerados de tamanho desiguais N
i
(i = 1, 2, , M). O
valor de N =
M
P
i=1
N
i
conhecido e igual a 1.000. Com objetivo de es-
timar a proporo de unidades elementares pertencentes a uma certa
classe, foi decidido utilizar uma amostra de conglomerados com sub-
amostragem. Em ambos os estgios foi empregado o procedimento de
seleo com probabilidades iguais sem reposio.
158 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
No 1
o
estgio foram selecionados 5 conglomerados com os seguintes
valores de N
i
: 6, 10, 8, 20 e 60. No 2
o
com frao amostral f
2i
=
4
N
i
,
foram obtidos os seguintes valores para o nmero de elementos que
pertencem classe em questo: 1, 3, 2, 2 e 3.
So fornecidos, ainda, os seguintes resultados:
s
2
e
=
1
m1
5
X
i=1
(N
0
i
y
i
y
Ac2
)
2
= 318, 67
5
X
i=1
N
02
i
N
0
i
n
0
i
N
0
i
s
2
i
n
0
i
= 118, 78
5
X
i=1
N
02
i

y
i
y
R
Ac2

2
= 53, 20
a) D a probabilidade de que a unidade elementar j do conglom-
erado i pertena a amostra e determine o nmero de unidades
elementares selecionadas em cada conglomerado.
b) Estime a proporo de unidades elementares que pertenam
classe e o respectivo coeciente de variao.
c) D as estimativas denidas em b) utilizando o estimador de razo,
adotando o tamanho dos conglomerados como varivel auxiliar.
d) Comente as vantagens e desvantagens do estimador usado em c)
em relao ao usado em b).
3.3.9 Para estudar as condies de vida dos trabalhadores que vivem em uma
rea industrial, foi selecionada uma amostra estraticada com2 estgios
de seleo. Em cada estrato da amostra foram selecionadas 4 fbricas
com probabilidade proporcional ao nmero de trabalhadores obtidos
de um perodo anterior e de cada fbrica selecionada foi selecionado
aleatoriamente um certo nmero de trabalhadores, totalizando uma
amostra de 1000 trabalhadores.
Sabe-se que foram denidos 4 estratos e que o nmero de trabalhadores
conhecidos de um perodo anterior em cada estrato dado por:
N
1
= 5.896 N
2
= 43.096 N
3
= 31.625 N
4
= 10.774
4
P
h=1
N
h
= 91.391
3.3. EXERCCIOS 159
Determine o nmero de trabalhadores a serem selecionados em cada
fbrica de tal modo a ter uma amostra autoponderada.
3.3.10 Explique qual a vantagem de se fazer uma amostra de conglomera-
dos em 2 estgios ao invs de uma amostra de conglomerados em um
estgio.
160 CAPTULO 3. CONGLOMERADOS EM 2 ESTGIOS
Captulo 4
Conglomerados em 3 estgios
4.1 Introduo
A diculdade de cadastramento para seleo da amostra se reduz medida
em que aumenta o nmero de estgios. Mas no entanto, medida em que
aumenta o nmero de estgios, mais se torna complicada a expresso da
varincia do estimador.
Seleciona-se uma amostra de r unidades primrias. Seja UP
0
i
a i-sima
unidade primria da amostra. De cada unidade primria da amostra seleciona-
se uma amostra de unidades secundrias. Desse modo na UP
0
i
seleciona-se
uma amostra de m
0
i
unidades secundrias. De cada unidade secundria da
amostra seleciona-se uma amostra de unidades tercirias. Assim, na US
00
ij
seleciona-se uma amostra de n
00
ij
unidades tercirias.
Associado UT
ijk
(unidade terciria) a observao y
ijk
,obtm-se a amostra
nal, constituda pelo conjunto:
n
y
ijk

i = 1, 2, , r; j = 1, 2, , m
0
i
; k = 1, 2, , n
00
ij
o
sendo:
n =
r
X
i=1
m
0
i
X
j=1
n
00
ij
4.2 Seleo com probabilidades desiguais
Seja P
i
a probabilidade de seleo da unidade primria UP
i
(i = 1, 2, , R) .
De cada UP
0
i
da amostra selecionam-se m
0
i
unidades secundrias, tendo a US
ij
probabilidade de seleo P
ij
. Finalmente, da US
00
ij
da amostra selecionam-se
n
00
ij
unidades tercirias com equiprobabilidade.
161
162 CAPTULO 4. CONGLOMERADOS EM 3 ESTGIOS
4.2.1 Estimador no viciado de Y
Considerando o processo em 2 estgios, o estimador do total da UP
0
i
dado
por:
b
Y
p
i
=
1
m
0
i
m
0
i
X
j=1
N
00
ij
P
00
ij
y
ij
logo, o estimador no viciado de Y dado por:
b
Y
p
Ac3
=
1
r
r
X
i=1
1
P
0
i
b
Y
p
i
=
1
r
r
X
i=1
1
P
0
i
1
m
0
i
m
0
i
X
j=1
N
00
ij
P
00
ij
y
ij
Caso particular de equiprobabilidade no 1
o
e 2
o
estgios:
P
0
i
=
1
R
e P
00
ij
=
1
M
0
i
b
Y
Ac3
=
R
r
r
X
i=1
M
0
i
m
0
i
m
0
i
X
j=1
N
00
ij
y
ij
Amostra autoponderada (caso genrico)
A probabilidade da UT
ijk
pertencer a amostra dada por: rP
0
i
m
0
i
P
00
ij
n
00
ij
N
00
ij
A amostra ser autoponderada se esta probabilidade for constante e igual
a frao geral de amostragem, isto :
rP
0
i
m
0
0
i
P
00
ij
n
00
ij
N
00
ij
=
n
N
= f
Neste caso, o estimador
b
Y
p
Ac3
assume a mesma forma do estimador
b
Y
Ac3
:
b
Y
p
Ac3
=
b
Y
Ac3
=
1
f
r
X
i=1
m
0
i
X
j=1
n
00
ij
X
k=1
y
ijk
O captulo seguinte apresenta alguns mtodos especiais para a estimao
das varincias de estimadores que so emgeral aplicados emdesenhos amostrais
complexos.
4.3. EXERCCIOS 163
4.3 Exerccios
4.3.1 Os estudantes de 1
o
grau de um determinado municpio esto distribu-
dos em 15 escolas, com uma mdia de 20 turmas por escola e estima-se
que h um total de 10.000 estudantes. Deseja-se estimar a proporo
de alunos aprovados no ltimo ano no municpio.
a) Represente esquematicamnete a populao de interesse, denido ad-
equadamente:
- unidades primrias;
- unidades secundrias;
- unidades tercirias;
- a caracterstica y.
b) Para uma caracterstica genrica y, dena:
- a notao dos parmetros para uma dada unidade primria (to-
tal, mdia por unidade secundria e mdia por unidade da
populao);
- a notao dos parmetros da populao (total, mdia por unidade
primria, mdia por unidade secundria e mdia por unidade
da populao).
c) Dena um esquema de amostragem de conglomerados em 3 estgios
que permita selecionar uma amostra probabilstica das unidades
da populao com o objetivo de estimar a proporo de alunos
aprovados no ltimo ano no municpio.
d) Considerando o esquema apresentado em c), obtenha um estimador
no viciado para a proporo de alunos aprovados no ltimo ano
no municpio.
164 CAPTULO 4. CONGLOMERADOS EM 3 ESTGIOS
Captulo 5
Estimao de varincias
5.1 Porque importante estimar varincias?
Em amostragem, a estimao de varincias uma componente essencial da
abordagem de inferncia utilizada: sem estimativas de varincia, no se ter
indicao da preciso das estimativas.
Tentao: fcil esquecer que os resultados das pesquisas so baseados
apenas em uma amostra da populao, e portanto sujeitos ao erro amostral.
Com uma estimativa de varincia para cada estimativa de parmetro de
interesse, fcil obter intervalos de conana e fazer inferncias estatsticas
adequadas:
Estimativas de varincia so tambmessenciais para comunicar aos usurios
da pesquisa sobre a qualidade e preciso dos resultados.
Algumas vezes, problemas inesperados podem ser detectados mediante
anlise das estimativas de varincia: valores suspeitos (outliers), celas
raras, etc.
5.2 Problemas para estimar varincias
Para os casos regulares, estimadores de varincia esto disponveis nos
livros-texto de Amostragem. Entretanto, os pacotes estatsticos tradicionais
(SAS, SPSS, BMDP, MINITAB, etc.) no fornecem estimadores de varincia
diretamente, nem mesmo para planos amostrais comuns tais como AAS e
AES.
Para alguns planos amostrais, as probabilidades de incluso conjuntas (de
segunda ordem) podem ser nulas (como na amostragem sistemtica) ou dif-
ceis de calcular (como no caso de alguns planos amostrais com probabilidades
desiguais).
165
166 CAPTULO 5. ESTIMAO DE VARINCIAS
Em muitos casos, estimadores dos parmetros de interesse so no lin-
eares (isto , no so mdias, totais ou propores). Exemplos incluem
razes, correlaes, coecientes de regresso, quantis de distribuies, etc.
Alguns estimadores de varincia podem fornecer valores negativos (como
o caso do estimador de varincia de Horvitz-Thompson em alguns planos
amostrais com probabilidades desiguais).
5.3 Mtodos para estimar varincias
Wolter (1985) enfatiza ambas a teoria e aplicaes de vrios mtodos para
estimar varincias.
5.3.1 Mtodo de Linearizao de Taylor ou -mtodo
Um dos primeiros mtodos, desenvolvido para fornecer estimadores de var-
incia para estimadores no lineares.
A hiptese bsica deste mtodo que o parmetro de interesse possa ser
representado como uma funo de K totais populacionais, isto :
= f(Y
1
, , Y
K
)
onde Y
K
=
N
P
i=1
y
ik
so totais poulacionais para vriveis de pesquisa
y
k
, k = 1, , K.
O estimador amostral do parmetro dado por
b
= f(
b
Y
1
, ,
b
Y
K
)
onde
b
Y
K
=
n
P
i=1
y
ik

i
o estimador de Horvitz-Thompson do total Y
k
, k =
1, ..., K.
Quando f uma funo linear, fcil obter expresses de varincia para
b
. Isto ocorre por causa da linearidade de f, j que neste caso
= a
0
+
K
X
k=1
a
k
Y
k
e consequentemente
b
= a
0
+
K
X
k=1
a
k
b
Y
k
5.3. MTODOS PARA ESTIMAR VARINCIAS 167
Portanto, neste caso podemos usar propriedades de combinaes lineares
de variveis aleatrias para obter
V

b

= V

a
0
+
K
X
k=1
a
k
b
Y
k
!
=
K
X
k=1
a
2
k
V

b
Y
k

+
K
X
k=1
K
X
j6=k
a
k
a
j
COV (
b
Y
k
,
b
Y
j
)
Dessa forma, um estimador para a varincia de pode ser facilmente obtido
substituindo as varincias e covarincias na expresso acima por seus respec-
tivos estimadores no viciados, levando a:
v

=
K
X
k=1
a
2
k
v

b
Y
k

+
K
X
k=1
K
X
j6=k
a
k
a
j
cov(
b
Y
k
,
b
Y
j
)
Para funes de fato no lineares, a idia aproximar o estimador
b
por
uma quantidade linearizada
b

L
, obtida mediante expanso da funo f em
srie de Taylor em torno do ponto (Y
1
, , Y
K
), e desprezando-se o termo do
resto, isto :
b

=
b

L
= +
K
X
k=1
a
k

b
Y
k
Y
k

onde
a
k
=
f(
b
Y
1
, ,
b
Y
K
)

b
Y
k

e
Y
1
, ,
e
Y
K
=Y
1
, ,Y
K
para k = 1, ..., K.
Para amostras grandes, o estimador no linear
b
ter comportamento
semelhante ao do estimador linearizado
b

L
, e portanto podemos usar a var-
incia deste estimador linearizado como aproximao para a varincia do
estimador
b
. Isto :
V

b

= E

= E

2
= E

K
X
k=1
a
k

b
Y
k
Y
k

!
2
=
K
X
k=1
a
2
k
V

b
Y
k

+
K
X
k=1
K
X
j6=k
a
k
a
j
COV (
b
Y
k
,
b
Y
j
)
168 CAPTULO 5. ESTIMAO DE VARINCIAS
A varincia aproximada de
b
pode ento ser obtida, bastando para isso
calcular as derivadas da funo f e substituir na expresso acima.
Um estimador para a varincia de
b
pode ento ser facilmente obtido
usando
v

=
K
X
k=1
ba
2
k
v

b
Y
k

+
K
X
k=1
K
X
j6=k
ba
k
ba
j
cov(
b
Y
k
,
b
Y
j
)
onde os valores de ba
k
so as estimativas das derivadas a
k
obtidas substi-
tuindo os totais Y
1
, , Y
K
pelas respectivas estimativas
b
Y
1
, ,
b
Y
K
.
Notas:
1. Linearizao de Taylor pode ser trabalhosa, pois para cada parmetro
ou estimador de interesse necessrio calcular derivadas e frmulas
especcas.
2. Muitas estatsticas de interesse no podem ser facilmente escritas como
funes lineares de totais, como por exemplo a mediana e os quantis de
uma distribuio.
3. Apesar disso, vrios pacotes computacionais usam este mtodo para es-
timar varincias e desvios padres para diversas estatsticas, tais como
mdias e totais para domnios, razes, coecientes de regresso, e at
mesmo quantis.
5.3.2 Mtodo do Conglomerado Primrio (Ultimate Clus-
ter - Hansen et al, 1953)
O termo conglomerado primrio (ultimate cluster) usado para denotar o
agregado de unidades includas na amostra de uma unidade primria.
Ovalor agregado da caracterstica y para o i-simo conglomerado primrio
y
i
;e o tamanho do i-simo conglomerado primrio n
i
.
Esta denio de conglomerado primrio vlida para qualquer nmero
de estgios de amostragem.
Supondo que um municpio amostrado como unidade primria e um
conjunto de 5 setores contendo 200 domiclios cada selecionado do municpio
como unidades secundrias e 20 domiclios so selecionados de cada setor
selecionado. O conglomerado primrio consiste do total da amostra de 100
domiclios selecionados do municpio.
A idia central deste mtodo para estimar varincias de mdias e totais,
emplanos amostrais de mltiplos estgios, considerar apenas a variao entre
informaes disponveis a nvel das unidades primrias de amostragem(UPAs),
5.3. MTODOS PARA ESTIMAR VARINCIAS 169
isto , a nvel dos conglomerados primrios, e supor que estes tivessem sido
selecionados por amostragem com reposio da populao de UPAs.
Trata-se de idia simples, porm bastante poderosa, pois permite aco-
modar grande variedade de planos amostrais estraticados, conglomerados
e com probabilidades desiguais (com ou sem reposio), tanto das unidades
primrias como das demais unidades de amostragem.
O requisito fundamental para aplicao deste mtodo que estejam dispo-
nveis estimadores no viciados dos totais da(s) varivel(is) de interesse para
cada um dos conglomerados primrios selecionados, e que pelo menos dois
destes sejam selecionados em cada estrato (caso esta condio no seja sat-
isfeita para alguns estratos, estes podem ser agrupados).
Embora este mtodo tenha sido proposto para estimar varincias de m-
dias e totais em planos amostrais de mltiplos estgios (portanto complexos),
pode ser tambm aplicado em combinao com Linearizao de Taylor para
obter estimativas de varincias para estatsticas no lineares que possam ser
escritas como funes de totais.
Este mtodo fornece, juntamente com a Linearizao de Taylor, a base
metodolgica de vrios pacotes especializados para estimao de varincias,
tais como SUDAAN, STATA, CENVAR e PC-CARP, entre outros.
Considere um plano amostral em vrios estgios, com m
h
2 unidades
primrias selecionadas do estrato h, h = 1, ..., L.
Denote por
hi
a probabilidade de incluso na amostra da i-sima UPA
(conglomerado primrio) do estrato h, e por
b
Y
hi
um estimador no viciado
do total Y
hi
da caracterstica de interesse y na i-sima UPA do estrato h,
h = 1, ..., L.
Um estimador no viciado do total populacional Y =
L
P
h=1
M
h
P
i=1
Y
hi
dado
por
b
Y
CP
=
L
X
h=1
m
h
X
i=1
b
Y
hi

hi
e um estimador no viciado da varincia correspondente dado por
v

b
Y
CP

=
L
X
h=1
m
h
m
h
1
m
h
X
i=1

b
Y
hi

hi

b
Y
h
m
h
!
2
onde
b
Y
h
=
m
h
P
i=1
b
Y
hi

hi
para h = 1, ..., L.
Embora muitas vezes a seleo das unidades primrias seja feita sem
reposio, o estimador de Conglomerados Primrios aqui apresentado pode
fornecer uma aproximao razovel da varincia de aleatorizao desejada.
170 CAPTULO 5. ESTIMAO DE VARINCIAS
Isso ocorre porque planos amostrais sem reposio geralmente so mais
ecientes que planos de mesmo tamanho com reposio.
Esta aproximao bastante usada na prtica por sua simplicidade, em
comparao com os estimadores de varincia que procuram incorporar todos
os estgios do plano amostral.
5.3.3 Mtodos de Replicao
A idia de mtodos de replicao para estimar varincias em Amostragem
no nova, e foi primeiramente proposta por Mahalanobis em 1939.
O segredo construir sua amostra de tamanho n mediante a seleo de
G amostras independentes de tamanho
n
G
cada uma, usando o mesmo plano
amostral, onde G o nmero de replicaes.
Ento, se o parmetro alvo, e
b

g
um estimador no viciado baseado
na rplica g, imediato notar que:
b

R
=
1
G
G
X
g=1
b

g
um estimador no viciado de e
v

=
G
G1
G
X
g=1

2
um estimador no viciado da varincia do estimador de replicao
b

R
.
O resultado acima vale para qualquer plano amostral adotado para sele-
cionar cada rplica.
A abordagem de replicao bastante geral. vlida para qualquer
estimador, no somente para aqueles que podem ser escritos como funes
de totais.
Aplicaes prticas exatas dessa tcnica so raras, entretanto, devido
as seguintes causas:
a) algumas vezes caro e inconveniente selecionar de fato G amostras
independentes segundo o mesmo plano amostral;
b) Se G for pequeno, o estimador de varincia pode ser instvel.
Aplicao: US Consumer Price Index (CPI) - usa 3 rplicas de um plano
amostral com estraticao detalhada e mltiplos estgios de conglomerao.
5.3. MTODOS PARA ESTIMAR VARINCIAS 171
Mtodo dos Grupos Aleatrios Algumas vezes, a amostra subdividida
em grupos aps a seleo. Se as amostras nos diversos grupos puderem ser
consideradas como aproximadamente independentes, ento o estimador
de varincia proposto serve como uma aproximao para a varincia do esti-
mador.
Note que a diviso da amostra emgrupos deve considerar o plano amostral.
Sob planois amostrais estraticados, h duas alternativas:
a) aplicar o mtodo de grupos aleatrios para estimar as varincias dentro
dos estratos; ou
b) aplicar o mtodo de grupos aleatrios amostra como um todo, preser-
vando a estraticao quando da diviso da amostra em grupos - esta
opo requer amostras grandes o bastante em cada estrato para permi-
tir a subdiviso em G grupos.
Freqentemente as UPAs so alocadas nos grupos aleatrios carregando
todas as unidades amostrais a elas subordinadas.
Um outro estimador de varincia empregado com o mtodo de grupos
aleatrios o que considera diferenas em relao a um estimador de amostra
completa
b
, a saber:
v

=
G
G1
G
X
g=1

2
Mtodo Jackknife Este mtodo foi inventado como uma tcnica para
reduo de vcio na estatstica clssica (Quenouille, 1949, 1956).
A idia consiste em dividir a amostra em G grupos mutuamnete ex-
clusivos, cada um de tamanho
n
G
. Em seguida, so calculados os pseudo-
valores
b

(g)
dados por
b

(g)
= G
b
(G1)
b

g
onde,
b

g
uma estimativa de obtida da amostra aps a excluso das
unidades do grupo g, usando a mesma forma funcional que se teria aplicado
com a amostra completa (no caso, o estimador
b
).
Planos amostrais estraticados no esto cobertos imediatamente pela
descrio acima. A situao mais complicada nesse caso. Consulte Wolter
(1985).
Estima-se a varincia usando um dos estimadores:
172 CAPTULO 5. ESTIMAO DE VARINCIAS
v
J1

=
1
G(G1)
G
X
g=1

(g)

JK

2
v
J2

=
1
G(G1)
G
X
g=1

(g)

2
onde
b

JK
=
1
G
G
P
g=1
b

(g)
.
Notas:
1. O estimador de Jackknife
b

JK
de poderia ser utilizado como um
estimador alternativo ao estimador de amostra completa
b
.
2. v
J2

um estimador mais conservador da varincia do que v


J1

.
3. Freqentemente se toma n = Ge se elimina uma observao da amostra
de cada vez.
4. Com planos amostrais de mltiplos estgios, eliminam-se UPAs inteiras
da amostra de cada vez. Isto , se uma UPA excluda, excluem-se ao
mesmo tempo todas as unidades a ela subordinadas.
Justicativas para o estimador Jackknife de varincia:
a) quando a estatstica for linear, os estimadores de varincia coincidem
com estimadores usuais;
b) evidncia emprica (limitada).
5.4 Sistemas para estimao de varincias
A maior parte das pesquisas realizadas por agncias de estatsticas ociais
usam alguma forma de plano amostral estraticado em mltiplos estgios.
Clculos de varincias, mesmo para estimadores lineares, podem se tornar
trabalhosos de programar.
Programas desenvolvidos sob medida custam mais caro e aumentam
risco de erros e prazos de obteno de resultados.
Alternativa: usar pacotes prontos.
Problema: pacotes padres (SAS, SPSS, BMDP, MINITAB, etc.) calcu-
lam varincias supondo que as observaes amostrais so IID (independentes
5.4. SISTEMAS PARA ESTIMAO DE VARINCIAS 173
e identicamente distribudas), e portanto IGNORANDO a natureza complexa
do plano amostral empregado para obter os dados.
Isto geralmente levaria a obter estimativas dos desvios padres severa-
mente viciadas. Em alguns casos, a subestimao das varincias pode ser
bastante grande, especialmente com planos amostrais muito conglomerados.
Soluo: usar pacotes especializados para estimao de varincias em
amostras complexas.
Alguns pacotes atualmente disponveis incluem:
SUDAAN (Research Triangle Institute)
WESVARPC (Westat Inc.)
GES (Statistics Canada)
STATA (Stata Corporation)
CENVAR (US Bureau of Census)
Biblioteca ADAC (Anlise de Dados Amostrais Complexos) do Sistema
R (Coordenao de Mtodos e Qualidade / Diretoria de Pesquisas /
IBGE - Prof. Djalma Galvo Pessoa)
Vantagens de usar pacotes especializados prontos incluem:
- clculo de estimativas para propores, mdias e totais e seus desvios
padres facilmente tratados;
- desvios padres disponveis para estatsticas tais como razes de m-
dias, mdias de domnios e suas diferenas, coecientes de regresso,
correlaes, etc.;
- algoritmos numricos exaustivamente testados, reduzindo as chances
de erros de clculo;
- computao eciente;
- usurio pode se concentrar no que calcular, e no em como calcular;
- mais barato que desenvolvimento local;
- testes de hipteses e p-valores tambm disponveis.
Desvantagens de usar pacotes especializados prontos incluem:
174 CAPTULO 5. ESTIMAO DE VARINCIAS
- abrangncia limitada - pacotes no podem fazer tudo;
- pacotes no avaliam estimativas, apenas calculam;
- integrao com outros pacotes pode ser difcil;
- necessrio investir na aquisio e manuteno da licena do pacote,
mais treinamento do pessoal usurio;
- resultados produzidos precisam ser editorados antes de servir para pub-
licao.
Concluses
- Vantagens devem mais que compensar desvantagens.
- Uso de pacotes especializados para estimao de varincias altamente
recomendvel.
- Voc provavelmente no consegue fazer melhor sem pacotes, dadas re-
stries de tempo e recursos.
- Poupe seu tempo e esforo para melhorias verdadeiras do processo de
pesquisa.
Captulo 6
Dupla amostragem
6.1 Descrio da tcnica
Como visto, em muitos casos conveniente o uso de informaes adicionais
sobre uma varivel auxiliar, que nos permite melhorar a preciso das esti-
mativas. Vimos por exemplo, como a estraticao produz amostras mais
representativas, e como se pode obter estimadores mais precisos; o mesmo
ocorre, sob certas condies, com os estimadores de razo e com o uso de
probabilidades desiguais de seleo.
Nestes casos a teoria estudada at aqui supe que conhecida a infor-
mao prvia para a formao dos estimadores mencionados. Na prtica
pode no ser vivel, ento coloca-se a possibilidade de selecionar uma 1
a
amostra, relativamente grande, em que com um baixo custo pode-se obser-
var uma ou vrias caractersticas gerais das unidades que nos proporcione
a(s) informao(es) que necessitamos.
Em uma 2
a
fase selecionamos uma subamostra da 1
a
, em que observamos
a(s) caracterstica(s) objeto de estimao. Esta tcnica conhecida como
dupla amostragem ou amostragem em 2 fases.
A dupla amostragem (ou amostragem em duas fases) pode ser general-
izada para qualquer nmero de fases, dando lugar amostragem multifsica.
Na amostragem multifsica se utiliza as mesmas unidades de amostragem
em todas as fases, diferentemente da amostragem em mltiplos estgios onde
h uma hierarquia das unidades de amostragem que variam de estgio para
estgio.
175
176 CAPTULO 6. DUPLA AMOSTRAGEM
6.2 Consideraes sobre o custo
evidente que a convenincia desta tcnica de amostragem depende dos
custos, se a observao da caracterstica que nos interessa no tem custo,
ou muito baixo, tomaramos uma amostra do tamanho necessrio para a
preciso desejada e com ela faramos as estimaes.
Suponha que dispomos de um pressuposto custo total C; que o custo por
unidade da 1
a
amostra de tamanho n
0
c
0
; e que o custo por unidade da 2
a
amostra de tamanho n << n
0
c (c
0
<< C).
Nestas condies temos:
se selecionarmos uma s amostra: C = c n
0
; e
se zermos dupla amostragem: C = c
0
n
0
+c n
igualando os custos totais, tem-se:
n
0
= n +
c
0
c
n
0
Logo, com a tcnica de dupla amostragem a observao efetiva se faz com
uma amostra de tamanho n, menor que n
0
, que corresponde a uma amostra
aleatria simples em uma fase com o mesmo custo total.
Por exemplo, se
c
0
C
= 0, 1, o tamanho n
0
= 1.000 equivalente aos tama-
nhos n = 400 e n
0
= 6.000. A diminuio de n
0
n = 600 unidades no
tamanho da amostra efetiva produzir uma perda em preciso.
A questo que se coloca decidir se compensa a diminuio do tamanho
efetivo da amostra, com o aumento de informao adquirida na 1
a
fase. Para
isso, deve-se calcular a varincia correspondente com a aplicao da dupla
amostragem e compar-la com a de uma amostra de uma s fase (

2
n
0
, no caso
da estimao da mdia com amostragem aleatria simples).
bvio que quanto menor for a relao
c
0
C
mais favorvel o uso da dupla
amostragem, mas no o nico parmetro a ser considerado.
Em amostragem com reposio a varincia dos estimadores toma a forma:
V =
k
1
n
+
k
2
n
0
que vlida para amostragem sem reposio quando as fraes so pequenas.
Esta varincia pode ser minimizada para um custo total dado e nos fornece,
atravs dos multiplicadores de Lagrange, os tamanhos timos de n
0
e n.
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAO 177
6.3 Dupla amostragem para estraticao
Seleciona-se a 1
a
amostra de tamanho n
0
, atravs de um esquema aleatrio.
Utiliza-se essa amostra para estraticar as unidades, atendendo a uma ou
vrias caractersticas que observamos, assim como para estimar a proporo
de unidades da populao pertencentes a cada estrato, supondo que a popu-
lao seja estraticada em L estratos.
Sejam n
0
1
, n
0
2
, , n
0
L
onde n
0
h
o nmero de unidades na amostra (da 1
a
fase) em cada estrato h e a respectiva proporo:
w
h
=
n
0
h
n
0
A segunda fase consiste em tomar uma subamostra aleatria de tamanho
n
h
n
0
h
em cada estrato h, independentemente.
O estimador usual da mdia em amostragem estraticada :
y
est
=
L
X
h=1
W
h
y
h
em dupla amostragem os W
h
so estimados pelos w
h
obtidos da 1
a
amostra
e com a 2
a
amostra estimamos as mdias, tomando:
y
h
=
y
h
n
h
de forma que resulta no estimador para a mdia:
y
d,est
=
L
X
h=1
w
h
y
h
y
d,est
no viciado, pois:
E

y
d,est

= E
(
E
w

L
X
h=1
w
h
y
h
!)
= E

L
X
h=1
w
h
E
w
(y
h
)
!
= E

L
X
h=1
w
h
Y
h
!
=
L
X
h=1
E(w
h
) Y
h
=
L
X
h=1
W
h
Y
h
= Y
onde:
E
w
(T) expressa a esperana matemtica de uma estatstica T condi-
cionada ao conjunto de amostras da 1
a
fase, nas quais n
0
1
, n
0
2
, , n
0
L
so
xos e para um dado n
0
, w
1
, w
2
, , w
L
so xos.
178 CAPTULO 6. DUPLA AMOSTRAGEM
V

y
d,est

= V

E
w

y
d,est

+E

V
w

y
d,est

V

E
w

y
d,est

= V

L
X
h=1
w
h
Y
h
!
= V

L
X
h=1

Y
h

2
w
h
!
=
L
X
h=1

Y
h

2
V (w
h
) +
L
X
h6=k
Y
h
Y
k
COV (w
h
, w
k
)
as V (w
h
) e COV (w
h
, w
k
) em amostragem sem reposio, usando a dis-
tribuio hipergeomtrica para L classes, so dadas por:
V (w
h
) =
N n
0
N 1
W
h
(1 W
h
)
n
0
e
COV (w
h
) =
N n
0
N 1
W
h
W
j
n
0
Logo:
V

E
w

y
d,est

= g
0
(
L
X
h=1

Y
h

2 W
h
(1 W
h
)
n
0

L
X
h6=k
Y
h
Y
k
W
h
W
j
n
0
)
=
g
0
n
0
(
L
X
h=1

Y
h

2
W
h

L
X
h=1

Y
h

2
(W
h
)
2

L
X
h6=k
Y
h
W
h
L
X
k=1
Y
k
W
k
)
=
g
0
n
0
_
_
_
L
X
h=1

Y
h

2
W
h

L
X
h=1
W
h
Y
h
!
2
_
_
_
=
g
0
n
0
(
L
X
h=1
W
h

Y
h
Y

2
)
sendo: g
0
=
N n
0
N 1
.
Por outro lado, tem-se:
6.3. DUPLA AMOSTRAGEM PARA ESTRATIFICAO 179
E

V
w

y
d,est

= E

V
w

L
X
h=1
w
h
y
h
!!
= E

L
X
h=1
(w
h
)
2
V
w
(y
h
)
!
= E

L
X
h=1
(w
h
)
2
(1 f
h
)
S
2
h
n
h
!
=
L
X
h=1
E (w
h
)
2
(1 f
h
)
S
2
h
n
h
=
L
X
h=1
(1 f
h
)
S
2
h
n
h

V (w
h
) +W
2
h

=
L
X
h=1
(1 f
h
)
S
2
h
n
h

g
0
W
h
(1 W
h
)
n
0
+W
2
h

Portanto:
V

y
d,est

=
g
0
n
0
(
L
X
h=1
W
h

Y
h
Y

2
)
+
L
X
h=1
(1 f
h
)
S
2
h
n
h

g
0
W
h
(1 W
h
)
n
0
+W
2
h

onde:
f
h
a frao de amostragem da 2
a
fase, supondo que a seleo foi com
probabilidades iguais e sem reposio nas fases.
Observe que n
0
aparece no denominador na expresso da varincia. Por-
tanto, quanto maior n
0
(n
0
< N) a perda de preciso pelo uso da dupla
amostragem diminui. Obviamente o custo aumenta, razo pela qual convm
estudar os tamanhos timos em funo do custo.
Se a amostra com reposio na 1
a
fase temos:
V

y
d,est

=
L
X
h=1
(1 f
h
)
S
2
h
n
h

W
2
h
+
W
h
(1 W
h
)
n
0

+
1
n
0
L
X
h=1
W
h

Y
h
Y

2
frmula aproximada para n
0
pequeno em relao a N em caso sem reposio.
Se a amostra com reposio nas 2 fases:
V

y
d,est

=
L
X
h=1

2
h
n
h

W
2
h
+
W
h
(1 W
h
)
n
0

+
1
n
0
L
X
h=1
W
h

Y
h
Y

2
frmula aproximada para n
h
pequeno em relao a N
h
, h e n
0
pequeno em
relao a N no caso sem reposio.
180 CAPTULO 6. DUPLA AMOSTRAGEM
Para o total Y = NY , o estimador no viciado
b
Y
d,est
= N y
d,est
e a
varincia V

b
Y
d,est

= N
2
V

y
d,est

.
Observe que se na amostra da 1
a
fase n
0
= N, isto , se observa todas as
unidades da populao para efetuar a estraticao, ento g
0
= 0 e a frmula
geral da varincia do estimador de dupla amostragem ca:
V

y
d,est

=
L
X
h=1
(1 f
h
) W
2
h
S
2
h
n
h
que coincide com a varincia de uma amostra estraticada usual em uma
nica fase.
6.3.1 Estimador no viciado para V

y
d,est

Um estimador no viciado para a varincia do estimador da mdia em dupla


amostragem para estraticao com reposio V

y
d,est

dado por:
v

y
d,est

=
n
0
n
0
1
(
L
X
h=1
s
2
h
n
h

w
2
h
+
w
h
n
0

+
1
n
0
L
X
h=1
w
h

y
h
y
d,est

2
)
n
0
n
0
1

= 1 se n
0
no for pequeno, ento:
v

y
d,est

=
L
X
h=1
s
2
h
n
h

w
2
h
+
w
h
n
0

+
1
n
0
L
X
h=1
w
h

y
h
y
d,est

2
6.3.2 Estimao de uma proporo na dupla amostragem
para estraticao
Se se deseja estimar uma proporo P
A
de um atributo A na populao,
sendo P
Ah
a correspondente proporo no estrato h, o estimador no viciado
na dupla amostragem :
p
A(d,est)
=
L
X
h=1
w
h
p
Ah
6.4. DUPLA AMOSTRAGEM PARA ESTIMADORES DE RAZO 181
sendo: p
Ah
a proporo amostral do atributo A na 2
a
fase.
V

p
A(d,est)

=
L
X
h=1
(1 f
h
)
P
Ah
Q
Ah
n
h

W
2
h
+
g
0
W
h
(1 W
h
)
n
0

+
g
0
n
0
(
L
X
h=1
W
h
(P
Ah
P
A
)
2
)
sendo:
S
2
h
=
N
h
N
h
1
P
Ah
Q
Ah

= P
Ah
Q
Ah
Em amostragem com reposio nas 2 fases, ou sem reposio e tamanhos
amostrais pequenos com relao populao (f
h

= 0 e g
0

= 1).
V

p
A(d,est)

=
L
X
h=1
P
Ah
Q
Ah
n
h

W
2
h
+
W
h
(1 W
h
)
n
0

+
1
n
0
(
L
X
h=1
W
h
(P
Ah
P
A
)
2
)
Para o total do atributo A = N P
A
, o estimador :
b
A
d,est
= Np
A(d,est)
e
V

b
A
d,est

= N
2
V

p
A(d,est)

6.4 Dupla amostragem para estimadores de


razo
O estimador usual de razo para a mdia Y utiliza como informao previa-
mente conhecida da mdia X (ou total) de uma caracterstica x, denida em
todas as unidades da populao, escolhida convenientemente de modo que
sua relao com y seja linear pelo menos aproximadamente.
Em dupla amostragem utiliza-se a 1
a
amostra de tamanho n
0
para obter
uma boa estimativa de X (ou de X) e a 2
a
amostra de tamanho n para
estimar y e x. Desta forma o estimador de razo para a mdia em dupla
amostragem :
y
d,R
=
y
x
x
0
sendo x
0
a mdia estimada usando as informaes da amsotra da 1
a
fase.
Com este procedimento de dupla amostragem cabe considerar duas pos-
sibilidades:
182 CAPTULO 6. DUPLA AMOSTRAGEM
1. a 2
a
amostra uma amostra aleatria da populao selecionada inde-
pendentemente da 1
a
;
2. a 2
a
amostra uma subamostra aleatria da 1
a
. Em ambos casos con-
siderar n n
0
.
Em qualquer caso: E

y
d,R

= X E

b
R

e ser no viciado se
b
R =
y
x
for
no viciado.
Para calcular o erro mdio quadrtico que coincida coma varincia quando
E

b
R

= R =
Y
X
temos:
y
d,R
Y =
y
x
x
0
Y =
b
Rx
0
Y =
b
Rx
0
RX
=
b
Rx
0
RX +RX RX
= X

b
RR

+
b
R

x
0
X

=
X
x

y
b
Rx

+
b
R

x
0
X

utilizando as aproximaes:
b
R

= R e
X
x

= 1.
Podemos escrever para o clculo aproximado da varincia do estimador:
V

y
d,R

= E

(y Rx) +R

x
0
X

2
= V

(y Rx) +R

x
0
X

= V (y Rx) +V

R

x
0
X

+ 2RCOV

(y Rx)

x
0
X

= V (y) +R
2
V (x) 2RCOV (x, y) +R
2
V ( x
0
) +
+2RCOV (y, x
0
) 2R
2
COV (x, x
0
)
No caso em que as amostras das 2 fases so independentes, as covarincias
se anulam entre (x, y) e (x, x
0
), resultando:
V

y
d,R

= V (y) +R
2
V (x) 2RCOV (x, y) +R
2
V ( x
0
)
V

y
d,R

=
1
n

2
y
+R
2

2
x
2R
xy

+
1
n
0
R
2

2
x
6.5. DUPLAAMOSTRAGEMPARAPROBABILIDADES DESIGUAIS183
frmula vlida para amostragem com reposio (no caso de sem reposio,
usar fator de correo de populaes nitas).
Para o caso em que a 2
a
amostra de tamanho n uma subamostra
aleatria da 1
a

n n
0

temos que calcular as covarincias.


Fixando a amostra da 1
a
fase:
E
w
0 (y) = y
0
e E
w
0 (x) = x
0
por y e x serem mdias de subamostras aleatrias =
COV (y, x
0
) = E(y, x
0
) E (y ) E( x
0
)
= E(E
w
0 (y, x
0
)) E(E
w
0 (y )) E(E
w
0 ( x
0
))
= E(y
0
, x
0
) E(y
0
) E (x
0
) = COV (y
0
, x
0
)
=

xy
n
0
analogamente:
COV (x, x
0
) =

2
x
n
0
Logo:
V

y
d,R

=
1
n

2
y
+R
2

2
x
2R
xy

+
1
n
0
R
2

2
x
+

1
n
0
2R
2

2
x
+
1
n
0
2R
xy
=
1
n

2
y
+R
2

2
x
2R
xy

+
1
n
0

2R
xy
R
2

2
x

admitindo com reposio.


Se n
0
= N = COV (x, x
0
) = COV (y, x
0
) = 0,ento V

y
d,R

reduz
varincia do estimador de razo em uma nica fase.
6.5 Dupla amostragem para probabilidades
desiguais
O estimador usual do total Y , com probabilidades de seleo das unidades
proporcionais a uma medida de tamanho, seja M
i
, dado por:
b
Y =
1
n
n
X
i=1
y
i
P
i
184 CAPTULO 6. DUPLA AMOSTRAGEM
com: P
i
=
M
i
M
.
Se no se conhece a priori os tamanhos das unidades da populao, pode-
mos tomar uma amostra aleatria da populao de tamanho n
0
com probabil-
idades iguais, para obter informao acerca dos tamanhos M
1
, M
2
, , M
n
0 ,
sendo M
0
=
n
0
P
i=1
M
i
. Nestas condies se toma uma subamostra de tamanho
n < n
0
, para formar o estimador de dupla amostragem baseado em:
M
i
N
n
0
M
0
como esstimador de
M
i
M
= P
i
e o estimador no viciado de total ca da forma:
b
Y
p
d
=
n
X
i=1
N
n
0
M
0
n
y
i
M
i
=
NM
0
nn
0
n
X
i=1
y
i
M
i
E

b
Y
p
d

= E

N
n
0
E
w
0

n
X
i=1
M
0
n
y
i
M
i
!!
= E

N
n
0
y
0

= Y
onde:
E
w
0 indica a esperana da 1
a
amostra xa com probabilidade proporcional
ao tamanho;
y
0
o total da amostra da 1
a
fase, tomando n
0
, tomada com probabili-
dades iguais.
Supondo que a 1
a
amostra seja selecionada com probabilidades iguais e
sem reposio e a 2
a
amostra com probabilidades proporcionais ao tamanho
e com reposio, a varincia do estimador de total dada por:
V

b
Y
p
d

=
N
N 1
n
0
1
nn
0
N
X
i=1
P
i

Y
i
P
i
Y

2
+
N (N n
0
)
n
0
S
2
y
se n
0
grande ento
n
0
1
n
0

= 1 ento:
V

b
Y
p
d

=
1
n
N
X
i=1
P
i

Y
i
P
i
Y

2
+
N (N n
0
)
n
0
S
2
y
Bibliograa
[1] Albieri, S. e Dias, A.J.R. (1994). Metodologia de expanso da amostra
do censo demogrco de 1991: uma descrio resumida. Rio de Janeiro:
IBGE, Diviso de Metodologia.
[2] Andersson, C. e Nordberg, L. (1994). A method for variance estima-
tion of non-linear functions of totals in surveys - theory and software
implementation. Journal of Ocial Statistics, 10, 395-406.
[3] Cochran, W.G. (1977). Sampling Techniques, third edition. New York:
John Wiley & Sons.
[4] Deville, J.C. e Srndal, C.E. (1992). Calibration estimators in survey
sampling. Journal of the American Statistical Association, 87, 376-382.
[5] Estevao, V., Hidiroglou, M.A. e Srndal, C.E. (1995). Methodological
principles for a generalized estimation systemat Statistics Canada. Jour-
nal of Ocial Statistics, 11, 181-204.
[6] Fieller, E. C. (1932). The distribution of the index in a normal bivariate
population. Biometrika, 24, 428-440.
[7] Hanif, M. and Brewer, K.R.W. (1980). Sampling with unequal proba-
bilities without replacement. International Statistical Review,Voorburg:
Holand, 48: 317-35.
[8] Hansen, Morris H; Hurvitz, William N. and Madow, William G. (1953).
Sample Survey Methods and Theory ( vol. I and II). New York: John
Wiley & Sons.
[9] Hartley, H.O. et alli. (1962). Sampling with unequal probabilities with-
out replacement. Annals of Mathematical Statistics, Hayward; EUA, 33:
350-74.
185
186 BIBLIOGRAFIA
[10] Horvitz, D.G., and Thompson, D.J. (1952). A generalization of sampling
without replacement from a nite universe. Jour. Amer. Stat. Assoc.,
47, 663-685.
[11] IBGE (1983). Metodologia do censo demogrco de 1980. Rio de Janeiro:
Srie Relatrios Metodolgicos, v. 4.
[12] Kish, L. (1965) Survey Sampling. New York: John Wiley & Sons.
[13] Lima, J.M.(1985). Seleo de amostra com probabilidades desiguais -
o mtodo dos grupos aleatrios. Rio de Janeiro: IMPA, (Informes de
Matemtica Srie D-015/85 - Tese de Mestrado).
[14] Mahalanobis, P.C. (1939). A Sample Survey of the Acreage Under Jute
in Bengal. Sankhya 4, 511-531.
[15] Nascimento, W.A. (1981). Amostragem de Conglomerados.
IBGE/ENCE.
[16] Quenouille, M.H. (1949). Aproximate Tests of Correlation in Time Se-
ries. Journal of the Royal Statistical Society, B 11, 68-84.
[17] Quenouille, M.H. (1956). Notes on Bias in Estimation. Biometrika 43,
353-360.
[18] Paulson, E. (1942). A note on the estimation of some mean values for a
bivariate distribution. Ann. Math. Stat., 13, 440-444.
[19] Pessoa, D.G.C. e Silva, P.L.N. (1998). Anlise de dados em planos
amostrais complexos. Minicurso do SINAPE 1998.
[20] Raj, Des. (1968). Sampling Theory. Bombay, New Delhi: Tata McGraw-
Hill.
[21] Srndal, C.E., Swensson, B. e Wretman, J. (1992). Model assisted survey
sampling. New York: Springer-Verlag.
[22] Shah, B.V., Barnwell, B.G., Hunt, P.N. e LaVange, L.M. (1992). SUD-
DAN users manual - professional software for survey data analysis for
multi-stage sample designs - release 6.0. North Carolina: Research Tri-
angle Institute.
[23] Silva, P.L.N. (1996). Planejamento, estimao e anlise de dados em
pesquisas por amostragem: desvendando a realidade brasileira com o
telescpio da estatstica. Rio de Janeiro: IBGE.
BIBLIOGRAFIA 187
[24] Silva, P.L.N. (1996). Utilizing auxiliary information in sample survey
estimation and analysis. Southampton: Department of Social Statistics,
University of Southampton, tese de doutorado.
[25] Silva, P.L.N., Bianchini, Z.M. e Albieri, S. (1993). Uma proposta de
metodologia para a expanso da amostra do censo demogrco de 1991.
Rio de Janeiro: IBGE, Diretoria de Pesquisas, Srie Textos para Dis-
cusso, n. 62.
[26] Silva, P.L.N., Silva, D.B.N., Moura, F.A.S. e Jooris, L.R. (1995). Frame
problems and survey design for the Brazilian annual retail and wholesale
trade survey. Artigo submetido para publicao na revista Estadstica.
[27] Silva, P.L.N. e Skinner, C.J. (1995). Estimating distribution functions
with auxiliary information using poststratication. Journal of Ocial
Statistics, 11, 277-294.
[28] Silva, P.L.N. e Skinner, C.J. (1996). Variable selection for regression
estimation in nite populations. Artigo submetido para publicao no
Journal of the American Statistical Association.
[29] Skinner, C. J., Holt, D. and Smith, T.M.F. (1989). Analysis of Complex
Surveys. Chichester: Wiley.
[30] Thompson, S.K. (1992). Sampling. New York: John Wiley & Sons.
[31] Westat (1995). A users guide to WesVarPC, version 1.0. Rockville:
Westat.
[32] Wolter, K.M. (1985). Introduction to Variance Estimation. New York:
Springer-Verlag.

Das könnte Ihnen auch gefallen