Eficiencia de Los Estimadores. Muestreo Conglomerados

Eficiencia de los estimadores en encuestas por muestreo1
(Efficiency of estimators in survey sampling)

Jun Javier Snchez Carrin
Catedrtico de Sociologa
UCM
ndice
5.- Muestra por conglomerados (clusters)
5.1 Muestra por conglomerados
5.2 Muestra polietpica
5.3 Muestra por conglomerados de distinto tamao
Trabajo no reproducible
5.- Muestra por conglomerados (clusters)

5.1 Muestra por conglomerados
Tomemos de nuevo el estrato de Filosofa y, en vez de elegir los alumnos aleatoriamente, tal
como hacamos en el muestreo estratificado, o por un procedimiento sistemtico, como
hacamos al hablar de este tipo de muestreo, seleccionemos los 66 alumnos haciendo uso de
la idea de conglomerado. Supongamos que los 660 alumnos se encuentran divididos en
A=110 clases (conglomerados) de B=6 alumnos cada una. En vez de seleccionar a los 66
alumnos de la muestra por un procedimiento MAS podemos hacerlo seleccionando una
muestra de a=11 clases y entrevistando despus a los B=b=6 alumnos de cada una de esas
clases.
Hechas las entrevistas obtenemos los siguientes resultados: 3 5 2 3 4 1 4 2 6 1 2 (nmero
de alumnos que aprueban la medida en cada clase).
i/ Proporcin de alumnos a favor
1 a b
y
ab
1 1
1
=
(3+5++1+2)
(11)(6)
33
=
= 0,5; , alternativamente,
66
1
1 a
y = y = (0,500+0,833+ +0,166+0,333)
11
a 1
= 0,5
y =
[17]
ii/ Varianza del estimador

Puesto que estamos ante una muestra aleatoria de conglomerados el error ser igual al de
este tipo de muestreo (MAS), sustituyendo valores individuales por valores de
conglomerados. El error estar asociado a la seleccin de los conglomerados pues dentro de
cada conglomerado se investiga a todos los elementos y, por tanto, al no realizarse seleccin
no hay error. La frmula de la varianza es muy semejante a la utilizada en MAS,
apareciendo los valores de los conglomerados en lugar de los individuos.
vy (c) = (1-fa)
s a2
a
Donde:
a
fa=
A
11
=
;y
110
1 a
s a2 =
(
a 1 1
[18]
)2
1
[(0,500-0,500)2+ +(0,333-0,500)2]
10
1
= 0,723
10
= 0,0723
11 0,0723
vy (c) = (1
)
= 0,0059
11
110
sy (c) = 0,077
Una frmula alternativa, ms sencilla de utilizar para calcular la varianza del estimador,
sera la siguiente (Kish, 1965: 153):
a
y2
1
2
vy (c) = (1-fa)
( y )
a
ab 2 (a 1) 1
11
1089
1
= (1
)
25
2
110 (11)(6 )(10)
11
= 0,00584; y
sy (c) = 0,0764
[19]
Y la varianza del estimador en una muestra aleatoria simple, con la que compararemos la
varianza del estimador de la muestra por conglomerados, sera igual a:
s2
n
66 (0,5)(0,5)
= (1
)
660
66
= 0,00341; y el error tpico sera igual a:
sy (0) = 0,0584
vy (0) = (1-f)
iii/ Efecto del diseo

Siendo el efecto del diseo igual a:
2
D =
=
vy
(c)
v y 0
0,00584
1,713
0,00341
Y el tamao de la muestra para obtener mediante un diseo por conglomerados el mismo

error que con una muestra aleatoria simple sera igual a (66)(1,713)= 113 entrevistas. Vemos
de qu manera el uso de los conglomerados aumenta la varianza de las estimaciones y, con
ello, el nmero de entrevistas necesarias para conseguir precisiones similares a las que se
consiguen con muestras MAS.
An podramos comparar el efecto que tiene el diseo de conglomerados con el que

vimos de muestra sistemtica estratificada. En este ltimo caso la perdida de precisin del
muestreo por conglomerados todava es mayor:
D2 =
=
vy
(c)
v y sw
0,00584
2,171
0,00269
iv/ Efecto del diseo y correlacin intraconglomerados

La razn de la menor precisin (mayor varianza del estimador) de las muestras por
conglomerados se debe a la correlacin que existe entre las respuestas de los miembros de
un mismo conglomerado, llamada correlacin intraconglomerados . se relaciona con el
efecto del diseo (comparacin de las varianzas muestrales de una muestra por
conglomerados con otra MAS) de la siguiente manera:
D2 = 1 + (b-1)
[20]
Donde b es el nmero de entrevistas por conglomerado y la correlacin

intraconglomerados.
En el caso que nos ocupa ser igual a:
D2 1
b 1
1,73 1
=
6 1
= 0,146
[21]
Por tanto, cuanto mayor sea la homogeneidad de los conglomerados (mayor sea ) menor
habr de ser el nmero de personas entrevistadas en cada uno de ellos. En sentido opuesto,
cuando =0 ambas muestras (conglomerados y MAS) tienen la misma precisin.
Para tener una idea del tamao de y de D2 en estudios a la poblacin general incluimos
la informacin ofrecida por Groves (1989: 277) relativa a los National Election Surveys de
los EE. UU., realizados en los aos 1982 y 1984. Segn el autor los valores medios de y de
D2, calculados sobre 8 variables distintas, fueron 0,0255 y 1,41, respectivamente, lo que nos
puede dar una idea del entorno en que se mueven estos estadsticos.
v/ Tamao ptimo de los conglomerados y modelo de costes
Cuanto mayor sea el nmero de individuos elegidos de un mismo conglomerado b y mayor
sea la correlacin intraconglomerados menor ser la precisin de un diseo por
conglomerados. Dado que es un valor fijo, si queremos controlar la precisin lo nico que
se puede modificar es b, pudiendo determinarse, para un presupuesto dado, cul es el tamao
ptimo de b que minimiza la varianza muestral.
Con el fin de determinar el tamao ptimo necesitamos definir un modelo de costes para
la encuesta. Veamos cul es la opcin elegida:
C = C0 + aCa+abCb
[22]
Donde:
C = coste total de la encuesta
C0 = costes fijos, independientes del nmero de entrevistas que hagamos (alquileres,
nminas)
a = nmero de conglomerados
Ca = coste por conglomerado (formacin, viajes, marcos muestrales)
b = nmero de individuos por conglomerado
Cb=coste por entrevista (entrevista, codificacin, grabacin de datos)
Bajo este modelo, el valor ptimo de b que minimiza la varianza del estimador para un
presupuesto dado es aproximadamente:
bpt. =
Ca 1
Cb
[23]
Donde es la correlacin intraconglomerados

Segn la frmula anterior elegiremos muchos conglomerados (y pocos individuos dentro
de cada uno de ellos) cuando:
. la homogeneidad sea grande
. el coste por elemento Cb sea grande
. el coste por conglomerado Ca sea pequeo
Pongamos que el coste relativo Ca/Cb= 17 y que = 0,10, en ese caso
bpt. = 17
1 0,10
0,10
15 entrevistas por conglomerado

5.2 Muestra polietpica
Supongamos ahora que en el estrato de Filosofa, en vez de sacar los 6 elementos de cada
conglomerado elegimos una submuestra de b=3 (B=6), y que ampliamos el nmero de
conglomerados a a=22 (A=110). De esta manera mantenemos el tamao de la muestra en 66
elementos. Supongamos que se obtienen los resultados que mostramos a continuacin: 1 2 1
1 2 0 1 2 3 0 1 2 3 2 0 2 1 3 1 2 0 3 (personas que aprueban la medida de la direccin en
cada conglomerado/clase)
y=
1
ab
1
(1+2++0+3)
(22)(3)
33
=
= 0,5 (igual valor que cuando la muestra era por conglomerados)
66
y=
ii/ Varianza del estimador

En el caso de las muestras polietpicas (multifase) tenemos dos fuentes de error: una
atribuible al hecho de que no se seleccionan todos los conglomerados y otra atribuible a que,
dentro de los conglomerados seleccionados, no se entrevista a todos sus miembros:
vy (c) = (1-fa)
s a2 a b sb2
1
a A B ab
[24]
Donde
1
( )2; y
a 1 1
1 a b
sb 2 =
(y )2
a(b 1) 1 1
sa 2 =
Si (a/A) es una cantidad pequea el segundo trmino tambin es pequeo; por lo tanto,
como una aproximacin al clculo del error ste se puede eliminar. En compensacin
tratamos la seleccin de las Unidades Primeras de Muestreo (PSU) como si estuviera hecha
con reemplazamiento (eliminamos el factor de correccin 1-f), aunque en verdad hayan sido
elegidas sin reemplazamiento (Kalton 1983: 34). La eliminacin del factor de correccin
aumenta el error muestral como compensacin por la eliminacin que hemos hecho del
segundo trmino de error.
vy (c) = (1- fa)
a
y2
s a2
1
2
2
y
a
a
ab (a 1) 1

[25]
2
33
1
[(12+22+ +02+32)]
2
22
(22)(3 )(22 1)
1
=
(71 49,5) = 0,00517
4158
sy (c) = 0,077
=
iii/ Efecto del diseo

Calculamos la varianza muestral en un diseo MAS, igual a:
s2
n
66 (0,5)(0,5)
= 1
= 0,00341; y
66
660
vy (0) = (1-f)
D2 =
vy
(c)
v y 0
0,00517
= 1,52
0,00341
El valor de D2 es inferior al que tenamos cuando la muestra era por conglomerados

(D =1,73). Ello es debido al menor tamao de b, que ha pasado de 6 a 3 personas, a pesar de
que la correlacin intraconglomerados ha aumentado:
2
D 2 1 1,52 1
=
= 0,26
b 1
3 1
5.3 Muestra por conglomerados de distinto tamao

Lo ms normal es que los conglomerados no tengan el mismo tamao, en ese caso estamos
en una situacin diferente a las vistas hasta ahora. Por ejemplo, imaginemos que los N=660
alumnos de Filosofa se encuentran repartidos en A=12 clases, ahora de tamaos diferentes,
y que hemos de extraer una muestra de n=66. El Cuadro 8 muestra los datos.
Cuadro 8
Conglomerados de distinto tamao (B)
Clase (A)
10
11
12
Tamao (B)
65
55
45
30
70
35
80
90
20
40
75
55
B acumulado
65
120
165
195
265
300
380
470
490
530
605
660
La muestra ha de ser MESIP, por lo que la probabilidad de seleccin de cada uno de los
individuos de la poblacin ha de ser igual a la fraccin de muestreo (f=n/N=66/660=1/10).
Para la seleccin de la muestra podemos proceder de dos maneras diferentes:
a/ Seleccin de los conglomerados de primea etapa (PSUs) con igual probabilidad
Pongamos que seleccionamos 6 clases (conglomerados); en este caso la probabilidad de
seleccionar cada conglomerado es de 6/12=1/2. Y la probabilidad de seleccin de cada
alumno se puede obtener utilizando la regla multiplicativa de las probabilidades. En general,
en un diseo en dos fases la probabilidad de obtener el elemento dado que previamente
hemos elegido el conglomerado al que pertenece es igual a:
P() = P()P(/)
[26]
Donde P() es la probabilidad de seleccionar el conglomerado , y P(/) es la

probabilidad de seleccionar el elemento , a condicin de que previamente hayamos
seleccionado el conglomerado al que pertenece.
En nuestro ejemplo si la probabilidad de seleccionar los conglomerados P() es de 1/2 y
la fraccin de muestreo es de f=P()=1/10, la probabilidad de seleccionar a los elementos
de los conglomerados P(/) ha de ser igual a 1/5. Es decir, a la hora de seleccionar a los
alumnos dentro de las clases la tasa de muestreo ha de ser de 1 de cada 5:
P() =
11 1
2 5 10
Imaginemos ahora que al seleccionar al azar los conglomerados, todos ellos con igual
probabilidad, salen elegidos los ms grandes: clases 1 5 7 8 11 12. En ese caso, siguiendo la
fraccin de muestreo elegiramos 1 de cada 5 miembros de cada clase y la muestra, en vez
de tener los 66 elementos previstos, tendra un tamao de 87 unidades. Si por el contrario
salieran elegidos conglomerados ms pequeos el tamao sera menor que 66. Por ejemplo,
la eleccin al azar de los conglomerados 2 3 4 6 9 10 dara una muestra de 45 elementos.
El procedimiento que estamos explicando tiene el inconveniente de que no podemos
saber a priori el tamao que va a tener la muestra, pues dependiendo de qu clases
(conglomerados) seleccionemos en la primera etapa as ser su tamao definitivo. Con el fin
de evitar este problema se utiliza el procedimiento que explicamos a continuacin,
denominado seleccin con probabilidad proporcional al tamao de los conglomerados
b/ Seleccin de los conglomerados de primera etapa (PSUs) con probabilidad
proporcional a su tamao (PPS, siglas en ingls)
Siguiendo con el ejemplo anterior lo que se hace es seleccionar los conglomerados (PSU)
con probabilidad proporcional a su tamao y, una vez elegidos los conglomerados,
seleccionar igual nmero de elementos en cada uno de ellos. En general, la ecuacin de
seleccin para una muestra MESIP en estas condiciones es igual a:
P() = f =
aB
b
n
a
B
N
B
[27]
Donde a conglomerados (PSUs) se seleccionan por un procedimiento PPS, se

muestrean b elementos de cada PSU elegida, n=ab y N==1B
El procedimiento para hacer la seleccin consiste en acumular el nmero de elementos de
cada conglomerado (vase Cuadro 6). Luego, a cada conglomerado se le asocia una cantidad
de nmeros igual al nmero de elementos que lo componen. As, el conglomerado (clase) 1
queda asociado a 65 nmeros que van del 001 al 065; el conglomerado 2 a 55 nmeros, del
066 al 120; el 3 a 45, del 121 al 165; y as sucesivamente. De esta manera a cada
conglomerado se le asigna una cantidad de nmeros igual a su tamao (B). Una vez
asignados los nmeros se sacan a=6 nmeros al azar y se seleccionan aquellos
conglomerados que tengan los nmeros elegidos. Por ejemplo, si uno de los nmeros fuera
el 200 se elegira la clase 5, puesto que esta clase est asociada a los nmeros 196 a 265.
La seleccin de los 6 nmeros puede hacerse por un procedimiento MAS o por otro
sistemtico. El primero de ellos implica que se puede elegir un mismo conglomerado ms de
una vez, por tratarse de un procedimiento de muestreo con reemplazamiento. El segundo
evita este problema, ya que se trata de un muestreo sin reemplazamiento. Para hacer la
seleccin de los conglomerados segn este ltimo procedimiento calculamos un intervalo de
seleccin K=N/a=110. Elegimos un nmero al azar (Arranque Aleatorio) entre 1 y 110, por
ejemplo el 40; y a este nmero le vamos sumando 110:
AA=40;
40+110=150;
150+110=260;
260+110=370;
370+110=480;
480+110=590
Miramos en el Cuadro 8 y vemos que estos nmeros corresponden a las clases 1 3 5 7 9
11, que seran las elegidas para seleccionar b=11 alumnos en cada una de ellas. Imaginemos
que sus respuestas a la pregunta sobre la actuacin de la direccin del Centro fuera como
sigue: 3 7 9 1 5 8 (nmero de alumnos que estn a favor en cada clase). En este caso:
y=
y
n
y /a
1
= 33/66
= 0,5
La media as calculada es un estimador insesgado de la media poblacional.
ii/ Varianza del estimador (conglomerados finales o ultimate cluster sampling)
Si queremos calcular la varianza del estimador, dado que los tamaos de los conglomerados
son distintos no podemos hacerlo como si de una muestra aleatoria de conglomerados se
tratase, para utilizar despus la frmula del muestreo aleatorio simple [19]. Una posibilidad
para sortear este problema es recurrir a la idea de conglomerados finales (en ingls, ultimate
cluster sampling) (Kalton 1983: 41-42). En este procedimiento lo que hacemos es dividir los
a conglomerado en B/b conglomerados finales (por simplicidad, asumimos que B/b es un
nmero entero). Una vez que estn divididos seleccionamos a conglomerados finales por un
procedimiento MAS. Este procedimiento es equivalente al procedimiento PPS, excepto que
en los conglomerados finales podemos seleccionar ms de uno dentro de un mismo
conglomerado (PSU), cosa que no es posible en el muestreo PPS. A condicin de que esta
probabilidad no sea grande podemos asumir que las diferencias entre ambos procedimientos
carecen de importancia, pudiendo calcular la varianza muestral como hacamos en el
muestreo polietpico (multifase) con conglomerados de igual tamao [25]. Veamos los datos
en el Cuadro 9.
Cuadro 9
Conglomerados finales (CF)
Clase
10
11
12
Tamao (B)
66
55
44
33
77
33
88
88
11
44
55
66
N de CF
CF acumulados
11
15
18
25
28
36
44
45
49
54
60
En los clculos que mostramos a continuacin, por simplicidad asumimos que todos los
conglomerados tienen un tamao mltiplo de b=11 y que, una vez seleccionados los
conglomerados finales, los datos que obtenemos (nmero de estudiantes a favor de la
reforma universitaria) son los mismos que hemos utilizado previamente para calcular la
media:
vy (c) =
a
y2
s a2
1
2
2
y
a a
a ab (a 1) 1

1
=
(229 181,5)
2
(6)(11 )(6 1)
47,5
=
= 0,01308
3630
c/ Seleccin de los conglomerados de primera etapa (PSUs) con probabilidad

proporcional a su tamao estimado (PPES, siglas en ingls). Medidas de razn
El requisito para que se pueda utilizar el procedimiento de seleccin de las unidades de
muestreo con probabilidad proporcional al tamao (PPS) es, justamente, que se conozca ese
tamao, cosa que no siempre est al alcance del investigador. Sin embargo, en muchos casos
s que podemos conocer un tamao aproximado de los conglomerados, quiz a partir de
recuentos (p. ej. censos) anteriores. En ese caso, podemos utilizar en la muestra estos
tamaos estimados, en sustitucin de los reales, siempre que no sean muy distintos. El
Cuadro 10 muestra los datos que hemos utilizado al explicar el muestro PPS, al que se han
aadido tamaos esperados bajo el supuesto de que desconocemos los tamaos reales de los
conglomerados.
Cuadro 10
Conglomerados con tamaos reales (B) y estimados (M)distintos
Clase
10
11
12
Tamao (B)
65
55
45
30
70
35
80
90
20
40
75
55
660
Tamao
estimado (M)
70
65
50
35
80
45
60
95
35
50
80
55
720
Tamao muestra
10,2
esperado
9,3
9,9
9,4
9,6
8,6
14,7 10,4
6,3
8,8
10,3 11,0
B acumulado
120
165
195
265
300
380
490
530
605
65
470
660
Cuando utilizamos tamaos esperados, en vez de hablar de muestreo con seleccin de los
conglomerados con probabilidad proporcional al tamao (PPS) decimos que la seleccin se
hace con probabilidad proporcional al tamao esperado (PPES). Y en este caso, la ecuacin
de seleccin [27] quedara tal como mostramos a continuacin:
P() = f =
n
aM
b
a
N
M
M
[28]
Si se quiere mantener que la muestra sea MESIP, el uso de los tamaos esperados implica
que la tasa de muestreo en la seleccin de los individuos dentro de los conglomerados ha de
ser igual a b/M y el tamao de la muestra b(B/M). Siguiendo este procedimiento hemos
calculado los tamaos de muestra esperados en cada conglomerado, suponiendo que fueran
elegidos en la primera fase de muestreo. Como se puede observar en el Cuadro 8, ahora en

vez de hacer 11 entrevistas en los 6 conglomerados elegidos en la primera fase,
independientemente de cules salieran elegidos tal como ocurra cuando la seleccin era
PPS, el nmero vara, tan solo siendo igual a 11 individuos en la Clase 12, en la que
tamaos esperado y real coinciden. El uso de tamaos de muestra iguales (b=11) en cada
conglomerado seleccionado en primera fase habra modificado la probabilidad de seleccin
de los individuos dependiendo de a qu conglomerado pertenecieran. Por ejemplo
individuos del conglomerado 1 tendran una probabilidad de seleccin de 4620/46800=0,099
sobre 1, mientras que, p. ej., para los de la clase 9 la probabilidad sera de
2310/14400=0,160 sobre 1.
6 70 11
4620
aM b
P(1)= a 1
=
0,099
720 65 46800
B1
M
1
P(9)=
2310
6 35 11
0,016
720 20 14400
Como consecuencia del uso del muestreo PPES el tamao total de la muestra no es una
constante, de valor fijo, sino que se trata de una variable aleatoria cuyos valores dependen de
los conglomerados que se elijan en la primera fase del muestreo. En este caso la media (r)
consiste en la razn de dos variables aleatorias: la variable que estemos estudiando (y) y el
tamao de la muestra (x), tambin variable segn acabamos de explicar.
r=
y
x
[29]
Este tipo de media, llamado media de razn, no es un estimador insesgado de la media

poblacional; sin embargo, el sesgo es despreciable a condicin de que el coeficiente de
variacin del denominador x sea inferior a 0,1, siendo este coeficiente el error tpico de x
dividido por su valor esperado (el valor esperado del tamao de la muestra).
cv(x)=
s ( x)
[30]
Tratndose de un total, la varianza v(x) ser igual a:

a
v(x)= ns2= n ( x x) 2 /(n-1)

1
s(x) = v( x )
La varianza de la media de razn tambin se ve afectada por el tamao variable de la
muestra, y para su clculo se ha de recurrir a un procedimiento llamado la expansin de
Taylor o mtodo Delta. Su uso requiere que el coeficiente de variacin de x sea inferior a 0,2
(Vanse Kish, 1965: 182-193; Kalton, 1983: 44-45).
vr=
1
[vy+r2vx2rcovx,y]
x2
[31]
Donde covxy es la covarianza de x e y, de valor:

covxy=
a
a 1
y x
vy=
a a 2 y2
y a ; y
a 1 1
vx=
a a 2 x2
x a
a 1 1
yx
a
Veamos el clculo de la media r y de la varianza vr suponiendo que han sido elegidas las
clases 1 3 5 7 9 11, solo que ahora, en vez de seleccionar 11 elementos en cada una de ellas,
seleccionamos 10 10 10 15 6 y 10 (valores redondeados), lo que hace un total de 61
alumnos. Imaginemos que sus respuestas a la pregunta sobre la actuacin de la direccin del
Centro fuera como sigue: 3 7 9 1 5 8 (nmero de alumnos que estn a favor en cada clase).
Media r =
y 33
= 0,54%; y
x 61
Varianza muestral vr=
1
[vy+r2vx2rcovxy]
2
x
Donde:
a a 2 y2
6
1089
vy=
y
229
57,0
a 1 1
a
6 1
6
a a 2 x2
6
3721
vx=
x
661
49,02
a 1 1
a 6 1
6
a a
yx
covxy=
= 6 315 3361 = -24,6
y x
a 1 1
6
a 6 1
cvx=
sx
57
0,124
x
61
El coeficiente de variacin de x tiene un valor algo superior a 0,10, como consecuencia

del escaso tamao de la muestra (Kalton, 1983: 71), lo que hace que a pesar de estar por
encima de ese valor podamos considerar que el sesgo del estimador media de razn sea
despreciable. El hecho de que su valor sea inferior a 0,2 permite estimar la varianza de la
media vr segn la frmula [31]:
vr=
1
97,86
[57,0+(0,542)(49,02)-2(0,54)(-24,6)]=
0,02630
3721
3721
sr= 0,02630 0,1622

En las explicaciones y los clculos que acabamos de hacer hemos considerado el
muestreo por conglomerados de los alumnos de Filosofa sin tener en cuenta que forman
parte de un estrato (una Facultad) dentro de la Universidad. Veamos cmo quedara, a partir
de la expresin [31], el clculo de la media y la varianza muestral teniendo en cuenta este
hecho; es decir, cuando tenemos una muestra MESIP estratificada en H estratos y

polietpica:
ah
ah
Media r=
y 1 H
y
x x h 1 1 h
y y
h 1 1
H ah
h 1
h 1
H
x
h 1
[32]
h
Donde:
y h es el total de la variable y en el conglomerado del estrato h

x h es el tamao de la muestra en el conglomerado del estrato h
y h es el total de la variable y en el estrato h
x h es el tamao de la muestra en el estrato h

Varianza muestral vr=
1
[vy+r2vx2r cov x, y ]
2
x
[33]
Donde:
H
v y a h s y2h
h 1
H
v x a h s x2h
h 1
H
c x , y a h s xy2 h
h 1
Siendo:
2
y
y h h /( a h 1)
ah
1
ah
2
yh
x
s xh h /( a h 1)
ah
1
ah
x
y
s xyh xh h y h h
a h
ah
1
ah
2
xh
/( a h 1)
Kalton (1983: 45) indica que la formula [31] puede generalizarse a cualquier muestreo
estratificado MESIP polietpico, independientemente de cules sean las probabilidades
utilizadas para seleccionar las UPMs y el tipo de submuestreo utilizado dentro de las
mismas. Tambin se puede utilizar en diseos no estratificados y en muestras con seleccin
proporcional al tamao, en las que el tamao de la muestra no es variable sino fijo vx=0 y
covxy=0. La formula sirve para calcular medias de razn y porcentajes basados en el total de
la muestra y en subclases (p. ej. solo hombres o personas con estudios superior.

Eficiencia de Los Estimadores. Muestreo Conglomerados

Hochgeladen von

Dokumentinformationen

Originalbeschreibung:

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Eficiencia de Los Estimadores. Muestreo Conglomerados

Hochgeladen von

Copyright:

Verfügbare Formate

Eficiencia de los estimadores en encuestas por muestreo1

(Efficiency of estimators in survey sampling)

5.- Muestra por conglomerados (clusters)

ii/ Varianza del estimador

iii/ Efecto del diseo

Y el tamao de la muestra para obtener mediante un diseo por conglomerados el mismo

An podramos comparar el efecto que tiene el diseo de conglomerados con el que

iv/ Efecto del diseo y correlacin intraconglomerados

Donde b es el nmero de entrevistas por conglomerado y la correlacin

Donde es la correlacin intraconglomerados

15 entrevistas por conglomerado

ii/ Varianza del estimador

iii/ Efecto del diseo

El valor de D2 es inferior al que tenamos cuando la muestra era por conglomerados

5.3 Muestra por conglomerados de distinto tamao

Donde P() es la probabilidad de seleccionar el conglomerado , y P(/) es la

Donde a conglomerados (PSUs) se seleccionan por un procedimiento PPS, se

c/ Seleccin de los conglomerados de primera etapa (PSUs) con probabilidad

elegidos en la primera fase de muestreo. Como se puede observar en el Cuadro 8, ahora en

Este tipo de media, llamado media de razn, no es un estimador insesgado de la media

Tratndose de un total, la varianza v(x) ser igual a:

v(x)= ns2= n ( x x) 2 /(n-1)

Donde covxy es la covarianza de x e y, de valor:

Varianza muestral vr=

El coeficiente de variacin de x tiene un valor algo superior a 0,10, como consecuencia

sr= 0,02630 0,1622

hecho; es decir, cuando tenemos una muestra MESIP estratificada en H estratos y

y h es el total de la variable y en el conglomerado del estrato h

x h es el tamao de la muestra en el estrato h

Das könnte Ihnen auch gefallen