Sie sind auf Seite 1von 7

Eficiencia de los estimadores en encuestas por muestreo1

(Efficiency of estimators in survey sampling)


Jun Javier Snchez Carrin
Catedrtico de Sociologa
UCM

ndice
4.- Muestreo Sistemtico
4.1 Ejemplo ilustrativo
4.2 Caractersticas del muestreo sistemtico
4.3 Intervalos fraccionales

Trabajo no reproducible

4.- Muestreo Sistemtico


Se trata ste, el muestro sistemtico, de un tipo de muestreo que, como hemos tenido
ocasin de explicar en otro lugar, resulta bastante desconocido (Snchez Carrin, 2014).
En general se suele asimilar al muestreo aleatorio simple, cuando dicha asimilacin no
siempre est justificada; y cuando lo est tampoco es la mejor asimilacin posible, dado
que se pueden hacer otros supuestos sobre la forma como est organizado el marco del
que se extrae la muestra que permiten obtener estimadores ms eficientes que los del
MAS (Lepkowski y OMuicheartaigh 1992; Kish 1965: 117-120). En este apartado
veremos cules son estos supuestos (modelos de poblacin), cmo se aplica uno de ellos
el ms apropiado al ejemplo que estamos utilizando y cul es el efecto D2 que tiene
sobre la precisin de los estimadores.
4.1 Ejemplo ilustrativo
Siguiendo con nuestro ejemplo universitario, y para simplificar los clculos, en vez de
trabajar con los 300 alumnos de toda la poblacin imaginemos que sacamos solo la
muestra de los alumnos de Filosofa: en total 66 alumnos, segn vemos en el Cuadro 1.
Las posibilidades para seleccionar a estos 66 alumnos son mltiples, dependiendo eso s
del marco muestral del que dispongamos para hacer la seleccin: muestra aleatoria
simple, muestra estratificada (ambas explicadas), muestra por conglomerados (explicada
ms adelante) y una nueva, que es la que vamos a ver ahora: muestra sistemtica.
Imaginemos ahora que el Centro nos facilita un listado con todos sus alumnos
(N=660), ordenados por los cuatro cursos de la carrera y dentro de cada curso por orden
alfabtico. Para una muestra de tamao n=66 determinamos un Intervalo de seleccin k
igual a:
Intervalo: k =

N 660

10
n
66

Elegimos un principio de la lista al azar, entre 1 y k (p. ej. el 5), al que denominamos
Arranque Aleatorio AA. A partir de aqu seleccionamos los 66 elementos de la muestra
de manera AA+k, AA+2k, AA+3k. El Cuadro 5 muestra los elementos seleccionados
y la respuesta que dan cuando se les pregunta por su actitud hacia la medida adoptada
por la Direccin del Centro.

Cuadro 5
Valores obtenidos en el muestreo sistemtico de n=66 alumnosde Filosofa del
total de N=660, donde: 1 = aprueba la medida adoptada por la Direccin; 0 = la
desaprueba. Solo se muestran los 27 primeros casos.
N Alumno
N Alumno
N Alumno
Actitud
Actitud
Actitud
seleccionado
seleccionado
seleccionado
5
1
95
1
185
0
15
0
105
0
195
0
25
0
115
0
205
0
35
1
125
0
215
0
45
0
135
0
225
0

55
65
75
85

0
0
0
0

145
155
165
175

0
0
1
1

235
245
250
255

1
1
0
0

Cuando tenemos un muestreo sistemtico y queremos estimar la media de la


poblacin los estimadores que obtenemos por este procedimiento son insesgados.
Distinto es el caso cuando queremos estimar su varianza muestral, para lo cual es
necesario hacer algn supuesto sobre la naturaleza (la organizacin) de la lista. Y ello es
as, porque la seleccin de 1 de las k posibles muestras de la lista, que es lo que se hace
en la prctica, es el equivalente a seleccionar una muestra de 1 solo conglomerado de
tamao n, lo cual tiene como consecuencia que, como decimos, no sea posible calcular
su error muestral (hacen falta ms de un elemento para poder calcular el error variable
de muestreo). Veamos 4 supuestos posibles:
i/ Seleccin MAS: se supone que la lista est ordenada aleatoriamente.
Supongamos que la lista de la poblacin est ordenada aleatoriamente; en este caso
se puede calcular la varianza muestral como si de una muestra aleatoria simple se
tratase.
S2
;
V y (s0) =(1-f)
n
Donde S2 es la varianza poblacional, que al ser desconocida se sustituye por la
de la muestra s2, por ser sta su mejor estimador:
s2
vy (s0) =(1-f)
n
ii/ Seleccin estratificada: se supone que la lista est estratificada.
En este caso la lista es homognea al interior de los estratos y existe un orden
aleatorio entra estratos (lista heterognea entre estratos). Supongamos que el reparto de
la muestra estratificada sea proporcional; en ese caso:
1 f
vy (sw) =
n

W s
h 1

2
h h

Donde Wh= n de unidades por estrato/n


En este tipo de listas (de poblaciones) hay tendencia a que las unidades prximas se
asemejen entre s y a que se desven de la media. Esta circunstancia se da en ficheros
ordenados cronolgicamente, sujetos a variacin a lo largo del tiempo (p. ej. colegiados
de un Colegio profesional). Tambin se da en listas de empleados ordenadas por grupos
de trabajo, relativamente homogneos entre s; o listas de subscriptores de una revista o
de clientes de una compaa, que pueden estar ordenadas geogrficamente. Lo mismo
ocurre cuando los listados estn ordenados por distritos o secciones de una ciudad.
La ventaja de hacer el supuesto de que la lista est ordenada estratificadamente es
que el error variable de muestreo es menor que en MAS.

iii/ Seleccin pareada: se supone que la lista est estratificada en grupos de 2


zonas
Se trata de un caso especial del diseo estratificado en el que se emparejan las
unidades de dos en dos (H=n/2). En este caso la varianza muestral ser igual a:
H

vy (swp) = 1 2 f
n

(yh1- yh2)2

h 1

iv/ Seleccin diferencias sucesivas: se supone que la lista est ordenada segn
unidades relacionadas con sus contiguas en mayor medida que con las ms alejadas.
La lista est deliberadamente ordenada de manera que yi e yi+1 estn ms
correlacionados entre s que yi e yi+2, y as sucesivamente. En este caso la varianza
muestral ser igual a:
vy (sds) =

1 f
2n(n 1)

n 1

(yg- yg+1)2

g 1

Por ejemplo, este modelo se podra aplicar si quisiramos conocer el tiempo que
duran las visitas al mdico entrevistando a lo largo del da a uno de cada k pacientes
cuando salen de la consulta.
De los modelos de poblacin que acabamos de explicar, con la informacin que
tenemos parece que el modelo ms adecuado para nuestro caso es el muestreo
estratificado, contando que, vamos a suponer, la medida adoptada por la Direccin
repercute de manera distinta en los alumnos segn el curso en el que estn matriculados:
ms favorable es la medida cuanto ms avanzado es el curso. An as calcularemos la
varianza muestral en el supuesto MAS, con el fin de ver el efecto D2 que tiene el
primero de los diseos muestrales. Primero calculemos la media, que en este caso, al
hacer el supuesto de muestra estratificada proporcional, su clculo coincide con el de
muestra MAS (datos en Cuadro 6):
H

y w=

Wh

= [(0,320)(0,238)+ + (0,200)(0,769)]= 0,500

h 1

1
y = p1 =
n

y
i 1

[1]

33
= 0,500
66

i/ Varianza del estimador en el supuesto de muestreo estratificado


1 f H
Wh s h2

n h 1
Donde Wh= Peso del estrato = n de zonas (unidades) por estrato/n

vy (sw) =

[16]

Para poder calcular el peso de cada uno de los 4 estratos (cursos) tenemos que
conocer cuntos alumnos hay matriculados en cada uno de ellos. Supongamos que los
porcentajes de alumnos son: 32% (1), 28% (2), 20% (3) y 20% (4). Iguales
porcentajes (pesos) vamos a asumir para la lista. A partir de aqu el Cuadro 6 muestra la
informacin y los clculos efectuados.
Cuadro 6
Distribucin de los estudiantes de Filosofa segn Cursos en una muestra
sistemtica bajo el modelo de estratificada con reparto proporcional
* Nmero de alumnos que aprueban la medida de la Direccin
(1)
(2)
(3)
(4)
(5)
(6)
(7)
Curso
2
Wh s h2
sh
Estadstica
Nh
nh
rh*
Wh
ph= h
1
211
21
5
0,238
0,181 0,320
0,058
2
185
19
8
0,421
0.244 0.280
0,068
3
132
13
10
0,769
0,178 0,200
0,036
4
132
13
10
0,769
0,178 0,200
0,036
Total
660
66
33
0,500
0,250 1,000
0,198

vy (sw)

66
660 [(0,320)(0,181)+ + (0,200)(0,178)]
=
66
= (0,0136)(0,198) = 0,00269
1

ii/ Varianza del estimador en el supuesto de MAS


En el ejemplo que nos ocupa hacer este supuesto implicara que la lista de los
alumnos del Centro carece de orden: no hay relacin entre el curso en el que estn
matriculados y la opinin que tienen sobre la medida que piensa adoptar la Direccin
del Centro.
p1 (1 p1 )
n 1
66 (0,500)(0,500)
vy (s0) = 1

66
660

= 0,0035

vy (s0) = (1-f)

iii/ Efecto del diseo (D2)


2

D =

vy

( sw)

v y so

0,00269
0,789
0,00341

Vemos de qu manera el muestreo sistemtico, cuando asumimos la estratificacin


de la lista (de la poblacin), es ms eficiente que cuando tratamos la lista, como suele
ser normal, pensando que se trata de una MAS. De hecho, siguiendo con la traduccin
del Efecto del diseo a nmero de entrevistas, bastaran 52 entrevistas estratificadas
para obtener igual precisin que con las 66 MAS: (0,789)(66)
4.2 Caractersticas del muestreo sistemtico

A partir del ejemplo que hemos utilizado para ilustrar el muestreo sistemtico y
dada la naturaleza algo desconocida de las posibilidades de este tipo de muestreo vamos
a detenernos en resumir cules son sus caractersticas principales.
a/ Es un muestro prctico: el muestreo sistemtico es ms fcil de implementar
que el MAS y permite una mejor comprobacin del trabajo administrativo (trabajo de
campo).
b/ Mantiene la proporcionalidad: por ejemplo, en una lista alfabtica de
nombres, el muestreo sistemtico proporciona la misma proporcin de nombres de cada
letra.
c/ Permite la estratificacin de la muestra: a condicin de que la lista est
estratificada, el muestreo sistemtico refleja esta condicin.
d/ No se asegura un valor entero de k: imaginemos que N=9 y n=2; en este
caso k=4,5. Cuando esto ocurre existen distintas soluciones:
. Permitir que la muestra vare de tamao para conseguir que k sea un nmero
entero.
. Eliminar con igual probabilidad tantas unidades como sea necesario para
reducir la lista a un tamao nk.
. Considerar la lista de manera circular: al llegar al ltimo elemento de la lista se
contina por el primero
. Los procedimientos anteriores tienen el problema de que las muestras que
seleccionamos no son MESIP. Si queremos que todos los miembros de la poblacin
(lista) tengan igual probabilidad de ser elegidos tenemos que utilizar el mtodo de los
intervalos fraccionales (vase infra).
e/ Es un muestreo MESIP: lo mismo que el MAS, el muestreo sistemtico da a
cada elemento de la poblacin la misma probabilidad de ser elegido en la muestra (por
eso decimos que es un procedimiento MESIP). Difiere del MAS en que no todas las
combinaciones de elementos tienen la misma probabilidad de ser elegidas.
f/ Es un muestreo que permite la mensurabilidad: este procedimiento permite
obtener estimaciones insesgadas de los parmetros poblacionales (p. ej. de la media
poblacional a partir de la media de la muestra), pero no calcular el error tpico de los
estimadores (tal como hemos explicado previamente) salvo que se hagan ciertos
supuestos sobre la poblacin que estamos estudiando. Veamos cules son estos
supuestos, expresados en forma de modelos.
4.3 Intervalos fraccionales
Los intervalos fraccionales se utilizan para seleccionar los n elementos de la muestra
cuando k no es un nmero entero y, adems, queremos que todos los miembros de la
poblacin tengan la misma probabilidad de ser elegidos (muestra MESIP). Imaginemos

que tenemos que seleccionar n=5 elementos de una poblacin de N=27. En este caso
k=27/5=5,4. El Cuadro 7 muestra la lista de los 27 elementos.
Cuadro 7
Elementos de una poblacin N=27 de la que se extrae una
muestra sistemtica de n=5 unidades, y en donde k no es un
nmero entero
Muestras
1

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

La solucin a la seleccin de los elementos del muestreo sistemtico cuando k no es


un nmero entero pasa por adoptar alguna de las siguientes estrategias:
i/ Permitir que n vare dependiendo de cul sea el arranque aleatorio (AA).
Segn vemos en el Cuadro 3, si elegimos las muestras 1 2 (AAs=1 2), su tamao ser
igual a n=6; por el contrario, las muestras 3, 4 y 5 (AAs=3 4 5) darn tamaos de n=5
elementos.
ii/ Omitir 2 elementos al azar para permitir que k sea un nmero entero
k=

27 2
5
5

iii/ Permitir que la lista sea circular: elegir un AA entre 1 y k y continuar


seleccionando elementos hasta que se consigan los n=5 fijados.
iv/ Como dijimos al hablar de las caractersticas del muestreo sistemtico, todos
los procedimientos anteriores tienen el problema de que generan muestras que no son
MESIP. Para evitar este problema recurrimos al procedimiento de los intervalos
fraccionales.
Para un tamao de n=5 unidades seleccionamos un arranque aleatorio entre 1 y 54
(un decimal implcito). A partir de aqu aadimos intervalos de k10. Si, p. ej., AA=33,
los elementos elegidos seran: en primer lugar, el elemento nmero 3 (eliminamos el
ltimo dgito); despus el 33+54=87, en cuyo caso elegiramos al elemento 8. El
siguiente sera el 87+54=141, siendo el elemento 14 el seleccionado. Vendra despus el
141+54=195 (elemento 19). Y, por ltimo, el 195+54=249 (elemento 24). De esta
manera hemos conseguido seleccionar los n=5 elementos dndoles a todos la misma
probabilidad.

Das könnte Ihnen auch gefallen