Sie sind auf Seite 1von 17

Técnicas de Muestreo

UNIDAD 5
MUESTREO SISTEMÁTICO
El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren
de un trabajo detallado en el proceso de selección de la muestra. Porque las unidades de
muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de
aleatorización, como una tabla de números aleatorios, pueda utilizarse para seleccionar
unidades específicas de la muestra. Un diseño de muestreo que se utiliza frecuentemente
porque simplifica el proceso de selección de la muestra es el muestreo sistemático (m.s).

5.1.-PRESENTACIÓN DEL MUESTREO SISTEMATICO


El muestreo sistemático es un proceso de selección regular cuyo punto de inicio es aleatorio,
tomando un elemento de los k primeros elementos y posteriormente la selección de cada k-
ésimo elemento, este tipo de muestreo es mas fácil de realizar y esta menos expuesto a
errores del encuestador.
La muestra sistemática se define como una muestra obtenida al seleccionar aleatoriamente
un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento se
denomina muestra sistemática de 1 en k.
Por ejemplo, suponga que va a seleccionarse una muestra de n nombres de una larga lista;
una forma sencilla de seleccionarlos es, eligiendo un intervalo apropiado (dependiendo de n)
y seleccionar los nombres a lo largo de la lista. De ese modo si k=10, se escoge un numero
aleatorio entre los 10 primeros elementos, suponga que fue el 4 (selección aleatoria), el
siguiente elemento sería el 14 luego el 24 y así sucesivamente se toma una observación
cada 10 elementos.
Las ventajas del muestreo sistemático son las siguientes:
1 El muestreo sistemático es fácil de realizarse en el campo y por su forma de llevarse a
cabo está menos expuesto a los errores de selección que cometen los investigadores.
2 El muestreo sistemático puede proporcionar mayor información
informaci ón por unidad de costo
que la que proporciona el muestreo irrestricto aleatorio ya que se extiende más
uniformemente sobre toda la población y por lo tanto puede proporcionar mayor
información que una muestra equivalente en tamaño, tomada con muestreo irrestricto
aleatorio.
Técnicas de Muestreo

Una consideración importante en el muestreo sistemático es que su precisión depende del


orden de las unidades de muestreo en el marco, ya que si estas están dispuestas de manera
aleatoria entre todos los demás entonces la ventaja se pierde y resulta equivalente al
irrestricto aleatorio.
Otros ejemplos del uso del muestreo sistemático se dan cuando se realiza la selección de
cada k- esimo cuestionario de un censo, para su validación; cada k-esimo renglón de un libro
para su revisión; o cada k-esima manzana de mapas numerados. Las ventajas mencionadas
se acentúan cuando se le encarga a un enumerador la selección de las unidades de
muestreo. Su instrucción puede consistir en que liste las viviendas de una manzana y que
seleccione posteriormente las unidades numeradas r, r+k, r+2k etc. (r es el punto de partida).
También puede servir para supervisar el trabajo de un enumerador, durante el levantamiento
de cuestionarios en un censo, de modo que cada décimo cuestionario sea verificado.
La ventaja de que el muestreo sistemático produce muestras proporcionales se puede
apreciar al seleccionarla de una lista de nombres en orden alfabético producirá
aproximadamente la misma proporción de nombres de cada letra, o también en el caso de
los auditores que requieren muestrear de una larga lista ordenadas en el tiempo, de cuentas
para comprobar el cumplimiento de los procedimientos de contabilidad.
Los investigadores de mercado y los encuestadores, que regularmente muestrean personas
en movimiento, frecuentemente utilizan un diseño sistemático, por ejemplo a cada vigésimo
cliente en un mostrador de pago se le puede preguntar su opinión acerca del sabor, color o
textura de un producto alimenticio o a cada décima persona que aborde un autobús se le
puede pedir que responda un cuestionario acerca del servicio del autobús.
Los ingenieros agrónomos pueden muestrear sistemáticamente parcelas de terreno para
estimar proporción de árboles enfermos o para estudiar patrones de crecimiento. Todas
estas muestras son sistemáticas.

5.2.-OBTENCIÓN DE UNA MUESTRA SISTEMATICA


Los métodos para seleccionar los datos en un muestreo irrestricto aleatorio y en un muestreo
sistemático son muy diferentes, en el primer caso se seleccionan con una tabla de números
aleatorios y en el sistemático solamente el primer elemento se selecciona al azar entre los
primeros k elementos y luego se seleccionan los demás de 1 en k hasta que se complete la
Técnicas de Muestreo

muestra.
Las muestras sistemáticas se seleccionan de 1 en 3 o de 1 en 5 en general de 1 en k, ahora
¿cómo se selecciona el número k? Sabiendo que N es conocido y se puede determinar el
tamaño de “n”, entonces k debe de ser un número aleatorio menor o igual que N/n o sea:

 N 
k  ≤
n
Posteriormente se selecciona cada k-esimo elemento a partir del punto de inicio hasta
completar el tamaño de muestra n
Cuando N es desconocido la selección de k generalmente se supone para poder obtener una
muestra de tamaño “n” pero si “k” se selecciona muy grande, el tamaño de “n” que se
requiere no se podrá obtener utilizando una muestra sistemática de 1 en k de la población.
Ejemplo.
En una preparatoria de 2998 estudiantes repartidos en tres grados se desea conocer la
opinión de los estudiantes sobre la utilidad del evento “feria del libro” que se realiza cada fin
de curso. Se puede tener la lista de los estudiantes ordenados por grado, si optamos por un
muestreo irrestricto aleatorio, posiblemente obtengamos mayor cantidad de estudiantes de
primer grado cuya opinión será muy diferente a la de los estudiantes del segundo y del tercer
grado, ya que por las fechas en las que se realiza el evento, los estudiantes del primer grado
no tienen ninguna experiencia previa y esto daría una estimación deficiente y alejada de la
realidad, en cambio con un muestreo sistemático se tendrían elementos proporcionales de
los tres grados.
Si seleccionamos una muestra del 10% de los estudiantes, tendremos un intervalo muestral
de k=10. Si el número al azar entre 1 y 10 es 4 los estudiantes con los números:
4, 14, 24, 34, 44, 54,……2994
conformarán la muestra. Si el número seleccionado al azar es el 9, entonces la muestra se
integraría con los estudiantes listados con los números
9, 19, 29, 39, 49, 59,……2989
En la primera muestra se tienen 300 estudiantes y en la segunda solamente 299. El tamaño
de la muestra puede diferir en una unidad cuando N no es exactamente divisible entre k.
Observe que no se podrá seleccionar exactamente a k cuando el tamaño de la población es
desconocido. Podemos determinar un tamaño de muestra n aproximada, pero debemos
Técnicas de Muestreo

suponer el valor de k necesario para obtener un tamaño de muestra n. Si se selecciona un


valor de k muy grande, el tamaño de muestra n requerida no se obtendrá usando una
muestra sistemática de 1 en k de la población. Este resultado no presenta problema si el
experimentador puede volver a la población y realizar otra muestra sistemática de 1 en k
hasta obtener el tamaño requerido. Sin embargo en algunas situaciones, obtener una
segunda muestra sistemática es imposible. Por ejemplo, tomar una muestra sistemática de 1
en 40 compradores de periódicos, es prácticamente imposible, si el tamaño de la muestra es
de n=90 compradores y no se obtiene en el tiempo que los compradores pasan por la
esquina.

5.3.-ESTIMACIÓN DE UNA MEDIA, DE UN TOTAL Y DE UN PROPORCIÓN


POBLACIONAL
Sabemos que el objetivo de las encuestas por muestreo es estimar uno o más parámetros de

la población. Para estimar una media poblacional se puede utilizar la media muestral  y de

una muestra sistemática.


Estimador de la media poblacional µ
n

∑  y i

µ ˆ =  y  s = i=1

Varianza estimada de  y s


2
  n  
n
 ∑  y i 
 s 2   N  − n  ∑  y i −   i =1  
2

ˆ
V ( y s ) =   en donde
n
 s 2 = i =1
n    N    n −1
n

∑  y i
2
− n y 2
o también  s 2 = i =1

n −1

Limite para el error de estimación


 s 2   N  − n 
2 vˆ( y s ) = 2    Con una probabilidad del 95%
n    N   

Cuando N se desconoce se elimina el factor de corrección por población finita (c.p.f) de las
ecuaciones anteriores.
Técnicas de Muestreo

Estimación de un total poblacional


La estimación de un total poblacional requiere del conocimiento del total de elementos N de
la población, de manera semejante a lo que se hizo en el muestreo irrestricto aleatorio y en el
aleatorio estratificado, para estimar τ  en el muestreo sistemático, se utiliza la siguiente
relación:

Estimador del total poblacional τ :


τ ˆ s =  N y s

Varianza estimada de τ  s :

2   s    N  − n 


2
V (τ  s ) = V ( N  y s ) =  N  V ( y s ) =  N   
ˆ ˆ 2 ˆ

n
       N   
Límite para el error de estimación:

ˆ ( N  y ) = 2  N     


   N  − n 
2
 s
 B = 2 V   s
2
 n   N   con el 95% de confianza

      
Es importante notar que se necesita conocer el valor de N para poder estimar τ cuando se
usa un muestreo sistemático.
Estimador de una proporción poblacional
Es común que se desee estimar una proporción poblacional con base en los datos de una
muestra sistemática, en este caso al igual que en el muestreo irrestricto aleatorio las

propiedades de la proporción  p̂ s   son similares a la de la media muestral  y s , considerando


que las respuestas se miden de la siguiente manera:
yi = 1 si el elemento muestreado posee la característica de interés
yi = 0, si no posee la característica
Por lo que el estimador es el promedio de las respuestas 0 y 1 de la muestra.
 Así el estimador de una proporción poblacional es:
n

∑ y
i =1
i

 pˆ s =  y s =
n
Técnicas de Muestreo

Varianza estimada de  p̂ s es:


 pˆ qˆ   N  − n 
V ˆ ( pˆ s ) =  s s   en donde: qˆ s = 1 − pˆ  s
n − 1    N   
Límite para el error de estimación es:

 pˆ qˆ   N  − n 


 B = 2 V ˆ ( pˆ s ) = 2  s s   con el 95% de confianza
n − 1    N   
Recuérdese que cuando el tamaño de la población es desconocido entonces se omite el cpf,
suponiendo a N relativamente grande con respecto a “n”.
Observación
Una observación pertinente en la estimación de los parámetros anteriores, es que la varianza

de  y s es idéntica a la varianza estimada de  y , obtenida por muestreo irrestricto aleatorio,

esto no implica que las varianzas poblacionales sean iguales, ya que la varianza de  y  esta

dada por la relación:

σ  2   N  − n 
V ( y ) =  
n   N  − 1 

y la varianza de  y s  esta dada por la relación:

σ 2
V ( y s ) = [1 + (n − 1) ρ ]
n
en donde  ρ   es una medida de la correlación entre los pares de elementos dentro de la

misma muestra sistemática.


•  Cuando  ρ   está cercano a uno, significa que los elementos muestrales son muy
parecidos con respecto a la característica que se esta midiendo y por lo tanto la
varianza de la media muestral sistemática será mayor que la que produciría el
muestreo irrestricto aleatorio.
• Si  ρ   es negativo entonces se pensaría que los elementos muestrales son

extremadamente diferentes y así el muestreo sistemático podría ser mejor que el


irrestricto aleatorio, una observación importante es que  ρ   no puede ser tan

negativamente grande como para que la varianza pueda ser negativa.


Técnicas de Muestreo

• Por último si  ρ  esta cercano a cero y N lo bastante grande el muestreo sistemático

es aproximadamente equivalente al irrestricto aleatorio.


Es importante señalar que un estimador insesgado de V ( y s ) no puede ser obtenido usando

solamente los datos de una muestra sistemática, sin que esto implique que nunca se pueda
estimar la V ( y s ) , ya que en ocasiones el muestreo sistemático es equivalente al irrestricto

aleatorio y pueden usarse las estimaciones de la varianza.


El éxito del muestreo sistemático con relación al irrestricto aleatorio o con respecto al
estratificado, depende mucho de las propiedades de la población.
En algunas poblaciones el muestreo sistemático es extremadamente preciso y en otras
resulta menos preciso, ya que dependiendo de la población y de algunos valores de n, la
V ( y s ) puede incrementarse aun al tomar una muestra grande, por lo tanto, es muy difícil dar

un consejo general respecto a las distintas situaciones en donde se pueda utilizar un


muestreo sistemático, para ello es necesario conocer la estructura de la población para
usarlo de manera efectiva.
 Ahora, es importante aclarar que la correlación que se da entre los pares de elementos
dentro de una muestra sistemática depende del tipo de población de donde se seleccione la
muestra.
Para ello se consideran tres tipos de poblaciones:
1 Población aleatoria
2 Población ordenada
3 Población periódica
La población aleatoria es aquella en que sus elementos están ordenados al azar.
Cuando una muestra sistemática se selecciona de una población aleatoria, se espera que
sus elementos sean heterogéneos y que no tengan correlación entre valores vecinos con
 ρ  = 0   por lo que la varianza de  y s es aproximadamente igual a la de  y , por lo que ambos

tipos de muestreo resultan equivalentes.


La población ordenada  es aquella cuyos elementos están ordenados en magnitud de
acuerdo a algún esquema.
Cuando una muestra sistemática se selecciona de una población ordenada, es generalmente
Técnicas de Muestreo

heterogénea con  ρ  ≤ 0  y si N es grande puede demostrarse que V ( y s ) ≤ V ( y ) por lo que una

muestra sistemática de una población ordenada proporciona mas información que una
muestra irrestricta aleatoria por unidad de costo. Por ejemplo una lista de las cuentas por
cobrar pueden estar ordenadas de mayor a menor cantidad, así la estimación de la muestra
sistemática podría tener una varianza menor (generalmente inestimable) que la de de una
m.i.a; ya que barre con todos los valores de las cuentas.
Como no podemos obtener una estimación de V ( y s ) con base en los datos de una muestra,

una estimación conservadora de dicha varianza es:

 s   N  − n 
2

V ( y s ) =  
n    N   
La población periódica es aquella cuyos elementos tienen variación cíclica.
Cuando una muestra sistemática es seleccionada de una población periódica, la efectividad
del muestreo sistemático depende del valor de k.
Los elementos de este tipo de muestra pueden ser homogéneos (  ρ  > 0 ) y cuando esto se da

V ( y s ) ≥ V ( y )  y en este caso el muestreo sistemático proporciona menos información que el

irrestricto aleatorio por unidad de costo.


Una forma de abatir este problema es cambiando varias veces el punto de inicio aleatorio y
de esta manera se reduce la posibilidad de seleccionar observaciones con la misma posición
relativa en una población periódica. Lo anterior tiene el efecto de mezclar los elementos de la
población y al mismo tiempo el de seleccionar una sola muestra sistemática. Esto nos
permite suponer que la muestra obtenida es equivalente a una muestra sistemática obtenida
de una población aleatoria, entonces la varianza V ( y s ) puede aproximarse usando la

relación:

ˆ ( y ) =  s 2   N  − n 


V   s  
n    N   
Si hay una variación periódica en la población debemos de tener cuidado en el uso del
muestreo sistemático. Por ejemplo si los hombres y las mujeres se alternan en una lista y k 

es par, la muestra sistemática solo tendrá hombres o solo mujeres, por lo que la estimación
no sería representativa del parámetro.
Técnicas de Muestreo

Ejercicio 1
La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la
cantidad promedio de llenado de latas de 12 onzas que sale de una línea de producción. Los
datos de la tabla adjunta representan una muestra sistemática de 1-en-50 de la producción
de un día. Estime µ y establezca un límite para el error de estimación. Suponga que N =
1800
Cantidad de llenado (en onzas)
12.00 11.97 12.01 12.03 12.01 11.80
11.91 11.98 12.03 11.98 12.00 11.83
11.87 12.01 11.98 11.87 11.90 11.88
12.05 11.87 11.91 11.93 11.94 11.89
11.72 11.93 11.95 11.97 11.93 12.05
11.85 11.98 11.87 12.05 12.02 12.04

Solución:
La estimación de µ esta dada por
n

∑ y
i =1
i
430.01
 y s = = = 11.94onzas
n 36
2
Para estimar el límite para el error de estimación, primero se calcula s
2
  n  
n  ∑ yi 
∑  y −   i =1  
2
5136.57 − 184908 .6
i =1
i
n 36 = 0.2199 = .0063
 s = =
2

n −1 35 35
Suponemos que la población de latas en una línea de producción, es una población aleatoria,
entonces la varianza la estimaremos con:

ˆ  s 2   N  − n  .0063  1800 − 36 


V ( y s ) =  =   = 0.00017
n    N    36   1800  

Y el límite para el error de estimación al 95% de confianza, sería:

2 V ˆ ( y s ) = 2 .00017 = .0262


Técnicas de Muestreo

En resumen estimamos que el promedio de llenado de latas de 12 onzas es de 11.94 onzas,


y el límite para el error de estimación con un 95% de confianza es de 0.0262 por lo que la
verdadera media del parámetro se debe de encontrar en el siguiente rango de valores
(11.91,11.97) onzas.
Ejercicio 2
La empresa del caso anterior desea estimar el total de líquido utilizado en la línea de
producción que se muestreo. Estime el total poblacional de la producción de un día con un
límite para el error de estimación.

τ ˆ s =  N  y s = 1800 (11 .94 ) = 21492 .onzas


 Ahora el límite para el error de estimación al 95% de confianza sería:

ˆ ( N  y ) = 2  N 2V 
2 V  ˆ ( y ) = 2 (1800) 2 (0.00017) = 46.94
 s s

Ejercicio3
La gerencia de una compañía constructora está interesada en estimar la proporción de sus
empleados de albañilería que favorecen una nueva política de la empresa de realizar los
pagos de sus salarios mensualmente, a diferencia de la política anterior de pagos
semanales. Se cuenta con una lista de los empleados referidos, en orden alfabético por lo
que suponen que el comportamiento es el de una población aleatoria. Realizan una muestra
sistemática de 1 en 10 de los empleados y los resultados de la encuesta para conocer
quienes son los que favorecen la nueva política se dan en la tabla adjunta; estime la
proporción de ellos sabiendo que se cuenta con 2000 trabajadores de albañilería y
establezca un límite para el error de estimación.

Empleado muestreado Respuesta


3 1
13 0
23 1
: :
: :
1997 1
200

∑ y
i =1
i = 132
Técnicas de Muestreo

Respuesta:  pˆ = 0.66 , B=0.0637.

5.4.-TAMAÑOS DE MUESTRA PARA ESTIMAR MEDIAS TOTALES Y PROPORCIONES


Para determinar el número de observaciones requeridas para estimar una media poblacional
con un límite para el error de estimación B determinado, se encuentra despejando n de la
relación siguiente:

 B = 2 V (θ ˆ s )

Para cualquiera de los estimadores θ ˆ s  (media, total o proporción poblacional) basados en un

muestreo sistemático. Pero esta ecuación involucra a σ s2 y ρ que deben de ser conocidas o
al menos poderlas estimar de estudios previos, en estas notas utilizaremos la fórmula para
calcular n que se uso en el muestreo irrestricto aleatorio, pero considerando que esta fórmula
podría dar una muestra muy grande cuando la población es ordenada y una muestra muy
pequeña para poblaciones periódicas. Recuérdese que las varianzas de  y s y de  y son

equivalentes cuando la población es aleatoria.


Tamaño de muestra requerido para estimar una media poblacional  µ con un límite para el
error de estimación de B:

 N σ 2  B 2
n= en donde:  D  =
( N  − 1) D + σ 2 4

Nota: σ2  puede aproximarse con s 2, a partir de una muestra piloto o por estudios previos
  Rango
similares o bien σ 2 ≈ . En cualquier caso n será un valor aproximado. Si N es grande,
4
como comúnmente ocurre, el (N-1) puede ser reemplazado por N.
Para determinar el tamaño de muestra requerido para estimar un total poblacional  τ  con un
límite para el error de estimación de B:

 N σ  2  B 2
n=  D =
( N  − 1) D + σ  2 en donde: 4 N  2
El tamaño de muestra requerido para estimar una  proporción poblacional p con un límite
para el error de estimación de B, será:
Técnicas de Muestreo

 Npq  B 2
n=   en donde: q = 1- p y  D =
( N  − 1) D +  pq 4
Hay ocasiones en donde se desconoce el valor de p y se estima de estudios previos pero
cuando estos no existen lo ideal es suponer un valor de p=0.5 que nos proporcionará un
tamaño de muestra conservador, que será probablemente mayor que el requerido.
En general para determinar el tamaño de muestra n se necesita conocer el error de
estimación B, la varianza σ 2 y el nivel de confianza 1-α.
Ejercicio 4.
Usando la información del ejercicio 1 determine el tamaño de muestra requerido para estimar
µ con un límite para el error de estimación de 0.015 unidades.
Solución:
B2 (0 .015 ) 2
Si B= 0.015 entonces:  D = = = 0 .00005625
4 4
Como σ2 No se conoce se estima con s 2

 N σ 2 1800(0.0063)
 Asi: n= = = 105.49 ≈ 106 latas
( N  − 1) D + σ 2 (1799)(0.00005625) + 0.0063
Ejercicio 5.
Determine el tamaño de muestra requerido para estimar τ , con los datos del ejercicio 2, con
un límite para el error de estimación de 30 unidades. Resp. n=87 latas
Ejercicio 6.
Para la situación referida en el ejercicio 3, determine el tamaño de muestra requerido para
estimar p con un límite para el error de estimación del 5%. ¿Qué tipo de muestra sistemática
deberá de obtenerse? Resp. n=305 albañiles

5.5.- MUESTREO SISTEMÁTICO REPLICADO.


Este tipo de muestreo permite al experimentador estimar la media y un total poblacional con
sus respectivas varianzas sin hacer ningún supuesto acerca de la naturaleza de la población.
Recordemos que no se puede estimar la varianza de con base en la información contenida
en una sola muestra sistemática, a menos que el muestreo sistemático genere una muestra
aleatoria. Sin embargo en la mayoría de los casos el muestreo aleatorio sistemático no es
Técnicas de Muestreo

equivalente al irrestricto aleatorio, entonces es aconsejable utilizar un método alternativo


para estimar la varianza V ( y S  ) , este método alternativo es el muestreo sistemático

replicado.
Este método consiste en seleccionar varias muestras sistemáticas o replicas y así poder
estimar la media poblacional �, como el promedio de todas las medias muestrales , la
estimación de la varianza V ( y S  )  utilizando el cuadrado de las desviaciones de cada una de

las medias muestrales individuales alrededor de su media poblacional.


Para seleccionar n S muestras sistemáticas replicadas se separan más los elementos de cada
muestra. Por lo que 10 muestras de 1 en 50 (n S=10, k’=50) de 6 mediciones cada una,
contiene el mismo número de mediciones que una sola muestra de de 1 en 5 (k=5)
conteniendo n=60 mediciones. El punto de inicio para cada una de las n S  muestras
sistemáticas es seleccionado aleatoriamente de entre los primeros k’ elementos. Los
elementos restantes en cada muestra son obtenidos adicionando k’, 2k’ y así sucesivamente,
al punto de inicio hasta que el número total por muestra, n/n S es obtenido.
Ejemplo. Si tenemos una población de N=960 elementos y queremos seleccionar una
960
muestra sistemática de 60 elementos entonces k  = = 16  o sea una muestra de 1 en 16
60
elementos, se selecciona un número al azar de los primeros 16 elementos y este sería el
punto de inicio de la muestra.
 Ahora si queremos seleccionar 10 muestras sistemáticas replicadas de esa misma población,
primero seleccionamos un valor de k’, de manera que k’=kn S, en donde n S es el número de
muestras sistemáticas que queremos seleccionar. Así para nuestro ejemplo
k’=10k=10(16)=160.
Inmediatamente después seleccionamos 10 números aleatorios entre 1 y 160 y la constante
k’=160, es la que se le adiciona a cada uno de estos 10 números que serán los puntos de
inicio aleatorio de las muestras, hasta que se obtienen 10 muestras de tamaño 6, por ello
siempre obtendremos 60 elementos.
Una selección de 10 números aleatorios entre 1 y 160 es:

73, 42, 81, 145, 6, 21, 86, 17, 112, 102


Técnicas de Muestreo

Si se utilizan como puntos de inicio entonces las muestras quedarían así:

Punto de inicio 2º elemento 3º elemento 6º elemento


aleatorio muestral muestral muestral
6 166 326 ……… 806
17 177 337 ……… 817
21 181 341 ……… 821
42 202 362 ……… 842
73 233 393 ……… 873
81 241 401 ……… 881
86 246 406 ……… 886
102 262 422 ……… 902
112 272 432 ……… 912
145 305 465 ……… 945

Es común que n S=10 ya que permite obtener suficientes medias muestrales para obtener una
estimación satisfactoria de V (µ 
ˆ)

Las formulas para estimar � S con nS muestras sistemáticas se dan a continuación:


Estimador de la media poblacional usando nS muestras sistemáticas de 1 en k’
n  s
 y
µ ˆ = ∑i=1 n
i

en donde representa el promedio de la i-ésima muestra sistemática.


Varianza estimada de
n s

  N  − n 
∑ ( y i − µ 
ˆ )2
ˆ ( µ 
V  ˆ) =   i =1
   N    n s (n s − 1)
El límite para el error de estimación al 95% de confianza es:

 B  = 2 V ˆ ( µ 
ˆ)
Técnicas de Muestreo

También se puede utilizar el muestreo sistemático replicado para estimar un total poblacional

τ, si N es conocida, con las siguientes relaciones:

Estimador del total poblacional usando nS muestras sistemáticas de 1 en k’


n  s
 y i
τ ˆ =  N  µ ˆ = ∑
i=1 n s

Varianza estimada de :
n s

  N  − n 
∑ ( y − µ 
ˆ) i
2

ˆ (τ ˆ) =  N 2V 
V  ˆ ( µ 
ˆ ) =  N 2   i=1
   N    n s (n s − 1)
El límite para el error de estimación al 95% de confianza es:

 B  = 2 V ˆ (τ ˆ)

Ejercicio 7
Un parque estatal cobra la admisión por automóvil en lugar de por persona y un funcionario
del parque quiere estimar el número promedio de personas por automóvil para un día
efectivo en particular durante el verano. El funcionario sabe por experiencia que entrarán al
parque alrededor de 400 automóviles y quiere muestrear 80 de ellos. Para obtener una
estimación de la varianza, utiliza el muestreo sistemático replicado con 10 muestras de 8
automóviles cada una. Usando los datos que se presentan en la tabla, estime el número
promedio de personas por automóvil y establezca un límite para el error de estimación
Punto de
Segundo Tercer Cuarto Quinto Sexto Séptimo Octavo
inicio
elemento elemento elemento elemento elemento elemento elemento
aleatorio
2(3) 52(4) 102(5) 152(3) 202(6) 252(1) 302(4) 352(4) 3.75 14.06
5(5) 55(3) 105(4) 155(2) 205(4) 255(2) 305(3) 355(4) 3.38 11.42
7(2) 57(4) 107(6) 157(2) 207(3) 257(2) 307(1) 357(3) 2.88 8.29
13(6) 63(4) 113(6) 163(7) 213(2) 263(3) 313(2) 363(7) 4.62 21.34
26(4) 76(5) 126(7) 176(4) 226(2) 276(6) 326(2) 376(6) 4.50 20.25
31(7) 81(6) 131(4) 181(4) 231(3) 281(6) 331(7) 381(5) 5.25 27.56
35(3) 85(3) 135(2) 185(3) 235(6) 285(5) 335(6) 385(8) 4.50 20.25
40(2) 90(6) 140(2) 190(5) 240(5) 290(4) 340(4) 390(5) 4.12 16.97
45(2) 95(6) 145(3) 195(6) 245(4) 295(4) 345(5) 395(4) 4.25 18.06
Técnicas de Muestreo

46(6) 96(5) 146(4) 196(6) 246(3) 296(3) 346(5) 396(3) 4.38 19.18
Totales 41.63 177.41

Los datos del número de personas por automóvil y i está en el paréntesis.

El valor de k en una muestra sistemática sería:


 N  400
k  = = = 5
n 80
Entonces para 10 muestras n S=10 el valor de k’ será: k’=10k=10(5)=50
Por lo que se escogen 10 números aleatorios entre el 1 y el 50 que fueron:
13, 35, 2, 40, 26, 7, 31, 45, 5, 46
Los automóviles con estos números forman los puntos de inicio aleatorio para las muestras
sistemáticas.
Observe en la tabla la cantidad es el promedio de personas por automóvil para la primera
muestra (fila), es el promedio para la segunda muestra y así sucesivamente entonces la
estimación de µ será:
n  s
 y i ( 3 . 75 + 3 . 38 + ..... + 4 . 38
ˆ =
µ  ∑i =1 ns
=
10
= 4 . 16

Realicemos ciertos cálculos previos para estimar la varianza


2
n s
1   n
ns
  s


i =1
( − ˆ
 y i µ  ) 2
= ∑
i =1
 y i2
− 
 ∑ y i 
n s   i =1  
Sustituyendo:
n s
1
∑ ( y
i =1
i − µ 
ˆ ) 2 = 177 .41 −
10
( 41 .63) 2 = 4.104

Por lo tanto la varianza estimada de será:


n s

  N  − n 
∑ ( y − µ 
ˆ )2
 400 − 80   4.104 
i
ˆ ( µ 
V  ˆ) =   i=1 =  = 0.0365

   N    n s (n s − 1)   400    10(9) 
Entonces el límite para el error de estimación sería:

 B = 2 0.0365 = 0.38
Técnicas de Muestreo

Por lo que decimos que nuestra mejor estimación del promedio de personas por automóvil es
de 4.16 personas, por lo que con un 95% de confianza podemos decir que el verdadero valor
del parámetro se encuentra en el intervalo (4.16±0.38)