Sie sind auf Seite 1von 21

CAPÍTULO 1

MUESTREO

El muestreo no es una simple sustitución de una cobertura


total por una parcial. El muestreo es la ciencia y arte de
controlar y medir la confiabilidad de la información estadı́stica
útil a través de la teorı́a de la probabilidad.
W.E. Deming
Some Theory of Sampling. New York: Dover, 1950.

1.1. Introducción

Estadı́stica II (Inferencia Estadı́stica) realiza estimaciones de parámetros poblacionales con la infor-


mación contenida en una muestra de elementos de una población. Para la selección de éstos elementos
que formarán la muestra, dependiendo de determinadas caracterı́sticas, se puede utilizar diferentes
técnicas muestrales, y con la selección de la técnica adecuada se obtendrán estimaciones más precisas.
Por tanto el objetivo del presente capı́tulo es la descripción de la teorı́a y la práctica de los métodos
básicos de muestreo, tal que satisfaga a las siguientes interrogantes:

¿Cómo puedo seleccionar una muestra para hacer un estudio en ingenierı́a comercial o financiera?
¿Qué técnica muestral debo utilizar?
¿Qué errores puedo cometer cuando selecciono una muestra?

Las técnicas que se estudiarán en cada método de muestreo pretenden estimar las caracterı́sticas de
una población objetivo a través del conocimientode los valores medios (µ), los totales (τ ) de clase
o las proporciones (p) correspondientes a variables aleatorias cuantitativas (métricas) o cualitativas
(atributos), con un lı́mite para el error de estimación para cada una de ellas.

1.2. Términos técnicos

Es necesario introducir alguna terminologı́a técnica que permita entender el contenido del capı́tulo.

1
Escuela Militar de Ingenierı́a

Definición. 1.2.1: Elemento


Un elemento es un objeto sobre el que se toma una medición.

Definición. 1.2.2: Población


Una población es un conjunto de elementos sobre los que se desea realizar una inferencia.

Definición. 1.2.3: Unidades de Muestreo


Las unidades de muestreo son conjuntos no solapados de la población que cubren la población
completa.

Definición. 1.2.4: Marco Muestral


Un marco es una lista de unidades de muestreo.

Definición. 1.2.5: Muestra


Una muestra es una colección de unidades de muestreo obtenidas a partir de un marco o marcos.

1.3. El proceso de diseño de la muestra

Las fases que se deben seguir para el proceso de muestreo son las siguientes:

Definición de la población objetivo.

Definición del marco muestral.

Selección de un método de muestreo.

Determinación del tamaño de la muestra.

Definición del plan de muestreo.

Selección de la muestra.

Estas etapas están interrelacionadas en forma cercana y relevante con todos los aspectos delproyecto
de investigación de mercados, desde la definición del problema hasta la presentación deresultados. Por
lo tanto, las decisiones del diseño de la muestra deben integrarse con todas las otrasdecisiones del
proyecto de investigación.

2
Escuela Militar de Ingenierı́a

1.3.1. Definición de la población objetivo

De la población de referencia podemos identificar dos grupos diferentes, la población afectada por el
problema (con problema) y la no afectada (población potencial o sin problema).

También podemos decir que la población objetivo es la recolección de elementos u objetos queposeen
la información buscada por el investigador y acerca de la cual se deben realizar deducciones.

La población objetivo se debe definir en forma precisa ya que si se define incorrectamenterealizaremos


con toda probabilidad una investigación imprecisa.

Por ello la población objetivo debe definirse en términos de elementos, unidades de muestreo,extensión
y tiempo. Un elemento lo podemos definir como el objeto sobre el cual deseamos obtenerla información.
Una unidad de muestreo es un elemento o unidad que contiene el elemento,disponible para la selección
en alguna etapa del proceso de muestreo. La extensión se refiere a loslı́mites geográficos y el factor de
tiempo es el periodo de tiempo que se considera.

1.3.2. Definición del marco muestral

A menudo es posible obtener una lista de elementos de población, pero la lista puede omitir algunose-
lementos de la población o incluir otros elementos que no pertenecen. Por lo tanto, el uso de unalista
llevará al error de marco de muestreo.

En algunas situaciones, la discrepancia entre la población y el marco de muestreo es lo suficientemente


pequeña como para ignorarla. Sin embargo, en muchos casos el investigador debe reconocer y resolver
el error de marco de muestreo. Esto se puede hacer por lo menos de tres formas.

Un método es redefinir la población en términos del marco de muestreo. Si se utiliza el directorio


telefónico como marco de muestreo, la población de hogares podrı́a redefinirse como aquella con una
lista correcta en el directorio telefónico de cierta área. Aunque este método sea simplista. Previene al
investigador de ser engañado sobre la población real que se investiga.

Otra forma de considerar el error del marco de muestreo es seleccionando a los encuestados en la fase de
recolección de datos. Los encuestados deben ser seleccionados respecto de las caracterı́sticas demográfi-
cas, familiaridad, uso del producto y otras peculiaridades para asegurar que satisfacen el criterio de

3
Escuela Militar de Ingenierı́a

la población objetivo. En la selección se puede eliminar a los elementos inapropiados contenidos en el


marco de muestreo, pero no se puede considerar a los elementos que se han omitido.

Incluso otro método es ajustar los datos recolectados mediante un esquema de pesaje paraequilibrar el
error de marco de muestreo.

Sin importar que método se adopte, es importante reconocer cualquier error de marco de muestreoque
exista para evitar deducciones de población inapropiadas.

1.3.3. Selección de un método de muestreo

La elección de un método de muestreo adecuado es importante, porque sino está bien realizado, nos
encontraremos ante situaciones en que no existen diferencias significativas entre las muestras. Además,
cualquier muestra que sea superior a la necesaria, aumentará los costes y el tiempo del estudio, lo que
puede hacer que no sea viable económicamente.

Seleccionar una técnica de muestreo incluye diversas decisiones de naturaleza más amplia. El investi-
gador tiene que decidir si utiliza el método bayesiano o tradicional, si muestrea con reemplazo o sin
éste y si utiliza el muestreo probabilı́stico o no probabilı́stico.

En él método bayesiano, los elementos se seleccionan siguiendo una secuencia. Después de que cada
elemento se suma a la muestra, se recopilan los datos, se computan las estadı́sticas de muestreo y
se determinan los costos del mismo. El método bayesiano incorpora de manera explı́cita información
previa acerca de los parámetros de población ası́ como los costos y probabilidades relacionadas con
tomar malas decisiones. Este método es teóricamente atractivo. Sin embargo, no se utiliza en forma
amplia en la investigación de mercados internacionales porque no se dispone de mucha de la información
requerida sobre costos y probabilidades.

En el método de muestreo tradicional, la muestra completa se selecciona antes de que comience la


recolección de datos. Debido a que el método tradicional es el más comúnmente utilizado, es el que se
considera en las siguientes secciones.

En el muestreo con reemplazo se selecciona un elemento del marco de muestreo y se obtienen los datos
apropiados. Luego, el elemento se reubica en el marco de muestreo. Como resultado, es posible que
un elemento se incluya en la muestra más de una vez. En el muestreo sin reemplazo, una vez que
se selecciona un elemento para su inclusión en la muestra se remueve del marco demuestreo y por lo
tanto, no puede ser seleccionado otra vez. El cálculo de estadı́sticas se realiza de manera diferente en
los dos métodos, pero la deducción estadı́stica no es muy diferente si el marco de muestreo es grande
con relación al tamaño de la muestra final. Por lo tanto, la distinción es importante sólo cuando el
marco de muestreo no es grande en comparación con tamaño de la muestra.

La decisión más importante acerca de la elección de la técnica de muestreo es el utilizar el muestreo


probabilı́stico o el no probabilı́stico.

Si la unidad de muestreo es diferente del elemento, es necesario especificar precisamente como se deben
seleccionar los elementos dentro de la unidad de muestreo. En las entrevistas personales en casa y las
entrevistas telefónicas tal vez no sea suficiente especificar sólo el número de teléfono o la dirección. Por
ejemplo ¿la persona que atiende el timbre debe ser entrevistada, o alguien más en el hogar?

A menudo puede calificar a más de una persona en el hogar. Por ejemplo, tanto el hombre como la

4
Escuela Militar de Ingenierı́a

mujer jefes de familia pueden ser elegibles para participar en un estudio que examina las actividades
familiares en el tiempo libre. Cuando se utiliza una técnica de muestreo probabilı́stico, se debe hacer
una selección aleatoria de todas las personas elegibles en cada hogar. Un procedimiento simple para
la selección aleatoria es el método del siguiente cumpleaños. El entrevistador pregunta cuál de las
personas elegibles en el hogar tiene el próximo cumpleaños e incluye a esa persona en la muestra.

 


 Muestreo aleatorio simple



 

 Muestreo sistemático

Probabilı́stico



Muestreo aleatorio estratificado

 

 

 
Muestreo aleatorio por conglomerados o áreas

 

Metodo de muestreo



 
Muestreo por conveniencia



 






 No Probabilı́stico Muestreo discrecional
 


 Muestreo por cuotas

1.3.4. Determinación del tamaño de la muestra

Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los objetivos de la
encuesta suelen requerir varias estadı́sticas y que al considerar cada una de ellas pueden llevar a un
diseño diferente, por lo tanto, para determinar el tamaño de la muestra se debe elegir el principal
objetivo y calcular el tamaño de muestra necesario para cumplir dicho objetivo. En caso de ser varios
los objetivos principales se determina un tamaño de muestra para cumplir cada objetivo y entre todos
ellos, se elige el mayor.

El tamaño de la muestra depende básicamente del tamaño de la población, del nivel de confianza o
confiabilidad de las estimaciones, del grado de variación o dispersión de la variable a estudiar y del
error de estimación.

El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el tamaño de la

5
Escuela Militar de Ingenierı́a

muestra, teniendo en cuenta que dicha Confiabilidad debe estar entre el noventa y el noventa y nueve
por ciento. A mayor confiabilidad mayor tamaño de muestra.

El grado de variación o dispersión de la variable se mide a través de la desviación estándar, la cual


puede ser estimada a partir de una muestra piloto o a partir de la información recopilada en una
investigación similar, realizada anteriormente.

El error de estimación es la máxima diferencia en valor absoluto, que se está dispuesto a aceptar, entre
el valor del estimador y el valor del parámetro, a éste error de estimación se le nota como B. El valor
del error de estimación depende del estimador que se desee obtener y de la magnitud de la variable.
Por ejemplo si se va a estimar la proporción de desempleados, un error de estimación lógico puede
ser del 3 por ciento; pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de
estimación lógico puede ser de 7 kilos. A mayor error de estimación menor tamaño de muestra.

Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una fórmula diferente para
calcular el tamaño de la muestra.

1.3.5. Definición del plan de muestreo

Se le denomina muestra porque es un subgrupo de los elementos que conforman la población selec-
cionada para participar en el estudio. Un plan de muestreo sigue un proceso de cinco pasos, estos
son:

Definir la población objetiva.


Identificar las unidades de prueba.
Seleccionar la técnica de muestreo.
Calcular el tamaño de la muestra.
Ejecutar el proceso de muestreo.

También encontramos otras definiciones del plan de muestreo desde otra perspectiva, ya que podemos
decir, que consiste en determinar el número máximo de casos no cumplidores (fracasos) que podemos
obtener en una muestra de tamaño muestral determinado, que nos permita distinguir entre una muestra
aceptable y una muestra no aceptable.

Para definir el plan de muestreo se requiere conocer o establecer:

Estándar. Otros autores lo describen como el nivel de calidad aceptable o umbral superior. Es el
valor que define un nivel de buena calidad para el indicador.
Umbra. Otros autores lo denominan como el nivel de calidad rechazable o umbral inferior. Es el valor
que define un nivel de mala calidad para el indicador.

1.3.6. Selección de la muestra

Siempre que realizamos un estudio tenemos que seleccionar una muestra, es decir, tenemos que tener
un grupo de individuos o elementos elegidos para llevar a cabo nuestra investigación, la muestra puede

6
Escuela Militar de Ingenierı́a

ser toda la población o un grupo seleccionado que sea representativo de dicha población.

Podemos optar por diferentes tipos de muestra como son:

Muestras Probabilı́sticas: subgrupo de la población en el que todos los elementos de esta tienen la
misma posibilidad de ser elegidos.
Muestras No Probabilı́sticas: subgrupo de la población en la que la elección de los elementos no
depende de la probabilidad sino de las caracterı́sticas de la investigación.

1.3.7. Errores muestral y no muestral

La precisión de los resultados de la muestra se ve afectada por dos tipos generales de error: error
muestral y error no muestral (medición). La fórmula siguiente representa los efectos de estos dos tipos
de error en la estimación de un parámetro de la población:
θb = θ ± s ± ns (1.1)
donde:

θb estadı́stica de la muestra.
θ parámetro verdadero de la población.
s error muestral.
ns error no muestral, o de medición

El error muestral resulta cuando la muestra seleccionada no es perfectamente representativa


de la población. Hay dos tipos de error muestral: administrativo y aleatorio.
• El error administrativo tiene que ver con los problemas en la ejecución del plan muestral; es
decir, fallas en el diseño o ejecución de la muestra que provocan que no sea representativa de
la población. Estos tipos de error pueden evitarse o minimizarse prestando mucha atención
al diseño y ejecución de la muestra.
• El error muestral aleatorio se debe al azar y no puede evitarse. Este tipo de error se puede
reducir, aunque no eliminar por completo, incrementando el tamaño de la muestra.
El error no muestral, o de medición, incluye todos los factores diferentes al error muestral
que pueden causar inexactitud y sesgo en los resultados encuestales.

1.4. Muestreo Aleatorio Simple MAS

Definición. 1.4.1: Muestreo Aleatorio Simple

Si se selecciona un tamaño de muestra n de una población de tamaño N de tal manera que cada
muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, el procedimiento
de muestreo se denomina muestreo aleatorio simple. A la muestra ası́ obtenida se le llama muestra
aleatoria simple.

7
Escuela Militar de Ingenierı́a

1.4.1. Cómo seleccionar una muestra aleatoria simple

Un clásico ejemplo que ilustra a este tipo de muestreo es la realización de un sorteo entre todos los
elementos de la población, debidamente numerados, lo que implica que debemos conocer a todos los
elementos. Introduciendo esos números en una urna, empezarı́amos a extraer a azar dichos números
y todos aquellos elementos que tengan el número extraı́do formarán la muestra. En la práctica, este
método puede automatizarse mediante el uso de ordenadores.

Gracias a los ordenadores y al desarrollo de la informática en general, la generación de números


aleatorios es cada vez más fiable asegurando la obtención de muestras representativas, de manera que
la única fuente de error que puede afectar a los resultados es el azar, error que puede calcularse de
forma precisa o acotarse.

Sea la urna u ordenador permiten generar datos correspondiente a una determinada variable de interés,
de una población de tamaño N seleccionada una muestra aleatoria de tamaño n, es decir:

Y : Variable de interés {y1 , y2 , ..., yn } : Datos de la muestra n seleccionada de una población N

1.4.2. Estimación de parámetros de una población

Para estimar diversas caracterı́sticas poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N

1.4.2.1. Estimador de la media poblacional µ

n
P
yi
i=1
µ
b = ȳ = (1.2)
n

Varianza estimada de ȳ
s2 N −n
 
Vb (ȳ) = (1.3)
n N
donde la varianza muestral s2 es:
n n
(yi − ȳ)2 yi2 − nȳ 2
P P
i=1 i=1
s2 = =
n−1 n−1

Lı́mite del error de estimación de ȳ


s
s2 N −n
q  
LEE(ȳ) = 2 Vb (ȳ) = 2 (1.4)
n N

8
Escuela Militar de Ingenierı́a

1.4.2.2. Estimador del total poblacional τ

n
P
N yi
i=1
τb = N ȳ = (1.5)
n

Varianza estimada de τb !
s2 N −n

2
Vb (τb) = Vb (N ȳ) = N (1.6)
n N

Lı́mite para el error de estimación de τb


v !
s2
u
N −n
q u 
LEE(τb) = 2 Vb (N ȳ) = 2tN 2 (1.7)
n N

1.4.2.3. Estimador de la proporción poblacional p

n
P
yi (
i=1 a 0 si yi ∈
/ exito
pb = ȳ = = tal que: yi = (1.8)
n n 1 si yi ∈ exito

Varianza estimada de pb
pbqb N −n
 
Vb (pb) = (1.9)
n−1 N
donde
qb = 1 − pb

Lı́mite para el error de estimación de pb


s
pbqb N −n
q  
LEE(pb) = 2 Vb (pb) = 2 (1.10)
n−1 N

1.4.3. Selección del tamaño de muestra

También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:

9
Escuela Militar de Ingenierı́a

1.4.3.1. Para estimar µ

N σ2
n= (1.11)
(N − 1)D + σ 2
donde
B2
D=
4

1.4.3.2. Para estimar τ

N σ2
n= (1.12)
(N − 1)D + σ 2
donde
B2
D=
4N 2

1.4.3.3. Para estimar p

N pq
n= (1.13)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n

1.5. Muestreo Sistemático MSI

Definición. 1.5.1: Muestreo Sistemático


Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en
el marco y después cada k−ésimo elemento se denomina muestra aleatoria sistemática de 1-de
cada-k elementos.

1.5.1. Cómo seleccionar una muestra sistemática

Es un método de selección secuencial automático sumamente práctico y de fácil comprensión por los
entrevistadores, sobre todo en la selección de unidades estadı́sticas durante la ejecución de la encuesta.

De la población {Y1 , Y2 , ..., YN } se desea extraer una muestra sistemática de tamaño n para ello se
debe seguir los siguientes pasos:

10
Escuela Militar de Ingenierı́a

N
1. Determinar la longitud k = del intervalo de selección sistemática, que nos indica la selección
n
de una de cada k unidades de investigación.

2. Si k es un número entero se determina el “arranque aleatorio” a escogiendo un número aleatorio


entre 1 y k (1 ≤ a ≤ k) con la tabla de números aleatorios se selecciona la unidad de análisis a.
A continuación seleccionamos sucesivamente las unidades de análisis a + k, a + 2k, a + 3k, ..., a +
(n − 1)k escogiéndose todas las unidades de análisis necesarias hasta completar el tamaño de la
muestra n.
Datos: {y1 , y2 , ..., yn }
Si k no es un entero, tomamos k como la mayor parte entera y aplicar el proceso descrito
anteriormente; indudablemente que en el proceso de selección de la muestra dejaran de participar
las unidades estadı́sticas con la mayor numeración.
De ser esto último un problema, entonces, tomar k como la mayor parte entera sólo para determi-
nar el “arranque aleatorio” a escogiendo un número aleatorio entre 1 y k (1 ≤ a ≤ k). Seleccionada
la unidad de análisis a, utilizando la tabla de números aleatorios, a continuación seleccionamos
sucesivamente y redondeando las unidades de análisis a + k, a + 2k, a + 3k, ..., a + (n − 1)k.
Escogiéndose todas las unidades de análisis necesarias hasta completar el tamaño de muestra n.

Datos: {y1 , y2 , ..., yn }

1.5.2. Estimación de parámetros de una población

Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N

1.5.2.1. Estimador de la media poblacional µ

n
P
yi
i=1
µ
b = ȳsy = (1.14)
n

Varianza estimada de ȳsy


s2 N −n
 
Vb (ȳsy ) = (1.15)
n N

Lı́mite del error de estimación ȳsy


s
s2 N −n
q  
LEE(ȳsy ) = 2 Vb (ȳsy ) = 2 (1.16)
n N

11
Escuela Militar de Ingenierı́a

1.5.2.2. Estimador del total poblacional τ

n
P
yi
i=1
τbsy = N ȳsy = N · (1.17)
n

Varianza estimada de τbsy


!
s2 N −n

Vb (τbsy ) = Vb (N ȳsy ) = N 2 (1.18)
n N

Lı́mite para el error de estimación τbsy


v !
s2
u
N −n
q u 
LEE(τbsy ) = 2 V (τbsy ) = 2tN 2
b (1.19)
n N

1.5.2.3. Estimador de la proporción poblacional p

n
P
yi (
i=1 a 0 si yi ∈
/ exito
pbsy = ȳsy = = tal que: yi = (1.20)
n n 1 si yi ∈ exito

Varianza estimada de pbsy


pbsy qbsy N −n
 
Vb (pbsy ) = (1.21)
n−1 N

Lı́mite para el error de estimación de pbsy


s
pbsy qbsy N −n
q  
LEE(pbsy ) = 2 Vb (pbsy ) = 2 (1.22)
n−1 N

1.5.3. Selección del tamaño de muestra

1.5.3.1. Para estimar µ

N σ2
n= (1.23)
(N − 1)D + σ 2
donde
B2
D=
4

12
Escuela Militar de Ingenierı́a

1.5.3.2. Para estimar τ

N σ2
n= (1.24)
(N − 1)D + σ 2
donde
B2
D=
4N 2

1.5.3.3. Para estimar p

N pq
n= (1.25)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n

1.6. Muestreo Aleatorio Estratificado MAE

Definición. 1.6.1: Muestreo Aleatorio Estratificado


Una muestra aleatoria estratificada es la obtenida mediante la separación de los elementos de
la población en grupos no solapados, llamados estratos, y la selección posterior de una muestra
irrestricta aleatoria simple de cada estrato.

1.6.1. Cómo seleccionar una muestra aleatoria estratificada

Cuando se tiene una población heterogénea {Y1 , Y2 , ..., YN } y esta puede dividirse en L subgrupos o
estratos independientes y mutuamente excluyentes de acuerdo a un criterio o variable de estratificación,
de modo que los elementos o unidades sean homogéneos dentro de cada estrato. De esta manera el
estrato h (h = 1, 2, ..., L) está constituido por Nh unidades y el tamaño de la población es:
L
X
N = N1 + N2 + · · · + NL = Nh
h=1

Cada estrato obtenido constituye una subpoblación con su marco de muestreo y parámetros de un
universo independiente. Posteriormente, de cada estrato se selecciona una muestra aleatoria, de manera
que el tamaño de la muestra en el estrato h sea nh (h = 1, 2, ..., L) y el tamaño de la muestra este dado
por:
L
X
n = n1 + n2 + · · · + nL = nh
h=1

13
Escuela Militar de Ingenierı́a

El objetivo de aplicar este método de muestreo es obtener estimadores más eficientes, esto es con menor
error estándar (desviación) o menor error relativo (coeficiente de variación).

Los datos muestrales dentro de cada estrato luego de este procedimiento serán:

Estrato h Tamaño de Muestra nh Datos de la Muestra {yhi }


Estrato 1 n1 {y11 , y12 , y13 , ..., y1n1 }
Estrato 2 n2 {y21 , y22 , y23 , ..., y1n2 }
Estrato 3 n3 {y31 , y32 , y33 , ..., y1n3 }
.. .. ..
. . .
Estrato L nL {yL1 , yL2 , yL3 , ..., y1nL }

1.6.2. Estimación de parámetros de una población

Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N

1.6.2.1. Estimador de la media poblacional µ

L
1 1 X
µ
b = ȳst = [N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL ] = Nh ȳh (1.26)
N N h=1
donde la media muestral dentro de cada estrato es
nh
P
yhi
i=1
ȳh = para todo h = 1, 2, ..., L.
nh

Varianza estimada de ȳst


1 h i
Vb (ȳst ) = N12 Vb (ȳ1 ) + N22 Vb (ȳ2 ) + · · · + NL2 Vb (ȳL )
N2 " ! ! #
1 s21 N1 − n1 s2L NL − nL

= 2 N12 + ··· + NL2 (1.27)
N n1 N1 nL NL
L
!
1 X s2h Nh − nh

Vb (ȳst ) = 2 Nh2
N h=1
nh Nh

donde la varianza muestral para cada estrato es


nh nh
(yhi − ȳh )2 2 − n ȳ 2
P P
yhi h h
i=1 i=1
s2h = = para todo h = 1, 2, ..., L.
nh − 1 nh − 1

14
Escuela Militar de Ingenierı́a

Lı́mite del error de estimación de ȳst


v
L
!
s2h
u
u 1 X Nh − nh
q 
LEE(ȳst ) = 2 V (ȳst ) = 2t 2
b Nh2 (1.28)
N h=1
nh Nh

1.6.2.2. Estimador del total poblacional τ

L
X
τbst = N ȳst = N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL = Nh ȳh (1.29)
h=1

Varianza estimada de τbst


L
!
s2h Nh − nh
X 
2b
Vb (τbst ) = Vb (N ȳst ) = N V (ȳst ) = Nh2 (1.30)
h=1
nh Nh

Lı́mite para el error de estimación de τbst


v
u L !
s2h Nh − nh
q uX 
LEE(τbst ) = 2 V (τbst ) = 2t
b Nh2 (1.31)
h=1
nh Nh

1.6.2.3. Estimador de la proporción poblacional p

L
1 1 X
pbst = ȳst = [N1 pb1 + N2 pb2 + · · · + NL pbL ] = Nh pbh (1.32)
N N h=1
donde la proporción para cada estrato es
nh
P
yhi
i=1 ah
pbh = = para todo h = 1, 2, ..., L.
nh nh

Varianza estimada de pbst


1 h i
Vb (pbst ) = N12 Vb (pb1 ) + N22 Vb (pb2 ) + · · · + NL2 Vb (pbL )
N2
1 pb1 qb1 N1 − n1 pbL qbL NL − nL
      
= 2 N12 + ··· + NL2 (1.33)
N n1 − 1 N1 nL − 1 NL
L
1 X pbh qbh Nh − nh
  
2
= 2 N
N h=1 h nh − 1 Nh

donde la probabilidad de fracaso para cada estrato es

qbh = 1 − pbh

15
Escuela Militar de Ingenierı́a

Lı́mite para el error de estimación pbst


v
u L
u 1 X pbh qbh Nh − nh
q   
LEE(pbst ) = 2 V (pbst ) = 2
b t 2
Nh (1.34)
2N nh − 1 Nh
h=1

1.6.3. Selección del tamaño de muestra n

También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:

1.6.3.1. Para estimar µ

L
Nh2 σh2 /wh
P
h=1
n= L
(1.35)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4

1.6.3.2. Para estimar τ

L
Nh2 σh2 /wh
P
h=1
n= L
(1.36)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4N 2

1.6.3.3. Para estimar p

L
Nh2 ph qh /wh
P
h=1
n= L
(1.37)
N 2D
P
+ Nh ph qh
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4
donde σh2 y ph son estimados mediante una encuesta preliminar (encuesta piloto) por
c2 = s2 ah
σ h h y pbh = ∀ h = 1, 2, ..., L.
nh

16
Escuela Militar de Ingenierı́a

1.6.3.4. Afijación del tamaño de la muestra

Después de elegir el tamaño de muestra n, existen muchas maneras de dividir n entre los tamaños de
muestra de los estratos individuales, n1 , n2 , ..., nL . Nuestro objetivo consiste en utilizar una afijación
que presente una cantidad especı́fica de información a un coste mı́nimo.

El mejor esquema de afijación está influido por tres factores:

1. El número total de elementos de cada estrato.

2. La variabilidad de las observaciones dentro de cada estrato.

3. El coste de obtener una observación de cada estrato.

Afijación óptima que minimiza el costo


   
 N σ /√c  N p
h ph qh /ch
 
h h h
nh = n  nh = n  ∀ h = 1, 2, ..., L. (1.38)
   
L √ L
 
P  P p 
Nk σk / ck Nk pk qk /ck
k=1 k=1

Afijación de Neymann Si el costo de obtener una observación es el mismo para todos los estratos
c1 = c2 = · · · = cL = 1, entonces
   
 N σ   N p q √ 
h h h h h
nh = n  nh = n  ∀ h = 1, 2, ..., L. (1.39)
   
L L



P  P 
Nk σk Nk pk qk
k=1 k=1

Afijación proporcional Además de encontrar costos iguales, en algunas ocaciones resulta las mis-
mas varianzas σ12 = σ22 = · · · = σL2 , entonces
 
 N  
Nh

h
nh = n  L =n ∀ h = 1, 2, ..., L. (1.40)
 
P  N
Nk
k=1

Afijación uniforme Además de encontrar costos iguales, en algunas ocaciones resulta las mismas
varianzas σ12 = σ22 = · · · = σL2 y los mismos tamaños de los estratos N1 = N2 = · · · = NL , entonces

1
 
nh = n ∀ h = 1, 2, ..., L. (1.41)
L

17
Escuela Militar de Ingenierı́a

1.7. Muestreo Aleatorio por Conglomerados MAC

Definición. 1.7.1: Muestreo Aleatorio por Conglomerados

Una muestra por conglomerados es una muestra aleatoria en la que cada unidad de muestreo es
un conjunto, o conglomerado de elementos..

Un muestreo por conglomerados, es un diseño eficaz para obtener una cantidad especificada de infor-
mación con costo mı́nimo, bajo las siguientes condiciones:

1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos de
la población, mientras que se puede lograr fácilmente un marco que liste los conglomerados.

2. El costo para obtener observaciones se incrementa con la distancia que separa los elementos.

1.7.1. Cómo seleccionar una muestra aleatoria por conglomerados

En este método de muestreo la población se subdivide en un número de partes pequeño de conglo-


merados naturales o artificialmente construidos para luego seleccionar al azar algunas de estas partes
como representativas del total.

Ası́ por ejemplo, se puede dividir el terriorio en un muestreo de conglomerados dividiendo el área total
en áreas más pequeñas como: distritos, dentros poblados, manzanas; se elige al azar algunas áreas y
todos los hogares que residen en dichas áreas, constituyen la muestra. Los conglomerados pueden ser:

Conglomerados Unidades Elementales Variable de Interés Y


Familias Individuos Gasto Mensual
Edificios Hogares Consumo Eléctrico
Granjas Gallinas Presencia de Enfermedad
Parcelas de Terreno Árboles Frutales Producción
Mancomunidades Municipios Consumo de Gas
Hospitales Pacientes Internos Tiempo Internado
Escuelas Alumnos Nota Final de Curso

1.7.2. Estimación de parámetros de una población

Para estimar diversos parámetros poblacionales de la variable de interés Y , como son la media de la
población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
Previamente definimos la siguiente notación:

N = número de conglomerados en la población.

18
Escuela Militar de Ingenierı́a

n = número de conglomerados seleccionados en una muestra aleatoria simple.

mi = número de elementos en el conglomerado i, i = 1, 2, ..., N .


n
P
mi
i=1
m̄ = = tamaño medio del conglomerado en la muestra.
n
N
P
M= mi = número de elementos en la población.
i=1

M
M̄ = = tamaño medio del conglomerado en la población.
N
yi (ai ) = total de todas las observaciones en el i−ésimo conglomerado de la muestra.

1.7.2.1. Estimador de la media poblacional µ

n
P
yi
i=1
µ
b = ȳcg =
Pn (1.42)
mi
i=1

Varianza estimada de ȳcg


N −n
 
Vb (ȳcg ) = s2r (1.43)
N nM̄ 2
donde n
(yi − ȳcg mi )2
P
i=1
s2r =
n−1
Aquı́ M̄ puede estimarse por m̄ si se desconoce M .

Lı́mite del error de estimación de ȳcg


s
N −n
q 
LEE(ȳcg ) = 2 Vb (ȳcg ) = 2 s2r (1.44)
N nM̄ 2

1.7.2.2. Estimador del total poblacional τ

n
P
N yi
i=1
τbcg = M ȳcg = M (1.45)
n

Varianza estimada de τbcg


N −n 2
 
Vb (τbcg ) = Vb (M ȳcg ) = N 2 sr (1.46)
Nn

19
Escuela Militar de Ingenierı́a

Lı́mite para el error de estimación de τbcg


s
N −n 2
q  
LEE(τbcg ) = 2 Vb (M ȳcg ) = 2 N 2 sr (1.47)
Nn

1.7.2.3. Estimador de la proporción poblacional p

n
P
ai
i=1
pbcg = Pn (1.48)
mi
i=1

Varianza estimada de pbcg


N −n
 
Vb (pbcg ) = s2p (1.49)
N nM̄ 2
donde n
(ai − pbcg mi )2
P
i=1
s2p =
n−1
Aquı́ M̄ puede estimarse por m̄ si se desconoce M .

Lı́mite del error de estimación de pbcg


s
N −n
q 
LEE(pbcg ) = 2 Vb (pbcg ) = 2 s2p (1.50)
N nM̄ 2

1.7.3. Selección del tamaño de muestra

1.7.3.1. Para estimar µ

N σr2
n= (1.51)
N D + σr2
donde σr2 se estima mediante s2r y
B 2 M̄ 2
D=
4

1.7.3.2. Para estimar τ

N σr2
n= (1.52)
N D + σr2
donde σr2 se estima mediante s2r y
B2
D=
4N 2

20
Escuela Militar de Ingenierı́a

1.7.3.3. Para estimar p

N σp2
n= (1.53)
N D + σp2
donde σp2 se estima mediante s2p y
B 2 M̄ 2
D=
4

21

Das könnte Ihnen auch gefallen