Apuntes Tema 1 Muestreo

CAPÍTULO 1
MUESTREO
El muestreo no es una simple sustitución de una cobertura

total por una parcial. El muestreo es la ciencia y arte de
controlar y medir la confiabilidad de la información estadı́stica
útil a través de la teorı́a de la probabilidad.
W.E. Deming
Some Theory of Sampling. New York: Dover, 1950.
1.1. Introducción
Estadı́stica II (Inferencia Estadı́stica) realiza estimaciones de parámetros poblacionales con la infor-

mación contenida en una muestra de elementos de una población. Para la selección de éstos elementos
que formarán la muestra, dependiendo de determinadas caracterı́sticas, se puede utilizar diferentes
técnicas muestrales, y con la selección de la técnica adecuada se obtendrán estimaciones más precisas.
Por tanto el objetivo del presente capı́tulo es la descripción de la teorı́a y la práctica de los métodos
básicos de muestreo, tal que satisfaga a las siguientes interrogantes:
¿Cómo puedo seleccionar una muestra para hacer un estudio en ingenierı́a comercial o financiera?
¿Qué técnica muestral debo utilizar?
¿Qué errores puedo cometer cuando selecciono una muestra?
Las técnicas que se estudiarán en cada método de muestreo pretenden estimar las caracterı́sticas de
una población objetivo a través del conocimientode los valores medios (µ), los totales (τ ) de clase
o las proporciones (p) correspondientes a variables aleatorias cuantitativas (métricas) o cualitativas
(atributos), con un lı́mite para el error de estimación para cada una de ellas.
1.2. Términos técnicos
Es necesario introducir alguna terminologı́a técnica que permita entender el contenido del capı́tulo.
1
Escuela Militar de Ingenierı́a
Definición. 1.2.1: Elemento

Un elemento es un objeto sobre el que se toma una medición.
Definición. 1.2.2: Población

Una población es un conjunto de elementos sobre los que se desea realizar una inferencia.
Definición. 1.2.3: Unidades de Muestreo

Las unidades de muestreo son conjuntos no solapados de la población que cubren la población
completa.
Definición. 1.2.4: Marco Muestral

Un marco es una lista de unidades de muestreo.
Definición. 1.2.5: Muestra

Una muestra es una colección de unidades de muestreo obtenidas a partir de un marco o marcos.
1.3. El proceso de diseño de la muestra
Las fases que se deben seguir para el proceso de muestreo son las siguientes:
Definición de la población objetivo.
Definición del marco muestral.
Selección de un método de muestreo.
Determinación del tamaño de la muestra.
Definición del plan de muestreo.
Selección de la muestra.
Estas etapas están interrelacionadas en forma cercana y relevante con todos los aspectos delproyecto
de investigación de mercados, desde la definición del problema hasta la presentación deresultados. Por
lo tanto, las decisiones del diseño de la muestra deben integrarse con todas las otrasdecisiones del
proyecto de investigación.
2
1.3.1. Definición de la población objetivo
De la población de referencia podemos identificar dos grupos diferentes, la población afectada por el
problema (con problema) y la no afectada (población potencial o sin problema).
También podemos decir que la población objetivo es la recolección de elementos u objetos queposeen
la información buscada por el investigador y acerca de la cual se deben realizar deducciones.
La población objetivo se debe definir en forma precisa ya que si se define incorrectamenterealizaremos

con toda probabilidad una investigación imprecisa.
Por ello la población objetivo debe definirse en términos de elementos, unidades de muestreo,extensión
y tiempo. Un elemento lo podemos definir como el objeto sobre el cual deseamos obtenerla información.
Una unidad de muestreo es un elemento o unidad que contiene el elemento,disponible para la selección
en alguna etapa del proceso de muestreo. La extensión se refiere a loslı́mites geográficos y el factor de
tiempo es el periodo de tiempo que se considera.
1.3.2. Definición del marco muestral
A menudo es posible obtener una lista de elementos de población, pero la lista puede omitir algunose-
lementos de la población o incluir otros elementos que no pertenecen. Por lo tanto, el uso de unalista
llevará al error de marco de muestreo.
En algunas situaciones, la discrepancia entre la población y el marco de muestreo es lo suficientemente

pequeña como para ignorarla. Sin embargo, en muchos casos el investigador debe reconocer y resolver
el error de marco de muestreo. Esto se puede hacer por lo menos de tres formas.
Un método es redefinir la población en términos del marco de muestreo. Si se utiliza el directorio

telefónico como marco de muestreo, la población de hogares podrı́a redefinirse como aquella con una
lista correcta en el directorio telefónico de cierta área. Aunque este método sea simplista. Previene al
investigador de ser engañado sobre la población real que se investiga.
Otra forma de considerar el error del marco de muestreo es seleccionando a los encuestados en la fase de
recolección de datos. Los encuestados deben ser seleccionados respecto de las caracterı́sticas demográfi-
cas, familiaridad, uso del producto y otras peculiaridades para asegurar que satisfacen el criterio de
3
la población objetivo. En la selección se puede eliminar a los elementos inapropiados contenidos en el

marco de muestreo, pero no se puede considerar a los elementos que se han omitido.
Incluso otro método es ajustar los datos recolectados mediante un esquema de pesaje paraequilibrar el
error de marco de muestreo.
Sin importar que método se adopte, es importante reconocer cualquier error de marco de muestreoque
exista para evitar deducciones de población inapropiadas.
1.3.3. Selección de un método de muestreo
La elección de un método de muestreo adecuado es importante, porque sino está bien realizado, nos
encontraremos ante situaciones en que no existen diferencias significativas entre las muestras. Además,
cualquier muestra que sea superior a la necesaria, aumentará los costes y el tiempo del estudio, lo que
puede hacer que no sea viable económicamente.
Seleccionar una técnica de muestreo incluye diversas decisiones de naturaleza más amplia. El investi-
gador tiene que decidir si utiliza el método bayesiano o tradicional, si muestrea con reemplazo o sin
éste y si utiliza el muestreo probabilı́stico o no probabilı́stico.
En él método bayesiano, los elementos se seleccionan siguiendo una secuencia. Después de que cada
elemento se suma a la muestra, se recopilan los datos, se computan las estadı́sticas de muestreo y
se determinan los costos del mismo. El método bayesiano incorpora de manera explı́cita información
previa acerca de los parámetros de población ası́ como los costos y probabilidades relacionadas con
tomar malas decisiones. Este método es teóricamente atractivo. Sin embargo, no se utiliza en forma
amplia en la investigación de mercados internacionales porque no se dispone de mucha de la información
requerida sobre costos y probabilidades.
En el método de muestreo tradicional, la muestra completa se selecciona antes de que comience la

recolección de datos. Debido a que el método tradicional es el más comúnmente utilizado, es el que se
considera en las siguientes secciones.
En el muestreo con reemplazo se selecciona un elemento del marco de muestreo y se obtienen los datos
apropiados. Luego, el elemento se reubica en el marco de muestreo. Como resultado, es posible que
un elemento se incluya en la muestra más de una vez. En el muestreo sin reemplazo, una vez que
se selecciona un elemento para su inclusión en la muestra se remueve del marco demuestreo y por lo
tanto, no puede ser seleccionado otra vez. El cálculo de estadı́sticas se realiza de manera diferente en
los dos métodos, pero la deducción estadı́stica no es muy diferente si el marco de muestreo es grande
con relación al tamaño de la muestra final. Por lo tanto, la distinción es importante sólo cuando el
marco de muestreo no es grande en comparación con tamaño de la muestra.
La decisión más importante acerca de la elección de la técnica de muestreo es el utilizar el muestreo

probabilı́stico o el no probabilı́stico.
Si la unidad de muestreo es diferente del elemento, es necesario especificar precisamente como se deben
seleccionar los elementos dentro de la unidad de muestreo. En las entrevistas personales en casa y las
entrevistas telefónicas tal vez no sea suficiente especificar sólo el número de teléfono o la dirección. Por
ejemplo ¿la persona que atiende el timbre debe ser entrevistada, o alguien más en el hogar?
A menudo puede calificar a más de una persona en el hogar. Por ejemplo, tanto el hombre como la
4
mujer jefes de familia pueden ser elegibles para participar en un estudio que examina las actividades
familiares en el tiempo libre. Cuando se utiliza una técnica de muestreo probabilı́stico, se debe hacer
una selección aleatoria de todas las personas elegibles en cada hogar. Un procedimiento simple para
la selección aleatoria es el método del siguiente cumpleaños. El entrevistador pregunta cuál de las
personas elegibles en el hogar tiene el próximo cumpleaños e incluye a esa persona en la muestra.
 


 Muestreo aleatorio simple



 

 Muestreo sistemático

Probabilı́stico



Muestreo aleatorio estratificado

 

 

 
Muestreo aleatorio por conglomerados o áreas

 

Metodo de muestreo



 
Muestreo por conveniencia



 






 No Probabilı́stico Muestreo discrecional
 


 Muestreo por cuotas
1.3.4. Determinación del tamaño de la muestra
Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los objetivos de la
encuesta suelen requerir varias estadı́sticas y que al considerar cada una de ellas pueden llevar a un
diseño diferente, por lo tanto, para determinar el tamaño de la muestra se debe elegir el principal
objetivo y calcular el tamaño de muestra necesario para cumplir dicho objetivo. En caso de ser varios
los objetivos principales se determina un tamaño de muestra para cumplir cada objetivo y entre todos
ellos, se elige el mayor.
El tamaño de la muestra depende básicamente del tamaño de la población, del nivel de confianza o
confiabilidad de las estimaciones, del grado de variación o dispersión de la variable a estudiar y del
error de estimación.
El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el tamaño de la
5
muestra, teniendo en cuenta que dicha Confiabilidad debe estar entre el noventa y el noventa y nueve
por ciento. A mayor confiabilidad mayor tamaño de muestra.
El grado de variación o dispersión de la variable se mide a través de la desviación estándar, la cual

puede ser estimada a partir de una muestra piloto o a partir de la información recopilada en una
investigación similar, realizada anteriormente.
El error de estimación es la máxima diferencia en valor absoluto, que se está dispuesto a aceptar, entre
el valor del estimador y el valor del parámetro, a éste error de estimación se le nota como B. El valor
del error de estimación depende del estimador que se desee obtener y de la magnitud de la variable.
Por ejemplo si se va a estimar la proporción de desempleados, un error de estimación lógico puede
ser del 3 por ciento; pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de
estimación lógico puede ser de 7 kilos. A mayor error de estimación menor tamaño de muestra.
Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una fórmula diferente para
calcular el tamaño de la muestra.
1.3.5. Definición del plan de muestreo
Se le denomina muestra porque es un subgrupo de los elementos que conforman la población selec-
cionada para participar en el estudio. Un plan de muestreo sigue un proceso de cinco pasos, estos
son:
Definir la población objetiva.

Identificar las unidades de prueba.
Seleccionar la técnica de muestreo.
Calcular el tamaño de la muestra.
Ejecutar el proceso de muestreo.
También encontramos otras definiciones del plan de muestreo desde otra perspectiva, ya que podemos
decir, que consiste en determinar el número máximo de casos no cumplidores (fracasos) que podemos
obtener en una muestra de tamaño muestral determinado, que nos permita distinguir entre una muestra
aceptable y una muestra no aceptable.
Para definir el plan de muestreo se requiere conocer o establecer:
Estándar. Otros autores lo describen como el nivel de calidad aceptable o umbral superior. Es el
valor que define un nivel de buena calidad para el indicador.
Umbra. Otros autores lo denominan como el nivel de calidad rechazable o umbral inferior. Es el valor
que define un nivel de mala calidad para el indicador.
1.3.6. Selección de la muestra
Siempre que realizamos un estudio tenemos que seleccionar una muestra, es decir, tenemos que tener
un grupo de individuos o elementos elegidos para llevar a cabo nuestra investigación, la muestra puede
6
ser toda la población o un grupo seleccionado que sea representativo de dicha población.
Podemos optar por diferentes tipos de muestra como son:
Muestras Probabilı́sticas: subgrupo de la población en el que todos los elementos de esta tienen la
misma posibilidad de ser elegidos.
Muestras No Probabilı́sticas: subgrupo de la población en la que la elección de los elementos no
depende de la probabilidad sino de las caracterı́sticas de la investigación.
1.3.7. Errores muestral y no muestral
La precisión de los resultados de la muestra se ve afectada por dos tipos generales de error: error
muestral y error no muestral (medición). La fórmula siguiente representa los efectos de estos dos tipos
de error en la estimación de un parámetro de la población:
θb = θ ± s ± ns (1.1)
donde:
θb estadı́stica de la muestra.
θ parámetro verdadero de la población.
s error muestral.
ns error no muestral, o de medición
El error muestral resulta cuando la muestra seleccionada no es perfectamente representativa

de la población. Hay dos tipos de error muestral: administrativo y aleatorio.
• El error administrativo tiene que ver con los problemas en la ejecución del plan muestral; es
decir, fallas en el diseño o ejecución de la muestra que provocan que no sea representativa de
la población. Estos tipos de error pueden evitarse o minimizarse prestando mucha atención
al diseño y ejecución de la muestra.
• El error muestral aleatorio se debe al azar y no puede evitarse. Este tipo de error se puede
reducir, aunque no eliminar por completo, incrementando el tamaño de la muestra.
El error no muestral, o de medición, incluye todos los factores diferentes al error muestral
que pueden causar inexactitud y sesgo en los resultados encuestales.
1.4. Muestreo Aleatorio Simple MAS
Definición. 1.4.1: Muestreo Aleatorio Simple
Si se selecciona un tamaño de muestra n de una población de tamaño N de tal manera que cada
muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, el procedimiento
de muestreo se denomina muestreo aleatorio simple. A la muestra ası́ obtenida se le llama muestra
aleatoria simple.
7
1.4.1. Cómo seleccionar una muestra aleatoria simple
Un clásico ejemplo que ilustra a este tipo de muestreo es la realización de un sorteo entre todos los
elementos de la población, debidamente numerados, lo que implica que debemos conocer a todos los
elementos. Introduciendo esos números en una urna, empezarı́amos a extraer a azar dichos números
y todos aquellos elementos que tengan el número extraı́do formarán la muestra. En la práctica, este
método puede automatizarse mediante el uso de ordenadores.
Gracias a los ordenadores y al desarrollo de la informática en general, la generación de números

aleatorios es cada vez más fiable asegurando la obtención de muestras representativas, de manera que
la única fuente de error que puede afectar a los resultados es el azar, error que puede calcularse de
forma precisa o acotarse.
Sea la urna u ordenador permiten generar datos correspondiente a una determinada variable de interés,
de una población de tamaño N seleccionada una muestra aleatoria de tamaño n, es decir:
Y : Variable de interés {y1 , y2 , ..., yn } : Datos de la muestra n seleccionada de una población N
1.4.2. Estimación de parámetros de una población
Para estimar diversas caracterı́sticas poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
1.4.2.1. Estimador de la media poblacional µ
n
P
yi
i=1
µ
b = ȳ = (1.2)
n
Varianza estimada de ȳ
s2 N −n

Vb (ȳ) = (1.3)
n N
donde la varianza muestral s2 es:
n n
(yi − ȳ)2 yi2 − nȳ 2
P P
i=1 i=1
s2 = =
n−1 n−1
Lı́mite del error de estimación de ȳ

s
s2 N −n
q
LEE(ȳ) = 2 Vb (ȳ) = 2 (1.4)
n N
8
1.4.2.2. Estimador del total poblacional τ
n
P
N yi
i=1
τb = N ȳ = (1.5)
n
Varianza estimada de τb !
s2 N −n

2
Vb (τb) = Vb (N ȳ) = N (1.6)
n N
Lı́mite para el error de estimación de τb

v !
s2
u
N −n
q u
LEE(τb) = 2 Vb (N ȳ) = 2tN 2 (1.7)
n N
1.4.2.3. Estimador de la proporción poblacional p
n
P
yi (
i=1 a 0 si yi ∈
/ exito
pb = ȳ = = tal que: yi = (1.8)
n n 1 si yi ∈ exito
Varianza estimada de pb
pbqb N −n

Vb (pb) = (1.9)
n−1 N
donde
qb = 1 − pb
Lı́mite para el error de estimación de pb

s
pbqb N −n
q
LEE(pb) = 2 Vb (pb) = 2 (1.10)
n−1 N
1.4.3. Selección del tamaño de muestra
También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:
9
1.4.3.1. Para estimar µ
N σ2
n= (1.11)
(N − 1)D + σ 2
donde
B2
D=
4
1.4.3.2. Para estimar τ
N σ2
n= (1.12)
(N − 1)D + σ 2
donde
B2
D=
4N 2
1.4.3.3. Para estimar p
N pq
n= (1.13)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n
1.5. Muestreo Sistemático MSI
Definición. 1.5.1: Muestreo Sistemático

Una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en
el marco y después cada k−ésimo elemento se denomina muestra aleatoria sistemática de 1-de
cada-k elementos.
1.5.1. Cómo seleccionar una muestra sistemática
Es un método de selección secuencial automático sumamente práctico y de fácil comprensión por los
entrevistadores, sobre todo en la selección de unidades estadı́sticas durante la ejecución de la encuesta.
De la población {Y1 , Y2 , ..., YN } se desea extraer una muestra sistemática de tamaño n para ello se
debe seguir los siguientes pasos:
10
N
1. Determinar la longitud k = del intervalo de selección sistemática, que nos indica la selección
n
de una de cada k unidades de investigación.
2. Si k es un número entero se determina el “arranque aleatorio” a escogiendo un número aleatorio

entre 1 y k (1 ≤ a ≤ k) con la tabla de números aleatorios se selecciona la unidad de análisis a.
A continuación seleccionamos sucesivamente las unidades de análisis a + k, a + 2k, a + 3k, ..., a +
(n − 1)k escogiéndose todas las unidades de análisis necesarias hasta completar el tamaño de la
muestra n.
Datos: {y1 , y2 , ..., yn }
Si k no es un entero, tomamos k como la mayor parte entera y aplicar el proceso descrito
anteriormente; indudablemente que en el proceso de selección de la muestra dejaran de participar
las unidades estadı́sticas con la mayor numeración.
De ser esto último un problema, entonces, tomar k como la mayor parte entera sólo para determi-
nar el “arranque aleatorio” a escogiendo un número aleatorio entre 1 y k (1 ≤ a ≤ k). Seleccionada
la unidad de análisis a, utilizando la tabla de números aleatorios, a continuación seleccionamos
sucesivamente y redondeando las unidades de análisis a + k, a + 2k, a + 3k, ..., a + (n − 1)k.
Escogiéndose todas las unidades de análisis necesarias hasta completar el tamaño de muestra n.
Datos: {y1 , y2 , ..., yn }
Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
n
P
yi
i=1
µ
b = ȳsy = (1.14)
n
Varianza estimada de ȳsy

s2 N −n

Vb (ȳsy ) = (1.15)
n N
Lı́mite del error de estimación ȳsy

s
s2 N −n
q
LEE(ȳsy ) = 2 Vb (ȳsy ) = 2 (1.16)
n N
11
n
P
yi
i=1
τbsy = N ȳsy = N · (1.17)
n
Varianza estimada de τbsy

!
s2 N −n

Vb (τbsy ) = Vb (N ȳsy ) = N 2 (1.18)
n N
Lı́mite para el error de estimación τbsy

v !
s2
u
N −n
q u
LEE(τbsy ) = 2 V (τbsy ) = 2tN 2
b (1.19)
n N
n
P
yi (
i=1 a 0 si yi ∈
/ exito
pbsy = ȳsy = = tal que: yi = (1.20)
n n 1 si yi ∈ exito
Varianza estimada de pbsy

pbsy qbsy N −n

Vb (pbsy ) = (1.21)
n−1 N
Lı́mite para el error de estimación de pbsy

s
pbsy qbsy N −n
q
LEE(pbsy ) = 2 Vb (pbsy ) = 2 (1.22)
n−1 N
N σ2
n= (1.23)
(N − 1)D + σ 2
donde
B2
D=
4
12
N σ2
n= (1.24)
(N − 1)D + σ 2
donde
B2
D=
4N 2
N pq
n= (1.25)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n
1.6. Muestreo Aleatorio Estratificado MAE
Definición. 1.6.1: Muestreo Aleatorio Estratificado

Una muestra aleatoria estratificada es la obtenida mediante la separación de los elementos de
la población en grupos no solapados, llamados estratos, y la selección posterior de una muestra
irrestricta aleatoria simple de cada estrato.
1.6.1. Cómo seleccionar una muestra aleatoria estratificada
Cuando se tiene una población heterogénea {Y1 , Y2 , ..., YN } y esta puede dividirse en L subgrupos o
estratos independientes y mutuamente excluyentes de acuerdo a un criterio o variable de estratificación,
de modo que los elementos o unidades sean homogéneos dentro de cada estrato. De esta manera el
estrato h (h = 1, 2, ..., L) está constituido por Nh unidades y el tamaño de la población es:
L
X
N = N1 + N2 + · · · + NL = Nh
h=1
Cada estrato obtenido constituye una subpoblación con su marco de muestreo y parámetros de un
universo independiente. Posteriormente, de cada estrato se selecciona una muestra aleatoria, de manera
que el tamaño de la muestra en el estrato h sea nh (h = 1, 2, ..., L) y el tamaño de la muestra este dado
por:
L
X
n = n1 + n2 + · · · + nL = nh
h=1
13
El objetivo de aplicar este método de muestreo es obtener estimadores más eficientes, esto es con menor
error estándar (desviación) o menor error relativo (coeficiente de variación).
Los datos muestrales dentro de cada estrato luego de este procedimiento serán:
Estrato h Tamaño de Muestra nh Datos de la Muestra {yhi }

Estrato 1 n1 {y11 , y12 , y13 , ..., y1n1 }
Estrato 2 n2 {y21 , y22 , y23 , ..., y1n2 }
Estrato 3 n3 {y31 , y32 , y33 , ..., y1n3 }
.. .. ..
. . .
Estrato L nL {yL1 , yL2 , yL3 , ..., y1nL }
Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
L
1 1 X
µ
b = ȳst = [N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL ] = Nh ȳh (1.26)
N N h=1
donde la media muestral dentro de cada estrato es
nh
P
yhi
i=1
ȳh = para todo h = 1, 2, ..., L.
nh
Varianza estimada de ȳst

1 h i
Vb (ȳst ) = N12 Vb (ȳ1 ) + N22 Vb (ȳ2 ) + · · · + NL2 Vb (ȳL )
N2 " ! ! #
1 s21 N1 − n1 s2L NL − nL

= 2 N12 + ··· + NL2 (1.27)
N n1 N1 nL NL
L
!
1 X s2h Nh − nh

Vb (ȳst ) = 2 Nh2
N h=1
nh Nh
donde la varianza muestral para cada estrato es

nh nh
(yhi − ȳh )2 2 − n ȳ 2
P P
yhi h h
i=1 i=1
s2h = = para todo h = 1, 2, ..., L.
nh − 1 nh − 1
14
Lı́mite del error de estimación de ȳst

v
L
!
s2h
u
u 1 X Nh − nh
q
LEE(ȳst ) = 2 V (ȳst ) = 2t 2
b Nh2 (1.28)
N h=1
nh Nh
L
X
τbst = N ȳst = N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL = Nh ȳh (1.29)
h=1
Varianza estimada de τbst

L
!
s2h Nh − nh
X
2b
Vb (τbst ) = Vb (N ȳst ) = N V (ȳst ) = Nh2 (1.30)
h=1
nh Nh
Lı́mite para el error de estimación de τbst

v
u L !
s2h Nh − nh
q uX
LEE(τbst ) = 2 V (τbst ) = 2t
b Nh2 (1.31)
h=1
nh Nh
L
1 1 X
pbst = ȳst = [N1 pb1 + N2 pb2 + · · · + NL pbL ] = Nh pbh (1.32)
N N h=1
donde la proporción para cada estrato es
nh
P
yhi
i=1 ah
pbh = = para todo h = 1, 2, ..., L.
nh nh
Varianza estimada de pbst

1 h i
Vb (pbst ) = N12 Vb (pb1 ) + N22 Vb (pb2 ) + · · · + NL2 Vb (pbL )
N2
1 pb1 qb1 N1 − n1 pbL qbL NL − nL

= 2 N12 + ··· + NL2 (1.33)
N n1 − 1 N1 nL − 1 NL
L
1 X pbh qbh Nh − nh

2
= 2 N
N h=1 h nh − 1 Nh
donde la probabilidad de fracaso para cada estrato es
qbh = 1 − pbh
15
Lı́mite para el error de estimación pbst

v
u L
u 1 X pbh qbh Nh − nh
q
LEE(pbst ) = 2 V (pbst ) = 2
b t 2
Nh (1.34)
2N nh − 1 Nh
h=1
1.6.3. Selección del tamaño de muestra n
También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:
L
Nh2 σh2 /wh
P
h=1
n= L
(1.35)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4
L
Nh2 σh2 /wh
P
h=1
n= L
(1.36)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4N 2
L
Nh2 ph qh /wh
P
h=1
n= L
(1.37)
N 2D
P
+ Nh ph qh
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4
donde σh2 y ph son estimados mediante una encuesta preliminar (encuesta piloto) por
c2 = s2 ah
σ h h y pbh = ∀ h = 1, 2, ..., L.
nh
16
1.6.3.4. Afijación del tamaño de la muestra
Después de elegir el tamaño de muestra n, existen muchas maneras de dividir n entre los tamaños de
muestra de los estratos individuales, n1 , n2 , ..., nL . Nuestro objetivo consiste en utilizar una afijación
que presente una cantidad especı́fica de información a un coste mı́nimo.
El mejor esquema de afijación está influido por tres factores:
1. El número total de elementos de cada estrato.
2. La variabilidad de las observaciones dentro de cada estrato.
3. El coste de obtener una observación de cada estrato.
Afijación óptima que minimiza el costo

   
 N σ /√c  N p
h ph qh /ch
 
h h h
nh = n  nh = n  ∀ h = 1, 2, ..., L. (1.38)
   
L √ L
 
P  P p 
Nk σk / ck Nk pk qk /ck
k=1 k=1
Afijación de Neymann Si el costo de obtener una observación es el mismo para todos los estratos
c1 = c2 = · · · = cL = 1, entonces
   
 N σ   N p q √ 
h h h h h
nh = n  nh = n  ∀ h = 1, 2, ..., L. (1.39)
   
L L

√

P  P 
Nk σk Nk pk qk
k=1 k=1
Afijación proporcional Además de encontrar costos iguales, en algunas ocaciones resulta las mis-
mas varianzas σ12 = σ22 = · · · = σL2 , entonces
 
 N 
Nh

h
nh = n  L =n ∀ h = 1, 2, ..., L. (1.40)
 
P  N
Nk
k=1
Afijación uniforme Además de encontrar costos iguales, en algunas ocaciones resulta las mismas
varianzas σ12 = σ22 = · · · = σL2 y los mismos tamaños de los estratos N1 = N2 = · · · = NL , entonces
1

nh = n ∀ h = 1, 2, ..., L. (1.41)
L
17
1.7. Muestreo Aleatorio por Conglomerados MAC
Definición. 1.7.1: Muestreo Aleatorio por Conglomerados
Una muestra por conglomerados es una muestra aleatoria en la que cada unidad de muestreo es
un conjunto, o conglomerado de elementos..
Un muestreo por conglomerados, es un diseño eficaz para obtener una cantidad especificada de infor-
mación con costo mı́nimo, bajo las siguientes condiciones:
1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos de
la población, mientras que se puede lograr fácilmente un marco que liste los conglomerados.
2. El costo para obtener observaciones se incrementa con la distancia que separa los elementos.
1.7.1. Cómo seleccionar una muestra aleatoria por conglomerados
En este método de muestreo la población se subdivide en un número de partes pequeño de conglo-

merados naturales o artificialmente construidos para luego seleccionar al azar algunas de estas partes
como representativas del total.
Ası́ por ejemplo, se puede dividir el terriorio en un muestreo de conglomerados dividiendo el área total
en áreas más pequeñas como: distritos, dentros poblados, manzanas; se elige al azar algunas áreas y
todos los hogares que residen en dichas áreas, constituyen la muestra. Los conglomerados pueden ser:
Conglomerados Unidades Elementales Variable de Interés Y

Familias Individuos Gasto Mensual
Edificios Hogares Consumo Eléctrico
Granjas Gallinas Presencia de Enfermedad
Parcelas de Terreno Árboles Frutales Producción
Mancomunidades Municipios Consumo de Gas
Hospitales Pacientes Internos Tiempo Internado
Escuelas Alumnos Nota Final de Curso
Para estimar diversos parámetros poblacionales de la variable de interés Y , como son la media de la
población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
Previamente definimos la siguiente notación:
N = número de conglomerados en la población.
18
n = número de conglomerados seleccionados en una muestra aleatoria simple.
mi = número de elementos en el conglomerado i, i = 1, 2, ..., N .

n
P
mi
i=1
m̄ = = tamaño medio del conglomerado en la muestra.
n
N
P
M= mi = número de elementos en la población.
i=1
M
M̄ = = tamaño medio del conglomerado en la población.
N
yi (ai ) = total de todas las observaciones en el i−ésimo conglomerado de la muestra.
n
P
yi
i=1
µ
b = ȳcg =
Pn (1.42)
mi
i=1
Varianza estimada de ȳcg

N −n

Vb (ȳcg ) = s2r (1.43)
N nM̄ 2
donde n
(yi − ȳcg mi )2
P
i=1
s2r =
n−1
Aquı́ M̄ puede estimarse por m̄ si se desconoce M .
Lı́mite del error de estimación de ȳcg

s
N −n
q
LEE(ȳcg ) = 2 Vb (ȳcg ) = 2 s2r (1.44)
N nM̄ 2
n
P
N yi
i=1
τbcg = M ȳcg = M (1.45)
n
Varianza estimada de τbcg

N −n 2

Vb (τbcg ) = Vb (M ȳcg ) = N 2 sr (1.46)
Nn
19
Lı́mite para el error de estimación de τbcg

s
N −n 2
q
LEE(τbcg ) = 2 Vb (M ȳcg ) = 2 N 2 sr (1.47)
Nn
n
P
ai
i=1
pbcg = Pn (1.48)
mi
i=1
Varianza estimada de pbcg

N −n

Vb (pbcg ) = s2p (1.49)
N nM̄ 2
donde n
(ai − pbcg mi )2
P
i=1
s2p =
n−1
Aquı́ M̄ puede estimarse por m̄ si se desconoce M .
Lı́mite del error de estimación de pbcg

s
N −n
q
LEE(pbcg ) = 2 Vb (pbcg ) = 2 s2p (1.50)
N nM̄ 2
N σr2
n= (1.51)
N D + σr2
donde σr2 se estima mediante s2r y
B 2 M̄ 2
D=
4
N σr2
n= (1.52)
N D + σr2
donde σr2 se estima mediante s2r y
B2
D=
4N 2
20
N σp2
n= (1.53)
N D + σp2
donde σp2 se estima mediante s2p y
B 2 M̄ 2
D=
4
21

Apuntes Tema 1 Muestreo

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apuntes Tema 1 Muestreo

Hochgeladen von

Copyright:

Verfügbare Formate

CAPÍTULO 1

El muestreo no es una simple sustitución de una cobertura

Estadı́stica II (Inferencia Estadı́stica) realiza estimaciones de parámetros poblacionales con la infor-

1.2. Términos técnicos

Definición. 1.2.1: Elemento

Definición. 1.2.2: Población

Definición. 1.2.3: Unidades de Muestreo

Definición. 1.2.4: Marco Muestral

Definición. 1.2.5: Muestra

1.3. El proceso de diseño de la muestra

Definición de la población objetivo.

Definición del marco muestral.

Selección de un método de muestreo.

Determinación del tamaño de la muestra.

Definición del plan de muestreo.

1.3.1. Definición de la población objetivo

La población objetivo se debe definir en forma precisa ya que si se define incorrectamenterealizaremos

1.3.2. Definición del marco muestral

En algunas situaciones, la discrepancia entre la población y el marco de muestreo es lo suficientemente

Un método es redefinir la población en términos del marco de muestreo. Si se utiliza el directorio

la población objetivo. En la selección se puede eliminar a los elementos inapropiados contenidos en el

1.3.3. Selección de un método de muestreo

En el método de muestreo tradicional, la muestra completa se selecciona antes de que comience la

La decisión más importante acerca de la elección de la técnica de muestreo es el utilizar el muestreo

1.3.4. Determinación del tamaño de la muestra

El nivel de confianza o confiabilidad lo fija arbitrariamente quien esté calculando el tamaño de la

El grado de variación o dispersión de la variable se mide a través de la desviación estándar, la cual

1.3.5. Definición del plan de muestreo

Definir la población objetiva.

Para definir el plan de muestreo se requiere conocer o establecer:

1.3.6. Selección de la muestra

Podemos optar por diferentes tipos de muestra como son:

1.3.7. Errores muestral y no muestral

El error muestral resulta cuando la muestra seleccionada no es perfectamente representativa

1.4. Muestreo Aleatorio Simple MAS

Definición. 1.4.1: Muestreo Aleatorio Simple

1.4.1. Cómo seleccionar una muestra aleatoria simple

Gracias a los ordenadores y al desarrollo de la informática en general, la generación de números

Y : Variable de interés {y1 , y2 , ..., yn } : Datos de la muestra n seleccionada de una población N

1.4.2. Estimación de parámetros de una población

1.4.2.1. Estimador de la media poblacional µ

Lı́mite del error de estimación de ȳ

1.4.2.2. Estimador del total poblacional τ

Lı́mite para el error de estimación de τb

1.4.2.3. Estimador de la proporción poblacional p

Lı́mite para el error de estimación de pb

1.4.3. Selección del tamaño de muestra

1.4.3.1. Para estimar µ

1.4.3.2. Para estimar τ

1.4.3.3. Para estimar p

1.5. Muestreo Sistemático MSI

Definición. 1.5.1: Muestreo Sistemático

1.5.1. Cómo seleccionar una muestra sistemática

2. Si k es un número entero se determina el “arranque aleatorio” a escogiendo un número aleatorio

Datos: {y1 , y2 , ..., yn }

1.5.2. Estimación de parámetros de una población

1.5.2.1. Estimador de la media poblacional µ

Varianza estimada de ȳsy

Lı́mite del error de estimación ȳsy

1.5.2.2. Estimador del total poblacional τ

Varianza estimada de τbsy

Lı́mite para el error de estimación τbsy

1.5.2.3. Estimador de la proporción poblacional p