Beruflich Dokumente
Kultur Dokumente
MUESTREO
1.1. Introducción
¿Cómo puedo seleccionar una muestra para hacer un estudio en ingenierı́a comercial o financiera?
¿Qué técnica muestral debo utilizar?
¿Qué errores puedo cometer cuando selecciono una muestra?
Las técnicas que se estudiarán en cada método de muestreo pretenden estimar las caracterı́sticas de
una población objetivo a través del conocimientode los valores medios (µ), los totales (τ ) de clase
o las proporciones (p) correspondientes a variables aleatorias cuantitativas (métricas) o cualitativas
(atributos), con un lı́mite para el error de estimación para cada una de ellas.
Es necesario introducir alguna terminologı́a técnica que permita entender el contenido del capı́tulo.
1
Escuela Militar de Ingenierı́a
Las fases que se deben seguir para el proceso de muestreo son las siguientes:
Selección de la muestra.
Estas etapas están interrelacionadas en forma cercana y relevante con todos los aspectos delproyecto
de investigación de mercados, desde la definición del problema hasta la presentación deresultados. Por
lo tanto, las decisiones del diseño de la muestra deben integrarse con todas las otrasdecisiones del
proyecto de investigación.
2
Escuela Militar de Ingenierı́a
De la población de referencia podemos identificar dos grupos diferentes, la población afectada por el
problema (con problema) y la no afectada (población potencial o sin problema).
También podemos decir que la población objetivo es la recolección de elementos u objetos queposeen
la información buscada por el investigador y acerca de la cual se deben realizar deducciones.
Por ello la población objetivo debe definirse en términos de elementos, unidades de muestreo,extensión
y tiempo. Un elemento lo podemos definir como el objeto sobre el cual deseamos obtenerla información.
Una unidad de muestreo es un elemento o unidad que contiene el elemento,disponible para la selección
en alguna etapa del proceso de muestreo. La extensión se refiere a loslı́mites geográficos y el factor de
tiempo es el periodo de tiempo que se considera.
A menudo es posible obtener una lista de elementos de población, pero la lista puede omitir algunose-
lementos de la población o incluir otros elementos que no pertenecen. Por lo tanto, el uso de unalista
llevará al error de marco de muestreo.
Otra forma de considerar el error del marco de muestreo es seleccionando a los encuestados en la fase de
recolección de datos. Los encuestados deben ser seleccionados respecto de las caracterı́sticas demográfi-
cas, familiaridad, uso del producto y otras peculiaridades para asegurar que satisfacen el criterio de
3
Escuela Militar de Ingenierı́a
Incluso otro método es ajustar los datos recolectados mediante un esquema de pesaje paraequilibrar el
error de marco de muestreo.
Sin importar que método se adopte, es importante reconocer cualquier error de marco de muestreoque
exista para evitar deducciones de población inapropiadas.
La elección de un método de muestreo adecuado es importante, porque sino está bien realizado, nos
encontraremos ante situaciones en que no existen diferencias significativas entre las muestras. Además,
cualquier muestra que sea superior a la necesaria, aumentará los costes y el tiempo del estudio, lo que
puede hacer que no sea viable económicamente.
Seleccionar una técnica de muestreo incluye diversas decisiones de naturaleza más amplia. El investi-
gador tiene que decidir si utiliza el método bayesiano o tradicional, si muestrea con reemplazo o sin
éste y si utiliza el muestreo probabilı́stico o no probabilı́stico.
En él método bayesiano, los elementos se seleccionan siguiendo una secuencia. Después de que cada
elemento se suma a la muestra, se recopilan los datos, se computan las estadı́sticas de muestreo y
se determinan los costos del mismo. El método bayesiano incorpora de manera explı́cita información
previa acerca de los parámetros de población ası́ como los costos y probabilidades relacionadas con
tomar malas decisiones. Este método es teóricamente atractivo. Sin embargo, no se utiliza en forma
amplia en la investigación de mercados internacionales porque no se dispone de mucha de la información
requerida sobre costos y probabilidades.
En el muestreo con reemplazo se selecciona un elemento del marco de muestreo y se obtienen los datos
apropiados. Luego, el elemento se reubica en el marco de muestreo. Como resultado, es posible que
un elemento se incluya en la muestra más de una vez. En el muestreo sin reemplazo, una vez que
se selecciona un elemento para su inclusión en la muestra se remueve del marco demuestreo y por lo
tanto, no puede ser seleccionado otra vez. El cálculo de estadı́sticas se realiza de manera diferente en
los dos métodos, pero la deducción estadı́stica no es muy diferente si el marco de muestreo es grande
con relación al tamaño de la muestra final. Por lo tanto, la distinción es importante sólo cuando el
marco de muestreo no es grande en comparación con tamaño de la muestra.
Si la unidad de muestreo es diferente del elemento, es necesario especificar precisamente como se deben
seleccionar los elementos dentro de la unidad de muestreo. En las entrevistas personales en casa y las
entrevistas telefónicas tal vez no sea suficiente especificar sólo el número de teléfono o la dirección. Por
ejemplo ¿la persona que atiende el timbre debe ser entrevistada, o alguien más en el hogar?
A menudo puede calificar a más de una persona en el hogar. Por ejemplo, tanto el hombre como la
4
Escuela Militar de Ingenierı́a
mujer jefes de familia pueden ser elegibles para participar en un estudio que examina las actividades
familiares en el tiempo libre. Cuando se utiliza una técnica de muestreo probabilı́stico, se debe hacer
una selección aleatoria de todas las personas elegibles en cada hogar. Un procedimiento simple para
la selección aleatoria es el método del siguiente cumpleaños. El entrevistador pregunta cuál de las
personas elegibles en el hogar tiene el próximo cumpleaños e incluye a esa persona en la muestra.
Muestreo aleatorio simple
Muestreo sistemático
Probabilı́stico
Muestreo aleatorio estratificado
Muestreo aleatorio por conglomerados o áreas
Metodo de muestreo
Muestreo por conveniencia
No Probabilı́stico Muestreo discrecional
Muestreo por cuotas
Cuando deseamos estimar el tamaño de la muestra se debe tener en cuenta que los objetivos de la
encuesta suelen requerir varias estadı́sticas y que al considerar cada una de ellas pueden llevar a un
diseño diferente, por lo tanto, para determinar el tamaño de la muestra se debe elegir el principal
objetivo y calcular el tamaño de muestra necesario para cumplir dicho objetivo. En caso de ser varios
los objetivos principales se determina un tamaño de muestra para cumplir cada objetivo y entre todos
ellos, se elige el mayor.
El tamaño de la muestra depende básicamente del tamaño de la población, del nivel de confianza o
confiabilidad de las estimaciones, del grado de variación o dispersión de la variable a estudiar y del
error de estimación.
5
Escuela Militar de Ingenierı́a
muestra, teniendo en cuenta que dicha Confiabilidad debe estar entre el noventa y el noventa y nueve
por ciento. A mayor confiabilidad mayor tamaño de muestra.
El error de estimación es la máxima diferencia en valor absoluto, que se está dispuesto a aceptar, entre
el valor del estimador y el valor del parámetro, a éste error de estimación se le nota como B. El valor
del error de estimación depende del estimador que se desee obtener y de la magnitud de la variable.
Por ejemplo si se va a estimar la proporción de desempleados, un error de estimación lógico puede
ser del 3 por ciento; pero si se va a estimar el peso promedio de un grupo de estudiantes, un error de
estimación lógico puede ser de 7 kilos. A mayor error de estimación menor tamaño de muestra.
Dependiendo del tipo de estimador que se desee obtener, se debe utilizar una fórmula diferente para
calcular el tamaño de la muestra.
Se le denomina muestra porque es un subgrupo de los elementos que conforman la población selec-
cionada para participar en el estudio. Un plan de muestreo sigue un proceso de cinco pasos, estos
son:
También encontramos otras definiciones del plan de muestreo desde otra perspectiva, ya que podemos
decir, que consiste en determinar el número máximo de casos no cumplidores (fracasos) que podemos
obtener en una muestra de tamaño muestral determinado, que nos permita distinguir entre una muestra
aceptable y una muestra no aceptable.
Estándar. Otros autores lo describen como el nivel de calidad aceptable o umbral superior. Es el
valor que define un nivel de buena calidad para el indicador.
Umbra. Otros autores lo denominan como el nivel de calidad rechazable o umbral inferior. Es el valor
que define un nivel de mala calidad para el indicador.
Siempre que realizamos un estudio tenemos que seleccionar una muestra, es decir, tenemos que tener
un grupo de individuos o elementos elegidos para llevar a cabo nuestra investigación, la muestra puede
6
Escuela Militar de Ingenierı́a
ser toda la población o un grupo seleccionado que sea representativo de dicha población.
Muestras Probabilı́sticas: subgrupo de la población en el que todos los elementos de esta tienen la
misma posibilidad de ser elegidos.
Muestras No Probabilı́sticas: subgrupo de la población en la que la elección de los elementos no
depende de la probabilidad sino de las caracterı́sticas de la investigación.
La precisión de los resultados de la muestra se ve afectada por dos tipos generales de error: error
muestral y error no muestral (medición). La fórmula siguiente representa los efectos de estos dos tipos
de error en la estimación de un parámetro de la población:
θb = θ ± s ± ns (1.1)
donde:
θb estadı́stica de la muestra.
θ parámetro verdadero de la población.
s error muestral.
ns error no muestral, o de medición
Si se selecciona un tamaño de muestra n de una población de tamaño N de tal manera que cada
muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, el procedimiento
de muestreo se denomina muestreo aleatorio simple. A la muestra ası́ obtenida se le llama muestra
aleatoria simple.
7
Escuela Militar de Ingenierı́a
Un clásico ejemplo que ilustra a este tipo de muestreo es la realización de un sorteo entre todos los
elementos de la población, debidamente numerados, lo que implica que debemos conocer a todos los
elementos. Introduciendo esos números en una urna, empezarı́amos a extraer a azar dichos números
y todos aquellos elementos que tengan el número extraı́do formarán la muestra. En la práctica, este
método puede automatizarse mediante el uso de ordenadores.
Sea la urna u ordenador permiten generar datos correspondiente a una determinada variable de interés,
de una población de tamaño N seleccionada una muestra aleatoria de tamaño n, es decir:
Para estimar diversas caracterı́sticas poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
n
P
yi
i=1
µ
b = ȳ = (1.2)
n
Varianza estimada de ȳ
s2 N −n
Vb (ȳ) = (1.3)
n N
donde la varianza muestral s2 es:
n n
(yi − ȳ)2 yi2 − nȳ 2
P P
i=1 i=1
s2 = =
n−1 n−1
8
Escuela Militar de Ingenierı́a
n
P
N yi
i=1
τb = N ȳ = (1.5)
n
Varianza estimada de τb !
s2 N −n
2
Vb (τb) = Vb (N ȳ) = N (1.6)
n N
n
P
yi (
i=1 a 0 si yi ∈
/ exito
pb = ȳ = = tal que: yi = (1.8)
n n 1 si yi ∈ exito
Varianza estimada de pb
pbqb N −n
Vb (pb) = (1.9)
n−1 N
donde
qb = 1 − pb
También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:
9
Escuela Militar de Ingenierı́a
N σ2
n= (1.11)
(N − 1)D + σ 2
donde
B2
D=
4
N σ2
n= (1.12)
(N − 1)D + σ 2
donde
B2
D=
4N 2
N pq
n= (1.13)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n
Es un método de selección secuencial automático sumamente práctico y de fácil comprensión por los
entrevistadores, sobre todo en la selección de unidades estadı́sticas durante la ejecución de la encuesta.
De la población {Y1 , Y2 , ..., YN } se desea extraer una muestra sistemática de tamaño n para ello se
debe seguir los siguientes pasos:
10
Escuela Militar de Ingenierı́a
N
1. Determinar la longitud k = del intervalo de selección sistemática, que nos indica la selección
n
de una de cada k unidades de investigación.
Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
n
P
yi
i=1
µ
b = ȳsy = (1.14)
n
11
Escuela Militar de Ingenierı́a
n
P
yi
i=1
τbsy = N ȳsy = N · (1.17)
n
n
P
yi (
i=1 a 0 si yi ∈
/ exito
pbsy = ȳsy = = tal que: yi = (1.20)
n n 1 si yi ∈ exito
N σ2
n= (1.23)
(N − 1)D + σ 2
donde
B2
D=
4
12
Escuela Militar de Ingenierı́a
N σ2
n= (1.24)
(N − 1)D + σ 2
donde
B2
D=
4N 2
N pq
n= (1.25)
(N − 1)D + pq
donde
B2
q =1−p y D=
4
los parámetros σ 2 y p pueden ser estimados mediante una encuesta preliminar (encuesta piloto) por
a
b 2 = s2 y pb = .
σ
n
Cuando se tiene una población heterogénea {Y1 , Y2 , ..., YN } y esta puede dividirse en L subgrupos o
estratos independientes y mutuamente excluyentes de acuerdo a un criterio o variable de estratificación,
de modo que los elementos o unidades sean homogéneos dentro de cada estrato. De esta manera el
estrato h (h = 1, 2, ..., L) está constituido por Nh unidades y el tamaño de la población es:
L
X
N = N1 + N2 + · · · + NL = Nh
h=1
Cada estrato obtenido constituye una subpoblación con su marco de muestreo y parámetros de un
universo independiente. Posteriormente, de cada estrato se selecciona una muestra aleatoria, de manera
que el tamaño de la muestra en el estrato h sea nh (h = 1, 2, ..., L) y el tamaño de la muestra este dado
por:
L
X
n = n1 + n2 + · · · + nL = nh
h=1
13
Escuela Militar de Ingenierı́a
El objetivo de aplicar este método de muestreo es obtener estimadores más eficientes, esto es con menor
error estándar (desviación) o menor error relativo (coeficiente de variación).
Los datos muestrales dentro de cada estrato luego de este procedimiento serán:
Para estimar diversos parámetros poblacionales de dicha variable de interés Y , como son la media de
la población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
L
1 1 X
µ
b = ȳst = [N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL ] = Nh ȳh (1.26)
N N h=1
donde la media muestral dentro de cada estrato es
nh
P
yhi
i=1
ȳh = para todo h = 1, 2, ..., L.
nh
14
Escuela Militar de Ingenierı́a
L
X
τbst = N ȳst = N1 ȳ1 + N2 ȳ2 + · · · + NL ȳL = Nh ȳh (1.29)
h=1
L
1 1 X
pbst = ȳst = [N1 pb1 + N2 pb2 + · · · + NL pbL ] = Nh pbh (1.32)
N N h=1
donde la proporción para cada estrato es
nh
P
yhi
i=1 ah
pbh = = para todo h = 1, 2, ..., L.
nh nh
qbh = 1 − pbh
15
Escuela Militar de Ingenierı́a
También en el muestreo resulta de interés conocer el tamaño muestral n adecuado para estudiar,
dados unos errores determinados B y un margen de confianza 1 − α. El tamaño de muestra para cada
párametro de interés es:
L
Nh2 σh2 /wh
P
h=1
n= L
(1.35)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4
L
Nh2 σh2 /wh
P
h=1
n= L
(1.36)
N 2D + Nh σh2
P
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4N 2
L
Nh2 ph qh /wh
P
h=1
n= L
(1.37)
N 2D
P
+ Nh ph qh
h=1
donde
Nh B2
wh = ∀ h = 1, 2, ..., L. y D=
N 4
donde σh2 y ph son estimados mediante una encuesta preliminar (encuesta piloto) por
c2 = s2 ah
σ h h y pbh = ∀ h = 1, 2, ..., L.
nh
16
Escuela Militar de Ingenierı́a
Después de elegir el tamaño de muestra n, existen muchas maneras de dividir n entre los tamaños de
muestra de los estratos individuales, n1 , n2 , ..., nL . Nuestro objetivo consiste en utilizar una afijación
que presente una cantidad especı́fica de información a un coste mı́nimo.
Afijación de Neymann Si el costo de obtener una observación es el mismo para todos los estratos
c1 = c2 = · · · = cL = 1, entonces
N σ N p q √
h h h h h
nh = n nh = n ∀ h = 1, 2, ..., L. (1.39)
L L
√
P P
Nk σk Nk pk qk
k=1 k=1
Afijación proporcional Además de encontrar costos iguales, en algunas ocaciones resulta las mis-
mas varianzas σ12 = σ22 = · · · = σL2 , entonces
N
Nh
h
nh = n L =n ∀ h = 1, 2, ..., L. (1.40)
P N
Nk
k=1
Afijación uniforme Además de encontrar costos iguales, en algunas ocaciones resulta las mismas
varianzas σ12 = σ22 = · · · = σL2 y los mismos tamaños de los estratos N1 = N2 = · · · = NL , entonces
1
nh = n ∀ h = 1, 2, ..., L. (1.41)
L
17
Escuela Militar de Ingenierı́a
Una muestra por conglomerados es una muestra aleatoria en la que cada unidad de muestreo es
un conjunto, o conglomerado de elementos..
Un muestreo por conglomerados, es un diseño eficaz para obtener una cantidad especificada de infor-
mación con costo mı́nimo, bajo las siguientes condiciones:
1. No se encuentra disponible o es muy costoso obtener un buen marco que liste los elementos de
la población, mientras que se puede lograr fácilmente un marco que liste los conglomerados.
2. El costo para obtener observaciones se incrementa con la distancia que separa los elementos.
Ası́ por ejemplo, se puede dividir el terriorio en un muestreo de conglomerados dividiendo el área total
en áreas más pequeñas como: distritos, dentros poblados, manzanas; se elige al azar algunas áreas y
todos los hogares que residen en dichas áreas, constituyen la muestra. Los conglomerados pueden ser:
Para estimar diversos parámetros poblacionales de la variable de interés Y , como son la media de la
población (µ), el total poblacional (τ ) y la proporción poblacional (p) definida por las expresiones:
N
P N
P
Yi Yi
i=1 i=1 A
µ= τ =N ·µ p= =
N N N
Previamente definimos la siguiente notación:
18
Escuela Militar de Ingenierı́a
M
M̄ = = tamaño medio del conglomerado en la población.
N
yi (ai ) = total de todas las observaciones en el i−ésimo conglomerado de la muestra.
n
P
yi
i=1
µ
b = ȳcg =
Pn (1.42)
mi
i=1
n
P
N yi
i=1
τbcg = M ȳcg = M (1.45)
n
19
Escuela Militar de Ingenierı́a
n
P
ai
i=1
pbcg = Pn (1.48)
mi
i=1
N σr2
n= (1.51)
N D + σr2
donde σr2 se estima mediante s2r y
B 2 M̄ 2
D=
4
N σr2
n= (1.52)
N D + σr2
donde σr2 se estima mediante s2r y
B2
D=
4N 2
20
Escuela Militar de Ingenierı́a
N σp2
n= (1.53)
N D + σp2
donde σp2 se estima mediante s2p y
B 2 M̄ 2
D=
4
21