Beruflich Dokumente
Kultur Dokumente
mdicos,
enfermeros,
auxiliares de enfermera,
otros
profesionales de la salud,
administrativos,
auxiliares de limpieza,
guardias, y se
seleccionan muestras en cada uno, de tamaos proporcionales,
, tales que
, y
Para todo .
3) Muestreo por Conglomerados (M.C.)
La poblacin presenta subgrupos llamados conglomerados que, respecto de la variable
medida, tienen la caracterstica de ser heterogneos dentro de ellos (variados
representando cada conglomerado a una poblacin en miniatura) y homogneos entre
ellos (los conglomerados son semejantes entre ellos de modo que da lo mismo seleccionar
uno u otro). Adems, existen problemas de acceso a los elementos, y la seleccin de
conglomerados los soluciona, en muchas ocasiones los conglomerados son unidades de
muestreo.
Ejemplo
Se conduce un estudio de la necesidad de un centro abierto para nios en una poblacin
que est compuesta de 50 edificios de departamentos. Interesa obtener una muestra del
10% de las familias, para lo cual se seleccionan al azar 5 de los 50 edificios y luego se
realiza la consulta en todos los departamentos de los edificios en la muestra.
4) Muestreo Sistemtico (M.S.)
La poblacin no presenta subgrupos o estos son desconocidos para el investigador y la
variable a ser medida en ella tiene un comportamiento relativamente homogneo.
Adems se cuenta con un marco muestral completo ordenado en el cual los individuos
estn numerados o pueden numerarse fcilmente. Finalmente, el ordenamiento en el
marco muestral no guarda relacin con la variable de inters, en el sentido de que no se
observa algn tipo de patrn, por ejemplo cclico, en ellos.
Ejemplo
Se desea estudiar el rendimiento de los estudiantes de primer ao de cierta
Universidad, los cuales estn ordenados en un listado en orden alfabtico. La muestra
corresponder a un 5% de la poblacin ( ). Esto significa que se seleccionar en
forma sistemtica uno de cada individuos, es decir:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
14
Para definir el nmero inicial, se selecciona un nmero al azar entre 1 y , sale
elegido el nmero 16. El primer individuo en la muestra es el que corresponde en la lista al
16. A partir de este nmero se salta cada vez 20 para elegir el que sigue, es decir, se
escoge a los individuos nmero 16, 36, 56, 76, 96, 116, ... , 4.896.
Diseo del Muestreo
El objetivo del muestreo es la estimacin de parmetros de la poblacin.
La estimacin se basa en la informacin muestral. La precisin de esta estimacin es
determinada por el investigador como el error mximo de estimacin .
|
|
La probabilidad de que la estimacin tenga un error que no supere a esta cota se
denomina nivel de confianza.
( ) (|
| )
Como se vio anteriormente, si consideramos (
), y
El tamao de muestra es grande, o la distribucin es normal, se tiene que la
probabilidad es
El tamao de muestra es pequeo, se tiene que la probabilidad es
Note que la cantidad (
] [
)]
Tamao de la Muestra
Cada elemento de la poblacin contiene una cierta cantidad de informacin relativa a ella,
a las variables en juego, a sus distribuciones y a sus parmetros; sin embargo cada unidad
muestreada implica un costo, lo que motiva la determinacin del mnimo tamao
muestral que permita el logro de los objetivos de la estimacin (precisin y confianza
deseadas), dada la variabilidad (desviacin estndar del estimador) existente y el tamao
de la Poblacin.
De estos factores, dos son propios del problema y no se pueden alterar (variabilidad,
tamao de la poblacin), mientras que los otros dos son definidos por el investigador
(precisin y confianza).
El ideal es que se pueda contar con que las mediciones hayan sido realizadas en forma
exacta. En caso contrario, se habla de error de medicin. Este tipo de error debe
minimizarse.
2.1. Muestreo Aleatorio Simple (M.A.S.)
El muestreo aleatorio simple es la forma ms sencilla de muestreo de probabilidad y
proporciona la base terica de las formas ms complejas.
Existen dos formas de extraer una muestra aleatoria simple: con reemplazo, donde la
misma unidad se puede incluir ms de una vez en la muestra, y sin reemplazo donde
todas las unidades de la muestra son distintas.
Una muestra aleatoria simple con reemplazo, de tamao , obtenida de una
poblacin de unidades se puede pensar como la extraccin de muestras
independientes de tamao 1. Una unidad se extrae al azar de la poblacin con
probabilidad
) . El valor verdadero
es el valor del parmetro. Un estimador es sesgado si se desva del valor verdadero en
forma sistemtica. Con un estimador insesgado podemos aproximarnos al valor verdadero
tanto como queramos, aumentando el tamao de la muestra. Con el estimador sesgado,
siempre habr una desviacin entre el verdadero y el estimado, y la desviacin es
independiente del tamao de la muestra.
Anlisis de Caso 1
Supongamos que queremos la longitud promedio de la cohorte que no desve ms del 7%
de la longitud promedio verdadera y que adems se necesita una certeza del 95%. Es
decir, se precisa que los lmites de confianza al 95%, no se desven ms del 7% del
promedio estimado .
A partir del intervalo de confianza para la media de una distribucin normal se tiene:
Varianza conocida
]
Varianza desconocida
[
]
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
17
Asumiendo varianza desconocida, la desviacin
Se define entonces
Donde es el error mximo de estimacin
Observacin: Para estimar el tamao de muestra necesitamos conocer la desviacin
estndar muestral la que se puede estimar de una muestra piloto o de alguna
informacin anterior.
Ejemplo
Considerando el Caso 1 con un nivel de confianza del 95%.
a) Determine el error mximo relativo usando como estimadores y
; para una muestra de tamao .
b) Evalu el comportamiento del error mximo relativo para distintos tamaos de
muestra dados por la tabla.
6 7 8 9 10
11 21 31 41 51
61 71 81 91 101
111 121 131 141 146
c) Realice el grfico error relativa (eje Y) versus tamao de muestra (eje X).
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
18
d) Comente que observa del grfico.
Desarrollo
a) El error mximo relativo sustituyendo , y est dado por:
b) Haciendo uso de Excel se obtendrn los valores de la estadstica para los
diferentes grados de libertad en base a la probabilidad.
c)
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
19
d) Observaciones
-Ntese que se ha ganado relativamente poco al incrementar n cuando . Pero
al aumentar de , se ha reducido el error relativo.
-Si se pueden obtener muestras aleatorias insesgadas, no hay problema en estimar el
tamao de la muestral requerido para cualquier error pre especificado.
-Sin embargo, generalmente las muestras son sesgadas de un modo u otro. Por
ejemplo si los peces pequeos pueden escaparse a travs de red, se puede obtener
una sobreestimacin de la talla promedio de la poblacin de peces estudiada. (Este es
un ejemplo de sesgo). Por otro lado tambin puede suceder que los peces ms
grandes naden ms rpido que la red que es arrastrada y por lo tanto de esta forma
evitan ser capturados, en este caso se obtiene otro tipo de sesgo.
Idea fundamental del Muestreo Aleatorio Simple
La idea fundamental del muestreo aleatorio simple es que, en la eleccin de una muestra
de unidades, todas las posibles combinaciones de unidades tienen la misma
posibilidad de ser seleccionada de la poblacin de tamao .
Sea (
( )
La probabilidad de escoger alguna de estas muestras es:
()
)
Recordemos (
Media
Proporcin
Varianza
Varianza insesgada
x
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
21
Caractersticas del muestreo aleatorio simple
a) Cada uno de los elementos de la muestra, se selecciona aleatoriamente uno por otro.
b) Todos los elementos de la poblacin tiene la misma probabilidad de ser incluidos en la
muestra.
Estimacin del tamao de muestra para
Deseamos estimar la media poblacional
se tiene:
(
|
|
()
)
Despejando se tiene que
(|
())
As,
()
Con
() ( )
As, el tamao de muestra
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
22
Donde:
Tamao de la muestra
Tamao de la poblacin
Varianza de la muestra
Error de estimacin
Generalmente es necesario hacer un premuestreo de por lo menos 30 elementos o un
10% de la poblacin, con el objetivo de hacer una primera estimacin de
.
Haciendo
Se obtiene que,
Notar que cuando es muy grande se aproxima a
. A
Con
Estimacin del tamao de la muestra para Proporcin
Si
{
Entonces
Para estimar el tamao de la muestra n, en este caso con error mximo de muestreo
admisible e y coeficiente de confianza basta reemplazar el valor de la varianza en
la frmula:
(
Con
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
24
Observacin. Si no se tienen antecedentes de , utilizar
, as
El tamao de muestra, ignorando la correccin para poblaciones finitas, es grande al
compararlo con el tamao de la poblacin, as es que en este caso ajustamos segn la
correccin indicada para poblaciones finitas.
Calculamos
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
25
2.2. Muestreo Estratificado
La eleccin del diseo de muestreo depende de factores relativos a la estructura de la
poblacin. En este captulo abordaremos el caso en el cual la poblacin est compuesta de
grupos que son heterogneos entre ellos respecto de la variable de inters, pero que
presentan un comportamiento homogneo de la variable dentro de ellos. Estos grupos se
conocen como Estratos.
En estos casos se suele utilizar el mtodo conocido como Muestreo Aleatorio
Estratificado, el cual consiste en la seleccin de muestras aleatorias simples
independientes dentro de los subgrupos o Estratos.
La utilizacin del Muestreo Aleatorio Estratificado (MAE) permite reducir la variabilidad
total del estimador utilizado, ya que sta depende de la variabilidad de la variable de
inters, la cual es baja dentro de los grupos. Como sabemos, la variabilidad del estimador
incide en el error de estimacin, de modo que se obtendr una estimacin mucho ms
precisa.
Ventajas de la Estratificacin
Por supuesto, la estratificacin se realiza debido a sus ventajas y cuando stas lo ameritan.
Algunos de estos beneficios son:
1) Mayor precisin: Para un mismo tamao muestral, la estratificacin produce un lmite
ms pequeo para el error de estimacin que el que se generara a partir de un MAS. Este
resultado es ms efectivo mientras ms homogneos sean internamente los estratos, es
decir, mientras ms adecuada y necesaria sea la estratificacin.
Por ejemplo, estratificar por sexo en un estudio relacionado con el peso reducir
notablemente la variabilidad; en un estudio relacionado con sueldos, si se cree que existe
discriminacin al respecto.
2) Reduccin de costos: La estratificacin en grupos convenientes permite reducir los
costos monetarios y temporales de la recoleccin de datos.
Por ejemplo, si se trata de individuos que viven en diferentes sectores, organizar el
proceso de recoleccin en cada sector por separado resulta ms econmico.
3) Estimaciones para los estratos: La estratificacin permite, a la vez que estimar respecto
del grupo total, obtener estimaciones de los estratos mismos. Cuando stos son grupos de
inters, estos resultados resultan muy tiles. Si la estratificacin es por grupos
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
26
socioeconmicos, ser mucho ms til contar con las mediciones para cada grupo
particular que para el grupo total.
Proceso de Estratificacin
El proceso de estratificacin es un diseo de muestreo en etapas. Una vez que se ha
determinado que el MAE es el diseo ms adecuado, las etapas son las siguientes:
1) Definicin de Estratos: Definir claramente los estratos existentes en la poblacin, de
modo que cada elemento de la poblacin pertenezca a un estrato y slo a un estrato.
2) Tamao de los Estratos: Determinar o estimar el tamao de cada estrato
,
donde naturalmente el tamao de la poblacin es la suma de los tamaos de los estratos:
3) Tamao muestral: Determinar el tamao muestral total y por estrato es un proceso que
se realiza de diferentes formas, las cuales sern mencionadas ms adelante.
4) Seleccin de la muestra: Seleccionar la muestra dentro de cada uno de los estratos en
forma independiente mediante un diseo de MAS.
Estimadores e intervalos
El objetivo de este diseo de muestreo es la estimacin de parmetros de la poblacin y
de los estratos. Los estimadores son insesgados y, dependiendo de las prioridades
establecidas, de varianza mnima o con costo mnimo. Dependiendo de si el tamao
muestral por estrato es grande o pequeo, se generan intervalos con nivel de confianza
95% 75%, respectivamente.
Para las estimaciones, es necesario precisar la notacin por estratos. Las medias,
desviaciones estndar y proporciones para las muestras del i-simo estrato se denotan,
respectivamente, por
.
En ocasiones se cuenta con poca informacin previa, lo cual dificulta la estimacin de las
desviaciones estndar. En estos casos se puede usar la siguiente regla:
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
27
Tambin se contar con estimaciones para el caso en que los tamaos de los estratos son
muy grandes respecto de las muestras (
y .
Por otra parte, se denota por al tamao promedio de los conglomerados en la muestra
(valor que se puede observar):
Ahora bien, el total de la variable medida en los individuos del conglomerado i-simo se
denota por y
i
, y corresponde a la suma de las mediciones en el conglomerado, de donde el
promedio de la variable y estimador de la media corresponde a la suma de totales dividida
por la suma de los tamaos. El total de la poblacin, por su parte, sale de multiplicar el
promedio por el nmero de individuos en la poblacin.
2.4. Muestreo Sistemtico
Existen ocasiones en las cuales la muestra a seleccionar y la poblacin son muy grandes,
por lo cual seleccionar una muestra aleatoria simple resulta largo. Tambin en muchas
ocasiones se cuenta con un marco muestral ordenado. En estos casos resulta mucho ms
sencillo considerar un mtodo que en muchos casos es equivalente al muestreo aleatorio
simple en cuanto a precisin, pero que en trminos de facilidad para obtener la muestra
resulta muchsimos ms sencillo, y se trata del muestreo aleatorio sistemtico
Obtencin de la muestra
Para seleccionar una muestra aleatoria sistemtica de tamao n desde una poblacin de
tamao , la cual se encuentra ordenada y numerada en un marco muestral:
- Se obtiene la frecuencia
.
- Se elige un nmero al azar entre , digamos .
- La muestra consiste de los valores:
- En este caso se habla de una muestra sistemtica de .
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
30
Por ejemplo, si y , entonces
Supongamos que al
elegir un nmero al azar entre 1 y 9, se obtiene el valor ; entonces el primer valor
de la muestra es 6 y los dems valores se obtienen sumando sucesivamente 9 hasta
completar los valores, correspondientes a los individuos numerados como: 6, 15,
24, 33, 42, 51, 60, 69, 78, 87, 96, 105, 114. Esta es una muestra sistemtica de 1 en 9.
Utilizacin del muestreo sistemtico
El muestreo sistemtico lleva a resultados absolutamente equivalentes a los del muestreo
aleatorio simple si la poblacin se encuentra ordenada y numerada en un marco muestral
en el cual el orden no guarda relacin con la variable de inters.
En este caso, tanto el tamao muestras, como las estimaciones, sus errores estndar y los
errores de estimacin coinciden con el muestreo aleatorio simple.
Tipos de poblacin
Para clasificar las poblaciones, nos referiremos al marco muestral. Este puede ser de tres
tipos, respecto del orden de las unidades y el valor medido:
a) Aleatorio: las unidades no siguen ningn patrn en el marco muestral. En este caso no
existe ninguna diferencia terica entre muestreo aleatorio simple y sistemtico, aunque la
seleccin es ms sencilla.
b) Ordenado: las unidades en el marco muestral se encuentran ordenadas en forma
creciente respecto de la variable de inters (Figura 2.4.1): en este caso, dada la
uniformidad con que es seleccionada la muestra, se ven representados en forma casi
equitativa todos los posibles valores de la variable de inters, por lo cual la precisin de la
estimacin es mayor a la del muestreo aleatorio simple, es decir:
-El tamao muestral requerido es menor.
-El error estndar es menor.
-El error de estimacin es menor.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
31
Figura 2.4.1: Muestreo sistemtico en marco muestral creciente
c) Peridico: las unidades en el marco muestral se encuentran ordenadas de tal manera
que los valores de la variable varan en forma cclica con respecto de la variable de inters
(Figura 2.4.2): en este caso, dependiendo del punto inicial y de la frecuencia, diferentes
muestras arrojan estimaciones muy diferentes y por lo tanto la variabilidad es muy
grande, mayor a la del muestreo aleatorio simple y por lo tanto la precisin de la
estimacin es inferior, es decir:
-El tamao muestral requerido es mayor.
-El error estndar es mayor.
-El error de estimacin es mayor.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
32
Figura 2.4.2: Muestreo sistemtico en marco muestral cclico
Entonces es claro que, cuando existe algn comportamiento de tipo cclico en la variable,
el muestreo sistemtico debe evitarse, a menos que se utilicen tcnicas correctivas:
Cada cierta cantidad de unidades se elige un nuevo valor inicial.
Ejemplo
. El primer valor elegido al azar entre 1 y 9 es
, se elige entonces 6, 15, 24, luego entre los valores 25 a 33 se elige un valor al azar,
supongamos que es c = 26, entonces se agrega a la muestra 26, 35, 44; en este punto se
elige otro valor inicial entre 44 y 52, supongamos que sale escogido el valor 50, entonces
se agrega el 59 y 68. Ahora se elige un valor al azar entre 69 y 77, supongamos que sale el
73, se agrega entonces el 82 y 91. Se elige un ltimo valor inicial entre 92 y 100 y
supongamos que sale el 94. Al sumarle 9 se obtiene 103, es decir nos pasamos en 3.
Empezando de nuevo se debe agregar el valor 3. La muestra final seleccionada son los
individuos numerados: 3, 6, 15, 24, 26, 35, 44, 50, 59, 68, 73, 82, 91.
Se toman muestras sistemticas con rplicas, es decir, en lugar de una muestra
sistemtica se toman varias con diferentes puntos iniciales.
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
33
Ejemplo
, se toman 4 rplicas, es decir, cada una tiene
datos.
( )
Una forma para estimar el valor de es la siguiente:
( )
donde
es la varianza de la poblacin, la cual se puede estimar mediante una muestra
piloto aleatoria simple o bien obtener de estudios anteriores, y donde es la varianza
obtenida a partir de la muestra aleatoria sistemtica. Claramente la estimacin de se
obtiene en forma posterior a la toma de la muestra sistemtica, por lo cual ser til para
un estudio posterior. Algunas ayudas, si an no se cuenta con un valor de , son las
siguientes:
- Si los valores obtenidos en la muestra son muy parecidos, sin embargo, la
variabilidad de la poblacin es mucho mayor que la de la muestra, se evidencia que
existe un comportamiento cclico o peridico. En este caso la correlacin de la
muestra es grande, y por lo tanto crece.
- Si los valores obtenidos en la muestra estn ordenados de menor a mayor o al
revs, ocurre que los valores son cada vez ms diferentes y la variabilidad de la
poblacin es igual a la de la muestra. En este caso se evidencia un comportamiento
ordenado y en este caso la correlacin de la muestra es negativa aunque cercana a
0, y por lo tanto decrece.
- Si los valores obtenidos en la muestra varan sin un patrn y la variabilidad de la
poblacin es igual a la de la muestra, se trata de un comportamiento aleatorio, y
ESTADISTICAS DE MERCADO
MANUAL DE ESTUDIO- MODULO IV
34
en este caso la correlacin de la muestra es y el tamao de la muestra es el
mismo que en el caso del muestreo aleatorio simple.
GLOSARIO DE TERMINOS
Ayuda de memoria
-Elemento: Objeto al cual se le pueden tomar (y eventualmente se le toman) las
mediciones.
-Poblacin: Coleccin de elementos acerca de los cuales se desea realizar inferencias.
Unidades de muestreo: Colecciones no traslapadas de elementos que cubren la poblacin
completa.
-Marco muestral: Lista de unidades de muestreo.
-Muestra: Una coleccin de unidades seleccionadas de uno o de varios marcos muestrales.
BIBLIOGRAFIA
1. Canavos, G., Probabilidad y Estadstica. Aplicaciones y Mtodos. (Mac Graw Hill).
2. Apuntes, Departamento de Estadstica, Universidad de Concepcin.
3. Devore, J., Probabilidad y Estadstica para ingeniera y ciencias. (THOMSON).