Beruflich Dokumente
Kultur Dokumente
Mostrar los beneficios del muestreo 2. Analizar los tipos de muestreo 3. Aplicar las frmulas de muestreo para poblaciones finitas e infinitas
1.
MUESTREO
Una paso fundamental para realizar un estudio estadstico del
mercado es obtener unos resultados confiables y que puedan ser aplicables. No obstante resulta casi imposible o imprctico llevar a cabo algunos estudios sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio basndose en un subconjunto de sta denominada muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad
buscada es necesario que tal subconjunto de datos, o muestra, posea algunas caractersticas especficas que permitan, al final, generalizar los resultados hacia la poblacin en total. Esas caractersticas tienen que ver principalmente con el tamao de la muestra y con la manera de obtenerla.
familias, etc.) de las cuales se desea informacin las poblaciones pueden ser finitas o infinitas. Se consideran infinitas aquellas formadas por ms de 5000 unidades.
datos de la cual se extrae la muestra. Para analizar el comportamiento de la poblacin por ejemplo el listado de las 100 empresas ms grandes de Bolivia.
TIPOS DE MUESTREO
Muestreo no probabilstico
Los elementos de la muestra se seleccionan siguiendo criterios determinados por el investigador siempre procurando la representatividad de la muestra
Muestreo probabilstico
Todos los individuos o elementos de la poblacin tienen la misma probabilidad de ser incluidos en la muestra extrada, asegurndonos la representatividad de la misma
A. MUESTREO NO PROBABILSTICO
Este tipo de muestreo se utiliza cuando el probabilstico
resulta muy costoso, teniendo presente que no sirve para hacer generalizaciones puesto que no existe certeza de que la muestra extrada tenga representatividad, puesto que no todos los elementos de la poblacin tiene la misma probabilidad de ser seleccionados.
acuerdo a criterios que l considera de aporte para el estudio. Ejemplo: Seleccionar a cajeros de un banco en un estudio sobre el comportamiento del usuario ante el pago de impuestos.
intencionadamente de acuerdo a la facilidad de acceso Ejemplo: Un profesor universitario frecuentemente utilizar a sus estudiantes para integrar muestras.
selecciona a los elementos o individuos ms representativos de cada estrato. Primero. Se realiza una clara divisin por cuotas (estratos) Segundo. A cada cuota se aplica un muestreo discrecional
Ejemplo: Seleccionar 20 estudiantes de la carrera de ingeniera industrial, que ya hayan cursado el noveno semestre de la carrera y que tengan promedio arriba del 65 por ciento. Se eligen a los primeros 20 que cumplan con estas condiciones. Este tipo de muestreo se utiliza especialmente en las encuestas de opinin.
otros y estos a otros hasta conseguir una muestra adecuada en tamao. Ejemplo: Realizar estudios con poblaciones marginales, tipos de enfermos, especialistas, etc.
B. MUESTREO PROBABILSTICO
Todos los individuos o elementos de la poblacin tienen la
probabilidad de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de muestreo es ms recomendable, pero resulta mucho ms difcil de llevarse a cabo y, por lo tanto, es ms costoso. Para seleccionar una muestra de este tipo se requiere tener en forma de lista todos los elementos que integran la poblacin investigada y utilizar tablas de nmeros aleatorios.
EJEMPLO
A un grupo de 100 personas se les numera de uno a cien y se
depositan en una urna 100 bolitas a su vez numeradas de uno a cien. Para obtener una muestra aleatoria simple de 20 elementos, tendramos que sacar 20 bolitas numeradas de la urna que nos seleccionarn en forma completamente al azar a los 20 elementos escogidos para que opinen sobre un nuevo producto.
Se elige un primer elemento del universo y luego se van escogiendo otros elementos igualmente espaciados a partir del primero. Consiste en dividir la poblacin en n estratos, compuestos de k unidades. Ejemplo: a partir de una lista de 100 establecimientos de comestibles, deseamos seleccionar una muestra probabilstica de 20 tiendas. La forma de hacerlo sera:
Dividir 100 entre 20 para obtener 5 que es el salto sistemtico Extraer un nmero al azar entre 1 y 5. Supngase que es el nmero 2
el cual corresponde al primer elemento seleccionado. Se incluyen en la muestra de establecimientos numerados: 2, 7, 12, 17, 22,..,97.
ciudad que se investigar. Segunda etapa: seleccin de hogares en esas manzanas. Posteriormente se deben eliminar del plano las manzanas no destinadas a casa habitacin: como parques, iglesias, tiendas e industrias. Tercera etapa: Se enumera cada manzana de las que restan en el plano con un criterio uniforme para no alterar la aleatoriedad. Al mismo tiempo se determinar el nmero de manzanas que estarn en la muestra. Una vez realizados estos pasos se encuentra un nmero promedio de viviendas por manzana
Ejemplo: Se desea realizar un estudio en las familiar de una ciudad, en esta ciudad existen cerca de 5,000 manzanas disponibles y 200,000 hogares, con un promedio de 40 hogares por manzana.
Se fija un salto mnimo de hogares para hacer cada entrevista. Un salto
es el nmero de casas que se dejarn de visitar despus de cada encuesta. A mayor salto, mayor dispersin de la muestra y mayor representatividad, pero mayor costo. Se recomiendan saltos no menores de 4 ni mayores de 10 casas. Se puede utilizar un salto promedio de 8. Se determina el tamao de la muestra. Suponiendo que la muestra es de 800 hogares entrevistados, se tiene:
haber encuestado una manzana, se obtiene de la siguiente forma: si se precisa 160 manzanas
5000/160=31,25
Primera manzana.25 Salto sistemtico..32 Segunda manzana....57 Salto sistemtico..32 Tercera manzana89 Etc.
caracterstica que se desea estudiar: clases sociales, regiones, sexo, grupos de edad. En este caso la poblacin queda dividida en estratos o grupos y el muestreo debe hacerse de tal forma que todos esos grupos queden representados.
Para determinar el tamao de la muestra en cada estrato, sobre
todo si la estratificacin es por niveles de ingreso y por regiones, se puede utilizar dos mtodos:
una relacin proporcional entre el tamao del estrato y el nmero de elementos que aporta a la muestra. Cuanto mayor sea el estrato, mayor ser el tamao de la muestra seleccionada.
Clculo desproporcional al tamao del estrato. Este tipo de
clculo se utiliza para no tener muestras excesivamente grandes en los estratos de mayor tamao y muestras demasiado pequeas que no permitan un anlisis mayor en los estratos de menor tamao. Muchas veces, los productos a investigar tienen su mayor demanda en los estratos ms pequeos.
Ejemplo: Se desea realizar una investigacin acerca de las actitudes, preferencias y hbitos de consumo de las madres de familia y los nios por un nuevo tipo de galleta en el mercado no obstante es evidente que esete estudio debe enfocarse ms hacia los niveles socioeconmicos altos, ya que son quienes pueden hacer frente a un precio Premium del 20%.
Suponga que la muestra total es de 500 encuestas en la ciudad del estudio.
Considerando los porcentajes de hogares en cada estrato socioeconmico en un muestreo probabilstico con clculo proporcional obtendramos:
mtodo desproporcional, analizando el comportamiento de la caracterstica para cada estrato y se haciendo una estimacin de su distribucin en la muestra total.
tamao del estrato, al intentar investigar la probabilidad de pago de un precio Premium, la investigacin se ve muy limitada, precisamente por el tamao del estrato. Al balancear el tamao del mismo con la probabilidad de posesin del producto, se podr explorar mejor el fenmeno.
LA INFERENCIA ESTADSTICA
El objetivo del muestreo es estimar parmetros de la
poblacin, tales como la media o la varianza, con base en la informacin contenida en una muestra. La teora de muestreo permite desarrollar mtodos de seleccin de muestras y de estimacin, que proporcionen, al menor costo posible, estimaciones con la suficiente exactitud para los propsitos establecidos.
Para calcular el tamao de una muestra hay que tomar en
para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a que no existe ninguna duda para generalizar resultados e implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto para el estudio se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca alrededor de 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.
acept y se rechaz la hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la investigacin actual. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechaz se la hiptesis es la variabilidad negativa, denotada por q. Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Adems, cuando se habla de la mxima variabilidad, en el caso de no existir antecedentes sobre la investigacin (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.
EN RESUMEN:
Cuando deseamos estimar el tamao de una muestra, debemos conocer los
siguientes aspectos: a) El nivel de confianza o seguridad (1 - ). El nivel de confianza prefijado da lugar a un coeficiente (Z). Por ejemplo para una seguridad del 95%, Z = 1.96, para una seguridad del 99%, Z = 2.58. (Estos valores provienen de las tablas de la distribucin normal Z) b) La precisin que deseamos para el estudio es decir el mximo error muestral c) Una idea del valor aproximado del parmetro que queremos medir. Esta idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%). Una consideracin clave para una investigacin es la cantidad de informacin con la que se cuente; especficamente se pueden tener dos casos: desconocer la poblacin del fenmeno estudiado, o bien, conocerla.
Es la constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigacin sean ciertos: un 95,5 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 4,5%.
Es el error muestral deseado. El error muestral es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella
Z = nivel de confianza, P = probabilidad de xito, es la proporcin de individuos que poseen la caracterstica de estudio en la poblacin q = probabilidad de fracaso d = precisin (error muestral mximo admisible)
personas compraran un producto y tenemos un error muestral del 5% comprarn entre 95 y 105 personas. Ejemplo 2: si hacemos una encuesta de satisfaccin a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarn. Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estar en el intervalo 52-58% (55% +/- 3%).
Ejemplo: A cuntas familias tendramos que estudiar para conocer la preferencia del mercado en cuanto a una marca de shampoo para beb, si se desconoce la poblacin total?
Seguridad = 95%; Precisin = 3%;
Probabilidad de xito = asumamos que puede ser prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral. Entonces: Z = 1.962 (ya que la seguridad es del 95%) p = proporcin esperada (en este caso 5% = 0.05) q = 1 p (en este caso 1 0.05 = 0.95) d = precisin (en este caso deseamos un 3%)
Se requerira encuestar a no menos de 203 familias para poder tener una seguridad del 95%
Ejemplo: Cmo hubiera cambiando el ejemplo anterior, si se desconoce la proporcin esperada? Cuando se desconoce la probabilidad de xito esperada, se tiene que utilizar el criterio conservador (p = q = 0.5), lo cual maximiza el tamao de muestra de la siguiente manera: Z = 1.962 (ya que la seguridad es del 95%) p = Probabilidad de xito(en este caso 50% = 0.5) q = 1 p (en este caso 1 0.5 = 0. 5) d = precisin (en este caso deseamos un 3%) quedando como resultado:
Se requerira encuestar a no menos de 1068 familias para poder tener una seguridad del 95%
de la poblacin es la siguiente:
Ejemplo: A cuntas familias tendramos que estudiar para conocer la preferencia del mercado en cuanto a una marca de shampoo para beb, si se conoce que el nmero de familias con bebs en el sector de inters es de 15,000? Seguridad = 95%; Precisin = 3%; Probabilidad de xito= asumimos que puede ser prxima al 5%; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao muestral.
Se requerira encuestar a no menos de 200 familias para poder tener una seguridad del 95%
Se requerira encuestar a no menos de 997 familias para poder tener una seguridad del 95%
EJEMPLO
Los investigadores de una empresa de productos de aseo personal
desean a aplicar una encuesta en la ciudad de Bellavista para conocer las preferencias de consumo de una nueva crema aftershave. Su principal duda es el nmero de personas que debern encuestar para realizar su investigacin. Por lo que le han solicitado determinar:
1.- La poblacin meta. El elemento y unidad muestral. 2.- El marco muestral y el estrato. 3.- El tipo de muestreo ms adecuado. 4.- La distribucin y el tamao de la muestra a utilizar.
Tomar en cuenta que la poblacin meta estar compuesta solo por varones mayores de 18 aos.
Como la poblacin meta estar compuesta solo por varones mayores de 18 aos en este caso coincide que cada persona de sexo masculino del distrito de Bellavista, mayor de 18 aos, ser el elemento muestral y la unidad de muestra. El marco muestral para obtener los datos de la poblacin meta, ser el listado anual de distribucin poblacional que emite el INSTITUTO NACIONAL DE ESTADSTICA El estrato est conformado por los varones mayores de 18 aos de los niveles socioeconmicos A, B, C.
aleatorio estratificado por ser el de uso ms frecuente cuando queremos una primera aproximacin de mercado. A travs de ella podremos seleccionar las unidades de muestra al azar, segn la distribucin poblacional, definida por las caractersticas de control. Es decir, estableceremos cuotas segn sexo, edad y nivel socio econmico. Variables importante por la naturaleza de la investigacin.
Para empezar, sumamos las columnas de cada nivel
socioeconmico, para luego obtener los porcentajes de cada una, en base al total neto de varones.
|Total Neto
|100.00%
Una vez obtenidos los porcentajes, estaremos en capacidad de establecer la cantidad de encuestas a realizar en cada rango de edad y nivel socioeconmico.
Luego procederemos a calcular el tamao de muestra de acuerdo con los datos y la frmula correspondiente.
Nivel de confianza Distribucin normal estandarizada Si tiene caractersticas de inters No tiene caractersticas de inters Error Tamao de la poblacin = 0.95 z =1.96 p =0.60 q =0.40 d =0.05 N =2,449
Indica la probabilidad de que los resultados de nuestra investigacin sean ciertos: un 95 % de confianza es lo mismo que decir que nos podemos equivocar con una probabilidad del 5%.
Es la diferencia que puede haber entre el resultado que obtenemos preguntando a una muestra de la poblacin y el que obtendramos si preguntramos al total de ella
=2257,93/7,04=321 encuestas
EJERCICIOS
1. Determinar el tamao de la muestra para realizar una encuesta de satisfaccin a clientes de un determinado modelo de coche del que hemos vendido 10.000 unidades (N), en la que queremos una confianza del 95%, deseamos un error muestral del 5% y consideramos que estarn satisfechos el 50% (p=q=0.5) 2. Determinar el tamao de la muestra para contrastar el porcentaje de personas de un pas que ven un determinado programa de televisin. Si la poblacin del pas es de 40 millones de personas, estimamos que lo ve el 20% de la poblacin (p=0.2 y q=0.8), queremos una confianza del 95% y estamos dispuestos a asumir un error muestral del 5%