Sie sind auf Seite 1von 7

IT-01 METODOLOGA DE MUESTREO

METODOLOGA DE MUESTREO
Introduccin
En este documento trataremos de definir los conceptos bsicos necesarios para calcular una muestra representativa sobre el total de una poblacin, considerando como tal al conjunto de individuos de los que se quiere obtener una informacin. Esto es, si deseamos conocer la opinin general de un total de clientes, podramos preguntarles a todos y sacar la media aritmtica, pero para aquellos casos en los que este nmero de clientes es muy elevado, la estadstica nos permite tomar slo una muestra de forma aleatoria. De este modo, preguntando nicamente a los clientes resultantes de la muestra, los porcentajes medios que obtendremos de sus respuestas sern los mismos que si preguntsemos al total de la poblacin. El error que se comete debido al hecho de que se obtienen conclusiones del total de una poblacin a partir del anlisis de slo una parte de ella, se denomina error de muestreo.

Obtener una muestra adecuada significa lograr una versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos bsicos. Clculo del tamao muestral.
Cada estudio tiene un tamao muestral idneo, que permite comprobar lo que se pretende con la seguridad y precisin fijadas por el investigador. Esta seguridad y precisin dependern del rango de posibles respuestas (necesitaremos una muestra ms pequea si las opciones son si o no, que si por el contrario la opcin es elegir entre 1 y 10). As mismo, tambin influir si el estudio se realiza sobre una poblacin finita o infinita. FRMULAS:
Dos opciones de respuestas(Ejem: si o no) Varias opciones de respuestas (ejem: valora entre x e y)

Poblacin finita

n = Z

NS2 i2 (N-1)+Z2S2
2

Poblacin infinita

n=Z

S2 i2

A CONTINUACIN EXPLICAMOS CADA UNO DE LOS PARMETROS QUE INTERVIENEN EN LAS FRMULAS.

Pgina 1 de 7

IT-01 METODOLOGA DE MUESTREO


n = tamao de la muestra representativa que deseamos obtener. N = tamao de la poblacin. Z= Valor correspondiente a la distribucin de Gauss (siendo el nivel de confianza elegido). Habitualmente los valores escogidos son Z= 1,96 para =0,05 y Z= 2,57 para =0,01. Qu significa esto?. La distribucin de Gauss es la denominada distribucin normal y responde a la forma representada a continuacin:

Fig. 1 Bajo esta campana est representada una poblacin concreta. Sea cal sea el objeto del estudio o del anlisis estadstico, existir una mayora de la poblacin que se encontrar ubicada en la parte central rayada de la fig. 1 (es decir si estamos midiendo la satisfaccin de los clientes frente a un servicio concreto, la mayora de los clientes tendrn una percepcin similar, parte rayada), aunque siempre existirn opiniones dispersas (situadas en los extremos), que por su poca representatividad y distancia a la parte ms alta de la campana, podrn ser despreciables. Por tanto, los valores de Z dependern de del nivel de confianza escogido:

Consideramos que todas las respuestas son fiables. Nos sirven el 100%

Consideramos que el 1% de las respuestas son de clientes muy satisfechos o muy insatisfechos con respecto a la media, por tanto existir un 1% de encuestas que entrarn en el anlisis que no nos aportarn nada.

Consideramos que el 5% de las respuestas son de clientes muy satisfechos o muy insatisfechos con respecto a la media, por tanto existir un 5% de encuestas que entrarn en el anlisis que no nos aportarn nada.

Consideramos que el 10% de las respuestas son de clientes muy satisfechos o muy insatisfechos con respecto a la media, por tanto existir un 10% de encuestas que entrarn en el anlisis que no nos aportarn nada.

Fig. 2 Por tanto, el valor de z (siendo z una variable normal centrada y reducida), elimina del intervalo z una proporcin a de los individuos.

Pgina 2 de 7

IT-01 METODOLOGA DE MUESTREO


i = error de la estimacin (tambien denominado e). Error que se prev cometer. Por ejemplo, para un error del 10%, introduciremos en la frmula el valor 0,1. As, con un error del 10%, si el parmetro estimado resulta del 80%, tendramos una seguridad del 95% (para =0,05) de que el parmetro real se sita entre el 70% y el 90%. Vemos, por tanto, que la amplitud total del intervalo es el doble del error que introducimos en la frmula. (Ver fig. 4) Nivel de confianza (1-): habitualmente 95% o 99%. Probabilidad complementaria al error admitido
Dos opciones de respuestas(Ejem: si o no) Varias opciones de respuestas (ejem: valora entre x e y)

p = proporcin en que la variable estudiada se da en la poblacin. Prevalencia esperada del parmetro a evaluar. En caso de desconocerse, aplicar la opcin ms desfavorable (p=0,5), que hace mayor el tamao muestral (ver fig. 3). q = 1 - p. Cmo escogemos confianza? el nivel de

S2 o varianza/S o desviacin tpica: para estos casos en los que existen un mayor nmero de posibles respuestas, la varianza nos dice cal es el valor medio de la dispersin de las mismas respecto a la media de dichas respuestas. Es decir, respecto a la parte ms alta de la campana de Gauss, cal es el rango de respuestas que estaran incluidos dentro del nivel de confianza (1-). Su frmula es:

El nivel de confianza () es el intervalo en el cual existe una probabilidad 1 - de que est contenido el parmetro p. Este intervalo est comprendido entre +z y z. En la figura 3 podemos ver estas probabilidades y las puntuaciones z que les corresponden.

OPCIN 1. NO EXISTEN ESTUDIOS PREVIOS: En este caso, lo normal es que no se conozca ni la media ni la desviacin tpica de la poblacin, por tanto no tendramos informacin para aplicar la frmula y obtener la varianza. En este caso tendremos que hacer una estimacin de estos valores. Para ello tomaremos una muestra piloto de la poblacin np y sobre esta calcularemos lo que se denomina la cuasi varianza:

Fig. 3
El resto de valores seran los mismos, pero en orden inverso (los valores de p pasaran a ser los de q y al revs, ya que tal y como decamos q=1-p).

Si np 30: es mejor estimar la varianza de la poblacin, mediante la cuasi varianza:


S2n-1=

En la aplicacin de las frmulas para el clculo del tamao de la muestra suele presentarse el problema de determinar el valor de p. Esta dificultad se puede solventar de una de las siguientes formas:

(Xi-X)2 n- 1

la cuasi varianza de la muestra, es un estimador centrado de la varianza de la poblacin. A partir de la cuasi varianza, la varianza se calcula aplicando la siguiente frmula:

Pgina 3 de 7

IT-01 METODOLOGA DE MUESTREO


Dos opciones de respuestas(Ejem: si o no) Varias opciones de respuestas (ejem: valora entre x e y)

OPCIN 1. NO EXISTEN ESTUDIOS PREVIOS: Por la teora de probabilidad se sabe que la suma de probabilidades tiene que ser igual a 1. En el caso que nos ocupa, solo hay dos posibilidades: que dicha variable se d en la poblacin (probabilidad p) o que no se d (probabilidad q). Aplicando lo anterior tendremos que p + q = 1. Como lo que nos interesa son los productos pq, vamos a ver qu valores pueden tomar cada uno de ellos y su producto: Como se puede observar el valor pq ms elevado es el que corresponde a p = q = 0,5. Ese ser el caso ms desfavorable, puesto que al estar en el numerador de ambas frmulas implica que, cuanto ms elevado sea, mayor tendr que ser la muestra, por lo tanto ste ser el valor que se tendr que tomar cuando no se tenga ninguna informacin. A un riesgo = 0,05 le corresponde un valor de z = 1,96 2, si tomamos p = q = 0,5 y sustituyendo estos valores en las frmulas que dan el tamao de la muestra, quedan como sigue: Poblacin finita

Si np > 30: Para valores grandes de np es prcticamente igual, tomar como estimador de la varianza de la poblacin, la varianza o la cuasi varianza de la muestra, es decir la varianza calculada de esta muestra preliminar puede entonces utilizarse en la frmula general. Para conocer cmo es la aplicacin de dicha frmula, pasamos a la Opcin 2. OPCIN 2. EXISTEN ESTUDIOS PREVIOS: Para su aplicacin analizamos una a una las respuestas de las distintas encuestas a cada una de las preguntas. Suponemos una encuesta con un rango de respuesta entre 1 y 4, que en un estudio previo se ha pasado a 5 clientes (n=5). Aplicando la frmula: Suponemos las siguientes respuestas: Cuestion 1: 1, 2, 2, 3, 4 Cuestin 2: Cuest

n=

N i2(N-1)+1

Poblacin infinita

n=

1 i2

Para aplicar la frmula sacamos la media (= sumatorio de las respuestas entre el nmero total de encuestas consideradas) Lo aplicamos para la cuestin 1:

que, aplicndolas para diferentes mrgenes de error, nos permitirn determinar el tamao de la muestra. En el caso de poblaciones muy grandes (superiores a 10.000) y con las condiciones establecidas (riesgo = 0,05; z = 1,96 2; p = q = 0,5), aplicaramos la frmula para poblaciones infinitas, tenemos que, para un margen de error i, el tamao de la muestra es el que se especifica a continuacin:

X=

1+2+2+3+4. 5

= 2,4

Por tanto calculamos la (Xi X)2 para cada una de las respuestas a la cuestin 1, sern: (Xi1-X)2= -1,42=1,96 (Xi2-X)2= -0,42=0,16

Pgina 4 de 7

IT-01 METODOLOGA DE MUESTREO


Dos opciones de respuestas(Ejem: si o no) Varias opciones de respuestas (ejem: valora entre x e y)

(Xi3-X)2= -0,42=0,16 (Xi4-X)2= -0,62=0,36 fig. 4 En el caso de poblaciones finitas, con las condiciones establecidas (riesgo a = 0,05; z = 1,96 2; p = q = 0,5), si aplicamos la frmula anterior, tenemos el tamao de la poblacin para diferentes mrgenes de error, que se indica en la figura 5.
Fig. 5: Determinacin del tamao de la muestra en el caso de poblaciones finitas

(Xi5-X)2= -1,62=2,56 Por tanto:

S 2=

1,96+0,16+0,16+0,36+2,56 5

Con lo que S2=1,04 De este modo, calcularemos la varianza para cada pregunta de nuestra encuesta, tomando el valor ms desfavorable para la aplicacin de la frmula general (segn se trate de poblacin finita o infinita) y obtencin de la muestra representativa n.

NOTA: Los espacios que quedan en blanco en el cuadro es porque los valores que se obtienen son superiores a la mitad de la poblacin. Cuando esto ocurre lo ms aconsejable es coger toda la poblacin directamente, a no ser que hayan razones de otra ndole que aconsejen no trabajar con su totalidad.

OPCIN 2: EXITEN ESTUDIOS ANTERIORES sobre la misma temtica. En estos casos podemos obtener, a travs de ellos, una idea aproximada del valor de p y aplicar la frmula con datos reales.

Pgina 5 de 7

IT-01 METODOLOGA DE MUESTREO


Cmo sacar la muestra:

Generalmente, se distinguen dos tipos de muestras: muestras probabilsticas (aquellas en las que todos los individuos tienen una probabilidad conocida de ser incluidos en la muestra) y muestras no probabilstcas (en las que no se conoce la probabilidad de cada individuo de ser incluido en la muestra). Para seleccionar la muestra se pueden utilizar distintos mtodos o combinaciones de ellos, en funcin del coste y de la precisin que se desee conseguir. Generalizando, podemos decir que cuando se desee calcular los errores de muestreo y el intervalo de confianza en que se mueven las estimaciones, hay que recurrir a las muestras probabilsticas. Cuando las estimaciones no tienen tanta trascendencia, se recurre a las muestras no probabilsticas ya que es ms econmico. Dentro de las muestras probabilsticas, tenemos 4 mtodos: Muestreo aleatorio simple (es el ms utlizado)
Cuando todos los individuos de la poblacin tienen la misma probabilidad de ser elegidos, de acuerdo con las leyes del azar. Se trata de hacer una lista completa de la poblacin, asignar un nmero a cada individuo y, finalmente, mediante una tabla de nmeros aleatorios seleccionar los individuos que van a formar parte de la muestra.

Muestreo, aleatorio sistemtico


Se selecciona al azar al primer individuo, eligindose el resto a intervalos fijos. Para ello se halla el coeficiente de elevacin: N/n (siendo N el tamao de la poblacin y n el tamao de la muestra), se elije, al azar, un nmero no superior al coeficiente de elevacin que ser el nmero a partir del cual se inicia la seleccin. El resto se selecciona sumando sucesivamente el coeficiente de elevacin, al ltimo nmero hallado.

Muestreo aleatorio estratificado


Se clasifica la poblacin en categoras excluyentes. Se elijen, de forma aleatoria, los individuos que previamente se haya determinado en cada categora. Es necesario conocer las fluctuaciones de la varianza dentro de cada categora y entre las distintas categoras, ya que dentro de cada categora la varianza ha de ser la mnima posible, y entre las categoras debe ser la mxima. La distribucin de la muestra entre las diferentes categoras recibe el nombre de afijacin de la muestra y puede hacerse de diferentes formas:

Afijacin simple: a cada categora se le asigna el mismo nmero de individuos, Afijacin proporcional: la asignacin de los individuos a cada categora es proporcional al nmero de individuos que la componen, y Afijacin ptima: el nmero de individuos que se asigna a cada categora est en funcin de la desviacin tpica. As, cuando en una categora la desviacin tpica es muy pequea, nos bastar con una muestra pequea. Cuando la desviacin tpica sea elevada, la muestra deber ser mayor.

Muestreo aleatorio por conglomerados


Es muy similar al anterior. Se divide la poblacin en conglomerados (se agrupa por zonas geogrficas u otras reas de inters para la investigacin) y se selecciona aleatoriamente cules de ellos formarn parte de la muestra. Una vez seleccionados se toman todos los individuos que componen cada conglomerado.

Pgina 6 de 7

IT-01 METODOLOGA DE MUESTREO


Las muestras no probabilsticas pueden realizarse de 3 formas: Muestreo casual
Es la tcnica ms utilizada por las televisiones, radios y empresas de investigacin de mercado. Se trata de entrevistar a personas de forma casual. Generalmente el entrevistador se sita en la calle y pregunta a las personas que pasan cerca de l. Tambin se realiza por telfono.

Muestreo intencional
Se seleccionan casos tpicos de una poblacin, a criterio de un experto.

Muestreo por cuotas


Se le asigna a cada entrevistador un nmero de entrevistas a realizar a personas que renan determinadas caractersticas (por ejemplo: mujeres, entre 20 y 30 aos, casadas).

Pgina 7 de 7

Das könnte Ihnen auch gefallen