Sie sind auf Seite 1von 13

UNIDAD I TEORIA DEL MUESTREO

Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio. Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma. Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto observa. Una muestra es un subconjunto de observaciones seleccionadas de una poblacin. Muestras Aleatorias Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente. A continuacin se ver algunos usos del muestreo en diversos campos:

1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinin pblica y el apoyo en las elecciones. 2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para determinar la eficiencia de una tcnica o programa de enseanza. 3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad. 4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la eficacia de una tcnica o de un frmaco nuevo. 5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los efectos de un fertilizante nuevo. 6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional. Errores en el Muestreo Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales, o parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral. El error muestral se refiere a la variacin natural existente entre muestras tomadas de la misma poblacin. Cuando una muestra no es una copias exacta de la poblacin; an si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamao sean representativas de una cierta poblacin, no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es un concepto importante que ayudar a entender mejor la naturaleza de la estadstica inferencial. Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominan errores no muestrales. El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro real. El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin. La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin en el que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria. Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico. Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple. Ejemplo 1.1

Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un procedimiento ms simple para elegir una muestra aleatoria sera escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y despus extraer cinco papeles al mismo tiempo. Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la tabla, se regresa al recipiente y despus de revolver otra vez se selecciona la seguida tira que determina el segundo nmero de la tabla; el proceso contina hasta obtener una tabla de dgitos aleatorios con tantos nmeros como se desee. Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico, imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para las encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera muy costoso o tardado. El muestreo estratificado requiere de separar a la poblacin segn grupos que no se traslapen llamados estratos, y de elegir despus una muestra aleatoria simple en cada estrato. La informacin de las muestras aleatorias simples de cada estrato constituira entonces una muestra global. Ejemplo 1.2 Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran universidad. Puede ser difcil obtener una muestra con todos los profesores, as que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento acadmico; los estratos vendran a ser los colegios, o departamentos acadmicos. El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la poblacin pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son usualmente heterogneos o dismiles. Ejemplo 1.3 Suponga que una compaa de servicio de televisin por cable est pensando en abrir una sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el porcentaje de familias que utilizaran sus servicios, como no es prctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado. En el muestreo por conglomerados, stos se forman para representar, tan fielmente como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por conglomerados.

El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin aleatoria inicial de observaciones seguida de otra seleccin de observaciones obtenida usando algn sistema o regla. Ejemplo 1.4 Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede obtenerse primero una muestra aleatoria de los nmeros de las pginas del directorio telefnico; al elegir el vigsimo nombre de cada pgina obtendramos un muestreo sistemtico, tambin podemos escoger un nombre de la primera pgina del directorio y despus seleccionar cada nombre del lugar nmero cien a partir del ya seleccionado. Por ejemplo, podramos seleccionar un nmero al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio que corresponden a los nmeros 40, 140, 240, 340 y as sucesivamente. Error Muestral Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media poblacional , entonces la media muestral, como medida, conlleva algn error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una poblacin con media = 15: si la media de la muestra es x=12, entonces a la diferencia observada x- = -3 se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos cantidades, la media poblacional y el error muestral; si e denota el error muestral, entonces:

Ejemplo 1.5 Se toman muestras de tamao 2 de una poblacin consistente en tres valores, 2, 4 y 6, para simular una poblacin "grande" de manera que el muestreo pueda realizarse un gran nmero de veces, supondremos que ste se hace con reemplazo, es decir, el nmero elegido se reemplaza antes de seleccionar el siguiente, adems, se seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccion primero 4 y despus 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamao 2 que es posible seleccionar con reemplazo y tambin contiene las medioas muestrales y los correspondientes errores muestrales. La media poblacional es igual a = (2+4+6)/3 = 4. Ver la tabla en la siguiente pgina. Notese las interesantes relaciones siguientes contenidas en la tabla: La media de la coleccin de medias muestrales es 4, la media de la poblacin de la que se extraen las muestras. Si x denota la media de todas las medias muestrales entonces tenemos: x = (3+4+3+4+5+5+2+4+6)/9 = 4 La suma de los errores muestrales es cero. e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0

Muestras ordenadas (2,2) (2,4) (2,6) (4,2) (4,4) (4,6) (6,2) (6,4) (6,6)

x 2 3 4 3 4 5 4 5 6

Error muestral e = x 2 4 = -2 3 4 = -1 44=0 3 4 = -1 44=0 54=1 44=0 54=1 64=2 , el promedio de

En consecuencia, si x se usa para medir, estimar, la media poblacional todos los errores muestrales es cero. Distribuciones Muestrales

Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propia, impredecibles. No se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando estadsticas muestrales. Como el anlisis de las distribuciones asociadas con los estadsticos muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para hacer inferencias sobre un parmetro poblacional desconocido. Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribucin de frecuencias. La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En general, la distribucin muestral de un estadstico es la de todos sus valores posibles calculados a partir de muestras del mismo tamao. Suponga que se han seleccionado muestras aleatorias de tamao 20 en una poblacin grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la siguiente figura:

Suponga que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la siguiente figura:

Ejemplo 1.6 Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6. Encuentre: , la media poblaciona. , la desviacin estndar poblacional.
x,

la media de la distribucin muestral de medias. , la desviacin estndar de la distribucin muestral de medias.

Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias. Solucin: a. La media poblacional es:

b. La desviacin estndar de la poblacin es:

c. A continuacin se listan los elementos de la distribucin muestral de la media y la correspondiente distribucin de frecuencias.

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

De aqu que podamos deducir que: Como para cualquier variable aleatoria, la dsitribucin muestral de medias tiene una media o valor esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin muestral de medias tiene una media igual a la media poblacional. Esto es:

Distribuciones muestrales Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles a stas su estadstico. Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada. Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser normal. Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma de la disitribucin muestral de medias sea aproximadamente normal, an en casos donde la poblacin original es bimodal, es realmente notable.

2.- Tipos de muestreo

Los autores proponen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos.

2.1.- Mtodos de muestreo probabilsticos


Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes tipos: 2.1.1.- Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. 2.1.2.- Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k=N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo se este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. 2.1.3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (tamao geogrfico, sexos, edades,...). La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos: Afijacin Simple: A cada estrato le corresponde igual nmero de elementos muestrales. Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato.

Afijacin Optima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin.

Supongamos que estamos interesados en estudiar el grado de aceptacin que la implantacin de la reforma educativa ha tenido entre los padres de una determinada provincia. A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los 10000 nios escolarizados en las edades que nos interesan, 6000 acuden a colegios pblicos, 3000 a colegios privados concertados y 1000 a colegios privados no concertados. Como estamos interesados en que en nuestra muestra estn representados todos los tipos de colegio, realizamos un muestreo estratificado empleando como variable de estratificacin el tipo de centro. Si empleamos una afijacin simple elegiramos 200 nios de cada tipo de centro, pero en este caso parece ms razonable utilizar una afijacin proporcional pues hay bastante diferencia en el tamao de los estratos. Por consiguiente, calculamos que proporcin supone cada uno de los estratos respecto de la poblacin para poder reflejarlo en la muestra. Colegios pblicos: 6000/10000=0.60 Colegios privados concertados: 3000/10000=0.30 Colegios privados no concertados: 1000/10000=0.10 Para conocer el tamao de cada estrato en la muestra no tenemos ms que multiplicar esa proporcin por el tamao muestral. Colegios pblicos: 0.60x600=360 sujetos Colegios privados concertados: 0.30x600=180 sujetos Colegios privados no concertados: 0.10x600= 60 sujetos 2.1.4.- Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades muestrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc, son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son rea geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos.

En una investigacin en la que se trata de conocer el grado de satisfaccin laboral los profesores de instituto necesitamos una muestra de 700 sujetos. Ante la dificultad de acceder individualmente a estos sujetos se decide hacer una muestra por conglomerados. Sabiendo que el nmero de profesores por instituto es aproximadamente de 35, los pasos a seguir seran los siguientes: 1. Recoger un listado de todos los institutos. 2. Asignar un nmero a cada uno de ellos. 3. Elegir por muestreo aleatorio simple o sistemtico los 20 institutos (700/35=20) que nos proporcionarn los 700 profesores que necesitamos.

Para finalizar con esta exposicin de los mtodos de muestreo probabilsticos es necesario comentar que ante lo compleja que puede llegar a ser la situacin real de muestreo con la que nos enfrentemos es muy comn emplear lo que se denomina muestreo polietpico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada una de ellas el mtodo de muestreo probabilstico ms adecuado.

2.2.- Mtodos de muestreo no probabilsticos


A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. 2.2.1.- Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin. Por ejemplo, la Consejera de Sanidad desea estudiar la incidencia de las drogas en la adolescencia. Lo que deberamos hacer sera: conocer por los informes de la Consejera de Educacin cuales son los centros ms afectados por el problema, fijar un nmero de sujetos a entrevistar proporcional a cada uno de los estratos (cuotas) y finalmente dejar en manos de los responsables del trabajo de campo a que sujetos concretos se deber entrevistar. 2.2.2.- Muestreo opintico o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. 2.2.3.- Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios. 2.2.4.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

Tipos de muestreo

12.1

Introduccin

La Estadstica inferencial se ocupa de extender o extrapolar a toda una poblacin , informaciones obtenidas de una muestra , as como de la toma de decisiones. Poblacin Es el conjunto total de individuos susceptibles de poseer la informacin buscada. No se refiere exclusivamente a personas, la poblacin puede estar formada por todos los rboles de un bosque. Muestra Es la parte de la poblacin en la que se miden las caractersticas estudiadas. El nmero de individuos de la muestra se llama tamao de la muestra. Muestreo Es el proceso seguido para la extraccin de una muestra. Encuesta Es el proceso de obtener la informacin buscada entre los elementos de la muestra.

Tipos de muestreo
No aleatorios - Se eligen los elementos, en funcin de que sean representativos, segn la opinin del investigador. Aleatorios - Todos los miembros de la muestra han sido elegidos al azar, de forma que cada miembro de la poblacin tuvo igual oportunidad de salir en la muestra.

Simple: elegido el tamao n de la muestra, los elementos que la compongan se han de elegir aleatoriamente entre los N de la poblacin. Con calculadora: se utilizan los nmeros aleatorios.
o

Sistemtico: se ordenan previamente los individuos de la poblacin; despus se elige uno de ellos al azar, a continuacin, a intervalos constantes, se eligen todos los dems hasta completar la muestra. Estratificado: se divide la poblacin total en clases homogneas, llamadas estratos; por ejemplo, por grupos de edades, por sexo. Hecho esto la muestra se escoge aleatoriamente en nmero proporcional al de los componentes de cada clase o estrato.

Ejemplos

Das könnte Ihnen auch gefallen