Beruflich Dokumente
Kultur Dokumente
Lectura fundamental
Diseños de muestreo
Contenido
1 Diseños muestrales
Antes de comenzar a definir los diseños de muestreo, es conveniente revisar algunos conceptos
fundamentales para la comprensión del tema que permitirán entender el objetivo de la estadística
inferencial y de los procedimientos para la obtención de las muestras.
• Población: se refiere a un conjunto de medidas o recuentos posibles de todas las unidades que
tienen una o varias características en común. La población puede ser finita o infinita según el
número de unidades o elementos que la constituyen.
Asimismo, la población debe estar perfectamente definida en el tiempo y en el espacio. Por
lo tanto, se debe cuidar que el conjunto de elementos que la integran quede delimitado. Por
ejemplo, para hacer un análisis de las pequeñas empresas, se debe especificar cuáles son y en
qué período de tiempo se analizan (pequeñas empresas de la capital del país, en el año 2018).
• Muestra: se trata de un subconjunto de la población que ha sido seleccionado con una técnica
llamada "diseño de muestreo"; se debe garantizar que la muestra sea representativa de la
población, es decir, que las unidades sean seleccionadas aleatoriamente, de tal forma, que cada
una de ellas tenga la misma probabilidad de ser seleccionada.
POLITÉCNICO GRANCOLOMBIANO 2
• Estadística o estadígrafo: se refiere a un número determinado que describe un aspecto
de la muestra; para encontrar su valor es necesario utilizar la información muestral. En los
ejemplos enunciados anteriormente (definición de parámetros), los estadísticos o estadígrafos
corresponderían al puntaje medio obtenido en la prueba de aptitud en la muestra seleccionada
de hombres y mujeres y al porcentaje de productos defectuosos en la muestra seleccionada de
la producción diaria.
• Censo: técnica para obtener los datos por medio de la cual se cuentan todos los elementos que
conforman la población y se registran sus características.
El objetivo de la estadística inferencial es estimar los parámetros de la población a través de los datos
obtenidos en la muestra, la diferencia que se encuentra entre el valor del parámetro de la población y
el valor de la muestra se conoce como error y puede deberse a errores muestrales o no muestrales.
El requisito fundamental de una muestra es que sea representativa de la población que se trata de
describir. Hay, por supuesto, muchas formas de obtener una muestra poco confiable. Una falla
en la representatividad ocurre cuando, por desconocimiento o en forma inadvertida, se toma una
muestra de una población equivocada. Muchas veces hemos escuchado encuestas que presentan a
un candidato como posible ganador en elecciones presidenciales; esta información ha sido recogida
a través de una muestra conformada por habitantes de las clases media y alta de las grandes capitales
del país, pero en los resultados, se evidenció que dicho candidato obtuvo el apoyo de las clases con
menos ingresos, cuyas opciones no se reflejaron en la encuesta.
Otra fuente de error en el muestreo, especialmente en las encuestas de opinión pública, son las
respuestas sesgadas, ocasionadas por cuestionarios mal redactados o mal elaborados que dan lugar a
respuestas que no reflejan las verdaderas opiniones.
Estos tipos de errores se llaman errores no muestrales en los que se incluyen todo tipo de "errores
humanos" tales como, errores en la recolección, en el análisis o publicación de datos, en un
instrumento de medición mal calibrado o en un registro del dato mal escrito.
POLITÉCNICO GRANCOLOMBIANO 3
1.2.2. Errores muestrales
Por otra parte, aun cuando se trate de muestras bien diseñadas y seleccionadas, habrá casos en
donde la muestra no representa de forma adecuada a la población de estudio, simplemente porque
solo representa una parte de esa población. En tales casos, la información contenida en la muestra
puede dar inferencias incorrectas acerca de la población, es decir, puede cometerse un error al
estimar las características de la población sobre la base de la información muestral. Los errores de
esta naturaleza, que representan las diferencias que pueden existir entre un estadístico muestral y el
parámetro poblacional que se está estimando, reciben el nombre de errores muestrales.
Un objetivo fundamental del diseño de muestreo consiste en minimizar tanto los errores muestrales
como los no muestrales. Los errores son costosos, no solo en términos del tiempo y del dinero
invertido en la recolección de las muestras, sino también en términos de la pérdida potencial que
podría provenir de una decisión errónea tomada a partir de una inferencia errónea basada en esos
datos, es por esto que trataremos el problema de determinar el diseño de muestreo que minimice con
mayor efectividad los errores.
• Muestreo por cuotas: se seleccionan elementos de la población hasta cumplir la cuota establecida, de
tal forma que guarde la misma proporción de la población con respecto a la característica de interés. Por
ejemplo, si se sabe que en una población hay un 60% de mujeres y un 40% de hombres y se selecciona
una muestra de 100 personas, esta muestra estará conformada por 60 mujeres y 40 hombres.
POLITÉCNICO GRANCOLOMBIANO 4
• Muestreo por conveniencia: se refiere a la muestra que está disponible en tiempo o el momento
del estudio o la investigación. Por ejemplo, los estudiantes de una clase son seleccionados para
conocer la opinión de los estudiantes de la universidad sobre el servicio de biblioteca.
• Bola de nieve: permite ubicar algunos individuos que pueden ayudar a llegar a otros, luego, estos
a otros hasta obtener una muestra suficiente, se puede pensar en usar la red social de unos
individuos iniciales para que accedan a un colectivo.
En una muestra aleatoria o probabilística, sabemos las posibilidades existentes de que un elemento
de la población figure o no en la muestra. Por eso, se pueden evaluar objetivamente las estimaciones
de las características de la población que resultan de la muestra, es decir, se puede describir
matemáticamente la objetividad de las estimaciones. Se comenzará la explicación de este proceso
describiendo cuatro métodos de muestreo aleatorio:
• Muestreo estratificado
• Muestreo sistemático
Una muestra aleatoria simple es aquella en la cual todos los elementos de la población a muestrear
tienen la misma probabilidad de ser seleccionados. Se puede realizar con reemplazamiento, cuando
una unidad de muestreo es extraída de una población finita y después de registrar sus características
se devuelve a dicha población antes de extraer la siguiente unidad. Si esto no se hace, es decir, una
vez seleccionada la unidad, esta no se regresa a la población, se dice que el muestreo es sin reemplazo.
Tengamos en cuenta, que si en una población finita, el muestreo se hace con reemplazamiento, esta
se vuelve una población infinita. La práctica usual para muestrear poblaciones finitas es muestrear sin
reemplazo, es decir, con un elemento seleccionado que será elegido solo una vez.
POLITÉCNICO GRANCOLOMBIANO 5
»» Selección del muestreo aleatorio simple
El principal requisito para la aplicación de este muestreo es que cada elemento de la población sea
identificable en forma clara y sin ambigüedades, de tal forma que se pueda obtener una lista que
permita identificar de manera única cada elemento. Cuando ya se dispone de esta información y
está completa, pueden numerarse secuencialmente todas las unidades de la lista y puede elegirse
una muestra aplicando un proceso de selección por medio de una tabla de números aleatorios. Se
deben tener tantos números diferentes de esta tabla como los casos que se desean para la muestra,
excluyendo los números que están fuera de la secuencia numérica correspondientes a la población.
Se seleccionan aquellos elementos que correspondan a los números aleatorios que se obtuvieron.
01 15
02 14
03 15
04 18
05 19
06 20
07 13
08 23
09 30
10 35
11 30
12 27
13 25
14 26
15 29
POLITÉCNICO GRANCOLOMBIANO 6
Con el objeto de seleccionar una muestra aleatoria de 5 trabajadores, se procede de la siguiente forma:
1. Se hace una enumeración de cada uno de los elementos de la población, en este caso
de cada trabajador.
2. Para la selección de los elementos que van a conformar la muestra, se utiliza la generación
de números aleatorios de Excel.
POLITÉCNICO GRANCOLOMBIANO 7
Para esto, se elige la función fx y aleatorio entre:
Aquí se genera el primer número aleatorio y el resultado se extiende hasta obtener los cinco
números generados:
POLITÉCNICO GRANCOLOMBIANO 8
Los valores aleatorios corresponden a los datos:
06 20
07 13
08 23
09 30
10 35
11 30
12 27
13 25
14 26
15 29
De esta forma, la muestra seleccionada corresponde a los números aleatorios seleccionados que
aparecen resaltados en la tabla 2 con color rojo.
»» Muestreo estratificado
Este es un segundo tipo de diseño de muestreo que frecuentemente proporciona una cantidad de
información a menor costo que el muestreo aleatorio simple. Este diseño se recomienda cuando la
población la conforma un conjunto de grupos heterogéneos (distintos).
El proceso de estratificación requiere que la población se divida en grupos o estratos con elementos
que son homogéneos dentro de los estratos, donde cada elemento tiene una característica tal que
no le permite pertenecer a otro estrato. Un ejemplo de estratificación es la que encontramos en la
clasificación para el cobro de los servicios públicos, estratos 1,2,3,4,5,6.
POLITÉCNICO GRANCOLOMBIANO 9
El primer paso en la selección consiste en la especificación clara de cada estrato, asociando a
cada elemento de la población uno y solo un estrato. Una vez especificados los estratos, se puede
seleccionar una muestra aleatoria en cada estrato.
N1+N2+……..+ Nk = N
Ejemplo
Suponga que la población de los tiempos de los trabajadores está conformada por los siguientes valores:
19 21 35 15 21 18
17 19 20 32 22 21
34 27 21 19 20 17
21 34 20 20 17 19
25 30 15 19 19 23
28 19 17 18 23 20
32 18 21 30 15 21
25 15 35 31 16 22
32 25 16 20 25 30
25 28 18 25 32 18
POLITÉCNICO GRANCOLOMBIANO 10
N=60, se quiere seleccionar una muestra estratificada de 20 elementos:
MEDIDAS DESCRIPTIVAS
Media 22,66666667
Mediana 21
Moda 19
Curtosis -0,607778895
Rango 20
Mínimo 15
Máximo 35
Suma 1360
Primer cuartil 18
Cuenta 60
POLITÉCNICO GRANCOLOMBIANO 11
Los valores que conforman cada uno de los estratos son:
POLITÉCNICO GRANCOLOMBIANO 12
Tabla 6. Estrato 3: trabajadores que gastan más de 30 minutos
Número
Número Tiempo
aleatorio
1 15 17
2 1 19
3 16 19
4 20 17
5 22 18
6 17 15
7 10 18
POLITÉCNICO GRANCOLOMBIANO 13
Tabla 8. Números aleatorios para estrato 2
Número
Número Tiempo
aleatorio
1 15 20
2 11 21
3 4 25
4 5 25
5 22 21
6 12 20
7 11 21
8 14 20
9 16 25
Número
Número Tiempo
aleatorio
1 2 32
2 8 32
3 9 30
4 1 34
»» Muestreo sistemático
El muestreo sistemático o en serie se usa frecuentemente por ser simple, directo y económico.
Consiste en seleccionar uno a uno, los elementos de la muestra en un orden determinado, con un
comienzo aleatorio.
POLITÉCNICO GRANCOLOMBIANO 14
La fracción (F) de muestreo se establece con la relación:
En general, en el muestreo por conglomerados se obtendrán los resultados más exactos, cuando cada
conglomerado tenga la mezcla más variada posible y al mismo tiempo se asemejen lo más posible entre sí.
Un ejemplo del muestreo por conglomerados se presenta cuando se quiere medir el rendimiento
académico de los universitarios en Colombia. En este caso, cada universidad se puede considerar
como un conglomerado en donde las características son heterogéneas dentro del conglomerado, es
decir, encontramos estudiantes con rendimiento alto, medio y bajo; así también, entre conglomerados
se encuentran condiciones homogéneas o similares para ser comparables. De cada universidad se
selecciona un grupo de estudiantes hasta conformar la muestra definitiva.
POLITÉCNICO GRANCOLOMBIANO 15
En síntesis...
En el manejo de información, el concepto de muestreo es fundamental para la
inferencia estadística; por esto, definir el diseño de muestreo apropiado permite
obtener una muestra representativa, en la cual se disminuye el margen de
incertidumbre al tomar decisiones con base en una parte de la población.
POLITÉCNICO GRANCOLOMBIANO 16
Referencias
Freund, J., Miller, I. & Miller, M. (2000). Estadística Matemática con aplicaciones.
México: Pearson educación.
Gutiérrez, H. & De la Vara, R. (2005). Control estadístico de Calidad y Seis Sigma (6σ).
México: McGrawHill.
Newbold, P. (2012). Estadística para los Negocios y la Economía. Ed. Prentice Hall. Madrid, España
Walpole, R., Myers, R. & Myers, S. (2010). Probabilidad y Estadística para ingenieros.
México: Prentice Hall.
POLITÉCNICO GRANCOLOMBIANO 17
INFORMACIÓN TÉCNICA
POLITÉCNICO GRANCOLOMBIANO 18