Sie sind auf Seite 1von 18

Unidad 1 / Escenario 1

Lectura fundamental

Diseños de muestreo

Contenido

1 Diseños muestrales

Palabras clave: muestreo probabilístico, error de muestreo, estratificado, conglomerados.


1. Diseños muestrales
El objetivo fundamental de la estadística inferencial es trabajar con base en muestras, en el cual los
resultados se generalizan o infieren a una población; el proceso por el que generamos las muestras
se denomina muestreo; por lo tanto, una muestra es una parte de la población que debe ser lo
más representativa posible de esta; así, los diseños de muestreo permiten generar muestras lo más
representativas posibles y se determinan de acuerdo con las características del estudio o de la investigación.

1.1. Conceptos fundamentales

Antes de comenzar a definir los diseños de muestreo, es conveniente revisar algunos conceptos
fundamentales para la comprensión del tema que permitirán entender el objetivo de la estadística
inferencial y de los procedimientos para la obtención de las muestras.

• Población: se refiere a un conjunto de medidas o recuentos posibles de todas las unidades que
tienen una o varias características en común. La población puede ser finita o infinita según el
número de unidades o elementos que la constituyen.
Asimismo, la población debe estar perfectamente definida en el tiempo y en el espacio. Por
lo tanto, se debe cuidar que el conjunto de elementos que la integran quede delimitado. Por
ejemplo, para hacer un análisis de las pequeñas empresas, se debe especificar cuáles son y en
qué período de tiempo se analizan (pequeñas empresas de la capital del país, en el año 2018).

• Parámetro: se relaciona con un número determinado que describe un aspecto de la población;


para determinar su valor es necesario utilizar la información poblacional completa. Por ejemplo:
para determinar si son los hombres o las mujeres los que tienen más aptitud para desempeñar
un cargo en una empresa, es necesario conocer el puntaje promedio de una prueba de aptitud,
o si se quiere determinar el porcentaje de productos defectuosos en la producción diaria en una
empresa, se debe conocer el porcentaje de productos que no cumplen con las especificaciones
en toda la producción del día; entonces, el promedio del puntaje y la porcentaje de productos
defectuosos de los ejemplos mencionados serían los parámetros a seguir.

• Muestra: se trata de un subconjunto de la población que ha sido seleccionado con una técnica
llamada "diseño de muestreo"; se debe garantizar que la muestra sea representativa de la
población, es decir, que las unidades sean seleccionadas aleatoriamente, de tal forma, que cada
una de ellas tenga la misma probabilidad de ser seleccionada.

POLITÉCNICO GRANCOLOMBIANO 2
• Estadística o estadígrafo: se refiere a un número determinado que describe un aspecto
de la muestra; para encontrar su valor es necesario utilizar la información muestral. En los
ejemplos enunciados anteriormente (definición de parámetros), los estadísticos o estadígrafos
corresponderían al puntaje medio obtenido en la prueba de aptitud en la muestra seleccionada
de hombres y mujeres y al porcentaje de productos defectuosos en la muestra seleccionada de
la producción diaria.

• Censo: técnica para obtener los datos por medio de la cual se cuentan todos los elementos que
conforman la población y se registran sus características.

1.2. Tipos de errores en el muestreo

El objetivo de la estadística inferencial es estimar los parámetros de la población a través de los datos
obtenidos en la muestra, la diferencia que se encuentra entre el valor del parámetro de la población y
el valor de la muestra se conoce como error y puede deberse a errores muestrales o no muestrales.

1.2.1. Errores no muestrales

El requisito fundamental de una muestra es que sea representativa de la población que se trata de
describir. Hay, por supuesto, muchas formas de obtener una muestra poco confiable. Una falla
en la representatividad ocurre cuando, por desconocimiento o en forma inadvertida, se toma una
muestra de una población equivocada. Muchas veces hemos escuchado encuestas que presentan a
un candidato como posible ganador en elecciones presidenciales; esta información ha sido recogida
a través de una muestra conformada por habitantes de las clases media y alta de las grandes capitales
del país, pero en los resultados, se evidenció que dicho candidato obtuvo el apoyo de las clases con
menos ingresos, cuyas opciones no se reflejaron en la encuesta.

Otra fuente de error en el muestreo, especialmente en las encuestas de opinión pública, son las
respuestas sesgadas, ocasionadas por cuestionarios mal redactados o mal elaborados que dan lugar a
respuestas que no reflejan las verdaderas opiniones.

Estos tipos de errores se llaman errores no muestrales en los que se incluyen todo tipo de "errores
humanos" tales como, errores en la recolección, en el análisis o publicación de datos, en un
instrumento de medición mal calibrado o en un registro del dato mal escrito.

POLITÉCNICO GRANCOLOMBIANO 3
1.2.2. Errores muestrales

Por otra parte, aun cuando se trate de muestras bien diseñadas y seleccionadas, habrá casos en
donde la muestra no representa de forma adecuada a la población de estudio, simplemente porque
solo representa una parte de esa población. En tales casos, la información contenida en la muestra
puede dar inferencias incorrectas acerca de la población, es decir, puede cometerse un error al
estimar las características de la población sobre la base de la información muestral. Los errores de
esta naturaleza, que representan las diferencias que pueden existir entre un estadístico muestral y el
parámetro poblacional que se está estimando, reciben el nombre de errores muestrales.

Un objetivo fundamental del diseño de muestreo consiste en minimizar tanto los errores muestrales
como los no muestrales. Los errores son costosos, no solo en términos del tiempo y del dinero
invertido en la recolección de las muestras, sino también en términos de la pérdida potencial que
podría provenir de una decisión errónea tomada a partir de una inferencia errónea basada en esos
datos, es por esto que trataremos el problema de determinar el diseño de muestreo que minimice con
mayor efectividad los errores.

1.3. Tipos de muestreo

Se dispone de dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de


juicio y el muestreo aleatorio o probabilístico.

1.3.1. Muestreo no aleatorio

En el muestreo no aleatorio o de juicio, se usa el conocimiento y la opinión personal para identificar


los elementos de la población que van a incluirse en la muestra. Una muestra seleccionada por
muestreo de juicio se basa en el conocimiento de la población por parte de alguien; en ocasiones, este
muestreo sirve como muestra piloto para decidir cómo seleccionar después una muestra aleatoria.
Dentro de los muestreos no aleatorios tenemos:

• Muestreo por cuotas: se seleccionan elementos de la población hasta cumplir la cuota establecida, de
tal forma que guarde la misma proporción de la población con respecto a la característica de interés. Por
ejemplo, si se sabe que en una población hay un 60% de mujeres y un 40% de hombres y se selecciona
una muestra de 100 personas, esta muestra estará conformada por 60 mujeres y 40 hombres.

POLITÉCNICO GRANCOLOMBIANO 4
• Muestreo por conveniencia: se refiere a la muestra que está disponible en tiempo o el momento
del estudio o la investigación. Por ejemplo, los estudiantes de una clase son seleccionados para
conocer la opinión de los estudiantes de la universidad sobre el servicio de biblioteca.

• Bola de nieve: permite ubicar algunos individuos que pueden ayudar a llegar a otros, luego, estos
a otros hasta obtener una muestra suficiente, se puede pensar en usar la red social de unos
individuos iniciales para que accedan a un colectivo.

1.3.2. Muestreo probabilístico

En una muestra aleatoria o probabilística, sabemos las posibilidades existentes de que un elemento
de la población figure o no en la muestra. Por eso, se pueden evaluar objetivamente las estimaciones
de las características de la población que resultan de la muestra, es decir, se puede describir
matemáticamente la objetividad de las estimaciones. Se comenzará la explicación de este proceso
describiendo cuatro métodos de muestreo aleatorio:

• Muestreo aleatorio simple

• Muestreo estratificado

• Muestreo sistemático

• Muestreo por conglomerados

»» Muestreo aleatorio simple

Una muestra aleatoria simple es aquella en la cual todos los elementos de la población a muestrear
tienen la misma probabilidad de ser seleccionados. Se puede realizar con reemplazamiento, cuando
una unidad de muestreo es extraída de una población finita y después de registrar sus características
se devuelve a dicha población antes de extraer la siguiente unidad. Si esto no se hace, es decir, una
vez seleccionada la unidad, esta no se regresa a la población, se dice que el muestreo es sin reemplazo.
Tengamos en cuenta, que si en una población finita, el muestreo se hace con reemplazamiento, esta
se vuelve una población infinita. La práctica usual para muestrear poblaciones finitas es muestrear sin
reemplazo, es decir, con un elemento seleccionado que será elegido solo una vez.

En el muestreo aleatorio simple, las unidades de muestreo se eligen individualmente y directamente


por medio de un proceso aleatorio (por medio de las tablas de números aleatorios).

POLITÉCNICO GRANCOLOMBIANO 5
»» Selección del muestreo aleatorio simple

El principal requisito para la aplicación de este muestreo es que cada elemento de la población sea
identificable en forma clara y sin ambigüedades, de tal forma que se pueda obtener una lista que
permita identificar de manera única cada elemento. Cuando ya se dispone de esta información y
está completa, pueden numerarse secuencialmente todas las unidades de la lista y puede elegirse
una muestra aplicando un proceso de selección por medio de una tabla de números aleatorios. Se
deben tener tantos números diferentes de esta tabla como los casos que se desean para la muestra,
excluyendo los números que están fuera de la secuencia numérica correspondientes a la población.
Se seleccionan aquellos elementos que correspondan a los números aleatorios que se obtuvieron.

Este procedimiento se muestra con el siguiente ejemplo:

Suponga una población hipotética de 15 trabajadores y su tiempo (en minutos) en la realización de un


proceso, cuyos datos se observan en la tabla 1.

Tabla 1. Ejemplo de muestreo aleatorio simple

Número Tiempo (minutos)

01 15
02 14
03 15
04 18
05 19
06 20
07 13
08 23
09 30
10 35
11 30
12 27
13 25
14 26
15 29

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 6
Con el objeto de seleccionar una muestra aleatoria de 5 trabajadores, se procede de la siguiente forma:

1. Se hace una enumeración de cada uno de los elementos de la población, en este caso
de cada trabajador.

2. Para la selección de los elementos que van a conformar la muestra, se utiliza la generación
de números aleatorios de Excel.

Figura 1. Pantallazo formato en Excel del paso 1 generación números aleatorios


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 7
Para esto, se elige la función fx y aleatorio entre:

Figura 2. Pantallazo del paso 2, definición de rango de valores


Fuente: elaboración propia

Aquí se genera el primer número aleatorio y el resultado se extiende hasta obtener los cinco
números generados:

Figura 3. Pantallazo del paso 3, números aleatorios generados


Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 8
Los valores aleatorios corresponden a los datos:

Tabla 2. Números aleatorios para la selección de la muestra

Número Tiempo (minutos)


01 15
02 14
03 15
04 18
05 19

06 20
07 13
08 23
09 30
10 35
11 30
12 27
13 25
14 26
15 29

Fuente: elaboración propia

De esta forma, la muestra seleccionada corresponde a los números aleatorios seleccionados que
aparecen resaltados en la tabla 2 con color rojo.

»» Muestreo estratificado

Este es un segundo tipo de diseño de muestreo que frecuentemente proporciona una cantidad de
información a menor costo que el muestreo aleatorio simple. Este diseño se recomienda cuando la
población la conforma un conjunto de grupos heterogéneos (distintos).

El proceso de estratificación requiere que la población se divida en grupos o estratos con elementos
que son homogéneos dentro de los estratos, donde cada elemento tiene una característica tal que
no le permite pertenecer a otro estrato. Un ejemplo de estratificación es la que encontramos en la
clasificación para el cobro de los servicios públicos, estratos 1,2,3,4,5,6.

Para la selección de una muestra estratificada, se usa el procedimiento de muestreo proporcional,


en el que se divide el tamaño de la muestra en forma proporcional al tamaño de los estratos.

POLITÉCNICO GRANCOLOMBIANO 9
El primer paso en la selección consiste en la especificación clara de cada estrato, asociando a
cada elemento de la población uno y solo un estrato. Una vez especificados los estratos, se puede
seleccionar una muestra aleatoria en cada estrato.

En el muestreo proporcional, el tamaño de la muestra n se divide en un tamaño de muestra para cada


uno de los estratos de manera que n = n1 + n2 +….+ nk con cada ni determinada por la siguiente fórmula:

Donde Ni es el tamaño del estrato i

N1+N2+……..+ Nk = N

Donde N es el tamaño de la población.

Ejemplo

Suponga que la población de los tiempos de los trabajadores está conformada por los siguientes valores:

Tabla 3. Ejemplo muestreo estratificado

19 21 35 15 21 18
17 19 20 32 22 21
34 27 21 19 20 17
21 34 20 20 17 19
25 30 15 19 19 23
28 19 17 18 23 20
32 18 21 30 15 21
25 15 35 31 16 22
32 25 16 20 25 30
25 28 18 25 32 18

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 10
N=60, se quiere seleccionar una muestra estratificada de 20 elementos:

Algunas medidas descriptivas obtenidas con los datos son:

MEDIDAS DESCRIPTIVAS

Media 22,66666667

Error típico 0,745482313

Mediana 21

Moda 19

Desviación estándar 5,774481169

Varianza de la muestra 33,34463277

Curtosis -0,607778895

Coeficiente de asimetría 0,729904373

Rango 20

Mínimo 15

Máximo 35

Suma 1360

Terer cuartil 26,5

Primer cuartil 18

Cuenta 60

Se divide la población en tres estratos de la siguiente forma:

Estrato 1: trabajadores que gastan menos de 20 minutos

Estrato 2: trabajadores que gastan entre 20 y 30 minutos

Estrato 3: trabajadores que gastan más de 30 minutos

POLITÉCNICO GRANCOLOMBIANO 11
Los valores que conforman cada uno de los estratos son:

Tabla 4. Estrato 1: trabajadores que gastan menos de 20 minutos

Número Tiempo Número Tiempo Número Tiempo


1 19 9 16 17 15
2 17 10 18 18 16
3 19 11 15 19 18
4 19 12 19 20 17
5 18 13 19 21 19
6 15 14 18 22 18
7 15 15 17
8 17 16 19

Fuente: elaboración propia

Tabla 5. Estrato 2: trabajadores que gastan entre 20 y 30 minutos

Número Tiempo Número Tiempo Número Tiempo


1 21 10 20 19 20
2 25 11 21 20 23
3 28 12 20 21 25
4 25 13 21 22 21
5 25 14 20 23 23
6 21 15 20 24 20
7 27 16 25 25 20
8 25 17 21 26 21
9 28 18 22

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 12
Tabla 6. Estrato 3: trabajadores que gastan más de 30 minutos

Número Tiempo Número Tiempo Número Tiempo


1 34 5 30 9 30
2 32 6 35 10 31
3 32 7 35 11 32
4 34 8 32 12 30

Fuente: elaboración propia

El tamaño de muestra correspondiente a cada estrato es:

Se utiliza la generación de números aleatorios utilizando la función de Excel en cada estrato:

Tabla 7. Números aleatorios para estrato 1

Número
Número Tiempo
aleatorio
1 15 17
2 1 19
3 16 19
4 20 17
5 22 18
6 17 15
7 10 18

Fuente: elaboración propia

POLITÉCNICO GRANCOLOMBIANO 13
Tabla 8. Números aleatorios para estrato 2

Número
Número Tiempo
aleatorio
1 15 20
2 11 21
3 4 25
4 5 25
5 22 21
6 12 20
7 11 21
8 14 20
9 16 25

Fuente: elaboración propia

Tabla 9. Números aleatorios para estrato 3

Número
Número Tiempo
aleatorio
1 2 32
2 8 32
3 9 30
4 1 34

Fuente: elaboración propia

»» Muestreo sistemático

El muestreo sistemático o en serie se usa frecuentemente por ser simple, directo y económico.
Consiste en seleccionar uno a uno, los elementos de la muestra en un orden determinado, con un
comienzo aleatorio.

POLITÉCNICO GRANCOLOMBIANO 14
La fracción (F) de muestreo se establece con la relación:

Suponga que N= 1000 y n = 100, entonces, la fracción de muestreo es:

El primer elemento se selecciona aleatoriamente en el intervalo 0 a 10; por ejemplo, resultó


seleccionado el número 5, el segundo elemento que se seleccionará será 15, luego 25 y así
sucesivamente, ya que la fracción de muestreo es 10.

»» Muestreo por conglomerados

El muestreo por conglomerados se refiere al procedimiento de dividir la población en grupos, de tal


forma que los elementos de cada conglomerado sean lo más heterogéneos posible, mientras que entre
conglomerados haya mayor homogeneidad; contrario al proceso del muestreo estratificado.

En general, en el muestreo por conglomerados se obtendrán los resultados más exactos, cuando cada
conglomerado tenga la mezcla más variada posible y al mismo tiempo se asemejen lo más posible entre sí.

Un ejemplo del muestreo por conglomerados se presenta cuando se quiere medir el rendimiento
académico de los universitarios en Colombia. En este caso, cada universidad se puede considerar
como un conglomerado en donde las características son heterogéneas dentro del conglomerado, es
decir, encontramos estudiantes con rendimiento alto, medio y bajo; así también, entre conglomerados
se encuentran condiciones homogéneas o similares para ser comparables. De cada universidad se
selecciona un grupo de estudiantes hasta conformar la muestra definitiva.

POLITÉCNICO GRANCOLOMBIANO 15
En síntesis...
En el manejo de información, el concepto de muestreo es fundamental para la
inferencia estadística; por esto, definir el diseño de muestreo apropiado permite
obtener una muestra representativa, en la cual se disminuye el margen de
incertidumbre al tomar decisiones con base en una parte de la población.

POLITÉCNICO GRANCOLOMBIANO 16
Referencias
Freund, J., Miller, I. & Miller, M. (2000). Estadística Matemática con aplicaciones.
México: Pearson educación.

Gutiérrez, H. & De la Vara, R. (2005). Control estadístico de Calidad y Seis Sigma (6σ).
México: McGrawHill.

Kennet, R., Zacks, S. (2010). Estadística Industrial Moderna. México: Ed Thomsom

Montgomery, C. & Runger, G.C. (2012). Probabilidad y Estadística aplicadas a la Ingeniería.


México: Limusa Wiley.

Newbold, P. (2012). Estadística para los Negocios y la Economía. Ed. Prentice Hall. Madrid, España

Walpole, R., Myers, R. & Myers, S. (2010). Probabilidad y Estadística para ingenieros.
México: Prentice Hall.

POLITÉCNICO GRANCOLOMBIANO 17
INFORMACIÓN TÉCNICA

Módulo: Estadística Inferencial


Unidad 1: Muestreo y distribuciones muestrales
Escenario 1: Diseños de muestreo

Autor: Patricia Castillo Garzón

Asesor Pedagógico: Amparo Sastoque


Diseñador Gráfico: Julieth Rodríguez
Asistente: Eveling Peñaranda

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 18

Das könnte Ihnen auch gefallen