You are on page 1of 15

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE HUMANIDADES Y EDUCACIÓN

ESCUELA DE PSICOLOGÍA

CÁTEDRA DE ESTADÍSTICA

MUESTREO

Profesora María Fátima Dos Santos


Año 2009

Este capítulo forma parte del material “TÓPICOS FUNDAMENTALES EN LA CONSTRUCCIÓN


DE INSTRUMENTOS EN PSICOLOGÍA”, actualmente en desarrollo
PARTE V: MUESTREO

En sentido general, el muestreo consiste en la selección de ciertos individuos, los


cuales son estudiados en profundidad, a partir de un conjunto más amplio de individuos. El
término “individuo” no se refiere solo a sujetos humanos, sino también a animales, objetos
inanimados e incluso intervalos de tiempo. Al conjunto seleccionado se le denomina
“muestra” y al conjunto mayor “población”.

Siguiendo a Azorín (que cita el diccionario de términos estadísticos de Kendall y


Buckland), se denomina población o universo a cualquier colección finita o infinita de
individuos o elementos. En ciertos libros se hace una distinción entre “universo” y
“población”, siendo el primero el conjunto físico de sujetos u objetos disponibles, y el
segundo los valores obtenidos de la medición de determinadas variables en ellos. Por
ejemplo, del conjunto de los estudiantes de una universidad (que podría verse como el
universo), podrían medirse la variable edad, y el conjunto de números derivados de esta
medición sería llamado “población”. La población puede tener una sola dimensión (como
en el caso señalado) o varias (si midiéramos, por ejemplo, edad, sexo, circunsferencia
cráneo-encefálica, etc).

Cada vez con mayor frecuencia se usan como sinónimos los términos universo y
población.

Según Azorín (citando nuevamente el diccionario de términos estadísticos de


Kendall y Buckland), se llama”muestra” a una parte de la población o aun subconjunto de
un conjunto de unidades obtenidas con el fin de investigar las propiedades de la población o
conjunto de procedencia. A diferencia de la muestra, el censo evalúa a toda la población.

1
1. Ventajas del Muestreo

El muestreo presenta muchas ventajas, por lo cual es un método de investigación


ampliamente utilizado. Algunas de las ventas de trabajar con muestras son:

a) Si la población es infinita (o extremadamente grande), puede resultar imposible,


por razones de tiempo o recursos, obtener información de todos sus miembros.
Para poblaciones finitas, es sin duda más económico, y más manejable en
términos de tiempo, trabajar con muestras en lugar de poblaciones.
b) Si la población es suficiente uniforme en las variables estudiadas, proporcionaría
poca información adicional recabar información de todos sus miembros.
c) Si el proceso de medición es destructivo, se debe minimizar el daño generado.
Por ejemplo, se toman muestras de sangre para evaluar la totalidad del fluido, y
no se extrae la totalidad del fluido, pues mataríamos al individuo.
d) Se puede controlar mejor la calidad cuando nos focalizamos en una muestra que
en una población, y también entrenar mejor a los miembros del equipo, corregir
problemas que ocurran en el campo, etc. (FALTAN. REVISAR BABBIT)

2. Unidades Estadísticas

Las unidades estadísticas pueden ser vistas, en términos muy generales, como
divisiones que se establecen sobre el campo o la data lograda a partir de él. Las siguientes
unidades estadísticas resultan relevantes:

a) Unidad de investigación: Contiene las partes que se van a analizar. Por ejemplo,
en un estudio antropométrico que mida la longitud de los huesos del cuerpo
humano, la unidad de investigación es el individuo. En una investigación que
indague los principales problemas de los kioscos de un municipio, la unidad de
investigación es el municipio.
b) Unidad de análisis: Es la unidad que se examina y de la cual se extrae la
información, y sobre la cual se hacen los reportes estadísticos. En el estudio

2
antropométrico que referíamos, la unidad de análisis es cada hueso (colecciones
de data para el tarso, el metatarso, el fémur, etc, vistas por separado). En nuestro
otro ejemplo, la unidad de análisis es el kiosco.
c) Unidad de observación: Es la unidad a través de la cual se obtiene la
información, el “reportante”. En el estudio antropométrico que hemos citado, la
unidad de observación coincide con la de análisis, mientras que en el estudio
entre kioscos, el kiosquero es la unidad de observación.
d) Unidad de muestreo: Es un listado con los miembros de la población que pueden
pasar a formar parte de la muestra. Algunos de los elementos de este listado
compondrán la muestra, y otros serán desechados. Por ejemplo, en un estudio
antropométrico, la unidad de muestreo son todos los sujetos humanos. En el
estudio de kioscos, la unidad de muestreo es un listado con todos los kioscos de
un municipio.

Pueden darse diferentes combinaciones de unidades estadísticas. Veamos ejemplos:


Caso Unidad de Unidad de Unidad de Análisis Unidad de
Muestreo Investigación Observación
Encuesta en hogares en Hogares de la Hogares de la Hogares de la ciudad Jefe de Hogar
Caracas, que indaga el ciudad de Caracas ciudad de Caracas de Caracas
gasto promedio en
alimentos, bebidas, etc
Encuesta en hogares, Hogares de la Muestra de Muestra de Cualquiera de los
indagando situación ciudad de Caracas individuos de la individuos de la miembros del
laboral de cada miembro ciudad de Caracas ciudad de Caracas hogar, que reporta
del mismo la situación de los
demás
Tipo de cambio mensual Países de Promedio mensual Meses (enfoque Reporte mensual
promedio (precio del Latinoamérica del tipo de cambio longitudinal) o de Banco Central
dólar) de los países para cada país países (enfoque de cada país
Latinoamericanos Latinoamericano transversal)
Tasa de envases plásticos Envases que salen Fábricas Envases que salen de Envases que salen
deteriorados en fábricas de de la línea de la línea de de la línea de
plástico producción de cada producción de cada producción de cada
fábrica, tomados fábrica, tomados fábrica, tomados
cada 10 minutos cada 10 minutos cada 10 minutos
Hábitos de sueño de niños Hogares de Niños menores a 1 Niños menores a 1 Madres o
con edades menores a 1 Valencia, con año año cuidadoras de los
año, de la ciudad de niños menores a 1 niños menores a 1
Valencia año año
Encuestas telefónicas Jóvenes de 18 a 24 Jóvenes de 18 a 24 Jóvenes de 18 a 24 Jóvenes de 18 a 24
sobre preferencias en años de la ciudad años de la ciudad años de la ciudad de años de la ciudad
sabores de pizza, entre de Maturín de Maturín Maturín de Maturín
jóvenes de 18 a 24 años de
la ciudad de Maturín

3
Esta diferenciación puede resultar en ocasiones algo compleja. Lo que es necesario
es entender que en ocasiones existen diferentes niveles: un elemento sirve para seccionar la
población, de otro elemento se obtiene la información, y los resultados dan cuenta de otro
elemento más. Sobre todo, es fundamental diferenciar la unidad de análisis, la de muestreo
y la de información, porque es bastante frecuente que no sean la misma.

3. Tipos de Muestreo

Las diferentes técnicas de muestreo existentes pueden clasificarse (Azorín, 1969) en


tres grandes tipos:

Probabilístico: Cuando puede calcularse la probabilidad de determinado elemento


de llegar a ser seleccionado. Aunque usualmente la aleatorización está asociada a estas
técnicas de muestreo en algún nivel, no es conveniente equiparar el muestreo probabilístico
al muestreo aleatorio. Éste es un caso especial de aquél.

Intencional u opinático: El investigador selecciona la muestra usando criterios


subjetivos en los que con frecuencia opera la casualidad. (Por ejemplo, las encues tas por
intercepción a la salida del Metro).

Muestreo sin norma: No existe un protocolo para la selección de la muestra, y


cualquier muestra se considera representativa de la población. Es adecuado para
poblaciones homogéneas (por ejemplo, en una fábrica de palillos, cualquier muestra de
palillos puede ser utilizada para evaluar la calidad).

A continuación veremos algunos procedimientos específicos de muestreo


enmarcados dentro de estos tres grandes tipos.

4
3.1. Muestreos Probabilísticos

3.1.1. Muestreo Aleatorio con Reemplazamiento o de Poblaciones Infinitas

En este tipo de muestreo se puede dar una de las dos siguientes condiciones, que se
consideran equivalentes.

a) La población es suficientemente grande como para considerarla infinita, lo cual,


técnicamente, significa decir que la extracción de un elemento de dicha
población no afectaría de manera importante la probabilidad de extracción de
los siguientes elementos. Por ejemplo, en una población de 100.000 sujetos, la
probabilidad de extracción de un sujeto determinado es de 1/100.000. Una vez
extraído este sujeto, si no se repone (es decir, si se le excluye de la lista de
sujetos disponibles), la probabilidad de cada uno de los sujetos restantes sería
de 1/99.999, lo cual no representa una variación importante.

b) Efectivamente se produce la reposición, es decir, una vez seleccionado un


determinado elemento, este es devuelto a la lista de elementos disponibles para
ser seleccionados. Difícilmente se haría esto cuando se trabaja con poblaciones
humanas, pero es fácil imaginarlo si estamos haciendo control de calidad de,
por ejemplo, un saco de zanahorias: una vez medida una determinada
zanahoria, esta puede ser regresada al saco, por lo cual puede ser seleccionada
nuevamente. No importa la cantidad de zanahorias presentes en el saco, esto
hace que la población sea virtualmente infinita.

3.1.2. Muestreo Aleatorio sin Reemplazamiento o de Poblaciones Finitas

Todas la unidades de la población tienen la misma probabilidad de ser


seleccionadas, pero una vez que una unidad es retirada, no puede volver a ser seleccionada,
5
lo cual aumenta la probabilidad de las restantes de ser seleccionadas. Por ejemplo,
supongamos una fiesta en el siglo XIX. Si hay cinco muchachas en dicha fiesta, una vez
que una de ellas es pedida para bailar, la probabilidad de las restantes de ser pedidas para
ese mismo baile es de 1/4, es decir, que la primera muchacha salga a bailar aumenta la
probabilidad de las siguientes de ser pedidas.

3.1.3. Muestreo Estratificado Aleatorio (o Muestreo Estratificado con Llenado Aleatorio de


las Cuotas)

El muestreo estratificado consiste en segmentar la muestra de determinada manera,


generalmente tomando en cuenta información que se conoce de la población, derivada de
alguna investigación anterior. Por ejemplo, se sabe que en una población de pelotas de tenis
un 20% son Spalding y el resto marca Truculenta, el investigador podría decidir garantizar
que en una muestra de esta población de n=40 pelotas, 8 sean Spalding (o sea, el 20%) y 32
Truculenta (es decir, 80%). Si, luego de definir este número, el investigador selecciona las
pelotas con un procedimiento aleatorio, el muestreo se considera también aleatorio. (Si el
investigador selecciona las pelotas que le quedan más cerca, se trataría de un muestreo
intencional).

El reparto del tamaño de la muestra entre los diferentes segmentos suele ser llamado
afijación, de la cual hay tres tipos notables:

a) Afijación igual o uniforme: se distribuye la muestra por igual entre todos los grupos
conformados

b) Afijación proporcional: se distribuye la muestra replicando la distribución de la


población en determinadas variables (en ese caso se dice “afijación proporcional por
la variable XXX, YYY, etc)

c) Afijación óptima: se reparte la muestra asignando más peso a los grupos que
presenten mayor varianza en la población.

6
A continuación se ilustra la definición de cuotas en un muestreo estratificado para una
muestra de 200 sujetos. Si el muestreo es aleatorio, estas 200 personas deben ser
conseguidas al azar:

POBLACIÓN MUESTRA (n=200)


Rango de edad % Rango de edad %
18 a 24 años 25 18 a 24 años 50
25 a 35 años 21 25 a 35 años 42
36 a 45 años 18 36 a 45 años 36
46 a 55 años 15 46 a 55 años 30
56 a 65 años 9 56 a 65 años 18
Más de 65 años 12 Más de 65 años 24

3.1.4. Muestreo por Conglomerados

En lugar de seleccionar aleatoriamente a los elementos por separado, se seleccionan


grupos. Los grupos pueden ser formados por el investigador, o existir previamente (por
ejemplo, hogares, salones de clase, viajeros dentro de un vagón del metro, sacos de un
determinado producto, etc. son grupos naturales). El listado de elementos elegibles está
formado por los grupos presentes, y una vez seleccionado el grupo, deben evaluarse a todos
los elementos presentes en él. El tamaño de la muestra puede estar definido por cierta
cantidad de grupos, o por cierta cantidad de elementos. Si se trata de grupo homogéneos, es
fácil hacer la conversión (es decir, si el investigador está trabajando con grupos de cinco
personas que él mismo formó, y desea una muestra de 50 personas, debe evaluar a 10
grupos). Si se trata de grupos heterogéneos, con cantidad variable de elementos (por
ejemplo, los vagones del Metro), hay que tomar algunas decisiones: una alternativa es
evaluar a todos los elementos presentes en el grupo, y flexibilizarse en cuanto a la muestra
total. Otra es seleccionar aleatoriamente a cierta cantidad de elementos de los que
conforman el grupo. Otra es actuar de la misma forma, pero mediante una selección
intencional. Cada decisión que se tome tiene algunas implicaciones.

7
Los muestreos por conglomerado son muy prácticos, pero pueden conducir a ciertos
sesgos si no se manejan con cuidado. Por ejemplo, evaluar un determinado colegio
tomando al azar apenas tres salones, puede llevar a que se seleccionen sólo los salones
correspondientes a los grados superiores, de tal forma que la heterogeneidad de la
población no se vería bien representada. Un buen investigador debe estar alerta ante estos
riesgos y prevenirlos de alguna forma.

Antes de terminar, el muestreo por conglomerados solo puede ser considerado un


método probabilístico si los conglomerados son seleccionados de manera aleatoria.

A continuación presentamos un ejemplo hipotético. Se conformaron conglomerados


de igual tamaño, aparentemente equivalentes. Los sujetos en gris representan extranjeros, y
en blanco ciudadanos del país. Resultaron seleccionados aleatoriamente los clusters 2, 5 y
6. ¿Cómo es la muestra resultante en cuanto a ser extranjeros o naturales del país?

Cluster
3
n=15 Cluster
(se seleccionaron 4
aleatoriamente
Cluster los clusters 2, 5 y 6)
1

Cluster
5
Cluster
2 Cluster
6

8
3.1.5. Muestreo Sistemático

La clave para que un muestreo sistemático sea considerado un método probabilístico


es que la selección del punto de arranque sea efectuada de manera verdaderamente
aleatoria. El muestreo sistemático consiste en seleccionar elementos cada cierto número de
elementos, de modo que se produce una especie de salto.

Muestreo sistemático en una fila de alumnos de un colegio mixto (lo que hace que la
fila sea mixta en cuanto al sexo).
Punto
de arranque

Imagine una guía telefónica, e identifique un método para seleccionar


aleatoriamente un nombre como punto de arranque (por ejemplo, genere números aleatorios
en la computadora y tome el primero para seleccionar la página de la guía, y luego tome el
segundo para seleccionar un registro dentro de esa página). A partir de allí, usted debería
seleccionar un nombre cada cierta cantidad de registros, o de páginas, o de páginas y
registros.

Este salto no debería ser elegido arbitrariamente por usted. Por ejemplo, no tiene
sentido hacer un salto de “uno sí y uno no”, o tomar un registro cada dos registros, si voy a
seleccionar una muestra de apenas diez casos. ¿Por qué? Porque hay probabilidad de que,
con un salto tan pequeño, todos fueran Rodríguez o todos fueran Pérez. El “salto” (o
“fracción de muestreo”, en términos técnicos) debería permitirnos recorrer toda la extensión
de los elementos disponibles, no importa de qué manera esté ordenada. Una fracción de
muestreo adecuada se logra dividiendo n/N (el tamaño de la muestra entre el tamaño de la
población). Si termina de recorrer la lista antes de lograr la muestra deseada, debe decidir
qué hacer. Lo más sencillo es considerar la página 1 de la guía telefónica como
continuación de la página n (o sea, de la última página), y seguir con el salto inconcluso.

9
A continuación se ilustra el muestreo sistemático en un listado (con nombres y
números telefónicos). La celda más oscura marca el punto de arranque. Los elementos
seleccionados aparecen en gris. Al terminar de recorrer el listado, se regresó al principio.

Perez, Amalia 5555555 Perez, Jacinto 7273641 Rojas, Andrés 8474626


Perez, Arturo 5536475 Perez, Pedro 7273746 Rojas, María 8384765
Perez, Beatriz 3847562 Perez, Virginia 2737461 Rojas, Otilia 2737365
Perez, Carlos 9482746 Portillo, Gustavo 2837461 Sarramera, Julio 2737465
Perez, Carolina 8346592 Puerta, Amanda 3847642 Serrano, Victoria 2938475
Perez, Gustavo 9481716 Quintero, 4859582 Sierra, Patricia 9485732
Rosaura
Perez, Federico 1827364 Quiñónez, Ana 4838572 Tovar, Emilia 8485725

3.1.6. Muestreo Doble o Bifásico

Si tenemos una muestra suficientemente grande de la cual no poseemos más


información que el número total, y deseamos hacer un muestreo estratificado, o cualquier
otra técnica que requiera información previa de la muestra (como la distribución porcentual
de ciertos grupos o la varianza de los mismos), podemos decantarnos por un muestreo
bifásico. En la primera fase tomaremos una muestra (pequeña) de la cual extraeremos la
información para determinar cuidadosamente las características de la segunda muestra, que
es la que se reportará. La primera muestra resulta, en un sentido científico, “sacrificada”.

También se considera un muestreo bifásico a una investigación donde se evalúan


determinadas variables en la totalidad de la muestra, y se hace una investigación más
profunda para una parte más pequeña de la muestra total. Por supuesto, el muestreo bifásico
puede ampliarse a muestreo polifásico (si tiene más de dos fases).

10
3.1.7. Muestras Interpenetrantes

La muestra total es evaluada con el mismo instrumento, y luego la data es dividida


en porciones con diferentes finalidades de contraste: para fines de control, podemos
comparar los resultados obtenidos por distintos encuestadores, o en diferentes momentos
del tiempo total que tomó el trabajo de campo, etc. Desearíamos no encontrar diferencias
entre estos segmentos. En tal sentido, el conocido alpha de Cronbach, que suele aplicarse
en los instrumentos psicométricos, puede considerarse una generalización ad infinitum del
método de muestras interpenetrantes.

3.1.8. Muestreo Repetido

Se utiliza para la generación de series de tiempos (es decir, bases de datos donde los
sujetos son en realidad fracciones de tiempo), cuando se llevan a cabo estudios
longitudinales (todos los muestreos señalados hasta ahora suelen utilizarse en estudios
transversales). En este tipo de muestreo el principal problema es la llamada “mortalidad”,
que es el abandono de determinados sujetos, producido por cualquier causa (fatiga, muerte
real, mudanza, etc). En ciertos estudios, especialmente si son muy largos y evalúan seres
humanos, la mortalidad experimental puede ser un problema tan serio que llega a invalidar
los resultados del estudio. Para evitarlo, se suele “sobremuestrar” las etapas iniciales, lo que
significa medir a una cantidad de sujetos algo mayor a la n deseada para la última
medición. Es muy difícil calcular este factor, y depende de muchos factores (la dificultad de
acceder a la población, características propias de la población, longitud del instrumento,
posible aversión al instrumento de medición, intervalo entre mediciones sucesivas, etc).
Sea cual sea el factor decidido, este debe multiplicar la n de cada medición de manera
exponencial. Por ejemplo, si deseo conservar una n=100 en la quinta (última) medición, y
supongo una mortalidad experimental media, puedo decidir un factor de 0,1, y aplicarlo
como sigue:

11
Número de medición Procedimiento n por medición

Quinta medición 100


Cuarta medición 100*0,1 110
Tercera medición 110*0,1 121
Segunda medición 121*0,1 133
Primera medición 133*0,1 126

Si durante el campo se revela que la mortalidad va a ser mayor que la esperada, se


deben redoblar los esfuerzos para evitar la mortalidad. En muchos casos, ya no se puede
incorporar más sujetos al estudio y arrancar la primera fase (por ejemplo, si tenemos un
tiempo reducido de campo, o teníamos determinada cantidad de muestras a probar).

El muestreo sistemático puede ser probabilístico o no, dependiendo de cómo se


seleccionó el grupo al cual se le va a hacer seguimiento.

3.2. Muestreos Intencionales

3.2.1. Muestreo Bola de Nieve

Es el muestreo más adecuado para poblaciones dispersas y difíciles de contactar,


como por ejemplo los miembros de ciertos grupos secretos (wiccanos, masones, etc.) o total
o parcialmente clandestinos (traficantes de droga, hackers, etc). También para ciertos
grupos sociales de difícil acceso o muy particulares (compradoras de determinada crema
para el rostro, o personas que hayan asistido a conciertos de Madona). El muestreo por Bola
de Nieve consiste en contactar a un miembro del grupo, que pone al investigador en
contacto con otras personas que cumplen las características requeridas.

Este muestreo se basa en la producción espontánea de redes sociales, según la cual


uno tiende a establecer contacto con personas que poseen características similares a las de
uno. Ciertas redes sociales electrónicas (como LinkedIn, Facebook, Twitter, etc.) se basan

12
en esta misma plataforma y podrían suponer muchas facilidades para llevar a cabo este tipo
de muestreo.

El diagrama a continuación permite ver de un modo esquemático el proceso de este


tipo de muestreo: a partir de un único contacto inicial (sujeto de la izquierda) se lograron 25
contactos, incluso a pesar de que ningún sujeto refirió a más de tres personas, e incluso
algunos no refirieron a ninguna.

3.2.2. Muestreo Intencional para Estudios Cualitativos:

En muchos estudios cualitativos (como por ejemplo, estudios con formadores de


opinión pública, historias de vida, etc) no tiene ninguna relevancia la inferencia, pero sí nos
interesa enormemente conseguir a la persona más idónea para determinada investigación.
Por ejemplo, si deseamos conocer las perspectivas económicas de los inversionistas sobre
el próximo año, no tiene ningún sentido comenzar a contactar gente utilizando la guía

13
telefónica, sino que, más bien, podríamos intentar contactar a tres o cinco expertos que
escriban frecuentemente en periódicos. Si estamos haciendo una i nvestigación sobre la
historia de una determinada población, debemos conseguir a los habitantes más viejos de la
misma, o a los de mayor influencia, o a los fundadores.

3.3. Muestreos Sin Norma

3.3.1. Muestreo Accidental

No hay requisitos para seleccionar a los encuestados, aunque suele haber un tamaño
estimado para la muestra. Son informativas, pero no tienen validez inferencial. Cuando se
realiza un muestreo accidental, no existe ninguna garantía de que la muestra se parezca a la
población sobre la cual se desea hablar. Por ejemplo, si realizo una encuesta por
intercepción a la salida del Metro entre las 6 y las 9 de la mañana, muy probablemente
encuestaré a personas que tienen empleo, y a esa hora se están desplazando hacia su
trabajo. No puedo estimar de qué manera eso puede afectar los resultados. Tal vez no
resulte muy relevante si estoy estudiando qué canal de televisión prefieren ver, pero si estoy
investigando qué marca de zapatos prefieren o si están a favor o en contra del gobierno, el
hecho de tener trabajo (e ingreso fijo) puede influir notablemente los resultados.

14