Beruflich Dokumente
Kultur Dokumente
FUNDAMENTOS DE MUESTREO
Cada población tiene unos parámetros reales que se pueden estimar, pero nos sale muy caro
(entrevistar a los 40 millones de españoles). Es más rentable y barato estimar esos
parámetros a partir de una muestra representativa con datos aproximados. Pero los cuales
no son los reales, riesgo de error muestral.
Todo diseño muestral comprende una serie de decisiones clave que atañen a la población
(o universo de estudio), al tamaño de la muestra y al procedimiento seguido para su
selección.
Delimitada la población, el siguiente paso es la elección del marco muestral, el “listado” que
incluye a la población de estudio y que se utilizará para la extracción de la muestra (censo de
población, padrón de habitantes, un registro de individuos, empresas, pacientes, alumnos
matriculados, etc., cualquier procedimiento que lleve a la identificación de los miembros de
la población de interés.
Del marco se espera que sea un descriptor válido de la población de estudio. Razón por la
cual ha de cumplir una serie de requisitos mínimos:
̅̅̅ − 𝑌̅𝑁𝐶 )
𝐸𝑁𝐶 = 𝑡𝑁𝐶 × (𝑌𝑐
̅̅̅
𝑌𝑐 es la media de Y (la variable que se analiza) en la población cubierta
̅̅̅̅ − 𝑌̅𝑁𝐶
𝑌𝑐
Error de no cobertura relativo = 𝑡𝑁𝐶 × ( 𝑌̅𝑝
)
Todos los aspectos referidos intervienen en el cálculo del tamaño muestral. La fórmula
genérica para una muestra aleatoria (simple o sistemática) sería la siguiente, cuando el
universo o población fuese infinita (integrada por más de 100.000 unidades):
𝑍 2 𝑆̂ 2
𝑛=
𝐸2
̂̂
𝑍 2 𝑃𝑄
𝑛=
𝐸2
Dónde:
“Z” es el valor del área bajo la curva normal. Representa las unidades de desviación típica
que corresponden al nivel de confianza elegido (2α o 3 α): nivel de confianza de que las
estimaciones se ajustan a la realidad.
Si el universo lo forman 100.000 unidades o menos, es una población finita y habría que
introducir un factor de corrección en las fórmulas, quedando de la siguiente manera:
𝑍 2 𝑆̂ 2 𝑁
𝑛=
𝐸 2 (𝑁 − 1) + 𝑍 2 𝑆̂ 2
𝑍 2 𝑃̂ 𝑄
̂𝑁
𝑛=
𝐸 2 (𝑁−1)+ 𝑍 2 𝑃̂𝑄
̂
Donde “N” es el tamaño de la población.
1. El presupuesto económico.
2. El periodo de tiempo programado para su ejecución.
3. La existencia de un marco muestral valido que haga factible la selección muestral
aleatoria.
4. El grado de precisión que se quiera dar a la indagación.
MUESTREO PROBAABILÍSTICO
cada unidad de la población puede ser elegida sólo una vez) o con reemplazamiento
sin reemplazamiento.
Las variables de estratificación más empleadas son las variables sexo y edad, debido a que
ambas se hallan recogidas en la mayoría de los marcos muestrales. A ellas pueden añadirse
otras variables, como la clase social, la ocupación, el nivel de instrucción; depende del
objetivo fundamental de la investigación.
En estudios a nivel nacional (e internacional), suele estratificarse por ubicación geográfica:
ámbito territorial (país, comunidad autónoma, provincia, municipio), tipo de hábitat
(urbano, semiurbano, rural), o por tamaño de hábitat (número de habitantes).
Tras la afijación de la muestra procede la elección del procedimiento aleatorio a aplicar para
la selección de las unidades muestrales en cada estrato. A diferencia del muestreo por
cuotas, en el estratificado la selección de las unidades finales de la muestra se hace al azar
(mediante muestreo aleatorio simple, sistemático, etc.) y no mediante criterios subjetivos.
El muestreo por conglomerados abarata los costes del trabajo de campo. Además, la
dificultad de elaborar una lista exhaustiva de todos los integrantes de la población (para
aplicar otro aleatorio) son las razones principales de su aplicación.
El muestreo por conglomerados puede ser singular o monoetápico (si todas las unidades de
los conglomerados elegidos componen la muestra), bietápico o polietápico. Bioetápico
cuando la selección muestral prosigue dentro de cada conglomerado, en una segunda fase:
en cada conglomerado elegido al azar se procede a la selección aleatoria de unidades
muestrales. Si el proceso no concluye aquí, se está ante un muestreo polietápico de tres,
cuatro e, incluso más fases.
Una de las modalidades de muestre o más populares es el muestreo por cuotas. Esta
constituye una variedad de muestreo no probabilístico que parte, igualmente (con el
estratificado), de la segmentación de la población de interés en grupos, a partir de variables
sociodemográficas relacionadas con los objetivos de la investigación. Se buscan grupos
internamente homogéneos y heterogéneos respecto de los otros grupos.
Es el propio entrevistador quien elige al entrevistado, en cualquier momento y lugar (en una
calle comercial, a la salida del metro, en la parada del autobús, en un mercado, en un
parque). La única condición que se le impone es que la persona se ajuste a las cuotas fijadas
por el equipo investigador. Este margen de libertad es su principal debilidad.
También es fácil que, dentro de una misma cuota, se escoja a unos individuos con
preferencia a otros. Por ejemplo, si se controla por edad, es probable que se entreviste más
a personas de edades intermedias en los intervalos diferenciados, y no a aquellas situadas
en los límites del intervalo. Asimismo, el entrevistador puede ubicar a los sujetos en cuotas
diferentes a las que realmente pertenecen, en aquéllas donde se precisen casos (para
completarlas). Esta última picaresca también resulta difícil de controlar.
EL ERROR MUESTRAL
Por muy perfecta que sea la muestra, como únicamente se analiza una parte de la población
(y esta muestra solo representa una de todas las posibles que pueden extraerse de la misma
población), siempre habrá divergencias entre los valores obtenidos en la muestra
(estimaciones muestrales) y los correspondientes a la población (parámetros
poblacionales). Esta disparidad es el error muestral (o error típico de muestreo). Su
magnitud depende del tamaño de la muestra y de su representatividad: si todos los
componentes de la población han tenido igual de probabilidad de ser elegidos para formar
la muestra. Su valor depende de:
A partir del error típico (Se) se calculan los intervalos de confianza. Expresan el intervalo de
valores que comprende el parámetro poblacional a partir de la estimación muestral. Como
toda inferencia estadística, los intervalos se estiman para un nivel de confianza concreto. Si
es 99,7%, el error se multiplicará por 3; si es 95,5%, por 2; y si fuese 95%, por 1,96. El
intervalo es igual al valor estimado en la muestra menos (límite inferior del intervalo) y más
(límite superior del intervalo) el producto de Z por el error típico de estimación (Se):