Sie sind auf Seite 1von 12

Universidad Nacional de Córdoba

Maestría en Estadística Aplicada

MUESTREO

UNIDAD 1: INTRODUCCIÓN

DR. JOSÉ ALBERTO PAGURA

Conceptos introductorios
• En muchos estudios, no es posible o conveniente la
observación de las características de interés para
todas las unidades que componen la población
objetivo, debiendo realizar la observación parcial de
un subconjunto de las mismas, es decir utilizar una
muestra de ellas.
• Ejemplo: se desea conocer el total de conejos que
han comprado los restaurantes de la ciudad de
Rosario para ofrecer en sus menús, platos
preparados a partir de esta carne, en el mes de
agosto de 2017.

1
Conceptos introductorios
• ¿Cómo llevar a cabo la observación parcial, para
poder “confiar” en los resultados que se obtengan?
¿con que criterio seleccionar las unidades a
observar? ¿Cuántas serán suficientes para aportar al
problema que se desea resolver?
• ¿Cómo elegir los restaurantes con la finalidad de
encontrar un valor aproximado del total de conejos
comprados por los restaurantes de Rosario en agosto
de 2017? ¿En cuántos restaurantes habría que relevar
información?

Conceptos introductorios
• ¿De que forma extender a la población, los
resultados encontrados?
• Una característica distintiva de los métodos
conocidos como “Técnicas de Muestreo” es que las
poblaciones objeto de estudios son finitas, es decir,
están compuestas por un conjunto finito de N
unidades. En el ejemplo: los restaurantes de la
ciudad de Rosario en agosto de 2017.
• Las cantidades poblacionales que se definen, los
estimadores que se utilizan y los estudios de sus
propiedades, comprenden aspectos particulares que
se estudiarán en el presente curso.

2
Conceptos introductorios
• Unidad elemental: la parte más pequeña de la
población a la que se le observan las características de
interés en el estudio. Siguiendo el ejemplo: el
restaurante.
• Unidad muestral: puede coincidir con la unidad
elemental o estar formada por un conjunto de ellas. La
selección de la muestra se hace a partir de ellas.
• Población objetivo: es el conjunto de todas las
unidades elementales objeto de estudio.
• Población muestreada: conjunto de unidades que
podrán seleccionarse en la muestra. Puede o no
coincidir con la población objetivo.

Conceptos introductorios
• Valor poblacional: los estudios por muestreo, se
realizan con el objetivo de conocer cantidades
definidas sobre la población finita como promedios,
totales, o proporciones. Esas cantidades son llamadas
valores poblacionales.
• En el ejemplo mencionado, se desea conocer el total de
conejos que han comprado los restaurantes de la
ciudad de Rosario en agosto de 2017, cantidad que solo
puede definirse si se trata de una población finita.
• Variable en estudio: es la característica que se “mide” a
cada unidad elemental y se utilizará en el cálculo de los
valores poblacionales de interés.

3
El marco muestral
• Requisito indispensable para seleccionar una
muestra por procedimientos aleatorios.
• Es el conjunto de materiales que sirven para
identificar, localizar y acceder a cada uno de los
elementos de la población.
• Los marcos deben incluir sin omisión ni repetición,
a todos los elementos de la población.
• Los marcos pueden ser de lista, de área o mixtos.

El marco muestral
• Marco de lista: listado completo de los elementos de la
población con información auxiliar útil para el diseño de
la muestra. Difíciles de mantener completos debido a los
cambios que ocurren en las poblaciones. Ej: listado de
restaurantes de Rosario y datos de localización.
• Marco de área: una partición del territorio en la que se
asienta la población realizada sobre mapas, fotografías
aéreas, imágenes de satélite o cualquier otra
representación gráfica del territorio. Son completos pero
tienen escasa información auxiliar. Ej: zonas de la ciudad.
• Los marcos mixtos tratan de reunir las ventajas de los
marcos de listas y de áreas. Son completos e incluyen e
incluyen información auxiliar para mejorar la eficiencia
de las muestras de áreas.

4
Errores de muestreo y ajenos al
muestreo
• Error de muestreo: se produce por trabajar con una
muestra y no con toda la población. Si se desea
conocer una cantidad poblacional  , a partir de la
muestra se obtendrá un valor aproximado ˆ , por lo
general diferente del valor poblacional. Esa
diferencia es el error de muestreo, y en el muestreo
probabilístico, se podrá dar una medida del mismo.
• Errores ajenos al muestreo: corresponden a otras
fuentes de error y pueden estar presentes en las
muestras y en los estudios por enumeración
completa.
• Algunas clases de errores ajenos al muestreo son:

Errores ajenos al muestreo


• No respuesta: imposibilidad de alcanzar a algunas
unidades de la muestra por cuestiones geográficas o
climáticas, dificultad de encontrar personas
seleccionadas en su casa, negación a responder, etc.
• Errores de medición: a veces la gente no dice la verdad,
las preguntas no siempre son comprensibles, las
personas no siempre recuerdan, a veces pueden
responder de acuerdo a la orientación que da el
entrevistador, etc.
• Errores de cobertura: el marco muestral no coincide
con la población objetivo.

5
Tratamiento de los errores ajenos al
muestreo

• Uso de marcos mixtos para reducir los errores de


cobertura.
• Mejora en las técnicas de observación
• Desarrollo de métodos para la recolección de datos
con asistencia de nuevas tecnologías
• Desarrollo de modelos para el tratamiento de la no
respuesta

Muestreo probabilístico
• Interesa estimar características de la población que son
formas lineales de los valores de Yi como la media, el
total, y la proporción o el número de elementos si la
variable es cualitativa.
• Un diseño de una muestra aleatoria queda definido
especificando:
• El procedimiento de selección
• El estimador de la característica en estudio
• En el muestreo probabilístico, cada elemento de la
población tiene una probabilidad conocida y no nula de
ser seleccionado.

6
Muestreo probabilístico
• La probabilidad se obtiene a través de la operación de
aleatorización que se define.
• Cochran puntualiza las condiciones que caracterizan al
muestreo probabilística de la siguiente forma:
- Puede definirse el conjunto de muestras distintas
S1,S2,…,Si…,S
- Cada muestra posible Si tiene una probabilidad
conocida de ser seleccionada
- La selección se realiza por un procedimiento aleatorio
que asigna la probabilidad definida a cada muestra
- Se define el método para calcular la estimación a
partir de la muestra y debe conducir a una estimación
única para una muestra específica.

Enfoques para el problema de las


inferencias
• Las poblaciones estadísticas objeto del diseño de
muestras son conjuntos de elementos numerosos
pero finitos, que responden a una misma definición
pero que varían en sus características individuales. A
un individuo específico Ui de una población de
tamaño N, se asocia un valor de una variable de
interés, Yi ,desconocido.
• Por lo general, se deseará estimar valores
poblacionales como un total, un promedio o una
proporción.

7
Enfoques para el problema de las
inferencias
N
• Un total queda definido como Y   Yi
N i 1
1
• Un promedio: Y 
N
Y
i 1
i

• Una proporción puede definirse como un promedio


de una variable que toma valores 0 o 1
• En general, se tratará de estimar una valor
poblacional  mediante un estimador ˆ
calculado con los datos de la muestra de n unidades
• El problema de la inferencia (la extrapolación a la
población de los resultados observados en la
muestra) ha sido enfocado por dos vías

Inferencia basada en el diseño


• Los valores de la variable en estudio en la población,
Yi, i=1...N, son fijos
• La aleatoriedad se introduce a través del
procedimiento de selección de la muestra que
asigna a cada muestra posible una probabilidad de
ser seleccionada.
• Los valores que toma el estimador en cada muestra
posible junto con la probabilidad asociada a ellos
define una distribución estadística : distribución en
el muestreo.

8
Inferencia basada en modelos o enfoque
de predicción
• Se asume que la población Y1 , Y2 ,..., Yi ,..., YN es una
muestra de una población infinita o
“superpoblación” en la que la variable aleatoria Y se
comporta de acuerdo a un modelo estadístico
determinado.
• La muestra de n unidades se utiliza para estimar los
parámetros del modelo superpoblacional,
• El modelo estimado se utiliza para predecir los
valores de “Y” en las N-n unidades de la población
finita que no pertenecen a la muestra
• Luego con los N valores, observados y predichos, se
encuentra un predictor de la cantidad poblacional
buscada

Inferencia asistida por modelos


• En el enfoque de modelos, la calidad de los resultados
depende de lo adecuado del modelo superpoblacional
elegido.
• Una propuesta que combina las anteriores, tratando de
explotar las ventajas de ambas, consiste en:
• utilizar el enfoque de modelos para encontrar el
procedimiento óptimo de selección de la muestra y el
estimador óptimo,
• Basar la inferencia acerca de las características de la
población que se estudia, en la distribución en el
muestreo de la población finita. Este enfoque se conoce
como “asistido por modelos”.

9
El Error Cuadrático Medio
• Los planes de muestreo se comparan entre si
comparando el Error Cuadrático Medio para la
distribución en el muestreo, del estimador.
• Si ˆ es un estimador del valor poblacional  ,

 
• El error de muestreo es: ˆ  

ˆ  
2
• El error cuadrático es:

  
2
• El error cuadrático medio es : ECM ˆ  E ˆ  

• Un plan de muestreo con estimador *1 es


uniformemente mejor que otro con estimador *2 si:
• ECM(*1) < ECM(*2)
• El error cuadrático medio puede expresarse como:
 
ECM ˆ  V ˆ  B 2 ˆ 

• donde B ˆ es el sesgo del estimador de  .
• Una propiedad deseable para el estimador es que sea
insesgado, es decir que la media del estimador en la
distribución en el muestreo coincide exactamente
con el valor poblacional que se estima.

10
Etapas en un estudio por muestreo
• Establecimiento de objetivos
• Definición de la población a muestrear.
• Elaboración del plan de muestreo.
• Definición de qué datos a recolectar.
• Determinación del grado de precisión deseado.
• Elección el procedimiento para la obtención de los
datos
• Construcción del marco muestral

Etapas en un estudio por muestreo


• Ejecución de un estudio piloto
• Selección la muestra
• Organización el trabajo de campo
• Resumen y análisis de los datos
• Presentación de resultados e información útil para
trabajos futuras

11
Áreas de aplicación
• Es común identificar al muestreo con las encuestas.
Es claro que en la mayoría de estos estudios se
requiere de las técnicas de muestreo logrando
menores costos, mayor exactitud y mejores tiempos
para la obtención de resultados.
• Sin embargo hay otras clases de estudios en los que
se requiere del empleo de las técnicas de muestreo.
• La obra ya clásica de Azorín-Sanchez Crespo (1986)
dedica algunos capítulos a la presentación de
particularidades de las aplicaciones en Biología,
Inspección por muestreo y Control de Calidad y
Auditoría, además de Encuestas en diversos campos.

12