Sie sind auf Seite 1von 81

J.

Santiago
E.U. Estadística
Contraste de Hipótesis Básicas
Y Análisis de Datos en Investigación de
Marketing

El Muestreo
El Muestreo en
en
Investigación de
Investigación de Mercados
Mercados
«To err is human,
to forgive divine,
but to include errors in your design
is statistical.»

Leslie Kish (1910-2000)


Objetivos
• Comprender la importancia de las técnicas de

• Revisar los conceptos básicos de muestreo.


probabilísticas y no probabilísticas

• Aprender los diferentes métodos de muestreo, sus


Objetivos (2)

• Aprender a calcular los volúmenes

• Comprender el peculiar uso de las técnicas de

• Comprender la problemática aplicación de las


técnicas de muestreo en los estudios en
Contenido:
1. Importancia y utilidad de las técnicas de muestreo en

2. Conceptos básicos de muestreo.

4. Muestras probabilísticas y muestras no


probabilísticas. Ventajas e Inconvenientes.
5. Métodos de muestreo.

7. Volúmenes y errores
1. Importancia y utilidad en IM


individuos que integran una población.

• La razón fundamental para realizar un muestreo es la

• Obtener una “buena muestra” significa seleccionar


una parte de la población que refleje las similitudes y
diferencias que se producen en la población (en las
variables de interés para el estudio) = “representativa”.
2. Conceptos Básicos: MUESTREO

generalización
generalización

Población

Selección Muestra Estudio


muestra muestra
2. Conceptos Básicos
!
Procedimiento estadístico para seleccionar un número reducido d
(muestra) de una población, con el objeto de estudiar en ella al
característica, y generalizar los resultados a la población de o
! POBLACIÓ N:

en un cierto lugar durante un periodo, que poseen una característica común


que se desea estudiar. El número de elementos que la integran co
el tamaño de la población
!
Gr upo generalmente reducido de unidades obtenidas de la població
!
ación de
interés.
!
Medio o soporte donde están representados los elementos de la población:
listado del censo, listín telefónico, cintas de ordenador, lista
¿A quiénes quiero
generalizar?
Población teórica

¿A qué población
puedo acceder?
Población estudio

¿Cómo puedo acceder


a ella? listado
Marco muestral

¿Quién está en
nuestro estudio?
Muestra
2. Conceptos Básicos

Términos estadísticos en muestreo

1 2 3 4 5
Variable
ingresos

Estadístico Media = 3.74


muestra

Parámetro Media = 3.75


población
2. Conceptos Básicos: Error muestral
La población tiene
una media de 3.75...
150

…y una
100
desviación
frecuencia

típica de .25
50

3.0. 3.5 4.0 4.5


Esto significa
ingresos
que...
Cerca del 68% de casos se encuentran entre 3.5 - 4.0
Cerca del 95% de casos se encuentran entre 3.25 - 4.25
2. Conceptos Básicos: Error muestral
La muestra de 1000
tiene una media de
150 3.74 y un error típico
de .0074
100
frecuencia

σ
50
σx =
n

3.0. 3.5 4.0 4.5


ingresos

El error típico se llama Error Muestral


2. Conceptos Básicos: Error muestral
La muestra de 1000
tiene una media de
150 3.74 y un error típico
de .0074
100
frecuencia

Intervalo de confianza
50

3.0. 3.5 4.0 4.5


σ
ingresos x ± z*
Nivel de confianza n

El error muestral muestra que en el 95% de los casos,


la media de la población será de 3.74 + 2(.0074)
2. Conceptos Básicos: Distribución Muestral

muestra muestra muestra


5 5 5

0 0 0

5 5 5

0 0 0

3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4

media media media


15

10
…es la distribución
La Distribución de un estadístico a
muestral...
5
lo largo de un
0 infinito nº de
3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4
muestras
Error muestral, nivel de confianza y variabilidad

de opinión se trabaja con ±2σ

σ
-3σ σ
-2σ σ
-σ σ σ
2σ σ

68 %
95,5 %
99,7 %
3. Errores en Muestreo
Error Total

Error Muestral Error No-Muestral

Error de Observación Error No-Observación

Error de Medida Errores de Codificación, Error del Marco Error de Cobertura No Respuesta
Grabación y Análisis
Error de Muestreo
Distribución de ingresos

µ: Media Poblacional
Error muestral El ingreso medio muestral difiere del
poblacional solamente debido a que
no toda la población se incluye en la
muestra.

x : ingreso medio muestral


Error de Cobertura
Sesgo de Selección
Población

Cuando algún grupo de la población no puede ser seleccionado...

la muestra no representa a la
Muestra población
Error de Medición

• Ejemplo: En una encuesta se pregunta con qué


frecuencia toma Coca-Cola. Entre las posibles
respuestas tenemos:
– regularmente,
– ocasionalmente,
– raramente y,
– nunca.
• Una persona que beba 2 o 3 veces por semana
respondió ocasionalmente.
• Una persona que bebe Coca-Cola 1 vez al mes
contesto regularmente.
Error de No-Respuesta
Error de no-respuesta
Población

No-respuesta ... Puede llevar a resultados sesgados

Muestra
Tratamiento de las No-Respuestas

• Submuestra de no-respondentes y ajuste.


• Substitución por similares (cuotas)
• Equilibrajes y Ponderación
• Imputación
• Estimación subjetiva
Método de los dos estratos
Tiene usted Responden No-responden % p
automovil??
Sí n1=30 n2=3 n1p1+n2p2
p1=30% p2=15% N
21,3%
No n`=70 n`=17 n`1p`1+n`2p`2
p`1=88% N
p`1=70% 61,2%
Total N=120
n1=100 n2=20
Ponderación
Sexo Muestra Población Peso

Mujer 48 511 1.065

Hombre 52 489 0.940

Total 100 1000

•(100/48)*(511/1000) = 1.065 ; (100/52)*(489/1000) = 0.940


4. Muestras probabilísticas y no-
probabilísticas
• Muestras probabilísticas
• ¿Se basan en la
elemento de la población tienen una

• Muestras no probabilísticas
• Los elementos de la población se seleccionan
de manera no probabilística


el máximo de representatividad.
Ventajas Inconvenientes
• Asegura que la información sea • Más costoso, para un mismo n,
representativa de la población de
Probabilísticos

que un no-probabilístico (coste


interés.
de la selección y diseño por
• Permite calcular el error de especialistas).
muestreo.
• Requiere más tiempo (diseño y
• Los resultados son projectables
ejecución) que un no-
a la población total..
probabilístico.

• No permite cálculo errores de


No-Probabilisticos

• Más barato. Atractivo cuando


muestreo.
precisión no es muy importante.
Estudios exploratorios. • Imposible evaluar en qué
• Más rápido. grado la muestra es
representativa
• Si se ejecuta razonable-
mente, produce muestras • Los resultados no pueden ni
bastante representativas de la deben proyectarse a la población
población. total.
5. Métodos de muestreo:
Clasificación
Métodos
Métodos
Muestreo
Muestreo

Probabilísticos
Probabilísticos No-probabilísticos
No-probabilísticos

Sistemático
Sistemático Estratificado
Estratificado Conveniencia
Conveniencia Bola
Bola Nieve
Nieve

Aleatorio
Aleatorio
Conglomerados
Conglomerados simple
simple Expertos
Expertos Cuotas
Cuotas
Muestreo aleatorio simple

Listado de clientes

Submuestra aleatoria

Tamaño muestra
Probabilidad de selección = Tamaño población
Muestreo sistemático
1 26 51 76
2 27 52 77
N = 100 3 28 53 78
4 29 54 79
5 30 55 80
6 31 56 81
Queremos n = 20 7 32 57 82
8 33 58 83
9 34 59 84
10 35 60 85
N/n = 5 11 36 61 86
12 37 62 87
13 38 63 88
14 39 64 89
Selecciona un número aleatorio de 1-5: p.e. el 4 15 40 65 90
16 41 66 91
17 42 67 92
18 43 68 93
19 44 69 94
20 45 70 95
21 46 71 96
Comienza con #4 y toma cada 5 unidades 22 47 72 97
23 48 73 98
24 49 74 99
25 50 75 100
Muestreo estratificado

Muestra aleatoria estratificada


Muestreo estratificado
Listado Clientes

Grandes cuentas Org. públicos Pymes

Estratos

Submuestras aleatorias de n/N


Estratos y Afijación de la muestra
Afijación: determinación del nº de elementos de los diferentes

Reequilibrar !!
AFIJACION

Des-
Simple Proporcional proporcional
Óptima

Necesidad
nº de nº de elementos
igual nº de de
elementos sobrerepre tomando en cuenta
elementos sentar la población
proporcional
por estrato grupos
y la variabilidad de
a población de pequeños
cada estrato cada estrato
ε Estratificación proporcional vs. No proporcional
Estrato Población % Muestra Error Muestra Error
Pro Real No-Pro
A 1.000.000 6 60 12,9 100 10,0
B 2.000.000 13,77 138 8,5 200 7,1
C 4.000.000 26,66 266 6,1 300 5,8
D 8.000.000 53,33 533 4,3 400 5,0
TOTAL 15.000.000 100 1000 4,08 1000 3,2

á í
ó ó
ó
ó
ó

n p = muestra proporcion al al estrato


κ pq
2 np`2
2 ∑
Donde
ε= n a = muestral no proporcion al al estrato
n na
k 2 pq  5332 2662 1332 62 10000
ε=  + + + .) = (710,2 +865,6 +88,4 + 0,36) = 16,65 = ±4,08
n2  400 300 200 100 1000000

í ± ±
Muestreo por Conglomerados

Muestra por conglomerados monoetápica


Muestreo Polietápico

1ª Etapa del muestreo Muestra de


Conglomerados

K-ésima etapa del muestreo

Muestreo Muestreo No-


aleatorio aleatorio

• Simple • Cuotas
Última etapa del muestreo • Sistemático • Rutas
• Estratificado aleatorias
Manzana
Distrito

Bloque,
Altura, Muestreo Polietápico Individuo
Vivienda
Muestreo Rutas aleatorias

Establecida un área de muestreo, se define un punto de

Busca asegurar una cobertura geográfica de la muestra y/ o

homogé neos
Muestreo No-Probabilístico
No-probabilísticos
No-probabilísticos

Conveniencia Bola
Bola Nieve
Nieve
Conveniencia

Cuotas
Cuotas
Expertos
Expertos
Muestras por Cuotas
• : proporción de una variable de interés, en
la población.

• Se seleccionan los elementos de la población de

• La selección es no probabilística

• Útil cuando la representatividad de la/ s variable/ s


de interés es difícil de conseguir
requiriría
Cuotas Sexo x Marca consumida
Grupos A B C Total
De Edad
16-25 13 4 3 20
26-40 10 8 7 25
41-55 12 7 6 25
>56 5 11 14 30
Total 40 30 30 100
6. Proceso de Muestreo: Pasos

7:
7: 2:
2:
Ejecutar
Ejecutar el
el Plan:
Plan: Especificar
Especificar el
el
Seleccionar
Seleccionar lala “Marco”
“Marco”
muestra
muestra muestral
muestral
3:
3:
1:
1: Especificar
Especificar la
la
6:
6: Definir
Definir la
la “Unidad”
“Unidad”
Elaborar
Elaborar el
el “Población”
“Población” dede muestral
muestral
“Plan
“Plan de
de Interés
Interés
Muestreo”
Muestreo”

5:
5: 4:
4:
Determinar
Determinar Determinar
Determinar
El
El “Tamaño”
“Tamaño” El
El “Método”
“Método”
muestral
muestral de
de muestreo
muestreo
6.1: Definición de la Población

• Definir la población en términos de:

- Elementos: - individuos
- consumidores

- Características: - que posean automóvil


- en hogares / en supermercados

- Extensión: - residentes en Madrid-Capital


- consumidores de las marcas
AóB

- Tiempo: - en Enero del 2002


6.2: Especificar el “Marco”
muestral
• Se trata de describir los medios o soportes donde están
representados los elementos de la población: listado del
censo, listín telefónico, cintas de ordenador, lista de

• es aquél en el que cada


elemento de la población está representado una única

• ¡ Ojo! Los marcos


6.3: Especificar la “Unidad”
muestral
• Unidad muestral = unidad básica que contiene los
elementos de la población a muestrear

• Se trata de seleccionar la unidad de la muestra:


individuos, amas de casa, hogares, empresas...

• La unidad muestral puede tener uno o más elementos


de la población (hogar)

• La unidad a seleccionar dependerá del marco muestral


del que partamos y del diseño del proyecto de
investigación (listado de direcciones, censo de hogares,
listín telefónico....postal, personal, telefónica)
6.4. Determinar el “Método” de
Muestreo

1. PROBABILÍSTICO VS. NO PROBABILÍSTICO

2. UNIDADES SIMPLES VS. CLUSTERS

3. ESTRATIFICADO VS. NO ESTRATIFICADO

4. UNIETAPICO VS. POLIETAPICO


1. PROBABILISTICO VS. NO-PROBABILISTICO

• La elección ha de basarse en el criterio COSTE / VALOR


(Precisión),
en función de:
– Tipo de información necesitada (frecuencias y/ o
proporciones, proyección sobre el total)
– Tipo de error que tolera el problema investigado (¿se
requiere alta precisión de los valores?
– ¿ De qué magnitud son los errores no
(especificación del universo, marco, selección, no

– ¿ Qué homogeneidad tiene la población en las variables que

– ¿ Cuál es el coste derivado de los errores en la información


1. PROBABILISTICO VS. NO-PROBABILISTICO



– alta heterogeneidad de la población
– pequeños errores no


2. UNIDADES SIMPLES VS. CLUSTERS

• La elección depende del COSTE / PRECISI ON


– El cluster es más barato, pero contiene más error, y es más
difícil de calcular


población, alto coste derivado de los errores
3. ESTRATIFICADO VS. NO ESTRATIFICADO

• = segmento de población con una o más


características comunes

subpoblación



– Si se desean estimaciones de x , % u otros parámetros del
estrato en la población
– Tamaño de la muestra requerida en el diseño: si es
estratificado será menor que si no lo es
– ¿ Estratificación

4. UNIETAPICO VS. POLIETAPICO

• El nº de etapas está en función del “marco”

que contenga tal nº de información aplicable a la


estratificación o agrupación

áreas, seguidas de uno de bloques, luego hogares e

• polietápico es más económico por la menor


dispersión de las encuestas
6.5: Determinar el “Tamaño” de la
muestra
• Decidir el nº de elementos de la población que han

– Tamaño promedio de muestras en estudios

– Tamaño mínimo por celda (en m. estratificadas o


por cuotas y dependiendo del plan de tabulación
(desagregación de datos) (20
celda más pequeña)
TAMAÑO DE MUESTRAS TIPICAS
METODOS: (Cont) Tamaño muestral:

• Modelo tradicional estadístico:



• Error de muestreo (precisión) que se quiere conseguir
• –
• Desviación típica de la variable estudiada = varianza

• Modelo estadístico
Ti ene en consideración la diferencia entre el valor aportado por
tamaño de muestra y el coste de la misma.
CALCULO DEL TAMAÑO MUESTRAL,
Medias - En el supuesto de Distribución normal
CALCULO DEL TAMAÑO MUESTRAL,
En el supuesto de Distribución normal –
Medias
EJEMPLO:

• Tamaño de la población: 50.000


• Máximo error tolerado: 5unidades
• Nivel de confianza deseado: 95%

1−α / 2 = 0,975; ⇒ z0,975 = 1,96 ∼ 2)


(α=0.05; ⇒

• Desviación típica muestral: 3

n=
(1,96 )(3 )(50 .000 ) = 664
2 2

(5 )(50 .000 ) + (1,96 )(3 )


2 2 2
CALCULO DEL TAMAÑO CUANDO LA
POBLACION TIENDE A INFINITO ( >100.000
UNIDADES)


población > 100.000:

n =
(1 , 96 )(3 ) = 1428
2 2

(0 . 5 )2
Porcentajes z 2
1−α / 2 pq
n =
Tamañ o población infinito o ε 2

2
z pq N1−α / 2
Tamañ o de población finito n= 2
ε (N −1) + z21−α / 2 p q

ñ
ñ ó
z 1−α/2 º σα σ α

í ó
á

ε ó ±
FACTOR DE CORRECCION DEL TAMAÑO
CUANDO POBLACIONES FINITAS (<100.000)

• Se aconseja corregir el tamaño de la muestra


cuando n supera el 5 % de la población (N).
• Cuanto mayor sea N, el factor de corrección


6.6. PLAN DE MUESTREO

¿ Cómo definir operativamente “hogar”?


¿ Cómo distinguir entre “familia” y “hogar”?
¿ Cómo seleccionar el hogar en un bloque de viviendas?
¿ Cómo seleccionar al individuo en el hogar?
¿ Cómo reemplazar a los ausentes?
¿ Cuántos itinerarios/ rutas?
¿ Cuántas entrevistas por ruta?
Distribución de la muestra por estratos, zonas, áreas...
6.7. OBTENCION DE LA MUESTRA

• Realización de las operaciones de

• Puesta en práctica de los


7. Volúmenes y Errores muestrales
ERRORES ASOCIADOS A VOLUMENES MUESTRALES

z2 p q
Población infinita: ε =
n

Población finita: z 2 p q (N − n )
ε =
n (N − 1 )

M.Estratificado
ε=
∑n p q
i i i
n = tamañode la muestra
2 n i = tamaño poblaciónen estratoi
Proporcional: n
pi = % de la característica que se investiga

2 en estrato i
No- n iσ i
Proporcional: ε = qi = 100 - p
n2
ERRORES ASOCIADOS A VOLUMENES
MUESTRALES: CONGLOMERADOS

A) Mismo tamaño: ε = k  N − n  
 
∑ p i2 − n p 2 

 Nn   n −1 

  ∑ x i − 2p ∑ x i M i + p ∑ M 
B) Distinto tamaño: 2 2 2
 N−n 
ε =  
 nN M
2
 n −1 

N = nº de conglomerados que componen la población


n = nº conglomerados en la muestra
= nº total de elementos de la población en conglomerado i
M = tamaño medio de los conglomerados
= nº de elementos de la población que en el conglomerado i
poseen la característica que se investiga
p = % de elementos del conjunto de la población respecto de la
caracterçistica
ERRORES ASOCIADOS A VOLUMENES
MUESTRALES: POLIETAPICO

A) Bietápico(Conglomerados iguales)

ε =
N−n (
∑ p −p 2
i +
)
nM − nm
x
∑p q
i i
n n (n − 1 ) nM m 2 (m − 1 )

N = nº de conglomerados
n = nº conglomerados elegidos en 1ª etapa
M = tamaño de cada uno de los conglomerados de 1ª

m = nº unidades elementales seleccionadas dentro de

conglomerado en la 1ª etapa.
= % de la característica en estrato i
ERRORES ASOCIADOS A VOLUMENES
MUESTRALES: POLIETAPICO
A) Bietápico(Conglomerados desiguales)

ε =
N −n ∑ x i2 − 2 p ∑ x i m i + p 2 ∑ m i2
Nn m 2 n −1

N = nº de conglomerados
n = nº conglomerados elegidos en 1ª etapa
M = tamaño de cada uno de los conglomerados de 1ª etapa
= nº de unidades elementales (tamaño) que comprende el conglomer
m = nº unidades elementales seleccionadas dentro de cada
conglomerado en la 1ª etapa.
= nº de
m = nº medio de elementos por conglomerado de la muestra
= % de la característica en estrato i
Efecto Diseño
• cuando se emplea un diseño
polietápico

¿ cuánto mayor ?

desviación típica
√ é

• ó ñ
í
“ ñ ”
v â r particular
Efecto diseño =
v â MAS
• á

ó
Efecto Diseño
DISEÑ O

Polietápicos


•“Promedio” (3

Error = Error M. A. S. x Factor Diseño

. L. (2000): Muestreo. Diseño y análisis.


CALCULO DE LA MUESTRA EN POBLACION
POLINOMIAL (MULTINOMIAL)
CONVERSION DE TAMAÑO DE MUESTRA
DE BINOMIAL A POLINOMIAL
t ama ño como si
Nº de proporciones a estimar
NC 3 4 5 6 7 8

95% 1.53 1.66 1.73 2.05 2.37 2.53


conver si ón que
90% 1.71 1.84 2.04 2.44 2.76 2.91 corr esponde al n º

si mult án eament e
DETERMINACION DE LA MUESTRA EN
ESTUDIOS MULTIVARIABLES
• Los modelos de muestreo están construidos,


estudiadas simultáneamente un sinnú mero de variables
referidas a la población de interés, con bases y

• La elección del tamaño

de mayor importancia o interés, para posteriormente


8. Uso del muestreo en IM


• Irregular distribución de vías de acceso (timbres, porteros,


llaves, teléfonos, computadoras, etc.)

• autoselección
(personal, postal, telefónico, Internet).


8. Uso del muestreo en IM

• Micromárketing
• y difíciles de hallar.

• “ Representatividad” vs. Probabilístico



• El adecuado uso de las técnicas de muestreo

• Las posiciones “teóricas” del investigador...


8. Uso del muestreo en IM

• No sabe bien a quién dirigirse ( . teórica y de estudio


• Sabe, pero no tiene cómo llegar (

• medición
• error codificación grabación
• error análisis
• error interpretación

Posiciones «teóricas»:

• Busca epatar con profusión de nº , datos, técnicas


novedosas y recursos visuales...pero poca información de

• Informa sólo el tamaño de la muestra y el error probable


(como si M. A.S), pero no desarrolla la metodología.

• “Permite” interpretaciones erróneas, como confundir

• a voluntad, sin considerar el diseño


ni sus condiciones de aplicación
Posiciones «teóricas»:

• probabilístico
no científico.

• No adaptar el diseño a los obj etivos del estudio, que a


menudo no requieren muestras probabilísticas.

“ para los zapateros sólo existe el cuero” (


• probabilístico en investigación social y de

• No se cumplen las condiciones para su aplicación, ni para


cálculos de

• Usa muestras no probabilísticas pensando que cualquier


defecto en diseños más estrictos los invalida totalmente.

• probabilístico
probabilístico
cálculo de error y
d) Tecnologicismo
• Confiar en que a ponderación resolverá cualquier

imputación, ajustes iterativos...)


informáticos (de muestras, de análisis) sin adecuado

• Rechazar sin fundamento las soluciones tecnológicas


avanzadas y apegarse a viejos hábitos e
9. Muestreo en Internet

• Conveniencia, Barato, Rápido, Automatizado.


• La población de usuarios de
población general.

• Incentivos a la participación ⇒” ”⇒

• Reclutamiento de muestras de consumidores a través de

• Los paneles no son representativos ni de la población


9. Muestreo en Internet

• No colocarlas en áreas públicas y sin control (portales), riesgo

• Utilizar técnicas de “Pop ” para garantizar cierta


autoselección
Proveer claves únicas a los participantes.

• Extremar la precaución en la selección de paneles. Controlar


10. Resumen y Conclusiones
La característica fundamental de una muestra es

población.

Las técnicas de muestreo están orientadas a

La principal ventaja de las técnicas de muestreo


Resumen y Conclusiones (2)

• Considerar los problemas como desafíos


• la ética de la profesión
Gracias !

Das könnte Ihnen auch gefallen