Beruflich Dokumente
Kultur Dokumente
CONCEPTO
DISEOS
MUESTRALES DE
USO FRECUENTE
TIPOS
ALEATORIO
SIMPLE
SISTEMATICO
EJERCICIOS DE
APLICACIN
ESTRATIFICADO
POR
CONGLOMERADO
CALCULO DEL
TAMAO
MUESTRAL
ESTIMAR LA
MEDIA
POBLACIONAL
ESTIMAR LA
PROPORCION
POBLACIONAL
Estadstica II
3.
MUESTREO
3.1. CONCEPTO
En toda investigacin estadstica existe un conjunto de elementos sobre los que se toma informacin. Este
conjunto de elementos es lo que se denota con el nombre de poblacin (N). Cuando el investigador toma
informacin de todos los elementos de la poblacin se dice que est realizando un censo. Sin embargo, esto
no es muchas veces posible. Este problema lleva al investigador a tomar la informacin slo de una parte de
los elementos de la poblacin, proceso que recibe el nombre de muestreo. El conjunto de elementos de los
que se toma informacin en el proceso de muestreo se llama muestra (n) y el nmero de elementos que la
compone tamao muestral. Por lo tanto:
El muestreo es el proceso de seleccin de una parte representativa de la poblacin que permita estimar los
parmetros de la poblacin.
3.2. REVISION DE OTROS CONCEPTOS FUNDAMENTALES
Necesitamos algunas definiciones para precisar el concepto de una buena muestra:
UNIDAD DE OBSERVACION.
Es el objeto sobre el cual se realiza una medicin. sta es la unidad bsica de la observacin, a veces llamada
elemento. En estudios de poblaciones humanas, con frecuencia ocurre que las unidades de observacin son
los individuos.
UNIDAD DE MUESTREO
Es la unidad donde realizamos la muestra.
Por ejemplo, podramos querer estudiar a las personas, pero no tenemos una lista de todos los individuos
que pertenecen a la poblacin. En vez de esto, las familias sirven como las unidades de muestreo y las
unidades de observacin son los individuos que viven en una familia.
MARCO DE MUESTREO.
Es la lista de las unidades de muestreo.
Para las encuestas telefnicas, el marco de muestreo podra ser una lista de todos los nmeros telefnicos
residenciales de la ciudad; para las entrevistas personales, una lista de direcciones de todas las calles; para
una encuesta de agricultura, una lista de todas las granjas o un mapa de las reas que contienen granjas.
3.3. VENTAJAS Y DESVENTAJAS DEL MUESTREO
Hay muchas razones por las cuales el estudio de una muestra es preferible al de la totalidad de la poblacin.
VENTAJAS
DESVENTAJAS
Proporciona informacin confiable con Siempre conlleva a un margen de error de muestreo.
costos mucho menores que las de un Por el hecho de partir de la observacin de slo una
censo.
parte de la poblacin.
Los datos se pueden reunir ms rpidos, Hacer conclusiones hacia una poblacin mucho ms
de modo que las estimaciones se pueden grande de la que originalmente se tomo la muestra.
publicar de manera programada
Las estimaciones con frecuencia son Otros errores que no son de muestreo son la Sub
mucho ms precisas que las basadas en un cobertura, la carencia de respuesta y los descuidos en
censo.
la recoleccin de datos.
Permiten inferir la realidad sin necesidad
de estar examinando a toda la poblacin.
Estadstica II
Estadstica II
99.73%
3.00
99%
2.58
98%
2.33
96%
2.05
95.45%
2.00
95%
1.96
90%
1.645
80%
1.28
68.27%
1.00
En donde:
Z: correspondiente al nivel de confianza elegido
: Desviacin estndar de una variable cuantitativa
e: error mximo,
N: tamao de la poblacin
Ejemplo1: Un medico quiere estimar el peso promedio de los recin nacidos en cierto hospital. Un estudio
anterior de diez nios mostr que la desviacin estndar de sus pesos es de 150 gr. Qu tan grande debe
ser una muestra para que el mdico tenga el 95% de confianza de que el error de estimacin es a lo ms de
40 gr?
Solucin:
Entonces se necesita aproximadamente una muestra de 54 recin nacidos para estimar el peso promedio con
una confianza del 95% y un error mximo de 40 gr.
Ejemplo2: Para el ejemplo anterior. Cunto seria el tamao de muestra si se conoce que el total de recin
nacidos en cierto mes es de 200 nios?
Solucin:
Para ello se utilizara la formula de tamao de muestra cuando se conoce la poblacin, reemplazando sera
Por lo tanto se necesita aproximadamente una muestra de 43 recin nacidos para estimar el peso promedio
con una confianza del 95% y un error mximo de 40 gr.
Estadstica II
Se requerir entrevistar a no menos de 203 familias para poder tener la seguridad del 95%
Ejemplo 02:Cmo hubiera cambiado el ejemplo 01. Anterior, si se desconoce la proporcin esperada?
Solucin:
Cuando se desconoce la proporcin esperada, se tiene que utilizar el criterio conservador (p=q=0.5=50%)
Z: 1.96 (95% de confianza)
p: 0.5 (en este caso 50%)
q=1-p=1-0.5=0.50
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 1067 familias para poder tener la seguridad del 95%
Ejemplo 03: En una muestra aleatoria de 500 familias en el distrito de Los Olivos, se encuentra que 340
familias estn suscritas a Seguros Rmac. Qu tan grande se requiere que sea una muestra si se quiere tener
95% de confianza de que la estimacin de P est dentro de 0.06?
Solucin:
Z: 1.96 (95% de confianza)
p: 340/500=0.68 (en este caso 68%)
q=1-p=1-0.68
e: 0.06 (6% error mximo)
Entonces se necesita aproximadamente una muestra de 232 familias para estimar la proporcin de suscritos
a Seguros Rmac con una confianza del 95% y un error mximo de 0.06.
Estadstica II
Ejemplo 4:
Si el total de familias en el distrito es de 5000, Cunto ser la muestra necesaria para estimar P?
Por lo tanto se necesita aproximadamente una muestra de 222 familias para estimar la proporcin de
suscritos a Seguros Rmac con una confianza del 95% y un error mximo de 0.06.
Ejemplo 05:
Un investigador est interesado en estimar la proporcin de muertes debido a cncer de estmago en
relacin con el nmero de defunciones por cualquier tipo de neoplasia. Su experiencia le indica que sera
sorprendente que tal proporcin supere el valor de 1/3. Qu tamao de muestra debe tomar para estimar
la anterior proporcin, con un nivel de confianza del 99%, para que el valor estimado no difiera del valor real
en ms de 0.03?
Solucin:
Z: 2.575 (99% de confianza)
p: 1/3=0.33
q=1-p=1-0.33
e: 0.03 (3% error mximo)
Se requerir entrevistar a no menos de 1637 familias para poder tener la seguridad del 99%
3.5.3. PROCESO DE SELECCIN DEL MUESTREO ALEATORIO SIMPLE.
Para seleccionar una muestra de este tipo consiste en: Enumerar las unidades de la poblacin, desde 1 hasta
N.
Usando la tabla de nmeros aleatorios seleccionar la 1ra unidad para la muestra.
Continuar la seleccin excluyendo las que se repiten. En la actualidad la generacin de nmeros aleatorios se
realiza de forma automtica a travs del software Excel: se utiliza la siguiente funcin= Aleatorio. entre
(inferior, superior).
a.
La extraccin de una muestra aleatoria simple se efecta seleccionando una a una las n unidades. La
utilizacin de una tabla de nmeros aleatorios implica un mecanismo de probabilidad muy bien diseado, de
manera que garantiza estadsticamente la aleatoriedad de sus elementos.
Ejemplo 07
Supongamos que deseamos elegir a dos nmeros aleatorios entre 1 y 50. Para ellos podemos utilizar pares
de nmeros en la tabla y estos pueden ser adyacentes. Iniciemos en la fila 1, columna 5: nmeros (99) y
avancemos a la derecha (67), (16), (41),El (99) y el (57) no estn comprendidos entre 1 y 50 de manera que
se descarta, el (16) y el (41) si se eligen por estar comprendidos entre 1 y 50. Por lo tanto los elementos
elegidos serian: el 16 y el 41.
Estadstica II
Estadstica II
b.
Usando el Excel. Ver ejemplo de aplicacin en el archivo de Excel adjunto que tienen por
nombre seleccin y calculo muestral.
Estadstica II
Asignacin ptima. De poca aplicacin, cuando se toma en cuenta la proporcin de cada estrato
y se conoce dispersin previsible de los resultados a travs de la desviacin estndar.
Proceso de seleccin. Extraemos una muestra independiente en cada estrato ya sea por muestreo aleatorios
simple o sistemtico, posteriormente, reunimos la informacin para obtener las estimaciones globales de la
poblacin.
Ejemplo de aplicacin 01. Seleccin aleatoria en estratos de diferente tamao de acuerdo a su peso relativo.
Ejemplo: se desea asistir a una visita en una empresa y que se beneficien los alumnos de todas las escuelas
de la UCV. Por especialidad, el nmero de alumnos difieren entre ellos, por lo tanto debo tomar una muestra
que refleje el peso relativo de cada especialidad.
3.5.6. MUESTREO ALEATORIO POR CONGLOMERADO
Concepto. Las unidades que presentan agrupadas en el espacio y/o en el tiempo pueden ser consideradas
como conglomerados y pueden servir como base para un procedimiento de muestreo.
Entre el muestreo estratificado y el de conglomerados existe una diferencia fundamental que es importante
acotarla:
El muestreo estratificado se trata de que cada estrato sea lo ms homogneo posible. En cambio,
En el muestreo por conglomerados el ideal consiste en que contenga elementos de todas las
variedades que estn mezcladas como se pueda.
Estadstica II
Solucin:
Ejemplo de Aplicacin 03. Una empresa quiere saber el porcentaje de personas que demandaran sus
servicios mediante una encuesta. N=150,000 habitantes. Determinar el tamao de la muestra con un error
+/-2% para un nivel de confianza del 95%.
ESTRATO
N MANZANAS
ASIGNACION
IGUAL-AI
TOTAL DE
TOTAL DE
NUMERO DE
ASIGNACION PROPORCIONALHOGARES- HOGARESHOGARES-SUJETO
AP
SUJETO POR SUJETO POR
POR MANZANA
ESTRATO
ESTRATO
Hi
Ni
n/L
n/N
Ni*n/N
n'
AI
AP
Muy alto
Alto
Medio
Bajo
Total
270
1940
2000
790
5000
227
227
227
227
909
0.182
0.182
0.182
0.182
49
353
364
144
909
20
20
20
20
4545
4545
4545
4545
18180
982
7054
7272
2872
18180
Solucin:
Poblacin infinita, proporciones p=q=0.5
Entrevistas
Ejemplo de aplicacin 04. La empresa anterior considera determinante para sus servicios la distribucin de la
poblacin en cuatro barrios: Barrio I: 20,000; Barrio II: 30,000, Barrio III: 75,000 y Barrio IV: 25,000.
Determinar la muestra en cada estrato por asignacin simple o igual y proporcional.
Solucin:
Asignacin igual. Determina 625 entrevistas a cada estrato.
La asignacin proporcional. Determina 333 entrevistas para el Barrio I, 500 entrevistas para el Barrio II, 1250
entrevistas para el Barrio III y 417 entrevistas para el Barrio IV
ESTRATO
POBLACION
Hi
Ni
ASIGNACION
IGUAL
n/L
20000
30000
75000
25000
150000
625
625
625
625
2500
Barrio I
Barrio II
Barrio III
Barrio IV
Total
ASIGNACION PROPORCIONAL
n/N
Ni*n/N
0.017
0.017
0.017
0.017
333
500
1250
417
2500
Estadstica II
En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Lima, se encuentra
que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se quiere tener
95% de confianza de que la estimacin de P est dentro de 0.02?
2.
Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin
del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos.
Qu tamao de muestra se necesita si se requiere una confianza del 95% y un error mximo de
estimacin de 0.10?
3.
A cuntas familias tendramos que estudiar para conocer la preferencia del mercado en cuanto a
las marcas de shampoo para beb, si se conoce que el nmero de familias con bebs en el sector de
inters es de 15,000 con un error de 1% al 95% de confianza?
4.
5.
6.
Un bilogo quiere estimar el peso promedio de los ciervos cazados en cierta regin. Un estudio
anterior de diez ciervos mostr que la desviacin estndar de sus pesos es de 12.2 libras. Qu tan
grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el error de
estimacin es a lo ms 4 libras?
7.
Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una
desviacin estndar de 40 horas.
a. De qu tamao se necesita una muestra si se desea tener 95% de confianza que la media est
dentro de 10 horas de la media real?
b. Qu pasara si en lugar de tener un error de estimacin de 10 horas solo se requiere un error de
5 horas?
c. Suponga que se tiene una poblacin de 300 focos, y se desea saber de qu tamao debe ser la
muestra.
d. Comente sus resultados de a, b y c.
El presidente de una fraternidad en el campus universitario desea tomar una muestra de las opiniones de
112 miembros respecto a las actividades urgentes para el otoo
b. cul es la poblacin?
_________________________________________________________
c. Cul es la mejor forma en qu debe tomarse la muestra?
_________________________________________________________
Estadstica II
2.
Se desea realizar una evaluacin de los principales problemas detectados en el campus universitario:
A.
B.
C.
D.
Identifique la poblacin y el tipo de muestreo que aplicara. Por qu? Responda en cada caso
A. Congestionamiento en los ascensores
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
B.
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
C.
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
D. Vocacin profesional.
Poblacin: ___________________________________________________
Tipo de muestreo: _____________________________________________
Porque: ____________________________________________________
3.
El censo del 2007 se muestra que en Jauja el 11.5% de los residentes tienen ms de 60 aos. Para verificar
un sistema de muestreo por telfono se llaman a 200 residencias elegidas al azar. De los residentes
contactados, 10.2% tenan ms de 60 aos.
a) 11.5% es un parmetro o un estadstico?
b) 10.2% es un parmetro o un estadstico?
Estadstica II
4.
En el ao 2006 la Universidad Cesar Vallejo tiene 5 453 estudiantes, en la tabla se muestra un detalle de
la composicin. Necesitamos una muestra de tamao n=20 de la poblacin de estudiantes.
Sexo
MUJERES
HOMBRES
TOTAL
Nivel
Pregrado
2461
2848
5309
Postgrado
67
77
144
Total
2528
2925
5453
Elija muestras de tamao 20 para 2 tipos de muestreo: (en cada alternativa use la tabla aleatoria,
empiece en la fila 3 y columna 4)
a)
6.
Supongamos que necesitamos seleccionar a 4 integrantes del programa de televisin "Gana con la
Estadstica" de Abril del 2010. Calcule muestras de tamao n=4 usando los distintos diseos muestrales
(tipos de seleccin) (muestreo aleatorio simple y muestreo estratificado). En cada alternativa, use la tabla
de nmeros aleatorios (Excel), empiece en la fila 3 columna 3.
N
Mujeres
Mujeres
hombres
1.
Giovanna Santos
6.
Gianina Ramos
1.
Jorge Molina
2.
Brbare Ascue
7.
Pam Lozano
2.
Leandro Martnez
3.
Dany Bellido
8.
Jimena Pereira
3.
La Gutirrez
4.
Carolina Soto
9.
Maura Rivera
4.
Daro Jurez
5.
Mara Sobarzo
10.
Rosa Daz
5.
Nelson Pachas
N
6.
hombres
Jos Mauri
Suponga que nuestra poblacin de inters es el comit de estudiantes de la UCV para efectos de
colaboracin con la universidad en agosto del 2008. Juan Prez, Miguel Cornejo, Juana Olivares, Lucia
Galn, Edwin Manrique, Anglica Mario, Carlos Enciso, Julia Salinas, Manuela Enrico, Sonia Oquendo,
ngel Bravo, Luis Alba, Abel Vivar, Carla Espinosa, Marcelo Oyarte, Elba Aguilar, Ernesto Aguirre,
Francisco Alama. (En cada alternativa use la tabla aleatoria, empiece en la fila 4 y columna 2)
A. Si nos interesa estudiar la proporcin de mujeres en esta poblacin. Elija una muestra aleatoria
simple de tamao n=4 de esta poblacin.
B. Indique cul es el parmetro y el estadstico en (a)
C. Elija una muestra estratificada por sexo de tamao n=4 de esta poblacin
7.
La Facultad de Administracin de la Universidad Cesar Vallejo, quiere saber acerca del ingreso promedio
de sus estudiantes y para esto enva cartas a todos los Estudiantes desde su ingreso a la Universidad en el
ao 2006. En la Encuesta haba slo una pregunta: Cul es el ingreso promedio en su hogar?
Aproximadamente 30% de los alumnos respondieron.
Comente los posibles sesgos acerca del salario promedio de los estudiantes de Administracin. Cmo
debe ser el ingreso promedio entre los que respondieron y los que no respondieron?
Estadstica II
8.
El titular de un diario dice: Encuesta seala que aument el porcentaje de gente que chatea en el
trabajo. El artculo dio la siguiente informacin: Se encuestaron al azar 227 personas que llamaron a la
lnea abierta 800-CHAT durante 6 semanas entre Febrero y Marzo. 92% de los que llamaron dijeron haber
chateado alguna vez mientras trabajaban.
a) Qu clase de muestreo se us?
b) Cul piensa usted que fue la poblacin de la cual fue elegida esta muestra?
c) Piensa usted que el titular es correcto?
9.
10.
Una organizacin estudiantil quiere saber si a los estudiantes le interesa cambiar el horario de atencin
de la biblioteca. Selecciona al azar 100 estudiantes de primer ao, 100 de segundo, y 100 estudiantes que
egresarn este ao. Qu tipo de diseo muestral es ste?
Un profesor quiere investigar sobre el tiempo diario de estudio de 20 estudiantes de una clase
Nombre
Juan
Alicia
Pedro
Marcos
Alberto
Jorge
Jos
Carlos
Miguel
Vctor
Nmero de Horas
2,3
1,9
2,0
1,5
1,7
2,2
1,8
1,9
1,9
1,6
Nombre
Mara
Fernanda
Julio
Rosa
Fabin
Ana
Laura
Enrique
Carmen
Marcelo
Nmero
Horas
2,9
0,7
0,8
1,0
1,3
2,8
0,8
0.9
1,1
1,2
de
En cada alternativa, use la tabla de nmeros aleatorios, empiece en la fila 1 columna 1 y contine
seleccionando hacia la derecha.
a) Elija una muestra aleatoria simple de tamao n=4 de esta poblacin.
b) Calcule el Parmetro y el Estadstico en (a).
c) Elija una muestra estratificada de tamao n=4 por sexo de esta poblacin
d) Calcule el estadstico en (c)
11.
Una compaa de marketing saca una muestra de la gua de telfonos tomando 10 personas cuyos
apellidos comiencen con letra A, 10 personas cuyos apellidos comiencen con la letra B, y as
sucesivamente con cada letra del alfabeto, para una muestra total de 260 personas.
a) Qu clase de diseo muestral se us aqu?
b) Tienen todos los que estn en la gua de telfonos igual probabilidad de ser elegidos en la muestra?
c) No todos los residentes de la ciudad tiene telfono, qu clase de sesgo va a provocar este hecho?
d) Se sabe que la distribucin de la primera letra del apellido vara por etnicidad, Qu clase de sesgo va
a provocar este hecho?