Sie sind auf Seite 1von 6

Qu tamao de muestra necesito?

Escrito por Carlos Ochoa el 11 de noviembre 2013


Una de las secciones de nuestra web ms visitadas es la CALCULADOA DE
!UE"#A"$ %racias a esta aplicaci&n' indicando unos datos bsicos sobre la
poblaci&n (ue deseas investi)ar * el m+imo error (ue ests dispuesto a tolerar' obtienes
una estimaci&n del tama,o de muestra (ue necesitas para tu encuesta$
A menudo recibimos consultas relativas a esta calculadora- (u. /&rmulas emplea' (u.
si)ni/ica mar)en de error' nivel de con/ian0a1 2o* nos proponemos e+plicar c&mo
/unciona e+actamente$
El problema
El problema a resolver es el si)uiente- (ueremos estudiar un universo de personas 3por
e4emplo' personas de 5rasil entre 16 * 76 a,os' un total de 137 millones de personas8
mediante una encuesta a una muestra de este universo$ 9or el hecho de (ue la muestra es
de un tama,o in/erior al total del universo' vamos a cometer cierto error en los datos
(ue observemos$ "i estamos dispuestos a aceptar un : de error determinado' ;cul es el
tama,o de muestra m<nimo (ue necesito encuestar=
La forma en que mido el error
Cuando (uiero /i4ar el m+imo error (ue esto* dispuesto a aceptar en una encuesta' lo
habitual es re/erirnos a dos parmetros- el margen de error y el nivel de confianza$
;>u. si)ni/ica cada cosa=
El margen de error es el intervalo en el cul espero encontrar el dato (ue (uiero medir
de mi universo$ El dato puede ser en )eneral de dos tipos- una media o una proporci&n$
9or e4emplo' si (uiero calcular la media de hi4os (ue tienen los habitantes de 5rasil
entre 16 * 76 a,os' me )ustar<a poder decir (ue la media es 2'1 hi4os?persona con un
mar)en de error del 6:$ Eso si)ni/icar<a (ue espero (ue la media est. entre 2'1 @ 6: *
2'1 A 6:' lo (ue da un intervalo de 2'00 BCD 2'21$
"i (uisiera de/inir un mar)en de error para una proporcin' proceder<a de /orma
similar$ 9or e4emplo' me )ustar<a poder estimar el nEmero de personas de 5rasil entre
16 * 76 a,os (ue viven en un piso de propiedad' a/irmando (ue son un total de 71$36
millonres personas 3F6: de la poblaci&n8 con un mar)en del 6: de error' lo (ue
si)ni/icar<a (ue la realidad est entre 7F$F2 millones 3FG'26:8 * 6H$2H millones
3F2'G6:8$
El nivel de confianza e+presa la certe0a de (ue realmente el dato (ue buscamos est.
dentro del mar)en de error$ 9or e4emplo' si)uiendo con el caso anterior' si obtenemos un
nivel de con/ian0a del I6:' podr<amos decir (ue el porcenta4e de personas de mi
universo (ue viven en un piso de propiedad' en el I6: de los casos se encontrar entre
el F2'G6: * el FG'26:$ O dicho de otra manera' si repitiese 100 veces mi encuesta
seleccionando muestras aleatorias del mismo tama,o' I6 veces la proporci&n (ue busco
estar<a dentro del intervalo * 6 veces /uera$
Relacin entre error y tamao de muestra
!ar)en de error' nivel de con/ian0a * tama,o de la muestra siempre van de la mano$ "i
(uiero obtener un mar)en de error * un nivel de con/ian0a determinado 3por e4emplo'
error del 6: con con/ian0a I6:8 necesitar. un tama,o de muestra m<nimo
correspondiente$ !odi/icar cual(uiera de los 3 parmetros' altera los restantes-
1$ educir el mar)en de error obli)a a aumentar el tama,o de la muestra$
2$ Aumentar el nivel de con/ian0a obli)a a aumentar el tama,o de la muestra$
3$ "i aumenta el tama,o de mi muestra' puedo reducir el mar)en de error o incrementar
el nivel de con/ian0a$
9ero' ;(u. /&rmulas )obiernan la relaci&n entre los parmetros anteriores= El con4unto
de teoremas (ue se conocen como LEJ DE LO" %AKDE" KL!EO" viene a
nuestro rescate$ Estos teoremas son los (ue dan soporte matemtico a la idea de (ue el
promedio de una muestra al a0ar de una poblaci&n de )ran tama,o tender a estar cerca
de la media de la poblaci&n completa$ En concreto' el teorema del lmite
central demuestra (ue' en condiciones mu* )enerales' la suma de muchas variables
aleatorias independientes 3en el e4emplo' los habitantes de 5rasil (ue tienen piso de
propiedad8 Mse apro+ima bienN a una distribuci&n normal 3tambi.n llamada campana de
Gauss8$
%racias al teorema del l<mite central' cuando calculamos una media 3p$e$ hi4os por
persona8 o una proporci&n 3p$e$ : de personas con piso de propiedad8 sobre una
muestra' podemos saber cul es la probabilidad de (ue el universo ten)a ese mismo
valor o un valor parecido$ El valor (ue calculemos en la muestra ser el ms probable
para nuestro universo * a medida (ue nos ale4amos de este valor 3por arriba o por aba4o8
cada ve0 sern valores menos probables$ En mi e4emplo' si el F6: de mi muestra de
brasile,os tiene piso de propiedad' puedo a/irmar (ue F6: es el valor ms probable del
universo estudiado$ Un porcenta4e de FF: ser al)o menos probable' F3: aEn menos'
etc1 Lo mismo sucede para valores superiores- F7: es menos probable (ue F6:$
La /orma en (ue disminu*e la probabilidad a medida (ue me ale4o de la media
corresponde a una distribuci&n )aussiana$ 9odemos /i4ar un intervalo alrededor del valor
ms probable' de manera (ue en)lobemos el I6: de la probabilidad 3nivel de
con/ian0a8$ La distancia a la (ue me ten)o (ue ale4ar del valor ms probable para
en)lobar este I6: determina el mar)en de error$

"e)En el )r/ico anterior' para una distribuci&n normali0ada 3media 0' desviaci&n 18 si
(ueremos en)lobar los valores (ue cubren el I6: de los casos' ten)o (ue de/inir un
mar)en de error entre C1'I7 * A1'I7 de la media$ "i (uiero cubrir el II: de los casos' el
mar)en debe ale4arse hasta AC2'6H$
entonces! "qu est# $aciendo la calculadora?
Conociendo la propiedad anterior' es mu* /cil adaptar las /&rmulas de la distribuci&n
)aussiana a cual(uier caso 3sea cul sea la media * desviaci&n8$ Oamos a ver con detalle
el caso de la estimaci&n de una proporci&n$ 9ara ello usamos la si)uiente /&rmula-

Donde-
n P El tama,o de la muestra (ue (ueremos calcular
% P #ama,o del universo 3p$e$ 137 millones de brasile,os entre 16 * 76 a,os8
& P Es la desviaci&n del valor medio (ue aceptamos para lo)rar el nivel de con/ian0a
deseado$ En /unci&n del nivel de con/ian0a (ue bus(uemos' usaremos un valor
determinado (ue viene dado por la /orma (ue tiene la distribuci&n de %auss$ Los valores
ms /recuentes son-
Kivel de con/ian0a I0: CD QP1'7F6
Kivel de con/ian0a I6: CD QP1'I7
Kivel de con/ian0a II: CD QP2'6G6
e P Es el mar)en de error m+imo (ue admito 3p$e$ 6:8
p P Es la proporci&n (ue esperamos encontrar$ Este parmetro suele con/undir bastante
a primera vista- ;c&mo vo* a saber (u. proporci&n espero' si 4ustamente estamos
haciendo una encuesta para conocer esta proporci&n=
La ra0&n de (ue esta p apare0ca en la /&rmula es (ue cuando una poblaci&n es mu*
uni/orme' la conver)encia a una poblaci&n normal es ms precisa' lo (ue permite
reducir el tama,o de muestra$ "i en mi e4emplo' *o espero (ue como m+imo el : de
personas (ue ten)an un piso de propiedad sea un 6:' podr<a usar este valor como p * el
tama,o de mi muestra se reducir<a$ "i por el contrario' descono0co completamente (u.
puedo esperar' la opci&n ms prudente ser<a usar el peor caso- la poblaci&n se distribu*e
a partes i)uales entre propietarios * no propietarios' por lo (ue pP60:$
Como re)la )eneral' usaremos pP60: si no ten)o nin)una in/ormaci&n sobre el valor
(ue espero encontrar$ "i ten)o al)una in/ormaci&n' usar. el valor apro+imado (ue
espero 3a4ustando hacia el 60: ante la duda8$

La /&rmula anterior podemos simpli/icarla cuando traba4amos con universos de tama,o
mu* )rande 3se considera mu* )rande a partir de 100$000 individuos8' resultando lo
si)uiente-

Ejemplo: Retomamos nuestro caso anterior. Tenemos una poblacin de 136 millones de
brasileos entre 15 y 65 aos, ueremos saber u! " de ellos #i#e en un piso de
propiedad, con un mar$en de error del 5" y un ni#el de con%ian&a del '5".
(upondremos ue no tenemos nin$una in%ormacin pre#ia sobre cu)l puede ser el " de
propietarios ue podemos obtener en la encuesta. En este caso puedo usar la %rmula
simpli%icada pues 136 millones * 1++.+++, y usaremos p,5+" pues no ten$o
in%ormacin pre#ia sobre el resultado esperado:
n , 1,'6-. / +,5 / 01 1 +,52 3 +,+5-. , 345,16 6* 384
Debo encuestar por lo tanto a 3HF personas para mantenerme dentro de los niveles de
error de/inidos$
"i a ra<0 de un estudio reali0ado el a,o anterior obtuvimos (ue el : de brasile,os
propietarios de su vivienda era del 20:' * se espera (ue el dato de este a,o no ha*a
variado en ms de 6 puntos 3entre 16: * 26:8' podr<amos reempla0ar p por el peor
caso esperado P 26:$ El resultado ser<a-
n , 1,'6-. / +,.5 / 01 1 +,.52 3 +,+5-. , .44,1. 6* 288

"%ecesito $acer estos c#lculos?
Ko' por eso disponemos de una calculadora (ue hace todo el traba4o por ti$ "&lo debes
saber (ue el parmetro Rnivel de hetero)eneidadS es esta proporci&n esperada *' (ue en
ausencia de in/ormaci&n' debers indicar un valor de 60:$
Esperamos (ue os ha*amos a*udado a interpretar su uso$
'o(a de c#lculo del tamao de la muestra
La ho4a de clculo "#E9" para el tama,o de la muestra puede a*udarle a determinar el
tama,o de la muestra$
2o4a de clculo del tama,o de la muestra
+ls' F1Tb
'o(a de c#lculo del muestreo
Esta ho4a de clculo le a*udar a seleccionar la muestra para la encuesta "#E9"$ 9rovee
ho4as automati0adas para-
el clculo de la probabilidad proporcional del tama,o de la muestra
la selecci&n aleatoria simple de la muestra
la ponderaci&n de los datos$
2o4a de clculo del muestreo
0ip' 2$00!b

Das könnte Ihnen auch gefallen