Una de las secciones de nuestra web ms visitadas es la CALCULADOA DE !UE"#A"$ %racias a esta aplicaci&n' indicando unos datos bsicos sobre la poblaci&n (ue deseas investi)ar * el m+imo error (ue ests dispuesto a tolerar' obtienes una estimaci&n del tama,o de muestra (ue necesitas para tu encuesta$ A menudo recibimos consultas relativas a esta calculadora- (u. /&rmulas emplea' (u. si)ni/ica mar)en de error' nivel de con/ian0a1 2o* nos proponemos e+plicar c&mo /unciona e+actamente$ El problema El problema a resolver es el si)uiente- (ueremos estudiar un universo de personas 3por e4emplo' personas de 5rasil entre 16 * 76 a,os' un total de 137 millones de personas8 mediante una encuesta a una muestra de este universo$ 9or el hecho de (ue la muestra es de un tama,o in/erior al total del universo' vamos a cometer cierto error en los datos (ue observemos$ "i estamos dispuestos a aceptar un : de error determinado' ;cul es el tama,o de muestra m<nimo (ue necesito encuestar= La forma en que mido el error Cuando (uiero /i4ar el m+imo error (ue esto* dispuesto a aceptar en una encuesta' lo habitual es re/erirnos a dos parmetros- el margen de error y el nivel de confianza$ ;>u. si)ni/ica cada cosa= El margen de error es el intervalo en el cul espero encontrar el dato (ue (uiero medir de mi universo$ El dato puede ser en )eneral de dos tipos- una media o una proporci&n$ 9or e4emplo' si (uiero calcular la media de hi4os (ue tienen los habitantes de 5rasil entre 16 * 76 a,os' me )ustar<a poder decir (ue la media es 2'1 hi4os?persona con un mar)en de error del 6:$ Eso si)ni/icar<a (ue espero (ue la media est. entre 2'1 @ 6: * 2'1 A 6:' lo (ue da un intervalo de 2'00 BCD 2'21$ "i (uisiera de/inir un mar)en de error para una proporcin' proceder<a de /orma similar$ 9or e4emplo' me )ustar<a poder estimar el nEmero de personas de 5rasil entre 16 * 76 a,os (ue viven en un piso de propiedad' a/irmando (ue son un total de 71$36 millonres personas 3F6: de la poblaci&n8 con un mar)en del 6: de error' lo (ue si)ni/icar<a (ue la realidad est entre 7F$F2 millones 3FG'26:8 * 6H$2H millones 3F2'G6:8$ El nivel de confianza e+presa la certe0a de (ue realmente el dato (ue buscamos est. dentro del mar)en de error$ 9or e4emplo' si)uiendo con el caso anterior' si obtenemos un nivel de con/ian0a del I6:' podr<amos decir (ue el porcenta4e de personas de mi universo (ue viven en un piso de propiedad' en el I6: de los casos se encontrar entre el F2'G6: * el FG'26:$ O dicho de otra manera' si repitiese 100 veces mi encuesta seleccionando muestras aleatorias del mismo tama,o' I6 veces la proporci&n (ue busco estar<a dentro del intervalo * 6 veces /uera$ Relacin entre error y tamao de muestra !ar)en de error' nivel de con/ian0a * tama,o de la muestra siempre van de la mano$ "i (uiero obtener un mar)en de error * un nivel de con/ian0a determinado 3por e4emplo' error del 6: con con/ian0a I6:8 necesitar. un tama,o de muestra m<nimo correspondiente$ !odi/icar cual(uiera de los 3 parmetros' altera los restantes- 1$ educir el mar)en de error obli)a a aumentar el tama,o de la muestra$ 2$ Aumentar el nivel de con/ian0a obli)a a aumentar el tama,o de la muestra$ 3$ "i aumenta el tama,o de mi muestra' puedo reducir el mar)en de error o incrementar el nivel de con/ian0a$ 9ero' ;(u. /&rmulas )obiernan la relaci&n entre los parmetros anteriores= El con4unto de teoremas (ue se conocen como LEJ DE LO" %AKDE" KL!EO" viene a nuestro rescate$ Estos teoremas son los (ue dan soporte matemtico a la idea de (ue el promedio de una muestra al a0ar de una poblaci&n de )ran tama,o tender a estar cerca de la media de la poblaci&n completa$ En concreto' el teorema del lmite central demuestra (ue' en condiciones mu* )enerales' la suma de muchas variables aleatorias independientes 3en el e4emplo' los habitantes de 5rasil (ue tienen piso de propiedad8 Mse apro+ima bienN a una distribuci&n normal 3tambi.n llamada campana de Gauss8$ %racias al teorema del l<mite central' cuando calculamos una media 3p$e$ hi4os por persona8 o una proporci&n 3p$e$ : de personas con piso de propiedad8 sobre una muestra' podemos saber cul es la probabilidad de (ue el universo ten)a ese mismo valor o un valor parecido$ El valor (ue calculemos en la muestra ser el ms probable para nuestro universo * a medida (ue nos ale4amos de este valor 3por arriba o por aba4o8 cada ve0 sern valores menos probables$ En mi e4emplo' si el F6: de mi muestra de brasile,os tiene piso de propiedad' puedo a/irmar (ue F6: es el valor ms probable del universo estudiado$ Un porcenta4e de FF: ser al)o menos probable' F3: aEn menos' etc1 Lo mismo sucede para valores superiores- F7: es menos probable (ue F6:$ La /orma en (ue disminu*e la probabilidad a medida (ue me ale4o de la media corresponde a una distribuci&n )aussiana$ 9odemos /i4ar un intervalo alrededor del valor ms probable' de manera (ue en)lobemos el I6: de la probabilidad 3nivel de con/ian0a8$ La distancia a la (ue me ten)o (ue ale4ar del valor ms probable para en)lobar este I6: determina el mar)en de error$
"e)En el )r/ico anterior' para una distribuci&n normali0ada 3media 0' desviaci&n 18 si (ueremos en)lobar los valores (ue cubren el I6: de los casos' ten)o (ue de/inir un mar)en de error entre C1'I7 * A1'I7 de la media$ "i (uiero cubrir el II: de los casos' el mar)en debe ale4arse hasta AC2'6H$ entonces! "qu est# $aciendo la calculadora? Conociendo la propiedad anterior' es mu* /cil adaptar las /&rmulas de la distribuci&n )aussiana a cual(uier caso 3sea cul sea la media * desviaci&n8$ Oamos a ver con detalle el caso de la estimaci&n de una proporci&n$ 9ara ello usamos la si)uiente /&rmula-
Donde- n P El tama,o de la muestra (ue (ueremos calcular % P #ama,o del universo 3p$e$ 137 millones de brasile,os entre 16 * 76 a,os8 & P Es la desviaci&n del valor medio (ue aceptamos para lo)rar el nivel de con/ian0a deseado$ En /unci&n del nivel de con/ian0a (ue bus(uemos' usaremos un valor determinado (ue viene dado por la /orma (ue tiene la distribuci&n de %auss$ Los valores ms /recuentes son- Kivel de con/ian0a I0: CD QP1'7F6 Kivel de con/ian0a I6: CD QP1'I7 Kivel de con/ian0a II: CD QP2'6G6 e P Es el mar)en de error m+imo (ue admito 3p$e$ 6:8 p P Es la proporci&n (ue esperamos encontrar$ Este parmetro suele con/undir bastante a primera vista- ;c&mo vo* a saber (u. proporci&n espero' si 4ustamente estamos haciendo una encuesta para conocer esta proporci&n= La ra0&n de (ue esta p apare0ca en la /&rmula es (ue cuando una poblaci&n es mu* uni/orme' la conver)encia a una poblaci&n normal es ms precisa' lo (ue permite reducir el tama,o de muestra$ "i en mi e4emplo' *o espero (ue como m+imo el : de personas (ue ten)an un piso de propiedad sea un 6:' podr<a usar este valor como p * el tama,o de mi muestra se reducir<a$ "i por el contrario' descono0co completamente (u. puedo esperar' la opci&n ms prudente ser<a usar el peor caso- la poblaci&n se distribu*e a partes i)uales entre propietarios * no propietarios' por lo (ue pP60:$ Como re)la )eneral' usaremos pP60: si no ten)o nin)una in/ormaci&n sobre el valor (ue espero encontrar$ "i ten)o al)una in/ormaci&n' usar. el valor apro+imado (ue espero 3a4ustando hacia el 60: ante la duda8$
La /&rmula anterior podemos simpli/icarla cuando traba4amos con universos de tama,o mu* )rande 3se considera mu* )rande a partir de 100$000 individuos8' resultando lo si)uiente-
Ejemplo: Retomamos nuestro caso anterior. Tenemos una poblacin de 136 millones de brasileos entre 15 y 65 aos, ueremos saber u! " de ellos #i#e en un piso de propiedad, con un mar$en de error del 5" y un ni#el de con%ian&a del '5". (upondremos ue no tenemos nin$una in%ormacin pre#ia sobre cu)l puede ser el " de propietarios ue podemos obtener en la encuesta. En este caso puedo usar la %rmula simpli%icada pues 136 millones * 1++.+++, y usaremos p,5+" pues no ten$o in%ormacin pre#ia sobre el resultado esperado: n , 1,'6-. / +,5 / 01 1 +,52 3 +,+5-. , 345,16 6* 384 Debo encuestar por lo tanto a 3HF personas para mantenerme dentro de los niveles de error de/inidos$ "i a ra<0 de un estudio reali0ado el a,o anterior obtuvimos (ue el : de brasile,os propietarios de su vivienda era del 20:' * se espera (ue el dato de este a,o no ha*a variado en ms de 6 puntos 3entre 16: * 26:8' podr<amos reempla0ar p por el peor caso esperado P 26:$ El resultado ser<a- n , 1,'6-. / +,.5 / 01 1 +,.52 3 +,+5-. , .44,1. 6* 288
"%ecesito $acer estos c#lculos? Ko' por eso disponemos de una calculadora (ue hace todo el traba4o por ti$ "&lo debes saber (ue el parmetro Rnivel de hetero)eneidadS es esta proporci&n esperada *' (ue en ausencia de in/ormaci&n' debers indicar un valor de 60:$ Esperamos (ue os ha*amos a*udado a interpretar su uso$ 'o(a de c#lculo del tamao de la muestra La ho4a de clculo "#E9" para el tama,o de la muestra puede a*udarle a determinar el tama,o de la muestra$ 2o4a de clculo del tama,o de la muestra +ls' F1Tb 'o(a de c#lculo del muestreo Esta ho4a de clculo le a*udar a seleccionar la muestra para la encuesta "#E9"$ 9rovee ho4as automati0adas para- el clculo de la probabilidad proporcional del tama,o de la muestra la selecci&n aleatoria simple de la muestra la ponderaci&n de los datos$ 2o4a de clculo del muestreo 0ip' 2$00!b