Beruflich Dokumente
Kultur Dokumente
Sara Aguilar-Barojas
Frmulas para el clculo de la muestra en investigaciones de salud
Salud en Tabasco, vol. 11, nm. 1-2, enero-agosto, 2005, pp. 333-338,
Secretara de Salud del Estado de Tabasco
Mxico
Salud en Tabasco,
ISSN (Versin impresa): 1405-2091
revista@saludtab.gob.mx,
imbio_c@imbiomed.com.mx
Secretara de Salud del Estado de Tabasco
Mxico
www.redalyc.org
Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
ARTICULO DE REVISION
RESUMEN INTRODUCCIN
En la investigacin en salud, es muy difcil estudiar a toda la Cuando se desea realizar un estudio, lo que se desea
poblacin que presenta la variable de inters, por lo que es compartir con la comunidad mdica son: 1) observaciones
necesario realizar un muestreo que resulte representativo de realizadas en la prctica cotidiana, 2) datos especficos del
la poblacin objetivo. El clculo de la muestra permite expediente clnico en grupos de pacientes con alguna
responder a la pregunta del investigador de cuntos caracterstica en comn 3) diferencias que se consideran
individuos se deben considerar para estudiar un parmetro importantes al comparar grupos de pacientes.
con un grado de confianza determinado? o cuntos
individuos se deben estudiar para detectar en los resultados En cualquiera de estos tres casos, el clculo del tamao de la
de los dos grupos, una diferencia que sea estadsticamente muestra apoya al objetivo de cualquier investigacin, el cual
significativa? El artculo realiza las consideraciones previas puede ser de dos tipos: a) estimar un parmetro, o b)
sobre la profundidad del estudio y las variables. Presenta contrastar una hiptesis. Entonces, el clculo permite
las frmulas para calcular muestras con variables cualitativas responder a cualquiera de las siguientes preguntas: cuntos
y cuantitativas para estudios descriptivos y explicativos. individuos se deben considerar para estimar un parmetro
En estos ltimos, cuando se utilizan las pruebas de con un grado de confianza determinado? o cuntos
contrastacin de hiptesis ms comunes, como son la Chi individuos se deben estudiar para detectar en los resultados
cuadrada, la t de student y el coeficiente de correlacin de de los dos grupos, una diferencia que sea estadsticamente
Pearson. significativa?
Palabras claves: clculo de muestra, frmulas, muestra El resultado del clculo de una muestra debe considerarse
representativa, investigacin en salud. como orientativo, ya que se fundamenta en supuestos que
pueden ser incorrectos y que en el momento de introducirlos
numricamente en las frmulas, afectan la viabilidad del
SUMMARY estudio, el costo y hasta los aspectos ticos. Por otro lado,
un estudio con una muestra insuficiente, puede afectar la
In health research, is very difficult to study all the population precisin y la sensibilidad para detectar diferencias entre los
that has the interesting attribute, so that, is necessary to grupos y conducir a conclusiones falsas.1
make a sampling representative of the target population.
The sample calculation let answer the research question Existen, por lo menos cuatro razones para estudiar muestras,
about, how many persons we must considerate for study a en vez de poblaciones:
parameter with a specific grade of confidence? Or how many 1) Las muestras pueden estudiarse con ms rapidez
persons we must study for detect in the results of the two que las poblaciones.
groups, a difference significative statistically? The article 2) Es menos costoso estudiar una muestra que una
do the previously considerations about the depth of the poblacin.
study and the attributes. It presents the formulas for calculate 3) En la mayor parte de las situaciones el estudio de la
the sample with qualitative and quantitative attributes for poblacin entera es imposible.
descriptive and explicative research. In the last one, for use 4) Los resultados de una muestra son ms precisos
the tests for contrast the hypothesis must common, like chi que los derivados de poblaciones. Esto es por la
square, t of student and the correlation coefficient of Pearson. calidad de los datos, la capacitacin de quien recoge
Keywords: sample calculation, formulas, representative los datos; la estimacin del error en los parmetros
sample, health research. resultantes y la homogeneidad de las muestras.
(1)
Profesora de bioestadstica en la DACS-UJAT. Coordinadora de la Red Estatal de Laboratorios, Secretara de Salud del estado de
Tabasco.
ARTICULO DE REVISION
En la investigacin mdica, incluir ms sujetos de estudio, Los estudios clnicos son estudios descriptivos a
no es sinnimo de mejor estudio. Por esta razn, se debe de partir de la prctica cotidiana, revisiones de
planear el tamao apropiado de la muestra antes de iniciarlo. expedientes o ambos. En caso de que establecer
Este proceso se conoce como la determinacin de la fuerza una serie de tiempo no sea suficiente, se requiere
o potencia del estudio (1-) cuya definicin es la capacidad calcular una muestra para una sola poblacin.
de un estudio para identificar una diferencia de un tamao En estudios epidemiolgicos pueden ser
2
dado, si en realidad la diferencia existe. encuestas de cualquier tipo. Tambin se requiere
El tamao de la muestra dar la fuerza o potencia del estudio muestra.
(1-), sobre todo en el caso de que se vaya a contrastar una
hiptesis y se pueda cometer cualquiera de los dos tipos de l Nivel III, de correlacin. Buscan las relaciones o
errores, el tipo I, que consiste en rechazar una hiptesis asociaciones entre los factores estudiados. Son
nula, cuando es cierta y el II en aceptarla cuando es falsa. estudios observacionales, estudian dos
Un buen clculo de muestra nos protege de ignorar una poblaciones y verifican hiptesis.
diferencia significativa entre los dos grupos y, por lo tanto,
de cometer el error tipo II. Es importante recordar que la Clculo de la muestra:
Hiptesis Nula (Ho) es un enunciado que afirma que no hay Los estudios clnico-epidemiolgicos son casos y
diferencia entre el valor XA del grupo A y el valor XB del controles y de cohorte, que s requieren de calcular
grupo B. Mientras que la Hiptesis alternativa (H1) es un muestra en las poblaciones para establecer de
enunciado en desacuerdo con la hiptesis nula, que enuncia: antemano su potencia.
si hay diferencia entre el valor XA del grupo A y el valor X
B del grupo B. l Nivel IV, explicativos. Buscan establecer las causas
de las asociaciones. Son estudios cuasi-
I.- CONSIDERACIONES PREVIAS experimentales o experimentales, comparan dos
poblaciones y verifican hiptesis.
El tamao de la muestra necesario depender bsicamente
del nivel de la investigacin y las variables insertadas en el Clculo de la muestra:
objetivo de la investigacin. Los estudios epidemiolgicos son intervenciones
en poblaciones con seguimiento de la cohorte y
a) .- Con respecto al nivel de la investigacin son altamente exigentes en los valores que se
introducen para el clculo de la muestra para las
l Nivel I, de tipo exploratorias. Son investigaciones dos poblaciones que se van a comparar.
que responden preguntas sencillas para determinar
si hay o no hay tal o cual caracterstica. Aqu solo Los estudios clnicos son ensayos aleatorizados,
se van a estimar parmetros de la poblacin, su casi siempre para probar la efectividad de un
presencia y magnitud. Son estudios tratamiento. Tambin son altamente exigentes en
observacionales de una poblacin. los valores que se introducen para el clculo de la
muestra para las dos poblaciones, los que recibirn
Clculo de la muestra: el tratamiento y los controles.
Los estudios exploratorios de tipo clnico pueden
ser series de casos, donde no se requiere clculo Los experimentos puros se realizan en laboratorios
de la muestra, pues se presentan todos los casos de investigacin en animales y se calcula el nmero
que se hayan tenido. de repeticiones que se tienen que realizar. A pesar
En estudios epidemiolgicos, pueden ser clculos de que son los ms poderosos, por el riguroso
de prevalencia, encuestas de opinin, encuestas control de las variables confusionales, se utilizan
serolgicas. En este caso se calcula una muestra pocos sujetos de estudio. En este tipo de diseos
para una sola poblacin. a medida que las repeticiones aumentan, las
estimaciones de las medias observadas, se hacen
l Nivel II, de tipo descriptivo. En estos estudios se ms precisas. Ambas se influyen mutuamente, de
trata de realizar una descripcin detallada de las tal forma que, a mayor nmero de repeticiones
3
caractersticas que presenta el sujeto en estudio. mayor grado de precisin y viceversa.
Son estudios observacionales en un solo tipo de
poblacin. b) .- Con respecto a la variable insertada en el objetivo
Clculo de la muestra: general.
ARTICULO DE REVISION
An cuando varios autores mencionan que hay que tomar se puede apreciar, el que nos pidan los datos de algo que
4
en cuenta los objetivos de la investigacin, para no an no estudiamos, resulta sumamente confuso. Sin
confundir al lector es mejor precisar que es con respecto al embargo, s hay solucin a este problema.
objetivo general, sin tomar en cuenta los objetivos Estos datos se pueden obtener de tres formas: 1) de estudios
especficos. Ese objetivo general, que se desprendi de una reportados en revistas, con una poblacin parecida o similar
pregunta de investigacin, lleva insertada la variable de a la que queremos estudiar; 2) con un estudio piloto de 25
inters. Hay que determinar si es una variable cualitativa, sujetos, o 3) si no se pude lo anterior, se asigna la mxima
con escala nominal u ordinal, o cuantitativa con escala probabilidad con que se puede presentar la variable en
discreta o continua. cuestin, que es, en variables cualitativas del 50% y en el
caso de variables cuantitativas se determina la diferencia
En las variables cualitativas hay dos tipos de posibilidades: entre el mximo y el mnimo valor esperable, se divide entre
a) nominales, que pueden ser dicotmicas o multicotmicas cuatro y, por lo tanto, se tiene una cierta aproximacin al
5
y b) ordinales. En ambos casos los resultados se expresan valor de la desviacin estndar.
como porcentajes o tasas, datos que se introducen en la
frmula para el clculo de la muestra. El nivel de confianza deseado (Z). Indica el grado de
confianza que se tendr de que el valor verdadero del
En variables cuantitativas tambin hay dos tipos de parmetro en la poblacin se encuentre en la muestra
posibilidades: a) discretas, cuando los resultados se expresan calculada. Cuanta ms confianza se desee, ser ms elevado
numricamente, pero no aceptan fracciones, por ejemplo, el nmero de sujetos necesarios. Se fija en funcin del
nmero de dientes, nmero de hijos, etc. y b) continuas, inters del investigador. Los valores ms comunes son 99%
cuando los resultados numricos s aceptan fracciones, como 95% o 90%. Hay que precisar que los valores que se
peso, estatura, todos los parmetros de qumica sangunea, introducen en la frmula son del clculo del rea de la curva
etc. En ambos casos los resultados se resumen en forma de normal para esos porcentajes sealados:
medias y varianzas, mismas que se introducen en la frmula
del clculo de la muestra. Nivel de Valor de Z calculado
Es importante destacar, que las variables cuantitativas son % Error
Confianza en tablas
ms poderosas para el anlisis estadstico y no hay que
1 99 % 2.58
convertirlas en cualitativas. Por ejemplo, para la variable
5 95 % 1.96
obesidad, es mejor analizar el ndice de masa corporal, que
10 90 % 1.645
es la razn peso/talla, de tipo continua, que escoger la escala
de obeso y no obeso.
A veces se afirma errneamente, por ejemplo, que un nivel
II.- CLCULO DEL TAMAO DE LA MUESTRA de confianza al 95%, con relacin a la media muestral, da la
Para el clculo de la muestra debe conocerse: amplitud dentro de la cual se encontrar el 95% de futuras
medias muestrales. Esto es incorrecto, ya que la distribucin
La variabilidad del parmetro que se desea estudiar (p, q, de medias muestrales se centra en la media poblacional y no
S). Aunque esto parezca paradjico, ya que de eso se trata en la media muestral particular. La mayora de este tipo de
precisamente la investigacin, hay que conocer, cmo se afirmaciones son desorientadoras e incorrectas.3 Lo que s
presenta en la poblacin la variable que se quiere estudiar. se puede afirmar es que se tiene el 95% de probabilidad de
La primera reflexin que asalta al investigador es: si supiera que el valor verdadero de lo que se est estudiando en la
cmo se presenta, no estara diseando una investigacin poblacin, se encuentre en la muestra calculada.
para conocerla, cmo me piden eso? La precisin absoluta (d) . Es la amplitud deseada del
Si se trata de variables cualitativas, se necesita conocer el intervalo de confianza a ambos lados del valor real de la
porcentaje con que se presenta la variable en la poblacin. diferencia entre las dos proporciones (en puntos
Por ejemplo, si deseamos conocer la presencia de hbito porcentuales). Su uso es para dejar margen al error aleatorio
tabquico en los mdicos, debemos saber qu porcentaje de exigido en el modelo lineal aditivo, el cual expresa que la
mdicos fuman (p) y qu porcentaje no fuman (q) justamente observacin i-sima es una observacin de la media , pero
en la poblacin que deseamos estudiar. Si es una variable est sujeta a un error de muestreo i (psilon sub i). El
3
cuantitativa, cul es la desviacin estndar (S) con que se modelo lineal aditivo ms simple es:
presenta en la poblacin. Por ejemplo, si queremos realizar
una investigacin para establecer los picogramos sricos Yi= + i
de nicotina en los fumadores, debemos precisar la media
que esperamos encontrar y su desviacin estndar. Como Cuanta ms precisin se desee, ms estrecho ser este
ARTICULO DE REVISION
% Valor d Z2 pq
90 0.1 n=
d2
95 0.05
99 0.001
b) Para poblacin finita (cuando se conoce el total de
La precisin tambin puede expresarse de forma relativa () unidades de observacin que la integran):
con respecto a la estimacin. La diferencia con la absoluta
es que esta ltima se expresa en puntos porcentuales, N Z2 pq
n=
mientras que la relativa es en porcentaje y los ms comunes d (N - 1) + Z2 pq
2
( Z + Z )
2
2
Z 1(1 1) + Z 0 (1 0 ) n= 2
n=
1 0
Frmula: Frmula:
2
( Z + Z )
0.5 ln [(1 + r ) /(1 r )] + 3
1 1
[
* + *
] [ *
P1 (1 P1 ) P2 (1 P2 )
*
] N=
n = Z 21 a / 2
[log e(1-)] 2