Sie sind auf Seite 1von 18

10

METODOS ESTADISTICOS

José Jiménez

La estadística puede definirse como un organización, presentación y síntesis de


método de razonamiento que permite datos de una manera científica, y esta-
interpretar datos cuyo carácter esencial dística inferencial, que comprende las
es la variabilidad. Está presente en la bases lógicas mediante las cuales se
práctica médica cada vez con más fre- establecen conclusiones relacionadas
cuencia y en muy diversas formas, con poblaciones a partir de los resulta-
desde las estadísticas de actividad de dos obtenidos en muestras. Las técnicas
un hospital o los resultados de audito- estadísticas pueden utilizarse para con-
rías, por ejemplo, hasta los hallazgos de firmar hipótesis de trabajo o bien para
estudios de investigación que aparecen explorar conjuntos de datos sin hipóte-
en la literatura médica. sis previas. Ambas finalidades, la con-
firmación y la exploración, están vincu-
En investigación, la finalidad de la esta- ladas a la naturaleza de los objetivos
dística es utilizar datos obtenidos en del estudio, a la actitud con que el
una muestra de sujetos para realizar investigador se enfrenta a los datos y a
inferencias válidas para una población los términos en que deberán interpre-
más amplia de individuos de caracterís- tarse los resultados. Una hipótesis se
ticas similares. La validez y utilidad de confirma cuando se diseña un estudio
estas inferencias dependen de cómo el con el propósito de hacerlo. Se explora
estudio ha sido diseñado y ejecutado, cuando se rastrean datos en busca de
por lo que la estadística debe conside- información, sin objetivos concretos y
rarse como una parte integrante del formales que hayan gobernado el dise-
método científico. Muchos profesiona- ño del estudio. La exploración puede
les creen que se trata simplemente de servir para sugerir nuevas hipótesis,
un conjunto de fórmulas y cálculos pero de ningún modo para contrastar-
matemáticos que se aplican a un con- las, sino que la confirmación deberá
junto de datos. Si bien el análisis de obtenerse en un nuevo estudio diseña-
datos es la parte más visible de la esta- do específicamente para ello.
dística, deben tenerse en cuenta los
aspectos metodológicos relacionados Para las finalidades de este capítulo,
con el estudio. La justificación del aná- consideraremos que existen dos gran-
lisis no radica en los datos, sino en la des tipos de estudio: los que tienen por
forma en que han sido recogidos. objetivo estimar un parámetro a partir
de observaciones obtenidas en una
Habitualmente se distingue entre esta- muestra (por ejemplo, determinar el
dística descriptiva, que comprende la porcentaje de errores de medicación en
J. Jiménez

un hospital), y los que contrastan hipó- los criterios de selección establecidos


tesis mediante la comparación de dos o en el protocolo del estudio.
más grupos (por ejemplo, determinar
cuál de dos estrategias es más eficaz Muestra o conjunto de individuos real-
para reducir el porcentaje de infeccio- mente estudiados.
nes quirúrgicas).
La validez de las conclusiones de un
estudio dependen de cómo haya sido
ESTUDIOS DE ESTIMACION diseñado, de si la muestra es represen-
DE UN PARAMETRO tativa, de si no se han producido pérdi-
das o no respuestas, de si las medicio-
Principio de representatividad nes se han realizado correctamente y
son de calidad, etc. (validez interna).
En estadística, el término población se Por otro lado, la capacidad para genera-
utiliza para describir todas las posibles lizar las conclusiones o extrapolarlas a
observaciones de una determinada otras poblaciones diferentes de la estu-
variable o todas las unidades sobre las diada dependen de las diferencias entre
que podría haberse realizado una obser- la población diana y la de estudio, y
vación. Puede tratarse de pacientes, de entre éstas y la población a la que se
profesionales o de prescripciones tera- quiera aplicar los resultados (validez
péuticas, por ejemplo. Habitualmente externa).
se estudian muestras en lugar de pobla-
ciones por criterios de eficiencia. El tér- Para que los resultados de un estudio
mino muestra se refiere a cualquier tengan validez interna, la muestra de
conjunto específico de sujetos u obser- sujetos estudiada debe ser representati-
vaciones procedentes de una población va de la población de estudio (principio
determinada. Para que sea útil y la esta- de representatividad). Este principio
dística aplicable, se requiere que la puede verse comprometido cuando la
muestra tenga un tamaño razonable y muestra inicial ha sido mal selecciona-
sea representativa de la población de la da, cuando, aunque se haya utilizado
que procede. Un tamaño elevado no una técnica de muestre0 adecuada, la
asegura la representatividad, sino que variabilidad aleatoria (el azar) ha hecho
ésta radica básicamente en que la mues- que se obtenga una muestra no repre-
tra haya sido escogida adecuadamente sentativa, o bien cuando la muestra de
y esté libre de sesgos. sujetos finalmente analizados está ses-
gada debido a las no respuestas (sujetos
En cualquier estudio pueden conside- de los que no se ha podido obtener la
rarse tres niveles de población: información deseada).

Población diana, a la que hace referen- Intervalos de confianza


cia el objetivo del estudio, y a la que se
desearía generalizar los resultados. En un estudio, tan sólo se estudia una
de las múltiples muestras que podrían
Población de estudio, a la que se tiene haberse obtenido de la población de
la intención de estudiar, definida por referencia. Si se estudiara más de una,
Métodos estadísticos

en cada una de ellas el resultado podría ción. Dado que diferentes muestras
presentar valores diferentes simplemen- podrían conducir a diferentes resulta-
te por azar. Las diferentes técnicas de la dos, se necesita una medida de la pre-
estadística inferencia1 se fundamentan cisión de esta estimación, lo que se
en que esta variabilidad inherente al hace mediante el cálculo del llamado
proceso de muestre0 sigue unas leyes intervalo de confianza (IC). Por ello,
conocidas y puede ser cuantificada. siempre que se estimen parámetros
poblacionales a partir de estadísticos
Si la variable es cuantitativa, la media m muestrales, los resultados deben expre-
y la desviación estándar s observadas en sarse como IC, y no sólo como estima-
la muestra son la mejor estimación que ciones puntuales.
se dispone de los verdaderos valores de
los parámetros poblacionales. Pero Si se desea una confianza del 95% en la
¿cuáles serían los resultados si se repi- estimación, se trabaja con un valor a
tiera el estudio en múltiples ocasiones? del 5%, que corresponde a un valor Z
(distribución normal tipificada) de
Supongamos que en una muestra de 60 1.96. En el ejemplo, aplicando la fór-
sujetos se observa una media de tensión mula de la tabla 1, se obtendría un IC
arteria1 sistólica (TAS) de 150 mmHg del 95% que sería aproximadamente de
con una desviación estándar de 20 150 2 5 mmHg, lo que significa que la
mmHg. Se desea conocer el verdadero TAS media de la población de referen-
valor de la TAS media en la población cia está situada entre 145 y 155 mmHg
de referencia. El valor más probable es con un 95% de confianza. De forma
el observado en la muestra (150 similar se calcularía el IC en el caso de
mmHg), conocido por ello como esti- una variable cualitativa (tabla 1).
mación puntual. Pero éste no es más
que el resultado observado en una de El cálculo del IC proporciona mucha
las múltiples muestras que hubieran más información que la simple estima-
podido obtenerse de la misma pobla- ción puntual, ya que permite evaluar la

Tabla 1.Cálculo del intervalo d e confianza (IC) e n la estirn~iGn-de-


un parámetro poblacional.

IC DE UNA MEDIA (variable cuantitativa)*: m I( Z . ESM ) siendo ESM = s 6


IC DE UNA PROPORCION (variable cualitativa)**: p I( Z - ESP ) siendo ESP=-4
m: Media observada en la muestra; S: Desviación estandar observada en la muestra; n: Número de indi-
viduos de la muestra; ESM: Error estándar de la media; p: Proporción observada en la muestra, ESP:
Error estándar de la proporción; Z: Valor de la variable normal tipificada correspondiente al valor a
para un nivel de confianza (1-a).

(*) Este cálculo se basa en la distribución normal. El valor de Z para un IC del 95% es 1.96. Para mues-
tras de tamaño inferior a 30 individuos, este valor debe sustituirse por el de la distribución de la t de
Student-Fisher para (n-1) grados de libertad.

(* *) Las variables cualitativas no presentan una distribución normal. Las fórmulas de la tabla se basan
en una aproximación a la normalidad, aplicable cuando los productos n.p y n.(l-p) son mayores de 5.
J. Jiménez

precisión con que el parámetro pobla- parámetro con poca precisión. La


cional ha sido estimado, es decir, entre amplitud del IC, es decir, la precisión
qué límites se tiene una determinada de la estimación, depende del nivel de
confianza de que esté situado su verda- confianza utilizado, de la variabilidad
dero pero desconocido valor. Si se repi- del parámetro de interés y del número
tiera el estudio en 100 ocasiones, el IC de sujetos estudiados. Cuanto menor
incluiría el verdadero valor en 95 de sea la variabilidad del parámetro y
ellas. mayor el número de sujetos, mayor pre-
cisión existirá en la estimación para un
De las fórmulas se deduce que un nivel de confianza determinado.
aumento del número de sujetos produ-
ce un estrechamiento del intervalo, Para el cálculo del tamaño de la mues-
aumentando así la precisión de la esti- tra debe conocerse:
mación. Su amplitud depende también
del nivel de confianza que se utilice, La variabilidad del parámetro que se
aumentando si se incrementa su valor desea estimar. Si no se conoce, puede
convencional del 95% al 99%, por obtenerse una aproximación a partir de
ejemplo. datos propios o de otras investigacio-
nes, o un estudio piloto. En el caso de
En el cálculo del IC se asume que se ha las variables cuantitativas se mide por
estudiado una muestra aleatoria de la la variancia, y en el de las cualitativas,
población de referencia. Al interpretar- por el producto p-(1-p).
lo, hay que tener siempre en cuenta la
posibilidad de existencia de otras fuen- La precisión con que se desea obtener
tes de error no debidas al azar (errores la estimación, es decir, la amplitud
sistemáticos o sesgos). Si éstos existen, deseada del IC. Cuanto mayor precisión
o si la muestra no es aleatoria, el error se desee, más estrecho deberá ser este
de la estimación puede ser mayor que el intervalo, y más sujetos deberán ser
sugerido por la amplitud del intervalo. estudiados.

Tamaño de la muestra El nivel de confianza deseado.


Habitualmente se fija en el 95%. Este
En cualquier estudio, es importante valor indica el grado de confianza que
determinar a priori el número de suje- se tendrá de que el verdadero valor del
tos que es necesario incluir, aunque el parámetro en la población se sitúe en el
resultado de este cálculo debe conside- intervalo obtenido. Cuanto más con-
rarse como orientativo, ya que se basa fianza se desee, mayor será el número
en asunciones que pueden ser incorrec- de sujetos necesario.
tas. La inclusión de un número excesi-
vo de sujetos encarece el estudio, tanto De estos tres elementos, sólo debe cono-
desde el punto de vista económico cerse la variabilidad del parámetro, ya
como de los recursos humanos y físicos que tanto la precisión como el nivel de
necesarios. Por otra parte, un estudio confianza son fijados en función de los
con un tamaño insuficiente estimará un intereses del investigador.
Métodos estadísticos

Estimación de una proporción investigadores desean presentar el


resultado en función del sexo, la estra-
La fórmula para el cálculo del número tificación hará que la estimación se
de sujetos necesarios para estimar una haya obtenido en un número menor de
proporción se presenta en la tabla 2. sujetos por lo que la precisión en cada
Supongamos que se desea estimar el estrato será menor de la deseada.
porcentaje de pacientes ingresados en
un servicio que requieren una dieta En algunas ocasiones no se conoce el
determinada. A partir de datos previos valor aproximado del parámetro que se
se supone que debe estar situado alre- está buscando. Si no existen datos de la
dedor del 40% (p=0,40). Se quiere rea- literatura que resulten útiles, o si no
lizar la estimación con una precisión de puede realizarse una prueba piloto para
24 % (i=0,04)y una confianza del 95% obtener una primera aproximación a
(1-a =0,95; Z =1,96). Aplicando la fór- dicho valor, puede adoptarse la postura
mula, puede determinarse que serían de la máxima indeterminación, que
necesarios 576 sujetos. Esta cifra se consiste en suponer que el porcentaje
convierte en 9.220 cuando se desea una que se desea estimar se sitúa alrededor
precisión muy alta (i=0,01), o en tan del 50%, ya que es el valor que requie-
sólo 92 si se es menos exigente (i=0,1). re una mayor cantidad de individuos
para una precisión determinada.
Modificando cualquier valor, puede
obtenerse un número de sujetos que se Estimación de una media
aproxime al "deseado" o al disponible.
Debe evitarse esta manipulación del Cuando el objetivo del estudio es esti-
cálculo ya que, al reducir el número de mar una media, el cálculo del número
sujetos que se van a estudiar, también de sujetos necesario es similar (tabla 2),
disminuye el grado de precisión con con la diferencia que la medida de la
que el parámetro va a ser estimado y variabilidad es la variancia de la distri-
aumenta la amplitud del IC. bución de la variable en la población.
Supongamos que desea estimar la ten-
En el cálculo del tamaño de la muestra sión arteria1 diastólica (TAD) de los
debe tenerse en cuenta también la estra- pacientes diabéticos ingresados en un
tegia de análisis y cómo se presentarán servicio. Por estudios previos, se cono-
los resultados. Así, por ejemplo, si los ce que la desviación estándar de la TAD

Tabla 2. Fórmulas para el cálculo del número de sujetos necesarios para la realización de
un estudio cuyo objetivo es la estimación de una media o una proporción.

ESTIMACION DE UNA PROPORCION (Variable cualitativa) N = ( z 2 - ~ . ( 1 - ~ ) ) / i 2

ESTIMACION DE UNA MEDIA (Variable cuantitativa) N = (Z2-s2)/i2

N: Número de sujetos necesarios; Z:Valor de Z correspondiente al riesgo a fijado (cuando cr=0,05,


Z=1,96);P: Valor de la proporción que se supone existe en la población; s2:Variancia de la distribución
de la variable cuantitativa que se supone que existe en la población.
i: Precisión con que se desea estimar el parámetro (2i es la amplitud del intervalo de confianza).
J. Jiménez

en sujetos diabéticos es de 25 mmHg no respuestas que se espera que se pro-


(s=25 rnrnHg; s2=625 mrnHg). Se desea duzcan, de forma que se asegure que se
realizar la estimación con una confian- obtendrá información del número de
za del 95% (1-a=0,95) y una precisión pacientes deseado. Una fórmula para
de 15 mmHg (i=5). Aplicando la fórmu- hacerlo es la siguiente:
la, se puede determinar que son necesa-
rios 96 sujetos.

Corrección para poblaciones finitas donde N representa el número de suje-


tos teórico, Na el número de sujetos
En los cálculos anteriores no ha inter- ajustado y R la proporción esperada de
venido el tamaño de la población, ya no respuestas.
que se ha asumido que es infinito. Sin
embargo, en muchas ocasiones, desea Supongamos que para realizar un estu-
obtenerse una muestra de una pobla- dio se ha calculado que son necesarios
ción de tamaño conocido (finito). En 300 sujetos (N=300)y que se espera un
esta situación, puede aplicarse la 20% de no respuestas (R=0,20). El
siguiente fórmula que ajusta el número número de sujetos que deberían iniciar
de sujetos necesarios en función del el estudio sería Na=300(1/(1-0,2))=375
tamaño de la población: sujetos.

La utilización de esta fórmula asegura


que el estudio mantenga la potencia
estadística deseada pero no evita que se
donde n, es el número de sujetos nece- puedan producir sesgos si las no res-
sarios, n es el número de sujetos cal- puestas no se han producido aleatoria-
culado para poblaciones infinitas y N mente, es decir, si los sujetos de los que
es el tamaño de la población de refe- no se obtiene información son diferen-
rencia. tes de aquellos de los que sí se obtiene
(lo que suele ser lo habitual).
En el ejemplo en que se había calculado
que eran necesarios 576 sujetos para
estimar el porcentaje de pacientes
ingresados que requerían una dieta, si Para que se cumpla el principio de
la población de referencia fuera de 1000 representatividad, debe prestarse aten-
sujetos, aplicando la fórmula anterior ción al proceso de selección de los suje-
podría determinarse que son necesarios tos, utilizando una técnica de muestreo
365 pacientes pacientes. adecuada que aumente la probabilidad
de obtener una muestra representativa.
Corrección según el porcentaje
esperado de no respuestas El muestreo probabilístico se define
como el proceso de selección en que
El número de sujetos calculado debe ser todos los individuos candidatos tienen
ampliado en función del porcentaje de una probabilidad conocida, distinta de
Métodos estadísticos

cero, de ser incluidos en la muestra, aparición de sesgos debidos a las mis-


utilizándose alguna forma de selección mas. La población se divide en estratos
aleatoria para obtener las unidades que en función de las categorías de las
serán estudiadas. Tiende a asegurar que variables por las que se desea estratifi-
se obtendrá una muestra representativa, car, es decir, se forman subgrupos de
especialmente si la población y la población que comparten alguna carac-
muestra son de gran tamaño, pero tam- terística en común y son mutuamente
bién puede ocurrir que no sea así, ya excluyentes. A continuación, se escoge
que el propio azar puede conducir a una muestra al azar en cada estrato,
una muestra que no tenga la misma dis- habitualmente manteniendo las propor-
tribución de las variables de interés que ciones observadas en la población de
la población de referencia, especial- referencia (muestreo aleatorio estratifi-
mente si su tamaño es reducido. cado proporcional). Es preciso que los
estratos se delimiten en función de
La unidad de muestreo es el elemento variables que puedan influir sobre los
sobre el que se aplica la técnica de resultados.
selección, ya sean personas, servicios u
hospitales. La unidad de muestreo no El muestreo en múltiples etapas consis-
tiene por qué coincidir con la unidad te en seleccionar unidades de muestreo
de análisis. En un estudio para conocer de una población (unidades primarias,
la frecuencia de errores de medicación por ejemplo, servicios), y, en una
en un hospital, la unidad de muestreo segunda etapa, obtener una muestra de
pueden ser los servicios, y analizar en cada una de las unidades primarias
una muestra de ellos las prescripciones seleccionadas (unidades secundarias,
terapéuticas. por ejemplo, pacientes ingresados). Se
pueden usar el número de etapas que
En las técnicas probabilísticas la selec- sean necesario y, en cada una de ellas,
ción de las unidades se realiza al azar, un método diferente de muestreo (sim-
evitando la posible parcialidad, cons- ple, estratificado, sistemático). Cuando
ciente o inconsciente, de los investiga- se incluyen todas las unidades secun-
dores. Por esta razón, es más probable darias, se denomina muestreo en con-
que las muestras tiendan a ser repre- glomerados.
sentativas de la población de referen-
cia. En el muestreo aleatorio simple, se El muestreo sistemático se basa en apli-
prepara un listado de las unidades de car alguna regla sistemática simple,
muestreo, numerándolas, por ejemplo, como elegir uno de cada n individuos.
secuencialmente, y a continuación, se En primer lugar, se calcula la constante
seleccionan tantos números aleatorios de muestreo k, dividiendo el tamaño de
como elementos debe tener la muestra. la población candidata por el de la
El muestreo aleatorio estratificado es muestra. A continuación, se extrae la
una modificación que intenta asegurar primera unidad al azar entre las k pri-
que la muestra presenta la misma dis- meras unidades de muestreo y se le
tribución que la población en relación a suma la constante sucesivamente hasta
determinadas variables, previniendo la completar el tamaño de la muestra.
J. Jiménez

Tiene la ventaja de que es más cómodo control es proporcionar una estima-


y práctico que el muestreo aleatorio ción del valor de la variable de res-
simple, y de que no siempre es necesa- puesta en ausencia del factor de estu-
rio tener de antemano una lista comple- dio. En otras palabras, debe permitir
ta y exhaustiva de toda la población. aislar el efecto del factor de estudio del
Además, cuando la población de refe- debido a otros factores, por lo que el
rencia está ordenada siguiendo una ten- grupo control debe ser comparable al
dencia conocida (de mayor a menor, de de estudio en todas aquellas variables
más viejo a más joven...), el muestreo que puedan influir sobre la respuesta o
sistemático asegura una cobertura de su medición.
unidades de todos los tipos.
El proceso de formación de los grupos
En muchos estudios, bien porque no se depende del tipo de estudio. En los
dispone de un listado con los miembros diseños observacionales, se realiza en
que forman la población de estudio o función de la existencia o no de la
bien porque ésta es dinámica, la mues- enfermedad de interés (estudios de
tra de sujetos se selecciona por otros casos y controles) o de la presencia o no
métodos no probabilísticos (por ejem- de la exposición (estudios de cohortes).
plo, incluyendo consecutivamente a los En los estudios experimentales, los
pacientes que acuden a la consulta y sujetos son asignados a los diferentes
cumplen los criterios de selección, o a grupos que se desea comparar por un
voluntarios). En estos casos, para poder procedimiento aleatorio.
realizar inferencias válidas, debe
poderse asumir que la muestra seleccio- Contraste de hipótesis
nada es repiesentativa de la población
de estudio. La aplicación más frecuente de la infe-
rencia estadística en investigación
médica son las llamadas pruebas de
ESTUDIOS DE CONTRASTE DE contraste de hipótesis o de significa-
HIPOTESIS ción estadística. Supongamos que exis-
te interés en comparar dos tratamientos
Principio de comparabilidad (un diurético D y el tratamiento están-
dar E), y determinar cuál de ellos es el
En los estudios analíticos, además del más eficaz en el control de las cifras
principio de representatividad, debe tensionales. Para ello, se diseña un
cumplirse el de comparabilidad de los ensayo clínico controlado, distribuyen-
grupos. Estos estudios se basan en que do aleatoriamente una muestra de
los grupos son comparables por todos pacientes hipertensos en dos grupos,
los factores pronósticos y en que se ha cada uno de los cuales recibe uno de los
obtenido la información de la misma tratamientos. A los tres meses, el por-
forma en todos ellos, de manera que las centaje de individuos controlados en
diferencias en los resultados observa- cada grupo es del 70 y 50%, respectiva-
dos puedan atribuirse al factor que se mente. ¿Qué conclusión puede obtener-
está estudiando. La función del grupo se a la vista de estos resultados?
Métodos estadísticos

Lo que se quiere determinar es hasta previamente. De forma arbitraria, y por


qué punto es posible que la diferencia convenio, suele fijarse este valor en el
observada sea debida exclusivamente al 5% (0,05).
azar (variaciones del muestreo).
Supongamos que en el ejemplo se
Hipótesis nula e hipótesis alternativa obtiene un valor de p de 0,10. Esto sig-
nifica que, si Ho fuera cierta, la proba-
La hipótesis que en realidad se va a con- bilidad de que el azar pueda producir
trastar estadísticamente es la de que no unos resultados como los observados es
existen diferencias entre los porcentajes del lo%, o bien, que existe un 10% de
de hipertensos controlados observados probabilidad de que dos muestras del
en ambos grupos. La prueba de signifi- tamaño de las estudiadas obtenidas de
cación estadística intentará rechazar una misma población presenten unos
esta hipótesis, conocida como hipótesis porcentajes del 70 y 50% sólo por
nula Ho. Si lo consigue, se aceptará la variabilidad aleatoria. Si se había prefi-
hipótesis alternativa Ha de que existen jado el valor 0,05 para el nivel de signi-
diferencias entre ambos grupos. ficación, dado que el valor de p obteni-
do es superior, se considerará que la
El primer paso es, pues, formular la Ho. probabilidad de haber obtenido estos
A continuación, se calcula, mediante la resultados por azar es demasiado eleva-
prueba estadística más adecuada, la da y que, por tanto, no se dispone de la
probabilidad de que los resultados suficiente evidencia para rechazar la
observados puedan ser debidos al azar, Ho. Se concluye que no se han encon-
en el supuesto de que Ho sea cierta. En trado diferencias estadísticamente sig-
otras palabras, la probabilidad de que, a nificativas en el porcentaje de pacientes
partir de una población de referencia, controlados en ambos grupos. No se
puedan obtenerse dos muestras que concluye que ambos grupos son igua-
presenten unos porcentajes tan diferen- les, sino que no se ha encontrado la
tes como los observados. Esta probabili- suficiente evidencia para decir que son
dad es el grado de significación estadís- diferentes.
tica, y suele representarse con la letra p.
Basándose en su valor, se decide si se Supongamos que se hubiera obtenido un
rechaza o no Ho. Cuanto menor sea la p, valor de p de 0,02. Como este valor es
es decir, cuanto menor sea la probabili- inferior al nivel de significación del
dad de que el azar pueda haber produ- 0,05, se considerará que la diferencia
cido los resultados observados, mayor observada es estadísticamente significa-
será la evidencia en contra de Ho, y, por tiva, ya que es poco probable (p<5%)
lo tanto, mayor será la tendencia a con- que el azar pueda haber producido estos
cluir que la diferencia existe en la reali- resultados si la Ho fuera cierta. Se con-
dad. El valor de p por debajo del cual se cluye por tanto que existe una diferencia
considerará que se dispone de la sufi- entre los grupos. La respuesta a la pre-
ciente evidencia en contra de Ho para gunta de si esta diferencia es debida al
rechazarla, conocido como el nivel de nuevo tratamiento dependerá del diseño
significación estadística, debe fijarse y ejecución correctas del estudio.
J. Jiménez

El verdadero interés de la p es el de per- Error a y error p


mitir descartar que la diferencia obser-
vada es fruto de la variabilidad aleato- En estadística no puede hablarse de cer-
ria. No es una medida de la fuerza de la teza absoluta, sino de mayor o menor
asociación. Un estudio en el que se probabilidad. Sea cual sea la decisión
obtenga una p<0,001 no quiere decir que se tome respecto a la Ho, se corre
que la asociación encontrada sea más un cierto riesgo de equivocarse (tabla
fuerte (o la diferencia más importante) 3). La realidad no es conocida, ya que,
que otro estudio en que la p sea del si lo fuera, no sería necesario realizar el
0,05. Sólo quiere decir que es más estudio. Si no se rechaza la Ho, y ésta es
improbable que su resultado sea debido cierta, no se comete ningún error. Si se
al azar. Por ello, no hay que ser excesi- rechaza y es falsa, tampoco se comete
vamente rígido en el límite del nivel de un error. Pero, ¿qué pasa en las otras
significación. Un valor p de 0,048 es situaciones?
estadísticamente significativo al nivel
del 5%, y uno de 0,052, en cambio, no En un estudio, puede concluirse que
lo es, pero en ambos casos la probabili- existen diferencias cuando de hecho no
dad de observar el resultado por azar es las hay. Es decir, puede rechazarse Ho
prácticamente la misma, y muy próxi- cuando es cierta. Si ésto ocurre, la deci-
ma al 5%. sión es incorrecta y se comete un error,
conocido como error tipo 1 o error a. La
Pruebas unilaterales y probabilidad de cometer este tipo de
pruebas bilaterales error es la de que se concluya que exis-
ten diferencias significativas cuando en
En ocasiones, lo que interesa no es realidad son debidas al azar. Si se hace
determinar si existen o no diferencias un símil entre una prueba estadística y
entre dos tratamientos, sino evaluar si una diagnóstica, equivale a la probabili-
un nuevo fármaco es mejor que otro. En dad de obtener un resultado falso posi-
este caso, la hipótesis alternativa no es tivo. Esto es precisamente lo que mide
que D y E difieren, sino que D es mejor el valor de p o grado de significación
que E. Por tanto, la Ho que se va a con- estadística.
trastar es que D no difiere o es peor que
E. Dado que sólo interesa un sentido de Si, por el contrario, se concluye que no
la comparación, se habla de pruebas existen diferencias estadísticamente
unilaterales o de una cola. significativas, es decir, si no puede
rechazarse la Ho, puede ocurrir que en
Este hecho no afecta al cálculo del esta- realidad ésta sea falsa y sí existan dife-
dístico, sino que modifica el grado de rencias entre ambos grupos, en cuyo
significación. Como la distribución de caso se comete otro tipo de error, lla-
Z sigue la ley normal, y por lo tanto es mado error fl o tipo 11. Utilizando el
simétrica, en las pruebas unilaterales el símil con la prueba diagnóstica, equiva-
verdadero valor de p es la mitad del le a la probabilidad de obtener un resul-
valor a, dado que sólo se está interesa- tado falso negativo. Su valor comple-
do en uno de los extremos. mentario (1-B), denominado potencia o
Métodos estadísticos

Tabla 3. Tipos de error aleatorio en una prueba estadística de contraste de hipótesis.

REALIDAD (POBLACION)

EXISTE DIFERENCIA NO EXISTE DIFERENCI


O ASOCIACION(Ho falsa) O ASOCIACION(Ho cierl

DIFERENCIA O
ASOCIACION NO ERROR ERROR TIPO 1
SIGNIFICATIVA a
RESULTADO (Rechazo de Ho)
DE LA PRUEBA
(MUESTRA) DIFERENCIA O
ASOCIACION ERROR TIPO 11 NO ERROR
NO SIGNIFICATIVA P
(No rechazo de Ho)
Ho: Hipótesis nula

poder estadístico, indica la capacidad p (y, por lo tanto, resultados estadísti-


que tiene la prueba para detectar una camente significativos), simplemente
diferencia cuando ésta ya existe en la estudiando un elevado número de suje-
realidad. tos ya que al aumentar el tamaño de la
muestra, se incrementa el poder esta-
Lógicamente, cuanto mayor es la dife- dístico para detectar incluso pequeñas
rencia existente entre dos poblaciones y diferencias.
mayor el número de individuos estu-
diados, mayor capacidad existe para La diferencia que se considera clínica-
detectarla, es decir, el poder estadístico mente relevante depende de su magni-
es mayor y, por lo tanto, la probabilidad tud y de otros factores, tales como la
de cometer un error tipo 11 es menor. No frecuencia y gravedad de los efectos
es lo mismo concluir que no se ha secundarios, la facilidad de administra-
encontrado una diferencia estadística- ción o su coste económico, por ejemplo,
mente significativa cuando se tiene una cuando se trata de comparar la eficacia
probabilidad del 90% de haberla detec- de dos fármacos.
tado si hubiera existido (P=O,lO), que
cuando esta probabilidad es sólo del Elección de la prueba estadística
50% (P=0,50).
La elección de la prueba estadística
¿Diferencia estadísticamente significa- depende de:
tiva o clínicamente relevante?
La escala de medida de la variable de
Un resultado estadísticamente signifi- respuesta. Las pruebas estadísticas tie-
cativo no implica necesariamente que nen una mayor potencia si la variable
sea clínicamente relevante. El valor de de respuesta es cuantitativa, ya que
p no mide la fuerza de la asociación. contiene más información que si fuera
Pueden obtenerse valores pequeños de cualitativa.
J. Jiménez

La escala de medida del factor de estu- En estos casos, se recurre a otras prue-
dio. Puede ser cualitativa dicotómica bas estadísticas menos potentes, que no
(tratamiento activo/placebo, exposi- requieren asunciones para su aplicabi-
ciónlno exposición), cualitativa con lidad, conocidas como pruebas no para-
más de dos categorías (tres pautas tera- métricas. Este mismo tipo de pruebas es
péuticas, o diferentes niveles de exposi- aplicable cuando se trata de analizar
ción a un factor de riesgo) o cuantitati- datos ordinales.
va (valores de la colesterolemia o la
presión arterial). En la tabla 4 se resumen las pruebas
estadísticas que se utilizan en las situa-
El carácter apareado o independiente ciones más frecuentes. Cuando tanto el
de los datos. Desde el punto de vista factor de estudio como la variable de
estadístico, se habla de medidas repeti- respuesta son variables cualitativas, la
das o apareadas cuando han sido reali- prueba estadística más apropiada para
zadas sobre los mismos sujetos (por determinar si existe asociación entre
ejemplo, comparación de las cifras de ellas es la ji al cuadrado, siempre que
presión arterial obtenidas en los indivi- exista un número suficiente de sujetos
duos de una muestra al inicio y al final en cada una de las casillas de la tabla de
de un determinado período de tiempo). contingencia. Cuando se comparan dos
Dado que los sujetos son los mismos, grupos (factor de estudio dicotómico)
existe una menor variabilidad en las respecto a una variable cuantitativa, la
mediciones, lo que permite utilizar prueba estadística más adecuada es la t
pruebas más potentes que tengan en de Student-Fisher, si se cumplen las
cuenta este fenómeno. En caso de que condiciones necesarias para su aplica-
los grupos que se comparan estén for- ción. En caso contrario, debe recurrirse
mados por individuos diferentes, se a una prueba no paramétrica equivalen-
habla de datos independientes. te, como la U de Mann-Whitney.

Las condiciones de aplicación específi- Si se comparan más de dos grupos (fac-


cas de cada prueba. Las pruebas esta- tor de estudio con más de dos categorí-
dísticas que utilizan datos cuantitativos as) respecto a una variable cuantitativa,
suelen realizar determinadas asuncio- debe utilizarse el análisis de la varian-
nes sobre la distribución de las varia- cia (ANOVA). Si no se cumplen los cri-
bles en las poblaciones que están sien- terios de aplicación del análisis de la
do comparadas. Estas pruebas son variancia, debe recurrirse a la prueba de
conocidas como pruebas paramétricas. Kruskal-Wallis. Si se trata de determi-
La mayoría son robustas, es decir, que nar la posible asociación entre un factor
toleran relativamente violaciones de de estudio y una variable de respuesta
estas asunciones, especialmente si el cuantitativos, la prueba adecuada es la
número de sujetos estudiado es eleva- correlación de Pearson, o, si no se cum-
do. En muchas situaciones, especial- plen las condiciones de aplicación, la
mente cuando las muestras son de correlación de Spearman. En el caso de
pequeño tamaño, no se puede determi- que pueda asumirse una relación de
nar si se cumplen dichas asunciones. dependencia lineal de una de las varia-
Tabla 4. Pruebas bivariantes de significación estadística utilizadas con mayor frecuencia.

Variable de respuesta

Cualitativa nominal
Cualitativa
Factor de estudio Cuantitativa (*
2 categorías >2 categorías ordinal

t de
Ji al cuadrado
Student-Fishei
Prueba de Ji al cuadrado

r-
Prueba de
Fisher
Welch
halitativo Prueba de los
dos grupos) signos t de
Prueba de
McNemar Prueba de los Student-Fishe:
Apareados Q de Cochran rangos
Prueba de datos
Fisher signados de apareados
Wilcoxon

Prueba de
Análisis de la
Independientes Ji al cuadrado Ji al cuadrado Kruskal-
variancia
Wallis
halitativo
más de dos
PPOS) Análisis de la
Prueba de variancia de
Apareados Q de Cochran Q de Cochran
Friedman medidas
repetidas

Correlación de
t de Análisis de la Correlación Pearson
Cuantitativo
Student-Fisher variancia de Spearman Regresión linea
simple

(*) Cuando las pruebas estadísticas aplicables a las variables cuantitativas no cumplen las asunciones
necesarias para su uso, se recurre a las pruebas correspondientes como si la variable de respuesta fuera
ordinal (pruebas no paramétricas).

bles respecto a la otra, se habla de regre- Definir la hipótesis que se va a contras-


sión lineal simple. tar, precisando si es unilateral o bien
bilateral.
Tamaño de la muestra
Establecer el riesgo de cometer un
Para realizar el cálculo del tamaño de la error a que se está dispuesto a aceptar.
muestra necesario para comparar dos Habitualmente suele aceptarse un 5%,
grupos, deben utilizarse los siguientes y preferiblemente con hipótesis bilate-
elementos: rales, ya que son más conservadoras.
J. Jiménez

Establecer, asimismo, el riesgo que se De estos cinco elementos, sólo el último


acepta de cometer un error fl. Habitual- debe ser conocido, ya que los otros cua-
mente se sitúa entre el 5 y el 20%. A tro son fijados por el investigador. A
menudo, es más fácil enhentar esta deci- continuación, se aplica la fórmula
sión a partir del concepto de poder o correspondiente (tabla 5).
potencia estadística (1-fl),que es la capa-
cidad del estudio para detectar una Supongamos un estudio que tiene por
determinada diferencia. Aceptar un ries- objetivo determinar si un nuevo trata-
go de cometer un error fl del 20%, signi- miento T consigue un mayor porcentaje
fica que, si la diferencia que se busca de éxitos en las sobreinfecciones respi-
existe en la realidad, el estudio tiene un ratorias que el tratamiento estándar E.
80% de probabilidades de detectarla. Lo primero que debe conocerse es el
porcentaje de curaciones en pacientes
Definir la mínima magnitud de la dife- de características similares a los que
rencia, efecto o asociación, que se van a ser estudiados obtenido con el
desea ser capaz de detectar. Debe estar tratamiento estándar E. Supongamos
basada en datos de estudios previos o que esta ciha se sitúa alrededor del
de la literatura que definan el rango de 40% (P1=0,4). El siguiente paso es
valores esperables, y en la mínima mag- determinar la diferencia mínima que se
nitud que se considera de relevancia desea detectar, es decir, responder a la
clínica. siguiente pregunta: ¿A partir de qué
porcentaje de éxitos con el nuevo trata-
Es necesario, también, disponer de miento se considerará que éste es mejor
alguna medida de la variabilidad de la que E, y, por lo tanto, se estará dispues-
variable de respuesta en la población o to a modificar la pauta terapéutica habi-
grupo de referencia. tual? Es decir, si el porcentaje de indi-

Tabla 5. Fórmulas para el cálculo del número de sujetos necesarios por grupo en un estudio
cuyo objetivo es la comparación de dos muestras del mismo tamaño.
COMPARACION DE DOS PROPORCIONES (Variable cualitativa)

COMPARACION DE DOS MEDIAS (Variable cuantitativa)


N =[2.(Za + Z P ) ~s2]/d2
.

N: Número de sujetos necesarios en cada uno de los grupos; ZCL:Valor de Z correspondiente al riesgo
CL fijado (cuando a=0,05,Za=1,96 en hipótesis bilateral y Za=1,645 en unilateral); ZB: Valor de Z corres-
pondiente al riesgo $ fijado (cuando $=0,20, ZB=0,842; cuando $=0,10, ZB=1,282; cuando B=0,05,
ZB=1,645);P1: Valor de la proporción que se supone que existe en el grupo de referencia; P2. Valor de
la proporción que se supone que existe en el grupo de estudio; P2-P1: Valor mínimo de la diferencia
que se desea detectar (variable cualitativa); P: Media ponderada de las proporciones P1 y P2; s2:
Variancia de la distribución de la variable cuantitativa que se supone que existe en el grupo de refe-
rencia;-d: Valor mínimo de la diferencia que se desea detectar (variable cuantitativa).
Métodos estadísticos

viduos curados con T es del 41%, fórmula puede calcularse que son nece-
¿puede considerarse que esta diferencia sarios 387 sujetos por grupo de estudio.
del 1% es un resultado lo suficiente- Esta cifra indica el número de sujetos
mente importante para modificar la que deben finalizar el estudio para
pauta terapeútica? LO se exigirá un tener un 80% de probabilidades de
mínimo, por ejemplo, del 50% de éxi- detectar una diferencia igual o superior
tos? La respuesta a esta pregunta depen- a la fijada, con un nivel de error a del
de de muchos factores, tales como la 5%. Por lo tanto, hay que incrementar-
seguridad del fármaco, la facilidad de lo en función del número de pérdidas
administración o el coste, entre otros. de seguimiento y de abandonos que se
prevea que ocurrirán durante el estu-
Supongamos que los investigadores dio, aplicando la misma fórmula que se
consideran que, si se cura el 50 % de ha presentado en el caso de la estima-
pacientes con T (P2=0,5), se aceptará ción de parámetros.
como la elección terapeútica. A conti-
nuación, sólo falta determinar los nive- Estimación frente a significación
les de riesgo de cometer algún tipo de estadística
error aleatorio que se está dispuesto a
asumir. Supongamos que se acepta el En realidad, cuando analizan los resul-
nivel de riesgo a habitual del 5% con tados de un estudio, los investigadores
una hipótesis bilateral y un riesgo B del están interesados no sólo en saber si
20% (potencia: 1-P=0,80).Aplicando la una diferencia o asociación es estadísti-

Tabla 6. Cálculo del intervalo de confianza (IC) de la diferencia entre dos proporciones.
IC DE LA DZFERENCiA DE DOS PROPORCIONES (*)

a) MUESTRAS INDEPENDIENTES: (PA - PB) IZ.ESD

b) MUESTRAS APAREADAS (PA - Pg) k Z.ESD

PA, Pg: Proporciones observadas en las muestras A y B; nA, ng: Número de sujetos de las muestras A
y B; b, c: Número de casos que presentan valores diferentes en ambas mediciones (series apareadas); n:
Número total de casos; ESD: Error estándar de la diferencia; Z : Valor de la variable normal tipificada
correspondiente al valor a,para un nivel de confianza (1-a).

(*) Las variables cualitativas no presentan una distribución normal. Las fórmulas de la tabla corres-
ponden a una aproximación a la normalidad, aplicable cuando todos los productos n.PA, n.(lmPA),
n.PB y n.(l-PB) son mayores de 5.
J. Jiménez

Tabla 7. Cálculo del intervalo de confianza (IC) de la diferencia entre dos medias.

IC DE LA DIFERENCIA DE DOS MEDIAS (*)

a) MUESTRAS INDEPENDIENTES: (mA - mg) IZ.ESD

ESD=S
J:.-+- ne

b) MUESTRAS APAREADAS iiid 'Z.ESmd


mA, mg: Medias observadas en las muestras A y B; S*, sg: desviaciones estándar observadas en las
muestras A y B; nA, nB: Número de sujetos de las muestras A y B; ESD: Error estándar de la diferen-
cia; md: Media de las diferencias de las dos mediciones en cada individuo (series apareadas); ESmd:
Error estándar de la media de las diferencias individuales; Z: Valor de la variable normal tipificada
correspondiente al valor a , para un nivel de confianza (1-a).

(*) El cálculo se basa en la distribución normal. El valor de Z para un IC del 95% es 1,96. Para mues-
tras de tamaño inferior a 30 individuos, este valor debe sustituirse por el de la t de Student para (n-1)
grados de libertad. Asimismo, el cálculo requiere que no existan diferencias significativas entre las des-
viaciones estándar de ambas muestras.

camente significativa, sino también en observada es estadísticamente signifi-


determinar su magnitud. El valor obser- cativa. Además de saber si la diferencia
vado en el estudio es la mejor estima- es o no estadísticamente significativa,
ción puntual de dicha magnitud. Si se el IC permite conocer entre qué límites
repitiera el estudio con otras muestras, es probable que se encuentre la verda-
podrían observarse resultados de dife- dera diferencia, lo que es muy útil en la
rente magnitud. Por tanto, hay que cal- interpretación de los resultados.
cular un IC que contenga, con una
determinada confianza, la verdadera Supongamos un estudio que compara la
magnitud de interés. Las tablas 6 y 7 eficacia de dos tratamientos A y B en
presentan las fórmulas para el cálculo dos grupos de 30 pacientes. Se observa
del IC de la diferencia entre dos pro- una diferencia en el porcentaje de éxi-
porciones y entre dos medias, respecti- tos del 20% (70% - 50%) a favor del tra-
vamente. tamiento B, que no es estadísticamente
significativa (p=0,12).El IC del 95% de
Cuando se utiliza como medida del la diferencia entre los dos tratamientos
efecto una diferencia, si el IC del 95% es 0,2I0,24,es decir, de 4% a 44%. La
incluye el valor 0, que es el valor verdadera magnitud de la diferencia
correspondiente a la Ho de que no exis- está en un intervalo que va desde un
te diferencia entre ambos grupos, se 4% a favor del tratamiento A hasta un
concluirá que el resultado no es esta- 44% a favor de B. Dado que una dife-
dísticamente significativo. Si, por el rencia del O % también es posible, no
contrario, el IC del 95% excluye este puede descartarse que éste sea su ver-
valor O, se concluirá que la diferencia dadero valor, por lo que la prueba esta-
Métodos estadísticos

dística da un valor no significativo. En las que analizan la relación entre una


cambio, el IC informa además que tam- variable dependiente (variable de res-
bién son posibles grandes diferencias a puesta) y un grupo de variables inde-
favor de B, y que son improbables gran- pendientes (factor de estudio y varia-
des diferencias a favor de A. Aunque bles a controlar). Estas técnicas impli-
los resultados siguen sin ser concluyen- can la construcción de un modelo mate-
tes, se dispone de más información para mático. La elección de un modelo u
interpretarlos adecuadamente. El IC otro dependerá del diseño empleado en
cuantifica el resultado encontrado y el estudio, la naturaleza de las variables
provee un rango donde es muy proba- y de las interrelaciones entre el factor
ble que se encuentre el valor real que se de estudio,$la variable de respuesta y
está buscando. las restantes variables incluidas en el
modelo (variables a controlar). Los uti-
Los IC tienen otra ventaja adicional, y lizados con más frecuencia son la regre-
es la de expresar los resultados en las sión lineal múltiple cuando la variable
unidades en que se han realizado las dependiente es cuantitativa, y la regre-
mediciones, lo que permite al lector sión logística cuando es dicotómica.
considerar críticamente la relevancia
clínica de los mismos.
BIBLIOGRAFIA
Aunque las pruebas de significación
continúan siendo los procedimientos 1.Altman DG. Practical statistics for medi-
estadísticos utilizados con mayor fre- cal research. London: Chapman & Hall,
1991.
cuencia, las ventajas de la utilización 2. Andersen B. Methodological errors in
de los IC en el análisis e interpretación medical research. Oxford: Blackwell
de los resultados, tanto si el objetivo es Scientific Publications, 1990.
la estimación de parárnetros como el 3. Argimon Pallás JM, Jiménez Villa J.
contraste de una hipótesis, hacen que Métodos de investigacih clínica y epide-
cada vez más revistas recomienden a miológica. Madrid: Harcourt Internacional,
los autores la utilización de los mismos. 2000.
4. Armitage P, Berry G. Estadística para la
investigación biomédica. Barcelona:
Análisis multivariante
Doyma, 1992.
5. Campbell MJ, Julious SA, Altrnan DG.
En muchas ocasiones, interesa conside- Estimating sample size for binary, ordered
rar la influencia de más de dos varia- categorial, and continuous outcomes in two
bles simultáneamente. Ello requiere group comparison. BMJ 1995; 311: 1145-
técnicas sofisticadas, basadas en mode- 1148.
los matemáticos complejos, agrupadas 6. Dawson-Saunders E, Trapp RG.
bajo el nombre genérico de análisis Bioestadística médica. México: El Manual
Moderno, 1993.
multivariante.
7. Essex-Sorlie D. Medical bioestatistics &
epidemiology. East Norwalk: Appleton &
Existen múltiples técnicas estadísticas Lange, 1995.
multivariantes. En investigación clínica 8. Everitt BS. Statistical methods for medi-
y epidemiológica las más utilizadas son cal investigations. New York: Oxford
J. Jiménez

University Press, 1989. investigación clínica y epidemiológica. Med


9. Fleiss JL. Statistical methods for rates and Clin (Barc) 1998; 111: 267-76.
proportions. 2nd ed. New York: John Wiley 16. Martín Andrés A, Luna del Castillo J de
& sons, 1981. D. Bioestadística para las ciencias de la
10. Florey CV. Sample size for beginners. salud. 2" edición. Madrid: Norma, 1989.
BMJ 1993; 306: 1181-1184. 17. Norman GR, Streiner DL. Bioestadística.
11. Gardner MJ, Altman DG. confidence Madrid: MosbyIDoyma Libros, 1996;
intervals rather than p values: estimation 18. Plasencia A, Porta M. La calidad de la
rather than hypotesis testing. BMJ 1986; información clínica (11): significación esta-
292: 746-750. dística. Med Clin (Barc) 1988; 90: 122-126.
12. Gardner MJ, Altman DG. Statistics with 19. Porta M, Plasencia A, Sanz F. La calidad
confidence: confidence intervals and statis- de la información clínica (111): ~estadística-
tical guidelines. Londres: Bristish Medical mente significativo o clínicamente impor-
Journal, 1989. tante? Med Clin (Barc) 1988; 90: 463468.
13. Kelsey JL,Thompson WD, Evans A. 20. Sahai H, Khurshid A. Formulae and
Methods in obsewational epidemiology. tables for the determination of sample sizes
Nueva York, Oxford University Press; 1986. and power in clinical trials for testing diffe-
14. Kleinbaum D, Kupper L, Morgenstern H. rences in proportions for the two-sample
Epidemiologic Research. Belmont, Lifetime design: a review. Stat Med 1996; 15: 1-21.
Learning Publications 1982. 21. Silva Aycaguer LC. Muestreo para la
15. Marrugat J, Vila J, Pavesi M, Sanz F. investigación en ciencias de la salud.
Estimación del tamaño de la muestra en la Madrid: Díaz de Santos; 1993.

Das könnte Ihnen auch gefallen