Sie sind auf Seite 1von 21

Anlisis estadstico de datos cualitativos

Eventos, factores de riesgo y tratamientos


Jos Tessler y Carlos Tajer

La comparacin de variables cualitativas, en la prctica expresadas en


porcentajes, es la estadstica predominante en los ensayos clnicos
teraputicos pragmticos que evalan la eficacia teraputica a travs de la
incidencia de eventos adversos. En este captulo expondremos las
metodologas estadsticas, y en el siguiente la interpretacin de los
resultados desde las medidas del efecto del tratmiento: reduccin o
aumento de riesgo absoluto y relativo, odds ratio, reduccin o aumento
porcentual de riesgo, y nmero necesario para tratar para prevenir o daar.
En la comparacin de eventos entre tratamientos o condiciones de riesgo, la
hiptesis de nulidad es que no existen diferencias entre ellos. Los estudios
se dimensionan para explorar una reduccin de eventos con el tratamiento
o una diferencia de eventos ante la presencia de un factor de riesgo, de
forma tal de poder, en caso de existir una diferencia de suficiente magnitud,
rechazar la hiptesis de nulidad.
Evaluacin estadstica a travs de los intervalos de confianza
descriptivos
Partamos de un ejemplo conceptual antes de desarrollar los mtodos
estadsticos formales. El estudio CIBIS II compar la eficacia del bisoprolol
sobre el placebo en pacientes con insuficiencia cardaca sintomtica,
utilizando como punto final de eficacia la mortalidad. Al finalizar el estudio
se observ que fallecieron 156/1327p (11,8%) tratados con bisoprolol y
228/1320p (17,3%) tratados con placebo.
Intentaremos con lo aprendido sobre intervalos de confianza del porcentaje
de deducir si esta diferencia es estadsticamente significativa.
Calculamos el intervalo de confianza del 95% del porcentaje de mortalidad
para ambos tratamientos y obtenemos, con la frmula descrita en el
captulo de descripcin de datos cualitativos, los siguientes resultados.
Mortalidad en el grupo bisoprolol 11,8% (IC 95% 10-13,5)
Mortalidad en el grupo placebo 17,3% (IC 95% 15,2-19,3)
Los intervalos de confianza de la mortalidad del grupo bisoprolol no abarcan
a la mortalidad observada en el grupo placebo, y viceversa.
Conceptualmente, podemos afirmar que existe menos del 95% de
probabilidad de que la mortalidad en el grupo bisoprolol sea similar a la del
grupo placebo, y viceversa. En este caso si calculamos el intervalo de
confianza del 99% obtendremos 11,8 % (IC 99% 9,5-14) y 17,3 (14,6-20).
Confirmamos que existe menos del 99% de probabilidad que la mortalidad
de bisoprolol y placebo sean similares: el intervalo de confianza de cada
porcentaje no abarca lo observado de incidencia en el otro grupo.
An sin un test formal estadstico, podemos rechazar la hiptesis de
nulidad, que enunciaba que no existan diferencias de mortalidad entre
bisoprolol y placebo, y aceptar la hiptesis alternativa, en este caso que la
mortalidad se redujo con bisoprolol, con una confiabilidad del 99%, es decir,
con probabilidad de error menor del 1%.
La frmula mgica de la estadstica
La incidencia de mortalidad en el estudio comentado fue 11,8% con el
bisoprolol y 17,3% con el placebo, resultando en una diferencia de eventos
del 5,5%. Existen diferentes nomenclaturas que trataremos en el captulo
siguiente para describir los efectos de un tratamiento. Adelantaremos slo
que esta diferencia puede ser expresada como reduccin absoluta de
eventos cuando es beneficiosa, abreviada como RRA (reduccin de riesgo
absoluto) o aumento absoluto de riesgo cuando es perjudicial (ARA). En
forma coloquial, esperamos que cada 100 pacientes tratados con bisoprolol
se reduzcan 5 eventos mortales.
Lo que nos interesa evaluar es la probabilidad de que esta diferencia pueda
ser atribuible al azar. La mortalidad total de la poblacin del ensayo fue
384/ 2647p, 14,5%. Una forma conceptual de plantear el problema es
preguntarnos qu probabilidad existe de que dividiendo en dos grupos al
azar esta poblacin, encontremos una diferencia de la magnitud de la
observada en el ensayo.
Esto se estima a travs del clculo del intervalo de confianza de la
diferencia de porcentaje.
La frmula correspondiente es

1 1
ES dif % = p *(100 - p ) * +
n1 n2
Reemplazamos

1 1
ES dif % = 14,5*(100 - 14,5%) * + = 1,37% (aprox 1,4%)
1327 1320

En las distribuciones de errores al azar para esa incidencia de eventos y
nmero de pacientes, el error estndar aproximado fue de 1,4%.
Podemos plantear ahora la pregunta sobre la diferencia de porcentajes en
otros trminos: a cuntos errores estndar de la diferencia de porcentajes
se encuentra la incidencia de mortalidad con bisoprolol comparada con la
del grupo placebo? La respuesta a esta pregunta es la denominada por
Pocock frmula mgica de la estadstica (A y B son dos grupos hipotticos,
en este caso bisoprolol y placebo).
% A - % B 17,3% - 11,8%
Z = = = 3,9
ES dif % 1, 4%
Hemos hecho as una prueba de Z, es decir, calculado el nmero de errores
estndar que separa a un porcentaje del otro. Podemos en las tablas de Z o
en excel buscar la probabilidad de esa diferencia, pero podemos recordar
que la Z para p <0,05 es 1,96 y para p <0,01 2,54. En este caso la Z es
mucho mayor, 3,9 y los programas nos informan p <0,001.
Podemos as rechazar la hiptesis de nulidad: existe una probabilidad
menor de 0,001 es decir de 1 en mil, de que esa diferencia observada
pueda ser atribuida al azar.

2
En otros trminos, si no existiera diferencia entre los tratamientos, la
probabilidad de que por azar encontrramos esta magnitud de diferencia es
muy baja.

Infiriendo diferencias estadsticas a partir del intervalo de


confianza
En el anlisis del estudio CIBIS II estimamos que la diferencia entre los
porcentajes fue de 5,5% y calculamos que el error estndar de esa
diferencia fue de 1,4%. Como para cualquier otro parmetro descriptivo,
podemos establecer el intervalo de confianza del 95% de la diferencia de
porcentajes como
IC 95% = diferencia observada 1,96 * ES
IC95% = 5,5% 1,96 * 1,4%
Obtenemos que el intervalo de confianza va de 2,8% a 8,2%. Esto nos da
tambin una inferencia sobre la significacin estadstica: podemos rechazar
la hiptesis de nulidad de que la diferencia entre ambos tratamientos es 0,
dado que el 0 no est abarcado por el intervalo de confianza de la diferencia
de porcentajes. Si reemplazamos en la frmula 1,96 por 2,54 calcularemos
el IC del 99%, que en este caso tampoco abarca el 0.
Podemos expresar lo anterior afirmando que existe menos de un 95% de
probabilidad de que la verdadera diferencia entre bisoprolol y placebo sea
menor que 2,8% o mayor que 8,2%.
Un experimento frecuentista para fundamentar empricamente
el concepto
Profundizaremos en los conceptos anteriores con un experimento. En una
base de datos de 7.004 pacientes correspondientes a la rama internacional
del estudio GISSI 2, la mortalidad luego del alta hospitalaria en el
seguimiento a seis meses fue de 3,76%, y no hubo diferencia entre los
tratamientos.
Como experimento probabilstico dividimos a la poblacin en forma
randomizada en dos grupos A y B, tomndolos como tratamientos ficticios,
y calculamos la mortalidad en ambos grupos. Repetimos la experiencia 100
veces dividiendo en cada experiencia a la poblacin en dos grupos al azar.
Obtuvimos los siguientes resultados:

Tabla 1: incidencias de mortalidad y diferencia promedio en 100 muestras al


azar en una poblacin con aproximadamente 3,76% de mortalidad.
% dif Grupo A % Grupo B %
Media -0.0320 3.75 3.78
DS 0.4714
Mnimo -1.3 3.1 3.3
Mximo 0.9 4.2 4.4

3
Como era de esperar la diferencia promedio fue 0, no debera haber
diferencias entre grupos elegidos al azar. Sin embargo si observamos los
valores mnimos y mximos de la diferencia de mortalidad en algn estudio
fue de 0,9% y en algn otro de -1,3%. De hecho las mortalidades al azar
en el grupo A fueron de 3,1% a 4,2% y en el grupo B de 3,3 a 4,4%.
La distribucin de diferencias de porcentajes debe ser gaussiana, como todo
error de medicin, en este caso 100 mediciones al azar en la misma
poblacin. En la figura 1 efectuamos un histograma de frecuencias de la
distribucin de estas diferencias y en la figura 2 graficamos cada muestra
individualmente tomando la diferencia. En ambas figuras dibujamos los
Intervalos de confianza del 95% y 99%.

Histogram
20

15
Frequency

10

0
-1.4 -1.2 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4

DIF

Figura1: distribucin de las diferencias de mortalidad en 100 muestras de


una poblacin de 7.004 pacientes divididos en dos grupos al azar. Se
observa que la distribucin de las diferencias se distribuye en forma
simtrica y gaussiana alrededor del 0% de diferencia. En lnea punteada se
establecen la Z 1,96 (IC 95%) y en lnea con guiones la Z 2,54 (IC
99%). Vemos que slo una muestra supera el IC 99%.

4
Figura 2: graficacin de las diferencias de porcentaje de mortalidad en 100
muestras dividiendo a una poblacin de 7.004 pacientes en dos grupos al
azar. El porcentaje en cada muestra es expresado como una columna
vertical. En lnea punteada continua se delimit el Intervalo de confianza del
95% y en lnea interrumpida el IC 99%. En total 6 muestras tienen
porcentajes por fuera del 95% y slo una por fuera del 99%.

Lo que observamos en ambos grficos y en la tabla fundamenta el concepto


de nuestra aproximacin estadstica a la interpretacin de diferencias de
tratamiento: expresamos que existen o no diferencias significativas sobre la
base de un test estadstico formal o la comparacin de medias con la
frmula anterior calculando la Z, o alternativamente que la diferencia
observada descarta la hiptesis de nulidad. Esto no implica que tenemos
certeza sobre los resultados, sino que existe una muy baja probabilidad (p)
de que las diferencias observadas ocurrieran por azar si NO EXISTIERAN
DIFERENCIAS REALES. An as, como hemos observado en el ejemplo, 1
muestra por azar estuvo por fuera del IC 99% y seis fuera del IC del 95%,
confirmando la afirmacin conceptual: existe slo una posibilidad en 100 o
aproximadamente 5 en 100 (en este caso 6) de que las diferencias superen
el IC del 99% o IC del 95% por error o azar.

Qu nos dice el nivel de p y el intervalo de confianza de la


diferencia de porcentaje?
En el captulo de inferencia estadstica hemos establecido el error alfa, es
decir, la probabilidad expresada por la p de equivocarnos al descartar la
hiptesis de nulidad, afirmando que existen diferencias cuando no las hay.

5
Este valor de p expresa algo emprico, que hemos demostrado en el
ejemplo anterior: de no existir diferencias, slo en 1 de cada 100 ensayos
comparados encontraremos diferencias por encima del IC del 99% y slo en
5 de cada 100 ensayos por encima del 95% por azar.
De la misma manera, sobre la base de la figura 2, cuando afirmamos la
significacin estadstica sobre la base de un intervalo de confianza,
repetimos la misma conviccin que en los estudios descriptivos: afirmamos
que tenemos un 95% de confiabilidad de que la verdadera diferencia de
porcentaje entre los dos tratamientos est abarcada por el IC del 95%. En
el ejemplo del CIBIS II, la diferencia fue de 5,5% (2,8 a 8,2%), muy lejana
del 0% que indicara nulidad.
Tambin sobre la base de la experiencia emprica del ejemplo anterior,
debemos aceptar que pueden observarse diferencias de p <0,01 por azar,
justamente en uno de cada 100 estudios.
Luego de esta discusin conceptual pasaremos a los mtodos formales de
evaluacin estadstica. En el caso de los datos cualitativos, se utilizan tablas
denominadas de contingencia.

Mtodos estadsticos para la comparacin de datos


cualitativos
Tablas de contingencia
La manera ms comn de resumir datos cualitativos es en forma tabular,
denominadas para estadstica tablas de contingencia.
Existen varios significados para el trmino contingencia, de los que nos
interesan dos:
Azar
Indica que una variable es dependiente de, o est determinada por, otra.
En estadstica, tablas de contingencia son aquellas en las que los datos
categricos se muestran clasificados simultneamente por dos o ms
caractersticas (por ejemplo, grupos y eventos, tratamientos y eventos,
etc.). Usaremos en este captulo el trmino evento en su sentido ms
amplio, que incluye a las respuestas a los tratamientos (por ejemplo, la
normalizacin de la presin arterial puede considerarse un evento en el caso
de tratamiento antihipertensivo).

Grados de libertad (gl) de una tabla de contingencia

La tabla 2 es un ejemplo de tabla de contingencia. En 333 pacientes


divididos en 4 grupos, de 62, 81, 107 y 83 individuos respectivamente, se
registra si hubo o no un evento (S No). El total de eventos fue 108. En el
grupo A se observaron 41 eventos, al colocar el nmero 41 en el casillero A-
S, en el A-No debe ir obligatoriamente 62 41 = 21. Si en B-S colocamos
33, en B-No ir obligatoriamente 81 33 = 48. Si colocamos el nmero 27
en C-S, en C-No ir obligatoriamente 107 27 = 80 y en D-S, tambin

6
obligatoriamente 108 (41 + 33 + 7) = 7. Cae de maduro que en D-No ir
83 7 = 76.

Tabla 2. Tabla de contingencia de 4 columnas y 2 filas.

Grupo
Evento Total
A B C D
S 41 33 27 7 108
No 21 48 80 76 225
Total 62 81 107 83 333

Si ahora sin modificar los totales reemplazamos los valores en los 3


casilleros claros por 26, 12 y 55 respectivamente (tabla 3) tambin cambian
(obligatoriamente) los valores en los 5 casilleros sombreados. En
consecuencia, vemos que de los 8 casilleros podemos cambiar valores
solamente en 3, dado que los otros 5 quedan determinados por las
diferencias entre los totales y esos 3 valores. Es decir, tenemos 3 grados de
libertad.

Tabla 3. Al cambiar los valores de la tabla 1 en los casilleros claros, tambin


cambiaron los de los casilleros sombreados.

Grupo Total
Evento
A B C D
S 26 12 55 15 108
No 36 69 52 68 225
Total 62 81 107 83 333

Si observamos ambas tablas y tomamos en cuenta lo escrito hasta ahora,


vemos que en las filas hay solamente 1 grado de libertad y en las columnas
3. Podemos generalizar diciendo que los grados de libertad de una tabla de
contingencia se obtienen multiplicando la cantidad de columnas menos 1
por la cantidad de filas menos 1:
gl = (Cantidad de columnas 1) x (Cantidad de filas 1)
En nuestro ejemplo, las columnas son 4 y las filas 2, por lo que:
gl = (4 1) x (2 1 ) = 3 x 1 = 3

7
Tablas de 2x2
Se denominan tablas de contingencia de 2x2 o, simplemente, tablas de 2x2,
a las que tienen 2 filas y dos columnas. Estas tablas tienen 1 grado de
libertad.
gl = (2 1) x (2 1 ) = 1 x 1 = 1
En la literatura se expresan tambin como tablas de contingencia 2X2 o con
grado de libertad 1.
Es importante aprender a leer y confeccionar adecuadamente estas tablas.
Estas son las tablas ms comunes en los ensayos controlados que evalan
la presencia o ausencia de un evento en los pacientes tratados con cada una
de las estrategias.

Evento
Tratamiento
+ -
A 26 100 126
B 40 89 129
Total 66 189 333

Para la interpretacin de ensayos clnicos habituales partimos del diseo de


grupos paralelos. Discutiremos luego otros diseos de menor uso en
cardiologa para datos cualitativos, como el de propio individuo como
control.
Grupos paralelos
Supongamos que se trataron dos grupos de pacientes hipertensos, uno con
enalapril (tratamiento control) y el otro con amlodipina (tratamiento a
evaluar) y se evalu si se obtuvo o no normalizacin de las cifras
tensionales. En este caso el evento fue la normotensin arterial. La tabla 4
nos muestra cmo se pueden resumir los datos. Siempre en el casillero a
debe colocarse el nmero de eventos con el tratamiento a evaluar.
Tabla 4. Tabla de contingencia de 2x2 para un ensayo clnico en dos grupos paralelos
A: amlodipina. E: enalapril. NTA: normalizacin de la presin arterial. N: nmero total de individuos

NTA
Droga
S No
Amlodipina a b a+b
Enalapril c d c+d
Total a+c b+d N

8
Supongamos ahora un estudio caso-control sobre cncer de pulmn y
tabaquismo. Se toma un grupo de pacientes con cncer de pulmn (casos)
y otro sin esa patologa (controles) y se registra cuntos pacientes de uno y
otro grupo son fumadores. Los resultados pueden resumirse como en la
tabla 5. Siempre en el casillero a debe colocarse el nmero de expuestos al
txico entre los casos.

Tabla 5. Tabla de contingencia de 2x2 para un estudio caso-control


N: nmero total de individuos

Cncer de pulmn Total


Fumador
S No
S a b a+b
No c d c+d
Total a+c b+d N

Podemos generalizar la nomenclatura considerando que tanto los


tratamientos como el fumar son factores de exposicin y, como ya vimos,
tanto la normalizacin de la presin arterial como el tener cncer de pulmn
pueden considerarse eventos. Podemos entonces decir que en el casillero a
siempre debe colocarse el nmero de individuos con evento (+) y factor de
exposicin (+).
En las tablas colocamos los eventos en las columnas y el factor de
exposicin en las filas. Casi todos los software de estadstica suponen que
los eventos estn colocados en las columnas y los factores de exposicin en
las filas. Ello es generalmente poco importante, excepto cuando se estimar
el riesgo relativo (ver ms adelante) en cuyo caso puede obtenerse un
resultados falso si uno no sigue el lineamiento de los autores de los
software.

Propio individuo como control (tratamientos apareados)


Cuando se estudi el ondansetrn (OST) para el tratamiento de los vmitos
por quimioterpicos antineoplsicos, se utiliz como referencia el
tratamiento con metoclopramida (MCP) en diseos de propio individuo como
control. Tcnicamente estos estudios se denominan apareados, pero el
trmino propio individuo como control da una idea ms acabada de lo que
se trata. La mitad de los pacientes recibi en un ciclo de quimioterapia, OST
como antiemtico y en el siguiente MCP; la otra mitad recibi esos
tratamientos en orden inverso. Los resultados se resumen como se indica
en la tabla 6. En este caso el evento es el vmito y se indica tanto en las
columnas como en las filas, diferencindose por el tratamiento recibido.
Siempre en el casillero a debe colocarse la cantidad de pacientes que
present evento con ambos tratamientos.

9
Tabla 6. Tabla de contingencia de 2x2 para dos tratamientos antiemticos
consecutivos en un mismo individuo.
N: nmero de individuos.

Ondansetrn
Metoclopramida Total
Vomit No vomit
Vomit a b a+b
No vomit c d c+d
Total a+c b+d N

En ciertos casos, (enfermedades oculares bilaterales, enfermedades


cutneas bilaterales, enfermedad periodontal bilateral, etc.) es posible
aplicar dos tratamientos locales simultneamente, uno de cada lado. Por
ejemplo (tabla 7) se coloca un tratamiento diferente en cada ojo y se
registra si se obtuvo o no curacin en casos de conjuntivitis bilateral. En
este caso el evento es la curacin y siempre en el casillero a debe colocarse
la cantidad de pacientes que present el evento con ambos tratamientos.

Tabla 7. Tabla de contingencia de 2x2 para dos tratamientos colocados


simultneamente en sitios contralaterales en un mismo individuo.
N: nmero de individuos.

Ojo con Ojo con tratamiento A


Total
tratamiento B Curacin No curacin
Curacin a b a+b
No curacin c d c+d
Total a+c b+d N

Eleccin de la Prueba Estadstica


El anlisis de datos cualitativos puede referirse a varios objetivos diferentes
lo que lleva a la necesidad de diferentes formulaciones de hiptesis. Nos
referiremos primero a estas hiptesis nulas para luego seleccionar las
pruebas que podemos utilizar para probar cada una de ellas.
Hiptesis nulas

Escenario 1: hiptesis de independencia


Se desean responder preguntas como las siguientes:

10
La frecuencia de eventos fue igual (o diferente) en los distintos grupos?
Por ejemplo: La frecuencia de normalizacin de la presin arterial fue
igual con amlodipina que con enalapril, en un estudio en grupos
paralelos? (tabla 3). Hay diferencia en la incidencia de infarto de
miocardio en varones y mujeres de una poblacin seguida durante 20
aos? Es el caso de los ensayos teraputicos que utilizan como puntos
finales eventos clnicos.
La exposicin a una noxa fue igual en dos grupos de individuos, uno
con evento y otro sin evento? (estudios caso-control). Por ejemplo: El
antecedente de consumo de tabaco fue igual en pacientes con (casos) y
sin (controles) cncer de pulmn? (tabla 4). El antecedente de
consumo de talidomida fue igual en mujeres que tuvieron hijos con
focomelia (casos) que en las que tuvieron hijos sin malformaciones
(controles)?
La frecuencia de eventos fue igual (o diferente) con dos o ms
tratamientos aplicados a un mismo individuo? Por ejemplo: La
frecuencia de vmitos durante la quimioterapia antitumoral fue igual con
ondansetrn que con metoclopramida, aplicadas en dos ciclos sucesivos
a un mismo individuo? (tabla 5). La frecuencia de curaciones fue igual
con el tratamiento A que con el B aplicados a un mismo individuo con
conjuntivitis bilateral? (tabla 6).
En este caso la hiptesis nula es que la frecuencia de eventos es igual para
los distintos grupos o tratamientos, es decir, es independiente del grupo al
que pertenece el paciente (o del tratamiento recibido). Por este motivo, se
suele denominar hiptesis de independencia.

Escenario 2: hiptesis de tendencia


En este caso, una de las variables categricas est ordenada (por ejemplo,
grupos etarios, perodos calendario, estados funcionales). Las preguntas son
del siguiente tipo:
La frecuencia de eventos tiende a aumentar (o disminuir) con la edad?
Por ejemplo: la prevalencia de hipertensin arterial tiende a aumentar
con la edad?
La frecuencia de eventos tiende a aumentar (o disminuir) en los ltimos
aos (o quinquenios, o decenios)? Por ejemplo: La prevalencia de
estfilococo meticilino-resistente tiende a aumentar en los ltimos aos?
La frecuencia de eventos tiende a aumentar a medida que empeora el
estado funcional? Por ejemplo: La frecuencia de internaciones o muerte
tiene a aumentar a medida que se agrava el estado funcional de los
asmticos?
En este caso la hiptesis nula es que la tendencia a variar es igual a cero
(es decir, la frecuencia de eventos es igual en todos los grupos etarios, en
todos los aos calendario, en todos los estados funcionales).

Escenario 3: se ajustan los datos a una hiptesis previa?


En este caso se desean comparar los datos observados con los esperados
de acuerdo a una determinada hiptesis. Las preguntas son del siguiente
tipo:

11
Mis datos son gaussianos?
Los casos observados entre miembros de diversas familias siguen una
determinada ley gentica?
Mis resultados son similares a los publicados por otros?
La presencia simultnea de hipertensin arterial (HTA) y diabetes (DBT)
en un mismo individuo es solamente debida al azar?
En todos los casos la hiptesis nula es la respuesta afirmativa a la pregunta
y puede generalizarse diciendo que la distribucin observada es igual a la
esperada. Esperada segn qu?: Segn la funcin de Gauss para la
primera pregunta, segn una ley de la gentica para la segunda, segn los
datos publicados para la tercera, segn las leyes de probabilidad para la
cuarta. Esta ltima merece explicarse un poco ms. Si la prevalencia de
HTA en una poblacin es del 25 % y la de DBT es del 8 %, puede esperarse
por azar que un 2 % de los individuos tengan simultneamente ambas
enfermedades.
Eleccin de la prueba estadstica
Veremos ahora que prueba estadstica podemos elegir para cada uno de los
problemas que se nos presenta (figura 3). Luego nos referiremos a cada
una de ellas en particular. Para elegir la prueba para analizar datos
cualitativos, debemos tener en claro qu hiptesis nula (H 0) vamos a
probar.
Eleccin de prueba para probar la hiptesis de independencia
En primer lugar debemos preguntarnos si son datos apareados (propio
individuo como control) o grupos paralelos.

DATOS BONDAD DE AJUSTE


CUALITATIVOS

INDEPENDENCIA Ho DISTRIBUCIN
OBS = ESP

TENDENCIA 0 % 2 para TENDENCIAS

2
APAREADO SI gl >1 ANLISIS
MULTIVARIADO

McNEMAR 1
NO FILA
SI o COL NO
< 10

gl 1 N > 40 NO
SI

>1 2 CON PARTICIN DE gl EXACTA DE FISHER

Figura 3. Eleccin de prueba para anlisis de datos cualitativos.


: chi cuadrado. gl: grados de libertad. : sumatoria. N: nmero total de pacientes.
2

DATOS APAREADOS (PROPIO INDIVIDUO COMO CONTROL)


Debemos fijarnos ahora en los grados de libertad de la tabla de
contingencia. Si solamente hay un grado de libertad, podemos utilizar la

12
prueba de McNemar. Si hay ms de un grado de libertad es conveniente
recurrir al anlisis multivariado.
GRUPOS PARALELOS

Nuevamente debemos tomar en cuenta los grados de libertad de las tablas


de contingencia:
Si solamente hay un grado de libertad, entonces debemos ver si el
nmero total de pacientes (N) es o no mayor de 40. Si N 40 conviene
elegir la prueba exacta de Fisher. Si N > 40 debemos fijarnos si algn
total de fila o columna es menor de 10. Si esto sucede conviene elegir la
misma prueba. Si ninguna fila o columna tiene menos de 10 individuos,
entonces podemos elegir entre la prueba de Fisher y una prueba de 2 (la
letra griega se denomina chi o ji).
Cuando hay ms de un grado de libertad surge un problema para
obtener conclusiones. Si con los datos de la tabla 1 efectuamos el
anlisis estadstico encontramos que las diferencias son significativas (p
< 0,0001). Ahora nos surge una pregunta: Entre qu grupos hay
diferencias significativas? (Entre A y B? Entre B y C? Entre C y D?
Entre A y C? Entre A y D? Entre B y D?). Si efectuamos una prueba
estadstica con un error = 0,05 para comparar cada par de
tratamientos, el error total ser mucho mayor de 0,05. Entonces
debemos encontrar la manera de poder efectuar las comparaciones de
manera tal que el error total no sea mayor de 0,05. Esto puede
lograrse utilizando la prueba de 2 con particin de grados de libertad.

Prueba de la hiptesis de tendencia a variar igual a cero


Utilizamos una prueba denominada 2 para tendencias.

Prueba de la hiptesis de que la distribucin observada es igual a la


esperada
La prueba que se utiliza se denomina prueba de bondad de ajuste.

Conceptos Generales sobre Pruebas de 2 (Chi Cuadrado)


Con la excepcin de la prueba exacta de Fisher, todas las otras pruebas
mencionadas en la seccin anterior son pruebas de 2. Por este motivo
comenzaremos con algunos conceptos generales sobre las mismas.
Distribucin de 2
2 es un estadstico cuya distribucin depende de los grados de libertad. No
la analizaremos en detalle sino que nos limitaremos a sealar alguna de sus
caractersticas:
La distribucin de 2 es una distribucin continua.
Para un mismo valor de , 2 se incrementa con los grados de libertad
(gl). Es decir, a ms grados de libertad mayor valor de 2.
Para gl = 1; 2 = Z2. Como para = 0,05; Z = 1,96, entonces para gl =
1 y = 0,05:

13
2 = 1,962 = 3,8416

Tomando en cuenta el prrafo anterior, todo 2 < 3,8416 es


estadsticamente no significativo.
2 es siempre mayor que sus grados de libertad. Si, por ejemplo,
tenemos una tabla de contingencia de 8 grados de libertad, cualquier 2
8 ser estadsticamente no significativo.
Esperado segn la H0
En la tabla 8 observamos que con la droga activa (A) tuvieron un evento
25 de los 85 pacientes (29,4 %) mientras que de los 105 tratados con
placebo (P) 50 tuvieron ese evento (47,6 %). En total (T), de los 190
pacientes que participaron del estudio, 75 presentaron el evento (39,5 %).
Si el porcentaje de eventos (%E) fuera igual en ambos grupos (H 0)
entonces sera igual al observado en el total de los pacientes. Es decir, la
hiptesis de independencia puede escribirse de la siguiente manera:
Tabla 8. Valores observados y estimados segn H0

OBSERVADO ESPERADO SEGN H0


Tratamiento Tratamiento
Evento Total Evento Total
Droga activa Placebo Droga activa Placebo
S 25 50 75 S 33,55 41,45 75
No 60 55 115 No 51,45 63,55 115
Total 85 105 190 Total 85 105 190

H0: %EA = %EP = %ET


Para calcular el valor esperado segn la H 0 en el casillero a (droga activa,
evento S) utilizamos una regla de 3 simple, es decir, razonamos de la
siguiente manera:
Si de 190 pacientes ____ 75 tuvieron eventos
De 85 pacientes ______ 85 x 75 / 190 = 33,55 deberan tener eventos
Obsrvese (tabla 8) que 85 es la suma de la columna, 75 es la suma de la
fila y 190 es N, el nmero total de pacientes. Es decir, llamando ESP al
esperado segn la hiptesis nula, podemos calcular
ESP = Suma de la columna x Suma de la fila / N
En nuestro ejemplo, en el casillero a se observaron 25 pacientes cuando,
segn la hiptesis nula, esperaramos encontrar 33,55 pacientes con
evento. Para el resto de los casilleros el ESP puede calcularse mediante esta
misma ecuacin o simplemente por resta, ya que al tener solamente un
grado de libertad, una vez calculado el ESP de un casillero, los otros cuatro
pueden obtenerse directamente por diferencia.
Pruebas de 2
Si llamamos OBS al dato observado y ESP al esperado por H0,

14
(OBS ESP)2 / ESP = 2 si ESP = (es decir, N = )
pero
(OBS ESP)2 / ESP 2 si ESP 5
es decir, los cocientes (OBS ESP) 2 / ESP son aproximadamente iguales a
2 si los ESP no son menores de 5. En general, se acepta que pueden
efectuarse las pruebas de 2 si se dan las siguientes condiciones:
No ms del 20 % de los ESP < 5.
No ms del 5 % de los ESP < 1.
Ningn ESP = 0.
Obsrvese que las condiciones se refieren a los ESP y no a los OBS. Es
decir, puede tenerse un OBS = 0, pero no un ESP = 0. Enseguida veremos
cmo aplicamos estas condiciones para tablas de un grado de libertad.
Muchos software de estadstica advierten cuando hay un ESP < 5.

Anlisis de Tablas de Contingencia de un Grado de Libertad


2 para tablas de 2x2, grupos paralelos

De acuerdo con las condiciones generales antes mencionadas, ningn


casillero debera tener un ESP < 5. Este es el motivo por el cual en la figura
3 sealamos que N > 40 y la suma de cada una de las filas y columnas
debe ser 10.
Si N < 20 o alguna fila o columna suma menos de 10, seguro que hay por lo
menos un casillero con ESP < 5. Si N < 40 existe una probabilidad bastante
alta de tener algn casillero con ESP < 5. Por este motivo, en estos casos,
conviene elegir la prueba exacta de Fisher (figura 3).

Prueba exacta de Fisher para tablas de 2x2


Si observamos los datos de la tabla 9, vemos que la suma de la primera
fila es 7 y, por lo tanto debemos elegir (de acuerdo a la figura 3) la prueba
exacta de Fisher. Si, por otra parte, calculamos los esperados, veremos que
los dos casilleros de la primera fila tienen ESP < 5. Casos como stos son
relativamente frecuentes en la evaluacin de eventos adversos,
especialmente en los ensayos pequeos.

Tabla 9. Resultados de un ensayo clnico simulado en dos grupos paralelos

Tratamiento
Mareos Total
Droga Placebo
S 6 1 7

15
No 15 25 40
Total 21 26 47

La prueba de Fisher se basa en la distribucin hipergeomtrica.


Supongamos que tenemos 500 bolillas blancas y 300 celestes en una bolsa.
Cul es la probabilidad de obtener 1 bolilla blanca en 6 intentos? A esta
pregunta responde la distribucin hipergeomtrica.
En el caso de las pruebas de 2 es necesario obtener 2 para, a partir de su
valor, obtener el valor de p. En cambio, en la prueba exacta de Fisher
calcula directamente el valor de p. En nuestro ejemplo de la tabla 9 la
prueba exacta de Fisher para 2 colas nos da una p = 0,0347.
Hay software que efectan la prueba de Fisher para 1 y para 2 colas, otros
lo hacen solamente para 1 cola y otros solamente para 2 colas. Como
muchas veces no aclaran qu prueba efectan, es conveniente en estos
casos, antes de usarlo por primera vez, efectuar la prueba con los datos de
la tabla 9: si p = 0,0347 entonces el software efecta el clculo para dos
colas.
En el caso particular de la tabla 8 el valor de p de la prueba exacta de
Fisher es similar al del 2 con correccin de Yates, pero ello no siempre es
as. Como puede verse en la tabla 10, en otros casos el valor de p de la
prueba de Fisher puede ser ms parecido al de 2 sin correccin de
continuidad.

Tabla 10. Dos ejemplos de 2 con y sin correccin de Yates y de la prueba exacta
de Fisher de dos colas para tablas de 2x2.

Ejemplo Evento Grupo A Grupo B 2 2 Yates Fisher


(+) 14 4 2,69 1,79
1 p = 0,1350
(-) 18 15 p = 0,1010 p = 0,1813
(+) 70 20 13,45 12,97
2 p = 0,0002
(-) 90 75 p = 0,0002 p = 0,0004

2 de Mantel y Haenzel
Es otra manera de calcular 2, que resulta til en los estudios estratificados
(por ejemplo, los multicntricos) pues permite evaluar si los resultados son
o no homogneos entre los centros. ste mtodo (o, ms generalmente,
uno muy parecido: la modificacin de Peto) se emplean en los metaanlisis.
No nos extenderemos ms en este tema que ser tratado en el captulo de
inferencia causal y en el de metaanlisis.

16
2 para tablas de 2x2, propio individuo como control (prueba
de McNemar)
Si observamos la tabla 11, vemos que los resultados de los casilleros a y d
estn de acuerdo con H0, pues en a est la cantidad de pacientes que tuvo
eventos con ambos tratamientos y en d los que no tuvieron con ninguno de
ellos. La hiptesis nula se puede expresar, entonces, como H 0: b = c.

Tabla 11. Tabla de contingencia de 2x2 para dos tratamientos en un mismo individuo.
N: nmero de individuos.

Tratamiento A
Tratamiento B Total
Evento No evento
Evento A b a+b
No evento C d c+d
Total a+c b+d N

Como la prueba de McNemar es una prueba de 2, se requiere que ESP 5,


por lo que debe ser b + c 10. Como a pesar de ser una prueba sencilla
hay software que no la hacen, explicaremos como efectuarla, utilizando la
nomenclatura de la tabla 11 y el ejemplo de la tabla 12.
Sin correccin de continuidad
2 = (b c)2 / (b + c)

Tabla 12. Ejemplo para clculo de 2 en la prueba de McNemar

Tratamiento A
Tratamiento B Total
Evento No evento
Evento 25 8 33
No evento 18 65 83
Total 43 73 116

En nuestro ejemplo,
2 = (8 18)2 / (8 + 18) = 102 / 26 = 100 / 26 = 3,846 (p = 0,0499)
Con correccin de continuidad
2 = (b c 1)2 / (b + c)
donde las dos barras verticales significan mdulo (valor absoluto). En
nuestro ejemplo,

17
2 = (8 18 1)2 / (8 + 18) = ( 10 1)2 / 26 = (10 1)2 / 26 =
92 / 26 = 81 / 26 = 3,115
En este caso p = 0,0776 y vemos una vez ms como al efectuar o no la
correccin de Yates puede llegarse a obtener conclusiones diferentes, por lo
que el criterio de aplicarla o no debe adoptarse antes de ver los resultados.

2 Para Tendencias
En la figura 4 se da un ejemplo tpico de aplicacin de esta prueba, que se
denomina tambin 2 para tendencia lineal, aunque en realidad no prueba
linealidad. Es condicin para aplicar correctamente esta prueba que los
intervalos de clase (intervalo de tiempo en la figura, intervalos de edad,
etc.) sean iguales. Esta prueba tiene 1 grado de libertad.
Las barras de la figura 4 nos muestran como la prevalencia del estfilococo
meticilino resistente (SAMR) aument gradualmente de 16 / 250 (6,4 %) en
1.990 a 23 / 220 (10,5 %) en 1.997. Una prueba 2 de tendencias
abarcando los 8 aos (gl = 7) nos da como resultado:
2 = 3,928 (p = 0,7880)
Si sumamos los aislamientos de cada ao obtenemos en total 1.750 cepas y
con este nmero el poder de detectar como estadsticamente significativa
una diferencia tan pequea como la observada fue 1 = 0,238. Para 1
= 0,8 necesitaramos 6394 aislamientos. En cambio, la prueba de 2 para
tendencias nos dio:
2 = 3,847 ( p = 0,0498)
Es decir, pudimos detectar una tendencia al aumento de la prevalencia de
SAMR antes que las diferencias alcancen a ser significativas. Este ejemplo
muestra la gran utilidad que puede tener esta prueba en la vigilancia
epidemiolgica.

SAMR 16 14 17 19 17 17 20 23
N 250 200 230 250 200 190 210 220
11
10
9
PREVALENCIA DE SAMR (%)

8
7
6
5
4
3
2
1
0
1990 1991 1992 1993 1994 1995 1996 1997
AO
Figura 4. Prevalencia de SAMR en aislamientos bacterianos.

18
SAMR: Staphylococcus aureus meticiino resistente. N: Nmero total de aislamientos
bacterianos en cada ao.

Prueba de Bondad de Ajuste

Una forma sencilla de expresar el concepto de la bondad de ajuste es


pensar en patologas que consideramos predominantes en el gnero
masculino o femenino. Si afirmamos por ejemplo, que la proporcin de
varones entre los infartos de 50 aos es del 90%, conceptualmente
estamos comparando con la expectativa del 50% aproximado de la
distribucin por gnero de la poblacin. Si quisiramos afirmar si es o no
estadsticamente significativo, podramos resolverlo con la prueba de
bondad de ajuste, comparando los porcentajes observados con lo esperado
(en este caso 50% para cada gnero si el riesgo de infarto no estuviera
vinculado al gnero a esa edad).
Para explicar esta prueba, utilizaremos un ejemplo un poco ms complejo.
De los diversos casos planteados en el escenario 3 elegiremos el de la
gentica, utilizando como ejemplo la tabla 13. En ella vemos que de un
total de 107 pacientes pertenecientes a un grupo de familias, se observ
(OBS) en 36 el genotipo homocigoto dominante (RR), en 29 el heterocigoto
(Rr) y en 42 el homocigoto recesivo (rr). Supongamos que la H 0 sea 25 %
RR, 50 % Rr y 25 % rr.

Tabla 13. Prueba de bondad de ajuste aplicada a genotipos.


RR: homozigota dominante. Rr: heterozigota. rr: homozigota recesivo.

Genotipo Observado Esperado segn H0


RR 36 107 x 25 / 100 = 26,75
Rr 29 107 x 50 / 100 = 53,50
rr 42 107 x 25 / 100 = 26,75
Total 107 107,00

Calculamos el esperado (ESP) para RR por medio de una regla de 3 simple:


ESP = 107 x 25 / 100 = 26,75
Anlogamente calculamos los ESP para Rr y rr. Vemos que la suma de los
ESP es 107,00 , es decir, idntica a la suma de los OBS.
Calculamos 2 como la suma de los (OBS ESP) 2 / ESP (podemos hacer
esta prueba pues ningn ESP < 5):
2 = (36 26,75)2 / 26,75 + (29 53,50)2 / 53,50 + (42 26,75)2 / 26,75 = 23,11
Como hay 3 categoras, los grados de libertad son 3 1 = 2 y la p resulta
estadsticamente muy significativa.

19
Esta prueba se utiliza tambin para el clculo de la capacidad predictiva de
un escore, como discutiremos en el captulo de anlisis multivariado.

Odds Ratio o Riesgo Relativo


En el captulo de medidas de efecto del tratamiento se discutir en detalle la
estimacin de estos parmetros y sus intervalos de confianza respectivos.
Discutiremos aqu los escenarios adecuados para el uso de estos
parmetros.
Tabla 14:

Intervencin Evento sin Total Porcentaje


+ evento
BISOPROLOL 156 1171 1327 11.8%
PLACEBO 228 1092 1320 17.3%
Global 384 2263 2647 14.5%

En el captulo de descripcin de datos cualitativos explicamos que se


denomina riesgo a la razn entre pacientes con determinada condicin o
evento y el total de pacientes. En este caso, el riesgo de evento con
bisoprolol es de 156/1327, es decir 0,118 o 11,8%.
Llamamos odds a la razn entre el nmero de pacientes con eventos y el
nmero de pacientes sin eventos: para el grupo bisoprolol 156/1171, 0,133.
Una forma de expresar el efecto del tratamiento es relacionar los dos
riesgos y odds.
Surgen as el riesgo relativo, o cociente entre los dos riesgos: en este caso
11,8/17,3, lo que resulta en un riesgo relativo (risk ratio) de 0,68. Si
hacemos el cociente entre los odds obtendremos el odds ratio de 0,64.
Siempre el odds ratio tender a exagerar los resultados respecto del riesgo
relativo.
En ensayos clnicos de intervencin en grupos paralelos es ms correcto y
comprensible utilizar el riesgo relativo.
Por diferentes motivos que se desarrollarn en los captulos
correspondientes, en otras circunstancias es necesario utilizar el odds ratio
para indicar en forma correcta la relacin entre los grupos.
Resumiremos como forma de introduccin un algoritmo para guiar esa
decisin y su explicacin.

Eleccin entre OR y RR
En primer lugar (figura 5) debemos definir si se trata de un diseo de
propio individuo como control (PIC) o de grupos paralelos.
Si se trata de propio individuo como control, en todos los casos los datos
deben ser estimados a travs del odds ratio.

20
Si son grupos paralelos, debemos fijarnos si son 2 grupos o ms. Si son
solamente dos, debemos tomar en cuenta si se trata o no de un estudio
caso-control. En los estudios de caso-control no puede usarse el riesgo
relativo, slo el OR. En los estudios de intervencin lo conveniente es
calcular RR, pues este dato es ms fcil de comprender. Si son ms de dos
grupos, conviene recurrir al clculo de OR mediante regresin logstica.

SI PIC NO

TRAT >2 >2 GRUPOS

2 REGRESIN REGRESIN 2
LOGSTICA LOGSTICA

CASO-
ODDS RATIO RIESGO RELATIVO NO CONTROL

ODDS RATIO SI

Figura 5. Eleccin entre odds ratio y riesgo relativo.


PIC: propio individuo como control. TRAT: tratamientos.

21

Das könnte Ihnen auch gefallen