100%(1)100% fanden dieses Dokument nützlich (1 Abstimmung)
438 Ansichten30 Seiten
Este documento describe los conceptos clave para evaluar la validez y reproducibilidad de las pruebas diagnósticas. Explica índices como la sensibilidad, especificidad, valores predictivos positivos y negativos, los cuales miden la capacidad de una prueba para clasificar correctamente a los pacientes. También cubre métodos estadísticos como el índice kappa para medir la reproducibilidad entre observadores.
Este documento describe los conceptos clave para evaluar la validez y reproducibilidad de las pruebas diagnósticas. Explica índices como la sensibilidad, especificidad, valores predictivos positivos y negativos, los cuales miden la capacidad de una prueba para clasificar correctamente a los pacientes. También cubre métodos estadísticos como el índice kappa para medir la reproducibilidad entre observadores.
Copyright:
Attribution Non-Commercial (BY-NC)
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen
Este documento describe los conceptos clave para evaluar la validez y reproducibilidad de las pruebas diagnósticas. Explica índices como la sensibilidad, especificidad, valores predictivos positivos y negativos, los cuales miden la capacidad de una prueba para clasificar correctamente a los pacientes. También cubre métodos estadísticos como el índice kappa para medir la reproducibilidad entre observadores.
Copyright:
Attribution Non-Commercial (BY-NC)
Verfügbare Formate
Als PDF, TXT herunterladen oder online auf Scribd lesen
1. PRUEBAS DIAGNSTICAS (adaptado de captulo 8 del compendio de salud pblica)
INTRODUCCIN Aunque habitualmente se hace de forma no consciente, el mdico clnico procura orientar su interrogatorio y las pruebas diagnsticas de forma que aporten informacin sobre la probabilidad de que el paciente tenga o no cierta enfermedad; si al aplicar la prueba, la probabilidad de tener la enfermedad es muy elevada, se produce el diagnstico; si la probabilidad resulta muy baja, se descarta el diagnstico. Si el resultado de una prueba no modifica la probabilidad de enfermedad, entonces la prueba era innecesaria. En la evaluacin de pruebas diagnsticas hay que considerar dos pasos: (a) reproducibilidad y (b) validez.
REPRODUCIBILIDAD Una prueba es reproducible si al repetirla por el mismo observador (reproducibilidad intra-observador) o por distinto (reproducibilidad entre observadores) se obtiene el mismo resultado. Aunque se suele dar menos importancia a la reproducibilidad, lo cierto es que una prueba no puede ser vlida si no es reproducible. Para estudiar la reproducibilidad de una prueba dicotmica, se organizan los datos como en la tabla siguiente. El ndice ms utilizado es el kappa (1):
Reproducibilidad en una prueba dicotmica Observador 2 + - Total Observador 1 + n11 n12 n1+ - n21 n22 n2+ Total n+1 n+2 n
En el ejemplo del clculo de kappa, puede comprobar que, a partir de la tabla observada se calcula Po A continuacin, se construye la tabla esperada al azar: cada casilla se obtiene multiplicando el total de la fila por el total de la columna y dividiendo ese producto entre el total de los totales participantes (por ejemplo, los esperados para n11 seran 60x70/300=14). A partir de esta nueva tabla de esperados se calcula Pe: 1 o e e P P P ! " = "
Donde Po es el grado de acuerdo observado: 11 22 o n n P n + = Y Pe el grado de acuerdo esperado al azar: 1 1 2 2 / / e n n n n n n P n + + + + ! + ! = Ejemplo: 2 observadores (Obs1 y Obs2) valoran a 300 pacientes. en negrita Po (observada) Obs2 Total + - Obs1 + 40 30 70 - 20 210 230 Total 60 240 300 Po= (40+210)/300 =0,83 Pe= (14+184)/300 =0,66 en negrita Pe (esperada) Obs2 Total + - Obs1 + 14 56 70 - 46 184 230 Total 60 240 300 kappa = (0,83-0,66)/(1-0,66) = 0,5 Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 2 Finalmente, se calcula kappa:
ndice kappa de reproducibilidad de una prueba dicotmica.
La interpretacin de kappa es sencilla: valores prximos a 1 indican alta reproducibilidad; valores prximos a 0 indican baja reproducibilidad. En la aplicacin prctica de kappa pueden surgir dos inconvenientes (2,3): (a) paradoja del sesgo: si uno de los observadores tiene mayor tendencia a diagnosticar la enfermedad que el otro, entonces kappa tiende a ser bajo. (b) Paradoja de la prevalencia: kappa es ms elevado en las poblaciones en que el porcentaje de resultados positivos es ms alto. Por ejemplo, la reproducibilidad entre especialistas suele ser mayor que entre mdicos generales, porque en la consulta general la frecuencia de la enfermedad es menor. Otros ndices de reproducibilidad de pruebas dicotmicas son los grados de acuerdo positivo, negativo y total (Po), aunque se recomienda utilizarlos siempre acompaados del kappa (4,5). Cuando la prueba diagnstica tiene ms de dos niveles, es posible calcular el ndice kappa ponderado (6,7). Para la reproducibilidad de pruebas continuas (determinacin de glucemia, por ejemplo), es incorrecto utilizar el coeficiente de correlacin lineal o la prueba t de Student; lo adecuado es emplear el mtodo de Bland y Altman (8) el coeficiente de correlacin intraclase (9,10) o el grfico de acuerdo mediante supervivencia (survival agreement plot) (11,12).
5 0 66 0 1 66 0 83 0 1 , , , , = ! ! = ! ! = e e o P P P " NO EXPLICADO POR EL AZAR obseivauo EXPLICADO POR EL AZAR S4 S4 17,S 66
34 3 17, = kappa } 5 0 34 3 17 66 100 66 3 83 azar por esperada - mxima ia concordanc azar por esperada - observada ia concordanc , , , = = ! ! = = kappa Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S VALIDEZ INTERNA: SENSIBILIDAD Y ESPECIFICIDAD Una prueba perfecta permitira diferenciar siempre entre los enfermos y los sanos; su resultado sera positivo en todos los enfermos y negativo en todos los sanos. Para validar una prueba, lo que se hace es compararla con una prueba perfecta, a la que denominamos "criterio de verdad" o "gold standard" (en la prctica, la prueba perfecta no existe y es necesario utilizar criterios de verdad imperfectos; la forma de hacerlo est ms all de los objetivos de este libro).
Validez de una prueba dicotmica Criterio de verdad Enfermo ( ) No enfermo (nD) Prueba + a1=VP b1=FP - a0=FN b0=VN VP: verdaderos positivos; FP: falsos positivos; FN: falsos negativos; VN: verdaderos negativos
En la tabla anterior se presenta la forma de organizar los datos para medir la validez de una prueba diagnstica (13,14). Sobre esta tabla se definen dos ndices: ! La sensibilidad es la capacidad de la prueba para clasificar correctamente (resultado +) a los enfermos. Observe que en el clculo de la sensibilidad slo se tienen en cuenta los enfermos.
! La especificidad es la capacidad de la prueba para clasificar correctamente (resultado -) a los no enfermos. Observe que en el clculo de la especificidad slo se tienen en cuenta los no enfermos. Especificidad (E ) = P (!| nD) = VN VN + FP
Validez de una prueba dicotmica. Ejemplo Hipocalcemia S No PTH <10 ng/L 180 32 !10 ng/L 20 168
Ejemplo: Sywak (15) estudi si la determinacin de la PTH 4 horas despus de la tiroidectoma permita identificar los pacientes que desarrollaran hipocalcemia; en la tabla anterior se presentan los datos (modificados) de pacientes con y sin hipocalcemia que presentaron resultado positivo (PTH<10 ng/L) o negativo. Con estos datos, y .
VALIDEZ EXTERNA: VALORES PREDICTIVOS La sensibilidad sirve para responder a la pregunta: si un paciente tiene hipocalcemia, qu probabilidad hay de que previamente tuviera PTH baja? Anlogamente, la especificidad permite responder a: si un paciente no tiene hipocalcemia, qu probabilidad hay de que tuviera PTH normal? Ambas preguntas son intiles en la clnica, donde lo importante es predecir la hipocalcemia utilizando los valores de PTH. Por eso, se desarrollan dos nuevos indicadores: los valores predictivos (7,10,16). El valor predictivo positivo (VPP) indica la probabilidad de que un paciente con un D ( ) ( | ) VP Sensibilidad S P D VP FN = + = + 180 0, 9 180 20 S = = + 168 0, 84 168 32 E = = + Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 4 resultado positivo tenga la enfermedad. Para su clculo se empleas las frmulas siguientes:
VP= verdaderos positivos T+ =total de tests positivos
En la tabla, bastara dividir 180 (VP) entre 180+32 (total T+). VP = 180/(180+32) = 0,849. Lo ms sencillo es hacer una tabla y calcularlo desde la tabla.
De forma anloga, se define el valor predictivo negativo (VPN) como la probabilidad de que un paciente con resultado negativo no tenga la enfermedad:
VN = verdaderos negativos T- =total de tests negativos
VPP = 168 / (168+20) = 0,894
Ejemplo: basndose en su historia previa, el mdico estima que un paciente tiene una probabilidad de 0,3 de desarrollar hipocalcemia. Realiza la determinacin de PTH y encuentra 8 ng/L (un resultado positivo). Cul es ahora la probabilidad de hipocalcemia? Lo ms sencillo es inventar un total redondeado a una cifra alta y aplicar las probabilidades para crear una tabla. Primero se aplica la prevalencia (0,3):
S No Total PTH <10 ng/L !10 ng/L 3000 7000 10000
Despes se aplican sensibilidad y especificidad (0,9x3000) y (0,84x7000):
S No Total PTH <10 ng/L 2700 1120 !10 ng/L 300 5880 3000 7000 10000
El VPP = 2700 / (2700+1120) = 0,71
El VPN = 5880 / (5880+300) = 0,95
Los modos de calcular VPP y VPN muestran que los valores predictivos dependen de la probabilidad a priori de tener la enfermedad; cuando aumenta esta probabilidad, aumenta el VPP y disminuye el VPN. Esto da lugar a que la misma prueba diagnstica tenga distinta validez al aplicarla en diferentes poblaciones (17). Por ejemplo, un resultado positivo ser ms creble: ! En poblaciones con alta prevalencia de la enfermedad. Por ejemplo, el uso de mamografa para diagnstico precoz del cncer de mama tendr mayor VPP en EE. UU. (donde esta enfermedad es ms frecuente) que en Espaa. ! Las pruebas diagnsticas tienen distinta validez a unas edades que a otras. Siguiendo con el ejemplo de la mamografa, como el cncer de mama es ms frecuente entre 50 y 59 aos que entre 40 y 49, el VPP ser tambin ms alto. + = T VP VPP ! = T VN VPP Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S Ejemplos parecidos se pueden poner para mostrar la diferencia de VPP si la prevalencia de enfermedad vara entre sexos, razas, profesiones,... ! Una prueba diagnstica tiene mayor VPP en la consulta / planta del especialista correspondiente que en la del mdico de Atencin Primaria. Por ejemplo, si a la consulta oncologa se derivan los pacientes con mayor probabilidad de tener un cncer de colon, la prueba diagnstica que se utilice encontrar mayor prevalencia de esta enfermedad y, por lo tanto, tendr mayor VPP. ! La misma prueba diagnstica tiene mayor VPP cuando se aplica para el diagnstico clnico (en pacientes en los que se sospecha que pueden tener la enfermedad) que cuando se usa para el diagnstico precoz (en pacientes aparentemente sanos). ! En pacientes en los que el diagnstico se ha orientado mediante una buena historia y exploracin que en pacientes en los que la prueba se hace "por si acaso". ! Una situacin tpica en la clnica: durante el proceso de atencin a un paciente, el MIR-2 de Familia encuentra un resultado de laboratorio alarmante que parece contradecir el buen estado y la historia del paciente. Cuando consulta con el adjunto, ste le dice: Si la clnica dice una cosa y el laboratorio otra, lo que manda es la clnica. Qu subyace detrs de esta regla emprica? La situacin del paciente indica baja probabilidad de tener la enfermedad; por lo tanto, el VPP del resultado de laboratorio ser bajo.
En las mismas situaciones indicadas antes, el VPN ser menos fiable porque, como ya se ha dicho, disminuye al aumentar la probabilidad a priori.
RAZONES DE VEROSIMILITUD (RV) Las razones de verosimilitud 1 positiva (RV+) y negativa (RV-) son dos ndices muy tiles sobre la validez de una prueba diagnstica que permiten relacionar la probabilidad a priori de enfermedad ( ) con la probabilidad a posteriori (valores predictivos). La RV+ es la ms utilizada y expresa cuntas veces es ms probable que la prueba diagnstica sea positiva en los enfermos que en los sanos.
RV+ = p(T+| D) p(T+| nD)
Por ejemplo, si una prueba diagnstica resulta positiva en el 95% de los enfermos y slo da errneamente un falso positivo en el 5% de los no enfermos, su RV+ = 0,95/0,05 = 19 y se interpreta que es 19 veces ms probable que el test sea positivo en enfermos que que lo sea en sanos. Por tanto, la RV+ se obtiene tambin dividiendo la sensibilidad entre el complementario de la especificidad (observe que se utilizan slo las casillas con resultados positivos). Para disponer de una buena prueba diagnstica, lo que interesa es que la RV+ sea mayor que 1, y cuanto mayor, mejor prueba. Aplicado al ejemplo de la PTH e hipocalcemia, se obtiene:
La RV- se obtiene dividiendo el complementario de la sensibilidad entre la especificidad (observe que se utilizan slo las casillas con resultados negativos). Para
1 Likelihood ratio en ingles. ( ) P D 0, 9 5, 625 1 0,16 S RV E + = = = ! Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 6 disponer de una buena prueba diagnstica, interesa que RV- sea menor que 1, y cuanto menor, mejor prueba. Aplicado al ejemplo de la PTH:
RELACIN ENTRE RAZONES DE VEROSIMILITUD Y VALORES PREDICTIVOS Si 80 de cada 100 enfermos dan un resultado positivo, entonces la sesnsibilidad es del 80%. Los 80 (verdaderos positivos) aparecern tanto en el numerador como en el denominador. Esto sucede porque la sensibilidad es una proporcin y todas las proporciones y probabilidades (S, E, VPP, VPN) incluyen el numerador en su denominador. En cambio las odds dividen los que tienen una caracterstica entre quienes no la tienen y as excluyen el numerador del denominador. Decir que la odds de mujeres:varones es 1, es lo mismo que decir que el 50% son mujeres. En el ejemplo anterior de la sensibilidad del 80%, podra decirse que su odds es 4 (80/20). Tambin puede decirse que una odds es una probabilidad dividida por su complementario: odds = p 1! p
Por ejemplo, si la prevalencia de una enfermedad fuese del 30%, la odds de esa prevalencia (que luego llamaremos oddspretest) sera 0,3/0,7 = 0,43 A partir de una odds, se vuelve a obtener la probabilidad con la siguiente frmula: p = odds 1!odds
Si sabemos que la odds de prevalencia de una enfermedad es 0,43, su prevalencia ser 0,43/1,43 = 0,3. Son dos modos de expresar lo mismo. Cuando la probabilidad es muy pequea la odds casi coincide con la probabilidad. Usando odds en vez de probabilidades hay una frmula simple y muy interesante para relacionar la razn de verosimilitud positiva con la prevalencia (que dar la odds previa) y el valores predictivo positivo (que dar la odds posterior). Se denomina odds previa a la odds de la prevalencia y odds posterior a la del VPP. Se cumple que
Esta frmula es importante pues transmite de algn modo el planteamiento bayesiano. El planteamiento bayesiano, de modo general, exige matizar un hallazgo a la luz de unos supuestos o creencias previas, en este caso la creencia previa es la estimacin de la prevalencia de la enfermedad en la poblacin. Ver el apartado sobre Factor Bayes en pg. 34-35 que repite de algn modo estas ideas. La odds previa es la informacin basal de tipo general que se tiene antes de recoger ningn dato especfico del caso que se est estudiando. La odds posterior, en cambio, es la que se obtiene despes de que la prueba diagnstica ya haya dado un resultado positivo e integra el conocimiento nuevo (cociente entre sensibilidad y 1- especificidad) con la odds previa para proporcionar una nueva odds. Volviendo al ejemplo inicial: basndose en su historia previa, el mdico estima que un paciente tiene una probabilidad de 0,3 de desarrollar hipocalcemia. Realiza la determinacin de PTH y encuentra 8 ng/L (un resultado positivo). Cul es ahora la probabilidad de hipocalcemia? Creencia previa sobre la prevalencia: 0,3 ! odds previa = 0,3/0,7 = 0,43 RV+ = p(T+ | D) / p(T+ | nD) = S / (1-E) = 0,9 / 0,16 = 5,625 1 0,1 0,119 0, 84 S RV E ! ! = = = + ! = RV ODDS ODDS pre post Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 7 Frmula: oddspost = oddspre x RV+ = 0,43 x 5,625 = 2,42 Transformacin de oddspost en VPP = 2,42 / (1+2,42) = 0,71 El lector puede contestar por su cuenta a la siguiente pregunta Una prueba de laboratorio aparece alterada en 8 de cada 10 individuos que padecen una determinada enfermedad crnica mientras se obtienen valores normales en 8 de cada 10 individuos que no sufren dicha enfermedad. Si se aplica la prueba a una poblacin de 100 individuos de los cuales 20 sufren la enfermedad cul ser el valor predictivo positivo de la prueba? La respuesta correcta debe ser VPP= 50%. Cuanto mayor sea la RV+, mayor ser el VPP. Si la RV+ es 1, la prueba no aporta ninguna ganancia, pues el VPP ser igual a la prevalencia. Una RV+=1 es nula. Si la RV+ fuese inferior a 1, habra que intepretar la prueba al revs. Tambin si RV-=1 se obtiene que la probabilidad tras el resultado negativo es la misma que sin realizar la prueba: la prueba es intil. Se ha propuesto (hasta ahora sin xito) cambiar la expresin de la RV- (18,19).
VALIDEZ DE PRUEBAS CON MS DE DOS CATEGORAS En ocasiones, se dispone de pruebas que clasifican a los pacientes en ms de dos categoras. La tabla inferior muestra el ejemplo de PTH e hipocalcemia, clasificando el resultado de la PTH en cuatro categoras. Las columnas de hipocalcemia = S/No presentan la distribucin de los pacientes con hipocalcemia en porcentaje (es decir, el 71% de los pacientes hipocalcmicos y el 6% de los pacientes normocalcmicos tuvieron PTH < 3 ng/L).
Validez de una prueba con ms de dos categoras. Se presentan porcentajes sobre el total de enfermos y total de sanos. Hipocalcemia RV+ S No PTH (ng/L) <3 71 6 11,8 3-10 19 10 1,9 10-20 5 16 0,313 >20 5 68 0,074 Total 100% 100% En estas pruebas con ms de dos categoras, es muy sencillo generalizar el concepto de razn de verosimilitud. Por ejemplo, para conocer la razn de verosimilitud de un resultado con PTH<3, basta con dividir los porcentajes de pacientes con y sin hipocalcemia que tienen ese nivel de PTH:
Las razones de verosimilitud aparecen calculadas en la ltima columna de la tabla. Con esos valores, puede calcularse la probabilidad de hipocalcemia de cualquier paciente, en funcin del nivel de la PTH, utilizando una frmula similar a la que se acaba de ver para los valores predictivos.
VALIDEZ DE PRUEBAS CONTINUAS: CURVA ROC En los apartados anteriores se ha considerado el diagnstico basado en tests que dan una respuesta dicotmica (positivo o negativo). Sin embargo, muchas pruebas diagnsticas son cuantitativas (por ejemplo, glucemia, hemoglobinemia, tensin arterial sistlica, fraccin de eyeccin ventricular,!). Para convertir estas pruebas en dicotmicas es necesario determinar un punto de corte a partir del cual se considerar que los resultados son positivos; la decisin sobre el punto de corte adecuado no es automtica y uno de los instrumentos tiles para tomarla es la curva ROC, aunque se deben tener en cuenta otros aspectos (20-23). Las curvas ROC se desarrollaron en la dcada de los 50 del siglo pasado para evaluar la seal de radar. El nombre original 3 71 11, 8 6 PTH RV < = = Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 8 de la curva es Receiver Operating Characteristic; es un trmino procedente del radar y no tiene aplicacin a la medicina, por lo que no tiene sentido traducirla. La curva ROC se construye situando el complementario de la especificidad (1-E) en abscisas (eje horizontal) y la sensibilidad en ordenadas (eje vertical). A continuacin, se representan los diferentes puntos de corte y se unen por una lnea. La figura siguiente presenta la curva ROC del ejemplo sobre hipocalcemia y PTH, tomando la PTH como variable continua.
Curva ROC sobre la validez del valor de PTH a las 4 horas de la tiroidectoma para detectar hipocalcemia (15).
ELECCIN DEL PUNTO DE CORTE El punto de corte ideal es S = 1, 1-E = 0, que coincide con el ngulo superior izquierdo de la figura; por lo tanto, una buena aproximacin a la eleccin de punto de corte es elegir el ms prximo a dicho ngulo. Otra idea interesante para elegir el punto de corte es encontrar el punto de mxima curvatura de la curva ROC. En la figura, la mxima curvatura se alcanza en el punto marcado con un 1; puede observarse que desde ese punto, aumentar ligeramente la sensibilidad (desplazndose hacia el punto marcado con un 3) produce un gran descenso en la especificidad, y -al contrario- aumentar ligeramente la especificidad (desplazndose hacia el punto marcado con un 2) produce un gran descenso en la sensibilidad. La eleccin del punto de corte no depende slo de su cercana al ngulo superior izquierdo: segn la enfermedad y el uso que se pretenda dar a la prueba, se puede preferir una prueba ms sensible y menos especfica (o al revs), o puede ser necesario tener en cuenta el coste de la prueba y los tratamientos.
REA BAJO LA CURVA El rea bajo la curva ROC es una buena medida de la validez general de una prueba diagnstica. Una prueba que discrimine perfectamente entre los dos grupos (enfermos y sanos) dar una curva que coincide con los lados izquierdo y superior de la figura. La figura completa es un cuadrado de lado 1, por lo que el rea mxima bajo la curva ser 1, que se alcanzar cuando la curva ROC recorra el eje de ordenadas hasta el punto (1, 0) y, a continuacin, el eje horizontal superior hasta el punto (1, 1). Cuanto mayor sea el rea bajo la curva, mejor es la prueba diagnstica. Una prueba completamente intil ser una lnea recta que vaya desde el ngulo inferior izquierdo al ngulo superior derecho. Esta prueba (la peor prueba posible) es la que tiene rea bajo la curva = 0,5. Qu ocurre si una curva tiene rea menor de 0.5? Simplemente, que se estn interpretando mal los valores de la prueba y lo que hay que hacer es invertir la terminologa: lo que se ha llamado positivo pasa a ser negativo y viceversa; con eso el rea bajo la curva pasar a ser mayor de 0,5. El rea bajo la curva tiene una interpretacin probabilista: si se escogen al azar un paciente hipocalcmico y uno normocalcmico, el rea bajo la curva indica la probabilidad de que el hipocalcmico presente una PTH menor que el normocalcmico. Si la PTH fuera una prueba perfecta (rea bajo la curva = 1), todos los hipocalcmicos tendran valores ms bajos que los normocalcmicos (por lo tanto, 1 2 S Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 9 la prueba discriminara perfectamente entre ambos grupos). Si la PTH fuera una prueba intil (rea bajo la curva = 0,5), la probabilidad de que un hipocalcmico tuviera PTH ms baja que un normocalcmico sera igual a 0,5; esto dara a la prueba diagnstica la misma validez que arrojar una moneda al aire.
CALIBRACIN Y DISCRIMINACIN Los conceptos de calibracin y discriminacin en pruebas diagnsticas son diferentes. ! La calibracin se refiere a la capacidad de predecir correctamente la proporcin de personas dentro de cada subgrupo que padecern la enfermedad (ej. habr ms eventos en un grupo de pacientes de mayor riesgo). Por ejemplo, si una prueba diagnstica o un modelo multivariable clasifica a los pacientes en 3 grupos con riesgos predichos del 5%, 10% y 15%, se considerar que la calibracin es buena si al aplicar la clasificacin a un grupo externo al que gener estas predicciones, las incidencias reales de eventos observados estn prximas al 5%, 10% y 15%. La calibracin se demuestra presentando las tasas de eventos observados versus esperados para cada grupo de riesgo predicho. ! La discriminacin se refiere en cambio a la probabilidad que tiene una prueba diagnstica o instrumento de prediccin para distinguir entre dos pacientes, uno con alto y otro con bajo riesgo. P. ej., al atender a 2 pacientes al azar, en los que 1 de ellos posteriormente desarrollar un evento clnico, la prueba discriminar bien si predice correctamente cul de los dos tiene mayor riesgo de padecer el evento. Matematicamente esto se describe mediante el rea bajo la curva ROC (tambin se le llama ndice C o estadstico C y se puede calcular mediante la U de Mann Whitney dividiendo la U mayor de las dos que se obtengan entre el total de comparaciones (n1 x n2)). El rea bajo la curva ROC dene la probabilidad de que una persona seleccionada al azar del grupo de pacientes tenga un valor ms alto en la prueba que una persona tomada al azar del grupo no afectado.
REFERENCIAS (1) Cohen J. A coefficient of agreement for nominal scales. Educ Psychol Meas 1960;20:37-46. (2) Feinstein AR, Cicchetti DV. High agreement but low kappa: The problems of two paradoxes. J Clin Epidemiol 1990;43:543-9. (3) Cicchetti DV, Feinstein AR. High agreement but low kappa: Resolving the paradoxes. J Clin Epidemiol 1990;43:551-8. (4) Kraemer HC, Bloch DA. Kappa coefficients in epidemiology: an appraisal of a reappraisal. J Clin Epidemiol 1988;41:959- 68. (5) Maclure M, Willett WC. Misinterpretation and misuse of the kappa statistic. Am J Epidemiol 1987;126:161-9. (6) Cohen J. Weighted kappa: nominal scale agreement with provision for scaled disagreement or partial credit. Psychol Bull 1968;70:213-20. (7) Delgado-Rodrguez M, et al. Estudio de las pruebas diagnsticas. En: Sierra-Lpez A et al: Pidrola Gil - Medicina Preventiva y Salud Pblica. 11 ed, Barcelona: Elsevier; 2008;173-84. (8) Bland JM,Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement. Lancet 1986;1(8476):307-10. (9) Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el coeficiente de correlacin intraclase. Med Clin (Barc.) 1998;110:142-5. (10) Snchez-Villegas A, Martnez-Gonzlez MA, Palma S. Anlisis de la concordancia. En: Martnez-Gonzlez MA, Snchez-Villegas A, Fauln Fajardo FJ (eds.). Bioestadstica amigable. 2 ed. Madrid: Daz de Santos, 2006;821-50. (11) Luiz RR, Costa AJ, Kale PL, Werneck GL. Assessment of agreement of a quantitative variable: a new graphical approach. J Clin Epidemiol 2003;53:963-7. (12) Llorca J, Delgado-Rodrguez M. Survival analytical techniques were used to assess agreement of a quantitative variable. J Clin Epidemiol 2005;58:314-5. (13) Altman DG, Bland JM. Diagnostic test 1: sensitivity and specificity. BMJ 1994;308:1552. (14) Gilbert R et al. Assessing diagnostic and screening tests: Part 1. Concepts. West J Med 2001;174:405-9. (15) Sywak MS, Palazzo FF, Yeh M, et al. Parathyroid hormone predicts hypocalcaemia after total thyroidectomy. ANZ J Surg 2007;77:667-70. (16) Altman DG, Bland JM. Diagnostic tests 2: Predictive values. BMJ. 1994;309:102. (17) Brenner H, Gefeller O. Variation of sensitivity, specificity, likelihood ratios and predictive values with disease prevalence. Stat Med 1997;16:981-91. (18) Delgado-Rodrguez M, Almaraz A, Farias-Alvarez C. Should the definition for the negative likelihood ratio be changed? J Clin Epidemiol. 1997;50:641-2; discussion 643-4. (19) Delgado-Rodrguez M, Almaraz A, Farias-Alvarez C. Should the definition for the negative likelihood ratio be changed? J Clin Epidemiol. 1997;50:639-40. (20) Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic curve. Radiology 1982;143:29-36. (21) Hanley JA, McNeil BJ. A method of comparing the area under two ROC curves derived from the same cases. Radiology 1983;148:839-43. (22) Zweig MH , Campbell G. Receiver-Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical Medicine. Clin Chem 1993;39:561-577. (23) Altman DG, Bland JM. Diagnostic tests 3: receiver operating characteristic plots. BMJ 1994;309:188.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 1u 2. CAUSALIDAD EN EPIDEMIOLOGA
MODELO CAUSAL DE ROTHMAN (MODELO DETERMINISTA MODIFICADO) La creencia de que una enfermedad tiene una sola causa, y que cada posible causa origina una sola enfermedad es falsa, pero consciente o inconscientemente est arraigada en nuestra mente. Aun cuando se admita la multicausalidad, tambin est arraigada la creencia de que al sumar el porcentaje de casos de enfermedad atribuibles a cada factor, al final se llegar a una suma del 100%. Esto no es as. Obsrvese la siguiente tabla (tasas de un cncer por 100.000 habitantes-ao) No fuma Fuma Abstemios 10 40 Beben alcohol 30 120 Podra decirse que el tabaco multiplica por 4 las tasas y en cambio, el alcohol lo multiplica por 3. Esto es cierto segn la tabla. No habra ni sinergia ni antagonismo, sino simplemente una multiplicacin de efectos en los expuestos a ambos factores. Se puede afirmar que de los 120 casos por 100.000 observados en bebedores y fumadores: se habran evitado 90 si nadie en esa poblacin fumase (120-30=90). se habran evitado 80 si todos en esa poblacin fuesen abstemios (120-40=80). Por lo tanto, de esos 120 casos, el 75% (90/120) se deben al tabaco y el 67% (80/120) se deben al alcohol. La suma de ambos porcentajes es superior al 100%. Cmo puede ser esto? El modelo determinista modificado de Rothman resuelve sta y otras perplejidades al incorporar conceptos deterministas y multicausales 2 . Se define: ! Causa suficiente: mecanismo multicausal compuesto por el conjunto mnimo de componentes que actuando conjuntamente, invariablemente producen la enfermedad. Ver figura 2.1 donde aparecen 2 causas suficientes (I y II). ! Causa componente (o contribuyente): cada uno de los elementos de la causa suficiente. Ver figura 2.1 donde aparecen 4 causas componentes de cada una de las 2 causas suficientes. ! Causa necesaria: causa componente presente en todas las causas suficientes. La mayora de las enfermedades tienen distintos mecanismos causales suficientes y cada uno de ellos incluye varias causas componentes. Para producir la enfermedad, cada uno de los mecanismos requiere que todos y cada uno de sus componentes acten conjuntamente. Cundo todos estn presentes inevitablemente se produce la enfermedad. De ah el carcter determinista. No hay lugar para el azar o la probabilidad. Si falta un slo componente de una causa suficiente, la enfermedad no se producir por este mecanismo. Por eso, aunque se ignore la mayora de los componentes del mecanismo suficiente, eliminar un solo componente prevendr la enfermedad por ese mecanismo. Hay componentes que pueden participar en distintos mecanismos multicausales. Esto explica que la suma de las proporciones atribuibles a cada componente pueda ser >100%.
Figura 2.1. Causa suficiente
Causa suficiente I Causa suficiente II (60%) (40%)
2 El modelo determinista (Koch-Henle) postula la relacin nica, constante y recproca entre causa y efecto. No est vigente porque las enfermedades tienen varias causas. El modelo multicausal se basa en que todo suceso est producido por una multiplicidad de factores que actan de forma conjunta o independiente para provocar el suceso.
C B A D A E G H Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 11 La causa componente A es responsable del 100% de la enfermedad, B del 60%, H del 40%. La causa componente A sera necesaria y por tanto las intervenciones preventivas sobre ella, sern las prioritarias para evitar la enfermedad.
MODELO CONTRAFCTICO (COUNTERFACTUAL) DE CAUSALIDAD Supongamos que deseamos comparar el riesgo de infarto de miocardio dependiendo del consumo de aceite de oliva. La intuicin nos llevar a comparar el riesgo de infarto entre los consumidores y los no consumidores. Sin embargo, esto no ofrece una informacin fidedigna del efecto del aceite de oliva porque los consumidores de aceite suelen tener un estilo de vida ms saludable incluyendo mayor consumo de verduras y ensaladas, menor consumo de carnes y otros factores asociados a menor riesgo de infarto. En definitiva, habra que admitir que los grupos comparados son distintos no solo en el consumo de aceite de oliva. Por lo tanto, la pregunta realmente interesante es: cmo se modifica el riesgo de infarto de una persona que no consume aceite de oliva si pasa a hacerlo, pero sigue igual en todo lo dems? Lo interesante conceptualmente es plantear una comparacin de cada sujeto consumidor de aceite con otro sujeto exactamente igual a l en todo, pero que no probase nunca el aceite. Tales sujetos exactamente iguales no existen en la realidad. Se tratara de un grupo ficticio de sujetos (un grupo que fuese el de los realmente expuestos pero situndolos en el hipottico caso de que no estuviesen expuestos). A este tipo de comparacin, que va en contra de los hechos, se le llama contrafctica. Pensar as puede parecer absurdo, pero resulta til para llegar a inferencias causales y realizar buenos diseos de investigacin. Buenas aproximaciones al modelo contrafctico son el ajuste multivariable, los diseos aleatorizados y especialmente los ensayos cross-over (ver ms adelante). Se habla de mera asociacin estadstica entre dos variables cuando se encuentra que existe una relacin entre ellas, mayor que la que cabra esperar por el azar y entonces se dice que hay una asociacin estadsticamente significativa. Esto no implica necesariamente causalidad. Las asociaciones pueden ser causales o no causales. Es mejor reservar la palabra efecto para cuando hay elementos de juicio suficientes como para hablar de causalidad, siempre teniendo en mente el modelo contrafctico. Mientras no se dispone de tales elementos es ms prudente hablar de meras asociaciones. Las asociaciones pueden ser positivas (directas), cuando la probabilidad de aparicin de un fenmeno aumenta con la presencia de la otra variable, o cuando crece la variable y al crecer la variable x; o negativas (inversas), cuando la probabilidad de aparicin de un fenmeno disminuye con la presencia de la otra variable (haya causalidad o no). Las asociaciones no causales o espurias (o por error, artificiales), son las que aparecen como consecuencia de sesgos de seleccin de la muestra, por errores de informacin o por sesgos de confusin. Un ejemplo tpico es el de las manchas amarillas en los dedos de los fumadores y su asociacin no causal con el cncer broncopulmonar. Las asociaciones no causales fortuitas son las debidas al azar, a sesgos (o a razones desconocidas por nosotros).
PERIODO DE INDUCCIN Si en la causa suficiente I de la figura 2.1, la secuencia temporal con la que actu!an los componentes causales es que acta primero A, luego B, C, y por u!ltimo D; esto hace que si se investiga la causalidad del factor B, no se podr observar la ocurrencia de enfermedad inmediatamente despus de intervenir B, puesto que se requiere esperar a que tambin ocurran C y D. La enfermedad no aparecer hasta que se complete la secuencia y transcurrir un tiempo mientras que ocurre C y hasta que finalice de intervenir D. Solo entonces aparecer la enfermedad. El intervalo de tiempo entre la actividad de B y la enfermedad, ser el tiempo o periodo de induccin para la causa componente B. Este periodo de induccin de B ser mayor que el periodo de induccin del ltimo componente de la cadena (D). Las causas contribuyentes que actan al inicio de la secuencia causal tendrn periodos de induccin ms largos. El periodo de induccin de la u!ltima causa componente en la secuencia ser casi igual a cero. Es incorrecto hablar de un periodo de induccio!n para una enfermedad determinada, ya que el periodo de induccio!n siempre se asocia a la relacio!n especi!fica entre cada una sola de las causas contribuyentes y la enfermedad que esta causa componente produce. Es decir, para una sola enfermedad, habr tantos periodos de induccin como causas contribuyentes o componentes tenga en Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 12 sus mecanismos causales suficientes. En el ejemplo de la Figura 2.1, habr 8 periodos de induccin, ya que el periodo de induccin de A en el mecanismo suficiente I puede ser distinto del de ese mismo componente A en el mecanismo causal II. En carcinoge!nesis se habla de iniciadores o promotores, segn sean causas que actu!en ms temprano o ms tarde, respectivamente. Por ejemplo, los anticonceptivos orales son ms promotores que iniciadores de cncer de mama, el efecto de estrgenos/progestgenos es hacer crecer las clulas neoplsicas que ya se han vuelto malignas o invasivas. Cuando se estudian factores de riesgo de cncer en epidemiologa los factores iniciadores siempre tendra!n mayores periodos de induccio!n que los promotores. Lo mismo puede decirse de la terminologi!a de factores predisponentes o precipitantes utilizados en enfermedades cro!nicas, la ruptura o desestabilizacin de la placa de aterosclerosis y los factores que la desestabilizan son desencadenantes, con periodos de induccin cortos. Si un estudio epidemiolgico encuentra un corto periodo de induccin para la exposicin a cocana respecto al infarto de miocardio, se tratar de un desencadenante. En conclusio!n, puede decirse que el modelo determinista absoluto esta! desechado por la ciencia actual, y que el modelo determinista modificado de Rothman, basado en conceptos de multicausalidad y probabilsticos, se adapta mejor a la realidad.
CRITERIOS DE CAUSALIDAD EN EPIDEMIOLOGA No toda asociacin verificable con el mtodo epidemiolgico corresponder a una verdadera relacin causa-efecto. Los criterios de causalidad ms conocidos son los de Bradford Hill. Todos pueden tener excepciones y son criticables. El nico requisito sine qua non es la secuencia temporal. La causa siempre preceder al efecto. Estos criterios son: 1. Secuencia temporal: la supuesta causa debe preceder al efecto. 2. Fuerza de la asociacin: cuanto mayor RR, ms verosmil ser la causalidad. 3. Gradualidad; tendencia dosis-respuesta en las asociaciones causales. 4. Consistencia: si la asociacin es causal muchos estudios la evidenciarn. 5. Especificidad: al ser causal slo existir para un efecto o una exposicin concreta. 6. Plausibilidad biolgica: podemos explicar el mecanismo causal. 7. Coherencia: no contradice las tendencias temporales o su historia natural. 8. Evidencia experimental: hay estudios experimental que lo confirman. 9. Analoga: existen asociaciones similares ya demostradas. Los tres primeros criterios pueden comprobarse en el estudio concreto que se ha realizado, segn sus hallazgos y segn su diseo (ver ms adelante). Los estudios trasversales (cross-sectional) no suelen permitir verificar la secuencia temporal. Los otros criterios proceden habitualmente de la bibliografa. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 1S odds = s no proporcin = s s +no tasa = a (a +b) !t 3. MEDIDAS DE FRECUENCIA
MEDIDAS DE FRECUENCIA
PROPORCIN: Cociente cuyo numerador est incluido en el denominador. Carece de unidades. Tiene valores entre 0-1 (o bien entre 0% y 100% si se expresa en porcentajes, como suele ser frecuente).
Proporcin (p) =a / a+b
RAZN: Cociente cuyo numerador no est incluido en el denominador. No tiene unidades. Sus lmites son 0 e infinito.
Razn=a/b
ODDS: Es un caso particular de razn en la que el numerador es la probabilidad de que ocurra un suceso (p) y el denominador la probabilidad de que no ocurra (1-p). La odds (o ventaja), como todas las razones, carece de unidades y sus valores oscilan entre cero e infinito. Evala lo mismo que la proporcin pero en una escala distinta. Desde el punto de vista prctico se calcula dividiendo el nmero de sujetos que s tienen una caracterstica entre el nmero de sujetos que no la tienen.
Por ejemplo: si de 100 pacientes, 80 se curan con tratamiento, la odds de curacin ser odds = 80/20 =4 Interpretacin: se curan 4 por cada uno que no se cura. Es 4 veces ms probable curarse que no curarse.
Pero la proporcin (p) sera
p = 80 / (80+20) = 0,8.
Como la odds es la probabilidad (p) de que ocurra algo, dividido por su complementario (1-p), se puede obtener la odds sabiendo las proporciones (p)
odds = p/1-p
odds = 0,8 / 0,2 = 4
Tambin se puede hacer al revs: obtener la proporcin (p) a partir de una odds
p=odds/1+odds p = 4 / (1+4) = 0,8
En definitiva, la odds evala lo mismo que la proporcin, pero en una escala distinta.
TASA: Cociente que lleva incorporado en el denominador una variable de naturaleza diferente al fenmeno estudiado y que generalmente es el tiempo (t):
Donde a son los casos y b los no casos. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 14 Por ejemplo, si de 100 personas, 4 enferman durante el seguimiento y el tiempo de seguimiento medio fue de 0,5 aos, la tasa de enfermedad ser
tasa = 4 / (4+96)x0,5 = 0,08 aos -1
Su unidad es el recproco del tiempo (p.ej. aos -1 ). Un aspecto importante de la tasa es que tiene interpretacin slo poblacional, pero no individual. As, si la tasa de infarto en un grupo de alto riesgo fuese de 0,08 aos -1 significa que se producen 8 infartos por cada 100 habitantes y ao en esa poblacin. Esto se aplica a la poblacin, pero no al sujeto. Mide la velocidad de ocurrencia o fuerza de morbilidad de una enfermedad. Sus valores oscilan entre cero e infinito.
MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD
PREVALENCIA: Proporcin de sujetos que padecen un fenmeno en un momento determinado. El numerador es el total de casos y el denominador toda la poblacin. Casos existentes en tiempo t P = -------------------------------------------- Poblacin total en tiempo t La prevalencia puntual o de punto mide la proporcin de enfermos en un solo momento (t). El momento t se puede referir a un momento concreto del calendario o un momento determinado dentro de la evolucin de un proceso que vara, en tiempo de calendario, de una persona a otra. Por ejemplo: puede hablarse de proporcin de prevalencia de punto de infecciones en heridas quirrgicas en las primeras 48 horas postquirrgicas. El momento que sigue a las primeras 48 horas postquirrgicas no ocurre en el mismo momento del calendario para cada paciente pero sigue tratndose de una prevalencia de punto.
Alternativamente, se puede medir la frecuencia de enfermedad en una poblacin durante un periodo de tiempo predefinido y entonces se llama prevalencia de periodo. El numerador son todos los que han estado enfermos en algn momento de ese periodo y el denominador todos los que han estado presentes en esa poblacin en algn momento de ese periodo. Si ese tiempo fuese toda la vida, se hablara de lifetime prevalence o prevalencia a lo largo de la vida, en ese caso el numerador lo constituyen todos aquellos que hayan sufrido la enfermedad en algn momento de sus vidas. Pero a veces se usa como denominador el tamao poblacional de la mitad del periodo de tiempo considerado o la poblacin media durante dicho periodo de observacin.
Los factores que aumentan o reducen la prevalencia son:
Aumentan la prevalencia Reducen la prevalencia Por aumento de numerador Aumento de casos nuevos (incidencia) Mayor duracin: enfermedades cro!nicas Mayor supervivencia de los pacientes (sin curarse) Mejora de procedimientos diagno!sticos Inmigracio!n de casos Inmigracin de susceptibles (si acaban enfermando)
Por reduccin de denominador Emigracin de los sanos o poco susceptibles Muerte de los poco susceptibles Por reduccin de numerador Disminucio!n de casos nuevos (menor incidencia) Menor duracin: enfermedades agudas Alta mortalidad de casos (mayor letalidad=menor prevalencia). Ms curaciones por mejora de tratamientos Emigracio!n de casos
Por aumento de denominador Inmigracio!n de personas sanas. Inmigracio!n de personas no susceptibles (p.ej. vacunados).
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 1S Es importante que quede claro que cuanto ms duracin tiene una enfermedad, mayor tender a ser su prevalencia. La prevalencia es como un depsito con una entrada (incidencia de casos nuevos) y dos salidas (muerte y curacin). La utilizacio!n de la prevalencia es especialmente u!til en: Situaciones donde no es posible medir la incidencia (ver ms abajo). Por ejemplo, para estudiar malformaciones conge!nitas se habla de prevalencia porque no es posible medir el nu!mero de fetos anormales que se han destruido mediante abortos esponta!neos y precoces. Las malformaciones observables en el momento del nacimiento son proporciones de prevalencia de punto (en el nacimiento). Es incorrecto hablar de incidencia de malformaciones congnitas porque los casos observables son solamente los que han sobrevivido hasta el momento del nacimiento. Planificacio!n sanitaria: p. ej, para saber cua!ntas camas se necesitan, cada di!a del ao, en Unidades de Cuidados Intensivos, ser til contar con el dato de la prevalencia diaria observada de enfermos que precisen este tipo de cuidados en la poblacin de referencia del hospital. Enfermedades degenerativas no letales (p.ej. artrosis), o ciertas enfermedades mentales (p.ej. depresin) cuyo comienzo en el tiempo es difcil de precisar. Para estimar la incidencia es preciso conocer el momento de comienzo de la enfermedad con exactitud; sin embargo, para la prevalencia es suficiente saber quie!nes tienen una enfermedad en un periodo determinado (sin conocer su momento exacto de comienzo). En el caso de enfermedades con sintomas o brotes intermitentes se hablar de pacientes que hayan tenido dichos sntomas, al menos una vez durante el periodo de observacio!n.
INCIDENCIA ACUMULADA (IA) O RIESGO ABSOLUTO: Proporcin de individuos susceptibles que desarrollan un fenmeno (casos nuevos) en un tiempo determinado (perodo de seguimiento t0-t1). La incidencia acumulada tambin se llama riesgo y s tiene una clara interpretacin individual: riesgo de enfermar en dicho periodo. En enfermedades infecciosas, se denomina tasa de ataque. N casos nuevos durante t0-t1 IA = ------------------------------------------ N sujetos susceptibles en t0 Lo importante es que el numerador slo incluye a los casos nuevos. Para calcular la incidencia hay que olvidarse de los casos que existan al comienzo del estudio y contar slo los que empiezan a producirse a partir de entonces. El denominador son slo los que estn a riesgo de convertirse en casos nuevos durante el periodo de seguimiento. A los casos nuevos a veces se les llama casos incidentes. Si la prevalencia es una foto esttica que refleja la proporcin de enfermos en un momento determinado, la incidencia es como un vdeo que va contando como avanza la enfermedad a lo largo de un periodo seguimiento. Sin seguimiento, no hay incidencia. La IA es sensible al abandono de personas del estudio (muertes por otras causas competitivas, traslado de residencia, falta de colaboracio!n o defectos de observacio!n y seguimiento por parte del investigador). Las causas competitivas son otras enfermedades que pueden competir con la enfermedad de intere!s. Por ejemplo si en un estudio sobre cncer de mama, hubiese muchas muertes prematuras por accidentes de trfico en un grupo, esas mujeres que mueren por accidente tendran menos probabilidad de convertirse a la larga en casos de cncer de mama. La especificacin de cunto dura el seguimiento es imprescindible para poder interpretar una proporcin de incidencia acumulada. No es lo mismo decir que han muerto un 20% de personas en un estudio que ha durado 6 aos, que en un estudio con 20 aos de duracin. Al final, si el tiempo de observacin es muy largo, la incidencia acumulada de mortalidad ser siempre del 100%, por eso, muchas veces es preferible usar las tasas que tienen el tiempo en cuenta ya desde su denominador, como se explica a continuacin.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 16 DENSIDAD DE INCIDENCIA (DI) O TASA DE INCIDENCIA: Tasa que mide la velocidad con la que se pasa de sano a enfermo (por unidad de tiempo) en una poblacin. Estima la fuerza de morbilidad o velocidad de enfermar. Casos nuevos en t0-t1 DI = -------------------------------- = (unidades tiempo -1 ) Personas*tiempo Para obtener el denominador es necesario medir para cada sujeto su tiempo total en riesgo. El denominador es la suma de los tiempos de observacin de cada persona. Si se han producido dos casos nuevos de enfermedad aguda en 10 personas y su seguimiento fue: 5 de ellas fueron seguidas 3 das cada una 3 de ellas fueron seguidas 6 das cada una los dos que enfermaron lo hicieron a los 2 y a los 5 das El numerador ser: 2 El denominador: (5x3 das) + (3x6 das) + 2 dias + 5 das = 40 personas-das La DI = 2 / 40 = 0.05 das -1
Interpretacin: Por cada persona-da la velocidad de ocurrencia de enfermedad es 0.05. Por trmino medio, por cada 20 personas-das enfermar una persona. El denominador de la DI se expresa en unidades de personas-tiempo. La DI es una tasa (sus dimensiones son 1/tiempo o tiempo 1 y toma valores entre 0 e infinito). La DI tiende a infinito cuando observamos muchos desenlaces en un instante pequeo, por ejemplo si contabiliza!ramos las muertes producidas por una bomba ato!mica. A diferencia de la IA, la DI carece de interpretacio!n a nivel individual, so!lo se entiende en grupos de personas. Expresa una caracterstica de una enfermedad, expresa la fuerza que tiene un feno!meno para producir un cambio de estado (por ejemplo de estar sano a enfermo). Por ejemplo, una DI de 27 por 1.000 para fracturas de cadera entre mujeres de raza blanca y 65 o ma!s aos de edad con ciertos factores de riesgo podri! interpretarse como que esa fractura de cadera ocurre a los 37 an!os de seguimiento como media (ya que 1/0,027 = 37). Otro ejemplo sera el de una DI de mortalidad de 0,04 an!os1 que indica una supervivencia media de 25 aos (1/0,04 = 25). Sin embargo, si se mide la incidencia de una enfermedad o la mortalidad por una causa especfica (no la mortalidad en general), entonces esta estimacio!n de la supervivencia solamente sera! correcta cuando la persona no este! a riesgo de otras causas de enfermedad o muerte, es decir, cuando no existan causas competitivas. Esta interpretacio!n alternativa es conocida como el tiempo de espera. Por ejemplo, se plantea la siguiente pregunta (MIR 2010): Se ha realizado un estudio de cohortes en pacientes expuestos a diferentes anti-inflamatorios no esteroideos. El evento de inters fue la ocurrencia de hemorragia digestiva alta. En la cohorte de pacientes expuestos a ibuprofeno, se ha obtenido una densidad de incidencia de 2 por 1000 personas- ao. Cmo debe interpretarse este resultado? Las opciones de respuesta son: 1) Ocurren de media 2 casos de hemorragia digestiva alta por cada 1000 aos de exposicin a ibuprofeno, sumados los tiempos de observacin de todos los individuos de la cohorte. 2) El riesgo de desarrollar una hemorragia digestiva alta estando expuesto a ibuprofeno es 2 veces mayor que con el resto de antiinflamatorios no esteroideos, en personas tratadas al menos durante 1 ao. 3) Por cada 1000 personas que estn expuestas durante al menos un ao a ibuprofeno, se producen 2 casos de hemorragia digestiva alta. 4) Dos de cada 1000 personas que inician tratamiento con ibuprofeno desarrollan una hemorragia digestiva alta despus de un ao. 5) Cada 2 aos de media, ocurre un nuevo caso de hemorragia digestiva en la cohorte de 1000 personas expuestas a ibuprofeno
Cul es la respuesta correcta? El enunciado plantea que la DI = 0.002 aos -1 . Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 17 La DI es una medida de frecuencia absoluta, no de asociacin ni de comparacin alguna, por lo que la opcin 2) no es vlida. La opcin 3) se aproxima a la realidad, pero se estropea al decir al menos, pues significa que la unidad de medida no es aos -1 sino algo que es mayor de un ao, puesto que al menos significa que como mnimo un ao, pero no se sabe el mximo tiempo. Si se suprimiesen esas dos palabras (al menos) la opcin 3) sera correcta. La DI no tiene interpretacin individual, ya que no es una proporcin, sino una tasa, por lo que la opcin 4) es incorrecta. Puede ser por ejemplo que de cada 1000 personas sea slo 1 la que desarrolle la hemorragia, pero que la suma de los tiempos de seguimiento individuales sea 500 personas-aos (porque haya abandonos, causas competitivas, etc.), y 1 caso /500 personas-aos sera una DI = 0.002 aos -1 . La opcin 5) est mal calculada, ya que para ver cuntas personas-aos se necesitan para observar un caso se debera hacer 1/0.002 = 500 personas-aos. Se necesita observar 500 personas un ao, 250 durante dos aos, o mil durante medio ao para observar un caso. Es decir, cada medio ao /y no cada 2) de media por cada 1000 personas se produce un caso. La respuesta correcta es la primera.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 18 4. MEDIDAS DE ASOCIACIN E IMPACTO
MEDIDAS DE ASOCIACIN Estiman la magnitud de relacin entre un factor y un efecto. Comparan una medida de frecuencia de enfermedad (incidencia o prevalencia) en expuestos respecto a no expuestos, con el fin de estimar la magnitud de la relacio!n entre la exposicio!n y el efecto (desenlace, resultado, enfermedad o lesio!n, outcome en ingle!s). En principio, y como se ha visto en los criterios de Bradford Hill, cuanto mayor sea la magnitud de la asociacio!n ma!s probable es que se trate de una relacio!n causal; aunque como ha descrito Rothman en su modelo determinista modificado es posible que esto no se cumpla siempre. ! Riesgo relativo RR: Es la razn entre la incidencia acumulada en expuestos (IA1) y la incidencia acumulada en no expuestos (IA0).
RR=IA1 / IA0.
Informa sobre cuntas veces es mayor el riesgo de que se produzca desenlace en expuestos en comparacin con no expuestos. Expresa por cua!nto se multiplica el riesgo o probabilidad del desenlace en personas expuestas en comparacio!n con las que no lo esta!n. Las razones de prevalencias se estiman de manera parecida, con la diferencia de que se trabajan con prevalencias en vez de con incidencias acumuladas y expresan cua!ntas veces mayor es la prevalencia en personas expuestas en comparacio!n con personas no expuestas. El RR carece de unidades de medida. Sus valores oscilan entre cero e infinito y su valor nulo es 1. Cuando RR<1 la exposicin es protectora si RR>1 la exposicin ser factor de riesgo Si RR=1 se dice que el efecto (o asociacin) es nulo Si el intervalo de confianza para el RR incluye el valor 1 se dir que los resultados son compatibles con un efecto nulo (no son estadsticamente significativos) El ejemplo siguiente es de un estudio sobre trastornos de conducta alimentaria (TCA).
Tabla 4.1. Relacin entre el estado civil de los padres y TCA en Navarra. Estado civil SI TCA NO TCA TOTAL Casados 74 2199 2273 Divorciados/Separados 16 220 236 TOTAL 90 2419 2509
IA1=16/236=0,0678
IA0=74/2273=0,0326
RR=IA1/IA0=2,08
El riesgo de TCA se multiplica por 2,08 en hijas de divorciados/separados comparadas con hijas de padres casados. A este RR se le debe calcular su intervalo de confianza.
! Odds Ratio (OR): Es la razn de odds. Compara la frecuencia de exposicin en sujetos con o sin desenlace. Carece de unidades. Sus valores oscilan entre el cero e infinito. Su valor nulo es 1. Una OR = 1 implica que las dos categoras comparadas son iguales. Al igual que para el riesgo relativo, OR>1 implica exposicin perjudicial. OR<1 exposicin protectora. Lo mismo que para el RR puede decirse tambin de la OR respecto a cuando sus intervalos de confianza comprenden o no el valor 1. Si incluyen el valor 1, no habr diferencias significativas entre las categoras comparadas. La OR se suele estimar en estudios epidemiolo!gicos de casos y controles (que se vern ma!s adelante), aunque en realidad se puede estimar con cualquier diseo de estudio. Si se cumplen ciertas condiciones (enfermedades poco frecuentes) la OR es un buen estimador del Riesgo Relativo. La razo!n por la cual tiene intere!s la OR es, en primer lugar, porque es la u!nica medida de Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 19 asociacio!n que se puede estimar en ciertos tipos de estudios epidemiolo!gicos como los estudios de casos y controles y, en segundo lugar, porque es la medida de asociacio!n que estiman los programas estadsticos cuando se utilizan ana!lisis multivariantes de Regresio!n Logi!stica. En el ejemplo anterior:
Odds1=16/220=0,07272;
Odds0=74/2199=0,033651
OR=2,16
La OR es un buen estimador del RR pero tiende a sobreestimarlo especialmente cuando el suceso es frecuente y las diferencias entre grupos son grandes. Es posible corregir esta sobreestimacin cuando el suceso es frecuente:
OR RR= ---------------------------- (1-IA0) + (IA0 x OR)
La OR tiene una ventaja sobre el RR consiste en que la OR es simtrica. OR y RR de TCA para las hijas de divorciados/separados: OR= 2,16 (RR=2,08) OR y RR de ser hijas de divorciados/separados si tienen TCA: OR=2,16 (RR=1,95) (16/74) 16x2199 OR=--------------- = ------------- = 2,16 (220/2199) 220x74
A diferencia del RR, la OR es igual en un sentido que en otro (simtrica). La Odds Ratio se puede calcular directamente de los valores de la tabla tetraco!rica hallando la razo!n de los productos cruzados (de all que la OR se llame tambie!n as), siempre que la casilla correspondiente a la presencia tanto del desenlace de intere!s y de la exposicio!n o bien de la ausencia simulta!nea de ambas se encuentre en la casilla superior izquierda de la tabla 2x2, como puede verse en el ejemplo siguiente:
En los estudios de casos y controles emparejados, uno o ms controles se equiparan con el caso en sexo, edad y otras caractersticas de inters. Aqu se expone la opcin ms sencilla: un control por caso. Para calcular la OR se construye una tabla 2 x 2 en la que cada celda represente parejas de caso-control. La OR es el cociente entre parejas discordantes.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 2u Tabla 4.2. Ejemplo de estudio de Casos y Controles emparejados. Parejas Control con migraa Control sin migraa Ictus con migraa 34 60 Ictus sin migraa 32 74
OR=60/32=1,8. Las personas que padecen migraa tienen una odds 1,8 veces mayor de padecer ictus que quienes no tienen migraa. A esta OR se le debe calcular su intervalo de confianza.
MEDIDAS DE IMPACTO Una vez que se puede asumir la causalidad, las medidas impacto permiten estimar la carga de enfermedad atribuible a ese factor y el beneficio de las acciones preventivas dirigidas a eliminarlo.
Tabla 4.3. Cohorte prospectiva. Desarrollan enfermedad No desarrollan enfermedad Total Expuestos 40 60 100 No expuestos 20 80 100 Total 60 140 200 Nota: Se asume causalidad y validez externa.
Incidencia acumulada en expuestos =IA1 = 40/100=0,4 Incidencia acumulada en no expuestos =IA0 = 20/100=0,2 Incidencia acumulada en poblacin total =IAtotal = 60/200=0,3
Tabla 4.4. Anlisis de la cohorte prospectiva de la tabla 4.3. 1 pce: proporcin de casos expuestos RIESGO RELATIVO (RR) RR RR = IA1/ IA0 = 2 La enfermedad es dos veces ms frecuente en los expuestos INCREMENTO RELATIVO DE RIESGO (IRR) EN EXPUESTOS IRR IRR=(RR-1)x100=(2-1) x 100=100% La exposicin incrementa relativamente el riesgo en un 100% RIESGO ATRIBUIBLE EN EXPUESTOS (RAE) -INCREMENTO ABSOLUTO DEL RIESGO (IAR) RAE =IAR= IA1-IA0 = 0,4-0,2= 0,2 Un 20% de los expuestos padecern la enfermedad precisamente por haber estado expuestos. Si se evitase la exposicin, se prevendra la enfermedad en el 20% de los expuestos. NMERO NECESARIO PARA INTERVENIR (NNI) NNI= 1/ RAE = 1/0,2=5 Hay que intervenir sobre 5 personas expuestas para prevenir un caso. FRACCIN ETIOLGICA EN EXPUESTOS (FEE) FEE = RAE / I1= RR-1 / RR=0,5 (50%) El 50% de los casos que se producen en expuestos se deben a la exposicin. Evitando la exposicin, se prevendra la mitad de los casos que ocurren en expuestos RIESGO ATRIBUIBLE POBLACIONAL (RAP) RAP= IAtotal - IA0=0,3-0,2=0,1 El 10% de la poblacin adquirir la enfermedad debido a la exposicin. Se prevendra la enfermedad en el 10% de toda la poblacin si se evitase la exposicin. FRACCIN ETIOLGICA POBLACIONAL (FEP) PROPORCIN DE RIESGO ATRIBUIBLE POBLACIONAL (RAP%) FEP RAP% FEP=pce 1 FEE= (40/60)x0,5=0,33 RAP%= (IAt- IA0/ Itotal)x100=33% La tercera parte de los casos que se producen en la poblacin se deben a la exposicin. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 21
Tabla 4.5. Cohorte prospectiva (medida protectora) Un ensayo aleatorizado de prevencin de cncer de mama con mamografas (MM). Muertes Muertes-aos Tasa de mortalidad Mamografa 70 20000 0,0035 aos -1 No mamografa 120 30000 0,0040 aos -1
Total 190 50000 0,0038 aos -1
Se asume causalidad y validez externa.
Tabla 4.6. Anlisis de la cohorte prospectiva (medida protectora) de la tabla 4.5.
RAZN DE DENSIDADES DE INCIDENCIA (RDI) RDI= DI1 / DI0 = 0,875 La tasa de mortalidad en las expuestas es del 87,5% de la tasa en no expuestas.
REDUCCIN RELATIVA DEL RIESGO o FRACCIN PREVENTIVA (FP) FP = 1-RDI=1-0.875=0,125 El programa de mamografas reduce en 12.5% la tasa de mortalidad
DIFERENCIA DE DENSIDADES DE INCIDENCIA (DDI) o REDUCCIN ABSOLUTA DE LA TASA DDI = DI0-DI1= 0,0005 aos -1 El programa de mamografas evita 5 muertes al ao por cada 10000 mujeres sometidas a mamografa
NMERO NECESARIO PARA INTERVENIR O TRATAR (NNT) NNT=1/DDI=2000 Para evitar una muerte al ao es necesario que 2000 mujeres se sometan a mamografa.
DIFERENCIA DE DENSIDADES DE INCIDENCIA POBLACIONAL (DDIP) DDIP DDIP=DItotal DI1=0,0003 aos -1
Si todas las mujeres se sometiesen a mamografas se evitaran 3 muertes/ao por cada 10000 mujeres.
FRACCIN PREVENIBLE POBLACIONAL (FPP) FPP=pcne 1 x FP= (120/190) x 0,125= 0,0789=7,9% Si todas las mujeres de esa poblacin se sometiesen a mamografas, se podran prevenir potencialmente el 7,9% de las muertes por cncer de mama que actualmente ocurren en esa poblacin 1 pcne: proporcin de casos No expuestos
En los estudios de casos y controles, se calcula habitualmente slo la odds ratio (OR). Si se asume que la enfermedad sea rara (<10%) y se conoce la incidencia total por fuentes externas (no se pueden calcular directamente ni la incidencia ni el riesgo atribuible), se podra aplicar las siguientes frmulas (poco usadas) para derivar fracciones etiolgicas y riesgos atribuibles. FEP = FEE ! pce RAP = RAE ! pe
En general, casi nunca se llega al RAP en estudios de casos y controles.
OR OR FEE 1 ! = 1 1 1 + ! ! = ) ( ) ( OR pe OR I RAE total OR = odds ratio FEE = fraccin etiolgica en expuestos FEP = fraccin etiolgica poblacional RAE = riesgo atribuible en expuestos RAP = riesgo atribuible poblacional pe = proporcin de sujetos expuestos (en la poblacin) pce = proporcin de casos expuestos
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 22 INCREMENTO RELATIVO DEL RIESGO A trave!s de las medidas de asociacio!n como el RR se puede hallar el incremento relativo de riesgo que se asocia a una exposicio!n. Dado que el valor nulo de una medida de asociacio!n es RR = 1 entonces, si se halla un RR = 1,5, podr estimarse el aumento relativo que ha experimentado el RR al incrementar de 1 (ausencia de asociacio!n o valor nulo) a 1,5 (asociacio!n): 1,5 - 1 = 0,5. Este incremento de 0,5 es de hecho el 50 % del valor nulo inicial RR = 1 (0,5 es la mitad de 1). Por lo tanto, se expresa la cantidad de 0,5 en te!rminos de incremento relativo como un porcentaje (o proporcio!n de incremento relativo debido a la exposicio!n) multiplica!ndolo por 100. Al obtener un RR = 1,5 se puede decir que ha habido un incremento relativo de riesgo del 50 % debido a la exposicio!n (en el caso de asumir que efectivamente existe una relacio!n causal), pero esto no debe confundirse con el incremento absoluto del riesgo que consiste en la diferencia entre el riesgo en expuestos y el riesgo en no expuestos (o riesgo atribuible en expuestos).
INCREMENTO ABSOLUTO DEL RIESGO Los efectos absolutos se pueden medir hallando la diferencia entre incidencias acumuladas, densidades de incidencia o prevalencias entre un grupo expuesto a un factor de riesgo y otro no expuesto. Generalmente, los efectos absolutos son medidas u!tiles a la hora de valorar el impacto del problema de Salud Pu!blica provocado por la exposicio!n a un factor de riesgo (por ejemplo, para la administracio!n sanitaria) y asi! mismo el beneficio potencial esperable si elimina!semos dicho factor de riesgo en personas expuestas. El riesgo atribuible en expuestos (RAE) se llama tambie!n diferencia de riesgo, exceso de riesgo, o incremento absoluto de riesgo. El te!rmino de riesgo atribuible en expuestos (RAE) expresa que! incidencia de enfermedad es debida a la exposicio!n (relacio!n causal) y, por lo tanto, da una idea de la frecuencia de enfermedad, en personas expuestas, que puede atribuirse a la exposicio!n a un factor de riesgo determinado. Por ejemplo, si se produjo enfermedad en el 2% de los no expuestos y en el 2,4% de los expuestos, el RAE o incremento absoluto del riesgo ser del 0,4%, pero en cambio, el RR=0,024/0,02=1,2 y corresponder a un incremento relativo del riesgo del 20%, ya que 1,2 es un 20% superior a 1 (valor nulo). Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 2S 5. TIPOS DE ESTUDIOS EPIDEMIOLGICOS
MUESTRAS EN EPIDEMIOLOGI!A Normalmente, no es posible estudiar a todas las personas que pertenecen a una poblacio!n. Por ello, se seleccionan muestras o subconjuntos ma!s pequeos de dichas poblaciones. A la poblacio!n de la que se extrae la muestra se le llama poblacio!n diana. Si el procedimiento de muestreo es el adecuado, la muestra tendra! caracteri!sticas parecidas a la poblacio!n diana de la que se ha extrai!do, es decir el que sea representativa de esta poblacio!n diana. Se podrn generalizar (validez externa) los resultados a la poblacio!n entera si la muestra es representativa de dicha poblacio!n. Existen diferentes procedimientos de muestreo. Estos procedimientos pueden clasificarse en dos grandes grupos: muestreo aleatorio o por probabilidad muestreo no aleatorio. El muestreo aleatorio se caracteriza porque todas las personas de la poblacio!n diana tienen una probabilidad conocida de ser elegidas. Para realizar este tipo de muestreo se requiere un registro de todos los sujetos pertenecientes a la poblacio!n diana. Es el muestreo que asegura una mayor representatividad de la muestra y, siempre que sea posible, es el me!todo preferible. Se habla de muestra aleatoria estratificada cuando se divide la poblacio!n en subgrupos, atendiendo a alguna caracterstica importante como por ejemplo la edad o el nivel socioecono!mico, y se selecciona una muestra aleatoria de cada grupo. Si el taman!o que se elige de cada subgrupo o estrato es proporcional a la frecuencia de este subgrupo o estrato en la poblacio!n de origen, entonces la muestra total ara los diferentes estratos sera! representativa de la poblacio!n de origen. Muestra agrupada (cluster sampling). Consiste en que cada unidad de seleccio!n esta! constituida por un grupo de personas (todos los nin!os de una escuela, los miembros de una familia, todos los pacientes de un centro de salud, etc.). La unidad de muestreo final no es una persona individual, sino que es un colectivo (cluster). En otras ocasiones la seleccio!n de la muestra se hace por conveniencia (voluntarios, pacientes de una determinada consulta...) o de forma sistema!tica segu!n criterios tales como el di!a de la semana, el nu!mero de orden del paciente, etc. Puede ocurrir que aspectos tales como la gravedad del caso, la fase de la enfermedad o la presencia de otras comorbilidades influyan sobre los criterios elegidos para la seleccio!n de la muestra el dia de la semana en que se ve el paciente, la hora de visita... lo que puede comprometer la representatividad de la misma. Cuando la probabilidad que tiene un sujeto de la poblacio!n diana para ser elegido es desconocida se habla de muestreo no aleatorio. Las muestras verdaderamente representativas escasean en la realidad. Qu problemas trae esto? Los problemas son graves cuando el objetivo del estudio es responder a una pregunta descriptiva (cul es la proporcin de fumadores?, cul es el colesterol medio en la poblacin?, qu porcentaje de mujeres usan el mtodo sintotrmico?, etc.). En estas investigaciones el objetivo es calcular una media o una proporcin usando la muestra en vez de la poblacin para ahorrar recursos y se hace absolutamente necesario garantizar la representatividad. Hablamos de descripcin en estos casos porque no se estn haciendo comparaciones. En cambio, el problema de la muestra no representativa y el posible compromiso para la validez externa no suele ser tan grave cuando se asume que no se va a describir una poblacin sino que simplemente se trata de hacer comparaciones vlidas internamente para los que participan en el estudio (es mejor el tratamiento mdico o el tratamiento quirrgico en estos pacientes? puede ser que el consumo de caf haya protegido a sus consumidores frente a la diabetes? aumenta el riesgo de cncer de mama si se consumen anticonceptivos orales?, etc.). En estas situaciones, aunque la muestra no sea perfectamente representativa puede solventarse el problema y no deberan caer los investigadores en una preocupacin obsesiva que les lleve a buscar metas utpicas en pro de garantizar la representatividad estadstica. Esta preocupacin desaforada por obtener la representatividad estadstica a veces ha podido hacer ms dao que bien a la ciencia, especialmente en la investigacin de las causas de las enfermedades (epidemiologa analtica), tal como han denunciado los autores ms destacados en epidemiologa. Rothman, quiz el principal de ellos, llega a afirmar taxativamente lo siguiente "la representatividad es una falacia que ha contaminado a los estudios epidemiolgicos durante dcadas". Esta fuerte afirmacin requiere ser matizada. Es cierto que muchos de los descubrimientos ms Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 24 importantes de la epidemiologa moderna se han realizado en muestras que no eran representativas en el sentido estadstico del trmino. Por ejemplo, una muestra que slo inclua a varones ingleses, todos ellos de clase alta, pues todos eran mdicos (y entonces, a pesar de las apariencias actuales, ser mdico s que equivala a un alto estatus econmico) fue definitiva para comprobar que el tabaco produca cncer de pulmn. Esta muestra no era en absoluto representativa de la poblacin general britnica. Sin embargo, podran generalizarse sus resultados a las mujeres o a los varones que no fuesen mdicos? Lo que debe tenerse en cuenta es que generalizar no es un proceso estadstico automtico. En las encuestas transversales (descriptivas) s que interesa asegurar la representatividad, pues lo que se hace es elegir una muestra a partir de la poblacin diana para ahorrar costes, pues medir una caracterstica en toda la poblacin diana sera muy caro. Entonces, la representatividad estadstica (seleccin por muestreo aleatorio) es un aspecto prioritario en esos caso, como hemos dicho. En cambio, en los estudios comparativos (casos y controles, cohortes, ensayos clnicos, como se ver a continuacin), el objetivo no es describir, sino llegar a realizar una inferencia cientfica, que no se basa en extrapolar el resultado estimado en una muestra a una poblacin mayor o universo, sino que precisamente suele requerir elegir personas peculiares (con frecuencia nada representativas) para hacer la investigacin. Una vez obtenidas unas conclusiones con alta validez interna, se trata de generalizarlas a toda la humanidad en funcin del conocimiento biolgico, no de una aplicacin automtica de principios estadsticos. A veces ser preferible que participen en un estudio slo las personas ms motivadas y conscientes, porque sern quienes proporcionarn una informacin ms fiable, aunque la baja participacin reduzca la representatividad en el sentido estadstico del trmino. En este sentido, a veces (no siempre, desde luego) los estudios con una baja proporcin de candidatos que aceptan participar, pueden ser ms vlidos que aquellos donde se garantiza que una alta proporcin de los invitados acepta participar. La ciencia adquirida con el estudio del tabaco y el cncer de pulmn en los mdicos britnicos se extrapola a todas las personas, no mediante una "representatividad" estadstica sino por las siguientes razones: 1) No hay ningn motivo biolgico para pensar que si el tabaco causa cncer en los varones no lo vaya a causar en mujeres, es que es distinto el tejido pulmonar en los hombres y en las mujeres en cuanto a sus susceptibilidad a cancergenos? Afirmar que es distinto supondra olvidar la histopatologa pulmonar. 2) No hay ningn motivo biolgico para pensar que si el tabaco causa cncer en quienes son intelectuales o de clase alta no lo vaya a causar en los de clase baja o en quienes no han estudiado medicina, es que cambia el tejido pulmonar cuando uno de clase social baja pasa a ser de clase alta o cuando alguien se licencia en medicina? 3) Sucesivos estudios de otros pases realizados en otras muestras, que tampoco son por s mismas representativos, corroboran que cuanto ms se exponen las personas al tabaco, mayor es su riesgo de desarrollar cncer de pulmn (consistencia). 4) Estudios realizados en animales demuestran que el humo del tabaco es cancergeno. 5) El anlisis qumico del humo del tabaco identifica conocidos cancergenos en altas concentraciones presentes en l. 6) Se observa que en quienes dejan de fumar se reduce mucho el riesgo de cncer de pulmn. 7) Se observa que en quienes nunca fumaron pero han convivido largamente con fumadores (fumadores pasivos) tambin aumenta el riesgo de cncer de pulmn. Todas estas razones, que no son de carcter estadstico, sino de conocimiento biolgico y epidemiolgico, son los motivos realmente importantes para dar validez a los estudios de tipo comparativo (aqu se comparan fumadores frente a no fumadores). Los estudios comparativos son los ms habituales en la epidemiologa analtica y en el diseo experimental. Sin embargo, a quienes estn acostumbrados a realizar estudios slo descriptivos les produce de entrada extraeza encontrarse con un estudio comparativo que use una muestra claramente no representativa (es el caso de los mejores ensayos clnicos que ms han cambiado la prctica mdica). Pero, simplemente teniendo en cuenta los principios anteriores, puede comprenderse que la representatividad estadstica queda muy detrs en este tipo de estudios no descriptivos que buscan hacer inferencias cientficas. Este es el sentido de las palabras de Rothman antes citadas. De todos modos, cuando sea posible, tambin estos estudios mejoran si la muestra que se elige cuenta con garantas de representatividad, pues entonces su aplicacin a una poblacin diana es ms directa. La pena es perder la oportunidad de realizarlos, o comprometer seriamente su viabilidad dndole prioridad equivocadamente al objetivo de que la muestra sea representativa. Hay otras prioridades en el diseo.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 2S ESTUDIOS ANALTICOS Pretenden inferir causalidad. Se clasifican en: Experimentales: el investigador asigna los participantes a recibir o no la exposicin. ! Experimentales puros: la asignacin es aleatoria ! Cuasi experimentales: no son aleatorizados. Los estudios experimentales pueden ser: ! Ensayo clnico: son pacientes y se aleatorizan a una intervencin teraputica ! Ensayo de campo: son sujetos sanos y se aleatorizan a medidas preventivas ! Ensayo comunitario. Un colectivo es la unidad de aleatorizacin. Los requisitos ticos son muy importantes en los ensayos. nicamente se asignarn exposiciones protectoras. No deben existir mejores posibilidades de tratamiento que las ofrecidas. A la luz de los conocimientos existentes, las dos alternativas deberan ser igualmente aceptables. No es tico comparar con placebo si hay otro tratamiento eficaz. Los participantes deben estar adecuadamente informados de las consecuencias de la participacin en el estudio y deben firmar su consentimiento. El ensayo debe ser aprobado por un comit tico. Los ensayos con medicamentos requieren diversos requisitos legales. No experimentales: tambin llamados observacionales. El investigador observa lo que de manera natural ocurre en expuestos y no expuestos, sin que el investigador asigne nada. ! Cohortes: los sujetos inicialmente libres del desenlace se clasifican en expuestos y no expuestos, y se les sigue para observar el desarrollo del desenlace o efecto. Una cohorte es un grupo de personas que comparten una experiencia comu!n en un mismo periodo de tiempo. Por ejemplo, una cohorte de nacimiento seri!a un grupo de personas nacidas en un mismo ao y una cohorte ocupacional o laboral, un grupo de personas que trabajan en una misma profesio!n. En los estudios de cohortes prospectivos 3 , todos tienen que estar libres de enfermedad al comienzo del estudio. No es necesario realizar un estudio de cohortes con una sola exposicio!n. El ejemplo de la cohorte de trastornos de la conducta alimentaria (TCA) en Navarra era un estudio de cohortes prospectivo en el que se recogieron una serie de variables como los datos sociodemogra!ficos de las chicas, estado civil de los padres, antecedentes familiares de trastornos psiquia!tricos, frecuencia de comidas en solitario, exposicio!n a medios de comunicacio!n como las revistas del corazo!n o la radio y puntuaciones en diferentes pruebas psicolo!gicas. Posteriormente, se midi la incidencia de casos nuevos de TCA que se presentaron a lo largo de 18 meses de observacio!n. De esta forma se pudo asociar cualquier exposicio!n con la incidencia de TCA. ! Casos y controles se examina comparativamente la exposicin al factor de riesgo en sujetos con la enfermedad de inters (casos) y en sujetos libres de ella (controles). Las personas se seleccionan basa!ndose en la presencia (casos) o ausencia (controles) de una enfermedad cuya etiologi!a se quiere estudiar. A continuacio!n, se valora la presencia o no de factores de riesgo (exposicio!n) en el pasado, para estimar si existe una mayor prevalencia de exposicio!n en enfermos en comparacio!n con esa muestra de personas sanas que son los controles 4 . El propo!sito de tener un grupo control es el poder medir la frecuencia relativa de expuestos y no expuestos en la poblacio!n de riesgo; as pues, es imperativo que los controles se seleccionen de forma independiente a su nivel de exposicio!n. Los estudios de casos y controles pueden tener un cara!cter prospectivo cuando, despue!s de iniciarse el estudio, se espera a que aparezcan casos nuevos de enfermedad en la poblacio!n (casos incidentes) para ir incorpora!ndolos al grupo de personas enfermas. Los controles se suelen incorporar tambie!n paulatinamente al estudio aunque a veces se pueden escoger aleatoriamente, una vez conseguidos todos los casos que se requieren, de una lista de posibles controles. Por el
3 En los estudios de cohortes retrospectivos (no concurrentes o histo!ricos), tambie!n se identifican los grupos a comparar basa!ndose en la presencia o no de la exposicio!n de intere!s, personas expuestas o no expuestas al comienzo del estudio, pero en el momento en que comienza el estudio, ya se han producido todos los desenlaces. Estos estudios dependen totalmente de la existencia de un buen registro. Lo que se hace es retroceder en el tiempo para identificar las cohortes expuestas y no expuestas y se buscan los casos nuevos de enfermedad, en ambos grupos, y que tuvieron lugar en los an!os posteriores al comienzo de la exposicio!n, pero que son aos previos al comienzo de la investigacin. 4 Una estrategia para reducir costes de un estudio de cohortes es almacenar las muestras biolo!gicas que se tomen de toda una cohorte, pero no gastar dinero en analizar las muestras de todos los participantes, sino so!lo de aquellos que con el paso del tiempo van desarrollando eventos, compara!ndolos con controles que no los hayan desarrollado en ese momento. Este diseo sera un diseo de casos y controles anidados en la cohorte (nested case-control). Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 26 contrario, los estudios de casos y controles tienen cara!cter retrospectivo cuando los casos de enfermedad ya se han producido todos al comienzo del estudio (casos prevalentes). Es aconsejable utilizar solamente los casos incidentes para evitar el sesgo de supervivencia o falacia de Neyman que consiste en que las personas que ma!s sobreviven a una enfermedad presentan probablemente formas ma!s leves de la misma y por lo tanto probablemente tambie!n una menor exposicio!n al factor de riesgo en comparacio!n con personas que fallecen antes, por padecer formas ma!s agudas y/o graves de enfermedad.
ESTUDIOS DESCRIPTIVOS Tratan de presentar, sintetizar y resumir la distribucin de la enfermedad o de la exposicin atendiendo a variables epidemiolgicas de persona, lugar y tiempo. En ocasiones no es sencillo distinguir entre estudios puramente descriptivos y analticos. Por ejemplo, cuando construimos una tabla a partir de datos poblacionales, para resaltar diferencias de frecuencias de enfermedad entre grupos, lo podemos hacer simplemente porque algo nos ha llamado la atencio!n, o bien porque quiza!s la frecuencia de enfermedad observada nos parece diferente a la esperada. En este u!ltimo caso se estara procediendo (aunque de manera implcita) a una comparacio!n entre lo observado y lo esperado, lo que es un proceso analtico que nos conduce a valorar las posibles causas de las diferencias observadas. Por otra parte, aunque no tengamos ninguna idea preconcebida sobre lo que deberamos hallar en nuestros datos, la descripcio!n de los mismos nos puede llevar a realizar comparaciones entre subgrupos de la muestra estudiada y a encontrar diferencias que sugieran la existencia de factores de riesgo. La diferencia entre este estudio (con cara!cter eminentemente descriptivo) y otro que fuera analtico de entrada, es que el primero tiene como objetivo generar hipo!tesis mientras que el segundo se disea especi!ficamente para llegar a conclusiones etiolo!gicas basadas en comparaciones correctas. ! Estudios transversales, de corte, (cross-sectional) o de prevalencia: recogen en un momento concreto y de forma simultnea la exposicin y el efecto. No aseguran una correcta secuencia temporal y, en principio, no pueden ser utilizados para inferir causalidad. Cuando se trata de exposiciones estables en el tiempo (sexo, polimorfismos gene!ticos, etnia, etc.), debe considerarse siempre que con este tipo de estudios no es posible diferenciar entre factores de riesgo (por tenerlos, se esta! enfermo) y factores prono!sticos (por tenerlos, se tiene una supervivencia ma!s o menos prolongada). No se debe olvidar nunca que la prevalencia depende tanto de la incidencia como de la duracin de la enfermedad. ! Estudios ecolgicos tienen como unidad de estudio y anlisis a colectivos determinados segn criterios geogrficos o temporales. A cada individuo se le asigna el valor medio o modal de la exposicin de su grupo. Es decir, la unidad de observacio!n y ana!lisis es la poblacio!n, de tal forma que se utilizan valores medios de exposicio!n (de ahi! que se puedan llamar ecolo!gicos) y desenlace que se aplican o se refieren a una poblacio!n de estudio entera. Pueden servir para generar hiptesis. No obstante, algunas intervenciones preventivas de tipo legislativo o en general estructural, so!lo pueden medirse a este nivel, por ejemplo la prohibicio!n de beber alcohol con menos de 18 o! 21 an!os o la legislacio!n que regula el aborto en un pas. Son estudios relativamente fa!ciles, econo!micos y ra!pidos de realizar porque su aplicacio!n depende frecuentemente de informacio!n que ya existe a la que se le llaman datos secundarios (encuestas nacionales de salud, registros rutinarios de enfermedad), no recogidos especi!ficamente para el estudio. El inconveniente obvio de estos estudios es que la correlacio!n asume que todos los miembros de las poblaciones esta!n expuestos en la misma medida al factor de riesgo. El ca!lculo per capita por ejemplo del consumo total de carne por pases y su relacin con las tasas de cncer de colon asume que todos los habitantes de un pas comern la misma cantidad de carne. El error es asumir que todos los ciudadanos de un pas ( ode una provincia o ciudad) tienen la misma exposicio!n. Adema!s, no se puede estar seguro de que las personas que han tenido ca!ncer de colon son precisamente aquellas que han consumido mucha carne. En resumidas cuentas, no se puede relacionar un individuo enfermo con su exposicio!n especi!fica al factor estudiado. Por este motivo es posible que asociaciones medidas a nivel agregado (estudios ecolgicos) sean contrarias a la realidad que se obtendra si se midiesen a nivel individual. Este feno!meno se llama la falacia ecolo!gica. En la figura inferior se explica cmo el ndice de masa corporal (IMC) est directamente asociado con el nivel econmico a nivel ecolgico (hay mayor IMC medio en los pases ms ricos), pero inversamente asociado a nivel individual (en muchos pases hay ms obesidad en las clases sociales ms desfavorecidas). La verdad cientfica la da la asociacin medida individualmente, lo otro es falacia ecolgica, aunque tambin puede ser un efecto contextual de inters en salud pblica. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 27 Figura 5.1. Falacia ecolgica.
! Series de casos: describen las caractersticas en la evolucin natural de un proceso.
Figura 5.2. Clasificacin de los principales estudios epidemiolgicos
Tabla 5.1. Ventajas y limitaciones de los estudios analticos. El mejor para inferir causalidad Gran control de las condiciones del estudio ENSAYOS La aleatorizacin minimiza los sesgos (poca confusin) Condicionantes ticos Escasa validez externa Adecuados para enfermedades frecuentes Adecuados para exposiciones raras tiles para valorar multiefectividad COHORTES Estudia historia natural enfermedad (secuencia temporal) Calcula directamente incidencias Complejos, duraderos y caros Principal problema: prdidas durante el seguimiento Adecuados para enfermedades raras tiles para valorar multicausalidad CASOS Y CONTROLES Reproducibles, breves y baratos Mejor eficiencia estadstica Principal problema: sesgos de seleccin y de informacin
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 28 6. SESGOS DE INFORMACIN Y SELECCIN
ERROR ALEATORIO Y PRECISIN Un error aleatorio es un error que no es constante en cada medicio!n, no ocurre siempre en la misma direccio!n. De manera aleatoria, obtenemos valores a veces mayores y a veces menores que el valor real. Por ejemplo, hablariamos de error aleatorio en una ba!scula que a veces mide por defecto y otras por exceso. Habra! mayor precisio!n o mayor fiabilidad de una medicio!n, cuando los errores aleatorios sean pequen!os. En ausencia de error sistema!tico, si realiza!ramos la media de una serie de mediciones con errores aleatorios, dicho valor medio se acercara al valor real. El rango entre una serie de mediciones aumenta con el grado de errores aleatorios. El error aleatorio no afecta en si! a la validez interna pero s dificulta la posibilidad de encontrar una asociacio!n entre dos variables por la imprecisio!n de las medidas. La estadstica trata fundamentalmente del error aleatorio (falta de precisin); la epidemiologa se ocupa del error sistemtico o falta de validez. La validez puede ser interna o externa.
VALIDEZ INTERNA La validez interna de un estudio epidemiolo!gico valora el grado en que los resultados obtenidos son correctos para las personas incluidas en ese estudio concreto. Se obtiene evitando errores en el diseo del estudio pero tambie!n en el ana!lisis de los datos.
VALIDEZ EXTERNA La validez externa de un estudio es la capacidad de poder generalizar los resultados de la muestra en el estudio a la poblacio!n de referencia o a aquella sobre la que se pretenden aplicar las conclusiones del estudio. Se obtiene trabajando con muestras representativas de la poblacio!n de referencia (muestreo aleatorio probabilstico, o cualquiera de las otras variedades, cuando es posible) y evitando que el desarrollo del estudio o la falta de seguimiento adecuado de sus participantes modifiquen una seleccio!n de personas inicialmente adecuada.
SESGOS Un sesgo se puede definir como un error sistema!tico en un estudio epidemiolo!gico que tiene como consecuencia la estimacio!n erro!nea de la asociacio!n entre la exposicio!n y el desenlace (entre variable independiente y variable dependiente, respectivamente). Al trabajar con seres humanos, es pra!cticamente imposible eliminar los sesgos en su totalidad; no es posible obtener grupos de comparacio!n ide!nticos que solamente se diferencien en la exposicio!n de intere!s como en experimentos con animales gene!ticamente similares. Los sesgos pueden originarse en cualquier fase de la investigacio!n: la revisio!n bibliogra!fica, la seleccio!n de participantes, la obtencio!n de datos de mu!ltiples lugares o registros, en los procesos de medicio!n, en el ana!lisis e interpretacio!n de los resultados y, finalmente, en la fase de publicacio!n.
SESGOS DE SELECCIN Existe una caracterstica que simultneamente se asocia a mayor probabilidad de ser elegido y a un determinado resultado en la asociacin. Un sesgo se seleccin lleva a que no se incluyan las personas adecuadas para que la comparacin sea vlidamente causal. ! Mala seleccin al inicio del estudio. Por ejemplo, si para anticonceptivos orales-infarto se calcula el riesgo atribuible en expuestas (RAE) y se exponen a anticonceptivos las mujeres especficamente seleccionadas por tener bajo riesgo cardiovascular (no fumadoras, delgadas, normotensas) se infravalorar el verdadero RAE. ! Sesgo del trabajador sano: (cohortes) la morbimortalidad asociada a una exposicin laboral de riesgo es menor en trabajadores expuestos, ya que se exponen por ser especialmente sanos para este trabajo (esto les hace tambin no ser retirados de l). ! Sesgo de sospecha diagnstica: la exposicin a un factor de riesgo levanta sospechas, propicia el diagnstico y facilita entrar como caso en estudios de casos y controles. ! Falacia de Neyman o sesgo de supervivencia: ocurre en estudios de casos y controles con casos prevalentes. Los factores de riesgo pueden ser tambin factores pronsticos que determinen la Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 29 duracin de la enfermedad. Si la exposicin agrava el pronstico, los casos prevalentes sern preferentemente no expuestos (los expuestos mueren pronto y no tienen oportunidad de elegirse). Esto infravalorara la asociacin. En caso contrario (el factor de riesgo es factor de buen pronstico), se sobreestimara la asociacin. En la asociacin alcohol-miocardiopata dilatada, la miocardiopata dilatada alcohlica tiene mejor pronstico que la isqumica o la idioptica. Los pacientes con miocardiopata dilatada alcohlica viven ms por lo que es ms probable que sean elegidos como casos; as la exposicin est ms representada en los casos, sobrevalorndose la asociacin. ! Sesgo de Berkson: en estudios de casos y controles con controles hospitalarios (los controles son enfermos con enfermedades distintas a la estudiada). Sucede si el factor de riesgo se asocia con mayor o con menor probabilidad de ser hospitalizado. ! Sesgo por prdidas diferenciales. En los estudios de seguimiento, suele haber participantes que abandonan el estudio. El problema es que las prdidas suelen ser diferenciales. Si los perdidos son diferentes a los retenidos, es posible que hubiesen respondido de manera diferente a la exposicin. Unas prdidas>25% cuestionan seriamente los resultados. Para defender su validez, se realiza: o Comparaciones de caractersticas basales entre seguidos y perdidos o Mtodos probabilsticos de ponderacin que le dan ms peso a los retenidos que tienen caractersticas ms similares a los perdidos. o Anlisis de sensibilidad: se repiten los anlisis asumiendo los supuestos: (a) qu pasara si todos los perdidos desarrollasen el efecto (b) qu pasara si ninguno lo desarrolla. Si no cambia el RR, es improbable que haya existido sesgo por prdidas.
SESGOS DE CLASIFICACIN O INFORMACIN Se trata de errores introducidos por el investigador al medir las variables. Hay que distinguir: ! Mala clasificacin no diferencial: el error afecta por igual a todos los grupos. Por ejemplo se clasifica igual de mal la exposicin en los casos y en los controles; o se clasifica igual de mal la incidencia de enfermedad en expuestos y no expuestos. Sesgan habitualmente hacia el valor nulo (acercan el RR o la OR a 1). ! Mala clasificacin diferencial: el error afecta de un modo distinto a los grupos e introduce diferencias en la clasificacin de unos y otros, por lo que el resultado de este sesgos es ms peligroso por ser impredecible. Son sesgos de informacin diferenciales los siguientes: ! El sesgo anamnsico (de recuerdo, recall bias) propio de estudios de casos y controles. Los casos pueden recordar mejor las exposiciones perjudiciales porque achacan a ellas su enfermedad. Otro ejemplo: en un estudio de deterioro cognitivo, los casos recuerdan peor la exposicin. Tambin puede ocurrir que un caso mienta sobre su exposicin porque sospecha que ese factor caus su enfermedad y no quiere reconocerlo. ! Sesgo del observador: el entrevistador investiga con diferente intensidad la exposicin o el desenlace en el grupo de expuestos que en el de no expuestos. Hay sesgos de informacin que pueden ser diferenciales o no: ! Sesgo de atencin o efecto Hawthorne: los participantes alteran su comportamiento cuando se saben observados. ! Sesgo de inaceptabilidad: se tiende a infravalorar las exposiciones que se perciben como de riesgo (drogas) o socialmente poco aceptadas (social desirability bias). ! Sesgo de obsequiosidad: se sobreestima la exposicin socialmente aceptada o protectora (deporte).
Sesgo de informacin no diferencial: ! Sesgo de migracio!n diagno!stica: Un ejemplo cla!sico de sesgo de informacio!n no diferencial del desenlace es el sesgo de la migracio!n diagno!stica o feno!meno de Will Rogers que suele ocurrir en estudios que se desarrollan durante varios aos coincidiendo con cambios de criterios diagno!sticos o con cambios de sensibilidad de los aparatos diagno!sticos. Habitualmente lo que suele ocurrir es que al diagnosticar mejor a un paciente, se suelen ver mejor ciertas lesiones (por Universidad de Navarra Dpto. M. Preventiva y Salud Pblica Su ejemplo, ganglios afectados) y algunos pacientes suelen acabar clasifica!ndose en un estadio superior al que estaban. Evidentemente estos pacientes tienen una forma de enfermedad ma!s grave que la del grupo donde estaban inicialmente (estadio II) aunque por otra parte tienen una gravedad menor que la del grupo donde ahora se sitan (estadio III). Ocurre algo aparentemente parado!jico; la mortalidad es menor en los dos grupos objeto de la migracio!n diagno!stica: la mortalidad del estadio II bajara! porque hay menos pacientes graves y la mortalidad del estadio III tambie!n bajar porque ahora hay personas con una gravedad de enfermedad menor que la que le corresponde al grupo. Podri!amos explicar este feno!meno con el smil de la altura. Si la persona ma!s alta de un grupo de gente baja pasa a pertenecer a otro grupo de personas con mayor altura, ambos grupos vera!n disminuir la media de sus alturas.
OTROS SESGOS ! Regresin a la media: quienes mostraron valores extremos en una determinacin inicial tendern a presentar posteriormente valores ms cercanos a la media. Se debe a mecanismos homeostticos, a posibles mediciones errneas iniciales o a registros bajo circunstancias excepcionales en la primera ocasin. ! Falacia ecolgica: la asociacin entre exposicin-efecto observada en la colectividad, no necesariamente se sostiene a nivel individual.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S1 7. CONFUSIN E INTERACCIN.
Uno de los conceptos ma!s importantes en epidemiologa es el de confusio!n. Todo el trabajo que se realiza al escoger, disear e implementar el mejor diseo posible para responder a una pregunta cientfica consiste precisamente en lograr grupos de comparacio!n que sean contrafa!cticos. En definitiva, se intenta reducir al ma!ximo ese componente de la medida de asociacio!n que en apartados anteriores hemos llamado error o sesgo y conseguir as que la medida de asociacio!n coincida con la medida del efecto que queremos conocer y valorar. Por otra parte, para interpretar de manera crtica y correcta los resultados de los estudios que se publican en la literatura cientfica, es tambie!n imprescindible comprender el feno!meno de confusio!n. Una variable (o factor) de confusio!n se puede definir como una variable que distorsiona la medida de la asociacio!n entre otras dos variables. El resultado de la presencia de una variable de confusio!n puede ser la observacio!n de un efecto donde en realidad no existe o la exageracio!n de una asociacio!n que realmente existe (confusio!n positiva) o, por el contrario, la atenuacio!n de una asociacio!n real e incluso una inversio!n del sentido de una asociacio!n real (confusio!n negativa).
SESGOS DE CONFUSIN Las relaciones especficas existentes entre las variables estudiadas y otras variables que no son el efecto ni la exposicin distorsionan la medida de asociacin.
Las condiciones para que se d un factor de confusin son, que esa variable: ! Est asociada con el efecto independientemente de la exposicin. ! Est asociada con la exposicin independientemente del efecto. ! No sea un eslabn causal intermedio entre exposicin y efecto.
Figura 7.1. Factor de confusin.
Se ha asociado el consumo de alcohol con un mayor riesgo de muchos cnceres; pero el consumo de tabaco y alcohol se asocian. Es posible que sea el tabaco lo que realmente aumente el riesgo y que no se haya controlado bien la confusin por tabaco. El concepto ms importante es que podr ser factor de confusin toda variable que comparta causas comunes con la exposicin y con el efecto. Una variable (por ejemplo el sexo) puede ser un factor de confusin en una base de datos (de un estudio determinado) y no serlo en otra.
MODIFICACIN DEL EFECTO O INTERACCIN La interaccin entre dos factores supone una interdependencia entre sus mecanismos de accin. Cuando al estratificar los datos globales segn las distintas exposiciones, la medida de asociacin es distinta dentro de los diferentes estratos se dice que hay interaccin o modificacin del efecto. La interaccin es un efecto biolgico real. Por ejemplo, el efecto de los anticonceptivos hormonales sobre el riesgo de enfermedad cardiovascular (ECV) puede estar modificado por el tabaco.
Tabla 7.1. Interaccin tabaco-anticonceptivos orales. GLOBAL Casos Controles Anticonceptivos s 2304 800 Anticonceptivos no 480 1600 OR global=9,6
Anlisis estratificado Confusin! Tabaco Causa Alcohol Efecto Cncer Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S2 FUMAN Casos Controles ORfum Anticonceptivos s 1920 480 8,0 Anticonceptivos no 160 320
NO FUMAN Casos Controles ORno fum Anticonceptivos s 384 320 4,8 Anticonceptivos no 320 1280
La interaccin anticonceptivos-tabaco se podra representar en una tabla (tabla 6.9)
Tabla 7.2. Interaccin anticonceptivos-tabaco. Ratio casos/controles para cada posible categora. No fuman Fuman Anticonceptivos NO 320/1280=0,25 160/320=0,5
Anticonceptivos s
384/320=1,2
1920/480=4
Odds ratios 1 para cada posible categora. No fuman Fuman Anticonceptivos NO 1 (ref)
2
Anticonceptivos s
4,8
16,0
1 Tomando como referencia la categora no usuarias de anticonceptivos y no fumadoras
El efecto de los anticonceptivos es distinto en fumadoras que en no fumadoras. El tabaco modifica el efecto de los anticonceptivos. Hablaremos de interaccin si: ! La medida de asociacin (OR) de los dos estratos es distinta entre s (8 ! 4,8). ! En la tabla que combina ambos efectos, el valor de odds ratio en la cuarta casilla (OR=16 ) se aparta significativamente de la multiplicacin de las otras dos odds ratios (2 x 4,8) (interaccin multiplicativa sinrgica o positiva). Este apartamiento puede darse porque lo observado sea mayor, como sucede en el ejemplo (16>9,6), o tambin porque lo que se observe sea menor que el producto de las otras dos odds ratio (interaccin negativa o antagonismo). En este ejemplo se est asumiendo un modelo multiplicativo de interaccin. Esto es lo que suele asumirse en estudios epidemiolgicos que valoran un desenlace dicotmico y que usan modelos exponenciales (regresin logstica o de Cox), pero tambin podra hablarse de interaccin aditiva y esto es lo que implcitamente se asume cuando la variable dependiente es continua (modelos de ANOVA, ANCOVA o regresin mltiple). Se dir que hay interaccin aditiva cuando el efecto conjunto de dos factores sea significativamente diferente de la suma de sus efectos por separado.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica SS 8. PROBABILIDAD. CONCEPTOS DE PROBABILIDAD.
CONCEPTOS DE PROBABILIDAD Podra definirse inicialmente la probabilidad de un suceso como la proporcin de veces que ese suceso ocurrira si repitisemos la experiencia un nmero muy grande de veces. Cul es la probabilidad de que al lanzar una moneda al aire salga cara? Decimos que es del 50% porque suponemos que si lanzamos muchas veces la misma moneda el 50% de ellas saldr cara. Hay dos tendencias principales al concebir la probabilidad. Segn el concepto frecuencista de probabilidad, la probabilidad es algo similar a una proporcin o porcentaje: cuando decimos que la probabilidad de que algo ocurra vale 0,2 viene a significar lo mismo que decir que ocurrir en el 20 % de los casos 1 de cada 5 veces. La definicin frecuencista mantiene que las probabilidades son los lmites a los que tiende la proporcin o frecuencia relativa con la que sucede un acontecimiento. Por ejemplo, si se lanza una moneda un nmero muy grande de veces, la frecuencia relativa con la que saldr cara tender a ser del 50% (probabilidad = 0,5). As, el pensamiento frecuencista define que la probabilidad de que ocurra un suceso sera el lmite de la frecuencia relativa cuando el nmero de observaciones tiende a infinito. Ya que las frecuencias relativas son observables empricamente, se puede pensar que los lmites a los que tienden pueden proponerse como propiedades de los sistemas o mecanismos que generan las secuencias de acontecimientos. Por eso a esta concepcin corresponde el concepto de la probabilidad como algo objetivo (probabilidad fsica). En su forma ms pura el pensamiento frecuencista niega todo significado a la probabilidad individual de un acontecimiento singular, ya que, al no engendrar una repeticin, no es posible estimar empricamente su frecuencia relativa. Hay preguntas para las que no existen posibilidades de repetir la experiencia, por ejemplo Cul es la probabilidad de que un graduado universitario saque una oposicin en la primera convocatoria tras terminar la carrera? Slo habr una primera convocatoria tras acabar la carrera. Aunque haya posibilidad de repeticin, esas repeticiones ya son respuestas a otra pregunta distinta. Este problema podra presentarse al aplicar la probabilidad al paciente individual ya que "no hay enfermedades sino enfermos". La respuesta frecuencista es imputarle a cualquier paciente lo que ha ocurrido previamente con pacientes similares, siempre acompaada de un cierto grado de incertidumbre, pero prescindiendo del hecho de que no hay dos seres humanos iguales. La otra filosofa es la bayesiana, que maneja la probabilidad como algo subjetivo, es decir el grado de certeza que se posee sobre un asunto, la "credibilidad" o la probabilidad personal. Frecuencistas y bayesianos constituyen actualmente dos clanes o grupos filosficos que mantienen una cordial disputa en el mundo de la estadstica. Los frecuencistas son ms abundantes que los bayesianos. A los bayesianos se les denuncia cierto carcter arbitrario o irracional en sus probabilidades subjetivas (que se suelen llamar "a priori"), ya que estas probabilidades no son directamente medibles. Tambin se podra decir que la verificacin frecuencista de la probabilidad emprica nunca ha sido hecha. Nadie ha lanzado una moneda al aire infinitas veces.
FACTOR BAYES Si en un estudio que incluye a 1000 pacientes, slo 200 de ellos padecen diabetes, la odds de desarrollar diabetes se calculara dividiendo 200 entre 800 (odds =1/4). Tambin podra expresarse la odds como 1:4. Se interpreta que apareci un diabtico por cada 4 no-diabticos. 4 1 1000 200 diabticos no diabticos ODDS = = =
Como ya se vio en el captulo 1, se demuestra que la odds a posteriori (una vez que se sabe que se ha cumplido una condicin) es igual a la odds marginal (no condicionada o previa a saber la condicin), multiplicada por un factor. En la tabla 8.1, la odds de ser diabtico previamente a saber la condicin, es decir no condicional a la glucosuria, se basa en la probabilidad total o marginal y se calculara dividiendo 200 entre 800 (odds previa=1/4 o bien 1:4) y se interpreta que hay un diabtico por cada 4 no-diabticos
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S4 Tabla 8.1. Presencia de glucosuria en pacientes diabticos y sin diabetes. Diabetes No diabetes Total Glucosuria 60 8 68 No glucosuria 140 792 932 Total 200 800 1000
4 1 800 200 1000 / 800 1000 / 200 diabetes) (no P (diabetes) P ODDSprevia = = = =
Puede hablarse tambin de una odds posterior que sera la odds condicionada a cumplir un requisito, en el ejemplo la odds posterior sera la odds condicionada a tener glucosuria. Esta odds posterior valdra: 7,5 8 60 8/68 60/68 ) glucosuria | diabetes (no P ) glucosuria | (diabetes P posterior ODDS = = = = El teorema de Bayes demuestra que la odds posterior (condicional) es igual a la odds previa multiplicada por un factor al que llamaremos "factor Bayes" (al que en el captulo 1 se le llam RV+):
Bayes Factor ODDSprevia ior ODDSposter ! =
El factor Bayes equivale a la razn de probabilidades de la condicin, es decir al cociente de probabilidades de presentar la condicin (glucosuria) entre los que tienen el evento (diabticos) y los que no lo tienen (no-diabticos). Ya habamos dicho que tener glucosuria era 30 veces ms frecuente entre los diabticos que entre los no-diabticos. A ese cociente se le llama Factor Bayes: 30 01 , 0 3 , 0 diabetes) no | a (glucosuri P diabetes) | a (glucosuri P Bayes Factor = = = El factor Bayes se interpreta como que es 30 veces ms frecuente encontrar glucosuria en los diabticos que en los no diabticos. Vemos que se cumple la regla de Bayes: 5 , 7 4 1 30 ODDSprevia Bayes Factor ior ODDSposter = ! = ! = Como vimos ms arriba, la odds posterior era 7,5 y equivala a dividir 60 entre 8. Esta odds posterior se interpreta como que entre los que tienen glucosuria hay 7,5 diabticos por cada no diabtico (es 7,5 veces ms probable ser diabtico si se cumple la condicin de la glucosuria). Si se transforma la odds en probabilidad, usando la expresin vista odds 1 odds + = p
probabilidad = 7,5/(1+7,5) = 0,882. Esta es la probabilidad posterior, es decir la probabilidad de diabetes condicionada a glucosuria, que ya habamos calculado. Si ahora nos cambiasen el problema y nos dijesen que, por ejemplo, en una poblacin con un 10% de diabticos, el 40% de los diabticos presentan glucemias por encima de 140 mg/dl y slo el 5% de los no-diabticos las presentan, simplemente aplicando el teorema de Bayes podramos responder a la pregunta de cul es la probabilidad de que una persona con glucemia superior a 140 sea diabtico: 9 1 9 , 0 1 , 0 diabetes) (no P (diabetes) P ODDSprevia = = = 8 05 , 0 4 , 0 diabetes) no | 140 (glucemia P diabetes) | 140 (glucemia P Bayes Factor = = > > = 889 , 0 9 8 9 1 8 Bayes Factor ODDSprevia ior ODDSposter = = ! = ! = La odds posterior valdra 8:9. Como hemos dicho, transformar una odds en una probabilidad consiste simplemente en aadir el numerador al denominador. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica SS Por lo tanto, la probabilidad de ser diabtico si se presenta una glucemia >140 mg/dl (ste es el valor predictivo positivo) sera: = > 140) glu | P(diab 0,889/(1+0,889) = 0,471. El 47,1% de los que presentan glucemias superiores a 140 mg/dl sern diabticos en esa poblacin. Esto es lo que ms le suele interesar al mdico, saber cul es la probabilidad de enfermedad condicional a que un test diagnstico sea positivo. Esto se llama valor predictivo positivo. Corresponde a la probabilidad a posteriori. Su odds es la odds posterior.
PLANTEAMIENTO BAYESIANO Imaginemos que una enfermedad (E) se da en los pacientes que acuden a urgencias con una relativa baja frecuencia, en concreto, se sabe que hay 1 persona con esa enfermedad por cada 200 que no la padecen. Esta ser nuestra odds previa a cualquier otra informacin. Nuestra presuncin de que la padezca algn paciente que llega a urgencias, antes de saber nada ms de l, ser que su odds de padecer esta enfermedad es 1 : 200. Pero le aplicamos dos pruebas y ambas resultan positivas. Cada prueba puede ser positiva o negativa. Las caractersticas de las pruebas 1 y 2 son: Prueba 1 Prueba 2 Sensibilidad 90%: p(prueba1+|E) = 0,9 70%: p(prueba2+|E) = 0,7 Especificidad 80%: p(prueba1-|nE)= 0,8 99%: p(prueba2-|nE)= 0,99 El planteamiento bayesiano ser el que recoge la figura 8.1 Figura 8.1. Evolucin sucesiva de la odds de enfermedad al resultar 2 pruebas diagnsticas positivas.
En la figura 8.1 se comprueba como la odds se va multiplicando por el Factor Bayes de cada prueba a medida que las pruebas van dando resultados positivos. Este proceso podra continuar con sucesivos pasos donde siempre se parte de la odds obtenida en el paso previo. Pero, en el ejemplo, ya con dos pruebas positivas, la decisin debera ser que el paciente tiene la enfermedad, ya que es ms probable que la tenga que su contrario. Al principio se nos han dado las probabilidades de un resultado u otro de la prueba condicionada a la enfermedad. Al final estimamos una odds de enfermedad condicionada a los resultados observados en las pruebas. Este es el fundamento de la estadstica bayesiana. La estadstica frecuencista convencional calcula las probabilidades de que ocurra un resultado condicionadas a que una hiptesis sea cierta (pero no se valora cul es la probabilidad de que esa hiptesis sea cierta). La estadstica bayesiana en cambio calcula la probabilidad de que la hiptesis sea cierta condicionada a los resultados obtenidos. Al factor Bayes, en el contexto de las pruebas diagnsticas se le llama tambin razn de verosimilitud (likelihood ratio).
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S6 DISTRIBUCIN NORMAL Es una distribucin de probabilidad terica para variables continuas. Tiene forma de campana, es simtrica, mesocrtica y en ella la media, la mediana y la moda coinciden. Esta distribucin de frecuencias, se usa mucho en bioestadstica y es conocida como campana de Gauss. En una campana de Gauss el eje horizontal o de abscisas corresponde a cada uno de los valores posibles de la variable que se estudia, mientras que el eje vertical (ordenadas) corresponde a la probabilidad de que ocurran los valores. Pero la probabilidad de un valor individual aislado tericamente es 0, y slo el rea que queda bajo la curva correspondiente a un cierto intervalo de valores es el que se interpreta como la probabilidad de que ocurra alguno de los valores contenidos en ese intervalo. La probabilidad de un valor concreto es 0 porque el modelo matemtico de la distribucin normal es el de una variable continua y en esta situacin hablar de un valor concreto supondra una exactitud absoluta y radical. Por ejemplo, si sabemos que el nivel de colesterol total de una poblacin sigue una distribucin normal y se nos pregunta cul es la probabilidad de que alguien tenga un colesterol=200 mg/dl, tendremos que decir que dicha probabilidad es 0, porque no nos estamos refiriendo a que tenga un nivel de colesterol entre 199,5 y 200,5 mg/dl, ni entre 199,9 y 200,1 mg/dl, sino exactamente 200,000000000000, y habra que ampliar los dgitos decimales hasta el infinito. Nadie tiene exactamente esa cifra de colesterol. La solucin con la distribucin normal es valorar siempre la probabilidad de un rango de valores entre dos lmites. Esto s puede hacerse, por cercanos que sean los lmites. Es preciso advertir por tanto que las variables continuas (colesterol, tensin arterial, edad) tienen (tericamente) un nmero infinito de posibles valores. En estos casos no tiene sentido hablar de la probabilidad de que un sujeto presente un determinado valor puntual de colesterol, puesto que, como tal, no puede ser calculada. En estos casos hablamos de densidad de probabilidad, un concepto que se refiere a la probabilidad de que un sujeto tenga un valor incluido en un determinado intervalo entre dos valores. As, cuando trabajamos con variables continuas, se tiende a realizar el lmite de cada una de las barras de los histogramas o diagramas de barras de los que hemos comenzado hablando, logrando con ello una distribucin mucho ms suave, pero en la cual, las alturas ya no son probabilidades, sino densidades de probabilidad, y as ya no tiene sentido hablar de que haya una probabilidad de que se d cada posible valor concreto de la variable, sino que tan slo podemos calcular probabilidades para intervalos entre dos valores.
Figura 8.2. Campana de Gauss, distribucin normal.
En la figura 8.2. la suma de todo el rea bajo la curva (desde !" hasta +") tiene una probabilidad del 100%. La altura de la ordenada no se puede interpretar como la probabilidad de que ocurra un valor particular (esta probabilidad sera cero en una variable continua) sino que corresponde al concepto de densidad de probabilidad. Algunas de las variables estudiadas en medicina y en ciencias de la salud suelen seguir una distribucin normal o de Gauss, siendo ms frecuentes los valores intermedios y ms raros los de los extremos. Por qu este tipo de distribucin, en la que los valores centrales son muy frecuentes y en cambio los valores alejados del centro (colas) son raros est muy presente?. Para resolver esta cuestin podramos preguntarnos por ejemplo: de qu depende la altura de una persona? Sin nimo de ser exhaustivos responderamos: 1-De la altura de su padre. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S7 2-De la altura de su madre. 3-De su nutricin (cantidad de energa consumida) durante la infancia y adolescencia . 4-De la velocidad de maduracin de su esqueleto (en esto influyen los niveles hormonales, la edad en la que aparece la pubertad, etc). 5-Del aporte que reciba de vitamina D (sta a su vez se ve influenciada por la exposicin mayor o menor a la luz solar) . 6-Del aporte de calcio. 7-Del ejercicio fsico. 8-De sus niveles de hormona de crecimiento. 9-etc... (aqu se incluyen muchos otros factores, algunos de ellos desconocidos actualmente). Podemos pensar que estos 9 factores son como 9 dados que puntan alto o bajo. Sera muy raro encontrar un caso en que todos simultneamente puntuaran tan alto que resultara un individuo con 2,40 m de altura. Lo ms frecuente es que unos "dados" punten alto, otros bajo y muchos en posiciones intermedias. Esto pasa con la mayor parte de las caractersticas de los seres vivos: peso, talla, frecuencia cardiaca, nmero de respiraciones por minuto, colesterol en sangre, presin arterial, etc. todas estas variables dependen de muchos factores, todos ellos sometidos a su vez a una amplia variabilidad biolgica y por ello suelen seguir una distribucin que se aproxima a la normal. La distribucin normal es la indicada para datos que siguen una escala -al menos en teora- continua (peso, talla, edad, colesterol, tensin arterial, cido rico, bilirrubina, etc.) y adems posee la ventaja de que otras distribuciones, bajo ciertas condiciones, acaban aproximndose a ella, como sucede con la distribucin binomial (para sucesos dicotmicos) cuando " se aproxima a 0,5 y n es grande. Tambin se aproxima a la normal la suma de varias distribuciones uniformes. Esto es lo que sucede con la suma de varios dados. La distribucin normal se conoce tambin como curva o Campana de Gauss, en honor del matemtico que la describi, y es muy til en estadstica por las razones mencionadas. La distribucin normal terica nunca se da exactamente en la realidad, slo hay aproximaciones a ella, pero se puede expresar como ecuacin matemtica. No es preciso conocer esta expresin matemtica para resolver la mayor parte de los problemas relativos a la distribucin normal. Al ser expresada como un modelo o ecuacin, la distribucin se hace continua y tericamente hay infinitos puntos, infinitos valores posibles. En teora, su eje horizontal (abscisas) se extiende desde menos infinito hasta ms infinito. En general, una distribucin normal se caracteriza por: 1) Tener forma de campana. 2) Ser simtrica. 3) No ser excesivamente plana ni excesivamente picuda (mesocrtica). 4) Coincidir en ella la media, la mediana y la moda. 5) Tener aproximadamente el 95% de sus valores dentro del intervalo 2 # (media 2 desviaciones estndar). Exactamente, el 95% de los individuos se encuentra dentro del intervalo comprendido por 1,96 #. Incluso podemos afirmar que casi el 100% de los valores estn dentro del intervalo 3 #. 6) Ser la distribucin muestral que siguen los ndices o estimadores estadsticos calculados en una muestra. Lo ms importante de todo es que cualquier distribucin aunque no siga una normal, tiende a ella en su distribucin muestral. Por ejemplo, si tomamos 1000 muestras distintas, todas del mismo tamao (por ejemplo, de 30 individuos) de la distribucin uniforme (lanzamiento de un slo dado) y a todas ellas les calculamos su media y con estas 1000 medias hacemos una distribucin de frecuencias, nos vuelve a aparecer la campana de Gauss. Aunque la poblacin de la que proceden las muestras no siga una distribucin normal, los estimadores calculados en las sucesivas muestras s la siguen, siempre que las muestras tengan suficiente tamao (n>30).
CLCULOS BSICOS CON UNA DISTRIBUCIN NORMAL Desde el punto de vista prctico tambin es muy importante adquirir familiaridad con un procedimiento que sirve para responder a muchas preguntas sobre una variable que sigue una distribucin normal. Estas preguntas se puedan responder con una tabla y unos sencillos clculos (sumar, restar, multiplicar y dividir). Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S8 El procedimiento consiste en tipificar o estandarizar la normal. Se trata simplemente de transformar una determinada distribucin normal en otra que tenga una media igual a 0 y una desviacin estndar igual a 1. Esto consigue que cualquier valor represente una distancia a la media expresada como el nmero de desviaciones estndar en que ese valor se aleja de la media. Habr valores positivos, los que estn por encima de la media y valores negativos, los que estn por debajo de la media. Para eso se emplea la siguiente ecuacin:
Donde x es la antigua variable y z es la nueva variable que ya sigue una distribucin normal de media=0 y desviacin estndar=1. Para devolver la transformacin a su estado original tendremos:
X = +!z
Por ejemplo, si la media de tensin arterial sistlica de una poblacin es 120 mmHg y la desviacin estndar es 25 mmHg, y se asume que sigue una distribucin normal, podemos responder a diversas preguntas con slo unos clculos muy sencillos. As, si queremos saber qu proporcin de personas tiene ms de 170 mmHg, habr que calcular el valor z que corresponde a 170:
Qu ventaja nos ofrece saber que 170 mmHg corresponde a un valor de z = +2?. En primer lugar sabemos que est a 2 desviaciones estndar por encima de la media. En segundo lugar, existen tablas que nos dicen cul es la probabilidad de que se d un valor superior o inferior a cada valor de z. Esas son las tablas de la distribucin normal que vienen en todos los libros de estadstica. Estas tablas estn encabezadas por una frase que dice Dentro de la tabla se proporciona el valor de p para +z o para -z. Como z es positiva, nos dar el valor de la zona por encima de z. Para buscar una z= +2,00 hay que localizar el valor correspondiente a 2,0 (en la primera columna) y ,00 (en la primera fila). La probabilidad p correspondiente al rea de la cola que est a la derecha de un valor de z=+2 es 0,0228. Es decir, el 2,3% de los individuos tendrn valores superiores a 170 mmHg. Tambin se pueden obtener la probabilidad correspondiente a cada z en excel con la expresin: = DISTR.NORM.ESTAND (-z) En nuestro ejemplo = DISTR.NORM.ESTAND (-2) y devolver p = 0.028 En Excel siempre se debe meter con signo negativo, porque siempre da la cola de la izquierda. En el software Stata se debe introducir: display normal(-2) y devolver p = 0.028
Para saber cuntas personas tienen tensiones arteriales sistlicas entre 160 y 180 mmHg tendremos que hacer lo mismo con 180 (le calculamos su z y es +2,40; a continuacin buscamos en la tabla y nos dice que el 0,8% (0,0082) de las personas tendrn valores por encima de z=+2,40. A continuacin hay que hacer lo mismo con 160 y su z valdr +1,60. Recordemos que esto simplemente significa que 160 est a 1,6 desviaciones estndar por encima de la media. La probabilidad que nos da la tabla de que alguien est a ms de 1,60 desviaciones estndar de la media es del 5,5% (0,0548). Lo nico que queda es restar 0,8% de 5,5%. Si hay un 0,8% de resultados por encima de 180 Y hay un 5,5% por encima de 160 Cuntos habr entre 160 y 180? ! " = x z 2 25 120 170 + = ! = ! = " x z Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S9 5,5% - 0,8% = 4,7% La solucin es que el 4,7% de las personas de esa poblacin tienen tensiones sistlicas comprendidas entre esos valores (160-180 mm Hg). Tambin podemos preguntarnos: Qu valor deja al 90% de las personas por debajo de l? Esto supone exactamente preguntarnos por cul es el percentil 90. Para hacerlo hay que recorrer un camino similar, pero al revs, empezando por mirar las tablas: 1 Buscamos en las tablas qu valor de z deja 0,1 por encima. Este valor es z=1,28. 2 Calculamos x a partir de z. Este valor es 152 mm Hg.
x = + z# = 120 + (1,28 x 25) = 152
Imaginemos otro ejemplo. Cul es la proporcin de individuos de una poblacin (sigue una distribucin normal) que se encuentran entre los valores 20 y 35, si la media vale 30 y la desviacin estndar 10? Los valores z respectivos sern 1 y +0,5 para 20 y 35. El rea bajo la curva que nos interesa calcular es la delimitada por los valores -1 y +0.5 en la figura 8.2. Para resolver el problema bastar con restar de 1 la suma de las probabilidades que quedan a la derecha y a la izquierda del rea central, que es la que nos interesa. Si hay un 15,9% de individuos por debajo de z= -1 Y hay un 30,9% por encima de z=+0,5 Cuntos habr entre z=-1y z=+0,5? 100% - (15,9% + 30,9%) = 53,2%
!"#$%&'()%*+%*,(-"#%.*/0%*/0%+(&*%&*+1,%#.".*1&'%#,(-".*%&*0&(*+1.'#120$13&* &"#4(- 5 6* Desviaciones estndar (z) % valores en cada cola (p a 1 cola) % central (media zs) 1 15,85 68,3 1,28 5 90 1,96 2,5 95 2,58 0,5 99 3 0,15 99,7 En Excel se pueue intiouucii la expiesion =BISTR.N0RN.ESTANB(z) y uai el iea que queua en la cola +%* -(* 17/01%#+( paia caua valoi ue z que se esciiba, poi ejemplo: =BISTR.N0RN.ESTANB(-2) uevuelve p=u,u2S (1 cola).
La uistiibucion noimal es la uistiibucion que siguen muchos inuices o estimauoies estauisticos calculauos en una "#$%&'(. Esta piopieuau es la ms impoitante. Significa que si se toman muestias ue una poblacion que sigue cualquiei uistiibucion aunque no siga una noimal, los estimauoies que se calculen en las sucesivas muestias tenuein a la uistiibucion noimal. Aunque la poblacion ue la que pioceuan las muestias no siga una uistiibucion noimal, los estimauoies calculauos en las sucesivas muestias si la siguen, siempie que las muestias tengan suficiente tamao (n>Su).
5 Los datos excluidos del intervalo se reparten a ambos lados de la distribucin normal. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 4u 9. CONCEPTOS BSICOS DE BIOESTADISTICA (adaptado del Compendio de salud pblica)
Segn una figuia seeia paia la saluu pblica, Floience Nightingale 6 , hay gianues iazones paia apienuei estauistica: )*!#+,$'%&(+,!-*,.%!&/*#0/&%!1$!"#%&!%&#,2!%&(&3%&34%!! 5*'!&/$%$!('$!&/$!"$(%#'$%!*5!63%!7#'7*%$ 89:6
;<=>?@<=AB>*?;<BCA!=AD>!
)89:;!<=!>?@8?AB=;!
Para trabajar con variables cualitativas se usan proporciones (p), mientras que para trabajar con variables cuantitativas se usan habitualmente sus medias ( ).
C=<8<?;!<=!)=D<=DE8?!E=D)@?B! Estiman cul es el valoi ms tipico o iepiesentativo ue una muestia. La "$,3(! ('3&"F&34(!$s el piomeuio ue touos los valoies y es la meuiua ue tenuencia cential ms usaua. Poi ejemplo, la meuia aiitmtica ue los valoies 1, 2 y S es 2:
El inconveniente ue la meuia aiitmtica es que, en muestias pequeas, se ueja influii mucho poi valoies extiemos, poi eso se uice que es poco iobusta. Si el teicei
6 Vivi en Inglaterra de 1820 a 1910. Es considerada la pionera de la enfermera moderna. Fue rebelde frente a los prejuicios de su poca. Destac inicialmente en la guerra de Crimea. Tanto all como en otros conflictos blicos sus brillantes acciones -basadas en evidencias- para organizar la atencin sanitaria lograron descender dramticamente la mortalidad. Fue la primera mujer miembro de la Royal Statistical Society britnica. Su frase puede traducirse como: Debemos estudiar estadstica para comprender la mente de Dios, porque en ella estn las medidas de Sus designios. x ( ) 2 3 3 2 1 = + + = = ! n x x i Cualitativas Escala nominal A, B, C
Caracterstica o cualidad que la persona posee o no posee. Si slo hay dos categoras: variables dicotmicas o binarias. Los posibles valores son excluyentes. Permiten: 1) clasificar o
diferenciar (igualdad/desigualdad) Escala oiuinal I, II, III Sus valoies son jeiaiquizables y oiuenables. Auems ue 1) clasificai o uifeienciai, peimiten:
2) jeiaiquizai, o asignai '(+0*%. Cuantitativas Discreta 2, 6, 33 Solo pueuen tomai valoies numiicos enteios. Sus valoies son finitos y no aumiten uecimales. Auems ue 1) clasificai o uifeienciai y 2)jeiaiquizai, peimiten: S) contai y 4) iealizai opeiaciones algebiaicas. Continua 9.S, 28.96 Escala ue iazon. Son numiicas y aumiten cualquiei cantiuau inteimeuia entie uos posibles valoies (uecimales). Peimiten: 1) clasificai o uifeienciai
2) jeiaiquizai
S) meuii 4) opeiaciones algebiaicas.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 41 valoi en vez ue sei S fuese 24, la meuia aiitmtica subiiia a 9. En cambio, la "$,3(+(!+*! %$!,$G(!3+5H#3'!7*'!$I&'$"*%J!ya que es aquel valoi que ueja la mitau ue las obseivaciones poi uebajo y la mitau poi encima (si los uatos son paies, seiia la meuia ue los uos valoies centiales). Seiia 2 en ambos casos. Siive tambin paia vaiiables oiuinales. Su inconveniente es que no usa touos los uatos. La! "$,3(! 7*+,$'(,(! *&*'0(! a unas obseivaciones ms impoitancia o peso (wi) que a otias. Poi ejemplo, si la teiceia obseivacion (S) tiene un peso uel 8u% y las otias uos (1 y 2) solo uel 1u%: C$,3(!7*+,$'(,(K! ! La!"*,(!es aquel valoi que se iepite con mayoi fiecuencia.
C=<8<?;!<=!9:;8E8LD! Inuican el lugai o el oiuen que ocupa un uato uentio ue la uistiibucion a la que peitenece. Los c#(+&3H$%!Inuican qu puesto tiene un ueteiminauo valoi ue una vaiiable en el conjunto oiuenauo ue los uatos 8E:. Los peicentiles uiviuen la muestia en paites poicentuales acumulativamente. Poi ejemplo el peicentil Su es el valoi que ueja el Su% ue las obseivaciones ue la muestia poi uebajo. C$,3(+( =7$'4$+&3H!MN.
C=<8<?;!<=!<8;9=@;8LD! Estiman la vaiiabiliuau ue los uatos. La v('3(+O(: se paiece al piomeuio ue las uesviaciones cuauiticas ue caua valoi iespecto a la meuia, peio su uenominauoi es n-1 en vez ue sei n. Este uenominauoi (n-1) coiiesponue a los 0'(,*%! ,$! H3P$'&(, ue la vaiianza. Al numeiauoi ue la vaiianza se le conoce como %#"(! ,$! 4#(,'(,*%. Poi ejemplo, la vaiianza ue S valoies, 1, 2 y S, sei: >('3(+O(!"#$%&'(H!Q% R SK ! El inconveniente ue la vaiianza es que tiene uniuaues al cuauiauo ue los uatos oiiginales. La ,$%T3(43U+! $%&V+,('! *! ,$%T3(43U+! &W734(! elimina las uniuaues al cuauiauo, pues consiste en extiaei la iaiz cuauiaua ue la vaiianza. La uesviacion tipica (s) tiene, poi tanto, las mismas uniuaues que la meuia y es el inuice ue uispeision ms utilizauo:! %!K ! El! 4*$5343$+&$! ,$! T('3(43U+! compaia la uispeision ue vaiiables con uistintas uniuaues (es auimensional). Es el cociente entie uesviacion tipica y meuia aiitmtica: ! E*$5343$+&$!,$!T('3(43U+K ! Se suele expiesai en poicentaje (en el ejemplo, el coeficiente ue vaiiacion inuicaiia que la uesviacion tipica es el Su% ue la meuia). Pouiia sei >1uu%. 0n concepto tiascenuental en estauistica es el ue $''*'! $%&V+,('! Q==S! ue un estimauoi (a no confunuii con la uesviacion estnuai). El EE miue el giauo ue uispeision ue los estimauoies muestiales ue touas las posibles muestias ue igual tamao que se puuiesen obtenei aleatoiiamente ue una poblacion. A mouo ue ejemplo, se piesentan los EE ue una meuia y ue una piopoicion:!
9('(!#+(!"$,3(X! ! 9('(!#+(!7'*7*'43U+X! ! Caua estimauoi tiene su piopio eiioi estnuai con su coiiesponuiente foimula. @(+0*!3+&$'4#('&WH34*X!Es la uifeiencia entie el peicentil 7S y el peicentil 2S. ! ! ! ( ) ( ) 2,7 0,8 0,1 0,1 3 0,8 2 0,1 1 0,1 w w
i i i = + + ! + ! + ! = = " " x ( ) ( ) ( ) ( ) 1 1 3 2 3 2 2 2 1 1 n x 2 2 2 2 = ! ! + ! + ! = ! ! = " x i ( ) 1 1 1 n x 2 = = ! ! = " x i % 50 100 2 1 100 media tipica Desviacion = ! = ! = x s n s EE x = n p p EE p ) 1 ( ! = Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 42 @=9@=;=D)?E8:D=;!-@YZ8E?;! * =(2-(*5696*C%F#%.%&'($1"&%.*G#HI1$(.*.%GJ&*%-*'1F"*+%*,(#1(2-%.6* D(#1(2-%* C%F#%.%&'($13&*G#HI1$(* B(#($'%#K.'1$(.* Cualitativas nominales uifico ue sectoies
La fiecuencia es piopoicional al iea. Cualitativas oiuinales Cuantitativas uiscietas Biagiama ue baiias
La fiecuencia es piopoicional a la altuia ue las baiias. Cuantitativas continuas Bistogiama __ Los iectngulos se iepiesentan juntos. El punto meuio uel inteivalo pueue uai titulo a caua iectngulo. La fiecuencia es piopoicional al iea ue las baiias. Poligono ue fiecuencias
Se obtiene unienuo con una linea las fiecuencias ue los puntos meuios ue los inteivalos ue un histogiama. Poligono ue fiecuencias acumulauas
Se suman las fiecuencias ue los inteivalos pieceuentes. Repiesenta cuntos sujetos ue la muestia piesentan poi lo menos un ueteiminauo valoi ue la vaiiable. uificos ue caja
Se iepiesentan la meuiana, el iango inteicuaitilico, y los valoies iaios (peiifiicos o *#&H3$'% [ ). En este ejemplo no hay outlieis.
uifico ue uispeision
Repiesenta la ielacion entie uos vaiiables numiicas continuas.
7 Un valor perifrico es aqul que est muy alejado por arriba del percentil 75 o por abajo del percentil 25. 3 2 1 Grupo D C B A F recu en cia 80 60 40 20 0 F re c u e n c ia 60 50 40 30 20 10 0 57 38 33 49 4 25 9 11,0 10,0 9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 0 5 10 15 20 25 A B C D E F 0 10 20 30 40 50 60 A B C D E F 10 8 6 4 x 10 8 6 4 2 0 y 10 8 6 4 2 0 Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 4S AL=;CD>MN<*?;*BNLOA>LP>*Q*BNL=C><=;<*?;*RA!S=;<A<*
=@@:@!;8;)=CY)8E:!\!=@@:@!?B=?):@8:! Los eiioies sistemticos o sesgos estn piouuciuos poi un uefecto uel instiumento ue meuiua o poi una tenuencia eiionea ue obseivauoi y, poi tanto, tienuen a iegistiaise en el mismo sentiuo. Los eiioies aleatoiios o acciuentales son aquellos uebiuos a pequeas causas imponueiables e imposibles ue contiolai 8T:.
=(2-(*56T6*?1I%#%&$1(.*%&'#%*%##"#%.*(-%('"#1".*U*%##"#%.*.1.'%4H'1$".6* ERR0R ALEAT0RI0 ERR0R SISTENATIC0 - Impredecible - Simtrico - Inevitable, aunque estimable - No afecta a la validez interna ni externa - Equivale a falta de precisin - Estimacin y control " Estadstica - Predecible - Asimtrico - Corregible - Afecta a la validez interna y/o externa - Equivale a falta de validez (sesgo) - Prevencin y control " Epidemiologa Fuente: 8E:. ! 8D)=@>?B:;!<=!E:DZ8?D]?! E*+4$7&*! ,$! 3+&$'T(H*! ,$! 4*+53(+O(X! Casi siempie iesulta impiacticable iecogei la infoimacion ue las vaiiables ue inteis ue toua la poblacion. Poi ello, se suele tiabajai con muestias extiaiuas ue una poblacion en las que se ueteiminan los $%&3"(,*'$% muestiales (meuia, piopoicion, etc.). A paitii ue ellas, se necesita inuagai un iango ue valoies uonue sea cieible que se encuentie el veiuaueio paimetio poblacional (veiuaueia meuia ue la poblacion total, veiuaueia piopoicion, etc.) que no es factible ueteiminai (pues paia haceilo se hubiesen iequeiiuo los uatos ue &*,( la poblacion). Al iango u hoiquilla ue valoies cieibles paia ese paimetio poblacional que ahoia es inaccesible se le uenomina 3+&$'T(H*! ,$! 4*+53(+O( 8TV5:. Se calcula el inteivalo usanuo solo los uatos ue la muestia. Peio en ese inteivalo 4'$$"*%! o confiamos que estai incluiuo el veiuaueio valoi poblacional (paimetio). Lo impoitante es sabei que si se iepitiese el muestieo 1uu veces y a paitii ue las 1uu muestias se calculasen 1uu inteivalos ue confianza al 9S%, habiia 9S inteivalos que iealmente contenuiian al veiuaueio valoi uel paimetio poblacional y S que no lo contenuiian. ! EVH4#H*!,$!3+&$'T(H*%!,$!4*+53(+O(X!Los inteivalos ue confianza se calculan usanuo el eiioi estnuai (EE), que es un inuicauoi ue la vaiiabiliuau ue los estimauoies calculauos en muchas posibles muestias ue igual tamao que se tomen ue una poblacion. En uefinitiva, el EE ue un estimauoi miue el giauo ue inceitiuumbie iespecto a la capaciuau ue ese estimauoi paia aveiiguai el paimetio poblacional 8W:. El clculo uel inteivalo ue confianza piesupone que los estimauoies muestiales ue un paimetio siguen una uistiibucion noimal (teoiema cential uel limite). La foimula paia el clculo uel inteivalo ue confianza vaiiai en funcion uel paimetio que se uesee estimai. Sin embaigo, en geneial, pouemos afiimai que: 9('V"$&'*!7*PH(43*+(H! !$%&3"(,*'!^!OI==! Aqui, z es el valoi coiiesponuiente a la uistiibucion noimal.
E:D)@?;)=!<=!689L)=;8;! 0n contiaste ue hipotesis implica una compaiacion entie un $5$4&* y la vaiiabiliuau aleatoiia espeiaua ($''*'). Si la magnituu uel efecto obseivauo en la muestia es muy supeiioi al eiioi, se uii que la muestia apoya la existencia ue tal efecto en la poblacion. Si el efecto obseivauo en la muestia es similai o infeiioi en magnituu al eiioi, se concluii que la muestia no apoya la existencia ue uicho efecto. Paia tomai una u otia uecision, se establecen uos hipotesis (a nivel ue la poblacion): ! Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 44 637U&$%3%!+#H(!Q6NS: mantiene que el efecto ue inteis no existe (es nulo, es uecii, vale u) en la poblacion ue la que pioceue la muestia. Si Bu fuese cieita, toua la vaiiabiliuau obseivaua se pouiia explicai meiamente poi el azai. 637U&$%3%! (H&$'+(&3T(! Q6_S: mantiene que existe algn efecto uistinto ue u en la poblacion ue la que pioceue la muestia. La vaiiabiliuau obseivaua no se explicaiia totalmente poi el azai. Las hipotesis (nula y alteinativa) se plantean siempie a nivel ue la poblacion; sin embaigo, los uatos usauos paia apoyailas o iechazailas pioceuein ue la muestia. Se calcula uespus un T(H*'! 7! ,$! %30+3534(43U+! $%&(,W%&34(, que estima la piobabiliuau ue encontiai un efecto como el encontiauo *!#+*!&*,(TW(!"(2*' en la muestia si el efecto fuese u en la poblacion (es uecii, si Bu fuese cieita). Esa piobabiliuau muchas veces coiiesponuei al iea ue la cola ue la uistiibucion noimal paia un valoi z calculauo. El clculo ue tal valoi z se hai muchas veces uiviuienuo el efecto entie el eiioi (eiioi estnuai). Cuanto menoi sea esa cola, menos compatible sei el iesultauo encontiauo en la muestia con la hipotesis nula en la poblacion. 8+&$'7'$&(43U+! ,$H! 4*+&'(%&$! ,$! /37U&$%3%X! El valoi 7 es una piobabiliuau conuicionaua a que la hipotesis nula sea cieita. Inuica la piobabiliuau ue obseivai en la muestia uifeiencias mayoies o iguales a las iealmente obseivauas si la hipotesis nula fueia cieita. >(H*'!7K *
?%$1.1"&%.*/0%*.%*'"4(&*%&*0&*$"&'#(.'%*+%*X1F3'%.1.*%&*I0&$13&*+%-*,(-"#*"*+%* .1G&1I1$($13&*%.'(+K.'1$( Y 6* FZ[\[5* F][\9[* Se rechaza la hiptesis nula No se puede rechazar la Hiptesis nula No parece que el azar lo explique todo No se puede descartar que el azar lo explique todo El efecto es mayor que el error El efecto es similar al error Hay diferencias estadsticamente significativas No hay diferencias estadsticamente significativas Existen evidencias a favor de la hiptesis alternativa No existen evidencias a favor de la hiptesis alternativa. Fuente: auaptauo ue 8E:. Los limites u,uS y u,1u son en cieito mouo aibitiaiios y no se les uebe uai una consiueiacion uogmtica o absoluta. Entie u,uS y u,1u se pueue aumitii que, ue algn mouo se est en "tieiia ue nauie" y pouiia ueciise que los iesultauos se apioximan o estn ceicanos a la significacion.
;)%4F-"*+%*$"&'#(.'%*+%*X1F3'%.1.6* En una muestra de 100 varones, su permetro abdominal medio es 94 cm (s=9), en otra muestra, esta vez de 136 varones, la media es 97 (s=9) . Son significativamente distintas las medias de permetro abdominal en ambas muestras?
El efecto (diferencia de medias: 94-97= -3) tiene una magnitud 2,53 veces superior al error. El error corresponde al error estndar de la diferencia de medias para varianzas homogneas:
* * El resultado z=-2,53 corresponde a un valor p (a 1 cola) de 0,0057 y p=0,0114 (2 colas). Conclusin: Se decide rechazar H0 (que mantiene que las muestras proceden de dos poblaciones que no difieren en sus permetros abdominales) y se concluye que los permetros medios son significativamente distintos en las dos muestras comparadas. Nota: Paia compaiai uos meuias se usai habitualmente la uistiibucion t ue Stuuent que se paiece a la noimal, peio sus valoies p cambian en funcion uel tamao muestial. Cuanto menoi sea n, ms impoitante es usai t. Si en este ejemplo, se hubiese con la t, el valoi p (2 colas) hubiese siuo p=u,u12.
8 Los lmites 0,05 y 0,10 son en cierto modo arbitrarios y aproximados. ) | ( 0 H observadas dif p ! 2 1 1 1 n n s EEDM + = . hom . var Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 4S Es impoitante uistinguii entie los conceptos ue significacion estauistica y ue significacion o ielevancia pictica (significacion 4HW+34( en la investigacion muica). La significacion estauistica es la mayoi o menoi piobabiliuau ue obtenei un iesultauo como el obseivauo (o ms extiemo) en el estuuio si touo se uebieia solo al azai. Pueue que una asociacion que hallemos sea estauisticamente significativa peio tenga poca ielevancia clinica poique la magnituu ue la uifeiencia obseivaua no tiene ninguna tiascenuencia paia la saluu ue un paciente. En el ejemplo ue la tabla anteiioi la significacion clinica venuiia uaua poi la piegunta: como afectai a la saluu ue un vaion ue esas caiacteiisticas que su peiimetio abuominal aumente en S cm. ! =@@:@!)89:!_!\!=@@:@!)89:!R`!9:)=DE8?!=;)?<a;)8E?!
?%$1.1"&%.*/0%*.%*F0%+%&*'"4(#** +%.F0^.*+%*0&*$"&'#(.'%*+%*X1F3'%.1.6 vERBAB (REALIBAB) B u B 1
El valoi 7 (ue significacion estauistica) estima la piobabiliuau ue cometei un eiioi ue tipo 1 una vez que se han analizauo los uatos, en cambio el iiesgo alfa es el ciiteiio ue uecision pieviamente estableciuo. Pueue paiecei a piimeia vista que alfa coinciue con el valoi 7, peio lo que suceue es que el iiesgo alfa se iefieie a la piobabiliuau que el investigauoi %$!53G(!,$!(+&$"(+*, establecienuo qu iiesgo ue cometei una equivocacion est uispuesto a aumitii, es poi tanto un nmeio fijo y se especifica sin necesiuau ue conocei los uatos; en cambio, 7 se calcula a posteiioii, a paitii ue los uatos analizauos 8W\_:.
* !C`;a><*?;*BNL=C><=;*?;*RA!S=;<A< 9@8DE89?B=;!9@b=A?;!<=!E:D)@?;)=!<=!689L)=;8;! Las piuebas ue contiaste ue hipotesis ms utilizauas apaiecen en la tabla siguiente, agiupauas segn el tipo ue vaiiables que se analicen. Las piuebas paiamtiicas se llaman asi poique se basan en paimetios (meuia, vaiianza, etc.) ue una uistiibucion teoiica ue piobabiliuau y iequieien el cumplimiento ue unas conuiciones ue aplicacion ms estiictas. Cuanuo no se cumplen tales supuestos o si las vaiiables uepenuientes siguen una escala oiuinal se ueben usai las piuebas +*!7('("F&'34(%. Las muestias inuepenuientes son aquellas en que no hay ninguna ielacion paiticulai entie caua pai ue inuiviuuos ue los giupos que se compaian. En cambio los tests empaiejauos, paieauos o ue meuiuas iepetiuas son los que estn inuicauos cuanuo se tiata ue un mismo sujeto meuiuo en uos ocasiones o ue uiseos uonue se establecen compaiaciones entie paiejas especificas y bien ielacionauas ue sujetos (heimanos, familiaies o contioles empaiejauos inuiviuualmente con caua caso).
* * Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 46 !#0%2(.*+%*$"&'#(.'%*+%*X1F3'%.1.*(F-1$(2-%.*%&*$(+(*.1'0($13&6* Variable independiente* Variable dependiente*
Pruebas empleadas
Observaciones
Categrica
Categrica Ji cuadrado Ji cuadrado de tendencia lineal
Prueba exacta Fisher Test de McNemar
REGRESIN LOGSTICA Si muestra grande Categoras siguen algn orden o variables ordinales Si muestra pequea Medidas repetidas
Cuantitativa REGRESIN CORRELACIN-PEARSON Correlacin-Spearman REGRESIN MLTIPLE Predice una variable a partir de otra Asociacin Asociacin Multivariable
Categrica
Supervivencia Kaplan-Meier 11
Log-Rank (Mantel-Haenzsel) REGRESIN DE COX REGRESIN DE POISSON Curvas supervivencia #2 curvas supervivencia Multivariable Multivariable * Las vaiiables inuepenuientes (eje ue abscisas o ue las "x") son los pieuictoies que habitualmente anteceuen a los supuestos efectos (tiatamiento asignauo, giupo al que peitenece el sujeto, caiacteiistica inicial o basal) ** Las vaiiables uepenuientes (eje ue oiuenauas o ue las "y") es el efecto, iesultauo o iespuesta que -conceptualmente al menos- ocuiiiiia posteiioimente al pieuictoi; se tiata ue compiobai si esa vaiiable uepenue ue los pieuictoies. Nota: se piesentan en maysculas las piuebas paiamtiicas
9@b=A?;!?!bD?!E:B?!\!9@b=A?;!?!<:;!E:B?;! Si la hipotesis alteinativa en un test ue hipotesis apunta solo en una uiieccion, inuicanuo la supeiioiiuau ue un giupo fiente al otio, se tiatai ue un test ue hipotesis unilateial. Si poi el contiaiio, la hipotesis alteinativa mantiene la uifeiencia ue los giupos, puuienuo sei cualquieia ue ellos el mayoi, se tiatai ue un test ue hipotesis bilateial. En el piimei caso los valoies p seiian solo (!#+(!4*H(. Si una piueba bilateial es significativa, tambin lo sei una piueba unilateial. Las piuebas a uos colas uain valoies 7 "(2*'$% (y poi tanto con "$+*' significacion estauistica). Las piuebas a una cola se empleain excepcionalmente. Se aconseja usai piuebas a uos colas.
NOCIONES DE ANLISIS MULTIVARIABLE Actualmente, casi toda la estadstica que se usa en medicina y en salud pblica consiste en anlisis multivariables que se basan en modelos de regresin que tratan con tres o ms variables simultneamente. Rara vez existe un slo predictor para cualquier suceso. Nuestro universo es multivariable. Los fenmenos de inters para la salud pblica tambin tienen habitualmente mltiples causas. Los anlisis estadsticos actuales intentan explicar un fenmeno (variable y o variable dependiente en la figura siguiente) teniendo en consideracin varias variables simultneamente. Los usos principales de estos modelos de regresin multivariable son 3:
9 El ANOVA, al incluir muchos grupos, suele necesitar que se corrijan o penalicen los valores p por las comparaciones mltiples que se pueden hacer, ya que al comparar todo con todo alguna comparacin resultara significativa slo por azar. El mtodo clsico ms empleado para esta correccin es el de Bonferroni. Tambin se ha usado el mtodo de Scheff. Hay otros menos conservadores (Sidak, Tukey, Tamhane, Gabriel, Duncan, Dunnet). Recientemente se est usando mucho el mtodo de Benjamini-Hochberg que usa un lmite de significacin estadstica progresivamente distinto para cada comparacin, tras ordenarlas de menor a mayor segn sus valores p. 1u El test de Jonckheere-Terpstra, ms reciente, puede usarse para la misma finalidad que el de Kruskal-Wallis. 11 Se trata en realidad de un mtodo descriptivo. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 47 ! El uso ms importante y ms frecuente es el de intentar ajustar las estimaciones por posibles factores de confusin (ver captulo correspondiente). La existencia de factores de confusin es omnipresente en la investigacin epidemiolgica. Los factores de confusin son variables distintas a la exposicin (variable "x" o independiente) y al efecto (variable "y" o dependiente), pero asociadas con ellas (comparten causas comunes) que distorsionan las medidas de asociacin. Hoy da nadie cree un anlisis estadstico que no est ajustado al menos por edad y sexo. En el primer panel de la figura 5.1 la "y" correspondera a funcin cognitiva (minimental test, MMSE), la lnea superior a los no fumadores (x1=0), la inferior a fumadores (x1=1) y en el eje "x" estara la edad como cuantitativa (x2). Una simple comparacin de la media de MMSE entre fumadores y no fumadores (t de Student) no sera vlida, puesto que si los fumadores son ms jvenes, tendrn mejor memoria, a pesar de que el tabaco les produzca deterioro cognitivo. Se soluciona el problema introduciendo la variable x2 (edad) en el modelo. Entonces el coeficiente de regresin b1 que acompaa a x1 dar la diferencia entre fumadores y no fumadores a igualdad de edad. Es decir se consigue comparar un fumador frente a un no fumador que sea de su misma edad. Si se introducen otras variables xi (sexo, nivel educativo, antecedentes familiares, alelo de la apoE, etc.) se puede conseguir reducir la posible confusin por dichos factores. Se consigue ajustar por todo factor que se haya introducido en la ecuacin (8). ! El segundo uso es valorar la interaccin o modificacin del efecto. En el panel intermedio de la figura se aprecia que el deterioro cognitivo se acelera ms con la edad en los fumadores que en los no fumadores. Las diferencias segn tabaco no son homogneas sino que aumentan con la edad. El tabaco modificara el efecto de la edad (mayor deterioro cognitivo asociado a la edad en fumadores) y la edad modificara el efecto del tabaco (mayores diferencias entre fumadores y no fumadores a medida que aumenta la edad). A esto se le llama interaccin (9). As como la confusin es un error sistemtico o sesgo que debe corregirse, la interaccin no es ningn error, sino una realidad biolgica que debe valorarse y describirse de la mejor manera posible. Se valora la interaccin mediante trminos de producto (multiplicacin). La significacin estadstica (valor p) del coeficiente b3 propio del trmino de producto indicar si el apartamiento del paralelismo de ambas lneas es significativo o no. Cuando sea significativo se podr hablar de que hay interaccin o modificacin del efecto. ! El tercer uso es introducir trminos cuadrticos o cbicos que permitan que las relaciones sean en forma de U o sigan cualquier otro modelo distinto de la rgida lnea recta (panel inferior de la figura). En el ejemplo de la figura (panel inferior) se ha introducido un trmino cuadrtico (x 2 o lo que es igual x^2) para recoger una relacin en forma de U. Este sera el caso de lo que sucede por ejemplo en la relacin entre el consumo de alcohol y riesgo coronario.
* Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 48 Usos de los modelos multivariables. * * * * * * * * * * * * * * * * * * * * Los coeficientes ue estos mouelos (bi) no son calculables a mano. Los piopoiciona el oiuenauoi tias intiouucii los uatos y uaile instiucciones auecuauas 8E:. La figuia piesenta las opciones ms habituales ue mouelos multivaiiables y su ielacion con caua uno ue los mtouos uesciiptivos y ue anlisis bivaiiante ms habituales. La uecision sobie qu mouelo multivaiiable usai uepenuei uel tipo ue vaiiable ,$7$+,3$+&$ ("y") que se est utilizanuo. ! Paia vaiiables uepenuientes cuantitativas (numiicas) como el peso, la tension aiteiial o el colesteiol, se usai la iegiesion lineal mltiple. Los coeficientes bi que piopoiciona este mouelo son uiiectamente inteipietables como uifeiencias ue meuias fiente al giupo o categoiia que se consiueie como iefeiencia (uifeiencia ue meuias=u paia ese giupo, ya que l es el %#$H* o iefeiencia). ! Paia vaiiables uepenuientes uicotomicas (sino) como poi ejemplo habeise vacunauo o no, tenei hipeitension (pievalencia) o usai el cintuion ue seguiiuau, se usai la iegiesion logistica. Los coeficientes bi que piopoiciona este mouelo iequieien sei exponenciauos paia que sean inteipietables. El exponencial (e b ) uel coeficiente coiiesponue a la ouus iatio (0R) ue ese giupo o categoiia iespecto a la iefeiencia (0R=1 paia ese giupo ue iefeiencia) 89[:. ! Paia vaiiables uepenuientes uel tipo &3$"7*!/(%&(!#+!$T$+&* se elegii la iegiesion ue Cox (7'*7*'&3*+(H! /(O(',%! "*,$HS. Poi ejemplo, se uebei usai la iegiesion ue Cox en los anlisis ue supeivivencia o en estuuios longituuinales uonue se uesee valoiai la inciuencia ue nuevos casos ue enfeimeuau en funcion ue una seiie ue caiacteiisticas basales. Tambin se suele usai en los ensayos ue campo (pievencion piimaiia). Como con la iegiesion logistica, los coeficientes bi que piopoiciona este mouelo iequieien sei exponenciauos paia que sean inteipietables. El exponencial (e b ) uel coeficiente coiiesponuei ahoia a la hazaiu iatio (BR) ue ese giupo o categoiia iespecto a la iefeiencia (BR=1 paia ese giupo ue iefeiencia) 899:. * Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 49 *b"+%-".*40-'1,(#1(2-%.*4H.*0.(+".6* * * * * * * * * * * * * * * * * * * * * * * * ;<=>?@<=AB>*a>Q;<A>L>* Se suele abusai en la investigacion en saluu pblica ue las piuebas ue significacion estauistica (valoies p uel contiaste ue hipotesis). Bebeiia uaise mayoi impoitancia a los inteivalos ue confianza que constituyen una alteinativa mucho ms uiiecta y fcil ue entenuei. Las noimas STR0BE (;&'$+0&/$+3+0! &/$! @$7*'&3+0! *5! *P%$'T(&3*+(H!%&#,3$%!3+!=73,$"3*H*02!;&(&$"$+&) inuican explicitamente que al esciibii aiticulos sobie estuuios epiuemiologicos obseivacionales se piesenten las meuiuas ue asociacion ajustauas y acompaauas ue sus inteivalos ue confianza. Los inteivalos ue confianza habitualmente usan el concepto fiecuencista ue piobabiliuau. Existen otia coiiiente uistinta ue la fiecuencista paia uefinii la piobabiliuau: la filosofia bayesiana. Poi ejemplo, paia la piobabiliuau ue obtenei caia al tiiai una moneua, la uefinicion fiecuencista mantiene que las piobabiliuaues son los limites a los que tienue la piopoicion con la que salui caia si la moneua se lanzase infinitas veces. Peio nauie ha lanzauo una moneua infinitas veces. En cambio, la filosofia bayesiana maneja la piobabiliuau como un concepto %#PG$&3T*. Se tiata ue aauiile a la inteipietacion fiecuencista el giauo ue ceiteza pievia uel investigauoi. Se usa la ceiteza pievia paia matizai el iesultauo obteniuo en una muestia pequea. El giauo ue cieuibiliuau que se tiene ue antemano sobie un fenomeno y hasta qu punto se est uispuesto a pieuecii caua posible valoi uel iesultauo en la muestia se integia con los iesultauos obseivauos iealmente en la muestia. Asi, paia el planteamiento bayesiano seiia muy poco cieible ue antemano que llevai pieicing piotegiese fiente a la hepatitis, peio seiia muy cieible que comei menos llevase a auelgazai. Esta cieencia se foimaliza y se integia cuantitativamente paia matizai a la baja o al alza los iesultauos iealmente obseivauos en la muestia. La expiesion ms geneial y simple seiia:
odds posterior = odds a priori x Factor Bayes
La ouus posteiioi seiia el iesultauo uel anlisis bayesiano. La ouus pievia seiia subjetiva (la cieencia que se tiene antes ue iniciai el estuuio). El Factoi Bayes se obtiene Universidad de Navarra Dpto. M. Preventiva y Salud Pblica Su a paitii ue los uatos iecogiuos en la muestia. Esta expiesion iecueiua a la que se piesenta en el capitulo 8 paia las piuebas uiagnosticas, peio se amplia tambin a los uems tipos ue anlisis estauistico. Existen mtouos sencillos y que no iequieien ningn %*5&1('$ especial paia calculai inteivalos ue confianza con pioceuimientos bayesianos apioximauos 89E:. * C;O;C;LBA><* * (1) Pencheon D, Guest C, Melzer D, Gray AM. Oxford handbook of public health. N. York: Oxford University Press, 2001;13. (2) Martnez-Gonzlez MA, Snchez-Villegas A, Fauln Fajardo FJ (eds.). Bioestadstica amigable. 2 ed. Madrid: Daz de Santos, 2006. (3) Sents J, Pardell H, Cobo E, Canela J. Bioestadstica. 2 ed. Barcelona: Masson, 1995. (4) de Irala J, Martnez-Gonzlez MA, Segu-Gmez M. Epidemiologa aplicada. 2 ed. Barcelona: Ariel, 2008. (5) Carrasco JL, Hernn MA, Martn-Hortelano C. El mtodo estadstico en la investigacin mdica. Madrid: Ciencia, 1995. (6) Rothman KJ, Greenland S, Lash TL. Modern Epidemiology, 3 ed. Filadelfia: Lippincott Williams & Wilkins, 2008. (7) Ware JH, Mosteller F, Delgado F, Donnelly C, Ingelfinger JA. P Values. En: Bailar JC III, Hoaglin DC (eds.). Medical uses of statistics, 3 ed. Boston: New England Journal of Medicine, 2009. (8) de Irala J, Martnez-Gonzlez MA, Guilln-Grima F. Qu es un factor de confusin? Med Clin (Barc.) 2001;117:377-85. (Fe errores: Med Clin (Barc.) 2001;117:775). (9) de Irala J, Martnez-Gonzlez MA, Guilln-Grima F. Qu es una variable modificadora del efecto? Med Clin (Barc.) 2001;117:297-302. (10) Martnez-Gonzlez MA, de Irala J, Guilln-Grima F. Qu es una odds ratio? Med Clin (Barc.) 1999;112:416-22. (11) Martnez-Gonzalez MA, Alonso A, Lpez-Fidalgo J. Qu es una hazard ratio? (nociones de anlisis de supervivencia). Med Clin (Barc.) 2008;131:65-72. (12) Martnez-Gonzlez MA, Segu-Gmez M, Delgado-Rodrguez M. Cmo mejorar los intervalos de confianza? Med Clin (Barc.) 2009;135:30-4.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S1 10. INTRODUCCIN AL METANLISIS (adaptado del compendio de salud pblica)
El metanalisis se usa para combinar mltiples estudios que intentan contestar todos a la misma pregunta de investigacin. El trmino metaanlisis precede cronolgicamente al concepto de revisin sistemtica. Lo acu el psiclogo Glass en 1976 para definir un conjunto de tcnicas que se utilizan para cuantificar la informacin contenida en estudios similares que valoran una misma pregunta de investigacin. La revisin sistemtica es definida por la colaboracin Cochrane como una sntesis de los resultados de varios estudios primarios mediante tcnicas que limitan los sesgos y el error aleatorio. En la actualidad el trmino metaanlisis se reserva para denominar las tcnicas estadsticas de combinacin de resultados, mientras que en el pasado inclua tambin la nocin de revisin sistemtica.
SESGO DE PUBLICACIN Lo ms frecuente es que los investigadores que desean combinar los estudios realizados sobre un tema se basen en estudios publicados y aunque intenten sacar a la luz los no publicados, los publicados tendrn siempre ms probabilidad de ser localizados. El sesgo de publicacin se origina cuando lo que se publica no es representativo de lo que se investiga. La trascendencia de este sesgo es grande para investigadores y lectores: si lo que aparece no representa la realidad, se est distorsionando el propio proceso de aprendizaje. Por eso es importante saber si este sesgo se presenta y cules son las razones que favorecen su presencia. Este sesgo no slo reside en evaluadores y comits editoriales de las publicaciones cientficas, tambin reside en los autores, que muchas veces son los primeros en decidir no enviar sus investigaciones a publicar: por considerar que esos resultados tienen poco inters, por no tener la propiedad de los datos (estudios financiados por la industria, que puede buscar que los resultados que no la favorecen permanezcan en el anonimato), o por sesgos (en diseo o ejecucin) que comprometen la validez de un estudio. Los hechos que se conocen que influyen en la presencia del sesgo de publicacin son: ! Significacin estadstica del resultado. Es el ms importante y en el que se basan los procedimientos estadsticos para identificar la presencia del sesgo. Los resultados significativos suelen ser los primeros en publicarse. ! Caractersticas de la investigacin realizada: algunas de ellas se asocian con una probabilidad diferencial de publicacin: los estudios aleatorizados y los multicntricos se publican ms. Los de gran tamao muestral rara vz dejan de publicarse. Los estudios grandes suponen un mayor esfuerzo en su diseo y ejecucin y los autores ponen un mayor inters en que los resultados no permanezcan ignorados, ya sean positivos o negativos. ! La fuente de financiacin se asocia con la publicacin. El conflicto de inters puede dar lugar a publicaciones engaosas o maquilladas y dar pie a que cierta documentacin tenga ms probabilidad de ser publicada. Un ejemplo de ello es el papel desempeado por la industria tabaquera al investigar los efectos del tabaquismo pasivo (se recoga la informacin que resultaba menos perjudicial para la industria). ! El prestigio de la institucin puede jugar un papel en el sesgo de publicacin. Un ejemplo histrico de esto es el artculo de Levin (1) sobre la relacin entre tabaco y cncer de pulmn, retenido por el director de JAMA ante la desconfianza surgida por lo novedoso del diseo (uno de los primeros estudios de casos y controles de la historia), hasta que lleg a sus manos un estudio similar (de Wynder y Graham), firmado por un cirujano de prestigio Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S2 mundial (Graham), conocido por sus innovaciones. Public los dos estudios en el mismo nmero, pero primero el de Wynder y Graham (2). ! Prejuicio: aqu el proceso editorial tiene ms responsabilidad. Por ejemplo, en la relacin entre el consumo de cocana en el embarazo y riesgo fetal se ha comprobado que los trabajos que no hallan un efecto nocivo sobre el feto se rechazan con ms frecuencia, a pesar de que su calidad es similar a los restantes: as se est juzgando la metodologa por los resultados, con resultados no crebles el evaluador minusvalora los mtodos. ! Regresin a la media: El sesgo de publicacin se ha intentado justificar parcialmente como un fenmeno de regresin a la media. Los primeros artculos sobre una misma pregunta de investigacin, por su mayor novedad, son ms fcilmente aceptados, que los que a continuacin se remiten para su publicacin, y en los que se pueden manifestar con mayor intensidad los aspectos mencionados con anterioridad. En previsin de que un determinado estudio pase en el futuro a formar parte de un metaanlisis ha supuesto la implantacin en muchas revistas de las normas CONSORT, para los que quieran publicar un estudio de intervencin, y posiblemente ocurrir lo mismo con las normas STARD para pruebas diagnsticas o las normas STROBE para estudios observacionales. Las normas PRISMA son las actualmente vigentes para escribir una revisin sistemtica. http://www.prisma-statement.org/
Debieran hacerse esfuerzos para que toda investigacin con un mnimo de calidad se publicase, con independencia de la significacin de sus resultados, pero el papel se vende caro. Una opcin futura es la edicin electrnica (internet). El registro de ensayos intenta monitorizar todo ensayo clnico en marcha para identificar los que finalmente se publican y los qu ese esconden, aunque esto tambin tiene sus limitaciones. Puede haber un conflicto de intereses, por ejemplo, si un organismo privado prefiere que se ignore que un estudio est en marcha (no infrecuente en salud laboral) o cuando se esperan beneficios econmicos en el desarrollo de nuevos frmacos. Tambin hay ventajas: valorar el sesgo de publicacin, defender los derechos en ser el primero en investigar un tema, conocer a otros que trabajan en temas relacionados, etc. El sesgo de publicacin puede ser muy grave. Hay que cuantificarlo. Existen varios procedimientos para ello: ! Representacin del ln RR y su intervalo de confianza frente al tamao de muestra del estudio. Si se coloca el ln RR en el eje de ordenadas, se obtendr la imagen de un embudo (funnel plot), con la parte ms estrecha dirigida a la derecha (ms precisin cuando el tamao de muestra es mayor). La existencia una figura simtrica alrededor de un eje que pasa por el valor ponderado del RR habla en favor de la ausencia de este error. Cuando se coloca el ln RR en el eje de abscisas se obtiene una imagen similar a un rbol de navidad. Obsrvese en la figura de la derecha que faltan estudios pequeos con RR alrededor de la unidad.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica SS
! Clculo del nmero probable de estudios no publicados: requieren asumir supuestos ms o menos subjetivos en su aplicacin. Se puede estimar el nmero de estudios con resultados no significativos que se necesitaran para hacer que una asociacin global significativa se hiciera no significativa estadsticamente (mtodo de Rosenthal). Tambin se pueden aplicar otros mtodos como estrategias de remuestreo asumiendo que los estudios encontrados con resultado no significativo son una muestra representativa de todos los que se han hecho (publicados o no). ! El mtodo de Egger (Eggers method) es un procedimiento para detectar un sesgo de publicacin. Consiste en una regresin lineal simple de la magnitud del efecto dividida por su error estndar sobre el inverso del error estndar.
MTODOS DE COMBINACIN Se pueden combinar los resultados publicados (metanlisis convencional) o combinar las bases de datos (pooled analysis). En este ltimo caso, el anlisis estadstico es el habitual, salvo que es conveniente incluir en los modelos multivariables una variable que identifique al estudio. Este apartado se dedicar a la combinacin de datos procedentes de estudios publicados. Las tcnicas estadsticas de metaanlisis generan varios problemas: ! Se puede asumir que el efecto producido por la exposicin sea constante de estudio en estudio (modelo de efectos fijos, MEF) o, por el contrario, tenga una distribucin al azar a lo largo de los distintos estudios (modelo de efectos aleatorios, MEA). ! Los estudios individuales de un metaanlisis pueden no ser independientes, ya que los ltimos pueden iniciarse tras conocer los resultados de los primeros. Es un autntico problema: la investigacin actual se apoya en la del pasado. ! Existe una tendencia a encontrar resultados estadsticamente significativos conforme el nmero de estudios aumenta, aunque no favorezcan la asociacin. Por ello, se recomienda que el nivel de significacin (riesgo alfa) sea como mnimo del 1%. No obstante, la mayora de los metaanlisis calculan intervalos de confianza del 95%. Sea cual sea el procedimiento que se aplique, cada estudio proporcionar el mismo parmetro, #i. Lo ms habitual es que este parmetro sea el logaritmo neperiano de una medida multiplicativa de asociacin (riesgos relativos, odds ratios, etc). Lo que se hace viene a ser una media ponderada de los parmetros de todos los estudios. Recurdese que una media ponderada supone multiplicar cada dato por un peso y dividir la suma de estos productos por la suma de los pesos. Por ejemplo si un alumno obtuvo un 4 en el examen final un 8 en el examen parcial, y un 85 en unos tests de clase, y los pesos son del 60% para el examen final y del 20% para las otras dos notas, su media ponderada (Mp) ser: Mp = w i x i ! w i ! = (0, 6" 4) +(0, 2"8) +(0, 2"5) 0, 6 +0, 2 +0, 2 = 5 Del mismo modo, cuando se hace un metaanlisis lo que se combinan no son notas, sino los resultados de diferentes estudios epidemiolgicos, utilizando un criterio de ponderacin, es decir unos pesos llamados wi
: #p = ($ wi#i)/$ wi
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S4 MTODOS PARA VARIABLES DICOTMICAS: MODELO MULTIPLICATIVO Son mtodos que se basan en la nocin de riesgo relativo (RR). En este caso, el parmetro #i ser el logaritmo neperiano del RR (o de la OR) en cada estudio, de ah el subndice i. Mtodo del inverso de varianza Como ejemplo se expone el caso de la odds ratio (OR), que es lo ms utilizado en metaanlisis. Para la combinacin de resultados, dado que la OR (al igual que el RR) no sigue una distribucin normal, se transformar logartmicamente. Por tanto, en el caso de que se use la OR, el parmetro #i corresponder al logaritmo neperiano de la OR en cada estudio, es decir #i = lnORi. ! i = ln(OR i ) Por ejemplo, para el primer estudio de la tbla 10.1, el parmetro #i corresponder a ! i = ln(0, 96) = !0, 04 Cada estudio proporciona un ln(ORi). Pero adems debe extraerse su varianza. La varianza de ln(OR) se puede obtener a partir de los intervalos de confianza al 95% de la OR (mejor si est ya ajustada por factores de confusin). Los estudios donde se ofrecen estimaciones ajustadas (controlando por uno o ms factores de confusin), suelen proporcionar tambin el intervalo de confianza de la OR. En esta situacin, se calcula la varianza con la ecuacin var (ln OR)= [(ln ORs - ln ORi)/3,92] 2 , siendo ORs y ORi los lmites superior e inferior de confianza de la OR. Esto es as porque 3,92 es el doble de 1,96 y 1,96 es el valor z de la distribucin normal para un intervalo de confianza al 95%. Por ejemplo, en el primer estudio de la tabla 10.1, la varianza de ln(OR1) sera var(lnOR) = ln(1, 28) !ln(0, 73) 3, 92 " # $ % & ' 2 = 0,143 2 = 0, 0205
Tabla 10.1. Descenso de la colesterolemia por dieta y medicacin y mortalidad: estudios de prevencin primaria
Estudio
Tto. experimental / tto. control Gr. experimental Grupo control OR Viven (b) Mueren(a) Viven (d) Mueren (c) LA Veterans Dieta especial / convencional 250 174 245 177 0,96 (0,73-1,28) Minnesota Dieta especial / convencional 2039 158 2044 153 1,04 (0,82-1,31) OMS Clofibrato / placebo 5203 128 5209 87 1,47 (1,11-1,96) Upjohn Colestipol / placebo 531 17 519 27 0,62 (0,31-1,19) Lipids Colestiramina + dieta / placebo + dieta 1838 68 1829 71 0,95 (0,67-1,36) Helsinki Gemfibrozil + dieta / placebo + dieta 2006 45 1988 42 1,06 (0,68-1,66) Fuente: adaptado de 3.
Se usa como criterio de ponderacin el inverso de la varianza. w i = 1 var(lnOR i )
El peso para el primer estudio sera w i = 1 0, 0205 = 48, 8 As se va haciendo para todos los estudios como muestra la tabla 10.2.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica SS Tabla 10.2. Varianzas y pesos del ejemplo de la Tabla 10.1 en la aplicacin del mtodo del inverso de la varianza.
Estudio
OR
ln (OR) V (ln OR) = [(lnORs-lnORi)/3,92] 2
Peso (1/V) Peso % del total LA Veterans 0,96 -0,041 0,0205 48,73 48,73x100/224,7= 21,7 Minnesota 1,04 0,039 0,0143 70,02 31,2 OMS 1,47 0,385 0,0210 47,53 21,2 Upjohn 0,62 -0,478 0,1177 8,49 3,8 Lipids 0,95 -0,051 0,0326 30,66 13,6 Helsinki 1,06 0,058 0,0518 19,29 8,6 Total = 224,7 Total = 100%
Al final se calcula una media ponderada, que equivaldr al logaritmo neperiano de la OR combinada (ln(ORp)). ln(ORp) = w i ! i ! w ii !
Siendo ORp la odds ratio ponderada. ln(ORp) = (48, 73!"0, 041) +... +(19, 29!0, 058) 48, 73+... +19, 29 = 0, 065 Para pasar de lnORp a ORp ser necesario realizar la transformacin antilogartmica. ORp = e ln(ORp) = e 0,065 =1, 07 El siguiente paso es calcular un intervalo de confianza a la ORp. Para eso se requiere su varianza (la del estimador combinado final). La varianza del logaritmo natural de la ORp es igual al inverso de la suma de los pesos de cada OR, V(ln ORp)= 1/($ wi). El intervalo de confianza de la ORp es = ORp%EXP [ z&/2'V (ln ORp)], siendo z&/2 = 1,96 si se quiere una confianza del 95%. IC95%= ORp!e z!/2 Vp =1, 07!e 1,96 1 224,72 = 0, 94"1, 22
La significacin global del parmetro se puede estimar dividiendo el logaritmo natural del ORp por su error estndar, zasoc = ln ORp/[V(ln ORp)]^0,5, que sigue una distribucin Normal (0,1). Se puede apreciar, no obstante, que el resultado no es significativo porque el intervalod e confianza al 95% (0,94-1,22) comprende el valor nulo (OR=1). El grado de homogeneidad se valora mediante el estadstico Q
Cuanto mayor sea el estadstico Q, ms argumentos habr para hablar de heterogeneidad. Q sigue una distribucin ( 2 con (k - 1) grados de libertad, siendo k el nmero de estudios (5 grados de libertad en el ejemplo). Para cada valor de chi cuadrado (con sus respectivos grados de libertad) corresponde un valor p de significacin estadstica. En Stata display chi2tail(5,8.4) devolver p = 0.136 Cuanto mayor sea la chi cuadrado obtenido (chi cuadrado=Q), menor (ms significativo) ser el valor p. El punto de corte para detectar heterogeneidad se sita en el 10% (p = 0,1) y no en el clsico 5% (p = 0,05). Aqu en el ejemplo no se cuenta con pruebas para rechazar la homogeneidad, ay que p = 0,136. Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S6 Tabla 10.3. Resumen de la ponderacin por inverso de la varianza (modelo de efectos fijos). Objetivo Estimacin Ponderacin resumen, #p ! ! = i i i p w w" " ) ( 1 i i Var w ! = Error estndar de #p ! = i p w EE 1 ) (" Intervalo de confianza de #p ) ( 2 / p p EE z ! ! " # Significacin estadstica de #p ) ( p p EE z ! ! = Heterogeneidad, Q ( ) ! " = 2 p i i w Q # # ( 2 con k 1 grados de libertad. k = nmero de estudios Si se ponderan RD, #p = RDp, #i = RDi y wi = 1/Var(RDi) Si se ponderan RR, #p = ln(RRp), #i = ln(RRi) y wi = 1/Var(ln RRi)
Mtodo de efectos aleatorios (MEA) de DerSimonian Laird Se puede incorporar explcitamente la variabilidad entre estudios y asumir un modelo de efectos aleatorios (MEA: se le llama mtodo de DerSimonian Laird, Tabla 10.4), en vez de un MEF, como hasta ahora se ha hecho. Ahora se calcular la varianza entre estudios () 2 ).
tau 2 = (8,4-6+1) / (224,7-(10920/224,7)) = 0,019 Los valores negativos de tau 2 se asume que son cero. El peso de cada investigacin vendra dado ahora por: w*i= 1/(Vi + ) 2 ). Esto supondra que la ORp * = $ (w*iORi)/$ w*i. La varianza y el intervalo de confianza se estiman como en el caso anterior, cuando no se tuvo en cuenta la variabilidad entre estudios. En el presente caso se sustituira wi por w*i. En la Tabla 10.4 se resumen las varianzas de cada estudio, sus pesos, y los nuevos pesos tras la comprobacin de que ) 2 = 0,019.
Tabla 10.4. Varianzas y pesos del ejemplo de la Tabla 11.6 en la aplicacin del modelo de efectos aleatorios () 2 = 0,019). Estudio V (ln OR) Peso* = [1/(V+) 2 )] %Peso LA Veterans 0,0205 25,15 20,88 Minnesota 0,0143 29,84 24,77 OMS 0,0210 24,83 20,61 Upjohn 0,1177 7,30 6,06 Lipids 0,0326 19,29 16,01 Helsinki 0,0518 14,07 11,68
( ) ! " ! # $ ! % ! & ' ( + ( = ) ) ) i i i w w w K Q mx / 1 , 0 . 2 2 * Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S7 Tabla 10.5. Resumen de la ponderacin por inverso de la varianza (modelo de efectos aleatorios de DerSimonian Laird). Objetivo Estimacin Ponderacin resumen, #p
Q, wi y k como en la Tabla 11.3. Error estndar de #p
Intervalo de confianza de #p
Significacin estadstica de #p
Heterogeneidad, Q
( 2 con k 1 grados de libertad
Como ya se ha mencionado, ) 2 > 0 y se puede aplicar el MEA. Se recalculan los pesos. En primer lugar se aprecia que los pesos son menores que en el MEF, lo que se traducir en una mayor varianza (recuerde, el inverso de la suma de los pesos) y un intervalo de confianza mayor. Se comprueba tambin que las diferencias en la importancia de los estudios se han amortiguado: con los pesos originales el estudio Minnesota era siete veces ms influyente que el de Upjohn (72,5 frente a 10,0), mientras que con la nueva ponderacin, es algo superior a tres (27,1 frente a 8,1). Se concede con el MEA una mayor importancia relativa a los estudios pequeos. Con el MEA, la ORp = 1,05 y un intervalo de confianza ms amplio que con el MEF, e igualmente no significativo (0,88-1,26). Al descender el valor de los pesos, la prueba de homogeneidad Q se hace ms pequea, Q = 5,2, p = 0,39. Es ms difcil encontrar heterogeneidad con el MEA.
Estrategia general de anlisis La eleccin entre una medida basada en el RR o en la diferencia de riesgos depende de los objetivos de la investigacin, pero anundan mucho ms los metanlisis basados en el RR. En los estudios observacionales (cohortes, casos y controles) el mtodo del inverso de la varianza permite combinar parmetros (p.ej. RR) ajustados. Hay otros mtodos como el de Mantel-Haenszel y el de Peto que obligan a utilizar directamente los datos brutos de cada casilla de la tabla 2x2, y es probable que haya sesgo de confusin. Esto supone que los mtodos Mantel- Haenszel y Peto se recomienden slo para los estudios experimentales, donde ae puede asumir que al aleatorizar la exposicin se ha conseguido prevenir la confusin. Con respecto a la disyuntiva de utilizar el MEF o el MEA, se insiste en que la eleccin debe especificarse a priori y no tras conocer los resultados. Es muy comn empezar por un MEF (mucho ms restrictivo a la hora de considerar la heterogeneidad, ya que es ms fcil detectarla con este procedimiento) y esto basta ! ! = * * i i i p w w " " 2 * ) ( 1 ! " + = i i Var w ! ! " ! ! # $ ! ! % ! ! & ' ( + ( = ) ) ) i i i w w w K Q 2 2 1 , 0 max * ! = * 1 ) ( i p w EE " ) ( 2 / p p EE z ! ! " # ) ( p p EE z ! ! = ( ) ! " = 2 * p i i w Q # # Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S8 si no hay heterogeneidad; por el contrario, si hay heterogeneidad se recurre al MEA. A priori se recomienda el MEA cuando el nmero de estudios es pequeo (< 20).
El MEA asume que slo se dispone de una muestra de los estudios existentes, asuncin ms realista que tener todo el universo de estudios, como subyace en el MEF. El MEA introduce un trmino de variabilidad adicional y aumenta la varianza del estimador resumen, ampliando el intervalo de confianza final. Esto es una ventaja no desdeable, ya que uno de los inconvenientes que se han sealado en el metaanlisis es la facilidad de obtener intervalos de confianza exageradamente estrechos y resultados estadsticamente significativos. Sin embargo, la desventaja del MEA es que el mismo coeficiente de variabilidad se aade por igual a cada estudio, lo que hace que se acabe concediendo una mayor importancia relativa a los estudios pequeos frente a los grandes, lo que supone que el MEA se influye ms por los errores que afectan a los estudios pequeos, como el sesgo de publicacin. Algunos autores recomiendan que se haga un anlisis de sensibilidad, siempre y cuando sea posible, y combinar los resultados de las distintas investigaciones por ms de un mtodo. Si los distintos anlisis coinciden, queda ms clara la robustez de la inferencia.
ESTUDIO DE LA HETEROGENEIDAD Siempre debe realizarse un anlisis de la heterogeneidad. Lo ms habitual es usar el estadstico Q. Si el estadstico Q es grande y tiene un valor p significativo o prximo a la significacin surgirn dudas sobre la homogeneidad de los estudios y la capacidad de combinarlos se pone en tela de juicio. La sntesis de estudios realizados en diferentes lugares y tiempos, sobre distintas poblaciones y con diseos diferentes, con frecuencia da lugar a que los resultados sean estadsticamente diferentes entre s. Esta heterogeneidad no puede ignorarse. Supngase que todos los resultados de los estudios individuales son ciertos, sin sesgos, y existe una marcada heterogeneidad; aqu el clculo de una medida resumen que promediara de algn modo los diferentes estudios no aporta nada (ms bien confunde). El conocimiento del promedio entre los diferentes estudios no permite apreciar la riqueza de la variabilidad existente y lo ms acertado sera investigar cules son las razones para que se produzcan resultados contradictorios. El metaanlisis slo debe sacar un denominador comn slo cuando de verdad ste existe. Un inconveniente grave del anlisis de la heterogeneidad es que la mayora de sus pruebas estadsticas no tienen una potencia estadstica adecuada, especialmente cuando hay pocos estudios; por ello, el no rechazar la hiptesis de homogeneidad no implica que no exista heterogeneidad. Una alternativa interesante al estadstico Q es el estadsitco I 2 que cuantifica el efecto de la heterogeneidad, proproporcionando una medida del grado de inconsistencia en los resultados de los diferentes estudios. I 2 describe el porcentaje de la variabilidad total entre estudios que es debida a heterogeneidad en vez de ser debida al azar. I 2 se puede calcular como
I 2 = 100%"(Q - gl)/Q
donde Q es la cantidad antes presentada y gl son los grados de libertad. En el ejemplo
I 2 = 100"(8,4 -5)/8,4 = 40.4% para el MEF
I 2 = 100"(5,2 -5)/5,2 = 3.8% para el MEA Universidad de Navarra Dpto. M. Preventiva y Salud Pblica S9 Los valores negativos de I 2 se asume que son cero. Eso permite que el rango de valores para I 2 est entre el 0% y el 100%. Un valor del 0% indica que no se observa heterogeneidad; en cambio valores grandes muestran nivelkes crecientes de heterogeneidad (3).
En el anlisis de la heterogeneidad se debe partir de una reflexin acerca de cules pueden ser las variables que pueden ejercer una influencia diferencial: variables de diseo, exposicin, efecto, u otros factores de riesgo (variables de persona, tiempo y lugar, etc.). A continuacin se puede proceder de varias maneras: ! Anlisis estratificado: se repite el metaanlisis en cada uno de los estratos. Si desaparece la heterogeneidad dentro de los estratos es razonable pensar que esa variable influye. El inconveniente que presenta esta estrategia es que puede resultar poco eficiente si hay muchos estratos y el nmero total de estudios es pequeo. ! Metarregresin: Suele ser ms eficiente que la tcnica anterior. En ella se utiliza como variable dependiente la magnitud del efecto que se valora con una o varias variables independientes: ln OR = *0 + $*ixi. Las tcnicas de metarregresin trabajan con datos agregados y por lo tanto estn sometidas a los problemas de la falacia ecolgica. ! Metaanlisis acumulado: es menos sensible que las anteriores para la identificacin de la heterogeneidad. ! Anlisis de influencia: El anlisis de la heterogeneidad, en ocasiones, no revela ninguna causa, sino que sugiere que tal heterogeneidad puede ser debida a un error aleatorio, motivado porque una o varias investigaciones encuentran valores que difieren de la media. Son valores extremos sin ninguna razn aparente. Un anlisis de influencia puede ser aconsejable: consiste en repetir el anlisis con y sin ellos. Si el resultado significativo depende de ellos, hay que ser cauto en la inferencia. Tambin puede cambiarse el peso de esos estudios y comprobar qu sucede. ! Anlisis de sensibilidad: puede hacerse de varias maneras: cambiando los criterios de inclusin de los estudios que se combinan (generalmente caractersticas metodolgicas) y, si se corrigieron errores, variando los criterios utilizados para corregirlos.
GRFICO DE BOSQUE (FOREST PLOT) El grfico de bosque o forest plots es el modo habitual de presentar un meta-anlisis y est diseado para mostrar los riesgos relativos (u odds ratios) de mltiples estudios que intentan contestar todos a la misma pregunta de investigacin. Inicialmente se us slo para mostrar los resultados de diversos ensayos. En los ltimos 20 aos est siendo aplicad tambin a estudios observacionales. Los forest plots pueden adoptar diversas configuraciones, pero normalmente se presentan como una lista situada a la izquierda con los nombres (muchas veces en orden cronolgico) de cada uno de los estudios recogidos, seguida de unas figuras para cada estudio que incluyen unas barras laterales (intervalo de confianza) en torno a un pequeo cuadriltero central (estimacin puntual del RR), todo este grfico est situado a la derecha del nombre del cada estudio. Las barras de confianza son horizontales. El grfico puede representarse en escala logartmica cuando se usen odds ratios u otras medidas multilicativas porque slo as los intervalos de confianza sern simtricos en torno a la estimacin puntual (RR u OR de cada estudio). De lo contrario, podra darse mucha importancia indebidamente a la parte del intervalo de confianza que es superior a 1, mientras que se le da poca importancia a la inferior a 1 (ya que todo su margen de movilidad quedara meramente entre 0 y 1). El rea de cada cuadriltero suele ser proporcional al peso que tiene el estudio. Se representan dos lneas verticales, una es la correspondiente al nulo (RR=1) y otra corresponde Universidad de Navarra Dpto. M. Preventiva y Salud Pblica 6u a la estimacin combinada (ORp, por ejemplo) que resulta del metanlisis. Estas lenas cruzan todos los estudios. Al final, en la parte inferior se representa como un rombo la estimacin combinada global del metaanlisis. El rombo abarca el intervalo de confianza de la ORp.
REFERENCIAS (1) Levin ML, Goldstein H, Gerhardt PR. Cancer and tobacco smoking: a preliminary report. JAMA 1950;143, 336338. (2) Wynder EL, Graham EA. Tobacco smoking as a possible etiologic factor in bronchiogenic carcinoma. A study of six hundred and eighty-four proved cases. JAMA 1950;143, 329336. (3) Higgins JPT, Thompson SG, Deeks JJ, Altman DG. Measuring inconsistency in meta-analyses BMJ 2003; 327: 557560.
Calidad metodológica y estándares de publicación de ensayos clínicos en salud y psicología: Teoría y una experiencia de evaluación de calidad de investigaciones