Beruflich Dokumente
Kultur Dokumente
Epidemiologa y metodologa
cientfica aplicada a la pediatra
(VI): Confusin e interaccin
G. Sols Snchez,
G. Orejas Rodrguez-Arango*
An Esp Pediatr 1999;51:91-96.
Introduccin
La bsqueda de una relacin causal entre una variable independiente, o factor de estudio, y una variable dependiente, o desenlace, es la base de la mayora de los estudios de investigacin en clnica. Sin embargo, la demostracin de que una enfermedad se relaciona estadsticamente con cierta caracterstica
biolgica o social es solo el primer paso en el estudio epidemiolgico, ya que tras conocer que existe dicha relacin es necesario indagar su significado y validez(1-5).
Se puede definir causa como un suceso, condicin o caracterstica que precede a un desenlace y sin la cual dicho desenlace puede no aparecer en absoluto o aparecer por otro motivo, en otro momento o de otra forma determinada. Hablamos
de causa necesaria si el suceso, condicin o caracterstica es
imprescindible para que el desenlace ocurra, y hablamos de causa suficiente si el suceso, condicin o caracterstica da lugar al
desenlace, sea o no sea imprescindible para el mismo(1).
La idea de que una nica causa produce un nico efecto es
excesivamente sencilla. Actualmente sabemos que un desenlace se suele producir por la intervencin de varios factores o componentes, y que un factor concreto puede ser el origen de varios
desenlaces o enfermedades. En este sentido, otra definicin de
causa suficiente sera el conjunto mnimo de condiciones o sucesos que inevitablemente producen el evento.
Una caracterstica importante de la causalidad es que aunque dos factores estn asociados de forma muy importante desde el punto de vista matemtico, esto no quiere decir que uno
sea la causa del otro. Una buena correlacin no indica causalidad y la mayora de las asociaciones estadsticas no son causales en el sentido exacto de la definicin(6,7). As, entre dos variables podemos establecer distintas relaciones:
1.- No relacin: Ambas variables son independientes, sin
que se pueda establecer ninguna relacin entre ellas.
2.- Relacin esprea por azar: Falsa relacin que se encuentra entre ambas variables y se debe al azar.
3.- Relacin esprea por sesgos o errores: Falsa relacin
que se establece entre ambas variables, debida a otros factores, a un mal diseo o a algn agente externo a las variables estudiadas.
Servicio de Pediatra. Hospital de Cabuees (Insalud). Gijn. *ClinamatMedycsa. Madrid.
Correspondencia: Dr. Gonzalo Sols. Servicio de Pediatra.
Hospital de Cabuees. Cabuees s/n. Gijn.
VOL. 51 N 1, 1999
4.- Relacin causal: La relacin existente entre ambas variables es, realmente, causal: una provoca la aparicin de la
otra.
La relacin causal ha sido estudiada y discutida desde el
siglo pasado. Los criterios de causalidad de Bradford Hill, ya
expuestos en un artculo previo de esta serie, supusieron un
paso importante en esta teora de la causalidad y, todava hoy,
estn vigentes(2,8,9): fuerza de la asociacin, consistencia, temporalidad, especificidad, gradiente biolgico, plausibilidad, coherencia, evidencia experimental y analoga. Hill afirm que ninguna de estas caractersticas eran evidencia indiscutible de causalidad y que ninguna era condicin sine qua non para la misma. Sin embargo, actualmente, se considera la temporalidad como una caracterstica obligatoria para determinar causalidad: la
causa debe preceder en el tiempo al desenlace. Muchos autores han discutido y reevaluado estos criterios, pero su esquema
bsico se mantiene invariable(5,7).
91
Variable
dependiente
Factor de estudio
Variable
dependiente
Tabla I
Factor de estudio
Factor de confusin
Tabla global
Factor de estudio
Variable
dependiente
Variable
dependiente
Variable
dependiente
Variable
posterior
Factor de estudio
Variable intermedia
Factor de estudio
Variable no controlada
Variable dependiente
Factor de estudio
bre la variable dependiente, pero sin relacin con el factor de estudio. Su no inclusin en el estudio no provoca sesgos en la
estimacin de la relacin entre ellos, pero conducen a modelos
con escasa capacidad predictiva.
Por ltimo, las variables posteriores a la variable dependiente pueden conducir a errores en el establecimiento de relaciones
causales. Su inclusin en un estudio puede provocar situaciones
similares a las de los factores de confusin o de los factores modificadores de efecto. Desgraciadamente, con frecuencia es muy
difcil conocer si una variable es anterior o posterior a un desenlace.
En los estudios experimentales estas terceras variables pueden ser controladas con la asignacin aleatoria del factor de
estudio, sobre todo si la muestra de sujetos es suficientemente
grande(10). Sin embargo, en los estudios observacionales analticos, estas terceras variables no pueden ser controladas a no ser
que se conozcan previamente al estudio y se tengan en cuenta
en el anlisis(2).
Las formas de controlar terceras variables en los estudios observacionales son la restriccin de poblacin, la estandarizacin
de riesgos, el emparejamiento, la estratificacin y el modelaje
estadstico. Sea cual sea la tcnica que escojamos, es fundamental
reconocer estas terceras variables en la fase de diseo para recogerlas y, posteriormente, poder controlarlas.
Con el fin de realizar un buen estudio causal, se recomienda seguir tres pasos: en primer lugar, elegir claramente el modelo causal en estudio, es decir, establecer una hiptesis de trabajo clara y estable; en segundo lugar, identificar inequvocamente el papel que juega cada variable en el modelo elegido;
y, en tercer lugar, especificar el modelo matemtico, multiplicativo o aditivo, que se utilizar en el anlisis. Hablaremos de
92
Infarto
90
60
150
OR CRUDA= 2,25 (IC 95% 1,3-3,6)
Caf
No caf
No infarto
60
90
150
150
150
No infarto
40
10
50
120
30
Fumadores:
Infarto
80
20
100
OR FUMADORES= 1 (IC 95% 0,4-2,5)
Caf
No caf
No fumadores:
Infarto
No infarto
10
20
40
80
50
100
OR NO FUMADORES= 1 (IC 95% 0,4-2,5)
Caf
No caf
30
120
VOL. 51 N 1, 1999
Tabla II
Tabla global
Exito
273 (78%)
289 (83%)
562
Fracaso
77
61
138
350
350
700
Clculos menores de 2 cm
Exito
Ciruga abierta
81 (98%)
Nefrolitotoma
234 (83%)
315
Fracaso
6
36
42
87
270
357
Fracaso
71
25
96
263
80
343
Ciruga abierta
Nefrolitotoma
Clculos mayores de 2 cm
Ciruga abierta
Nefrolitotoma
Exito
192 (73%)
55 (69%)
247
350
350
700
Paradoja de Simpson
Un factor de confusin peculiar es el que aparece en la denominada paradoja de Simpson(15). Se trata de un factor de confusin tan importante que es capaz de invertir la verdadera relacin existente entre dos variables. Es un fenmeno que se cita clsicamente en todos los textos y revisiones sobre este tema,
pero que aparece muy pocas veces en la realidad(16).
El ejemplo ms citado es el de un estudio observacional sobre
el tratamiento de clculos renales, cuyo esquema se puede ver en
la tabla II. En este trabajo, la ciruga abierta obtuvo un 78% de xitos (273/350) frente a un 83% de la nefrolitotoma percutnea
(289/350). Sin embargo, si se valoraba el dimetro del clculo, esta diferencia no solo desapareca sino que se inverta. Para los clculos de menos de 2 cm, la ciruga abierta obtena unos xitos
del 98% (81/87) frente a un 83% (234/270) de la percutnea, y para los clculos de ms de 2 cm, 73% (192/263) frente a 69% (55/80),
respectivamente. La explicacin de esta inversin en la relacin
se encuentra en que la probabilidad de pasar a ciruga abierta o a
percutnea dependa del tamao del clculo, al ser un trabajo ob-
93
Tabla III
Tabla global
ENF
200
410
610
OR CRUDA= 0,24 (IC 95% 0,2-0,3)
FR positivo
FR negativo
No ENF
410
200
610
610
610
1220
No ENF
10
100
110
110
500
610
No ENF
400
100
500
500
110
610
Varones
ENF
100
400
500
OR VARONES= 2.5 (IC 95% 1.2-5.2)
FR positivo
FR negativo
Mujeres
ENF
100
10
110
OR MUJERES= 2,5 (IC 95% 1,2-5,2)
FR positivo
FR negativo
Interaccin
La interaccin o modificacin de efecto se presenta cuando la
fuerza de la relacin entre dos variables es diferente en funcin del
nivel de una tercera variable, denominada modificadora de efecto(18,19). Es decir, en la relacin entre una variable independiente A
y una dependiente B, aparece una tercera variable C, modificadora de efecto, en cuyas categoras vara la relacin entre A y B.
En muchos estudios nos interesa conocer la relacin entre dos
variables y las modificaciones de esta relacin en los distintos
estratos de una de ellas. Por ejemplo, conocer en un ensayo clnico si el resultado de un tratamiento es igual para nios que para adultos o, en un estudio observacional, si los riesgos son diferentes para mujeres que para varones. Es decir, queremos valorar la heterogenicidad de un efecto observado entre los distin-
94
tos subgrupos de la variable. El trmino estadstico para esta heterogeneidad es interaccin y su traduccin clnica sinergismo.
En realidad, la interaccin o modificacin de efecto aparece cuando la incidencia de una enfermedad, por ejemplo, en presencia de dos o ms factores difiere de la esperada al combinar
las tasas de incidencia de los factores por separado. La interaccin puede observarse en modelos estadsticos multiplicativos
y/o en modelos estadsticos aditivos. Algunas veces puede aparecer interaccin si manejamos OR, pero no si manejamos riesgos atribuibles, o al revs. Sin embargo, algunos autores slo reconocen interaccin si aparece la misma sea cual sea la eleccin
del modelo estadstico y sus unidades(2,19).
Para valorar la interaccin en el modelo multiplicativo, que
es el ms utilizado actualmente, en el anlisis estratificado de
una tabla 2x2 se utiliza el test de heterogeneidad de los riesgos
en los distintos estratos, que nos determina si estos son estadsticamente significativos. Desde el punto de vista grfico, la
interaccin se pone de manifiesto por la falta de paralelismo entre las rectas para cada estrato en una grfica que enfrente variable dependiente y variable independiente.
Pongamos un ejemplo sobre la relacin entre un factor de riesgo y una enfermedad, y el sexo como variable modificadora de
efecto (Tabla IV). En la tabla global, la OR es OR=1, sin que exista relacin entre el factor de riesgo y la enfermedad. Si analizamos los datos en funcin del sexo, la OR de los varones (OR=9)
es completamente diferente a la de las mujeres (OR=0.1). Es decir, la variable FR es un factor de riesgo positivo en los varones,
mientras que es un factor de riesgo protector o negativo en las mujeres(2). En este caso no existe confusin ya que la OR ponderada
es igual a la OR cruda, si bien este dato es poco importante ya que
al existir interaccin siempre debe mostrarse con el anlisis por
estratos y nunca presentar riesgos ponderados o generales.
Un ejemplo de interaccin con modelo aditivo lo podemos
ver en la tabla V. Se trata de la relacin entre tabaco y cardiopata isqumica, considerando al colesterol plasmtico como
modificador de efecto. El hecho de ser fumador incrementa el
riesgo de cardiopata isqumica en 8 casos por cada 1000 pacientes (20/1000 - 12/1000 = 8/1000), en sujetos con el colesterol normal. El efecto individual de tener el colesterol elevado incrementa la incidencia en 49 casos por cada 1000 sujetos (61/1000
- 12/1000 = 49/1000) en sujetos no fumadores. Se esperara que
la combinacin de ambos factores elevara la incidencia en 57
casos por cada 1000 sujetos (8 + 49 = 57) y, sin embargo, el
incremento es de 305 casos (317/1000 - 12/1000 = 305/1000),
lo que indica un sinergismo o interaccin entre ambos(19).
Con frecuencia una tercera variable es, a la vez, factor de
confusin y variable modificadora de efecto. Supongamos la relacin entre una variable independiente A y dependiente B. Puede
existir una tercera variable C que acta como variable confundidora (los riesgos crudos y los estratificados son diferentes) y,
a la vez, como modificadora de efecto o interaccin (los riesgos
varan entre los diferentes estratos de la variable C). En estos casos, la interaccin siempre es ms importante que la confusin,
Tabla IV
No ENF
100
100
200
200
200
400
No ENF
25
75
100
100
100
200
No ENF
75
25
100
100
100
200
Varones
ENF
75
25
100
OR VARONES= 9 (IC 95% 4,5-18,0)
FR positivo
FR negativo
Mujeres
ENF
25
75
100
OR MUJERES= 0,1 (IC 95% 0,06-0,2)
FR positivo
FR negativo
OR PODERADA DE MH= 1
VOL. 51 N 1, 1999
Tabla V
Fumadores
No fumadores
Colesterol elevado
317/1000
61/1000
Colesterol normal
20/1000
12/1000
95
Bibliografa
1
2
Test de homogeneidad entre estratos
3
Test significativo
(diferencias significativas
entre estratos)
Test no significativo
(no hay diferencias
entre estratos)
Existe interaccin
No existe interaccin
Riesgo crudo
similar
a ponderado
Riesgo crudo
diferente
a ponderado
No existe
confusin
Existe
confusin
7
8
9
10
11
resultado de una prueba estadstica de significacin sino a criterios de importancia clnica(27). Las variables confundidoras
se reconocern al introducirlas en un modelo cuando cambien
el coeficiente de la variable independiente que confunden.
Entre los posibles modelos finales obtenidos se elegir el que
estime con mayor precisin los efectos, lo que se refleja por un
menor intervalo de confianza del 95% de los valores de los coeficientes resultantes del modelo, y el que presente ms ventajas en cuanto a calidad de las variables finales, importancia de
las mismas y simplicidad del modelo.
El proceso de seleccin del mejor modelo a partir del modelo mximo inicial viene implementado en los distintos programas estadsticos para ordenador personal (SPSS, BMDP,
Epiinfo,...), generalmente con distintas opciones de eliminacin
y seleccin (inclusin secuencial, exclusin secuencial y paso a
paso). De cualquier forma, el proceso de modelizacin requiere una continua interaccin entre ordenador e investigador, partiendo de un conocimiento profundo del marco terico de la
investigacin y de un entrenamiento prctico en el diseo y diagnstico de modelos multivariantes(26).
Para conseguir establecer un buen modelo multivariante final que valore relaciones causales, confusiones e interacciones,
recomendamos realizar siempre de forma ordenada el anlisis
descriptivo de todas las variables, el anlisis de variables 2x2, el
anlisis estratificado de cada relacin y, slo en ltimo lugar, el
anlisis multivariante mediante ordenador. Realizando esta secuencia de anlisis ser la nica forma de comprender realmen-
96
12
13
14
15
16
17
18
19
20
21
22
23
24