Sie sind auf Seite 1von 6

EDUCACION CONTINUADA

Epidemiologa y metodologa
cientfica aplicada a la pediatra
(VI): Confusin e interaccin

G. Sols Snchez,
G. Orejas Rodrguez-Arango*
An Esp Pediatr 1999;51:91-96.

Introduccin
La bsqueda de una relacin causal entre una variable independiente, o factor de estudio, y una variable dependiente, o desenlace, es la base de la mayora de los estudios de investigacin en clnica. Sin embargo, la demostracin de que una enfermedad se relaciona estadsticamente con cierta caracterstica
biolgica o social es solo el primer paso en el estudio epidemiolgico, ya que tras conocer que existe dicha relacin es necesario indagar su significado y validez(1-5).
Se puede definir causa como un suceso, condicin o caracterstica que precede a un desenlace y sin la cual dicho desenlace puede no aparecer en absoluto o aparecer por otro motivo, en otro momento o de otra forma determinada. Hablamos
de causa necesaria si el suceso, condicin o caracterstica es
imprescindible para que el desenlace ocurra, y hablamos de causa suficiente si el suceso, condicin o caracterstica da lugar al
desenlace, sea o no sea imprescindible para el mismo(1).
La idea de que una nica causa produce un nico efecto es
excesivamente sencilla. Actualmente sabemos que un desenlace se suele producir por la intervencin de varios factores o componentes, y que un factor concreto puede ser el origen de varios
desenlaces o enfermedades. En este sentido, otra definicin de
causa suficiente sera el conjunto mnimo de condiciones o sucesos que inevitablemente producen el evento.
Una caracterstica importante de la causalidad es que aunque dos factores estn asociados de forma muy importante desde el punto de vista matemtico, esto no quiere decir que uno
sea la causa del otro. Una buena correlacin no indica causalidad y la mayora de las asociaciones estadsticas no son causales en el sentido exacto de la definicin(6,7). As, entre dos variables podemos establecer distintas relaciones:
1.- No relacin: Ambas variables son independientes, sin
que se pueda establecer ninguna relacin entre ellas.
2.- Relacin esprea por azar: Falsa relacin que se encuentra entre ambas variables y se debe al azar.
3.- Relacin esprea por sesgos o errores: Falsa relacin
que se establece entre ambas variables, debida a otros factores, a un mal diseo o a algn agente externo a las variables estudiadas.
Servicio de Pediatra. Hospital de Cabuees (Insalud). Gijn. *ClinamatMedycsa. Madrid.
Correspondencia: Dr. Gonzalo Sols. Servicio de Pediatra.
Hospital de Cabuees. Cabuees s/n. Gijn.

VOL. 51 N 1, 1999

4.- Relacin causal: La relacin existente entre ambas variables es, realmente, causal: una provoca la aparicin de la
otra.
La relacin causal ha sido estudiada y discutida desde el
siglo pasado. Los criterios de causalidad de Bradford Hill, ya
expuestos en un artculo previo de esta serie, supusieron un
paso importante en esta teora de la causalidad y, todava hoy,
estn vigentes(2,8,9): fuerza de la asociacin, consistencia, temporalidad, especificidad, gradiente biolgico, plausibilidad, coherencia, evidencia experimental y analoga. Hill afirm que ninguna de estas caractersticas eran evidencia indiscutible de causalidad y que ninguna era condicin sine qua non para la misma. Sin embargo, actualmente, se considera la temporalidad como una caracterstica obligatoria para determinar causalidad: la
causa debe preceder en el tiempo al desenlace. Muchos autores han discutido y reevaluado estos criterios, pero su esquema
bsico se mantiene invariable(5,7).

Papel de terceras variables en la relacin


causa-efecto
La asociacin entre dos variables puede verse influida por terceras variables que juegan, en cada caso, distintos papeles. De forma resumida podemos diferenciar entre las llamadas terceras variables las siguientes posibilidades: variables factor de confusin,
variables modificadoras de efecto, variables intermedias, variables
no controladas y variables posteriores(2). En la figura 1 puede verse la situacin de cada una de ellas respecto a la relacin causal.
Los factores de confusin son variables que producen un sesgo en la relacin entre un factor de estudio y una enfermedad,
modificando su relacin de forma homognea para todos los
estratos. Implican un sesgo y deben ser encontradas y eliminadas.
Las variables modificadoras de efecto son terceras variables
entre cuyas categoras se modifica la intensidad de la relacin
entre el factor de estudio y la enfermedad, dando lugar a la interaccin. Al contrario de los factores de confusin, las modificadoras de efecto deben ser encontradas y comunicadas como
hallazgo importante en una relacin causal.
Las variables intermedias son variables situadas dentro de
un orden causal entre la variable dependiente y el factor de estudio, pero a diferencia de los factores de confusin forman parte de la cadena causal.
Las variables no controladas son variables con efecto so-

Epidemiologa y metodologa cientfica aplicada a la pediatra (VI): Confusin e interaccin

91

Variable
dependiente

Factor de estudio

Variable
dependiente

Tabla I

Factor de estudio

Ejemplo de confusin: Hbito de fumar


como variable confundidora en la relacin
entre consumo de caf e infarto de
miocardio (Tomado de referencia 17)

Factor de confusin

Tabla global
Factor de estudio

Variable
dependiente

Variable
dependiente

Variable modificadora de efecto

Variable
dependiente

Variable
posterior

Factor de estudio

Variable intermedia

Factor de estudio
Variable no controlada
Variable dependiente
Factor de estudio

Figura 1. Terceras variables y su relacin con la variable dependiente y


el factor de estudio (Tomado de referencia 2).

bre la variable dependiente, pero sin relacin con el factor de estudio. Su no inclusin en el estudio no provoca sesgos en la
estimacin de la relacin entre ellos, pero conducen a modelos
con escasa capacidad predictiva.
Por ltimo, las variables posteriores a la variable dependiente pueden conducir a errores en el establecimiento de relaciones
causales. Su inclusin en un estudio puede provocar situaciones
similares a las de los factores de confusin o de los factores modificadores de efecto. Desgraciadamente, con frecuencia es muy
difcil conocer si una variable es anterior o posterior a un desenlace.
En los estudios experimentales estas terceras variables pueden ser controladas con la asignacin aleatoria del factor de
estudio, sobre todo si la muestra de sujetos es suficientemente
grande(10). Sin embargo, en los estudios observacionales analticos, estas terceras variables no pueden ser controladas a no ser
que se conozcan previamente al estudio y se tengan en cuenta
en el anlisis(2).
Las formas de controlar terceras variables en los estudios observacionales son la restriccin de poblacin, la estandarizacin
de riesgos, el emparejamiento, la estratificacin y el modelaje
estadstico. Sea cual sea la tcnica que escojamos, es fundamental
reconocer estas terceras variables en la fase de diseo para recogerlas y, posteriormente, poder controlarlas.
Con el fin de realizar un buen estudio causal, se recomienda seguir tres pasos: en primer lugar, elegir claramente el modelo causal en estudio, es decir, establecer una hiptesis de trabajo clara y estable; en segundo lugar, identificar inequvocamente el papel que juega cada variable en el modelo elegido;
y, en tercer lugar, especificar el modelo matemtico, multiplicativo o aditivo, que se utilizar en el anlisis. Hablaremos de

92

G. Sols Snchez y col.

Infarto
90
60
150
OR CRUDA= 2,25 (IC 95% 1,3-3,6)
Caf
No caf

No infarto
60
90
150

150
150

No infarto
40
10
50

120
30

Fumadores:
Infarto
80
20
100
OR FUMADORES= 1 (IC 95% 0,4-2,5)
Caf
No caf

No fumadores:
Infarto
No infarto
10
20
40
80
50
100
OR NO FUMADORES= 1 (IC 95% 0,4-2,5)
Caf
No caf

30
120

OR PONDERADA DE MH= 1 (IC 95% 0,5-1,9)


La diferencia entre la OR CRUDA y la OR PONDERADA MH definen la
confusin.

modelos multiplicativos cuando los clculos se realicen a travs


de cocientes de ventajas (OR) y de modelos aditivos cuando los
clculos los realicemos a travs de riesgos atribuibles(4).
Confusin
Una variable de confusin es una tercera variable C que si no
es tenida en cuenta modifica la relacin entre una variable independiente A y una dependiente B. La variable C confundidora debe ser externa a la relacin que se evala, cronolgicamente anterior al factor de estudio A y relacionada tanto con dicho factor como con la variable desenlace B. Es decir, la variable de confusin
debe ser un factor de riesgo para la enfermedad y tener relacin
con el factor de estudio. Las variables confundidoras nos engaan
y deben ser encontradas y eliminadas de nuestro estudio(11).
El ejemplo ms clsico de variable confundidora lo describe
Hulley en su excelente texto de investigacin en clnica(12). Se
trata de la falsa relacin entre el consumo de caf (variable A o
factor de riesgo) y el infarto de miocardio (variable B o dependiente) debida al tabaco (variable confundidora C) (Tabla I). En
este ejemplo, la OR cruda entre el consumo de caf y el infarto
es de 2,25, mientras que la relacin vara si tenemos en cuenta el
tabaco: tanto las OR para fumadores como la OR para no fumadores son OR=1. Es decir, la relacin que pareca existir entre caf e infarto de miocardio desaparece si tenemos en cuenta
el hbito tabquico. En el ejemplo, el hbito de fumar es una variable confundidora porque falsea la relacin e introduce un sesgo que debemos eliminar. Adems, cumple las tres condiciones

ANALES ESPAOLES DE PEDIATRIA

requeridas para considerarse factor de confusin: se relaciona


con el consumo de caf, se relaciona con el infarto de miocardio
y no es una variable intermedia entre ambas.
Para valorar realmente la existencia de una variable confundidora debemos calcular los riesgos crudos, ya sean OR o
RR, los riesgos para cada categora de la variable confundidora y el riesgo ponderado de Mantel y Haenszel(13).
En los estudios experimentales, las variables de confusin
se eliminan con la aleatorizacin(10). La distribucin aleatoria de
sujetos entre los grupos asegura, si el tamao de muestra es suficiente, que las posibles variables confundidoras conocidas y
no conocidas estarn equilibradas en ambos grupos.
Por el contrario, en los estudios observacionales, el investigador debe conocer, medir y controlar las posibles variables confundidoras(14). Para reconocer posibles variables de confusin debemos establecer listas de variables relacionadas con el factor de
estudio y que, adems, puedan ser causa de desenlace. Una vez
reconocidas tenemos dos opciones: controlarlas en la fase de diseo mediante la restriccin y el emparejamiento, o controlarlas
en la fase de anlisis mediante la estratificacin y el ajuste(12).
La restriccin definir unos criterios de inclusin y exclusin rgidos, admitiendo slo a sujetos con un cierto valor de
la posible variable confundidora. Por ejemplo, admitiendo al estudio a fumadores y eliminando a no fumadores. Las desventajas de esta restriccin es que limitan la generalizacin de
los resultados a la poblacin y que pueden hacer difcil encontrar un tamao de muestra adecuado.
El emparejamiento o matching implica equilibrar en cuanto
a la posible variable confundidora (fumadores y no fumadores) los grupos de estudio. Entre sus inconvenientes estn que
encarece el estudio en tiempo y dinero, que la decisin debe tomarse desde el inicio del estudio anulando posteriormente el valor de dichas variables, que requiere un anlisis especial debido
al emparejamiento y que puede producir un sobreemparejamiento,
reduciendo el valor del estudio.
La estratificacin asegura que slo se comparen casos y controles, o expuestos y no expuestos, con niveles similares de variable de confusin. Para esto se debe dividir a los sujetos en estratos segn la variable confundidora (fumadores y no fumadores). Entre las ventajas de la estratificacin se encuentra su reversibilidad, ya que si hemos controlado dicha variable podemos utilizarla o no, segn queramos, en el anlisis. Su gran desventaja es la limitacin del nmero de variables que pueden controlarse simultneamente, ya que el tamao de la muestra aumenta en gran medida por cada estratificacin que generemos.
La estratificacin permite el uso de los riesgos (OR o RR) de
Mantel y Haenszel, que son riesgos ponderadas por estratos. Si
el riesgo (OR o RR) crudo o de la tabla 2x2 no es muy diferente al riesgo ponderado de Mantel y Haenszel podemos concluir
que no existe confusin. Si, por el contrario, el riesgo crudo es
diferente al riesgo ponderado de Mantel y Haenszel, concluiremos que la variable por la que estratificamos es un factor de confusin(13).
Las tcnicas de ajuste estadstico modelan o simulan la aso-

VOL. 51 N 1, 1999

Tabla II

Paradoja de Simpson: Tratamiento de


clculos renales con ciruga abierta o
nefrolitotoma percutnea (Tomada de
referencia 23)

Tabla global
Exito
273 (78%)
289 (83%)
562

Fracaso
77
61
138

350
350
700

Clculos menores de 2 cm
Exito
Ciruga abierta
81 (98%)
Nefrolitotoma
234 (83%)
315

Fracaso
6
36
42

87
270
357

Fracaso
71
25
96

263
80
343

Ciruga abierta
Nefrolitotoma

Clculos mayores de 2 cm
Ciruga abierta
Nefrolitotoma

Exito
192 (73%)
55 (69%)
247

Relacin entre tamao de clculo y tipo de tratamiento


Calculo > 2 cm Calculo < 2 cm
Ciruga abierta
263
87
Nefrolitotoma
80
270
343
357

350
350
700

ciacin a travs de modelos multivariantes con el fin de separar el


efecto del factor de confusin. Las tcnicas de ajuste permiten controlar simultneamente varios factores de confusin y utilizar la
informacin completa de las variables continuas. Como inconvenientes destaca la posibilidad de modelizar errneamente y la dificultad para comprender los resultados en algunas ocasiones. Al
final de este artculo realizaremos un breve repaso a las tcnicas
de anlisis multivariante para el control de confusin e interaccin.

Paradoja de Simpson
Un factor de confusin peculiar es el que aparece en la denominada paradoja de Simpson(15). Se trata de un factor de confusin tan importante que es capaz de invertir la verdadera relacin existente entre dos variables. Es un fenmeno que se cita clsicamente en todos los textos y revisiones sobre este tema,
pero que aparece muy pocas veces en la realidad(16).
El ejemplo ms citado es el de un estudio observacional sobre
el tratamiento de clculos renales, cuyo esquema se puede ver en
la tabla II. En este trabajo, la ciruga abierta obtuvo un 78% de xitos (273/350) frente a un 83% de la nefrolitotoma percutnea
(289/350). Sin embargo, si se valoraba el dimetro del clculo, esta diferencia no solo desapareca sino que se inverta. Para los clculos de menos de 2 cm, la ciruga abierta obtena unos xitos
del 98% (81/87) frente a un 83% (234/270) de la percutnea, y para los clculos de ms de 2 cm, 73% (192/263) frente a 69% (55/80),
respectivamente. La explicacin de esta inversin en la relacin
se encuentra en que la probabilidad de pasar a ciruga abierta o a
percutnea dependa del tamao del clculo, al ser un trabajo ob-

Epidemiologa y metodologa cientfica aplicada a la pediatra (VI): Confusin e interaccin

93

Tabla III

Paradoja de Simpson: Relacin entre un


factor de riesgo (FR) o variable
independiente y la enfermedad (ENF) o
variable dependiente, siendo el sexo un
factor confusor que invierte el sentido de
los riesgos (Tomada de referencia 2)

Tabla global
ENF
200
410
610
OR CRUDA= 0,24 (IC 95% 0,2-0,3)
FR positivo
FR negativo

No ENF
410
200
610

610
610
1220

No ENF
10
100
110

110
500
610

No ENF
400
100
500

500
110
610

Varones
ENF
100
400
500
OR VARONES= 2.5 (IC 95% 1.2-5.2)
FR positivo
FR negativo

Mujeres
ENF
100
10
110
OR MUJERES= 2,5 (IC 95% 1,2-5,2)
FR positivo
FR negativo

OR PONDERADA MH= 2,5 (IC 95% 1,5-4,1)

servacional y no tratarse de un ensayo clnico randomizado(17).


Otro ejemplo, esta vez utilizando riesgos, se puede observar
en la tabla III. Una variable independiente funciona como factor protector (OR=0.24) para una enfermedad en la tabla de
datos crudos. Si separamos los datos por sexo (factor de confusin), la variable independiente pasa a ser un factor de riesgo (OR=2.5) para ambas categoras. La diferencia entre la OR
ponderada de Mantel y Haenszel y la OR cruda demuestran que
existe confusin. La diferencia de sentido entre la OR cruda (proteccin) y las OR por estratos y ponderadas (riesgo) indican que
se trata de una paradoja de Simpson(2).

Interaccin
La interaccin o modificacin de efecto se presenta cuando la
fuerza de la relacin entre dos variables es diferente en funcin del
nivel de una tercera variable, denominada modificadora de efecto(18,19). Es decir, en la relacin entre una variable independiente A
y una dependiente B, aparece una tercera variable C, modificadora de efecto, en cuyas categoras vara la relacin entre A y B.
En muchos estudios nos interesa conocer la relacin entre dos
variables y las modificaciones de esta relacin en los distintos
estratos de una de ellas. Por ejemplo, conocer en un ensayo clnico si el resultado de un tratamiento es igual para nios que para adultos o, en un estudio observacional, si los riesgos son diferentes para mujeres que para varones. Es decir, queremos valorar la heterogenicidad de un efecto observado entre los distin-

94

G. Sols Snchez y col.

tos subgrupos de la variable. El trmino estadstico para esta heterogeneidad es interaccin y su traduccin clnica sinergismo.
En realidad, la interaccin o modificacin de efecto aparece cuando la incidencia de una enfermedad, por ejemplo, en presencia de dos o ms factores difiere de la esperada al combinar
las tasas de incidencia de los factores por separado. La interaccin puede observarse en modelos estadsticos multiplicativos
y/o en modelos estadsticos aditivos. Algunas veces puede aparecer interaccin si manejamos OR, pero no si manejamos riesgos atribuibles, o al revs. Sin embargo, algunos autores slo reconocen interaccin si aparece la misma sea cual sea la eleccin
del modelo estadstico y sus unidades(2,19).
Para valorar la interaccin en el modelo multiplicativo, que
es el ms utilizado actualmente, en el anlisis estratificado de
una tabla 2x2 se utiliza el test de heterogeneidad de los riesgos
en los distintos estratos, que nos determina si estos son estadsticamente significativos. Desde el punto de vista grfico, la
interaccin se pone de manifiesto por la falta de paralelismo entre las rectas para cada estrato en una grfica que enfrente variable dependiente y variable independiente.
Pongamos un ejemplo sobre la relacin entre un factor de riesgo y una enfermedad, y el sexo como variable modificadora de
efecto (Tabla IV). En la tabla global, la OR es OR=1, sin que exista relacin entre el factor de riesgo y la enfermedad. Si analizamos los datos en funcin del sexo, la OR de los varones (OR=9)
es completamente diferente a la de las mujeres (OR=0.1). Es decir, la variable FR es un factor de riesgo positivo en los varones,
mientras que es un factor de riesgo protector o negativo en las mujeres(2). En este caso no existe confusin ya que la OR ponderada
es igual a la OR cruda, si bien este dato es poco importante ya que
al existir interaccin siempre debe mostrarse con el anlisis por
estratos y nunca presentar riesgos ponderados o generales.
Un ejemplo de interaccin con modelo aditivo lo podemos
ver en la tabla V. Se trata de la relacin entre tabaco y cardiopata isqumica, considerando al colesterol plasmtico como
modificador de efecto. El hecho de ser fumador incrementa el
riesgo de cardiopata isqumica en 8 casos por cada 1000 pacientes (20/1000 - 12/1000 = 8/1000), en sujetos con el colesterol normal. El efecto individual de tener el colesterol elevado incrementa la incidencia en 49 casos por cada 1000 sujetos (61/1000
- 12/1000 = 49/1000) en sujetos no fumadores. Se esperara que
la combinacin de ambos factores elevara la incidencia en 57
casos por cada 1000 sujetos (8 + 49 = 57) y, sin embargo, el
incremento es de 305 casos (317/1000 - 12/1000 = 305/1000),
lo que indica un sinergismo o interaccin entre ambos(19).
Con frecuencia una tercera variable es, a la vez, factor de
confusin y variable modificadora de efecto. Supongamos la relacin entre una variable independiente A y dependiente B. Puede
existir una tercera variable C que acta como variable confundidora (los riesgos crudos y los estratificados son diferentes) y,
a la vez, como modificadora de efecto o interaccin (los riesgos
varan entre los diferentes estratos de la variable C). En estos casos, la interaccin siempre es ms importante que la confusin,

ANALES ESPAOLES DE PEDIATRIA

Tabla IV

Interaccin o modificacin de efecto en


un modelo multiplicativo: Relacin de un
factor de riesgo (FR) o variable
independiente y una enfermedad (ENF) o
variable dependiente en relacin con una
variable modificadora de efecto (SEXO)

Tabla global (hombres y mujeres)


ENF
FR positivo
100
FR negativo
100
200
OR CRUDA= 1

No ENF
100
100
200

200
200
400

No ENF
25
75
100

100
100
200

No ENF
75
25
100

100
100
200

Varones
ENF
75
25
100
OR VARONES= 9 (IC 95% 4,5-18,0)
FR positivo
FR negativo

Mujeres
ENF
25
75
100
OR MUJERES= 0,1 (IC 95% 0,06-0,2)
FR positivo
FR negativo

OR PODERADA DE MH= 1

y los hallazgos deben ser tenidos en cuenta.


Aunque la deteccin de interacciones puede tener importantes
implicaciones prcticas, su bsqueda exagerada, creando subgrupos
numerosos o de escasa importancia clnica, puede dar lugar a hallazgos espreos o falsos(20,21). As, en un ensayo clnico aleatorio
comparando dexametasona y placebo para prevenir el sndrome de
distress respiratorio neonatal se encontr que el sexo era una variable modificadora de efecto ya que el efecto favorable de la medicacin apareca solo en el grupo de nias(22). Esta conclusin no pareca tener justificacin biolgica y, posteriormente, otros trabajos
se encargaron de confirmar que esta interaccin no era real(23).

Anlisis multivariante para valorar


confusin e interaccin
Cuando se estudia una relacin de causalidad entre una variable independiente y una dependiente se debe partir, como ya comentamos, de un diseo especfico para comprobar dicha relacin.
Una vez obtenidos los datos, realizaremos un primer anlisis crudo de los mismos. A continuacin, a travs de anlisis estratificados podremos valorar la presencia de factores de confusin e interacciones ya sospechadas previamente (Fig. 2). Para finalizar
el estudio, el anlisis multivariante nos ayudar a establecer un
modelo, explicativo o predictivo, segn sea nuestra intencin, que
confirmar o rechazar nuestra hiptesis de trabajo inicial(24-26).
Otra posibilidad sera utilizar el anlisis multivariante desde un inicio para explorar un conjunto de variables independientes en su relacin con una variable dependiente, controlan-

VOL. 51 N 1, 1999

Tabla V

Ejemplo de interaccin con modelo


aditivo: Incidencia de la cardiopata
isqumica segn tabaquismo y niveles de
colesterol. Los niveles de colesterol
modifican la incidencia de cardiopata
isqumica relacionada con el consumo de
tabaco (Tomado de referencia 19)

Fumadores
No fumadores

Colesterol elevado
317/1000
61/1000

Colesterol normal
20/1000
12/1000

Incremento de incidencia por el factor tabaco: 20/1000-12/1000= 8/1000


Incremento de incidencia por el factor colesterol:
61/1000-12/1000= 57/1000
Incremento por ambos factores en ausencia de sinergismo o
interaccin: 8/1000 + 57/1000 = 61/1000
Incremento real de incidencia: 317/1000 - 12/1000 = 305/1000
Al ser diferentes el incremento real del incremento esperado,
concluimos que existe interaccin o sinergismo en este modelo aditivo.

do los efectos de posibles variables de confusin y detectando


y explorando interacciones entre las distintas variables.
En los modelos multivariantes se parte de una variable dependiente respuesta (cuantitativa para la regresin mltiple, y
cualitativa binaria para la logstica), de una variable independiente exposicin o factor de estudio, y de un conjunto de variables independientes de control o ajuste. El ajuste estadstico es la propiedad de los anlisis multivariantes por la que se
determina la influencia especfica de cada variable independiente
sobre la variable dependiente al mantener el resto de variables
constantes. Por lo tanto, es multivariante porque analiza el efecto de mltiples variables simultneamente. Es un modelo porque partiendo de los datos de la investigacin asume ciertas
caractersticas de esos datos (distribucin normal, por ejemplo)
para llegar a una frmula matemtica.
La estructura bsica del modelo multivariante es
Variable respuesta = constante + (1 x variable1) + (2 x variable2) + ..., (n x variablen) siendo 1, 2 y n coeficientes que
vienen determinados por los datos de la empresa, y variable1,
variable2 y variablen las variables predictoras que pueden estar
relacionadas con el resultado.
Al plantear un modelo multivariante, se partir de una ecuacin inicial en la que se incluirn todas las variables independientes, incluidas todas las posibles variables de confusin y todas las posibles interacciones, siguiendo un principio jerrquico. Desde este modelo inicial se ir realizando una seleccin de
trminos con el fin de llegar a un modelo final eficaz.
La inclusin o eliminacin de una interaccin se realizar
con pruebas de significacin estadstica, manteniendo en el modelo los trminos que las cumplan. La interaccin existir si, al
introducirla en el modelo, el coeficiente de la misma es estadsticamente significativo.
Por el contrario, la decisin de mantener o eliminar en el modelo los trminos de confusin no debe ser tomadas en base al

Epidemiologa y metodologa cientfica aplicada a la pediatra (VI): Confusin e interaccin

95

Anlisis descriptivo de las variables

te los hallazgos obtenidos y no cometer errores en las conclusiones.

Anlisis grupo de tablas 2x2


(significacin estadstica con chi-cuadrado,
riesgos e intervalos de confianza)

Bibliografa
1

Anlisis de tablas estratificadas


(significacin estadstica con chi-cuadrado,
riesgos e untervalos de confianza)

2
Test de homogeneidad entre estratos

3
Test significativo
(diferencias significativas
entre estratos)

Test no significativo
(no hay diferencias
entre estratos)

Existe interaccin

No existe interaccin

Calculo de riesgos ponderados

Riesgo crudo
similar
a ponderado

Riesgo crudo
diferente
a ponderado

No existe
confusin

Existe
confusin

7
8

Figura 2. Estudio univariante y estratificado de una posible relacin causal


entre una variable dependiente o desenlace, una independiente o factor
de estudio y una tercera variable.

9
10
11

resultado de una prueba estadstica de significacin sino a criterios de importancia clnica(27). Las variables confundidoras
se reconocern al introducirlas en un modelo cuando cambien
el coeficiente de la variable independiente que confunden.
Entre los posibles modelos finales obtenidos se elegir el que
estime con mayor precisin los efectos, lo que se refleja por un
menor intervalo de confianza del 95% de los valores de los coeficientes resultantes del modelo, y el que presente ms ventajas en cuanto a calidad de las variables finales, importancia de
las mismas y simplicidad del modelo.
El proceso de seleccin del mejor modelo a partir del modelo mximo inicial viene implementado en los distintos programas estadsticos para ordenador personal (SPSS, BMDP,
Epiinfo,...), generalmente con distintas opciones de eliminacin
y seleccin (inclusin secuencial, exclusin secuencial y paso a
paso). De cualquier forma, el proceso de modelizacin requiere una continua interaccin entre ordenador e investigador, partiendo de un conocimiento profundo del marco terico de la
investigacin y de un entrenamiento prctico en el diseo y diagnstico de modelos multivariantes(26).
Para conseguir establecer un buen modelo multivariante final que valore relaciones causales, confusiones e interacciones,
recomendamos realizar siempre de forma ordenada el anlisis
descriptivo de todas las variables, el anlisis de variables 2x2, el
anlisis estratificado de cada relacin y, slo en ltimo lugar, el
anlisis multivariante mediante ordenador. Realizando esta secuencia de anlisis ser la nica forma de comprender realmen-

96

G. Sols Snchez y col.

12
13
14
15
16
17
18
19
20
21
22
23
24

Rothman KJ, Greenland S. Causation and causal inference. En:


Rothman KJ y Greenland S, eds Modern epidemiology. 2nd ed.
Philadelphia: Lippincott-Raven Publ, 1998: 7-28.
Cobo E, Buekens P. Necesidad y limitaciones del ajuste. Med Clin
(Barc) 1990; 95:702-708.
Bradford Hill A. The environment and disease: Association or
Causation?. Proc Royal Soc Medicine 1965; 58:295-300.
Orejas G, Martnez JF. Epidemiologa y metodologa cientfica aplicada a la Pediatra (I): Introduccin. Medidas de frecuencia, asociacin
e impacto. Estandarizacin. An Esp Pediatr 1998; 49:313-320.
Lilienfeld AM, Lilienfeld DE. Foundations of Epidemiology. 2nd
ed. New York: Oxford University Press Inc, 1980.
De Mata Donado J, Orejas G. Epidemiologa y metodologa cientfica aplicada a la Pediatra (III): Introduccin al anlisis estadstico en
epidemiologa. An Esp Pediatr 1999; 50:81-90.
Mac Mahon B, Pugh TF. Principios y mtodos de epidemiologa. 2
ed. Mexico DF: Ed Colpico, 1988.
Doll R. Sir Austin Bradford Hill and the progress of medical science. BMJ 1992; 305:1521-1526.
Sols G, Orejas G. Epidemiologa y metodologa cientfica aplicada
a la Pediatra (II): Diseos en investigacin epidemiolgica. An Esp
Pediatr 1998; 49:527-538.
Altman DG, Bland JM. Treatment allocation in controlled trials: why
randomise?. BMJ 1999; 318:1209.
Domnech JM, Sarra A. Confusin e interaccin. En: Domnech JM,
Sarra A, eds. Anlisis multivariante en ciencias de la salud: Modelos
de regresin. UD 8. Barcelona: Signo, 1995.
Hulley SB, Cummings SR. Diseo de la investigacin clnica.
Barcelona: Doyma, 1993.
Mantel N, Haenszel W. Statistical aspects of the analysis of data from
retrospective studies of disease. J Natl Cancer Inst 1959; 22:719-748.
Brennan P, Croft P. Interpreting the results of observational research: chance is not such a fine thing. BMJ 1994; 309:727-730.
Simpson EH. The interpretation of interaction in contingency tables.
J Royal Stat Assoc 1951; 13:238-241.
Julious SA, Mullee MA. Confounding and Simpsons paradox. BMJ
1994; 1480-1481.
Charig CR, Webb DR, Payne SR, Wickham OE. Comparison of treatmente of renal calculi by operative surgery, percutaneous nephrolithotomy and extracorporeal shock wave lithotripsy. BMJ 1986; 292:879-882.
Altman DG, Matthews JNS. Interaction 1: heterogeneity of effects.
BMJ 1996; 313:486.
Argimn JM, Jimnez J. Mtodos de investigacin aplicados a la atencin primaria de salud. Barcelona: Doyma, 1991.
Matthews JNS, Altman DG. Interaction 2: compare effect sizes not
P values. BMJ 1996; 313:808.
Matthews JNS, Altman DG. Interaction 3: how to examine heterogeneity. BMJ 1996; 313:862.
Collaborative Group on Antenatal Steroid Therapy. Effect of antenatal dexamethasone administration on the prevention of respiratory distress syndrome. Am J Obstet Gynecol 1981; 141:276-287.
Crowley P, Chalmers I, Keirse MJNC. The effects of corticosteroid
administration before preterm delivery: an overview of the evidence
from controlled trials. Br J Obstet Gynaecol 1990; 97:11.
Domenech JM, Sarra A. Modelo de regresin mltiple. En: Domenech
JM, Sarria A eds. Anlisis multivariante en ciencias de la salud: Modelos
de regresin. UD 7. Barcelona: Signo, 1995.

ANALES ESPAOLES DE PEDIATRIA

Das könnte Ihnen auch gefallen