Sie sind auf Seite 1von 464

EPIDEMIOLOGIA INTERMEDIA

Conceptos y Aplicaciones
Moyses Szklo
Profesor de Epidemiologi a
Escuela de Higiene y Salud Publica
Johns Hopkins University
Baltimore, Maryland
F. Javier Nieto
Profesor y Jete de Departamento
Ciencias de la Salud Poblacional
Escuela de Medicina
Universidad de Wisconsin
Madison, Wisconsin
I
EPIDEMIOLOGIA INTERMEDIA
Conceptos y Aplicaciones
Tr .. ducci6n;
Luis Carlos Silva Ay,aguer
Doctor en Ciencias Matematicas. Investigadm
Titular. In.tituto Superior de Ciencia. M&lica;.
La Habana. Cuba.
Rosa
Doctora en Ciencia. . E'r ... en
Hermanos Ameijeira, .
La Cuba.
Tflulo original:
Reservados tOOos los derechos.
No esta permit ida Ia reproducci6n total 0 de este libro,
ni su trutamienlo informatico. ni Ia transmisi6n de ninguna
forma 0 ror cual'luier medio. ya SCa electronico. mednico
por fotocopia. por registro u otros metOOos. si n cl permiso
previo y por escrito de los tilUlares del Copyright.
c
Edicione. Diaz de Santos. S. A.
Juan Bravo. 3-A. 28006 Madrid
E'pana
Internet: http: / www.diazdesanto . es/ediciones
E-Mail: ediciones@diazdesantos.es
ISBN;
Dep6sito legal: M.
Discno de cubierta: Angel Cal\"Cte
Fotocomposicion: FER. S. A.
Impresion: Edigrafos. S. A.
Encuadernacion: Riistica-Hilo
IMPRESO EN ESPANA
A Hilda y Marion
CONTENIDO
Presentaci6n . .
Prefacio . .
Reconocimientos
I NTRODUCCI6N
PARTE I
xxi
xxiii
. . xxvii
CAPITULO I Los disefios basicos de estudios en epidemiologia analitica 3
1.1. Introducci6n: Epi demiologfa analftica y epidemiologfa descri ptiva . . 3
1.2. Analisis del efecto de la edad, la cohortc de nacimiento y el periodo . 4
1.3. Est udios eco16gicos . . . . .. . .. . . .. . .. . .. . 15
1.4 . Est udios basados en los individuos como unidades de observaci6n . . 20
1.4. 1. Estudiode cohonc .. .. . .. . .. . . .. . .. . .. . 2 1
1.4.2. Estudios de casos y comroles . . . . . . . . . . . . . 25
ESludio de casos y confroleJ" basado ell los casos 26
de casus yconrroles dellfro de /lila collOrfe
(Jefi nida . . . . . . . 29
1.4.3. Estudios transversales . . 33
1.4.4. Disefio Caso-Cruzado . . . 35
1.4.5. El emparejamiento 35
EI emparejamienlO en los e.l'tudios de casm-commles y de co/wrle. 36
TijJOJ'de emparej amiellfO .. . 36
Vellraj u.\" y desvellraja.\" del emparejamiellfO . . 38
Bibli ograffa . . . . . . . . . . . . . . . . . . . . . 42
PARTE II
MEDl CI6 N DE LA OCURRENCIA DE ENFERMEDADES Y DE LA ASOCIACI6 N .. 45
CAPITULO 2 Medici6n de la ocurrencia de la enfermedad . . . 47
2.1. Introducci6n: Elementos ba.sicos de inferencia epidemiol6gica-
definici6n y comeo de los result ados de la enfermedad 47
2.2. Medidas de incidencia . . .. . .. . . .. . .. . .. . 49
2.2. 1. Incidencia basada en individuos en riesgo .. . 49
/ncidencia aeulllu/(jda basuda en el enJoque de tabla.\" de vida
por intervalos (tabla.\" de vida ehisica.l') . . . . . . . . . . . . 5 1
/ncideneia aeumulalia basada en el enJoque de Kaplan-Meier
(eventos de riellljJo.\ exacto.\) . .. . .. . 53
Sl/jJue.l'to.l' ell la e.l'rilllaei611 de fa ineideneia ael/IIII/fada
basada en el amilisis de .wperviveneia . . .. . 55
x CONTENlDO
2.2.2. Tasa de incidencia basada en tiempo-persona .. . .. . 58
Tasa de incidellcia ba.wuia ell daros agregado.\ . . .. . 59
Densidad de incidencia basada ell datos intiivitiuales . . 60
SlIposiciones para la estimaci6n de las rasas de incidencia
basadas en (iempo-persona . .. . .. . . .. . .. . .. .
Relaci6n entre la densuiad (basada en datos individua/e.\)
y rasa (basada ell datos agrupados) . .. . .. . .. .
E.\rrariJicaci6n de los tiell/pas-persona y rasas de aeuerda
al (iempo de segllimienfo y covariable.\"
2.2.3 . Comparacion entre medidas de incidencia .. .
2.2.4 . La tasa de riesgo instantaneo
2.3 . Medidas de prevalencia .. .
2.4. Odds
Bibliograffa .. .
CAPITULO 3 Medici6n de asociaciones entre exposiciones y desenlaces
3.1. Introducci6n .. .. . .. . .. .. . .. .. . .. . .. .
3.2 . Medici6n de asociaciones en un est udio de cohorte
3.2.1. Riesgo relat ivo (Razon de Riesgos) y Odds Ratio
3.2.2. RiesgoAtribuible . .. . .. .. . .. . .. .
Riesgo Atribuible en Indi viduoJ . .
porcentllal . . . . . . . . . . . . . . . . . .. . .. . .. .
Riesgo Atribllible Poblacional de Levin . .. . .. .
3.3 . Est udios de cone transversal: estimacion punt ual de la raz6n de tasas
de prevalencia
3.4 . Medicion de la asociacion enest udios de casas y controles . .. .
3.4 .1. Odds Ratio . .. . .. . . .. . .. . . .. . .. .
Odds ratio en estlldios de casos y commIes elllparejados
Odd.\ ratio COIIIO IIlIa estilllaci6n del riesgo relativo: eI sllpllesto
de baja prevalencia ... ......... .......... ......... .
Inflilencia del marco lIlue.\tral para la Jelecci6n de commIes
sobre la estimaci6n de parametroJ mediante eI oddJ ratio
de la eJ.posici6n: incidencia aCllmllladafrellte a demidad
de lIIueJtreo .. . .. .. . .. .. . .. . .. . . .. . .. . .. .
Clilc!llo de los odd.\ ratio c!lando hay mas de dos categorfas
lie eJ.posici6n . . .. .. . .. .. . .. . .. . . .. . .. .
3.4.2. Riesgo atribuible en estudios de casas y controles . .
3.5 . Evaluacion de la fuerza de las asociaciones
Bibli ograffa .. . . .. . .. . .. .. . .. .. . .. . .. .
P ARTE III
AMENAZAS A LA VALIDEZ Y PROBLEMAS DE INTERI' RETACI6N
CAPITULO 4 Falta d e validez: Sesgo
4.1. Generalidades
4.2 . Sesgo de selecci6n .. . .. .
62
63
65
7 1
73
73
75
76
79
79
79
80
85
86
86
88
92
92
92
96
%
100
102
102
103
105
107
109
109
11 2
CONTENI DO XI
4.3 . Sesgo de informacion . . . . . . . . . . . . . . 117
4.3 . 1. Sesgo en la identi ficacion de la exposicion . . 118
Sesgo de reCilerdo .. .. . .. . .. . 11 9
SeJgo del elltreviJrador . .. . .. . 120
4.3.2. Sesgo de identi ficadon del desenlace 122
Se.\go del observador .. . .. . .. . 122
Se.\go del que responde . .. . .. . 123
4.3.3. EI resultado del sesgo de informaci6n: el error
de c1asificacion . .. . .. . 123
Error de clasificaci6n 110 diferencial . . . . . . . 123
Error de clasificaci611 liiferellcial . . . . . . . . . 129
Efecto del error de clasificaci6n de ulla variabie confusora 132
Prevenci6n del error de dasificaci6n .. . .. . 133
4.4. Sesgo de informacion!selecci6n combinados .. . .. . 134
4.4. 1. Sesgo de vigilancia medica (0 de detecci6n) 134
4.4.2. Sesgos . .. . .. . 136
Se.\go de incidencia-prevalellcia 136
Sesgo temporal . . . . . . . 139
4.4.3. Sesgos relacionados con la evaluaci6n de las intervenciones
de tamizaje . .. . .. . .. . 14 1
Se.\go lie selecci6n .. .. . .. . 14 1
Se.\go de illcidellcia-prevaiellcia 142
Se.\go de anricipaci611 en eI diagll6stico 144
4.5. Sesgos al comunicar los resul tados del estudio: sesgo
de publicaci6n 149
Bi bli ograffa l SI
CAPITULO 5 La identilicacion de asociaciones no causales: confusion ISS
5.1. Introduccion . . .. . . .. . .. . . .. . .. . .. . ISS
5.2. La naturaleza de la asociadon entre el confusor, la exposicion
y el desenlace . .. . .. .... . .. . .. . 157
5.2. 1. Regia general . . . .. . .. . .. . 157
5.2.2. Elementos de la regia general para la defi nic ion de la presencia
de confusi6n . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
La vari able de confusion esta causal mente asociada
con el desenlace . .. .. . .. . 159
EI desellillce eJ1li asociado, casualmellte 0 no,
COli la eJ.pOJ"ici6n .. .. . .. . .. . . . . . . . . . . . 160
Pero 110 es ulla variable intermedia en ia cadena callsal
entre ill eJ.posici611 y eI desenlace . . .. . .. . 160
5.2.3. Excepc iones de la regia general para la presenci a
de confusi6n .. . . .. . .. . .. . . .. . .. . .. . 16 1
Confllsi611 debida a asociaciolles aleatorias . . 16 1
El confusor como variable illtenlledia ell la cadella causal
lie la relaci6n entre exposici611 y deJelllace . . . . . 162
Correlaci611 excesira entre eI ("ollji/sor y la exposici611
de inreres . . .. . . .. . .. . .. . . .. . .. . .. . 164
XII CONTENlDO
5.3 . Evaluaci6n de la presencia de confusion . . . .. . .. . 166
5.3 .1. i, Esta relacionada la variable de confusi6n con la exposici6n
y con el desenlace del proceso estudiado? . . . .. . .. . .. . 167
5.3 .2. i,Tiene la misma direcci6n e identica magnit ud la asociaci6n
exposici6n-desenlace observada en el analisis crudo que las
asoc iaciones observadas dentro del estrato de la vari able
confusora? . .. . .. .. . .. .. . .. . .. . . .. . .. . 168
5.3.3 . i. Tiene la asociaci6n exposicion-desenlace observada en el
anal isis cmdo idemica direcci6n y magnitud a la observada
despues del control (aj uste) por la variable confusora? . . 169
5 .4. Elementos adic ionales relacionados con la confusion . . .. . 172
5.4.1. La importancia de utili zar diferentes estrategias para evaluar
la confusion .. . .. .. . .. .. . .. . .. . . . . . . . . 172
5.4.2. La confusion no es un fenomeno de Iodo 0 . . 173
5.4.3 . Confusion residual . . . . . . . . .. . .. . . .. . .. . 174
5.4.4. Tipos de efec(Os de confusion: confusion negativa, posit iva
y cualitati va>, . . . . . . . . . . . . . . . . . . . . 175
5 .4.5. Signi fi cadon estadfstica en la evaluac ion de la confusion 177
5.4.6. Confusion condidonal 178
5.4.7. Confusion y sesgo .. . .. .. 178
5 .5 . Concl usion 18 1
Bi bliograffa .. . 182
CAPITULO 6 Definicion y eVlllullcioll de III heterogeneidlld de erect os:
Interaccion . .. . .. . 183
6 .1. Introducd6n .. .. . .. . .. .. . .. .. . .. 183
6 .2 . se mide el efec(O? . . . . . .. . .. 184
6.3 . Estrategias para evaluar la interacd6n 184
6.3 .1. Evaluad6n de la homogeneidad de efectos . . 184
Defeccion de interaccion adifivu: la diferencia absolufa
o lIIodelo de riesgo atribllible . . .. . . .. . .. . .. . 186
Defeccion de interaccion IIIl1lfiplicativa: la diJerencia relativa
o lIIodelo lie razon .. . .. .. . .. . .. . . . . . . . . 188
6.3 .2. Comparacion de efectos conj umos observados yesperados 189
Defeccion de interaccion adifiva: la diferencia absolufa
o lIIodelo del riesgo atribllible . . . .. . .. . .. . 189
Defeccion de interaccion IIIl1lfiplicariva: la diferencia relativa
o eI lIIodeio de razon . .. .. . .. . .. . . . . . . . . 192
6.3.3 . Ejempl os de evaluacion de interaccion en un estudio
de cohorte . . . . . . . . . . . . . . . . . . . . . . 193
6 .4. Evaluacion de la interacd6n en estudios de casos y comroles 195
6.4 .1. Evaluaci6n de homogeneidad de efectos . .. . .. . 196
6.4.2. Comparacion de efectos conj umos observados yesperados 198
Defeccion lie interaccion adifiva .. . 198
Defeccion lie interaccion IIIl1lfiplicariva 20 1
6 .5 . Mas acerca de la intercambiabilidad de las definiciones
de interaccion 203
CONTENI DO
XI[[
6.6. ~ C u a J es el modelo relevante?: Interacci6n aditiva frente a interaccion
multiplicati va . . . . . . . . . . . . . . . . . . . . . . 204
6.7. La naturaleza y rec iproc idad de la interacci6n . . .. . 206
6.7. 1. Interacci6n cualitativa frente a interacci6n cuant it at iva 206
6.7.2. Reci procidad de la imeracci6n . . . . . . . . . 208
6.8. Interacci on, efecto de confusion y aj uste .. . .. . .. . 209
6.9. Modelaci6n estadfstica y pruebas estadfsticas para la interacci6n 2 1 1
6. 10. Int erpretaci6n de la interaccion .. . . . . . . . . 2 11
6. 10.1. Heterogeneidad debida a variabilidad aleatoria 2 12
6. 10.2. Heterogeneidad debida a la confusi6n . . .. . 2 12
6. 10.3. Heterogeneidad debida al sesgo . . . . . . . . . . 2 14
6. 10.4. Heterogeneidad debida a la intensidad diferencial
delaexposicion . . . .. . .. . .. . . .. . .. . 2 14
6. 10.5. Interacci6n y fac(Qres del huesped 2 15
6.11. Imeracci6n y busqueda de nuevos factores de riesgo en grupos de bajo
ri esgo . . . . . . . . . . . . . . . . . . .. . .. . .. .
6. 12. Imeracci6n y representat iv idad de las asociaciones
Bi bliograffa . . . . . . . . . . . . . . . .. . .. .
PARTE IV
EL DESAFio DE LA VALIDACI6N
CAPITULO 7 Estratilicaci6n y ajuste: Amllisis multivariante
en epidemiologia . . . . . . . . . . . .. . .. .
7.1. Introducci6n . . .. . . . . . . . . . .. . .. . .. .
7.2. Tecnicas de estratificaci6n y aj uste para resolver el problema
de la confusion .. . .. . . .. . .. . .. .
7.2. 1. ESlratificaci6n y ajllste: supues(Os . .
7.3 . Me(odos de aj uste basados en la estratificaci6n
7.4.
7.3. 1. A juste direc(o . . . .. . .. . .. .
7.3.2. Ajuste indirecto . .. . .. .
7.3.3. Metodo de Mantel-Haenszel para ajustar la estimaci6n
de una medida de asociaci6n . .. . .. .
Razon de tasa.\ ajusradas seglin Mantel- Haenszel . . .
Metoda de Mamel- Haemzel y el odds rat io para daro.\
de casos y commIes emparejados . .. .. . .. .
7.3.4. Li mitaciones del aj uste con metodos basados
en la estratificaci6n .. .. . .. .
Tecnicas de regresi6n multi ple para el aj uste .. .
7.4. 1. Regresi6n li neal: Conceptos generales .. .
7.4.2. Regresi6n li neal mult iple .. .
7.4.3. Regresi6n logfsti ca multi ple
7.4.4. Modelo de ri esgos proporcionales de Cox
7.4.5. Regresi6n de Poisson .. . .. . .. .
7.4.6. NOla sobre modelos para el an<i. li sis mult ivariame de datos
procedemes de estudios de casos y commies emparejados
216
218
2 19
22 1
223
223
223
228
229
229
235
238
240
240
242
244
245
252
258
265
269
y anidados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1
XI V CONTENlDO
7.4.7. Modelaci6n de las relaciones no lineales con modclos
de regresi6n li neal .. . .. .. . .. . .. . . . . . . . . 275
Usa de variables indicadams (dummy) . . .. . .. . 277
Teenicas alfernarivas IJara fa motielaci6n de asociaciones
110 lineale.\" . .. . .. .. . .. .. . .. . .. . . .. . .. . 281
7.4.8. Pmebas estadisticas e imervalos de confianza para
las esti maciones de la regresi6n 284
7.5. Aj uste incompleto: Confusi6n residual 285
7.6. Sobreaj ustes . . . . . . . 288
7.7. Conclusion . . . . . . . . . 288
7.7.1. Selecci6n del modelo estadfstico correcto 292
Bibli ograffa .. . . . . . . . . . . . . . . . . . . . . . . . . 293
CAPITULO 8 Aseguramiento y control de la calidad 297
8.1. Introducci6n .. .. . .. . .. .. . .. .. . .. . .. . 297
8.2. Aseguramiemo de la calidad .. .. . .. . .. . 299
8.2.1. Protocolo del est udio y manuales de operacion . . 300
8.2.2. Instrumentos para la recolecci6n de los datos 301
8.2.3 . Entrenamiento del equipo de investigadores 301
8.2.4. Estudios pilolO y pruebas previas . . . 302
8.3 . Control de cali dad . .. . .. . . .. . .. . 303
8.3.1. Verificacion de las observaciones y valoraci6n
de las tendencias . . . . . . . . . . . . . . . . 303
8.3 .2. Estudios de validez . . . . . .. . .. . .. . 304
!ll ezclas estalldarizadas para mediciones
de laboratorio . . . . . . . . . . . . . 305
Dtros enfoques para naminar la validez 306
Disponibilidad y validez de los dato.\ de e.\tudio.\ previo.\ 307
Importancia y limitacione.\ de 10.\ e.\rudio.\ de validez 307
8.3.3 . Estudios de fiabilidad . . . . . . . . . . . . . . . . . . . . . . 309
8.4. indices de validez y fiabilidad . . . . . . . . . . . . . . . . . . . . . 313
8.4.1. indices de validezlfiabilidad para datos categ6ricos 313
Semihilidad y especiJicidad 313
El estadfstico J de YOllden . . .. . 320
Porcenraje de aCi/erdo .. .. . .. 320
Porcenraje de aCllerdos posirivo.\ 324
E.\tadfstico kappa. . . . . . . . . . . 324
Kap/Ja IJonderado . . 327
Dependencia de kaPIJa de la prevalencia 332
8.4.2. indices de validez y fi abilidad para datos continuos 335
Gr(ijico de correlaci6n (Diagrama de dispersi6n}.. . 336
Coejiciente de correlaci6n lineal, Correlaci611 de rall1;0.\ ,
Regresi6n lineal .. . . . . . . . . 338
Coejicienre de correlaci6n intraclcisico 342
Diferencia media y prlleba ( pareada 343
Coejicienre de variahilidad 344
Grcijico de Bland-Altman . . . . . . . . . 345
CONTENI DO
8.5. Regresion a la media
Bibliograffa . .. . .. .
PARTE V
COMUNI CACl6N DE RESULTADOS ....... ..................... .
CAPITULO 9 La comunicaci6n de los resultados de la investigaci6n
epidemiol6gica
9.1. Introduccion . . .. . . . . . . . . . .. . .. . .. .
9.2. Que comunicar .. . . .. . .. . .. .
9.2. 1. Objetivos del est udio y/o hip6tesis que se desarrollan durame
su concepci6n . . . . . . . . . . . . . .. . .. . .. .
9.2.2. Descripcion de la validez y la fiabilidad de los instmmentos
para la recolecci6n de datos . . . . . . . . .. . .. .
9.2.3. Razonamiento para la selecci6n de las variables confusoras . .
9.2.4. Criterios para Ia seIecci6n de puntos de corte cuando
se establecen categorfas para variables cominuas u ordinales
9.2.5. Datos no y parsimoniosamente modelados frente
a completameme modelados
9.2.6. Evaluaci6n de la inleracci6n . .. .
9.3. Como comunicar . . . .. . .. .
9.3. 1. Evitar la arrogancia cientffica .. .
9.3.2. Evitar la verbosidad
9.3.3. Faci litar la leclUra . .. .. . .. .
MetOl/OS Y
9.3.4. Realizar inferencias apropiadas
La presencia de /lIW a.wciaci6n (mil/que sea eJrad6ficamenfe
significuriva) /10 rejleja lIecesariamente cau.wlidad
La sigllificaci6n eSfadfsrica no es tllla medida de lafuerza
lie IIna asociaci6n . . . . . . . . . . . . . .. . .. . .. .
La magnirud de 10.\ eJrimadore.\ de la asociaci611 de la.\ disrinta.\
xv
346
347
351
353
353
353
353
355
356
357
357
358
358
358
358
359
360
360
360
36 1
variables pilule 110 ser direclamellre comparable 363
9.3.5. Tablas y figuras 364
Tablas . . 364
Figuras 366
9.4. Conclusiones . . 37 1
Bi bliograffa 372
APENDI CE A Errores estandar, intervalos de confianza, y pruebas
de hip6tesis para medidas seleccionadas de riesgo
y de osocioci6n
Contenidos . .. . .. . .. .
Introduccion . .. .. . .. . . .. . .. . .. .
A. 1. Estimaci6n de supervivencia acumulada
Varianza y error estandar (formula de Greenwood)
Intervalo de confianza aI 95% . .. . .. .
375
375
375
377
377
377
XVI CONTENlDO
A.2. Tasa de incidencia (por persona ti empo) 378
Intcrvalo de confianza al 95% . .. . .. . 378
A.3. Ri esgo relativo y raz6n de tasas .. . .. . 379
Riesgo relat ivo (raz6n de probabilidades) 379
Error csflintiar . .. . .. . 380
Infervalo de conjiullZu af 95% . . 380
Prucha de hil'orc.I'is .. . 380
Ejcmplo . .. .. . .. . .. . 381
Raz6n de tasas (raz6n de densidades de incidencias) . . 381
Infervalo de cOl/jiuuza a195% . . .. . .. . 381
Pruchas de hiporcsiJ" . .. . .. .. . .. . .. . 382
A.4. Odd.\" ratio (emparejados y no emparejados) 383
Estudio de casos y controles no emparejados 383
Error esflindar . .. . .. . 383
infer valo de confiullZu af 95% . . .. . .. . 383
Prucha de hiporesis .. .. . .. .. . .. . .. . 384
Estudio de casos y controles emparejados 384
Error esflindar . .. . .. . 385
infer valo de conjianza al 95% . . 385
Prueba de hil'ofesis .. . 383
A.5. Ri esgo atribuible 384
Riesgo atribuible en expuestos 384
Riesgo atribuible porcentual en los expuestos (%RAoxp) 384
Riesgo atribuible porcentual en la poblaci6n (%RApob) 384
Error esflindar . .. . .. . 385
Infer valo de conjianza al 95% . . .. . .. . 385
Prueba de hil'ofesis .. .. . .. .. . .. . .. . 385
A.6. Diferenda entre dos tasas ajustadas 0 probabilidades (metodo directo) 388
Error esflindar . .. . .. . 388
Infer valo de conjianza al 95% 389
Prueba de hil'ofesis .. . 389
A.7. Raz6n estandari zada de monalidad 390
Minima variunza esflindar infervalo de conjianza al 95% 390
A.8. de Mantel-Haemzel (y raz6n de tasas) 391
Error esflindar . .. . .. . 391
Infer valo de colljiallza al 95% . . 392
P/"lleba de hil'ofesis .. . 392
A.9. Coeficiente de regresi6n .. . .. .. 393
Infer valo de conjiunza al 95% . . 393
P/"lleba de hil'ofesis 393
Regresi6n lineal .. . .. . 394
Regresi6n /ogfsfica . . . . 394
Estadfstico de Wald para la interacci6n 395
A.iO. Sensibilidad, especificidad y porcentaj e de acuerdo 395
Error esflindar, infervalo de conjianza al 95% 395
Sensibilidad .. . .. . .. . 396
ESl'ecijiciliad . . .. . 396
Porcentaje de ao/erdo .. . .. . , 396
CONTENI DO
A.1I . Estadfstico J de Youden
Error estandar, intervalo de confianza
A.1 2. Kappa . .. .. . .. . .. . . .. . .. . .. .
Error estandar e imervalo de confi anza al 95%
Bibli ograffa . . . . . . . . .. . .. .
APENDI CE B l'ruebas de tendencia (dosis-respuesta)
Eje mpl o . . . . .. . .. .
Notas . . .. . . .. . .. . .. .
Prueba multivariada de tendencia
Bibli ograffa
APENDI CE C l'rueba de homogeneidad de estimados estratificados
(prueba de interaccion) . .. . .. .
Ejempl o: pmeba de homogeneidad de OR eSlral ificados
Bibliograffa . . . . . . . . . . . . . . . .. . .. .
APENDI CE D Manual de procedimi entos para el aseguramiento
de la calidad y control de la calidad de las mediciones
de presion arterial y la recoleccion de orina y sangre
en el estudio ARIC to . . . . . . .
Tension anerial sentado . . . . . . . . .. . .. .
I . Breve descri pci6n de los procedimientos para la medic i6n
de tensi6n arteri al sentado y medidas relacionadas para el
aseguramient o de la caUdad y control de caUdad . . .. ... .
2 . Mant enimiento del equipo . .. . .. .
3. Cont rol del desempefi o del tecnico por pane del centro cl fnico . . .
4 . Recogida de los datos de identificaci6n del part ici pante . .. . .. . .
5 . Medici6n de la circunferencia del brazo y selecci6n del manguito
de tension art erial .. .. . .. . .. . . . . . . . . . .. . .. .
6 . Postura del part ici pant e y descanso antes de la medici6n
de tension art erial .. .. . .. . .. . . .. . .. .
7 . AnaUsis del control de caUdad del cent ro coordinador . .
Recolecci6n y procesamiemo de sangre y orina .. .. . .. . .. .
1. Breve descripci6n de la recolecci6n y procesamiento de sangre
y las medidas relaci onadas con el aseguramiemo de la caUdad
y cont rol de la cali dad . . .. . .. .
2 . Mant enimiento del equipo
3. Adhesi6n de los panici pantes al protocolo
4 . Mant eni mient o de la suficiencia
5 . Observacion peri 6dica .. .. . .. .
6 . EI fonnulario de laboratorio .. .
7 . Datos repUcados de control de caUdad
8. AnaUsis de los datos de veni puntura y procesamiento
para control de calidad . .. . .. . . .. . .. .
XVII
397
397
397
397
399
40 1
402
402
404
404
405
406
407
409
409
409
410
410
4 11
4 11
412
412
412
412
413
413
414
414
414
415
415
XVIII CONTENlDO
9. Muestras de paquetes para el embarque
a los laboratori os . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 16
10. Descri pci6n de la recolecci6n y del procesamiento de orina
y medidas relacionadas para el aseguramiento de la calidad
y el control de la calidad . . . . . . . . . . . . 4 17
II. Preparaci6n de las muestras para control de cali dad 4 17
12. Programa del control de cali dad de la orina . .. . .. . 4 17
13. Requerimientos de control de calidad de la muestra 4 17
14. Fonnul ari os de laboratori o y fantasma 4 18
15. Preparaci6n de la muestra . . . . . . . . . . . 4 18
16. Procedimiento para muestras pequefias 4 18
17. Instmcciones de almacenamiento . . .. . 4 19
18. Aseguramiento de la calidad y control de calidad . . 4 19
APENDI CE E Calculo del coeficiente de correlaci6n intraclasico 42 1
Analisis de la varianza 42 1
Metodo de Deyo 42 1
Bibliograffa 42 1
I NDICE .. . .. . 425
PRESENTACION
El papel de la epidemiologfa, los conceptos que maneja y los mNodos con que opera
han venido recibiendo creciente atenci6n y reconocimiento, tanto por parte de perso-
nas procedentes de la medicina academica y las agendas gubemamentales, como de
la industria y el mundo de la polftica. ES(Q ha dado lugar a la publicaci6n de nLl me-
rosos li bros y a la aparicion de abundantes programas para graduados, incl uyendo
media docena de ClIfSOS de verano. Tales esfuerzos se orientan a mejorar la prepara-
cion de estudiantes y personal de la salud publ ica y la medic ina y se proponen sat is-
facer lI na notable demanda practica al proveerlos de las habilidades y los conoci-
mientos necesarios para desempefiarse en esta materia.
Hay vados libros sobre epidemiologfa de nivel introducfQrio y tambien textos
dedicados a areas especfficas de aplicaci6n; pero hay pocos libros de nivel avanzado.
Este volumen de Epidemiologfa inlermedia: conceptos y resulta en este
contexto significat ivo, puesto que procura cubri r una laguna de larga data y que
reclama la existencia de un li bro de nivel intermedio.
En este libro usted adqui rira conocimientos acerca de estudios de cohone yestu-
dios de casos y controles anidados, anaJisis de cohone de recien nacidos, estudios
ecol6gicos, incidencia acumulada. medidas de asociaci6n, confusi6n, interacci6n,
medidas de fiabilidad y validez, y muchas noc iones conexas. Hall ara una expl ica-
cion clara sobre las diversas formas que puede asumir el sesgo, fen6meno tan fre-
cuentemente encontrado en epidemiologfa, y de las diferentes maneras para evitar 0,
al menos, mitigar sus efectos de manera efect iva.
Conceptos complejos como la confusi6n, las interacciones y la modelaci6n esta-
dfstica se presentan de manera tal que se toman no solo faci lmente comprensibles
sino tambien diffc il es de olvidar, 10 cual se consigue mediante el uso flexible y
expresivo que hacen los autores de graficos y diagramas, el manejo oportuno de
ejemplos y el empleo de una redacci6n clara.
EI lector oblendra buena comprens i6n de los mdodos epidemiol6gicos y del
fmct uow papel que ell os desempefian en las ciencias medicas y la salud publica.
EI profesional de la salud del fut uro necesitara tener una amplia comprensi6n de
aspectos metodol6gicos, asf como una capacidad crftica en lomo a su aplicaci6n ade-
cuada con la finalidad de investigar la causa de la enfermedad y desarroll ar y eval uar
estrategias de intervencion. Si eI propOsito es hall ar la causa de la enfermedad, evaluar
el impacfQ de un programa en el estado de salud de la poblaci6n 0 desarroll ar una polf-
fica apropiada, la epidemiologfa es la ciencia que corresponde emplear,
Michel A.lhrahim, MD, PhD
Prof nor de t'J!idemiologra y Medicina Social
Unil'CfJidad de North Carolina at Chapel Ifill
Chapel Ifill, North Carolina
PREFACIO
Este !ibro fue concebido como un tcxto de epidemiologfa intermedia. Como taL
explora y discute conceptos y metodos claves de la epidemiologfa con mayor pro-
fund idad que la que predomina en lexlOS basicos de esta materia.
Como texto dedicado a metodos intermedios. el li bro aspira a comar con una
ampli a garna de lcctores potencial mente imeresados. Algunos seran estudiantes de
epi demiologfa que pueden emplearl o como un puente entre los metodos epi demio-
16gicos basicos y los mas avanzados . Tambien puede abarcar a quienes procuran
Icner un conocimiento avanzado. mas ali a de los princi pios epidemiol6gicos basi-
cos y de los me!Odos mas simples pero que no tienen la versaci6n estadfstica ncce-
sari a para comprender alguno de los texlOs sobre epidemiologia que. siendo exce-
lemes, pueden result ar para ellos demasiado matematicos . Aunque la
demostraci6n de muchos conceptos y metodos epidemiol6gicos han de descansar
ineludiblememe en fonn ul aciones estadfsticas, en este li bro tales formu laciones
estan extensameme apoyadas en ejemplos de la vida reaL con 10 que se imenta
faci litar el proceso de comprens ion a traves de la imuici6n. Por su parte, el epide-
mi610go pni.ctico tambitn puedc hallar zonas sclcccionadas dc cste li bro que resul -
ten ti tHes para comprender nociones que van mas alia de 10 basico. Asf. los rasgos
comunes de los lectores a quienes se di ri ge el texto son: la famili aridad con las
estrategias fundamemales de la epidemiologfa analftica y el deseo de incrementar
el nivel de dominio de diversas nociones que son cubiertas de manera mas 0
menos insuficiente en muchos li bros de texlO basicos. La manera en que se organi-
za el li bro debe comribuir a que se comprenda faci lmente 10 que acaba de expre-
sarse.
En el Capitulo I se revi san las est rategias basicas de investigaci6n epidemiol6gi-
ca en el marco observacional, inc luyendo tanto las que se ocupan de est udios de gru-
pos como de individuos , Aunque la epidemiologfa descri ptiva no constituye el cen-
tro del libro, los anal isis de cohortes generacionales se disc uten con alguna
profundidad en este capitulo, puesto que se (rata de un enfoque escasamente aborda-
do en detall e en los libros basicos , Un recurso que se ubica en la fromera entre la
epidemiologia analftica y la descriptiva, los estudios ecol6gicos, se examina desde
una perspectiva mas abarcadora que la mera discusi6n sabre la posibilidad de come-
ler un sesgo inferencial (ecoI6gico) . A cominuaci6n, el capitulo examina los est u-
dios obscrvac ionalcs donde las unidades dc obscrvaci6n son los individuos - esto
es - , estudios de casos y controles y de cohorte. Se revi san dife rentes disefios de
estudios de casos y comroles (basados en casos. est udios de casos y comroles dentro
de una cohone definida). Tambien se considera brevememe la estrategia de reali zar
emparejamiemos como procedimiento para lograr por antic ipado una colecci6n de
datos comparables .
XXII PREFACIO
Los Capftulos 2 y 3 cubren aspectos relacionados con las maneras de cuamificar
la frecuencia con que se producen los desenlaces
'
de los procesos estudiados y de
medi r la asociacion. En el CapItulo 2 se estudian las medidas absolutas de la fre-
cuencia de los desenlaces y los metodos de calculo correspondientes, 10 cual incl uye
el enfoque de persona-tiempo para el d lculo de la densidad de incidencia y el calcu-
10 de la inci dencia acumulada. tanto por el metoda de las lablas de vida clasicas
como por el de Kaplan-Meier. EI Capitulo 3 aborda el lema de la medicion de la aso-
ciacion; en especial se ocupa de las medidas que se basan en diferencias relalivas
(por ejemplo. ri esgo relativo y odds ratio!) y diferencias absolutas (ri esgo at ri bui -
ble).
Se pone enfasis en el examen de la conexion existente entre medidas de asocia-
cion oblenidas en estudios de cohorte y estudios de casos y comroles . En particul ar.
se da una descripcion de las dife rentes medidas de asociacion (es deci r, odd.\ ratio.
riesgo relativo y razon de riesgos) que pueden obtenerse mediante est udios de casos
y controles como una funcion de las estrategias de seleccion de controles introduci-
das en el Capitulo I .
Los Caplt ul os 4 y 5 se concentran en el escrutinio de los problemas que amenazan
la vali dez de los estudios epidemiologicos: los sesgos y la confusion. Las forma<; mas
comunes de sesgos son objeto de discusion en el CapIt ulo 4. donde se encaran tanto
los de seleccion como los de informaciOn. En la discusion de estos Uiti mos se exponen
ejemplos senci llos con la finalidad de incrementar la comprension del lector acerca de
los fenomenos de clasificacion equivocada 0 erronea, resultantes del hecho de que tan-
(0 la sensibilidad como la especificidad di stan de ser perfectas en los enfoques que se
emplean para evaluar la exposicion. los desenlaces, y/o la<; variables de confusion. Este
capItulo tambien recoge una di scus ion acerca de sesgos Iransversales y sesgos asoc ia-
dos con la evaluacion de procedimientos de cri bado: con respec(O a estos Lilti mos se
ofrece un rec ufSo simple para est imar el sesgo de tiempo (lead tillle bias), potencial-
mente ut i! para quienes estan envuelt os en estudios de evaluacion de este tipo. En el
Capitulo 5 se introduce el concep(O de confusion y se desarroll an diversa<; altemat ivas
para evaluar su presencia. Se consideran asimismo a<;pectos especiales relacionados
con este import ante concepto, en especial el de confusion residual y el papel de la sig-
nifi cacion estadlstica para la evaluacion de los efectos de confusion.
La interaccion (modificacion de efectos) se aborda en el CapItulo 6. donde el
concepto se di scut e poniendo enfasis en un enfoque pragmatico y en las estrategias
para evaluar la presencia de interacciones aditivas y multi plicativas. En este capItulo
se valoran aspectos practicos tales como la pertinencia de reali zar aj ustes cuando se
sospecha la existencia de imeraccion. aSI como la importancia de los modelos aditi-
vos en el marco de la salud publica.
I EI tcrmiJl{} Oil/COllie, cuya tr..!duccion liter..!1 serfa resultado, por 10 gener..!1 se tr..!duce a 10 largo
de este libro como desenlace, tcrnli no que nos parece mas espccffico y mas acordc al espfri tu del
que ti ene en epidcmiologia. para indicar el modo en que cond uye cierto proceso. (N de los T)
- Es aclar.lr que en este libro Se ha oplado por no traduci r al castellano algunas pocas
expresiones inglesas. Tal es el caso de odds ratio. Aunque se han realizado propuestas parcialmente
atractivas (por ejemplo. r.lzon de posibilidades 0 razon de oportunidades) y a pesar de las difi -
cult ades fonet icas que entr.liia la expresion ing!esa. hemos optado por JI{} traducirla. Dicha decision
se basa en que w nsideramos que la locuci6n ori ginal ha alcanzado difusion tan extendida que ya
const ituye un refe rente semant ico incorporado para la mayoria de los leclores y. sobre tOOo. en que
no hemos considerado optima ninguna de las alternativas valoradas. (N de los T)
XXII PREFACIO
Los Capftulos 2 y 3 cubren aspectos relacionados con las maneras de cuamificar
la frecuencia con que se producen los desenlaces
'
de los procesos estudiados y de
medi r la asociacion. En el CapItulo 2 se estudian las medidas absolutas de la fre-
cuencia de los desenlaces y los metodos de calculo correspondientes, 10 cual incl uye
el enfoque de persona-tiempo para el d lculo de la densidad de incidencia y el calcu-
10 de la inci dencia acumulada. tanto por el metoda de las lablas de vida clasicas
como por el de Kaplan-Meier. EI Capitulo 3 aborda el lema de la medicion de la aso-
ciacion; en especial se ocupa de las medidas que se basan en diferencias relalivas
(por ejemplo. ri esgo relativo y odds ratio!) y diferencias absolutas (ri esgo at ri bui -
ble).
Se pone enfasis en el examen de la conexion existente entre medidas de asocia-
cion oblenidas en estudios de cohorte y estudios de casos y comroles . En particul ar.
se da una descripcion de las dife rentes medidas de asociacion (es deci r, odd.\ ratio.
riesgo relativo y razon de riesgos) que pueden obtenerse mediante est udios de casos
y controles como una funcion de las estrategias de seleccion de controles introduci-
das en el Capitulo I .
Los Caplt ul os 4 y 5 se concentran en el escrutinio de los problemas que amenazan
la vali dez de los estudios epidemiologicos: los sesgos y la confusion. Las forma<; mas
comunes de sesgos son objeto de discusion en el CapIt ulo 4. donde se encaran tanto
los de seleccion como los de informaciOn. En la discusion de estos Uiti mos se exponen
ejemplos senci llos con la finalidad de incrementar la comprension del lector acerca de
los fenomenos de clasificacion equivocada 0 erronea, resultantes del hecho de que tan-
(0 la sensibilidad como la especificidad di stan de ser perfectas en los enfoques que se
emplean para evaluar la exposicion. los desenlaces, y/o la<; variables de confusion. Este
capItulo tambien recoge una di scus ion acerca de sesgos Iransversales y sesgos asoc ia-
dos con la evaluacion de procedimientos de cri bado: con respec(O a estos Lilti mos se
ofrece un rec ufSo simple para est imar el sesgo de tiempo (lead tillle bias), potencial-
mente ut i! para quienes estan envuelt os en estudios de evaluacion de este tipo. En el
Capitulo 5 se introduce el concep(O de confusion y se desarroll an diversa<; altemat ivas
para evaluar su presencia. Se consideran asimismo a<;pectos especiales relacionados
con este import ante concepto, en especial el de confusion residual y el papel de la sig-
nifi cacion estadlstica para la evaluacion de los efectos de confusion.
La interaccion (modificacion de efectos) se aborda en el CapItulo 6. donde el
concepto se di scut e poniendo enfasis en un enfoque pragmatico y en las estrategias
para evaluar la presencia de interacciones aditivas y multi plicativas. En este capItulo
se valoran aspectos practicos tales como la pertinencia de reali zar aj ustes cuando se
sospecha la existencia de imeraccion. aSI como la importancia de los modelos aditi-
vos en el marco de la salud publica.
I EI tcrmiJl{} Oil/COllie, cuya tr..!duccion liter..!1 serfa resultado, por 10 gener..!1 se tr..!duce a 10 largo
de este libro como desenlace, tcrnli no que nos parece mas espccffico y mas acordc al espfri tu del
que ti ene en epidcmiologia. para indicar el modo en que cond uye cierto proceso. (N de los T)
- Es aclar.lr que en este libro Se ha oplado por no traduci r al castellano algunas pocas
expresiones inglesas. Tal es el caso de odds ratio. Aunque se han realizado propuestas parcialmente
atractivas (por ejemplo. r.lzon de posibilidades 0 razon de oportunidades) y a pesar de las difi -
cult ades fonet icas que entr.liia la expresion ing!esa. hemos optado por JI{} traducirla. Dicha decision
se basa en que w nsideramos que la locuci6n ori ginal ha alcanzado difusion tan extendida que ya
const ituye un refe rente semant ico incorporado para la mayoria de los leclores y. sobre tOOo. en que
no hemos considerado optima ninguna de las alternativas valoradas. (N de los T)
PREFACIO XXIII
Los ultimos tres capltulos se destinan a examinar alternativas para manejar las
asechanzas que se ciernen sobre la validez de los resultados epidemiol6gicos. En el
Capitulo 7 se presentan estrategias para el ajuste de los factores de confusion. inclu-
yendo tanto los enfoques mas parsimoniosos (por ejemplo, el ajuste directo, el de
Mantel y Haenszel) como los mas complejos (por ejemplo. regresi6n multiple). Nos
detenemos en la selecci6n del metodo mas acorde para el est udio que se ll eva ade-
lante teniendo en cuenta el disefio empleado (por ejemplo. el metodo de riesgos pro-
porcionales de Cox para el an.i. li sis de datos de supervivencia 0 la regresi6n de Pois-
son para el analisis de tasas por personas-tiempo). EI Capitulo 8 contempla las
estrategias fundamentales para el control de cali dad en funcion de la prevencion y
del control de los errores de medici6n y los sesgos, asf como los enfoques cualitati-
vos y cuantitativos apropiados para el control de la calidad. Se consideran asimismo
las estrmegias analfticas mas frecuentemente empleadas para estimar la validez y la
fiabilidad de los datos obtenidos en los estudios epidemiologicos (por ejemplo. coe-
ftcientes de concordancia ponderado y no ponderado y coeficiente de correlacion).
Finalmente, el Capitulo 9 centra la mendon en un asunto crucial : la comunicaci6n
de result ados en los est udios epidemiol6gicos. Para subrayar la importancia de que
tales infonnes sean claros. se exponen ejemplos de errores que a menudo se presen-
tan cuando se informa acerca de datos epidemiologicos.
Tambien se agregan algunos anexos. Los apendices A, B, C Y E describen proce-
dimientos seleccionados de estadistica (por ejemplo. errores estandar y niveles de
confianza. pruebas de tendencia. pruebas de heterogeneidad de efectos, correlaci6n
intraclase) con la finalidad de ayudar al lector a evaluar mas detenidamente las
medidas de ri esgo y de asociacion disclllidas en el texto y para comunicar de manera
simple algunos procedimientos que no son faci les de hallar en los paquetes estadist i-
cos mas regulannente empleados tanto por los estudiantes de epidemiologfa . como
por quienes emplean esta di sdpli na con fines practicos . Finalmente. el apendice 0
incluye dos secciones sobre el aseguramiento de la calidad y procedimientos de con-
trol tomados de los correspondientes manual es del Atherosclerosis Risk aflli Com
mllnitie.\" Study (est udio ARIC); estos constituyen ejemplos de aplicaciones en la
vida real de algunos de los procedimi entos discmidos en el Capitulo 8.
Instamos a que los lectores visiten la pagina web creada para este libro
(hUp:llpublichealthJbpub.com/epidemiology/szklo) y a que nos envfen por
correo electr6nico sus comentarios. Agradeceremos en especial que nos comuniquen
los errores que pudieran hallar. las advertencias sobre pasajes no sufici entemente
claros y las sugerencias de mejorfa que nos pudieran hacer.
Todas las contribuciones significativas seran debidamente reconocidas en la pro-
xima edici6n y cualqui er correcci6n a los errores en eI texto sera consignada en
dicho sitio.
RECONOCIMIENTOS
Este libro cs un dcrivado del curso de epidcmiologfa intcrmcdia (informa[mcntc cOllocido
como Epi 2) impartido por [os au/orcs en [a Escuela de Salud PUbli ca de [a Univcrsidad
John Hopkins. A [0 largo de los an()s, cl cursu se ha beneficiado del significati vo apoyo
intclectual brindado por muchos profcsores. Nuestro recollocimiento por clIo abarca, ent re
olms, a George W. Comstock, Helen Abbey, James Tonascia y Mary Meyer. Los autorcs
agmdeccn espccialmcnte a George W. Comstock. mentor de ambos, quicn ha cstado com-
prometido con cl cursu a [0 largo de muchas dccadas y min com parte [a actividad doccnte
con nosotros. Su profundo conocimiento de los metodos cpidemiol6gicos y su sabidurfa
han sido de gran valor instrumental a [0 largo de los anos pam nuestro crecimiento profe-
siona!. EI doctor Comstock tambien nos ha provcfdo amablemente de muchos de los mate-
riales y ejemplos empleados en cl ultimo capitulo de este libro.
Los jefes (actual y anterior) de nuestro departamento, Jon Samet y Leon Gordis res-
pectivamente. han apoyado consistentement e este empeno, por 10 cualnos sentimos pro-
fundamente agmdecidos. Nuestra gmtitud tambicn alcanza a nuestros buenos amigos
Alfonso Mel e, Paolo Pasquini, Rosa Maria Corona y a otros colegas de la Di visi6n de Epi -
demiologia dcllnstituto Superior Ita[iano pam [a Sa[ud, quicnes tan amab[cmentc nos pro
porcionaron un aporte logistico clave dumnte un ano sabatico disfrutado por uno de noso-
tros (MS) cuando se bosquejaban [as primeras versiones de algunos capitu[os.
Estamos en deuda con varios colegas, incluyendo a Eliseo Guallar, Joseph Coresh y
Woody Chambless, quienes leyeron secciones parcia[es del texto y nos dieron orientaci6n
pam [a soluci6n de problemas conceptuales 0 estadisticos, y a Michacl Silverberg por su
cuidadosa lectum del manuscrito y las fecundas sugerenci as editoria[es y sustantivas que
nos hizo llegar. Tambi en agradecemos a [os revisores, especia[mente a Ana Diez- Roux y a
Eyal Shahar, a quienes [a Editorial Aspen Publishers envi6 una de [as versiones mas tem-
pmnas del texto: nos sentimos en deuda por la laboriosa revisi6n y las criticas y sugeren-
cias nacidas de ese esfuerzo, muchas de las cuales tuvieron un impacto tangible en el tex-
to. Finalmente. expresamos nuestro agradecimiento a Jingzhong Ding por su ayuda en el
desarrollo de los grMicos y las t a b l a ~ , y a Rodney Palmer por su eficiente apoyo adminis-
trativo.
Haber tenido cl privilegio de ensenar Epi 2 dumnte tantos anos nos permiti6 com-
prender cuanto hemos aprendido de nuestros estudiantes, a quienes tambicn expresamos
nuestro sincero agradecimiento. Finalmente, cube dejar constancia de que, sin cl apoyo y
la extraordinaria paeiencia de todos los miembros de nuestras familias , desde fuego, no
hubieramos podido dedicar tanto tiempo y esfuerzo a la redacci6n de este libro.
PARTE I
INTRODUCCION
CAPITULO 1
Los diseiios basicos de estudios
en epidemiologfa analftica
1.1. INTRODUCCION: EI'IDEMIOLOGIA ANALITICA
Y EPIDEMIOLOGiA DESCRII'TIVA
La Epidemiologia ha sido tradicionalmente definida como el es(udio de la di st ribu-
cion y los detenninantes de los estados de salud 0 los eventos de salud en poblacio-
nes especfficas y la aplicacion de este est udio al control de los problemas de saiud(' ).
La epidemiologfa se ha clasificado como descriptiva>, 0 analft ica. En terminos
generales. la epidemiologia descripfivQ haec uso de los datos disponibles para exa-
minar c6mo las tasas (por ejemplo: de monalidad) varian de acuerdo a variables
dcmograficas (por ejemplo, las obtenidas de los ccnsos). Cuando la distribuci6n de
las tasas no es uniforme de acuerdo a persona, tiempo y lugar, el epidemi610go es
capaz, no solamente de definir grupos de alto ri esgo con propositos preventivos (ej,
la hipertension ti ene mayor prevalencia en los negros norteamerieanos que en los
blancos, 10 que define a los primeros como un gmpo de alto ri esgo), sino de generar
hipotesis causales basadas en el paradigma chisieo: agente-huesped-medio (por
ejemplo, la hipOtesis seglin la cual un factor ambiental al cual estan expuestos los
negros, tal como el consumo exces ivo de sal, es el responsable del ri esgo mayor de
hipertension arterial a que estan sometidos).
Una revision minuciosa de los enfoques de la epidemiologia descriptiva puede
encontrarse con facilidad en numerosas fuentes(! 3) . Por esta razon y, dado el alcance
general de este libro, este capitulo se centra en los disefios de los estudios relevantes
para la epidemiol ogfa analfrica. L1 uniea excepcion se encuentra en la Secci6n 1.2
de este capitulo, donde un tipo especial de estrategia descriptiva, el analisis de
collOrres de nacimienfOs, se discute brevemente. Las razones para esta excepci6n
son las siguientes: I) aunque la evaluaci6n de los datos de una cohort e de nacimien-
tos descansa a menudo, al igual que otros enfoques descriptivos, en la infonnaci6n
usualmente disponible, requiere de la aplicacion de un enfoque analitieo con un
nivel de complej idad que no es tfpieo de la epidemiologfa descriptiva; y 2) este tipo
de anal isis es no pocas veces la clave para la comprension de la asociacion observa-
da entre la edad (con frecuencia fuertemente asociada con la oc urrencia de muchas
enfermedades y con sus detenninantes) y la enfennedad en analisis transversales.
(Una raz6n adie ionaL de naturaleza mas pragmatiea. es que el anal isis de una cohor-
te de nacimientos no es por 10 general considerada en detalle en los textos basieos).
En los estudi os epidemiologicos analftieos se evallian hipOtesis relacionadas
con asociaciones entre posibles exposiciones a ciertos fac(ores de riesgo y los
desenlaces de procesos relacionados con la salud. Aunque algunos de los concep-
tos que se discuten en los capitulos subsigui entes, (ales como las medidas de aso-
4 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
dad6n y la interaccion, son lambicn relevames para los estudios experimentales (ensa-
yos clfnicos aleatorizados), este libro se concentra en la epidemiologfa observaciollal.
Se ut ili zan dos estrategias generales para 1a evaluaci6n de las asoc iaciones en los
est udios observacionales: 1) los estudios que ut ilizan poblaciones 0 grupos de indi-
viduos como unidades de observaci6n - los lI amados estlltiios ecol6gicos - y 2)
aquell os en que las unidades de observaci6n son los individuos: disefio prospecfivo
(0 de cohorte), est udi o de casas y controles y est udio transversal.
1.2. ANALlSIS DEL EFECTO DE LA EDAD, LA COHORTE
DE NACIMIENTOS Y EL PERIODO
L.1S encuestas de salud praclicadas a una mucslra de derta poblad6n bajo esmdio,
usualmente se aplican a sujetos ubicados en un amplio espectro de edades. La edad es
un trascendente factor de riesgo para muchos desenlaces de sal ud y a la vez Sllele estar
asociado con numerosas exposiciones . Por 10 tanto. aun cuando el efecto de la edad no
sea uno de los objetivos princi pales del est udio. es a menudo import ante evaluar su rela-
ci6n con exposiciones y desenlaces dado su reievante efecto potencialmente confusor.
La Tabla 1. 1 muestra los result ados de un est udio transversal hipotetico conduci-
do en 1995 para estimar las tasas de prevalencia de una enfermedad Y, de acuerdo a
la edad' . En la Figura 1. 1 se ubican estos result ados en los puntos medios de grupos
de edad de 10 afios (par ejemplo, para las edades 30-39, a los 35 afios; para las eda-
des 40-49, a los 45 afios; y asf sucesivamente). Los datos muestran que la prevalen-
cia de Yen esta poblaci6n decrece con la edad . i,Significa esto que las tasas de pre-
valencia de Y decrecen a medida que el individuo envejece? No necesariamente.
Para muchas enfennedades, las tienen efeclOs acumulat ivos que solo
se expresan tras largos intervalos de tiempo. Numerosas asociaciones
exposici6n/enfermedad se caracteri zan por producirse tras prolongados periodos de
latencia y como resultado de efectos acumulat ivos. Tal es el caso, por ejemplo, del
Tabla 1.1
Datos hipotCticos de un estudio transversal de prevalencia de la
enfermcdad Y en la pohl acion, por cdad, 1995
Grupo de edad (ai'ios)
3039
4049
SO-59
60-69
7079
Punto medlo (ai'ios)
35
45
55
65
75
Prevalencla en 1995 (por 1.000)
45
40
36
31
27
Un uso mas estriclo del termino lam como medida de la ocurrencia de evenlos incidentes. sc
define en la Secci6n 2.2.2. Este termino se uliliza lambien ampliamente en un senlido mas general
para aludir a proporciones tales como la prevalencia!l ). Es en esle senlido mas general que emplea-
mos el termino aqui y en otrds partes del libro.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 5
50
40

b
30
0
0
20

"
>

"
10
0
0 10 20 30 40 50 60 70 80
Edad (anos)
Figura I .1. Datos hipotCticos de UII estudio transversal de prevalencia de la enfermedad
Yen la poblacion, por edad, 1995 (basado ell los dat os de la Tabla 1.1)
vinculo entre habilO de fumar y cancer de pulm6n, radiaciones y cancer de tiroides e
ingesti6n de grasa sat urada y enfennedad ateroscler6tica. Por tanto, el estado de
salud de una persona que tiene 50 afios de edad en el momenta de la encuesta puede
depender parcial mente de sus eXjX)siciones pasadas (por ejemplo. habito de fumar
durante la edad adultajoven) . Esta variabilidad de las exposiciones pasadas en gene-
raciones sucesivas (cohortes de nacimiento' ) puede distorsionar las asoc iaciones
ent re la edad y los desenlaces de salud que se observan en un punto cualquiera del
tiempo. Este concepto se ilustra como sigue.
Supongamos que el mismo investigador que recogi6 los datos que se muestran en
la Tabla 1. 1 es capaz de recuperar los datos procedentes de encuestas previamente
aplicadas en la misma poblaci6n en 1965, 1975 Y 1985 . Los datos resultantes se pre-
sentan en la Tabla 1.2 y la Figura 1.2; para cada una de estas encuestas se pueden
apreciar tendencias consistentes de decrecimiento en la prevalencia de Y en la medi-
da que aumenta la edad . Considercmos ahora el grMico de estos dalOs ut ilizando un
enfoque diferente, tal como se haec en la Figura 1.3 .
Los puntos en la Figura 1.3 eslan en los mismos lugares que ocupan los de la
Figura 1.2 pero ahora las lfneas se conectan por cohorte de nacimiento.\ (la enc uesla
de 1995 tambien se ha incluido en la Figura 1.3) . Cada una de las lfneas discont inuas
representa una cohone de nacimientos que converge en la encuesta de 1995 . Por
ejemplo, el punto de la edad mas joven en la curva transversal de 1995 representa
la tasa de la enfermedad Y para individuos de 30 a 39 afios (promedio 35 afios) que
nacieron entre 1955 y 1964: es decir, en promedio en 1960. Los individuos en eSla
cohone de nacimientos de 1960 tenian en promedio 10 afios menos; esto es, 25 afios
CohortI' de lIacimiefllo (del latin cohon. guerreros, la dccima parte de una legion) 1'1 compo-
nente de la poblacion nacido durante un periodo particular I' identificado por periodo de nacimiento
de manera que sus cardcteristicas (por ejcmplo. causas de muerte y numero todavia vivo) puede con-
trolarse a medida que entrd en periodos sucesivos de tiempo y edad.
6 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Tabla 1.2
Datos hipotcticos de una serie de estudios transvefsales de prcvalcncia de 13
cllfcrmedad Y en una poblacioll , por edad y fceha de la cncuesta
(ticmpo calcndario), de 1965 a 1995
Fecha de la encuesta
Grupo de Punto medlo
edad (arios) (anos)
1965 1975 1985 1995
Prevalencia (por 1.000)
1019 15 17 28
20-29 25 14 23 35
30-39 35 12 19 30 45
40-49 45 10 18 26 40
50-59 55 15 22 36
60-69 65 20 31
70-79 75 27
de edad en el momenta de la enClIcsta de 1985, y 15 afios de edad en eI momenta de la
encuesta de 1975. Por 10 tanto, 1a linea para 1a cohortc de nacimientos de 1960 permilc
apreciar como la prevalencia de Y cambia con el 3umento de la edad para los indivi-
duos nacidos, en promedio, en 1960. Evidentemente, el patron de 1a cohortc mostrada
en 1a Figura 1.3 es muy difereme del que sugieren los datos transversales puesto que
hace pensar que la prevalencia de Y realmente aI/menta a medida que la poblacion
envejece, fenomeno que se produce consistentemente para todas las cohortes de naci-
mientos mostradas en la fi gura. El hecho de que se observe una tendencia inversa en
los datos transversales se debe en este ejemplo a un fuerte efecto de cohorte,, : vale
decir, la prevalencia de Y esla acusadameme determinada por el ano de nacimiento de
50
40

g
30
1995

0
1985
..
20

~ 1 9 6 5
1975
~
10
0
0 10 20 30 40 50
6(1
70 80
Edad (anos)
Figura 1.2. Datos hipotCticos de una serie de cstudios transversal cs de prevalencia de la
enfermedad Y en una poblacion, por edad, y fecha de la encuesta (tiempo calendario),
1965, 1975, 1985 Y 1995 (basado en los datos de la Tabla 1.2)
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
50
40
~ 30

g
~ 20
~
~
10
1950--
...
Edad (anas)
.'
7
Figura 1.3. Datos de 13 Fi gura 1.2 por cohorte de nacimient os (vease tambien la Tabla 1.3).
Las lineas punteadas representan la, diferentes cohortes de nacimientos (desde 1920 a
1960) a medida que convergen a la encuesta transversal de 1995 (]fnea s6lida como en la
Figura 1.1)
la persona. Para cualquier edad dada, la [asa de prevalencia es mayor en las cohorles
mas j6venes (mas recientes) que en las mas viejas . Por 10 tanto. en la encuesla trans-
versal del ano 1995 (Figura 1. 1), los sujetos mas viejos provenfan de cohorles de naci-
mientos con tasas relat ivamente mcnores. mientras que los mas jovenes proven fan de
cohortcs con tasas mas al[as. Esto puede apreciarse claramente en la Figura 1.3 selec-
eionando una edad (por ejemplo 45 anos) y observando que la [asa es la menor para la
cohorte de nacimientos de 1920 y que aumenta para cada cohorle de nacimientos sub-
secuente: es decir, las cohorles de 1930, de 1940 y de 1950 respectivamente.
Una exposici6n grafica alternativa de estos datos se puede apreciar en la Figura
1.4. En esta figu ra, las cohortes de naeimientos se ubican en la abscisa (eje x), y cada
!fnea representa el cambio a 10 largo de la cohorte de nacimientos para un gmpo de
edad dado. A menudo. la selecci6n entre es[as representaeiones graficas alt ernativas
es una cues[i6n de preferencia personal: es deci r, depende de cual sea el patron que el
invest igador desea resalt ar. Mienlras que en la Figura 1.4 se muestran las tendeneias
de acuerdo a las cohortes de naeimientos mas explkilamente (es deci r, para cualquier
gmpo de edad, la prevalencia aumenla en la medida que se va de las cohortes mas
viejas a las mas recientes), la Figura 1.3 tiene un alract ivo intuitivo en virlud de que
cada !fnea representa el envejecimiento de una cohorte de nacimientos .
Siempre que se preste atenci6n cuidadosa a los r6[ulos del grafico, cualquiera de
eSlas al[ernat ivas grMicas es apropiada para identificar los patrones de las cohortes.
Notese que los mismos patrones que emergen en las Figuras 1.3 y 1.4 pueden verse
en la Tabla 1.2, si vamos mirando hacia abajo para examinar las tendencias trans-
versales, y diagonalmente de izquierda a derecha para examinar las tendencias de
las cohortes de naeimientos. La Tabla 1.3 ofrece una ilus[raeion tabul ar al[ernativa
de los mismos datos, probablemente mas faei l de leer, que pennite el examen de las
tendeneias de acuerdo a la edad (<<efecto de la edad) denlro de cada cohorte de
8 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
50
35
40 45

55
25
30
%
b
. 75
7

0
0
20
~

>

"
10
0
1920 1930 1940 1950 1960
Cohorte de nacidos
Fi gura 1.4. Exposicion altcrnati va de los datos de las Figuras 1.2 y 1.3. Las cohones de
nacimientos eSlan representadas en et eje x. Las lfneas representan grupos de edad (identifi-
cados pof et punto medio. en aiios)
nacimientos (las Ifneas horizontales en dicha tabla) . Adicionalmente y en concOf-
dancia con la Figura 1.4, las lasas de prevalencia aumentan para carla grupo de edad
en la Tabla 1.3 desde las cahanes mas viejas a las mas rec ientes (efecto de cohor-
te)(que se detecta al mover los ojos de arriba abajo en carla columna de grupo de
edad en 1a tabla) .
Por 10 lamo, los datos del ejempl o anterior eMan afectados simult aneamente por
dos efec!Os de gran magnitud: el de cohorte y el de edad (para las defi niciones, vea-
se el Esquema 1. 1). Estas dos tendencias son responsables conjuntamente de la ten-
dencia aparentemente parad6j ica observada en el an.i. li sis transversal de este ejemplo
hipotetico (Figuras 1.1 y 1.2), en las cuales las tasas parecen decrecer con la edad.
EI hecho de que las cohortes mas recientes tengan tasas sustancialmente mayores
(efecto de cohorte) no permite apreciar eI aumento debido a la edad y explica el
patr6n transversal.
Tabla 1.3
Reorganizacion de los datos de la Tabla 1.2 segun cohort es de nacidos
Grupos de edad (punto medio en anos)
Recorrido de
ta cohorte
Punt o medio 15 25 35 45 55 65 75
de nacidos
Prevaiencia (por 1.000)
191524 1920 10 15 20 27
1925-34 1930 12 16 22 31
193544 1940 14 19 26 36
1945-54 1950 17 23 30 40
1955-64 1960 28 35 45
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
Eleelo de edad:
Esquema 1.1
Definicioncs de edad, cohorte y crectos de periodo
Cambio en la tasa de una condici6n de acuerdo a edad, independientemente
de la cohorte de nacimientos y det tiempo calendario.
Eleelo de eohorte: Cambio en la tasa de una condici6n de acuerdo al ano de nacimiento inde-
pendientemente de la edad y del tiempo calendario.
Eleelo de perlodo: Cambio en la tasa de una condici6n que alecta a toda una poblaci6n en
algun momento del tiempo, independientemente de la edad y de la coMrte
de nacimientos.
9
Ademas de los efectos de cohorte y de edad, los patrones de las tasas pueden
estar inlluidos por el lI amado efeclo de periodo. EI lermino efeero de I'eriodo se usa
frecuentemente para aludi r a un cambio global en las tendencias que afectan a las
lasas a traves de cohones de nac imientos y grupos de edad (Esquema 1. 1). Cualquier
fen6meno que ocurra en un punto espedfico del tiempo (0 durante un periodo espe-
dfico) que afecle a una poblaci6n entera (0 a un segmento significativo de ell a), tal
como una guerra, un nuevo tratamiento 0 una migraci6n masiva, puede producir este
cambio independientemente de la edad y de la cohone de nacimientos. Un ejemplo
hipoletico se recoge en la Figura 1.5. Esta figura mueSlra datos simil ares a los utili-
zados en el ejemplo anteri or (ej . Figura 1.3) excepto que en este caso las tasas redu-
cen su nivel en 1985 para lodas las cohort es (esto es, cuando la cohorte de 1960
liene 25 afios de edad en promedio, cuando la cohone de 1950 liene 35 afios de
edad en promedio, y asf sucesivamente).
Los efectos de periodo en las lasas de prevalencia pueden ocurri r, por ejemplo,
cuando se introducen nuevos medicamentos 0 medidas prevent ivas para enfermeda-
50
40
10
.. ... .
1960"-
.. ' .e .....
' 195q/
.' ......
.. 1940./ 1995
.' " .. " 1930 .. .. ~ ~ ~
~ : : .... . ~ 9 ..
o 10 211 30 40 50 60 70 80
Edad (arios)
Figura 1.5. Ejemplo hipotctico del crccto dc periodo: ocurri6 un evento en 1985 que afec-
t6 a todas las cohortes de nacimien\()s (de 1920 a 1960) de manera similar y disminuy61a
tasa de crecimiento con la edad. La linea s6lida representa el patr6n observado de edad trans-
versal en 1995.
10 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
des que previamente tcnian un pron6stico sombrfo, como en el caso de la introduc-
cion de la insulina, los ant ibi6ticos y las vac unas para la polio.
Es importante entcnder que los llamados cfcctos de cohorte de nacimientos pue-
den tener poco que vcr con las circunslancias que rorlean al momenta del nacimien-
to de una cahone dada de individuos. Los cfcctos de cahone pueden resultar mas
bien de una experiencia de toda la vida (que incluye las condiciones que rodean al
nacimiento, aunquc no se li mita a ell <l s) de los individuos nacidos en un punta dado
del tiempo que inll uye sobre la enfennedad 0 el desenlace de inten!s. Por ejemplo,
los patrones de asociaci6n que se observan acmaimente entre la edad y la enferme-
dad coronaria pueden ser el resultado de efectos de cohone relacionados con cam-
bios en la dieta (por ejempl o, consumo de grasas) 0 en el habito de fumar de adoles-
centes y adul tos j6venes en el tiempo. Es bien conocido que las lesiones
ateroseler6ticas de las coronarias ( estrias grasas) se desarroll an frecuentemente en
la pri mera decada de la vida(4) ; en las edades medianas y mayores, algunas de estas
lesiones pueden evolucionar hacia trastornos ateroescieroticos mayores, que even-
tualmente conducen a una trombosis, a una oel usi6n de la luz y a la manifestaci6n
el inica del trastorno isquemico agudo resul tante. Por 10 tanto, los habitos dieteticos
y/o tabaquicos de un adult o joven pueden infl uir sobre el desarrollo temprano de ate-
rosc lerosis y el subsiguiente riesgo coronario. Si los cambios en estos habitos ocu-
rren en la poblaci6n a 10 largo del tiempo, las cohones de nacimientos sucesivas
necesariamente atraviesan distintos grados de exposici6n a los factores aterogenicos
tempranos que determinaran en pane los futuros patrones transversales de aso-
ciacion entre la edad y la enfermedad coronaria.
Otm manera de entender el concepto de efecto de cohorte es apreciarlo como el
result ado de una interacci6n entre la edad y el tiempo calendario. EI concepto de inte-
mcdon se discute en detalle en el Capitulo 6. En terminos simples. significa que una
variable dada (por ejemplo, tiempo calendario en el caso de un efecto de cohorte) modi
fica la fuerza 0 la naturaleza de una asociaci6n entre otra variable (por ejemplo, la edad)
y un desenlace (ej. aterosclerosis coronaria). En el ejemplo anterior significa que el
desarroll o de la ateroscierosis relacionado con la edad cambia con el tiempo como resul -
tado de los fact ores de riesgo cambiantes (por ejemplo, habitos dieteticos 0 tabaquicos
de adultos jovenes) . En otras palabras, los cambios relacionados con el tiempo calenda-
rio en los factores de riesgo modi fican la asociaci6n entre la edad y la ateroscierosis.
EI anali sis cohorte-edad-periodo puede ser aplicado no solamente a datos de pre-
valencia, sino tambien a los de incidencia y de monalidad . Un ejemplo elasico 10
brinda eI est udio de Wade Hampton FroJ"t sobre los patrones de edad de la mortal i-
dad por tuberculosis(S) . La Figura 1.6 cont iene dos grMicos del trabajo pri ncipal de
Frost. Con relaci6n a la Figura 1.6A, Frost(s pag.94) anotaba que:
mirando la curva de 1930.la impresi6n que se tiene es que actualmente un individuo
esta sometido a un mayor riesgo de muerte por tuberculosis entre las edades 50 y 60.
Pero esto no es realmente asf: las personas que en 1930 confomlaban el grupo de edad
de 30 a 60 han pasado en edades mas tempranas a !raves de riesgos de mortalidad mtis
grande.l (ellCasis t:1l t:I urigillal).
Para demostrarlo, Frost expuso los datos de la cohorte de nacimientos que se
hallan en la Figura 1.68 , que ponen de manifiesto que para las cohones nacidas
entre 1870 y 1890, el riesgo de muerte por tuberculosis despues de los primeros afios
de vida es realmente mayor a las edades de 20 a 30 afios.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
SIlO
0
8 700
600
8.
500

400


200


100


0
SIlO
700
8
- 600
8.
o 500
0
"
..
"
..... . ...
10 20
A
Ano 1880
Aflo 1910
.. ... .... .............
" ..
..... ..
AnO
................ .... . .......... .
30 40 50 60
Edad en anos
B
400
g300
200 : .. COI]o C
Oliorre
100 \
187
0
.- 1900 CoMrte 1890
o Cohorte 1910
o 10 20 30 40 50 60
Edad en anos
70 80
70 80
II
Figura 1.6. AmHisis de Frost de la edad en relacion a la mortalidad por tuberculosis
(solo hombres). A: lasas de mortalidad por tuberculosis de Massachusetts. por edad. 1880.
1910.1930. B: tasas de mortalidad por tuberculosis de Massachusetts. por edad en cohor
les sucesivas de 10 aiios.
Fuente: tmpreso con permiso de WH Frost, The age-setection of Tuberculosis mortality in suc-
cessive decades. American Journal of Hygiene. vol. 30, 91 -96. 1939.
O[ro ejemplo mas reciente se recoge en la Figura 1.7, basado en un analisis de
efeclos de la edad, la cohorte y el periodo sobre la incidencia de cancer colorrectal
en una region de Espafia(b) . Notese que en estas figuras las cohortes de nacimienlos
se colocan en el eje x (como en la Figura 1.4). Estas fi guras revelan fuertes efectos
de cohorte: para cada grupo de edad, las lasas de incidencia de cancer colorrectal
[ienden a aumentar desde las cohortes de nacimientos mas viejas a las mas recientes.
Tambien se manifiesla claramente un efeclo de la edad, ya que para cada cohone
(cualquiera que sea el valor del ano de nacimiento dado en el eje horizontal), las
[asas son mayores para los individuos de mayor edad que para los mas j6venes.
N6tese [ambien que, probablemente debido al amplio recorrido de las lasas que han
12 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
r " H " ' m ~ b ' " ' " ' ______________ --,
1885 1900 1915 1930 1945
ana de nacimiento
Mujeres
F="------------,
1885 1900 1915 1930 1945
ana de nacimiento
Fi gura 1. 7. Tcndcncias en las tasas de incidcncia espccificas por cdad de cancer colo-
rrectal en Navarra y Zaragoza (Espana)
Fuente: Publicado con permiso de G. L6pez-Abenle Dt a/ .. Age-period cohort modeling of colome-
tal cancer incidence and mortality in Spain, Cancer Epidemiology. Biomarkers, and Prevention, vol 6,
999-1005, 1997, American Association for Cancer Research. Inc.
de ubicarse en el grafico , se ut ili z6 Ll na escala logarftmica en la ordenada. (Para LI lia
di sclI si6n mas amplia del uso de escalas logarftmicas como aiternati va a las aritmet i-
cas, vease el Capitulo 9, Secci6n 9.3 .5).
En la Figura 1.8 se incl uye un ejemplo adicional del analisis por edad, cohort e y
periodo de datos de incidencia. Esta fi gura muestra la incidencia de demencia entre
los residentes de Rochester, Minnesota, de 1975 a 1984(7) . Se trata de un ejemplo en
el cual hay un fuerte erecto de la edad - es decir, las tasas se incrementan notable-
mente con la edad para {Qdas las cohones de nacimientos - pero virtualmente no
existe efecto de cohorte, como indican los datos practicameme superpuestos de los
pares de cohones de nacimientos sucesivas para cada grupo de edad. Deberfa quedar
claro a part ir de la Figura 1.8 que, en ausencia de efec{Qs de cohorte, se encuentran
los mismos patrones de tasas por edad en las curvas transversales que en las curvas
de cohorte.
Los erectos de pericKlo asociados a las tasas de incidencia tienden a ser mas pro-
minentes para enfermedades para las cuales los efectos acumul ativos de exposicio-
nes previas, tales como enfermedades infecciosas y dafios accidentales, tienen relat i-
vamente poca importancia. Comrariamente, en las enfermedades cronicas como el
dncer y las cardiovasculares, los efec{Qs acumul at ivos son general mente imponan-
tes y, consec uentemente, los efectos de cohorte tienden a afectar las tasas de inciden-
cia en mayor grado que los efectos de periodo.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 13
Demencia Enfermedad de Alzheimer
8.000 8.000

Cohorte

de nacidos
8 6.000
6.000
I
....... 1930
...... 1925
8
g
.. . 1920
4.000
;;
4.000
....... 1915

.. . 1910

, ,
_ 1905
0 0
.. . 1900
/"

2.000
./
"
2.000 __

. . .--"
. . .. 1890
"
.. /
"
___ 1885
0 0
50 60 70 80 90 100 50 60 70 80 90 100
Edad en anos Edad en anos
Figura 1.8. Tasas promcdio en cinco alios de incidencia de demencia (casas nuevos
por 100.000 alios-persona) por edad y cohorte de nacimientos , ambos sexos combina-
dos , en Rochester, J\.1inncsota. Para cada cohorte de nacimientos se representan dos pun-
lOS que corresponden a la incidencia de 1965 a 1979 y de 1980 a 1984. respeclivamente.
Fuente: Impreso con permiso de VIA Rocca et al., Incidence of dementia and Alzheimer's
disease: A reanalysis of the Rochester, Minnesota 19751984 Data. American Journal of Epidemio-
logy, vol 148, n." 15162, 1998.
Finalmente, procede consignar que estos metodos tambien pueden utili zarse
para cSlUdiar otras variables adcmas dc las lasas dc inc idcncia, como sc ilustra en
la Figura 1.9. All f se refl eja el analis is de los cambios en los niveles de colesterol
serico re lacionados con la edad, hasados en los datos del Programa de Investiga-
ci6n Geriatrica de la Florida (Florida Ceria/ric Research Program), un programa
en ejecuci6n, disei'tado para proveer cribado medico grat uit o a los Esta
figu ra revela ligeros efeclos de cohOrle, ya que los niveles de colesterol serico
tienden a ser mas altos en las cohorl es mas viejas que en las mas recientes para la
mayorfa de los grupos de edad . Tambien se aprecia un patron de edad en forma de
J 0 de U: esto es, para cada cohOrle de nacimientos, los nive les de coleslerol serico
tienden primero a di sminui r 0 a mantenerse estables, y luego a aumentar hasta
alcanzar su va lor maximo en los integrantes mas viejos de la cohorte. Aunque a
pri mera vista eSle patron podrfa considerarse derivado de un efecto de la edad,
n61ese que para cada cohorte los valores maximos de coleslerol en el grupo de
mayor edad coinciden en solo un punto en el tiempo calendario: de 1985 a 1987
(es decir, para la cohorl e de nacimientos de 1909- 1911 a los 76 ai'tos de edad, para
la cohorte de 1906- 1908 a los 79 afios de edad, y asf sucesivamente) . Esto llev6 a
Newsc ha ffer et al . a observar que:
cabe sospechar la presencia de un efecto de periooo cuando se observa un cambio con-
sistente en la altura de la curva en un momento dado del tiempo para IOdas las cohor-
les ... Por 10 tanto. sobre la base de una inspecci6n visual simple de las curvas. no es
posible atribuir el aumento consislente del colesterol en fonna de U al envejecimiento.
ya que parte de dicho patr6n se debe a efectos de periood
8
.p.OJ. 16).
14 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
MUJEAES
250
240
"
230
g'
~
220
. ~
. ~
210
"
200



190
8 ....... 1909191 1 ~ 1906-1908 -e- 1903-1905
160
e 1900-1902 ~ 1897-1899 -+- 1694-1 896
170
67 70 73 76 79 82 85 88 91
Punta media del grupo de edad (al'1os)
HOMBRES
250
240
__ 19091911
-+- 1906-1908 -e- 1903- 1905
~
e 1900-1902
__ 1897-1899
....... 1694-1896
f
230
"
2"

.
210
. ~
"
200

"

190
0
U
160
170
67 70 73 76 79 82 85 88 91
Punta media del grupo de edad (al'1os)
Figura 1.9. Nivcles mcdios de colestero! sCrico cspcdficos par sexo, par cdad y cohortc
de nacimientos: datos longitudinaies dt'l Programa de Investigacioll de F1orida, COllda-
do de Dunedin, Florida, 1976 a 1987
Fuente: Impreso con permiso de CJ Newschatler, TL Bush. WE Hale, Aging and total cholesterol
levels: cohort, period, and survivorship effects, American Journal of Epidemiology, vol 136. 23-34,
1992.
En situaciones complejas tales como la il ustrada en la discusi6n precedente, las
tecnicas de regresion multi ple pueden utili zarse para desenmarafiar los efectos de la
edad, la cohone y el periodo. La descripcion detallada de estas tecnicas esta fuera de
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALln CA 15
los Ifmites de este li bro. (Una discusi6n general de los metodos de regresi6n multi-
ple se presenta en el Capitulo 7, Secci6n 7.4.2). El lector interesado puede encontrar
otras referenci as y mas ejemplos en los trabajos originales ya citados (L6pez-Aben-
te et al .(6) y Newschaffer etal.(8)).
Finalmente, cabe enfatizar que los efectos de la cohort e de nacimientos pueden
afectar las asociaciones entre los desenlaces de la enfermedad y otras variabl es que
no sean la edad. Considerese, por ejemplo, un estudio de casos y controles (vease la
Secci6n 1.4.2) en el cuallos casos y los controles estan estrechamente emparejados
por edad (vease la Secci6n 1.4.5). Supongamos que en este estudio los casos se iden-
dfican en un periodo de 10 afios (por ejemplo, de 1960 a 1969) y los controles al
final del reclutamiento de los casos. En este estudio, la edad per se no ac[ua como
confusora, ya que los casos y los controles estan emparejados por edad (vease la
Secci6n 5.2.2); sin embargo, el hecho de que los casos y los controles se ident ifican
a partir de distintas cohortes de nadmientos puede afectar la evaluaci6n de variables
tales como el nivel educacional, que puede haber cambiado rapidamente a traves de
la cohorte de nacimientos. En este caso, la cohort e de nacimientos y no la edad, con-
fund irfan la asociaci6n entre la educaci6n y la enfermedad de interes .
13. ESTVDIOS ECOLOGICOS
Las unidades de observaci6n en un estudio ecol6gico son generalmente poblaciones
geograficamente definidas (tales como pafses 0 regiones dentro de un pafs) 0 las mis-
mas poblaciones geograficamente consideradas en diferentes momentos. Se obtienen
valores medios' tanto para el factor de ri esgo dado como para el desenlace de interes.
para cada unidad de observad6n con prop6sitos comparat ivos. Tfpicamente, el analisis
de datos ecol6gicos comprende la ubicaci6n en un sistema de ejes de los valores rela-
cionados con el factor de ri esgo y con el desenlace para todas las unidades de observa-
ci6n con el fin de valorar si emerge una relaci6n discernible. Por ejemplo, la Figura
I .1 0 muestra las lasas de muerte por enfennedad coronaria en hombres de 16 cohortes
induidas en el Estudio de Siete Paises (Seven Countries Study) asociadas con las esti-
maciones correspondientes del valor medio de consumo de grasa (porcentaje de calori-
as procedentes de la grasa)(9) . Los datos sugieren una relad6n positi va entre estas dos
variables, ya que existe una tendenda de las tasas de muene a ser mas alIas en los paf-
ses con medias mas elevadas de consumo de grasas saturadas .
En los estudios ecol6gicos pueden emplearse variables de diferente lipo('O) , las
cuales se resumen brevemente a continuaci6n:
MetficioneJ" agregadas que resumen las caracterfsticas de los individuos dentro
de un grupo, tales como el valor medio de cierto parametro, 0 la propord6n de
la poblad6n 0 grupo de interes que posee dena caracterfstica. Como ejemplos
pueden mencionarse la tasa de dena enfermedad. el consumo promedio de
grasa (Figura 1.1 0), la propord6n de fumadores y la mediana de ingresos .
* Un valor medio puede calcularse I ~ n l o pard variables continuas como para variables discretas
(por ejemplo. dicot6micas). Una lasa 0 una proporci6n es un valor medio cuando los valores indivi
duales son dicot6micos.
16
600
400
200
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Y::--83+25.1X
r :0 0,84

5 10

15

@J
20
x :0 % de las calorias de la dieta procedenles de grasas saluradas

Fi gura 1 .10. Ejcmplo de UII estudio ccol6gico. Puntos formados por las lasas de mortali-
dad de 10 alios por enfcrmcdad coronaria de las cohortcs del Estudio de Sicte Pafses y
porccntajes de calorias dietCticas suministradas por los acidos grasos saturados. Cohor-
les: B. 8elgrado: C. Crevalcore; D. Dalmatia: E. East Finland: G, Corfu: 1, Ushibuka: K. Cre-
ta: M. Momegiorgio: N. Zuphen: R. Rome railroad: S, Slavonia: T. Tanushimaru: U, Ameri-
can railroad: V: Velika Krsna: W. West Finland: Z, Zrenjanin. En 1a Figura se muestran los
coeficientes de correlaci6n r y de regresi6n lineal (vease Capitulo 7. Secci6n 7.4. 1) corres-
pondientes a esta nube de puntos.
Fuente: Impreso con permiso de Seven countries: A mullivariate analyses of death and coronary
hearl disease, by A Keys, Cambridge, Mass: Harvard University Press, copyright 1980 by Ihe Presi-
dent and Fel lows of Harvard College .
Muficiolles ambientales que representan caracterlsticas ffsicas del lugar geo-
grafico del grupo de interes. Los indi viduos dentro del grupo pueden tener
diferentes grados de exposicion a una caracterfstica dada teoricamente medi-
ble. Ejemplos de tales variables son la intens idad de la poluci6n ambiental y las
horas de luz solar .
Mediciones globales que representan caracterfsticas gmpales no reducibles a
los indi viduos (es decir, que no ti enen analogos a nivel individual), como ocu-
rre con el tipo de sistema politico 0 de atenci6n sanitaria, con ciena ley 0 con la
presencia y magnitud de desigualdades de salud.
En un estudio ecol6gico tradic ional, se examina la posible asociaci6n de dos varia-
bles ecol6gicas. Tfpicamente, se comparan una medida ecologica de exposici6n y una
medida agregada de enfermedad 0 mortalidad (por ejemplo, Figura 1.10) . Tales medi-
das ecologicas pueden {ambien utilizarse en est udios de individuos (es decir. estudios
transversales,de casos y controles 0 de cohones; vease la Secci6n 1.4) en los cuales eI
investigador escoge definir la exposicion utilizando un criterio ecol6gico sobre la base
de su validez de constmcto supuestamente superior. Por ejemplo, para examinar la
relacion entre nivel socioeconomico y prevalencia de enfermedad cardiovascular en
individuos, el investigador debera seleccionar un indicador agregado de nivel socio-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 17
econ6mico (por ejemplo, mediana del ingreso familiar en el entomo del vecindario)
para definir el estado socioecon6mico de cada individuo, 10 cual es mejor que, por
ejemplo, su nivel educacional (individual) 0 su ingreso. Aun mas, las medidas indivi-
duales y las medidas agregadas pueden combinarse en un antilisis lIIulrillivei tal como
cuando se examina eI efecto conjunlo de niveles individuales y agregados de ingresos
y educaci6n con relaci6n a la prevalencia de la enfennedad cardiovascularOl ).
Aunque una asociaci6n ecol6gi::a pudiera reflejar con exaclitud un vInculo causal
entre un presunto factor de riesgo y una enfermedad (por ejemplo, la asociad6n posi-
tiva entre consumo de grasas y enfennedad coronaria presentada en la Figura 1.1 0).
con frecuencia se invoca el fen6meno de la/alacia eco16gica como una desagradable
posibilidad si se emplean las correladones ecol6gicas como prueba bOlla fide de
hip6lesis etiol6gicas. La falacia ecol6gica (0 se.\go de agregaci6n) ha sido definida
como el sesgo que puede ocurrir debido a que una asociaci6n observada entre varia-
bles a nivel agregado no representa necesariamente la asociad6n que existe a nivel
individual,, (' ). EI fen6meno de la falacia ecol6gica se ilustra esquematicamente en la
Figura 1.11 ; eSla se basa en un ejemplo propuesto por Diez-Roux('2). En un est udio
ecol6gico hipoletico que examina la relaci6n entre el ingreso per Clipira y el riesgo
de danos por accidente de vehfcu lo de motor en Ires poblaciones hipoteticas, com-
puesta cada una por siele individuos, se observa una correlaci6n positiva entre la
media de ingresos y el riesgo de danos. Sin embargo, una inspecci6n mas cuidadosa
de los valores individuale.\ revela que los casos oc urrlan solamente en personas de
bajos ingresos (inferiores a 20.000 USO). En este ejemplo extremo de falacia ecol6-
gica, la asociaci6n detectada cuando se uti li zan poblaciones en calidad de unidades
de observaci6n - es dedr, que el promedio mas alt o de ingresos se relaciona con un
mayor riesgo de dano por accidentes por vehfculo automotor liene una direcci6n
diamelralmente opuesta a la que expresa la relaci6n entre ingresos y danos por ese
concepto en individuos- esto es, que un mayor ingreso indi vidual se relaciona con
Poblaci6n A: Ingreso medio, US $23.940; incidencia de heridos por accidentes de trafico 4n:o 57 %
[J 1
34
,5 1 1
28
,51 ~ 1
45
,6 1 ~ ~
Poblaci6n B: Ingreso medio, US $22.430; incidencia de heridos pCIf accidenles de Iralico 317::: 43 %
~ 132.5 1 124,31 ~ ~ 1
38
.
0
1 ~
Poblaci6n C: Ingreso medio, US 521,410; incidencia de heridos por accidenles de Ira/ico 2n:o 29 %
1
28
,7 1 1
30
,2 1 ~ 1
23
,51 [J @!J ~
Fi gura 1.11. Represcntacion esquematica de un estudio hipotctico donde sc produce la
ralacia ccologica. Las cajas representan individuos hipoteticos: las cajas mas gruesas repre-
sentan casos incidentes de daiios por vehfculos de motor (VM): los numeros dermo de las
cajas indican ingresos anuales individuales (en miles de d61ares norteamericanos). Ecol6gi-
camente. la correlaci6n es positiva: la poblaci6n A tiene los valores mayores tanto de ingreso
como de incidencia de dana por VM: la poblaci6n B tiene val ores intermedios tanto de ingre-
so como de incidencia de dana por V\1 y la poblaci6n C tiene los valores menores tanto de
ingreso como de dano por VM. Sin embargo. entre los individuos. la relaci6n es negativa:
para las tres poblaciones combinadas.el ingreso medio es $13.230 para los casos y $32.310
para los no accidentados.
18 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
un riesgo menor de dano. Por tanto, la conclusion del analisis ecol6gico de que un
nivel de ingresos mas alto es un fac!Qr de riesgo para sufrir dana por vehfculo auto-
motor bien puede ser falaz (vease mas adelante).
GIro ejemplo de una situaci6n donde puede haber ocurrido este tipo de falacia vie-
ne dado por un estudio ecol6gico donde se detecta una correlaci6n directa (posiliva)
entre el porcentaje de poblaci6n protestante y las tasas de suicidio en varias comunida-
des prusianas a finales del siglo XIX(lOI'). Sabre la base de esta realidad, la inferencia de
que ser protestante es un factor de riesgo de suicidio puede bien ser erronea - pucde
resultar de una falacia ecol6gica- ya que es posible que la mayorfa de los suicidios
dentro de estas comunidades correspondan a indi viduos catolicos que, en minorfa (es
decir, cuando la proporci6n de protestant es es alta), tienden a estar mas aislados social-
mente y por tanto tienen mayor riesgo de hacer intentos suicidas.
Estos ejemplos demuestran que el error asociado con los est udios ecol6gicos es un
resultado de la inferencia a traves de niveies, que ocurre cuando los datos agregados
se utilizan para hacer inferencias a nivel individual(lO) . El error en el ejemplo que aca-
ba de discmirse consiste en utilizar la correlaci6n entre la proporci6n de protestantes
(que es una medida agregada) y la tasa de suicidios para inferir que el riesgo de suici-
dio es mayor entre los individuoJ" protestantes que entre los catolicos. Sin embargo, si
se fuera a hacer una inferencia a nivei poblacional, la conclusion de que las comunida-
des predominantemente protestantes con minorfas catolicas tienen tasas mayores de
suicidio, mantendrfa su validez (supuesto que otros sesgos 0 factores confusores no
estuvieran presentes) . Simi lannente, en el ejemplo de ingresos y danos, la inferencia a
parti r del analisis ecologico es err6nea solamente si se extiende a los individuos. Si,
por otro lado, el prop6sito del investigador es comprender el entramado de causali-
dadO) involucrado en los danos causados por vehfculo de motor, la informacion ecol6-
gica puede ser valiosa. ya que puede brindar claves en cuanto a las causas de danos por
vehfculo de motor que no son brindados por los datos a nivel individual. Por ejemplo,
la media poblacional de ingresos mas alta puede asociarse con un aumento del volu-
men de tciftco. Ademas, la asociacion inversa entre bajos ingresos a nivel individual y
danos por vehfculo de motor puede ser mas fuerte en los pafses que posean un alto
ingreso per capita , esto es, en el contexto de un volumen alto de tciftco aparejado con
vehfculos inseguros utilizados por individuos de bajos ingresos.
Debido a la visi6n prevaleciente de que la inferencia a nivel individual es el esttin
lJar de oro (gold cuando se estudian las causas de las enfennedades(l 4J, asf
como la posibilidad de incurrir en la falacia ecol6gica. los esrudios ecol6gicos se con-
sideran a menudo como meros sustitutos imperfectos de aquellos en los cuales los
individuos constit uyen las unidades de observaci6n. Esencialmente, los est udios eco-
logicos se concept uan como est udi os preliminares que pueden sugerir promisorias
avenidas de invest igacion al arrojar luz sobre relaciones etioI6gicas(3 p'-s-70) . Los ejem-
plos que se acaban de exponer prueban, sin embargo, que aun cuando suele ser verda-
dero, tal silogismo puede ser falaz. Las siguientes dos sit uaciones ilustran el hecho de
que un analisis ecologico puede en ocasiones conducir a conclusiones mas exactas que
la utili zacion de datos a nivel individual (aun cuando el prop6sito inferencial del estu-
dio ecol6gico en cuesti6n se ubi que al nivel individual). La pri mera situaci6n se produ-
ce cuando la variabilidad de la exposicion de interes dentro de la poblacion es baja
pero la variabilidad entre poblaciones es alta. Por ejemplo, si el consumo de sal de los
individuos de una poblacion estuviera por encima del umbral necesario para causar
hipertensi6n, una relaci6n entre la sal )' la hipertensi6n podrfa no ponerse de maniftes-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEM[OLOGIA ANALlnCA 19
[0 en los estudios individuales aunque sf podrfa emerger en estudios ecol6gicos, indu-
so en poblaciones con habilOs dieteticos diversos(IS) . (Un fen6meno similar ha sido
enarbolado como explicacion de que las correlaciones ecol6gicas, y no los estudios
individuales, hayan detectado una relacion entre el consumo de grasa y eI riesgo de
cancer de mama(16)) . La segunda si tuacion se presenta cuando, aunque se intente un
nivel de inferencia individual, las implicaciones /Xlrll la prevencion 0 la illfervencion
conciernen en rigor alnivel poblacional. Algunos ejemplos que il ustran esta ultima
posibilidad son los siguientes:
En los est udios clasicos sobre pelagra, Goldberger et al . (17) evaluaron no sola-
mente los indicadores individuales de ingresos, sino tambien la disponibilidad
de alimentos en los mercados del area. Encontraron que, independiememente
de los indicadores socioecon6micos individuales, la disponibi lidad de ali men-
tos en los mercados locales de los pueblos estaba relacionada fuertemente con
la incidencia de pelagra, 10 que los llevo a conduir que:
Los factores mas potentes que intluyen sobre la incidencia de pelagra en los pue-
blos estudiados eran: a) bajos ingresos familiares: y b) condiciones desfavorables
relacionada<; con la disponibilidad de suplementos alimentarios.lo que sugiere que
bajo las condiciones prevalecientes en algunos de estos pueblos en la primavera de
1916. muchas familias no tenlan suficientes ingresos para procurarse una dieta
adecuada y que una mejorfa en la disponibilidad de alimentos (particulamlente
leche y came fresca) se necesitaba urgentemente en tales localidades
ol 7
M;. 27t!) .
Este ejempl o deja claro que un imponante (y polencialmente modificable)
eslab6n en la cadena causal en la ocurrencia de pelagra - precisamente la dis-
ponibilidad de alimento- podrfa haber resul tado inadvert ido si los invest iga-
dores se hubieran limitado exclusivamente a estudiar los ingresos individuales.
Los eSllldios de los factores de riesgo para el comienzo 0 el abandono del habilO
de fumar pueden centrarse en las regulaciones relacionadas con la publicidad de
los cigarrillos 0 con los impuestos que condicionan su consumo a nivel pobla-
cional. Aunque los faclOres individuales pueden inll uir sobre la predisposic i6n
personal al habilo de fumar (por ejemplo, perfil psicologico, habito de fumar de
amigos 0 familiares), los factores ecologicos regul alOri os pueden ser delermi-
nantes fuertes y modificadores de las conductas individuales . Por lanto, un
invest igador puede oplar por cent rarse en estos factores globales 0 por 10 menos
por considerarlos j unto con el examen de los condicionantes individuales.
En las indagaciones sobre faclOres que explican la transmisi6n de ciertas enfer-
medades infecciosas para las cuales la inmunidad de la comunidad es import an-
te, los eSlUdios que ut ilizan a los individuos como unidades de observacion pue-
den ser inapropiados . Tal como 10 discuten Koopman y Longini(l 8), los est udios
ecologicos pueden ser la unica manera para est udiar estos patrones y descubri r
los faclores de riesgo para la transmision de enfermedades infecciosas.
Debido a que, en ult ima instancia, todos los factores de ri esgo deben operar a
nive l individual, el enfoque reducc ionista' a ult ranza se oc uparfa solamente de los
* EI reduccionismo es una teoria que postula que tOOos los sistemas complcjos pueden ser com-
pletamenle comprcndidos en terminos de sus componenles. ignorando en buena medida las interac-
ciones entre eslos.
20 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
elementos causales que apcran a nivel bioqufmico 0 intracelular. Por ejemplo, el
esmdio de los cfcctos carcinogenicos del habito de fumar podrfa cemrarse en los
efectos de subproductos del tabaca a nivel celular - csto es - , a la alteraci6n del
ADN celular. Sin embargo, i,convertirfa esto en irrelevante el estudio del habito de
fumar? Obviamente no. Por supuesto, desde lIna perspecti va de salud publica, eluso
de un modelo tearico abarcador de la causalidad - uno que considere todos los fac-
tores que inll uyen en la ocll rrencia de 1a enfennedad- requiere a menudo tener en
Cllenta el papel que desempefian los raclores ecol6gicos (ambientales, socia-polIti -
cos y culturales) en 1a cadena causal. Como se enuncio al pri ncipio de esle capilulo.
el objeli vo final de la epidemiologfa es el de acl uar efeclivameme como herramiema
para mejorar las condiciones de salud de la poblaci6n; en esle contexto los factores
que operan a un nivel global pueden represenlar eslabones relevantes en la cadena
causal, particulannenle cuando pueden ser objeto de imervencion (por ejemplo.
mejorando el acceso a los ali menlos frescos en los poblados, 0 eslableciendo leyes
que limilen la publicidad de Como resultado, los esludios que se cent ran
en faclores a nivel individual pueden ser insufic ienles porque sus result ados no tie-
nen impaclo sobre estos lazos ecol6gicos en la cadena causaL Este conceplo puede
ser il ustrado ulilizando el ejemplo de la reli gion y el suic idio previamente discutido.
Un esludio basado en los individuos podrfa correclameme enconlrar que el riesgo
de sui cidio es mayor en los cat6licos que en los proleslanles(IO) . Esle hallazgo sugeri -
rIa l6gicamente explicaciones de por que la tasa de suicidio difiere enlre dichos gru-
pos religiosos . Por ejemplo, i,se debe esla lasa mayor en los cat6licos al catolicismo
per se? Alt ernativameme, i,sera por alguna diferencia etnica entre cat6licos y prOles-
tantes? Si es asf, i,se debe a algli n componente genetico que dislingue a estos grupos
etnicos? El problema radica en que eslas pregunlas que apuntan a caracleri zar el
riesgo a nivel individuaL atmque imporlames, son insuficienles para explicar com-
pletamenle el enlramado de ya que no consideran la dimension eco-
l6gica impifcita en la posibilidad de que el carac{er minorilario de la comunidad
cat6lica explique y de{ennine el riesgo aumenlado de suicidio. Esle ejemplo subraya
el preceplo de que ambos lipos de esludio. los individuales y los ecologicos, son
necesarios para estudiar una delerminaci6n causal compleja como la del suicidio, y
an<i. logamenle de olros muchos procesos de salud y enfermedad(l2). La combinaci6n
de los niveles ecol6gicos e individuales en el analisis implica relos melodologicos
para los que se han desarrollado recursos lales como los modelos jerarquicos. Sin
embargo, otros notables desaffos concepluales siguen vigemes, lales como el desa-
rrollo de modelos causales que incluyan todos los faclores de riesgo relevanles que
operan desde el nivel social al nivel biol6gico y lomen en consideraci6n las posibles
inleracciones dentro y enlre niveles(l2).
1.4. ESTUDIOS BASADOS EN LOS INDIVIDUOS COMO UNIDADES
DE OBSERVACION
Existen {res tipos basicos de disefio para estudios no experimenlales (observaciona-
les) en los cuales los individuos son las unidades de observaci6n: el estudio de
cohone 0 prospecl ivo, el esludio de casos y conlroles y el estudio Iransversal. En
esta secci6n se revisan los aspeclos claves de cada uno de ell os. Para una discusi6n
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 21
mas completa de sus diversos aspectos operacionales y anaifticos, se remite el lector
a lextos especializados('<J23).
Desde un punto de vista conceptual, el disefio fundamental de la epidemiologfa
observacional - en otras palabras, el disefio del cual se derivan los otros y que pue-
de ser considerado el estandar de oro- es el eSludio de cohorte 0 prospeclivo.
Los datos de una cohorte, si no son sesgados. reflejan la secuencia temporal causa-
efecto de los eventos tal y como ocurren en la realidad, una condicion .\ine qua non
para establecer la causalidad (vease Desde este punto de vista, los disefios
de casos y controles y transversales son meras variaciones del est udio de cohone. y
se justifican principalmente por la mayor faci li dad logfstica con que pueden desarro-
llarse y la consecuente ganancia en eficiencia, mas que por la idoneidad cientffica 0
por su 16gica inferencial intrfnseca.
1 AJ. Estudio de cohorte
En un eswdi o de cohorte un grupo de individuos sanos, 0 cohorte' , se ident ifica
y se sigue por un cierto periodo para evaluar la ocurrencia de eventos relacio-
nados con la salud (Fi gura I .12) . EI objet ivo de un est udi o de cohort es es usual-
mente dirimir si la incidencia de un evento se relaciona con una exposici6n
dada.
Los grupos que son objeto de atenci6n en los est udios de cohortes pueden ser
muy diversos; por ejemplo, podrfa Iratarse de una muestra de la poblacion general de
ciena area geografica (por ejemplo. el estudio de Framingham(2S) ; de una cohone
ocupacional, tfpicamente definida como un grupo de trabajadores con una ocupaci6n
o de una industria. que se clasifican de acuerdo al grado de exposici6n a agentes de
los cuales se sospecha que son riesgos ocupacionales; 0 de un gmpo de personas que,
debido a ciertas caracterfsticas. tienen un riesgo reconoc idamente alto de padecer
una enfennedad dada (por ejemplo, la cohorte de hombres homosexual es que se
siguen en el Estudio Multicentrico sobre SIDA lEMSII26) . Alt ernativamente, las
COHORTE
Exposicion
sospechada
1-------------- Desenlace
Muerte
Enfermedad
Recidiva
Recuperaci6n
------------------------------+
Tiempo
Figura 1. 12. Componenl cs basicos de un est udio de coborle: cxposicion, ticmpo y dcsenlace
Una definici6n del termino cohone mas amplia que la encontrada en la nota al pie de la Secci6n
1.2 es: cualquier grupo de individuos que son objcto de examen a 10 largo de un intervalo espccifica
do de tiempo,l).
22 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
cohortes pueden estar formadas por muestras de conveniencia, 0 const ituir grupos
que se han conformado atendiendo a Sli deseo de panic ipar, 0 por causa de otras ven-
tajas logfsticas tales como la facilidad de seguimiemo; como ejemplos pueden men-
cionarse la cahorte del Est udio de Salud de Enfermeras(27) , la cohorte del est udio de
Profesionales de la Salud(28), y la cahone de est udios de voluntari os de la Sociedad
Americana de Cancer<29) .
Una vez que se define la cohortc y se seleccionan los partici pantes, un ele-
memo crft ico para su eswdio es el registro de la ocurrencia de los eventos que se
vayan produciendo durante el tiempo de segui miemo (cuando el evento de imen!s
es la primera aparicion de derta enfermedad en el sujeto, los casos prevalemes se
excluyen de la cohorte a la entrada). Tal es la razon por la que dic hos est udios se
conocen tambien como e.\ludio.\ prosl'ectivos(YJ) . En la Fi gura 1.1 3 se expone la
represemad6n esquem:hica de una cohorte de 1.000 individuos. En este ejemplo
hipotetico los miembros de la cohorte se siguen durame un periodo dado durante
el cual ocurren cuatro eventos, ta les como casos de incidencia de una enfermedad
o muerte (que aparecen en la Figura 1.13 como cajas E). Ademas de estos cua-
lro evemos, siete individuos se pierden durame el peri odo de seguimiento. Estas
perdidas (representadas en la fig ura con flec has) se designan usualmeme como
observaeioneJ' eel/sllmdus 0 I'erdidus, Como se describe en el Capit ulo 2, tales
perdidas del seguimiemo han de tenerse en cuema para el dlcul o de las tasas de
incidenda, Utili zando el metodo de la tabla de vida actuari al como ejemplo (vea-
se la Secd6n 2.2.1), la incidencia puede est imarse como el numero de eventos
dividido ent re el numero de sujetos en la cohorte al inicio menos la mitad de las
perdidas, Por lamo, para la cohorte hipotetica de la Figura 1. 13, la incidenc ia de
E es 4/ l l.000 - ell x 7)1 = 4,0 1/ 1.000.
COHORTE
inicial
(n '" 1 ,(00)
Tiempo
linal del seguimiento
(n '" 989)
Figura I .13. Diagrama dc una rohortc hipotCtiea dc 1.000 snjctos. Durante el seguimien-
to ocurren cuatro eventos de enfermedad (E) y siete perdidas del seguimiento (flechas). de
manera que el numero de sujetos bajo observaci6n al final del seguimiento es 989.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 23
S. Se mantienen
enferman sin enfermedad
E,p""'" I

f 'ooidoooi,
tiempo Riesgo
relativo
No "P""'" I

f 'ooidoooi,
Figura 1.14. Enroque analftico M.sko en un cstudio de cohorte
En el fonnalO mas represenlalivo de un eSflldio de cohorfes, se identifica una
poblaci6n especffica, sus sujetos se clasifican de acuerdo a su sit uaci6n en {erminos
de exposici6n, y la incidencia de la enfermedad (0 cualqui er otro desenlace de salud
que interese) se evalua y se compara entre las categorfas de exposici6n (Figura 1. 14).
Por ejemplo, sobre la base de la cohone hipotetica de la Figura 1 .1 3, Y suponiendo
que la prevalenc ia de la exposic i6n de interes es 50 %, la Figura 1. 15 esboza el segui-
mienlo para los expuestos (n = 500) Y los no expuestos (n = 500) por separado. EI ana-
lisis de los dalos en esta silUaci6n es relativamente simple: involucra una comparaci6n
enlre la incidencia de E en los expueslOs y los no expuestos utilizando como denomi-
nador la poblaci6n en riesgo, {omando una vez mas en consideraci6n las perdidas
durante el seguimiento (vease Capitulo 2) . Porejemplo . utilizando el procedimiento de
la {abla de vida actuarial como n t e ~ para la cohone hipotetica del est udio mostrado en
la Figura 1.15, la incidencia de E en los individuos expuestos es 3/1500 - e/2 x 4)1 =
= 6,02/ 1.000, Y en los no expuestos es 1/1500 - ('/2 x 3)1 = 2,01 / 1.000. A parti r de estos
estimados de incidencia, el riesgo relalivo (vease Capitulo 3, Secci6n 3.2.1 ) se estima
como 6,0212,0 I = 3.0, 10 que sugiere que los individuos expuestos tienen un riesgo {res
veces mayor que los no expuestos en la misma cohorte.
Como se discute en el Capitulo 2, una suposici6n imponante para el dlculo de las
{asas de incidencia en un estudio de cohones es que los indi viduos que se pierden
durante el seguimi enlo (las l1echas en las Figuras 1 .1 3 Y 1 .15) son similares a los que se
mantienen bajo observaci6n en 10 que concierne a las caracterfsticas que afectan el
desenlace de inleres. La rawn es que, aunque existen tecnicas para corregir el deno-
minador teniendo en cuenta el nlimero de perdidas (y el momenlo en que se producen)
(vease Capllllio 2, Secci6n 2.2), si cl riesgo promedio de los que se pierden difiere del
de los que pennanecen en la cohone, la incidencia basada en estos ultimos no represen-
lara con suficiente precisi6n la verdadera incidencia en la cohorte inicial (vease CapItu-
lo 2, Secci6n 2.2.1). Sin embargo, si el objetivo del estudio es una colIIl'aracion interna
de la incidencia enlre expuestos y no expuestos. incluso en caso de que los sujetos per-
didos difieran del resto de los miembros de la cohorte, siempre que los sesgos debidos a
las perdidas sean similares en el gmpo de expuestos y el de no expuestos, dichos sesgos
se cancelaran mutuamente al calcular el riesgo relalivo (vease Capitulo 4, Secci6n 4.2).
Un riesgo relativo sesgado debido a perdidas del seguimiento se presenla solo cuando
las perdidas son diferentes entre sujelOs expuestos y no expuestos con respecto a las
24 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
EXPUESTOS
NO EXPUESTOS
Cohorta
inicial
(n '" SOO)
Cohorta
inicial
(n '" SOO)
Tiempo
Cohorta al
final del seguimiento
(n '" 493)
Cohorte al
final del seguimiento
(n '" 496)
Figura 1.lS. EI mismo estudio de cohorte de la Figura 1.13, pero hacienda scparada-
mcnte la cvaluacioll de los cventos y las perdidas del scguimiento entre los expuestos y
los no cxpucstos
caracterfsticas que infl uyen sobre el desenlace de inten!s - en alras palabras - . solo
cuando las perdidas estan afecladas tanto por la exposici6n como por 1a enfennedad.
Los estudios de cohortes se definen como cOllcurrenfe.\{ l) (0 verdaderamente pros-
pectiVOS>, (30)) cuando la cahone se confonna en el momenta presente - csto es, el tiem-
po calendario cuanda el estudio comienza - y se sigue hacia el fut uro (Figura 1.16). La
ventaja principal de los estudios de cohortes concurrentes estriba en que el examen ini-
cial, los mdodos de seguimiento y la evaluaci6n de los eventos se planifican e implan-
tan para los propOsitos del estudio, y sirven mejor por tanto a sus objetivos; ademas, las
medidas de control de calidad pueden ponerse en practica a medida que se necesiten
(vease Capft ulo 8). Las desventajas de los estudios concurrentes se relacionan con la
cantidad de tiempo necesario para desarroll arlos (los resul tados estaran disponibles solo
cuando se acumule un numero suficiente de eventos) y con el hecho de que su costo
usualmente resulta muy elevado. Allernat ivamente, en los est udios de cohortes no COII-
currellle.\ (tambh!n conocidos como estudios de cohortes hiJr6r icoJ 0 rerroJpecrivos), se
identifica una cohorte y se confonna en el pasado sobre la base de infonnaci6n que fue-
ra oportunamente registrada y este disponible, y se sigue hasta el presente, esto es,
hasta el momento en que se conduce el esmdio (Figura 1. 16) . Un ejemplo de este tipo
de disefio 10 ofrece un est udio realizado en 1992 en el cualla relaci6n entre el peso en la
infancia y la mortalidad subsecueme en la etapa adulta se examin6 no concurrentemen-
Ie sobre la base de registros existentes con los valores de peso y talla obtenidos entre
1933 y 1945 en ninos de edad escolar<.311. El diseno no concurrente tambien es uti! en la
epidemiologfa ocup..1cional, ya que 105 expedientes de ocupaci6n 0 censales pueden
enlazarse con los registros de cancer 0 de mortalidad: por ejemplo, una cohorte de todos
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 25
Selecci6n de
parlicipantes
L
T
Seguimienlo
1
EI invesligador
comienza el eSludio
EI invesligador
comienza el estudio
Figura 1 .16. Tipos de estudi os de cohoMe
EI investigador
comienza al asludio
ESludio
concurrenle
ESludio no
concurrcnto
(hist6rico)
Diseno mixto
los electricistas que trabajaban en Nomega en 1960 se siguio no concurrentemente has-
ta 1990 para esmdiar la relacion entre la radiaci6n eleclromagnetica y la incidencia de
cancer
m
). Tambien es posible aplicar disefios mixfO.\, que contienen tanto componentes
de seguimiento conc urrentes como no concurrentes (Figura 1. 16). Los eSllldios de
cohortes no concurrentes son obviamente mas economicos y pueden hacerse de manera
mas expedita que los est udios concurrentes . Su desventaja principal consiste en que
depende ineludiblemente de la informaci6n disponible; como consecuencia, la calidad
de los datos sobre la exposici6n 0 el desenlace disla a veces de ser 6ptima a los efectos
de cumpli r con los objetivos de estos estudios.
1 A.2. Estudios de casos y controles
Como demostro Cornfield(33) y se ha discut ido mas tarde en Iibros basicos de epidemiolo-
gfa (p. ej., Gordis(J) . el disefio de casos y controles es una alternativa al estudio de cohor-
les para investigar asociaciones ent re una exposici6n y una enfennedad. En contraste con
un estudio de cohortes, en el cuallos partici pantes expuestos y no expuestos de la cohor-
Ie se comparan en relaci6n a la incidencia de la enfermedad (0 cualquier otra medida de
lendenc ia central del desenlace) (Figura 1. 14). en un estudio de casos y con troles gene-
ralmente se compara el odds de una exposici6n pasada a un posible factor de riesgo entre
los casos (individuos enfermos) con el de los controles (generalmente individuos no
enfennos) . (Aunque la comparacion de los odds de exposicion es el enf<XJue anal flieo
tfpieo de los estudios de casos y controles, otros tipos de medidas pueden compararse
entre casos y controles, por ejemplo. niveles medios de tensi6n arteri al). Asf su estrategia
analftica princi pal reposa en el dlculo e interpretacion del odd.\ ratio de exposici6n, que
es un estimado del riesgo relativo (Figura 1.17) (vease Capftulo 3, Secci6n 3.2.1). EI
disefio de un estudio de casos y comroles tiene ventajas importantes sobre el di sefio de
26 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Expueslos
No expuestos
Enfermos
(casDS)

Cddsde
exposici6n
Odds ratio
No enfermos
(controlesj

Odds de
exposici6n
Fi gura I .17. Enroquc analit ico basico en UII estudi o de casos y con troles
cohortes, patticulannente sabre el estudio de cohorte conCLLrrente, ya que se evita la nece-
si dad de un liempo de seguimiemo. lo que optimiza la rapidez y 1a eficiencia(3) .
Estudio de casos y controles basado w los casos
En 1a estrategia mas si mple para 1a selecci6n de los gmpos de un estudio de casas y
comroles, los casas y los no casas se idemifican en un momenta dado entre individuos
vivos. Un ejemplo de esta estrategia. a veces Hamada estudio de caSM y controle.\"
basado ell caSO.\', es un estudio en el cual los casos se idenlifican como los individuos a
quienes se diagnostico la enfennedad de interes (por ejemplo, cancer de mama) en
d elto hospital 0 servicio medico durante un ano dado, en tanto que los controles se
selecdonan entre los miembms de la comunidad atendida por dicho hospital 0 servido
que no Ul vieron eI diagnostico de la enfennedad de interes al final de este mismo ano.
Debe notarse que, aunque este estudio se lIeva a cabo transversalmente (es dedr, los
casos y los controles se identifican en el mismo momento), los casos necesariamente
deben ocurrir durante un lapso dado ames de su inclusion en el estudio. Asf, es necesa-
rio suponer que los casos que sobreviven mientras dure eI es{udio (Figura 1.18) son
representat ivos de {odos los casos en relad6n a la experienda de exposid6n, y que si
los datos sobre la exposidon se obticnen a {raVeS de entrevistas, los sesgos (el de
recuerdo u olros) no interferiran (vease Capitulo 4). Ademas, para que la comparaci6n
entre casos y conlroles sea legftima en 10 que condeme a la si{uacion que presenten en
terminos de exposici6n, es necesario suponer que {odos proceden de la misma pobla-
d6n de referenda, es decir, de una cohorte mas 0 menos explfcitamente identificada,
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 27
como se mueslra en la Figura 1. 18. En otras palabras, para que una comparad6n entre
casos y controles represente una altemativa valida al eSludio de cohortes, se espera que
los casos y los controles pertenezcan a una pobladon de referenda comlln (0 a pobla-
dones de referenda similares, comQ se vera mas adelante). Sin embargo, a menudo es
difidl definir cual es la cohorte que sirve de fuente en un eSludio de casos y controles.
Tal es el caso, por ejemplo, de un est udio basado en casos en el cual estos proceden de
derto hospital A, en lanto que los controles se selecdonan de una muestra de una
poblad6n. Siendo asL es importante considerar la correspondenda entre la poblad6n
de padentes del hospi tal A y la pobladon del area geografica de la cual se selecdonan
los casos. Por tanto, si, por ejemplo, el hospital A es la uniea inst itud6n a la cual pue-
den acudir todos los residentes del area y lodos los casos se hospitali zan, una muestra
de la misma area poblacional representa un gmpo de control valido. Sin embargo, si
los residentes milizan hospi lales fuera del area, entonces deben considerarse estrate-
gias altemativas para seleccionar los controles, de suerte que se consiga que estos sean
representativos de la poblaci6n le6rica que provee los casos (por ejemplo, discado de
dfgitos al azar 0 emparejamiento por zona de residencia).
EI hecho de que los casos y los controles se originan en la misma cohone fuente
hipotetiea es un supuesto crftieo que afecta la validez de los datos de casos y contro-

hipotetica
"
Tiempo det
estudio
-----------------------_._----------- ------------------,..
Tiempo
Casos
Figura 1.18. Estudio hipotCtico de casos y controles basado en casos, suponiendo que los
casos y los controles se seleccionan de una cohorte hipotetica, como en la Figura l.l3. Se
supone que el grupo de casos incluye lodos los casos que ocurrieron en esa cohorte hipoteti-
ca hasla el momento en que se produce el estudio (<< E con flee has horizontales que tenninan
en la barra del caso): esto es, se supone que lodos eSlan vivos y disponibles para participar
en el estudio: los controles se seleccionan de entre los que no padecen la enfermedad de inte-
res (no casos) en el momento en que los casos son identificados y conforlnados como grupo.
Las lfneas diagonaies discontinuas con flechas representan perdidas durante el seguimiento.
28 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
les . Debe notarse que no es estrictameme necesari o que los casas y los controles se
seleccionen exactamente de la mislllti poblaci6n de referenda; sin embargo, deben
provenir de poblaciones que {cngan caracferiJ"ricas relevallfes similares. Baja estas
circunstancias, el grupo de control puede aceplarse como si fuera una muestra razo-
nablemente representat iva de la poblad6n de referenda de los casas.
Cuando los casas y los comroles no se seleccionan de la misma (0 simil ar) poblaci6n
o poblaciones de referenda, puede producirse el se.\Xo de selecci611, fen6meno que se
discute detall adamente en el Capitulo 4. EI sesgo de selecci6n puede ocurrir incl uso
cuando casas y controles provengan de la misma cohorte hipolelica>,: tal anomalla se
verifica cuando las perdidas que ocurren antes de que se seleccionen los grupos de estu-
dio comprometen la comparabilidad entre unos y otms. Por ejemplo, si las perdidas
entre los commies potenciales abarcan una proporcion mas alta de individuos con bajo
nivel socioeconomico que las que se producen entre los casos, emonces se pueden
encontrar asoc iaciones sesgadas al examinar exposiciones relacionadas con el nivel
socioeconomico. Este ejemplo subraya la estrecha relaci6n entre el sesgo de seleccion
en los estudios de casos y commies y las perdidas diferenciales durante el seguimiento
en los est udios de cohorte. En este comexto, debe considerarse la similitud entre las
Figuras I .1 8 Y 1. 13, en que la validez de las comparaciones hechas en el esmdio de
ambas cohortes (Figura 1. 13) y en los estudios de casos y controles (Figura 1. 18) depen-
de de si las perdidas (represemadas por flechas diagonales en ambas figuras) afectan la
representatividad de la cohorte de base (bien definida en la Figura 1. 13, hipotetica en la
Figura I .1 8) con relaci6n tanto a las variables de exposici6n como a las de desenlace.
Un tipo particular de perdida (previa) que puede afectar la comparabilidad de
los casos y los comroles concierne a las lIIuerfes debidas a otras enfermedades 0 a la
enfermedad de interes . Para el tipo de diseno representado en la Figura 1. 18, caracte-
rizado por una evaluacion transversal de los sujetos. los controles que mueren antes
de poder ser incl uidos en el estudio pueden tener una experiencia de exposici6n dife-
rente al resto de la poblaci6n fuente. Adic ionalmeme, este diseno ident ifica primor-
dialmeme casos prevalemes, esto es, aquellos con la supervivencia mas larga (Figura
I .1 9) . Estos tipos de sesgos de selecci6n const ituyen problemas genericos que intro-
ducen conflictos para la adecuada evaluaci6n transversal de los part ici pames en el
estudio; otro problema es el Jesgo de recuerdo, que result a de la obtenci6n de datos
sobre exposiciones pasadas mucho despues del comienzo de la enfermedad. (Para
una discusi6n detallada de estos y otros sesgos en los esmdios de casos y comroles,
vease Capitulo 4) .
Debe enfat izarse que, aunque la evaluacion transversal de casos y controles a
menudo se lleva a cabo transversal mente, este no es un rasgo sille qua /1011 de los
estudios de casos y controles basados en los casos. Una estrategia alt ernativa, que
pretende mini mizar los sesgos de seleccion y de rec uerdo, y que debe ser empleada
siempre que sea posible, es evaluar los casos concurrentemente; esto es, idemificar
(y obtener informaci6n sobre la exposici6n de) los casos tan pronto como sea posi-
ble despues del inicio de la enfennedad. Un ejemplo de esta estraregia 10 ofrece un
estudio sobre factores de riesgo de fis uras orales reali zado en En este
estudio las madres casos eran mujeres hospitalizadas que dieron a luz un nino naci-
do vivo con fis ura labial 0 palatina (sin otras mal formaciones) entre 199 1 y 1994.
Los controles se eli gieron del modo siguiente: para cada caso, se tomaron las dos
mujeres que habfan parido en ese mismo hospital exactamente ames que la madre
caso. Tanto las madres caso como las comroles fueron entrevistadas concurrente-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
Cohorle
hipotelica
____ , : Tiempo de supervivencia
Momento del
estudio
..........................................................
Tiempo
29
Figura 1.19. Scsgo de supervivencia en un estudio de casos y controles basado en casos
Ilevado a cabo transversal mente: solo los casos con una supervivencia larga despues del
diagn6stico (de mejor pron6stico) se incluyen en el grupo de casos. En este ejemplo hipoteti-
co. las lfneas horizontales que comienzan en las cajas E de los casos representan tiempos
de supervivencia: n6tese que solo dos de los cuatro casos se incluyen en el estudio. Las li-
neas diagonales discontinuas con flecllas representan perdidas del seguimiento.
mente por enfermeras entrenadas con respecto a embarazos previos. medicamentos.
habito de fumar, dieta, y olras exposiciones ambientales y ocupacionales.
Estudios de casos Y cOlllroies detllro de una cO/lOrte definida
Cuando los casos se identifican dentro de una cohorte bien definida, es posible llevar
a cabo estudios de casos y controles al/idados 0 est udios casocohorte. Estos dise-
fios han recibido considerable atenci6n en afios recientes(3S.37) al calor de varios est u-
dios de cohorte de gran magnitud, bien eslablecidos, que se han inic iado y continua-
do durante las ulti mas decadas. Notables avances metodol6gicos y anaiflicos
recientes se han venido verificando en este contexto.
Los estudios de casos y controles dentro de una cohone se conocen tambien
como disefios hfhridos () porque en ellos influyen algunos de
los rasgos presentes en los disefios de cohorte y en los de casos y controles . En estos
eSllldios, aunque la selecci6n de los participantes se lleva a cabo con un enfoque pro-
pi o de los est udios de casos y controles (Figura I .1 7), ell a se veri fica dentro de una
cohorte bien definida. EI grupo de casos se confonna con todos los individuos (0 una
muestra representativa de ell os) para los que se produce el desenlace de interes en la
30 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
cohortc definida durante un periodo de seguimiento especificado (las cajas E de la
Figura 1. 13). Como se di scute mas adelante, hay esencialmente dos opciones para la
selecci6n de los controles en esta si tuaci6n: I) seleccionarlos de 1a cohortc inic ial , 0
2) elegirlos de entre los individuos en riesgo en el momenta en que ocurre cada caso.
La primera alt ernativa se ha denominado diseiio caso-collOrfe y la segunda se ha
baulizado como diseiio de casos y comroles flnidadd
36
). Debe notarse que, indepen-
dientemente de la estrategia de selecci6n de controles que se discule a cont inuacion,
debido a que los casas y controles se seleccionan de 1a misma cohorte fuente en
estos esrudi os. la posibilidad de sesgo de seleccion tiende a ser menor en compara-
cion con el estudio tradicional de casos y controles basado en los casos.
Alternativa para la seleccioll (ie comlVles en lin de casos y conflVles dell-
fro de IIna cohorte. La primera alt emativa para seleccionar controles consiste en
{OmM una muestra aleatoria de la cohorte {Otal en el momento inicial. EI tennino
(fjseiio cm-o-cohorfe se ha uti li zado cuando el marco muestral para la selecci6n de
los controles esta representado por la cohorte {Otal en el momento inicial (Figura
1.20) , 10 que trae como consec uencia que algunos casos que surgen durante el segui-
miento ocurren entre los miembros seleccionados para integrar de las mues(ras de
ambos grupos, de los casos y de los controles (cajas E de la Figura 1.20). Resulta
hasta cieno punto peculi ar, sin embargo, que aunque algunos de los casas se selec-
cionan para integrar la muestra de la cohone (el grupo control), otros no. Tecnicas
analfticas que toman en cuenta este rasgo especial en el contexto del anaJisis de
supervivencia se han desarrollado recientemente (vease Secci6n 7.4.6(37)). Una ven-
taja importante del disefto de casos y controles es que la disponibilidad de una mues-
(ra de la cohone (el grupo control), permite estimar las distribuciones de fac{Ores de
_ .. Contrrnes


Figura 1.20. Est udio de casos y controles en el cuallos cont roles se scleccionan de una
cohorte de base (estudio caso-cohort e). Los casos sc representan por cajas E. Las ]fne-
as diagonales discontinuas con tlechas representan perdidas del seguimiemo.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 31
riesgo y las lasas de prevalencia necesarias para eslimar los riesgos atribui bles
poblacionales (vease Capitulo 3, Secci6n 3.2.2).
La segunda altemativa es que los comroles const ituyan una muestra aleatoria de la
cohorte seleccionada en el momento en que ocurre cada caso. Se trata deillamado diseiio
(ie casas y allidado (Fi gura 1.21) Y se basa en un esquema muestral conocido
como IIIlIestreo de dellsidad de incidellciai
3S38
) 0 lIIuestreo de cOl/junto ell rie.\"gr/
1fJ
). La
idea en la que se basa este esquema de muestreo es que pennite la comparaci6n de los
casos con un subconjunto de los miembros de la cohorte que estan en riesgo de convertir-
se en casos en el momento en que cada caso ocurre. por: esto es. un conjumo en riesgo
de todos los miembros de la cohorte bajo observaci6n en el momento de la ocurrencia de
cada caso. Mediante esta estrategia, los sujetos que se convierten en casos mas tarde en el
seguimiento son elegibles como controles a los efectos de su comparaci6n con individuos
que pasaron a ser casos mas tempranamente. EI muestreo de densidad de incidencia es el
equivalente de parear los casos y los comroles en cuanto a duraci6n del segui miento (vea-
se Secci6n 1.4.5) y pennite el uso de tecnicas estadlsticas anaift icas relat ivamente poco
complejas (por ejemplo. procedimiemo de regresi6n multipl e estandar para el analisis de
datos pareados y de supervivencia; ,ease Capitul o 7, Secci6n 7.4.6) .
Hasta el momento la discusi6n ha considerado solo estudios de casos y controles
demro de la cohorte en la cual se incl uyen los casos en el marco muestral para la
selecci6n de los comroles; en esta situaci6n puede demostrarse que el odd.\" ratio de
exposici6n estimado es un estimador estadlsticamente insesgado del ri esgo relativo
o la raz6n de tasas . Sin embargo, si los casos se excluyeran del grupo control poten-
..................................................
Tiempo
Figura 1. 21. Estudio de casos y controlcs anidado cn eI cuallos controlcs se selcccionan
en eI momento cn que ocurre un caso (muestreo dc dcnsidad de incidcncia). Los casos se
representan por cajas E. Las lfneas diagonales discontinuas con flechas. representan perdi-
das del seguimiento.
32 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
cial, entonces los enfoques analfticos e inferenciales sedan analogos a los de ellal-
quier estudio de casas y controles: vale decir, el d. lculo del d d . ~ ratio de exposici6n
produce un estimado del oddJ' ratio de enfermedad. Una discusi6n mas dctallada de
la influencia del marco muestralutilizado para la selecci6n de los controles sabre los
paramctros estimados por el odds ratio de exposici6n se encuentra en el Capit ulo 3
(Secci6n 3.4. 1).
;. Cuando debe Iweerse UII eSfudio de casos Y cOllfmles dentm de IIna collOrfe? En
la disc ll si6n precedente, los terminos estutiio caso-cohorfe y estutiio de caso.\' y con-
frole.\' anitJado han sido ut ilizados para di stinguir las situaciones en que los controles
son tornados de la cohol1e de base (Figura 1.20) de aquell as en que se usan conjuntos
de riesgo (Figura 1.2 1), respectivamente. Esta terminologfa es probablemente la mas
comunmente usada hoy en este campo07J9) . Desafortunadamente, sin embargo, estos
{erminos no se usan de manera consistente; por ejemplo, las expresiones esfudio de
cu.w.\ y contmles anidado y eSfudio CGSO cohorte se utili zan ocasionalmente para cla-
sificar los estudios anidados en funci6n de que se incl uyan 0 excluyan casos como
controles potenciales (vease arriba). Independientemente de la terminologfa utili zada,
10 imponante es comprender por que serfa ventajoso comparar casos y controles
seleccionados de una cohorte fuente en lugar de anali zar los datos de toda la cohone
(como en la Figura 1.15). Una razon es que los est udios de casos y controles dentro
de una cohone constituyen un recurso eficiente cuando se necesit a informacion adi-
cional que no se obtuvo 0 midio para toda la cohorfe. Una sit uacion {fpica es un estu-
dio de cohorfe concurrente en el cual se recogen muestras de suero y se guardan en
congeladores . Una vez que se ha rechllado un numero suficiente de casos durante el
seguimiento, las mues{ras de suero congeladas para los casos (0 para una muestra de
los casos) y para una muestra de los controles pueden descongelarse y anali zarse.
Esta estrategia no solamente reduce eI costo en que se hubiera incurrido si los analitos
de intert's se hubieran ident ificado en la cohorte completa, sino que ademas es a{ract i-
vo en la medida que se preservan muestras de suero para anal isis futuros. Una sit ua-
ci6n simil ar surge cuando la evaluaci6n de exposiciones claves 0 de variables confu-
soras (vease Capftulo 5) requiere ac{ividades intensivas de recolecci6n de datos tales
como resumenes de registros medicos u ocupacionales . L1 recolecci6n de esta infor-
maci6n adicional en los casos y en una muestra de la cohorfe total (0 de los no casos)
es una opcion beneficiosa desde el punto de vista costo-efectividad en lugar de mili-
zar la cohorte completa. Algunos ejemplos se presentan a continuaci6n:
Se condujo un estudio para examinar la relaci6n entre rango militar yexposi-
cion a radiaciones con el riesgo de tumor cerebral dentro de una cohone de
miembros varones de la Fuerza Aerea de los Estados Unidos que habfan (enido
por 10 menos un ano de servicio entre 1970 y 1989(40) . En este estudio se com-
pararon 230 casos de tumor cerebral con 920 no caso.\ (controles), pareados
por ano de nacimiento y raza, que aun estaban empleados en la Fuerza Aerea
ell el momento ell que se diagnostico el ca.\o, La raz6n para optar por un diseno
de casos y controles anidado (es decir, muestreo de densidad de incidencia:
vease Figura 1.2 1) en lugar de utilizar la cohorfe entera de los 880.000 miem-
bros de la Fuerza Aerea de los Estados Unidos es que se hubiera requeri do un
{rabajo intensivo de resumen de registros ocupacionales para obtener datos
exactos sobre exposici6n a radiacion electromagnetica, asf como infonnaci6n
relevante adicional sobre variables potencialmente confusoras, Una estrategia
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 33
alternat iva podrfa haber sido no excl ui r casos del marco mueslral de controles
elegibles (vease arriba). Aun otra estrategia podrfa haber sido utilizado por un
disefio caso-cohone con comroles seleccionados de entre la cohone de miem-
bros de las Fuerzas Annadas al pri ncipio de su empleo (es decir, en el momen-
to basal; vease Figura 1.20) .
Un ejemplo de muestreo de controles a panir de la cohorte total de partida (por
ejemplo, un disefio caso-cohorte; Figura 1.20) puede hall arse en el estudio de Nie-
to et al. (4 1), que evalua la relaci6n entre los anticuerpos a Clumidiu I'nellmolliae en
suero recogidos en el momenta inicial e incidencia de EC (enfennedad coronaria)
en el estudio Riesgo de Aterosclerosis en las Comunidades (ARIC) . Se trata de un
estudio de cohorte de aproximadamente 15.800 hombres y mujeres que tenian
entre 45 y 64 MOS de edad cuando se inici6 el estudio (1986- 1989). Durante el
seguimiento de 3 a 5 afios se ident ificaron 246 casos de cardiopatfa isquemica
incidente (infarto de miocardio 0 muene coronaria). EI grupo de comparaci6n en
este eSllldio consisti6 de una muestra de 550 particip..1ntes de la cohorte total, la
cual realmente incluia a lOde los 246 individuos que mas tarde desarroll aron car-
diopatia isquemica (casos incidentes), hecho que ha de tenerse en cuenta en el
anali sis estadfstico de los datos (vease tambien la Secci6n 7.4.6). Para este estu-
dio, en lugar de valorar la presencia de anticuerpos IgG de C. I'llellmoniue en
todos los integrantes de la cohone, los niveles de anticuerpos se determinab..1n
solamente en el suero de los casos y en la mencionada muestra de la cohorte; esto
es, en aproximadamente 800 individuos y no en los casi 16.000 partidpantes de la
cohorte. Ademas de la estimacion de las razones de riesgo que expresan la rela-
cion entre anticuerpos de C. I'nellmoniae y cardiopatfa isquemica incidente, la
selecci6n de una muestra aleatona de la cohorte en el est udio de Nieto et al . per-
mili6 la estimacion de la prevalencia de condiciones relevantes para el total de la
cohorte, que, como ya se consign6, pueden usarse para la detenninacion de nes-
gos at nbuibles poblacionales (vease Capitulo 3).
1 A3. Estudios transversal es
En el disefio de un estudio transversal, una muestra (0 el total) de la poblad6n de
referenda se examina en un punto dado del tiempo. Al igual que el estudio de casos
y comroles. el estudio transversal puede concept uali zarse como una manera de ana-
lizar datos de una cohorte, aunque a menudo ella es incorrecto, ya que consiste en
tomar una dnstantanea>, de una cohorte mediante registro de informacion sobre el
desenlace de la enfennedad y las exposiciones en un unico punto del tiempo (Figura
1.22)". De acuerdo con esto, el est udio de casos y controles basado en casos repre-
sentado esquematicamente en la Figura I . 19 puede ser tambien apredado como si
fuera un estudio transversal, ya que incluye casos transversalmente identificados a la
vez que incluye no casos (es decir, panici pantes de la cohone que sobrevivieron
durante un lapso suficientemente largo como para estar vivos en el momenta del
Los estudios transversales p u e d ~ n tambien hacerse peri6dicamente con el prop6sito
de supervisar el componamiento de las tasas de prevalencia de la enfermedad 0 del factor de
riesgo. como en el caso de las encuestas nacionales de salud de los Estados Unidos (41.4) ).
34 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Cohorle
hipolt'llica
____ .. : Tiempo de supervivencia
Tiempo del
estudio
---------------------------- -------------------------.
Tiempo
Figura 1.22. Rcprcscntacion esqucmatica de UII cstudio transversal conceptual y
mctodologicamcnte all aiogo al estudio de casos y controles basado en casos reprc-
sent ado ell 13 Fi gura 1.19, excepto que en vez de se leccionar explfcitamente los casos y
los comroles. se selecciona una muestra de tada 1a poblaci6n. Las lfneas diagonales dis-
continuas con flechas representan perdidas del seguimicnto. Los casos se representan por
cajas E.
est udio). De aquf se deduce que cuanda los datos transversales se oblienen para Ll na
poblaci6n 0 Ll na cohorte de referencia definida, el enfoque analftico puede consisti r,
bien en la comparaci6n de tasas de prevalencia puntuales para el desenlace de inten!s
entre individuos expuestos y no expucstos, bien en la utilizacion de la estrategia de
casos y controles, en la cual los casos prevalentes y los no casos se comparan con
respecto al odds de exposicion (veanse Capft ulos 2 y 3).
Aunque las encuestas transversales(44) de morbilidad ofrecen una oponunidad
para examinar las asociaciones exposici6n/desenlace, los analisis transversales de
la informacion de part ida en los estudios de cohorte son especialmente ventajosos,
ya que permiten obtener confirmaciones una vez que se disponga de los datos
recogidos prospectivamente. Por ejemplo, en el estudio ARIC se encontraron aso-
ciaciones transversales en eI momento basal entre la aterosclerosis coronaria asin-
(omatica definida por ult rasonido modo 8 y el habit o de fumar. tanto activo como
Estas asociaciones se contlrmaron s ubsigui entemente mediante Ia eva-
Iuacion de datos relativos a la progresion de la ateroscierosis en fumadores y no
fumadores(,u,).
Las condiciones que inll uyen sobre la validez de las asociaciones que se infieren
a partir de datos transversales se discuten en de{alle en el Capitulo 4 (Seccion 4.4.2).
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 35
1 AA. Diseiio Caso-Cruzado
Inic ialmeme propuesto por Maclure(471, este diseno cons iste en la comparaci6n
del eSlado de exposici6n de un caso inmediatamente antes de su ocurrencia con el
del mismo caso en algun momento ameri or (ej., durame el ano previo). Es espe-
cialmente apropiado para eSludiar exposiciones agudas (breves) que producen un
cambio transitorio en eI riesgo de sufri r una condici6n aguda. Por ejemplo, este
diseno se ha utilizado para eSludiar desencadenantes agudos para eI infarto de
miocardio. ta les como episodios de i r a ( ~ 8 ) y act ividad sexual(49).
Este diseno emrana un lipo especial de emparejamiemo (vease la secci6n
siguieme), ya que los individuos sirven como comroles de sf mismos: por 10 tan-
[0, [odas las caraclerfslicas individuales fijas que podrfan confundir la aso-
ciaci6n (por ejemplo, sexo, susceptibilidad genetica) estan controladas. Sin
embargo, eSlo reposa en dos supuestos: que los efectos de la exposici6n no son
acumulat ivos y que la enfermedad no tiene una e[apa precl fnica que pudiera
inadvenidamente afectar la exposici6n de imeres . Como en los esrudios de
casos y comroles, la caUdad de la informaci6n sobre la exposici6n previa se
supedita a la memoria de l caso, de manera que dichos esludios eslan sujetos al
sesgo de recuerdo (vease Secci6n 4.3. 1) .
1 AS. EI emparejamiento
En la epidemiologfa observacional, consliwye una preocupaci6n importante la con-
tingencia de que los grupos est udiados pudieran no ser comparables con respecto a
caracterislicas que pueden distorsionar (<<confundir) las asociaciones de interes. EI
lema de la confiui6n es crucial en la praclica y la inferencia epidemiol6gicas y se
discute pormenorizadameme en el Capitulo 5. Brevemente, este problema surge
cuando faclQres espurios (<<variahleJ' confilsoras) influyen sobre la direcci6n y la
magnilud de la asociaci6n de imeres. Por ejemplo, si en un est udio de casos y con-
[roles se delecla una asociaci6n entre la hi pertensi6n (exposici6n) y la enfermedad
coronaria (desenlace), podrfa argumentarse que [al asociaci6n puede (por 10 menos
en parte) ser debida al hecho de que los casos de enfermedad coronaria lienden a
ser de mayor edad que los comroles: pueslQ que la hipenensi6n se presema con mas
frecuencia en personas de mayor edad, la edad puede ser espuriamente la responsa-
ble de la asoc iaci6n observada (0 distorsionar su magnitud). Por 10 lanto, si la cues-
[i6n de interes es evaluar la relaci6n ne[a emre hipertensi6n y enfermedad coronaria
(intiel'endienfelllente de la edad), es imuilivamente conveniente seleccionar casos y
controles con las mismas edades, esto es, ellll'arejatios segun edad . Simil armente,
una presunta asociaci6n entre marcadores sericos de infl amaci6n (por ejemplo, pro-
[eina C-reacliva) y el riesgo de enfennedad coronaria puede resuit ar de la confusi6n
inducida por el habito de fumar (los fumadores. qui enes tienen mayor riesgo de
padecer enfennedad coronaria. tienden a exhi bir mayores nive les de estos marcado-
res, debido por ejemplo, a bronquit is cr6nica) . AI reconocer esla posibi li dad, los
invest igadores seguramente emparejarfan los casos y los controles de acuerdo al
habito de fumar (fumadores act uales. exfumadores 0 sujetos que nunca fumaron) en
un estudio de casos y controles anidado sobre la relaci6n emre la proleina C-reacti-
va y la enfermedad coronaria(so) .
36 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
El emparejamiento en los estudios de casos-controles y de cO/lOrte
El recurso del emparejamiemo es particul anneme li lH en el contex{Q de los esrudi os
de caso.\' Y collfroles con el fin de lograr que los casas y los controles sean tan simila-
res como sea posible con respecto a factores confusores polcnciaimente imponantes.
Otro ejemplo de emparejamiento 10 encontramos en el ya cilado estudio de factores
de riesgo para fisuras oraies(34) , en el que los casas y los controles se emparejaron de
acuerdo al lugar de nacimiento (seleccionando los controles del mismo hospital don-
de la madre habfa tcnido el parto) y momenta (seleccionando los dos nacimientos
precedentes). Un ejemplo especial de emparejamiento es cl di seno del eSllldio de
casos y comroles anidados basado en el muestreo por densidad de incidencia (vease
Secci6n 1.4 .2, Figura 1.2 1). Como ya se explic6, la aplicaci6n de esta estrat egia
result a en un emparejamiento de casas y controles de acuerdo al tiempo de segui-
mi ento. Ademas del ti empo en el estudio, los controles pueden ser emparejados a los
casos empleando otras variables que podrfan confundir la asoc iaci6n de interes . Por
ejemplo, en el estudio de la Fuerza Aerea de los Estados Unidos sobre tumores cere-
brales ya mencionado(-IO) , la muestra de controles seleccionada de los conjuntos de
riesgo en el momenta de oc urrencia de cada caso (y por 10 tanto emparejados por
tiempo de seguimiento) se emparejaban adic ionalmente por ano de nacimiento y raza.
En contraste, en los estudios de cohorte per se, el emparejamiento por variables
potencial mente confusoras no es comun. Los estudios de cohorte son a menudo
voluminosos y examinan numerosas exposiciones y varios desenlaces. Por tanto,
usualmente se milizan medios altemat ivos para controlar la confusi6n (por ejemplo,
tecnicas de aj uste; vease Capitulo 7). Entre los relati vamente escasos ejemplos en
que se ut iliza el emparejamiento en los eSllldios de cohorte estan los estudios sobre
faclOres util es para el pron6stico de supervivencia despues del diagn6stico de cancer
en ciertos ambientes . Por ejemplo, en un estudio que examina la edad (la exposi-
cion de interes) como factor pron6stico en pacientes con mieloma mUlt iple despues
de un trasplante aut ologd
S'
), los individuos de mayor edad (65 anos 0 mas) se empa-
rejaron con individuos mas j6venes (65 anos 0 menos) con respecto a otros faclOres
que afectan el pron6stico y podrfan por tanto confundir la asociaci6n edad-supervi-
vencia (niveles de fh-microglobuli na, albumi na, creatinina y protefna C-reactiva y la
presencia 0 ausencia de anonnali dades cromos6micas).
Tipos de emparejamietlto
Todos estos ejemplos se referian a eSllldios en los cuales los casos y los commies estaban
indivitiualmellfe emparejados: esto es, para cada caso, uno (0 mas) controles con las carac-
terfsticas relevantes emparejadas con los casos se eligiemn del conjumo total de no casos.
EI emparejamiento individual bas..1do en variables nat ural mente categ6ricas (por ejemplo,
sexo) no tiene mayor complicacion. Cuando el emparejamiemo concieme a variables con-
tinuas (por ejemplo. edad). usualmente se define un recorrido de emparejamiento (por
ejemplo,el control emparejado por edaddebe ser igual a la edad del caso fndice 5 aftos) .
En esta silllacion, asf como cuando las variables son arbitrariamente categori zadas (por
ejemplo, hipertensolnonnotenso 0 aClllal fumador/ex-fumador/nunca fum6), las diferen-
cia." entre los casos y los contmles pueden no haberse eli minado, 10 que resul ta en una con-
fusion residual (veanse Capit ulo 5, Secci6n 5.4.3 y Capfnllo 7, Secci6n 7.5) .
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 37
EI emparejamienlo individual puede ser logfsticameme difk il en ciertas silua-
ciones, partic ularmente cuando hay un numero li mitado de controles potencialmen-
Ie elegibles y/o cuando el emparejamiento se basa en multi ples variables. Una
estrategia alt ernativa es lIevar a cabo el emlHlrejamiellfo por grulJos (frequency
matching) que consiste en seleccionar un grupo cOnlrol de lal manera que la distri-
buci6n de la variable (0 variables) de emparejamienlo sea simil ar a la de los casos
pero sin hacer un emparejamiento caso por caso. Para lI evar a cabo el empareja-
miento por grupos se necesita usual mente un conocimiento previo de la distribu-
cion del grupo de casos para las variables de emparejamiemo. de manera que pue-
dan est imarse las fracciones de mueslreo necesarias dentro de cada estrato de la
poblaci6n de referencia con vistas a la adecuada selecci6n del grupo control. Por
ejemplo, si el emparejamienlo debe hacerse atendiendo a sexo y edad (clasificada
en dos grupos de edad, < 45 anos y O!: 45 anos), se definirfan 4 estratos: mujeres
menores de 45 anos, mujeres de 45 anos 0 mas, hombres menores de 45 anos, y
hombres de 45 anos 0 mas . Una vez que se obtiene la proporci6n de casos en cada
uno de estos 4 grupos, el numero de controles que debe seleccionarse para cada
eSlrato de edad y sexo se escoge de manera que la proporcion de controles en cada
estrato sea la misma que en eI cDrrespondiente grupo de casos. Si los controles
deben seleccionarse de un marco poblacional ampli o para el cual esta disponible la
informaci6n sobre las variables de emparejamiento, este proceso puede ser realiza-
do faci lmente mediante muestreD aleatorio estrat ificado con las fracciones de
muestreo deseables de cada estrato especffico. Por otro lado, si esta informaci6n no
eSluviera disponible previamente (por ejemplo, cuando los comroles se seleccionan
entre personas que ac uden a ciena clfnica de consult a externa), la selecci6n de los
controles puede hacerse por muestreo sistematico, con 10 cual pudieran sucesiva-
menle irse anadiendo los individuos seleccionados a cada estrato hasta que se com-
pleten los lamanos previs(Qs . Gtra eSlralegia, cuando la dist ribuci6n de los casos
segun las categorfas de las variables de emparejamiento no se conocen previamente
pero el investigador desea seleccionar y obtener informaci6n sobre casos y contro-
les concurrenlememe, es obtener (y peri6dicamente actuali zar) dislribuciones pro-
visionales de casos, permiliendo asf que la selecci6n de comroles sea lIevada a cabo
antes de que se identifiquen todos los casos.
Un metodo alt ernativo de emparejamiento por un numero grande de variables,
incl uyendo variables cont inuas. es el lI amado metodo de la medida de minima di.\
fllllcia ew.;lidianaf52l. Por ejemplo. en el eswdio de la edad como factor pron6stico
despues del trasplame en pacientes con mieloma multi ple que se describio amerior-
mente(S!), los individuos mas j6venes y mas viejos se emparejaban de acuerdo a cin-
co fac(Qres pron6stico (cuatro de el los, variables cominuas) . EI emparejamiento de
acuerdo a definic iones categ6ricas de todas esas variables hubiera sido baslante
engorroso; ademas, para algunos individuos expuestos, podrfa haber sido difkil
encontrar pares emre las personas no expuestas . Por 10 tamo, los autores de eSle
eSludio emparejaron por el metodo de la medida de mfnima distancia euclidiana que
se ilustra esquematicameme en la Figura 1.23. Para simplificar. en la figura se con-
sideran solo dos factores de emparejamienlo. Para cada caso expuesto, se escoge
como control la persona elegible mas cercana (por ejemplo, pacieme no expuesto)
en eSle espacio bidimensional definido por los niveles de albumina y creat inina. En
el est udio de Siegel et al .(SI ), los autores emparejaron por mas de dos variables
(niveles de fh-microglobulina, alblimina, creatinina, proleina C-reacliva y la presen-
38 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
o
00.......
o
o
o
o
Albumina
o
o
o
o
o
o
: Expuestos
o : No expuestos
Figura 1.23. Emparejamiento de acuerdo al metodo de la medida de minima
distancia euclidiana. Ejemplo hipotetico de un est udio de coholtes de supervivencia
despues del trasplante en paciemes con mieloma multi ple en el ell al los individuos
expuestos (ej ., individuos de mayor edad) se emparejan a los pacientes no expucstos
(los mas j6venes) atcndiendo ados factores pron6stico: niveles de albumina serica y
creatinina. Para cada caso se escoge como control el individuo no expucsto mas cer-
cana en el espacio bidimensional definido por las dos variables de emparejamiemo.
Fuente: Los autores. basado en el esludio de Siegel el al. I"I.
cia 0 ausencia de anormali dades cromosomicas) utilizando este metodo. (El espacio
multidimensional requerido cuando se utilizan mult iples vari ables en el empareja-
miento no es susceptible de ser represcntado en un diagrama.) Este metodo puede ser
ut ilizado tambien en estudios de casos y controles basados en casos 0 en estudios de
casos y controles dentro de una cohorte, tal como ocurre en la aplicacion ori ginal
debida a Smith ef al J S2), 10 que constituye una forma alternativa conveniente y eficien-
te cuando se necesita emparejar por vari ables mul tiples y/o cont inua.,>.
Velltajas y desvelltajas del emparejamiellto
Aunque existen pocas dudas acerca de que el emparejamiento sea una estrategia ut il
para controlar el fenomeno de confusion, ella esta lejos de ser la unica. El Capitulo 7
se destina totalmente a descri bir algunos de los procedimientos que pueden ser apli -
cados en la etapa analftica para encarar el problema de la confusi6n - concretamen-
te, la estratificacion y los aj ustes - . Manejar la confusi6n antes de la recolecci6n de
los datos por medio del emparejamiento durante la fase de recl ut amiento 0 hacerlo
mediante estrat ificacion 0 ajuste en la fase del analisis es una decisi6n que depende
de numerosas consideraciones .
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 39
Entre las venraja.\ del emparejamiento se hall an las siguientes:
I. Ademas de ser facH de entender y de describir, el emparejamiento puede ser la
unica manera de garantizar algun grado de control de la confusion en ciertas
situaciones. Esto puede ser paniculannente imponante en los est udios en los
cuales una variable de confusion potencialmeme fuerle puede producir un
desbalance tal en la composici6n de los grupos de est udio que el aj uste es diff-
ci l 0 directamente imposible. Por ejemplo, en un est udio de casos y controles
para evaluar posibles factores de riesgo para el cancer de prostata. tendrfa sen-
lido emparejar los controles a los casos con acuerdo a la edad; por 10 menos,
dado que la mayorfa de los casos de cancer prostatico eSlan en los gmpos de
edad mas avanzados, el investigador deberfa resrringir la elegibilidad de los
miembros del grupo control a un cierto recorrido de edad. (La restriccion es
una forma algo "debil " de emparejamiento) . De otra forma, si los controles se
seleccionaran de la poblacion general, el recorrido de edades podrfa ser tan
amplio, panic ulannente si la muestra fuese pequefia, que no habrfa la sufi-
ciente superposici6n con el reslringido recorrido de edades de los casos (es
decir, no habrfa suficientes sujetos de las edades mas ali as en la muestra con-
trol) para pennitir el ajuste (veanse Capitulo 5, Secci6n 5.2.3) .
2. Cuando el emparejamiento se hace a panir de variables de confusion fuertes
(variables que estan relacionadas con la exposici6n y con el desenlace; vease
Capitulo 5), el emparejamiento tiende a incrementar la potencia estadfstica
(eficiencia) del est udio(S354).
3. EI emparejamiento (especialmeme el de naturaleza individual) es una manera
logfsticamente directa para obtener un gmpo control comparable cuando los
casos y los controles se identifican de una poblaci6n de referencia para la cual
no existe un li stado como marco mueslral. Por ejemplo, en un eSlll dio de casos
y controles que ul iliza casos de diabetes identificados en la consulla externa,
cada caso debe emparejarse al proximo control sin diabetes con las mismas
caraclerfsticas que el (por ejemplo, el mismo sexo y con edad simil ar).
Tambien deben considerarse las de.wentajas del emparejamiento, de las cuales
las mas imponantes son las siguientes:
I. En ciertas siluaciones puede ser diffc il 0 imposible encontrar un control
emparejado (0 controles emparejados, si la raz6n de controles a casos es
mayor que I: I) para un caso dado, paniculannente cuando la selecci6n se rea-
liza de una poblaci6n fuente limit ada, 0 cuando se empareja por mul ti ples
variables. Ademas, inciuso si se tuvieran controles disponibles para empare-
jar, el proceso de identificarl os puede ser engorroso e incrementar los costos
de la fase de recimamiento.
2. Cuando se empareja, no puede evaluarse la asociaci6n entre el desenlace y las
variables usadas para emparejar: clio se debe a que una vez que se consuma el
emparejamiento por cierta variable, los grupos de est udio (por ejemplo, casos
y comroles) se fuerzan a ser iguales por disefio (0 similares) con respecto a
eSla variable 0 a eSle conj unlo de variables,
3, Se deriva de (2) que en los estudios de casos y controles emparejados no es
posible evaluar la interacci6n adiliva entre las variables de emparejamiento y
40 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
la exposici6n de interes. Como se discute en el Capitulo 6 (Secci6n 6.4.2), la
evaluaci6n de la imeracci6n aditiva en un estudio dpieo de casas y comroles
recae sabre la f6rmula para el cfeclo esperado conjunto de dos variables A y
Z, RRA+z+= RRA+z- + RR".z+- 1,0 (usando los odds ratio como estimados de
los riesgos relativos IRRJ) . Suponiendo que A es la vari able de emparejamien-
to, su cfccto independiente (RRA+z-) no puede ser est imado, ya que ha sido
fijado en 1,0 por disefio (vease 121 arriba) . Por 10 tanto, la formula anterior no
puede apl icarse.
4. Para el analisis de datos que han sido emparejados, deben ut ilizarse tecnicas
estadislicas especiales, como se detall a en eI Capitulo 7 (Secci6n 7.4.6) .
5. El emparej amiento implica delto grado de precaudon en eI proceso de selec-
don de los gmpos de estudio para hacerlos tan comparables como sea posible;
esta comparabil idad interna aumentada puede, sin embargo, implicar una
falta de representat ividad. Por ejemplo, un grupo control que se tome identico
a los casas con respecto a caracterfsticas sododemografi cas y variables confu-
soras puede dejar de constituir una muestra representativa de la pobladon de
referenda. Por tanto, tal gmpo control puede ser de uso li mitado para estudios
adidonales que podrfan ser de interes. Por ejemplo, en los estudios que exami-
nan la asoc iadon entre factores de ri esgo nuevos y una enfermedad, un objet i-
vo secundario, pero importante, puede ser eI estudio de la distribudon de estos
factores en la poblad on de referenda. Si los controles se emparejan a los
casos, utilizar las distribudones observadas en el gmpo control para hacer infe-
rendas al total de la poblad6n puede ser una tarea compl icada (se requieren
anali sis complejos que exigen ponderadones que contemplan las fracdones de
muestreo asadadas con el proceso de emparejamiento). Por otro lado, si se
escogiera una muestra aleatoria de la pobladon de referenda (como se hace en
los est udios de caso-cohorte), serla legfti mo extrapolar la dislribudon de los
factores de ri esgo en el grupo control a la pobladon de referenda. Obtener
estas distribudones (por ejemplo, la prevalenda de la exposid6n en la pobla-
don) es particul armente imponante para la est imadon del ri esgo atribuible
pobladonal (vease Capftulo 3, Secd6n 3.2.2). Ademas, un gmpo control que
se selecdona como una muestra aleatoria de la poblad6n fuente puede ser uti-
lizado como grupo de comparacion para Olro grupo de casas seleccionado de la
misma cohorte 0 de la poblaci6n de referenda. Por ejemplo, en el esmdio caso-
cohone que evaluo la reladon entre C. p"el/moniae y la enfennedad coronaria
el grupo control (n = 550) se selecdon6 como muestra aleatoria
de la cohorte inidal; la presencia de antic uerpos sericos de C. pllel/moniae
entre esos controles se compara con la de los 246 individuos que se convirt ie-
ron en casos de enfennedad coronaria durante el seguimiento. El mismo grupo
control puede ser utilizado para la evaluaci6n del papel de C. pneumolliae para
un desenlace diferente como. por ejemplo, los accidentes vasc ul ares encefali -
cos. Por tanto, a medida que se extiende el tiempo de seguimiento en este estll -
dio de cohorte. y una vez que se desarrolla un numero imponante de casas (de
accidentes vascul ares encefali cos), puede lI evarse adelante un anali sis subsi-
guiente de caso-cohorte que evalue la asociacion entre los anticuerpos de C.
pllellmoniae y el accidente vasc ul ar encefalico midiendo los anticuerpos solo
en los casas de accidentes vasculares encefalicos y ut ili zando para la compara-
ci6n, nuevamente, los datos obtenidos en el gmpo control.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA 41
6. Debido a que, una vez concrelado un emparejamiento, este no puede ser des-
hecho, es imponame que las variables empleadas para el emparejamiemo no
esten fuertemente correlacionadas con las variables de interes; de otra forma,
puede aparecer el fen6meno de sobremparejamiento . Por ejemplo, empare-
jar casos y comroles por raza puede en buena medida dar lugar a que unos
sean muy simi lares a los olros en cuanto a variables de imeres relacionadas
con el nivel socioecon6mico. Para conocer mas consideraciones y ejemplos
sobre este t6pico, vease Capit ulo 5 (Seccion 5.2.3) .
7. Finalmente. debe deci rse que no se gana pOlencia estadislica si las varia-
bles de emparejamiemo son confusores debiles. Si las variables de empare-
jamiento estan escasamente re lacionadas con la exposicion, aun cuando
estas variables eSlen relacionadas con el desenlace, la ganancia en eficien-
cia puede ser muy pequefia . Ademas, si las variables de emparejamiento
estan debil mente re lacionadas 0 no eSlan relacionadas con el desenlace de
interes, la aplicaci6n de este procedimiemo puede dar lugar a una perdida
de pOlencia(H.S4).
Cuando el emparejamiemo se aplica a partir de definiciones categoricas de varia-
bles cominuas, las diferencias residuales entre casos y controles pueden no ser eli mi-
nadas (collfusi611 residual; vease Capflulo 5, Seccion 5.4.3, y Capit ulo 7, Seccion
7.5) . En estas situaciones, puede resullar necesario realizar aj ustes por la variable en
cuesti6n a posteriori (en la fase de anali sis) para eliminar la variaci6n dentro de las
categorias de emparejamiemo. Porejemplo. en el est udio sobre la relaci6n emre ant i-
cuerpos de cilOmegalovims en mueslras de suero recogidas en 1974 (y anali zadas
retrospect ivameme) y la presencia de aterosclerosis carotfdea medida por ultrasonido
modo-B de las arterias car6tidas como parte del examen de partida en el estudio
ARIC (l987- 1989)(SS), ISO comroles (seleccionados emre individuos con arterias
car6t idas nonnales) se emparejaron por gmpos a lSO casos con alerosclerosis carOli-
dea de acuerdo al sexo y a dos grupos de edad relativamente ampIi os (45-54 afios, 55-
64 afios). Por lamo, por disefio, ambos gmpos, el de casos y el de comroles, tenian
identico numero de individuos en los cuatro grupos de edad-sexo; sin embargo, los
casos en este estudio lenian en promedio 58,3 afios de edad, mientras que la edad pro-
medio entre los comroles fue de 56,7 afios . Consecuentememe, aun cuando los gm-
pos de est udio eSlaban emparejados por dos categorfas de edad, la diferencia residual
en las edades Ilevo a que los autores aj ustaran por edad como ulla variable comillua
en el anali sis de regresi6n logfstica mult ivariada (vease Capit ulo 7, Secci6n 7.4.3) .
Las mismas diferencias res iduales pueden pennanecer incluso en los estudios
donde se aplic6 emparejamiento individual si las categorfas de emparejamiento
no son suficientemente La raz6n de este fen6meno se il ustra en la
Figura 1.24. Aun cuando los casos y controles estan igualmente representados en
ambos grupos de edad, dentro de cada uno de eslOs, los casos tienden a ser de
mayor edad, produciendose asi una diferencia global.
En resumen. los invest igadores deberfan siempre considerar cuidadosamente si
deben hacer uso de emparejamiento 0 no. A diferencia de los procedimientos post
hoc para controlar la confusion (estratificaci6n y ajuste), el emparejamiento es irre-
versible una vez que se aplica. Aunque esta puede ser la eSlrategia de eleccion en
eSludios con tamafios de muestras limitados y un conj unto claro de objetivos, debe-
ria evitarse en la mayoria de las situaciones en las cuales se espera que exisla una
42 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
JL--+--i
Casas
2
45 47 49 ' 51 53
Mueslra del eslralo, n '" 25
edad media " 5211tlos
I
55 57 59 '" 61 63 65 Edad
Muestra del estrato, n ,,40
",dad media " 62 anos
. ~ 1-----+-------.,
Controles
z
45 47 49 '" 51 53
Mueslra del eslralo, n '" 25
edad media", 50 anos
I
55 57 59 '" 61 63 65 Edad
Muestra del estrato. n '" 40
edad media", 60 atlos
Figura 1.24. Rcprescntacion esquematica de ulla situacioll hipotctica en la enal el
cmparejamicnto de casos y controles de acucrdo a catcgorfas de edad amplias (45-54
aiios: 55-64 aiios) da Ingar a ulla dircrcncia residual ell los promcdios de edad (confusi6n
residual). Los casos eslan escorados hacia las edades mayores. pero la distribuci6n por eda-
des de los controles es plana. Como resultado. el promedio de edad denlfO de cada grupo de
edad es mayor en los casos que en los controles, 10 que resulta en una media de edad global
de 58,2 aiios para los casos y 56.2 alIOS para los commIes.
superposici6n razonable de variables potencial mente confusoras (y que permit en e l
aj uste) 0 en los cuales se es(udian hip6tesis secundarias,
BlBLIOGRAFiA
I. Last 1M. A didionar), of epidemiology. 3.' ed. New York, Oxford University Press.
1995.
2. MacMahon B. Pugh TE. Epidemiology: Prindples and Methods. Boston, Li ttle. Brown
and Co, 1970.
3. Gordis L. Epidemiology. Philadelphia, WB Saunders, 1996.
4. Strong 1P. McGil l HC. The pediatric aspects of atherosclerosis. J Atherosd Res 1969: 9:
251265.
5. Frost WH. The age-selection of tuberculosis mortality in successive decades. Am J Hyg
1939: 30: 91-96.
6. L6pez.Abente G, Polhin M, Vergara A et al. Age-period-cohort modeling of colorectal
cancer incidence and mortality in Spain. Callcer Epidemiol Biolllarkers Prey 1997: 6:
999-1005.
7. Rocca WA, Cha RH. Waring SC, Kokmen E. Incidence of dementia and Alzheimer's dise-
ase: a reanalysis of the Rochester. Minnesota 19751984 data. Am J Epidemiol 1998: 148:
5 1-62.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPlDEM10LOGIA ANALlnCA 43
8. Newschaffer CL Bush TL Hale WE. Aging and total cholesterol level s: cohort. period.
and survivorship effects. Am J Epidemiol 1992: 136: 23-34.
9. Keys A. Sel'en cOllntries: A mllltivariate allalysis of dealh and L'orollary heart disease.
Cambridge, Harvard University Press . 1980.
10. Morgenstern H. Ecological studies in epidemiology: concepts. principles. and methods.
Ann Rev Public Heallh 1995: 16: 61-81.
II. Diez-Roux AV. Nieto FJ. Muntaner C el al. Neighborhood environments and coronary
heart disease: a multilevel analysis. Am J Epidemiol 1997: 146: 48-63.
12. Diez-Roux A V. Bringing context back into epidemiology: variables and fallacies in mul-
tilevel analysis. Am j Public Heallh 1998: 88: 216-222.
13. Durkheim E. Suicide: A study ill .\"Ociology. New York. Free Press: 1951.
14. Piantadosi S. Byar DP. Green SB. The ecological fallacy. Am J Epidemiol 1988: 127:
893903.
15. Elliott P. Design and analysis of multi centre epidemiological studies: the INTERSALT
study. En: Marmot M. Elliot p. (eds). Corollary hear! disease epidemiology: From aetio
logy 10 public heallh. Oxford. England: Oxford University Press: 1992: 166-1 78.
16. Wynder EL Cohen LA. Muscat 1E et al. Breast cancer: weighing the evidence for a pro-
moting role of dietary fat. J Natl Canar IIISI 1997: 89: 766-775.
17. Goldberger J. Wheeler GA. Sydenstrycker E. A study of the relation of family income
and other economic factors to pellagra incidence in seven cotton mill villages of SOUlh
Carolina in 1916. PlibliL' Health Rep 1916: 35: 2673-27 14.
18. Koopman 1S. Longini 1M. The ecological effects of individual exposures and nonlinear
disease dynamics in populations. A.m J PlibliL' Health 1994: 84: 836-842.
19. Breslow NE. Day NE. Slatistical Methods ill Callcer Research. Vol I. The Allalysis of
CaseConlml Studies. Lyon. France: IARC Scientific Publications. 1980.
20. Breslow NE. Day NE. StatisliL-a/ methods ill callcer research. Vol 2. The desigll alld
analysis of cohor! studies. Lyon. France: IARC Scientific Publications: 1987.
21. Samet J. Muiioz A, Cohort studies. Epidemiol ReI' 1998: 20( I).
22. Schlesselman JJ . Case cOlllrol studies. New York. Oxford University Press: 1982.
23. Amlenian H. Applications of the case-control method. Epidemiol ReI' 1994: 16(1):
1-164.
24. Hill AB. The environment and disease: association or causation? Proc Royal Soc Med
1965: 58: 295-300.
25. Dawber TR. The Framillgham Stl<dy: The epidemiology of atherosclerotic disease. Cam-
bridge. Harvard University Press: 1980.
26. Kaslow RA. Ostrow DG. Detels R et al. The Multicenter AIDS Cohort Study: rationale.
organization. and se lected characteristics of the participants. Am J Epidemiol 1987: 126:
310-318.
27. Stampfer MJ. Willett WC, Colditz GA et al. A prospective study of postmenopausal
estrogen therapy and coronary heart disease. N Engl J Med 1985: 313: 10441049.
28. Ascherio A. Rimm EB. Stampfer MJ et al. Dietary intake of marine n-3 fatty acids. fish
intake, and the risk of coronary disease among men. N Ellgi J Med 1995: 332: 977982.
29. Garfinke I L. Selection. follow.up. and analysis in the American Cancer Society prospec-
tive studies. Natl Cancer Illst Monogr 1985: 67: 49-52.
30. Vandenbroucke 1P. Prospective 01 retrospective: what's in a name? Br Med J 1991: 302:
249-250.
31. Nieto PJ . Salo M. Comstock G\'.'. Childluxx! weight and growth as predictors of adult
mortality. Am J Epidemiol 1992: 136: 201-213.
32. Tynes T, Andersen A. Langmark F. Incidence of cancer in Norwegian workers potentially
exposed to electromagnetic fields. Am J Epidemiol 1992: 136: 81-88.
33. Cornfield 1. A method of estimating comparative rates from clinical data: applications to
cancer of the lung. breast and cervix. J Natl Canar IlISt 1951: II: 1269 1275.
44 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APUCACIONES
34. Christensen K. Olsen l . Norgaard-Pedersen B el al. Oral clefts. transforming growth fac-
tor alpha gene variants. and maternal smoking: a population-based case-control study in
Denmark. 1991-1994. Am J Epidemio/l999: 149: 248-255.
35. Kleinbaum DG. Kupper LL. Morgentern H. (1982). Epidemiologic researdl: PrinL"iples
and q1lanlilalive methods. Belmont. Lifetime Learning Publications.
36. Langholz B. Thomas DC Nested case-control and case-cohort methods of sampling
from a cohort: a critical comparison. Alii J Epidemiol 1990: 131: I 69-176.
37. Thomas D. New techniques for the analysis of cohort studies. Epidemiol Rev 1998: 20:
122-134.
38. Checkoway H. Pearce NE. Crawford_Brown 01. Resellrch melhods in occuptllionlll epi_
demiology. New York. Oxford University Press. 1989.
39. Roth man Kl . Greenland S. Modern epidemiology. 2.' ed. Philadelphia. Li ppincott-Raven
Publishers. 1998.
40. Grayson lK. Radiation exposure. socioeconomic status. and brain tumor risk in the US
Air Force: a nested case-control study. Am J Epidellliol. 1996: 143: 480-486.
41. Nieto FJ. Folsom AR. Sorlie Pel al. Chlamydia pllellmolliae infection and incident coro-
nary heart disease: the Atherosclerosis Risk in Communities (ARIC) StUdy. Alii J Epide-
111;0/1999: 150:149-156.
42. Flegal KM. Carroll MD. Kuczmarski RJ. el al. Overweight and obesity in the United States:
prevalence and trends. 1960-1994. Inl JObes Relal Melab Di.wrd 1998: 22:3947.
43. Hickman TB. Briefel RR, Carroll MD. el al. Distributions and trends of serum lipid
levels among United States children and adolescents ages 4-19 years: data from the
Third National Health and Nutrition Examination Survey. Prev Med 1998: 27: 879-890.
44. Li ster SM. Jonn LR. Parental smoking and respiratory disease in Australian children
aged 0-4 years: ABS 1989-90 National Health Survey results. AIISI NZ J Pllblic Heallh
1998: 22: 781-786.
45. Howard G. Burke GL. Szklo M. el al. Active and passive smoking are associated with
increased carotid wall thickness: the Atherosclerosis Risk in Communities study. Arch
InlernMed 1';1'14: 154:
46. Howard G. Wagenknecht LE. Burke GL. el al. Cigarette smoking and progression of
atherosclerosis: the Atherosclerosis Risk in Communities (ARI C) study. JAMA. 1998:
279: 119- 124.
47. Maclure M. The case-crossover design: a method for studying transient effects on the
risk of acute events. Alii J Epidemiol 1991: 133: 144-153.
48. Mittleman MA. Maclure M. Sherwood lB el al. Triggering of acute myocardial infarc-
tion onset by episodes of anger: Determinants of Myocardial Infarction Onset Study
Investigators. Circllialioll 1995: 92: 1720-1725.
49. Muller lE. Mittleman MA. Maclure M el al. Triggering of acute myocardial infarction by
sexual activity: low absolute risk and prevention by regular physical exertion. Detenninants
of Myocardial Infarction Onset Study Investigators.JAMA 1996: 275: 1405-1409.
50. Ridker PM. Cushman M. Stampfer r-.U el al. Infl ammation. aspirin. and the risk of car-
diovascular disease in apparently healthy men. N Engl J Med 1997: 336: 973-979.
51. Siegel OS. Desikan KR. Mehta J el al. Age is not a prognostic variable with autotrans-
plants for multiple myeloma. Blood 1999: 93: 51-54.
52. Smith AH. Kark 10. Cassel l C. Spears GFS. Analysis of prospective epidemiologic stu-
dies by minimum distance case-control matching. Am J Epidemio/1977:105: 567-574.
:'\1 . MI . ilnfl efficiency in epirlemio loicill Ri()lt1P1ri/w
198]: 68: 577-588.
54. Thompson WD. Kelsey lL. Walter SO. Cost and efficiency in the choice of matched and
unmatched case-comrol study designs. Alii J Epidemiol1982: 116: 840-851.
55. Nieto FJ. Adam E. Sorlie P. el al. Cohort study of cytomegalovirus infection as a risk fac-
tor for carotid intimal-medial thickening. a measure of subclinical atherosclerosis. Circu-
lalioll 1996: 94: 922-927.
PARTE II
MEDICION DE LA OCURRENCIA
DE ENFERMEDADES
Y DE LA ASOCIACION
CAPITULO 2
Medici6n de fa ocurrencia
de fa enfermedad
2.1. INTRODUCCION' ELEMENTOS BASICOS DE INFERENCIA
EPIDEMIOLOGICADEFlNICION Y CONTEO
DE LOS RESULTADOS DE LA ENFERMEDAD
Los desenlaces de la invest igaci6n epidemiol6gica se han definido tradic ionalmeme
en terminos de enfennedad, aunqlle la credente apl icaci6n de la epidemiologfa a la
salud publica y a la medic ina preventiva requiere cada vez con mas frec lI encia del
uso de indicadores que midan desenlaces de los procesos vinculados a la salud en
general (por ejemplo, medidas del estado funcional en est udios epidemiol6gicos
relacionados con el envejecimiento) . Tales result ados 0 desenlaces pueden expresar-
se por conducto de variables discretas (por ejemplo, oc urrencia 0 gravedad de la
enfermedad) 0 cont inuas.
Variables conrinllfl.\", tales como la tensi6n arterial 0 los niveles de glucosa, son
frec uentemente empleadas para medir desenlaces en epi demiologia. Las herramien-
tas estadisticas fundamentales que se emplean para operar con este tipo de resulta-
dos son los coeficientes de correlaci6n, el analisis de la varianza y el anali sis de
regresi6n lineal, las cuales se explican en numerosos li bros de texto de estadistica.
Una breve revisi6n de la regresion lineal puede hallarse en el Capitulo 7 (Secci6n
7.4. 1) como un antecedente para introducir las tecnicas de anali sis de regresion mul-
tivariada en epi demiologia. Otros aspectos metodol6gicos concernientes al uso de
variables continuas en epidemiologia, tratadas en el Capit ul o 8, se relacionan con el
control de cali dad y las de fiabilidad.
EI presente capitulo se oc upa en 10 fundamental de variables categ6ricas con
result ado dicotomico, las mas frecuentemente empleadas en estudios epidemiol6gi-
cos . La frecuencia de este tipo de result ado puede ser genericamente definida como
eI numero de sujetos con una de [as posibles condiciones (el numerador) dividido
por el de individuos en riesgo de desembocar en dicha condicion (el denominador).
Existen dos tipos de medidas absolutas de la frecuencia de resultados: incidencia y
prevalencia (Tabla 2.1).
Aunque el termino incidencia ha sido tradicionalmente empleado para aludir a
una proporcion de casos nuevos (incidentes) de una enfennedad, en rigor, I abarca
b freclJenci;) cie clml'1 lJ ier nlJevo aconlecimienfo relacionacio con la 0 con I;)
enfermedad, y por tanto, tambien incluye la muerte, la recaida de enfennedad entre
los pacientes, la curaci6n, la menopausia, y asi sucesivamente. La incidencia es par-
ticul annente importante para la investi gacion epidemiologica anaiftica, puesto que
consiente la estimacion del riesgo, necesaria a su vez para evaluar asociaciones cau-
sales .
48
Medlda
Incidencia
Prevalencia
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Tabla 2.1
Medidas absolutas de frecucllcia de 13 enfermcdad
Expresa
Frecuencia de un
avento nuevo
Frecuencia de un
avento existente
Tlpos de Event os
Irrupci6n de una enfermedad
Muerte en la poblaci6n en riesgo (mortalidad)
Muerte en pacientes (Ietalidad)
Recurrencia de una enfermedad
Aparici6n del electo colaleral de un medicamento
Prevalencia puntual: Numero de casas en un instante
Prevalencia de periodo: Numero de casas durante
un periodo dado (por ejemplo un ano)
Prevalencia acumulada (a 10 largo de la vida): Numero
lolal de casas producidos en cualquier momenta
del pasado
La prevalencia, por olra parte, mide 1a frecuencia de un resul lado exislente, en
derta momenta - prevalencia punt ual- 0 durante un lapso dado - prevalencia de
un periodo. Un tipo especial de prevalencia de periodo es la prevalencia a 10 largo de
la vida, la cual mide la frecuencia ac umul ada desde el comienzo de la vida de cierto
result ado hasta el presente (es deci r, la proporcion de personas que han tenido tal
evento en algun momento en el pasado) .
Tanto para la prevalencia como para la incidencia, es necesario contar con una
definici6n clara del result ado 0 desenlace como un evenfo (un suceso notable
como se define en un dicc ionario de ingles(')). En epidemiologfa, un evento se define
como la ocurrencia de cualquier fenomeno morboso 0 de salud que pueda ser carac-
teri zado. Para la incidencia (vease Secci6n 2.2), inequfvocamente esta caracteri za-
cion demanda de una definicion precisa del momento de ocurrencia del inequfvoca-
mente evento en cuesti6n . Algunos eventos se definen y locali zan en el tiempo muy
hi.ci lmente, tales como eI nacimiento, d a muerte, un acto quirurgico y un
infano agudo del miocardio. Otros no eslan tan nitidamente deli mitados y requie-
ren de una definici6n operacional mas 0 menos arbitraria para el estudio; tal es el
caso de eventos como menopausial", recuperacion, y enfermedad
por citomegalovims (CMV) (Tabla 22). Un ejemplo de la complejidad que entrafia
la definicion de ciertos sucesos cl fnicos se presenta con la defi nicion ampliamente
aceptada de un caso de sfndrome de inmunodeficiencia adquirida (SIDA), la cual
emplea vados criterios clfnicos y de laboratorio(6) .
Las pr6ximas dos secciones de este capftulo describen las dife rentes alternativas
para calcular la incidencia y la prevalencia. La ul tima seccion describe el odd.\, una
manera alternat iva de medir la frec ucncia de la enfermedad. EI odd.\ constituye la
base para la constmcci6n de herramientas analfticas frec uentemente empleadas en
epidemiologfa, particularmente en los est udios de casos y controles (Capitulo I,
Seccion 1.4.2); mas concrctamente, son relevantes para el examen de los odds rclat i-
vos (Capitulo 3, Seccion 3.4.1) y para el anal isis de regresion logfstica (Capftulo7,
Seccion 7.4.3).
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Tabla 2.2
Ejemplos de definicion operacional de eventos en cstudios epidcmiologicos
Evento
Menopausia
Remisi6n de
diarrea
Damencia
Enfermedad
eMV
Definicion
Fecha del ultimo periodo menstruat despues de que
una mujer ha dejado de menstruar par espacio
de 12 meses.
Dos dias tibres de diarrea (diarrea :0 etapa con 3
o mas depasiciones liquidas 0 semis6lidas en un dial .
Ingreso hospilalario, inslilucionalizaci6n 0 admisi6n
en un hospital de dia 0 en un hospital psiquilttrico con
diagn6stico de demencia (CIE9CM c6digos
290.0290.4. 294.0. 294.1. 331 .0-331.2).
Evidencia de inlecci6n por CMV (ant igeno CMV
en celulas blancas de la sangre. cullivo de CMV
o seroconversi6n) acompai1ado par cualquier expresi6n
de fiebre en picas no por Olra raz6n par mas
de 48 horas y malestar general 0 una caida en los
conteos de neulr6filos por mas de 3 dias conseculivos.
2.2. MEDlDAS DE INClDENCIA
Referenclas
Bromberger el al. (2)
Mirza el al. (3)
Bralelar at al. )
Gane el al. (5)
49
La incidencia se enti ende mejor en el contexto de los estudios prospecti vos (0 de
cohone) (Capitulo I . Secci6n I .4.1 ). La estructu ra basica de cualquier indicador
de incidencia es la sigui ente: el nlimero de sucesos que ocurren en una poblaci6n
definida a 10 largo de un lapso especffico (numerador) se di vide por la poblaci6n en
riesgo de experimentar tal evento durante dicho lapso (denominador) . Hay dos tipos
de medidas de incidencia que se definen seglin el tipo de denominador: I ) medidas
de incidencia. basadas en personas en ri esgo; y 2) medidas de incidencia basadas en
unidades persona-tiempo en ri esgo.
2.2.1. Incidencia basada en indi viduos en riesgo
Este es un Indice definido en tenninos de la probabilidad de un evento, tambi en
conocido como incidencia aClllllulada. base para aplicar las tecnicas estadfsticas
universalmente conocidas como de slIl'ervivencia.
Si el seguimiento es complew para cada individuo de la cohorte, la estimaci6n de
la incidencia acumul ada es simplemente el numero de eventos ocurridos durante eI
seguimiento di vidido por la poblaci6n inic ial. Sin embargo. a menudo en los es(U-
dios epidemiol6gicos. el segui mi ento es incompleto para muchos 0 para todos los
individuos en el estudio. En un estudio de cohort e Ifpico. hay individuos que se pier-
den, aquell os que mueren por causas diferentes a la de interes, y aquellos cuyo
seguimiento es mas corto en vinud de que son rec1utados para el esmdio mas tarde
en el periodo de rec1utamiento; lodos ellos producen las lI amadas observacioneJ'
y requieren enfoques analflicos especiales. Las tecnicas tradicionales
para la estimaci6n de incidencia acumulada (0 de su complemento. la supel" vivencia
50 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
-
I
M (1)
2
M (17)
3
M (20)
4
M (9)
5
( 24)
6
C (16)
7 -
C(2)
B
M {13}
9 C (10)
10 M
j
(3)






>




>
0


0



0
W
,
,
W W
,
,
W w
Tiempo calendario
Figura 2.1. Cohorte hipotctica de to personas seguidas por espacio de 24 meses entre
cnero de 1996 y diciembre de 1997. M, muerte: C, observaci6n censurada: (). duraci6n del
segUlmlcnto en meses (se asume en IOOos los casas niimeros enteros exactos).
(leI/lilli/ada 0 laJimci6n de slIpervivencia) cuando existen observaciones censuradas
son las tablas de vida de tipo act uarial (indist intamente denominadas en esle capitu-
lo como tab las de vida dusica.\' , aCfuariales 0 basatias ell infervulos) y el metoda de
Kaplan-Meier
(7
) .
Como un ejemplo, 1a Figura 2. 1 afrece una representaci6n esquematica de un estu-
dio cuyo resultado de inten!s es la mucrte: 10 individuos son seguidos por espacio de
dos afios (1996- 1997). Cada linea horizontal en la figura representa el tiempo de segui -
miento de un unico individuo. EI seguimiento puede concluir ya sea porque se produce
el evento (M) 0 POf abandono del estudio (C, aludiendo a una observaci6n censllratia,
tal como se dijo anteriormente) . Adviertase que los individuos se rec lutan en diferentes
momentos, aSI como que abandonan el est udio (ya sea por muerte, por abandono,o por
la raz6n que sea) en dist intos momentos . Por ejemplo, el individuo numero 1 es reclu-
{arlo en noviemhre rle 1 QQn y mllere en rl iciemhre rle 1 99n, li n rle
guimiento, en tanto que eI individuo nLl mero 5 vive a 10 largo de todo el periodo de
seguimiento (dos afios). La Figura 2.2 muestra una reorganizaci6n de los datos de la
Figura 2. 1, donde la escala temporal ha sido transformada al tiempo de seguimiento en
lugar de emplear el tiempo calendario. ASI, el momento 0 ahora representa el comienzo
del seguimiento para cada individuo (independientemente de la verdadera fecha en la
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 51
M }
r- ' (1
I
2
M (17)
3
M (20)
4
M (9)
5
( 24)
6
C (16)
7 C(2)
8 M (13)
9
C (10)
10 M
1
(3}
o 2 4 6 8 10 12 14 16 18 20 22 24
Tiempo de seguimienlo (meses)
Figura 2.2. La misma cohorlc de la Figura 2.1 con los licmpos-pcrsona rcprcscnlados
de acucrdo al licmpo dcsdc cI comicnzo del csludio. M. muerte: C. observaci6n censurada:
0, duraci6n del seguimiento en meses (en tooos los casos se supone que se trata de numeros
enteros exactos).
que comenz6 a ser observado) . Gran parte de la di scusi6n que sigue sobre indices de
incidencia se basa fundamentalmente en la Figura 2.2.
Incidellcia aculIlulada basada ell el enfoque de tablas de vida por illtervalos
(tablas de vida cltisicas)
La probabilidad acumulada de un evento durant e un intervalo dado (que comienza
en el momento X y dura 11/ unidades de tiempo) es la proporci6n de nuevos eventos
durante dicho lapso (donde los evemos se denotan como md,), donde el denomina-
dor es la poblaci6n inicial (I x) corregida por las perdidas (mc,) . En la tabla de vida
ciasica, esta medida corresponde a la probabilidad basada en intervalos del evento
mqA (8). Sll ctimpllfo es inmeci ialo. r omo ~ ve en la Fi gllra 2.2, OCll rren 0 mll erl es
entre los 10 individuos que estaban vivos al comienzo del segui mi ento. Si no se
hubi eran perdido sujetos durante la observaci6n, 2qO (con ti empos especificados en
afios) serfa simplemente el numero de muert es a 10 largo de este intervalo de dos
afios (2do) dividido por el numero de indi viduos al comienzo del intervalo (10) : vale
decir, 6/10 = 0,60 0 60 %. Sin embargo, puesto que los tres individuos perdidos
52 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
(que aportan datos censurados), M, no estaban en riesgo a 10 largo de todo el segui -
mientQ, su limilada participaci6n debe ser adecuadamente comemplada en el denomi-
nador para eSlimar la probabilidad acumulada. Por convenio, la mitad de tales indivi-
duos se sustraen del denominador, y la probabilidad est imada se calcula entonces como:
I Ecuaci6n 2.I J
0,7 1
El enfoque convencional consistente en SlI Slraer del denominador la mitad del
numero total de observaciones censuradas se basa en el supuesto de que la censura
ocurri6 de manera uniforme a 10 largo del periodo, de manera tal que. en promedio.
estos individuos estuvieron en ri esgo solo durante la milad del perkKio de seguimiento.
EI complemento de esta probabil idad acumul ada del evento es la probabilidad
acumul ada de supervivencia: esto es,
'1jJo = I - 2qO = 0,29
Es importante advertir que a la probabili dad acumulada de un evento (0 supervi-
vencia acumulada) no Ie corresponde un lapso intrfnseco: el ti empo ha de ser especi fi -
cado. As!, en este ejemplo, uno debe describi r q como <<la probabili dad de muerte acu-
mulada en dOJ' alios. Usualmente, la tabla de vida chisica usa intervalos multiples
- por ejemplo, cinco intervalos bianuales para un total de 10 anos de seguimiento.
Una probabilidad ac umulada de supervivencia sobre mas de un intervalo - por ejem-
plo, un seguimiento de 4 anos con dos intervalos de 2 anos- se obtiene mediante el
d lculo de la probabilidad conjunta de no haber tenido el evento (haber sobrevivido):
esto es, la probabilidad de supervivencia a 10 largo del pri mer intervalo multiplicada
por <<la probabilidad condicionah> de sobrevivir a 10 largo del segundo (es decir, por la
probabilidad de sobrevivir a 10 largo del segundo intervalo supuesto que no se ha pro-
ducido la muerte durante el pri mero, ya que aquellos que no pudieron sobrevivir todo
el pri mer intervalo no tienen oponunidad de entrar en el segundo) . En este ejemplo,
La probabilidad acumulada de haber tenido el evento es el complemento de esta
probabilidad conjunta de supervi vencia:
I Ecuadon 2.2J
Esto es anaJogo al d lculo de la fund6n acumul ada de supervivenda que emplea
el metodo de Kaplan-Meier que se ilustra en la proxima secci6n.
N6tese que no es necesario que los intervalos en una tabla de vida clasica (basa-
da en intervalos) sean de igual duraci6n. La longitud del intervalo debe determinarse
teniendo en cuenta el ritmo al que se modifica la incidenda a 10 largo del ti empo.
Por ejemplo, para estudiar la supervi\'enda despues de un infarto agudo de miocar-
dio, los intervalos deben ser muy cortos. inmediatamente despues de comenzar los
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 53
sfmomas, cuando la probabil idad de muerte es muy alt a y cambia rapidamente. Sin
embargo, los intervalos subsiguientes podrfan ser mas largos, en la medida que la
probabilidad de eventos recurremes y de muerte tiendan a estabil izarse.
Ejemplos del uso del mdodo de tabla de vida actuari al pueden hallarse en los
infonnes de los est udios epidemiol6gicos ciasicos (por ejemplo. Pooli ng Project
Research Group('}) . En otros li bnlS de texto de epidemiologfa pueden hallarse mas
detall es y ejemplos adic ionales (por ejemplo, veanse Gordis(IO) y Khan y Sempos(II) .
Incidellcia aculllulada basada ell el enfoque de Kaplall.Meier
(eventos de tielllpos exactos)
EI enfoque de KaplanMeier supone el dlcul o de la probabilidad de cada evemo en el
momento en que ocurre. EI denominador para tal dlculo es la poblaci6n en riesgo en
el momento en que se produce dicho evento(7) . Como en la tabla de vida actuarial, se
trata de computar probabilidades condicionales>,: esto es, probabilidades condiciona-
das al hecho de haber estado en riesgo (vivos y no censurados) en el momemo de cada
evemo. Si cada evemo (primero, segundo, etc.) se designa por su momemo de ocurren-
cia i, emonces la f6rmul a para la probabilidad condicional se reduce, simplememe, a:
tl
i
qi = -
n,
donde d, es el numero de muertes (u otro ti po de evento) que ocurren en el momemo
i (un numero que sera siempre I salvo que haya empates) y IIi es el numero de suje-
(OS '1lJe rUIn se hall an hajo (es flecir, en riesgo fie (ener el even/o) en el
momento i.
Por ejemplo, en la Figura 2.2, cuando oc urre la pri mera muerte, exactameme al
final del primer mes (persona N I), hay 10 individuos en riesgo; consec uentememe,
la probabilidad condicional es:
]
ql = --
]0
Cuando se produce la segunda muerte despues de tres meses de seguimiemo
(persona N 10), hay solo 8 sujetos en riesgo; ell o se debe a que, ademas de la muer-
te anteri or, un individuo se habfa perdido del est udio (C) despues de dos meses (per-
sona N 7), Y por 10 tanto ya no estaba en riesgo en el momento de esa segunda
muerte. Asf, la probabilidad condicional en ese momemo de la segunda muerte se
estima mediame:
]
q3 = '8 = 0, 125
La Tabla 2.3 (columna 4) sintet iza el dlculo de dichas probabilidades condicio-
nales para cada momemo. Adviertase que para las observaciones previamente censu-
radas no se realizan dlculos de probabilidad (eli as no representan un evemo como
tal) pero son contabi li zadas en el denominador para calcular la probabil idad de cada
evento ocurrido ames de esa perdida del seguimiemo. Esto representa el uso mas efi-
ciente posible de la infonnaci6n disponible(7) .
54 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Tabla 2.3
Ciilculo de las cstimaciones de snpcrvivcncia por Kaplan-Meier para cI cjcmplo
de la Figura 2.2
Probabilidad Probabilldad Probabilidad
Tlempo Indlviduos Numero condiclonal condiclonal acumulada
(meses) en rlesgo de eventos de un evento de supervivencla de supervivencia
(1) (2) (3) (4) (5) (6)
I n, d, ql " d ~ n l PI ",l-QI S,
1 10 1110",0.100 9/10 ,,0,900 0,900
3 8 1/6",0,125
7/8 '" 0,875 0.788
9 7 117",0,143
617 '" 0,857 0.675
13 5 1/5 ::: 0,200 4/5 "O,BOO 0,540
17 3 1/3::: 0,333 213 =0,667 0,360
20 2 112 ::: 0,500 112 =0,500 0,180
La columna 5 en la Tabla 2.3 recoge los complememos de las probabilidades
condicional es del evento en carla momenta, es decir, 1a probabilidad condicional de
supervivencia (1' ,) la eual , como en el metoda de la tabla de vida chisica, representa
la probabilidad de sobrevivir mas ali a del momento i entre aquellos que aun estaban
bajo observaci6n en dicho momenta (es decir, condicionado a haber sobrevivido
hasta el momento i) . La columna 6, tambien graficamente representada en la Figura
2.3, presenta las probabilidades acumuladas de supervivencia: es(O es, la lIamada
filllciOIl de .,upe/"vivem;iu de Kaplan-Meier (usualmellte denotada mediant e Si). Esta
represema la probabi li dad de supervivencia desde el comienzo de l seguimiento has-
ta despues de l momenta i, calculada como el producto de todas las probabilidades
de supervivencia condicionales hasta el momenta i. Por ejemplo, la probabilidad de
supervivencia acumulada hasta el final de l seguimiento durante dos afios (Si' donde
i = 24 meses) es:
97642 1
S' 4= -- X- X- x - x - x - =0 180
-108 7532'
As!, la estimaci6n de la probabilidad acumulada del evento ( I -Si) es:
I - SN= 1- 0, 18=0,82
Tal y como oc urrfa con la probabilidad acumulada basada en el enfoque de tabla
de vida actuarial (Ecuaci6n 2.2), el intervalo de tiempo para la probabilidad acumu-
lada usando el enfoque de Kaplan-Meier tambicn necesita ser especificado (en este
ejemplo. 24 meses 0 2 afios). Para conocer sobre metodos que penni tan estimar Ifmi-
tes de confianza para las probabi li dades de supervivencia acumulada, vease el Apen-
dice A, Secci6n A. I.
lndependientemente del metodo empleado para el calculo (actuarial 0 de Kaplan-
Meier), la incidencia acumulada es una proporci6n en el sentido estric(O del termino.
Carece de unidades, y su valor se ubica entre 0 y 1 (0 100 %) .
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Supuestos ellia estimaci6n de fa incidencia aCllmulada basada
en el antilisis de supervivencia
55
Vni/ormidad de eventos Y I'erdidas dentm de auia intervalo (Tabla de vida ctasica,
como se acaba de explicar). Implfcito en eI calculo de la tabla de vida chisica esta el
supuesto generico de que los eventos y las perdidas se producen de manera aproxima-
damente uniforme a 10 largo de carla intervalo definido. Si eI riesgo aumenta 0 dismi -
nuye demasiado rapidamente dentro de un intervalo dado (es decir, si el intervalo es
demasiado largo en relaci6n con los cambios de los ri esgos que tienen lugar en su
seno), entonces un riesgo promedio a 10 largo del intervalo no es completamente infor-
mati vo. La aplicacion de la correcci6n por concepto de perdidas (es deci r, sustraer del
denominador la mitad de las perdidas, Ecuacion 2. 1) tambitn depende del supuesto de
unifonnidad que se aplic6 a las perdidas. EI supuesto de uniformidad de eventos y per-
didas dentro de un intervalo dado esta fnt imamente relacionado con el modo en que se
define la tabla de vida y su cumplimiento puede conseguirse aj ustando la definicion de
los intervalos de manera que sean adecuadamente unifonnes en tenninos de riesgo -
por ejemplo, acortandolos - . Ademas, este supuesto no procede cuando se usa el
metodo de Kaplan-Meier, donde los intervalos no se definen de antemano.
Si bien este supuesto basado en intervalos se aplica solo a las estimaciones de la
tabla de vida clasica, los siguientes dos supuestos son pertinentes tanto para estas Lilli -
mas como para las estimaciones de Kaplan-Meier, y son ciertamente cruciales a los
efectos de las tecnicas de anal isis de supervivencia y de los anal isis de datos proce-
dentes de cohortes en general: I) independencia entre la supervivencia y la censura: y
2) ausencia de tendencias secul ares durante el periodo de reclutamiento.
Indel'endencia entre la silpervlvencia Y la cenJw"a. Para los calculos de la inci-
dencia condicional y acumulada utilizando los metodos descritos. los individuos
censurados se incluyen en el denominador durante todo el tiempo durante el cual
pennanezcan bajo observaci6n; una vez censurados, se ignoran en los calculos sub-
siguientes. Por tanto, si uno desea inferi r que la supervivencia total acumul ada esti -
mada (por ejemplo, 5
24
= 18 %, como en la Figura 2.3) sea generalizable a la pobla-
cion total presente en el momento del comienzo del estudio (en el momento 0), se
Figura 2.3. Curva de Kaplan-Meier cor rcspondiente a los datos de la Tabla 2.3, columna 6
56 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
necesila suponer que las ce/lSl/ radas rimen fa /IIi.wl/a I'robabilidad del
evento (desl'uis de fa eensllra) que las que permal/ean hajo observaci6n. En alms pala-
bras, la censura debe ser independieme de 1a supervivencia; de Dlro modo, se producira
un sesga. Por ejemplo, si el riesgo fuese mayor para las observaciones censuradas que
para las no censuradas (por ejempl o. los sujctos abandonan el estudiodebido a que eSlan
mas enfennos) , en el transcurso del liempo la poblaci6n en estudio induirfa una propor-
cion progresivameme mayor de sujetos de bajo riesgo; como resultado, la incidencia
total acumul ada (verdadera) resultaria subestimada (es decir, se sobrestimarfa la supervi-
vencia). EI sesgo opucs(O ocurri ria si las observaciones censuradas tendiesen a producir-
se preferememente entre los individuos mas saludables. La direccion probable del sesgo
atendiendo al motivo por el cual se produce la censura , se resume en la Tabla 2.4. Las
observaciones censuradas debido a mllerfe I'or arras CUI/SUS en los esmdios de resulta-
dos por causas especfficas, si la enfermedad de interes comparte los factores de riesgo
con otras enfennedades que se asocian con la mortalidad, podrian produci r un sesgo, ya
que la censura puede no ser independiente de la supervivencia. Un ejemplo es un estudio
en el cual el desenlace estudiado es la muene por cancer pulmonar. Supongamos que los
participantes que mueren por otras incluyendo muenes por enfennedad corona-
ri a, son censurados en el momento de su muene (jya que no estan en riesgo de morir de
un dncer de pulm6n!). Debido a que el cancer de pulm6n y la enfennedad coronaria
comparten un factor de riesgo importante, el habito de fll mar, es posible que los indivi-
duos que mueren de enfermedad coronaria hubieran tenido un mayor riesgo de cancer
de pulm6n si no hubieran muerto de cardiopatfa isquemica, 10 que manifiesta una viola-
cion del supuesto de independencia entre censura y supervivencia.
Entre otras razones frecuentes de censura se incluyen que los participantes en el
estudio se nieguen a permitir contactos ulteriores en el seguimi ento (en un estudio
donde la evaluacion de los desenlaces depende de tales contactos) y la perdida de
Tabla 2.4
Rclacion entre la razon para la censura y el supucsto de independencia entre
la censura y la supcrvivenci a en el anii lisis de supervivenci a
Tlpo de censura
Muertes par otras
causas cuando hay
tactores de riesgo
comunes'
Rechazo a la
continuaci6n de
contactos
MigraciOn
Censura
administrativa
<.. Puede produclr una
violaclon del supuesto de
Independencia entre censura
V supervlvencla?
SI
SI
SI
Improbable+
SI el supuesto es vlolado,
direccion probable del sesgo
sobre la estlmaclon
de la incidencla acumulada
Subestimaci6n
Subestimaci6n
Variable
Variable
En la incidencia espe<:ifica por causas 0 los estudios de mortalidad .
.;. Mas probable en estudios con un perkldo de captad6n prolongado cuando exi sla teooencia secular.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 57
contacto debido a la migracion fuera del area de estudio. Los individuos que se niegan
a sostener nuevos contactos en el seguimiento pueden tener un estilo de vida menos
saludable que los que satisfacen las demandas de un est udio prospectivo; si ese es eI
caso, la censura puede lI evar a una subestimacion de la incidencia acumulada. La
direccion del sesgo que resulta de la perdida del seguimiento de individuos debido a
migraci6n es una funcion del contexto sociodemogrMico en el cual ocurre la migra-
cion; por ejemplo, si los individuQs que migran tienen un estatus socioeconomico
(SSE) mas alto 0 mas bajo. Por ejemplo, si las perdidas ocurren princi pal mente entre
los que estan en el SSE mas alto. que tienden a ser mas sal udables. los que permanecen
en el est udio tenderfan a tener una supervivencia menor. Por otro lado, si las perdidas
ocurren princi pal mente entre individuos con un menor SSE y, por tanto, peor sal ud, la
supervivencia calculada a partir de los que se mantienen en el est udio estarla inllada.
Para las lI amadas perdidas administrativlls, que se definen como las que ocurren
debido a que concl uyo el periodo de segui miento (por ejempl o, personas numero 7 y
9 en la Figura 2.1), la suposicion de independencia entre la censura y la superviven-
cia se considera mas j ust ificada, ya que cabe pensar que por 10 general estas perdidas
son independientes de los individuQs per se. (Sin embargo. las perdidas administrat i-
vas estan sujetas a cambios temporales que ocurren durante el periodo de recluta-
miento; veanse mas adelante las consideraciones que se hall an bajo el tft ulo Ausen-
cia de tendencias seculares) .
En resumen, la crucial slIpOJ'icion de que existe independencia entre censura y
supervivencia para eI dlculo de los estimados de incidencialsupervivencia acumulada
depende de las razones que hayan producido la censura (Tabla 2.4) . Esta suposicion es
particularmente relevante cuando la magnitud del estimado de incidencia absolma es el
centro del est udio; puede ser menos impol1ante si el investigador esta principalmente
interesado en obtener estimaciones relat ivas (por ejemplo. cuando se comp..1ran inciden-
cialsupervivencia en dos grupos definidos por los niveles de exposici6n en un estudio
de cohorte), dado que puede esperarse que los sesgos que pudieran resultar de las perdi-
das habrfan de ser razonablememe en los grupos comparados. (para una dis-
cusion de un sesgo relacionado, vease Sesgo de Seleccion en el Capit ul o 4, Seccion
4.2) . Finalmente, notese que esta suposicion puede a menudo ser verificada. Por ejem-
plo, usualmente es posible comparar caracterfsticas generales relacionadas con el
desenlace de interes entre los individuos perdidos y los no perdidos durante la observa-
ci6n. Porejemplo, es posible milizar el fndice Nacional de MOl1ali dad para comparar la
experi encia de mortalidad de los perdidos con la de los que completan el seguimiento.
AI/sencia de tendellciaJ' secillares. En los est udios en los cuales el tiempo de
reclutamiento es prolongado, la decision de lI evar a todos los individuos al tiempo 0
(como en la Figura 2.2) supone que no existen tendencias seculares con respecto al
ti po y caraclerlsticas de estos individuos que afecten el resultado de interes. Este, sin
embargo, puede no ser el caso en presencia de efectos de cahorte de nacimiento y de
periado (tiempo calendario) (vease Capitulo I , Seccion 1.2). Los cambios con el
tiempo de las caracterfsticas de los part ici pantes reclutados, aSI como los cambios
seculares significat ivos en las exposiciones relevantes y/o tratamientos pueden intro-
ducir sesgo en las est imaciones de incidencialsupervivencia acumulada con direc-
cion y magnitud dependientes de las caracterfsticas de estos efectos de cohorte 0
periodo. Por ejemplo, no serfa apropiado est imar la supervivencia posterior al diag-
n6stico para todos los pacientes identificados con diabetes insul inodependiente entre
1915 y 1935 como un solo gruPQ. ya que este extenso periodo de reclutamiento
58 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
combinarfa inapropiadamente dos cohortcs de pacientes mll y distintas: la de aque-
lias diagnosticadas ames de la int roducci6n de la insuli na y las que fueron diagnost i-
cadas despues de dicha introducci6n. Simil armente, no serfa apropiado ll evar a cabo
un an.i. li sis de supervivencia uniendo en el momenta 0 a todos los individuos VIH-
seropositivos en una sola cahone recl utada entre 1995 y 1999, esto es, antes y des-
pues de que un nuevo tratamiento efectivo (inhibidores de la proteasa) est uviera dis-
ponible.
2.2.2. Tasa de incidencia basada en tiempo-persona
En vez de emplear individuos, el denominador de este tipo de medida de incidencia
esta formada por el numero de unidades de tiempo (r) con que los individuos en ri es-
go cont ri buyeron al periodo de seguimiento (II) . Por ejemplo, consideremos una
cohorte hi potetica en la cual ocurren 12 eventos y que la cantidad total de tiempo de
seguimiento ac umulado por todos los individuos asciende a 500 dfas. La tasa de
incidencia en este ejemplo es 12/500 = 0,024 por dfas-persona, 0 2,4 por 100 dfas-
persona. N6tese que el ntl mero de individuos en el grupo no se brinda; por tanto el
monto del t iempo-persona>, en el ejemplo podrfa haberse ori ginado por 50 indivi-
duos cada uno de los cuales haya sido observado durante 10 dfas (50 x 10), 5 indivi-
duos observados durante 100 dfas (5 x 100) 0 cualquiera de un sinnumero de varian-
tes similares .
Las tasas de incidencia 110 son proporciones. Se miden en unidades de tiempo1 y
pueden ir desde 0 a infinito, dependiendo de las unidades de tiempo empleadas. Por
ejemplo, la tasa de incidencia anteri or podrfa expresarse de vari as maneras: 12/500
dfas-persona = 12/ 1.37 anos-persona = 8.76 por ano-persona (u 876 por cien anos-
persona) . EI ultimo valor es mayor que I (0 que 100 %) solamente debido a la un i-
dad de tiempo que se eli gi6 para ser ut ilizada en el denominador. Por tanto, el valor
que asume la tasa de incidencia depende de la unidad para tiempo-persona seleccio-
nada para la const rucci6n del denominador. Si una persona tiene un evento de interes
despues de un seguimiento de 6 meses y el invest igador elige expresar la tasa en ter-
minos de anos-persona, la tasa sera 110,50200 por 100 anos-persona.
La unidad de tiempo ut ilizada queda a discred6n del invest igador y se selecdona
usualmente sobre la base de la frecuenda del evento bajo est udio. L1 raz6n principal
por la que muchos est udios epidemiologicos milizan los aiios-per.wlla para el anal isis
es que se trata de un recurso conveniente para expresar eventos raros . Por otro lado,
cuando se estan estudiando enfennedades 0 eventos de salud mas 0 menos frecuentes,
puede ser mas conveniente ut ilizar alguna otra unidad de tiempo (Tabla 2.5). La selec-
ci6n es totalmente arbitraria y no afectara las inferencias que se deriven del estudio.
Mas que una proporci6n sin unidades de los individuos que tuvieron el evento
respecto al total de los que estaban en riesgo (vease incidencia acumulada explicada
arriba), la estimaci6n de la tasa de incidenda expresa la I a s a ~ ) a la cual oc urren los
eventos en sujetos de la poblaci6n en ri esgo en cualqui er momento. A este ti po de
tasas tambitn se Ie llama (iellsidad de incit/ellcia, un concepto analogo al de veloci-
dad: la tasa de cambio instantaneo 0 la rapi deb) con la que el individuo desarroll a
el evento (enfennedad, muerte, etc.) en la poblaci6n. Este concepto es la base para
algunas de las tecnicas matematicas de modelaci6n uti li zadas para el analisis de
tasas de incidenda (por ejemplo, modelos de regresi6n de Poisson; vease Capit ulo 7,
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Tabla 2.5
Ejemplos de unidadcs tiempo-persona de aeuerdo a la rrct:ucncia
de evcntos bajo illYestigacion
Poblacl6n
General
General
Ninos malnutridos
Enfermos de cancer
putmonar
Pobtaci6n afectada
por inftuenza epidemica
Ninos con diarrea aguda
Ellento estudlado
Cancer de mama incidente
Infarto de miocardio incidente
Oiarrea incidente
Muerte
Inftuenza incidente
Recuperaci6n
Unldad persona tlempo
tlplcamente empleada
Alios persona
Alios persona
Meses persona
Meses persona
Semanas persona
Dias persona
59
Secci6n 7.4.5). Sin embargo, debido a que la tasa instantanea para cada indi viduo no
puede ser calculada directamente, la incidencia promedio a 10 largo de un periodo
para una poblaci6n se suele emplear como valor aproximado. La incidencia promedio
puede calc ularse a partir de datos individuales 0 agregados del segui miento, como se
discutira mas adelante. Por razones practicas, los tcnninos rasa y densidad se ut ilizan
indistintamente; sin embargo, en Ia discusion que sigue, el termi no rasa se utilizara
pri ncipalmente en el contexto de datos agntpados, en tanto que demidad se usara
para aludir a una tasa basada en datos obtenidos de cada individuo en el estudio.
Tasa de incidellcia basada ell datos agregados
Este tipo de incidencia se obt iene tfpicamente para un lugar geografi co ut ilizando
como denominador el promedio de la poblaci on esti mada para cierto lapso dado. Si
este periodo no es excesivamente largo y si la poblaci on del area de interes y su
composici6n demografica son relativamente estables, la poblaci6n promedio puede
estimarse como la poblaci6n a mitad de periodo (por ejemplo, 1 de j ulio para un
periodo de un ano). En un estudio de cohortes, el promedio de la poblacion al princi-
pio y al final del periodo pueden obtenerse para un intervalo del seguimiento dado.
Por tanto, para un intervalo de tiempo especifi cado, se ti ene:
Tasa de incidencia =
Numero de eventos en el intervalo
Poblaci6n promedio
En la Figura 2.2, por ejemplo, 10 indi viduos estan vivos y presentes en el estudio
al principio del periodo de segui miento (<<punto cero) . Solo una persona esta viva y
presente en el estudio cuando tennina el periodo de seguimi ento de 2 anos. Por 10
tanto, la poblaci6n promedio (n) para el periodo total de segui miento de 2 anos es:
6() EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
10 + 1
11= =5,5
2
EI tamana promedio /I de la poblacion puede tambicn calcul arse slI strayendo la
mitad de los eventos (M) y de las perdidas (C) de la poblaci6n inicial:
11= 10 - 112(6+3)=5,5
Como con {odos los valores medios. la suposici6n subyaceme cuando se ut ili za
este recurso es que, en promedio, habfa 5,5 personas a 10 largo del estudio (2 afios).
Para que se cumpla tal suposici6n, los eventos y las salidas deben ocurrir unifor-
memente a traves del peri odo de seguimiento. La tasa de nueVQS eventos en relaci6n
a la poblaci6n promedio se calcula entonces asf:
Tasa de incidencia = _ 6_ = 1,09 por persona - 2 afios
j ~
N6tese que en este ejemplo, la lasa se basa en una unidad temporal de 2 afios y no
en el nLl mero de individuos (vease mas adelante) . La suposici6n que subyace cuando
se emplea la poblaci6n promedio es que 5,5 individuos fueron observados durante
todo el periodo de 2 MOS, a 10 largo del cual se prod ujeron 6 eventos. EI ejempl o
subraya nuevamente el hecho de que este tipo de tasas no es una proporcion y, por
tanto, no esta forzada a ser menor que I (0 100 %) . En este ejemplo particular, la
tasa, aparentemente contraria a la intuici6n, de 109 por 100 tiempo-personas obvia-
mente resul t6 del hecho de que se esta ut ili zando 2 a n o s ~ ) como la unidad de tiem-
po; si en lugar de ello se hubiese ut ili zado como unidad el ano-persona, la tasa
hubicra sido 1,0912 anos = 0,545 por ano-persona (0 54,5 por 100 afios-pcrsona).
EI ejemplo anterior ilustra la est imaci6n de una tasa de incidencia cuando se usa la
poblacion promedio de una cohone definida (es dec ir, la cohone hipotetica representa-
da en la Figura 2.2). Sin embargo, esta no es su apl icacion usual. La habit ual es que el
d lculo de la incidencia se realice con datos agmpados. Tal es el caso cuando se est u-
dia la monalidad usando infonnaci6n de las estadfsticas vitales, 0 cuando se estima la
incidencia de casos nuevos de una enfennedad usando registros poblacionales (por
ejemplo, cancer): en otras palabras, cuando se necesita estimar la incidencia p..1ra agre-
gados de individuos, defi nidos par su residencia en un area geografica en un perkKio
dado. E.<>tos agregados se conocen como cahortes dil/{imicas 0 abierfas porque inclu-
yen individuos que son afiadidos 0 sust rafdos del total de la poblaci6n en riesgo a
medida que migran hacia fuera 0 haciadentro del area (es decir, una sit uaci6n mas cla-
ramente representada por el diagrama en la Figura 2. 1 que por el de la Figura 2.2).
Detlsidad de illcidetlcia basada en datos indi viduales
Este tipo de incidencia puede est imarse cuando se tienen datos relativamente preci-
sos del momenta en que se producen los eventos 0 las perdidas para cada individuo
de una cahone definida. EI tiempo-persona total para el periodo de esmdio es sim-
plemente la suma de los tiempo-persona con los que contribuy6 cada individuo. La
densidad de incidencia promedio se calcula entonces como:
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Numero de eventos
Densidad de incidencia = -=- :-:-------:--
Total de personas-tiempo
61
Para eada individuo en el ejemplo que se il ustra en las Figuras 2.1 y 2.2, la lon-
gitud de la ]fnea horizomal representa el lapso transeurri do entre el eomienzo del
seguimiento y el momento en que el individuo muri6 (M) 0 se perdi6 de la obser-
vaci6n (C). Por ejemplo, para el individuo N I la muerte ocurri6 exaetamente des-
pues de un meso Por tanto, su contribue i6n al total de afios-persona en cl primer
ario de segui miento (vease Figura 2.2) serfa 11 12 = 0,083; obviameme, esta perso-
na no hizo comribuci6n alguna al segui miemo durante el segundo ano. Por otro
lado, el individuo N 2 muri 6 despues de permaneeer en el estudio por espacio de
17 meses, 0 un ano y 5 meses. Por tamo, su contribuci6n al primer ario de segui-
miento fue de 12/ 12 y al segundo ano fue de 5/ 12, para un total de 1,4 17 arios-per-
sona.
La contribuci6n de los individuos eensurados se ealcul a de identic a manera.
Por ejemplo, la comribuci6n de l individuo N" 6 al numero total de anos-persona
fue equ iva lente a 16 meses, 0 un ano-persona completo en el primer ano y 4/ 12
en el segundo, para un total de 1,333 anos-persona. El dlculo de anos-persona
para los 10 participantes de l est udio se muestra en la Tabla 2.6. En este ejemplo,
la densidad de incidencia apl icable al peri odo de seguimiemo tota l es, por 10 tan-
to, 6/9,5 83 = 0,63 por ano-persona (0 63 por 100 arios-persona) . Alternativamen-
te, la densidad de incidencia podrfa expresarse como 6/(9,583 x 12 meses) =
0,052 por mes-persona (5,2 por 100 meses-persona) . Un metodo para est imar los
lfmites de eonfianza de las tasas de incidencia se bri nda en el Apendice A, See-
cion A.2.
Tabla 2.6
Calculo del numero de alios-personas basado en la Figura 2.1
Contrl buclon al numero total de
anos-personas por los partl cl pantes en:
Indilliduo Tiempo total del Primer ano de Segundo ano de Periodo total de
.. segulmiento (meses) segulmiento segulmlent o segul mlento
1112=0,083 0 0,083
2 17 12/12 : 1,000 5112 :0,417 1,417
3 20 12/12:1 ,000 8112 :0,667 1,667
4 9 9112 :0,750 0 0,750
5 24 12/12:1 ,000 12112", 1,000 2,000
6 16 12/12 : 1,000 4112: 0,333 1,333
7 2 2/12:0,167 0 0,167
8 13 12/12 : 1,000 1112:0,083 1,083
9 10 10112:0,833 0 0,833
10 3 3112 :0,250 0 0,250
Total 115 meses 7,083 alios 2.500 anos 9,583 alios
62 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Suposiciones para fa estimaci6n de las lasas de incidencia basadas
en tiempo-persona
Las suposiciones de independencia entre la censlI ra y la supervivencia y la all sencia de
tcndencias secul ares que fueran discutidas en la Secci6n 2.2.1 lambien son relevames
en el contexto del anal isis liempo-persona. Estos supuestos tienen que ver con la
ausencia de sesgo de selecci6n y se aplican a clI alquier tipo de anal isis estadislico de
un est udio de cahone. Ademas, al igual que para la incidencia basada en la tabla
de vida act uarial (Ec uac i6n 2. 1) (Secci6n 2.2. 1). un supuesto imponante clI ando se ul i-
li za el enfoque ti empo-persona es que el riesgo del evento pennanece aproximada-
mente constant e en el tiempo durante eI imervalo de inten!s, 0, en otras palabras, que el
riesgo estimado ha de poder aplicarse igualmente a cualqllier ullidad de tiellll'o denlro
liel illfervalo. Esto signifi ca que II personas segui das durante t unidades de tiempo son
equi valentes a t personas observadas durante n unidades de tiempo: por ejemplo, el
riesgo de un individuo que vive 5 unidades de tiempo dentro del intervalo es equiva-
lente a 5 individuos cada uno de los cuales vive una unidad (Figura 2.4).
Cuando los indi viduos estan expuestos a un factor de riesgo dado, otra interpreta-
ci6n de este supuesto es que el efecto resultante de la exposici6n no es acumul at ivo
dentro del intervalo de seguimi ento de interes. A menudo es diffcil aceptar que este
supuesto se cumple como, por ejemplo, cuando se reali zan esmdios de ri esgo de
enfennedad respi ratoria cronica en fumadores: el ri esgo de bronquit is cr6nica para
Individuo N, "
Ano 1 M02 Ano3 Ano4 Ano 5
2
3
4
5
6
7
8
Figura 2.4. Ticmpo dc scguimicllto para 8 illdividuos cn un cstudio hipotCtico, Se supone
que la suma de los tiempos-persona para los individuos N
D
I aND 5 (con un periodo de segui-
miento corto de un aiio cada uno) es equivalente al que aportan los individuos N 6 Y 7 (con
tiempos de seguimiento de dos y tres a110s respectivamente) y al tiempo total para el indivi-
duo N 8 (quien tiene el tiempo de seguimiento mas largo, 5 a11os). Para cada grupo de indivi-
duos (N 1-5, 6 Y 7, Y 8), el nlimero total de aiios-persona de observaci6n es 5.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 63
alguien que ha fumado sostenidamente durante 10 anos ciertamente no es el mismo
que el de 10 personas que han fumado a 10 largo de un ano, ya que el efecto del habi-
to de fumar liene un caracter marcadamente acumul ativo. Para disminuir la depen-
dencia que de este supuesto liene el enfoque riempo-persona, eI periodo de segui-
miento puede dividirse en intervalos mas pequenos y calcular las densidades para
cada uno de ellos. Por ejemplo, utilizando los datos de la Tabla 2.6 y de la Figura 2.2,
es posible calcul ar las densidades separadamente para eI primero y el segundo ano de
seguimiento como sigue:
Primer ano de scguimiento: 317,083 = 42,4/ 100 anos-persona (0 3/85 = 3,6/100
meses-persona) .
Segundo ano de segui miento: 3/2,500 = 120/ 100 anos-persona (0 3130 = 10/ 100
meses-persona) .
Relaci6n entre fa densidad (basada en datos indi viduafes)
y tasa (basada en datos agrllpados)
Tiene interes praclico el hecho de que cuando las salidas (0 adiciones en una poblacion
abierta 0 en una cohorte dinamica) y los eventos oc urren unifonnemente, la tasa (datos
agmpados) y la densidad (datos individuales) son virtualmente iguales, en tal caso, la
densidad por tiempo-persona se corresponde con una tasa para una poblaci6n prome-
dio, promediada para la unidad de tiempo correspondiente (por ejemplo, anualmente).
Tasa =
Nli mero de eventos (x)
Poblacion promedio (11)
tiempo (1)
x .
= --= Densldad
/I x 1
Esra idea puede entendersc inruitivamente. Para una unidad de tiempo dada, tal
como un ano, el denominador de la tasa (la poblaci6n promedio) es Malogo al nlimero
total de unidades de tiempo vividas por lodos los individuos en la poblaci6n en esc lap-
so. Se da un ejemplo en la Tabla 2.7 conformada con los datos de 4 personas seguidas
por un maximo de 4 anos . Un individuo se pierde del scgui miento (censurado) despues
Tabla 2.7
Correspondencia entre densidad y tasa en un estudio en el eual 4 personas son seguidas
durante un maximo de 2 anos y los eventos y las pcrdidas se di stribuyen unirormemente
Indllliduo N Desenlace
Momento de Numero de
ellent oJperdlda anos persona
muelle a los 0,5 aiiQS (6 meses)
0.'
2 perdida de observacicn a un ano 1.0
3 muerte a los 1 ,5 arios (18 meses)
1.'
4 censura administrativa a los 2 anos 2.0
numero total de arios-persona:
'.0
64 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
de un ana; dos individuos mueren, uno despues de media ana y el alro despues de 1,5
anas; y e l cual1Q individuo sobrevive hasta el final del est udio. Hay, por tanto, una sime-
{ria perfecta en la distribuci6n de las salida.>; 0 de los eventos que ocllrrieron despues de
0,5, 1, l ,..s Y 2 afios despues del comienzo del estudio . Sumando la cont ribuci6n al tiem-
po de seguimiemo hecha por carla partici pante se abl iene un total de 5,0 anos-persona.
L1 densidad es por tanto de 2 muertes por 5 afios-persona, 0 0,40.
La poblaci6n promedio (n) en este ejemplo puede estimarse como (poblaci6n in i-
cial + poblaci6n final)I2,Q (4 + 1)/2 = 2,5. La tasa para el liempo total (1) = 2 anas es
emonces 212.5 . La lasa promedio anual es por lamo equivalente a la densidad uti li -
zando el tiempo-persona como denominador:
x
n x _-,--_0" __ _
Tasa anual = -- = -- =
t /I X t anos persona
= Densidad = ---:-::- 2--;:- = _2 = 0 40
2,5 x 2 5 '
Porotro lado, cuando las perdidas y los eventos no oc urren de una fonna aproxima-
damente unifonne, la tasa de incidencia basada en la poblacion promedio y la densidad
de inddenda basada en la misma pobladon pueden ser discrepames en 10 que conder-
ne al penodo de seguimiento correspondiente. Por ejemplo, basados en los datos de la
Figura 2.2, la inddenda anual promedio que se obtiene empleando la poblad6n media
ascendi6 a 54.5/ 100 anos-persona: sin embargo usando la densidad de inddenda esta
resul{o ser 6311 00 anos-persona. EI ejemplo hipotetico ilustrado esquematicamente en
las 2.1 y 2.2 se basa en un {amano de muestra muy pequeno y, por tanto, la falta
de uni fonnidad puede deberse a la variabilidad muestral. Cuando el tamano de la mues-
{ra es grande, y siempre que el intervalo sea razonablemente estrecho, la suposici6n de
unifonnidad de se cumple con mayor probabilidad.
La nocion de que la poblad6n promedio es equivalente al nlimero total de personas-
tiempo cuando los eventos y las salidas son uniformes es analoga al supuesto que se
hace en relad6n con las salidas en la tabla de vida actuarial (vease Secci6n 2.2.1 , Ecua-
d6n 2. 1). Si no se conoce exactamente cuando ocurrieron los evemos en un periodo
dado, cada persona que 0 bien sufre un evemo 0 bien sale del est udio se supone que
comribuye al tiempo de seguimiento con una mitad de una unidad de tiempo dada. (Se
presupone que este sera el promedio cuando se tenga un gran nlimero de indi viduos
entrando y saliendo en diferentes momcntos a 10 largo de cada unidad de tiempo).
En una cohorte abierta (dinamica), ademas de las perdidas debidas a eventos y
salidas, se suman otros individuos (porejemplo, por concepto de inmigracion). Estas
adiciones {ambien son contempladas al utilizar la poblad6n promedio, que se
corresponde con el tiempo-persona al que estos individuos afiadidos contribuyen.
supuesto que entraron en la poblaeion unifonnemente a traves del periodo. La
eorrespondencia entre tasa (basada en datos agrupados) y densidad (basada en tiem-
pos-personas individuales) haec posible eomparar una tasa promedio anual basada
en una poblacion promedio - que, en estadfsticas vitales es usualmeme el punto
medio,o la poblad6n estimada cli
o
de julio- con una densidad basada en afios-
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 65
persona. Por ejemplo. es pr:ktica comli n en los estudios de epi demiologfa oc upacio-
nal obtener un nli mero esperado de evemos necesarios para el d lculo de la raz6n
estandarizada de mort ali dad mediante la aplicaci6n de tasas por edad especfficas
tomadas de las estadfsticas vitales de poblacion al numero de afios-persona acumul a-
dos por edad especffi ca por una cohorte expuesta (vease Capitulo 7, Secci6n 7.3.2).
Estratificacioll de los tielllpos-persolla y tasas de aClierdo al tielllpo
de segllillliellto y covariables
EI d lculo del tiempo-persona vivido por una poblaci6n 0 grupo es simplemente la suma
de los tiempos-persona vividos por los di ferentes integrantes del grupo durante el periodo
de seguimiento. En la mayorfa de los estudios analfticos prospecti vos relevantes en epide-
miologfa. el riesgo del evemo cambia con el tiempo. Por ejemplo, la incidenci a de even-
(Os fatales 0 no fatales puede aumentar con el tiempo, al igual que se siguen individuos
sanos a medida que envejecen. En otras situaciones, los ri esgos disminuyen a medida que
progresa el seguimiento. tal y como ocurre en el estudio de complicaciones despues de la
cirugfa 0 con la mOl1alidad de los casos de infarto de miocardio. Debido a que calcular
una ta&'1 global promedio en un periodo largo cuando la inci dencia no es unifonne no tie-
ne mucho sent ido, es necesario estimar la ta&'1 de eventos para intervalos dentro de los
cuales se puede suponer homogeneidad en el riesgo. Por tanto, como se di scuti6 antes, a
menudo es impol1ante estratificar el tiempo de seguimiento y calcular la tasa de inciden-
cia para cada estrato (por ejempl o. Tabla 2.6) . En un estudi o de cohorte. uno puede adi-
cionalmente desear controlar las variables confusoras potenciales. EI tiempo y las varia-
bles confusoras pueden tenerse en cuent a estrati ficando el tiempo de seguimiento para
cada indi viduo de acuerdo a otms variables de tiempo (por ejemplo, edad) y categorfas de
las vari ables confusoras. y luego sumar los tiempos-persona dentro de cada estrato.
Los siguientes ejemplos ilustran el d lculo de ti empo-persona y las tasas de inciden-
cia correspondientes basadas en los datos que se muestran en la Tabla 2.8, correspon-
Tabla 2.8
Datos hipotcticos de cuatro mujeres postmellopausicas seguidas despucs
de ulla operacion de cancer de mama para evaluar mortalidad
Mujer N' Mujer N" 2 Mujer N3 Mujer N4
Fecha de la operaci6n 1983 1985 1980 1982
Edad cuando se opero 58 50 48 54
Edad cuando la menopausia 54 46 47 48
Hltbito de fumar cuando Sf N4 Sf N4
se oper6
Cambio en el hltbilo Abandono {1986} N4 N4 Empieza (1983)
de ' umar (ano)
Desenlace Muerte Pt'lrdida Aun vivia Muerte
al 'inalizar
Fecha del evenlo 1989 1988 1990 1984
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APUCACIONES
1980 81 B2 83 84 1985 86 87
I I

2
...
,

3
M
4
Tiempo desde que se aper6 (anas)
2 3 4 5 6 7
,
I I I I I
____________
2 ,...-----+
.
88

9
,
89
M
10
I
3
M
4 ;-__ ---"
1990
I
'.
Figura 2.5. Represcntacion esquematica de tiempos-persona para datos hipotCticos de la
Tabla 2.8, de acuerdo a una escala de tiempo: tiempo calendario (arriba) y tiempo de
seguimiento (debajo) (las observaciones censuradas se indican con flechas).
diente a un est udio hipotetico de cuat ro mujeres postmenopausicas seguidas para eva-
luar la mortalidad despues de una operacion de dncer de mama ( 1980- 1990) . L1
Tabla 2.8 expone las fechas de la cimgia (<<entrad3>,), la fecha del evento (muerte 0 cen-
sura) , las edades en el momenta de la cirugfa y de la menopausia y el habito de fumar.
Una escala de tiempo. A parti r de los datos de la Tabla 2.8, el seguimiento de estas
cuatro mujeres se muestra en la Figura 2.5. EI panel superior de la Figura muestra el
seguimiento de acuerdo al tiempo calendario para cada una de las cuatro mujeres; el
panel inferior muestra el tiempo de seguimiento despues de la cirugfa. Notese que en
la Figura 2.5, arriba, como no se conocen las fechas de la cirugfa y el desenlace se
supone que estas coinciden con la mitad del ano correspondiente (vease antes).
Si pudiera suponerse que el riesgo del evento fue aproximadamente unifonne dentro
de los intervalos de 5 anos. estarfamos Just ificados al calcular el tiempo-persona separa-
damente para el primero y el segundo periodo calendario de 5 anos (Figura 2.5, arriba);
el dlculo de las tasas se muestra en la Tabla 2.9. Notese que a los individuos cuyos
seguimi entos comienzan 0 tenninan en alglin momemo durante un ano dado se les asig-
na la mitad del ano-persona: por ejemplo, una comribuci6n de 0,5 Mos-persona provie-
ne de la mujer nO I en 1983, ya que su operaci6n se lI evo a cabo en alglin momento del
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Tabla 2.9
Eslralificacion de liempo-pcrsona y lasas de acuerdo al liempo calendario,
de acuerdo con la Tabla 2.8 y la Figura 2.5, parle superior
liempo caiendario
19801984
19851989
(1990-1994)
Mios-personas
8
12,5
(0,5)
Deseniaces
1
(0)
rasa
0,125
0,080
(0)
67
ano 1983 . Por tamo, el total de tiempo-persona para eI periodo 1980- 1984 es de
1,5 anos (mujer nO I) + 4.5 anos (mltier nO 3) + 2 MOS (mujer nO 4) = 8 Mos-persona.
Alternat ivamente, uno podrla estar imeresado en examinar las tasas de este eslu-
dio de acuerdo al tiempo de seguimiemo, como se muestra en la Tabla 2.1 0. Por
ejemplo. como la mujer nO I se sigui6 desde 1983,5 a 1989,5, puede suponerse que
ell a fue seguida durame 6 anos completos (Figura 2.5, debajo).
Dos 0 lIIas escalas lie fielllpo . Las cohortes epidemiol6gicas eslan usualmeme
constimidas por individuos independientes que interactuan y estan sujetas a vari adas
circunslancias biol6gicas y ambiemales. Por tamo, es con frecuencia imponame
tamar en consideraci6n mas de una escala de tiempo; la selecci6n de las escalas uti -
lizadas para la estratificaci6n del tiempo de segui miento varIa de acuerdo a las
caracterfsticas y objet ivos del est udio (Tabla 2. 11 ).
Tabla 2.10
Eslralificacion de tiempo_pcrsona y tasas de acuerdo al segui mi('nto
(tiempo desde la opcracion), basada en la Tabla 2.8 y la Figura 2.5, parte inrerior
llempo transcurrido
desde la operacl6n
Aii os-personas Eventos lasas
04 arios
5-9 anos
15
6
Tabla 2.11
0,0667
0,1667
Ejemplos de escalas de tiempo rclevanl es rrecuentemenle empleadas en
el conlcxlo de esludios de cohortI'
Escala de tiempo
Tiempo de seguimiento (tiempo desde
la eaplaei6n)
Edad
Calendario
Tiempo desde que se liene un empleo
Tiempo desde la menarquia
Tiempo desde la seroconversi6n
l lpo de estudio
lOOos los estudios
lOOos los estudios
lOOos los estudios (si la eaptaei6n se haee sabre un
periOOo extendido)
Estudios ocupaaonales
Estudios de desenlaees reprOOuctivos
Seguimiento de paeientes con infecci6n VIH
68 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
64,5

L-______
1985 I
131
(1,5
(0,5
14

45 50 55
Edad (anos)
60 65
58,5
1989,5
\
1983,5
Fi gura 2.6. Represcntacion esqucmatica de los ticmpos-pcrsona para las 4 mujcres de
13 Tabla 2.8 de acuerdo ados escalas de ticmpo, edad y ticmpo calcndario, catcgoriza-
dos en intervalos de 5 alios. Debido a que los datos de tiempo se dan en alios completos. se
supone que la entrada. los eventos, y las salidas ocurren exactamente a mitad de aiio. Las
observaciones censuradas se representan por una flecha. El tiempo IOtal deniro de cada estra-
to de tiempo para las 4 mujeres se muestra entre parentesis . Los tiempos de entrada y salida
para la mujer NQ I se dan en itaticas .
En la Figura 2.6, el tiempo-persona y los result ados de las 4 mujeres de la Tabla 2.8
se representan de acuerdo ados escalas de tiempo, la edad y el tiempo calendario.
En este tipo de representacion grMica (conoc ida como (Jiagmmll de Lexi.\"), la trayec-
toria de cada individuo se representa por lfneas diagonales a traves de las dos escalas
de tiempo. Como en el ejemplo previo, y dado que los datos sobre el ti empo son
aproximados (a anos completos), se supone que la entrada y el desenlace (0 la cen-
sura) ocurren en el punto medio del intervalo de un ano.
La Tabla 2.12 muestra los estimados correspondientes de tiempo-persona total para
cada estrato de dos dimensiones . Estos se obtienen mediante la suma del ti empo total
Tabla 2. 12
Estratifieacion de tiempo-persona y tasas de aeuerdo al tiempo calcndario,
y cdad (vease Figura 2.6)
Tlempo calendarlo Edad (ail os) AilosPersona
1980-84 45-49 1,5
SO-54 3,5
55-59 3
6064 0
1985-89 45-49 0
50 54 5
55-59 3
6064 4,5
Eventos
o
o
o
o
Tasa
o
o
0.3333
o
o
0.2222
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 69
vivido por los individuos en el est udio en cada estrato edadltiempo calendario repre-
sentado por 8 cuadrados en la Figura 2.6: por ejemplo, para aquellos que tenian de 55
a 59 afios de edad entre 1950 y 1984, se trata de la suma de I j afios vividos por la
mujer nO 4 (entre la edad 55 y la edad 56j, la edad supuesta de su muerte) y I j afios
vividos por la mujer nO I en esc estrato. Adviertase que los desenlaces tambien se asig-
nan a cada estrato correspondiente, 10 que pennite por tanto el calculo de las tasas de
incidencia especffi cas por calendario y edad, tambicn mostrados en la Tabla 2. 12.
Otras escalas de liempo pueden ser atractivas . En epidemiologia oc upacionaL por
ejemplo. puede ser de interes obtener tasas de incidencia de ciertos resultados, teniendo
en Cllenta Ires escalas de tiempo simultaneamente: porejemplo, la edad (si la incidencia
depende de ell a), tiempo calendario (si ha habido cambios seculares en las dosis de
exposici6n), y el tiempo desde que el sujeto se desempefia es este empleo (ya que este
puede influir en la dosis acumul ada). Para tal situaci6n, podrfa hacerse un dibujo tri di-
mensional analogo al de la Figura 2.6: cubos definidos por estratos de las tres escalas de
tiempo y cada tiempo-persona individual atravesando las diagonales lridimensionales.
EI procedimiento para el calculo de los tiempos-persona y las tasas de incidencia
asociadas antes descri to puede ser lIIilizado para reali zar comparaciones internas 0
externas de tasas estratificadas usando razones de mortali dad 0 de incidencias estan-
dari zadas (vease Capitulo 7, Secci6n 7.3.2) .
Tiempo y covariablesfijas y dependientes del fiempo. En ciertos casos, puede ser
apropiado estrat ificar segun covariables espedficas ademas del tiempo. Por ejemplo,
la Figura 2.7 muestra los tiempos-persona y los eventos para las cuatro mujeres de la
Fumador allnleio
Menopausia <5 atlos
19oo
1985
198{)
45
(1,5
If.3
50
No fumador al Inleio

55 60
Menopausia <5 atlos
65
19oo ,-,--,--,---,
Iv
1985 1--* - -+--+---1
198{)
45 50 55 60 65
1990
1985
1980
45
1990
1985
1980
45
Menopausia 00 5 arios
121
V
:7
If.3
""i 1
50 55 60 65
Menopausia 00 5 arios
10/
2
0
(0.5
10.5)
#4
50 55 60 65
Figura 2.7. Tiempos-pcrsona de acuerdo a tiempo calendario, road, tiempo desde la meno-
pausia , y lul.bito de fumar en el momento de la opcracion para las mujercs de la Tabla 2.8
70 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Tabla 2.8 de acuerdo a Ires escalas de tiempo: 1a edad, el tiempo calendario y el
tiempo transcurrido desde los cambios menopausicos (definidos arbilrariameme
como una variable dicot6mica), ademas de la situaci6n en relaci6n al habito de
fumar a1 comienzo (en el momenta de 1a operaci6n) . N6tese que en la Figura 2.7, 1a
mujer nO I cambia de diagrama a medida que se modifica su situaci6n en ClI anto a
tiempo transcli rrido desde la menopallsia (cuando ll ega a 59,5 - es deci r, un ana
dentro del est udio- se conviene en una mujcr que esta en el gmpo <(Oi!: 5 anos desde
1a menopausia>,) . De fanna parecida, la mujer nO 3 (que cntro en el est udio en 1980
- 0 mas bien, 19805- un ana despues de la menopausia) cambia de menopausia
< 5 afios al estrato O!: 5 afios desde la menopausia 4 afios despues del inicio del
segui mi ento (es decir, en algun momento en 1984,0 en 1984,5) .
Reparese que en la Figura 2.7, el habito de fumar se usa como una covanable fija. en
la medida en que solamente se considera el estado en el momenta inicial; sin embargo.
la infonnacion sobre eI cambio en eI habito de fumar esta disponible en los datos del
estudio hipotctico mostrado en la Tabla 2.8. Los cambios en materi a de exposici6n para
algunas covariables pueden ser tenidos faci lmente en cuenta c uando se lIIi1iza la estrat e-
gia del tiempo-persona. Por ejemplo, utilizando la informacion inicial y el cambio en
cuanto al habito de fumar mostrado en la Tabla 2.8, la asignaci6n del tiempo-persona de
acuerdo al habito de fumar como una covariable dependiente del tiempo puede
representarse como se il ustra en la Figura 2.8. Ut ili zando este enfoque, cada evento se
asigna al estat us de exposicion en el tn)mento del evento . Por 10 tanto, la muerte de la
mujer nO I se as igna al grupo no fumador, mientras que la de la mujer nO 4 se as igna
al grupo fumador. (Adviertase que las son opuestas a las basa-
en el estalll s de fumador en el momento inicial, Figura 2.7) .
Eluso del enfoque tiempo-persona para tener en cuenta exposiciones cambiantes
implica una suposici6n anaJoga a la que se hace en los ensayos cifnicos cruzados: una
vez que cambia la exposici6n, tambi en cambia el riesgo es simplemente
otra manera de enunciar que no existe acumulaci6n del nesgo y que por tanto el efecto
de una exposicion dada es <<instantaneo . La validez de este supuesto depende de la
o . 2
o

, 3
4
1980 81 82
Tiempo calendario
83 1985 86 87 88 89 1990
M
-----.;--..................... .
.....................................

M
Figura 2.8. Representacion esquematica de los tiempos-persona para las 4 mujercs de la
Tabla 2.8 de acuerdo al habito de rumar dependiente del tiempo. Las Uneas s6lidas repre-
sentan la situaci6n de ser fumadora. las lineas interrumpidas representan la situaci6n de ser
no fumador.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 71
exposicion y del resultado espedfko que se este considerando. Por ejemplo, para el
habito de fumar, la suposici6n puede ser razonable cuando se estudian eventos trombo-
emb6licos probablemente resultantes de los efectos agudos del tabaco (por ejemplo, los
que Ilevan a muerte cardiaca subita). Por otro lado, dados los rasgos bien conocidos de
latencia y efectos acumulativos que conducen al cancer de pulm6n relacionado con el
habito de fumar, la suposicion de un efeclo <<instantaneo no estarfa justificada. (El
efecto acumulativo del habito de fumar sobre el riesgo de cancer de pulmon puede infe-
rirse faci lmeme del hecho de que el riesgo en los fumadores que abandonan el habito
nunca es equivaleme al de los que nunca fumaron) . Si hay un efecto acumulativo. el
enfoque il ustrado en la Figura 2.8 (por ejemplo, que asigna el evento en la mujer N I a
la categorfa de no fumadores) resultara en una clasificaci6n erronea.
Los efectos acumulati vos de la exposicion pueden tomarse en cuenta mediante
definiciones de exposicion mas complejas: por ejemplo, la cant idad de anos-cajet i-
lias consumidas podrfa considerarse en el caso de ex-fumadores. Ademas, los tiem-
pos de latenda podrfan tambien introdudrse en la definic i6n de tiempos-persona en
reladon con los eventos, practica frecuente en los eSlUdios de la epidemiologfa oc u-
pacional 0 ambiental
02
pag.1SO.15S). Obviamente, la estratificaci6n con acuerdo a mas
de una escala de tiempo y a vadas covariables puede suponer calculos engorrosos de
los tiempos-persona y las tasas para cada estrato multidimensional. Afortunadamen-
Ie, se di spone de programas informaticos para faci litar este procedimiento(U.1S) .
2.23. Comparaci6n entre medidas de incidencia
Para la estimacion de las diversas medidas de incidencia, el numerador (numero de
muertes) es constante; la diferenciac i6n entre las medidas est riba en la manera en que
se calcula el denominador. Los patrones pri ncipales que distinguen la probabilidad
acumulada por un lado y la densidad 0 la lasa por otro se muestran en el Esquema 2.1 .
Numerador
Esquema 2.1
Comparacion de medidas de incidencia: Incidencia aeumulada
rrente a Tasa de incidenci a
Incidencla acurrulada rasa de Incldencla
Si el seguimiento Si el seguimiento Datos individuales Datos agrupados
es completo es ircompleto (cohorte) (area)
Numero de casas labia de vida clasica Numero de casos Numero de casos
Denominador Poblaci6n inicial Kaplan-Meier Tiempo-persana Poblaci6n promedio
Unidades Sin unidades Tiempo1
Recorrido
" 1
o a inlinito
Sin6nimos Proporcion Densidad de incidencia
Probabil idad
Equ1valente a t1empo-persona cuando los eventos y las perd1das (0 ad1cKmes) se d1stnbuyen homogeneamen
te en el intervalo de tiempo de interes .
.. En el texto. el termino densidadse util iza para releriroos a la situaci6n en la cual se conoce el tiempo exacto
de para cada individuo; 10 mas Irecuente, sin embargo, es que se usen los termioos "tasa. y "densi
dad" indistintamente.
72 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Como se discuti6 previamente, el Ifmite superior de los valores para una tasa 0 una
densidad puede exceder al 100 %, algo imposible para las probabilidades.
Las tasas a menudo se calculan como fusuS promedio anuales 0 tasas pOl' 100
aiios-persolla; la ulti ma alude a una tasa por 100 personas por ana, 10 que subraya la
correspondencia entre las estadfslicas vitales - tasa deri vada y una tasa por ana-per-
sona como se discUli6 en la secci6n previa- en este caso, se [rata de la correspon-
dencia entre una tasa an ual" y una o{ [asa por afio(s)-persona . Por alro lado no se
adjuman unidades de tiempo a una incidencia acumul ada (una probabilidad), la ellal
debe ser siempre especificada (por ejemplo, da probabilidad acumul ada para los
Ires aiios iniciale.\ de seguimiento) .
Finalmente, otm diferencia de imponancia practica entre los enfoctues de ti empo-
persona y de incidencia acumul ada es que, como los propios tenninos sugieren. no
es posible obtener una rasa acumulada global de vad os intervalos de tiempo (Ulili -
zando una poblaci6n promedio 0 un enfoque tiempo-persona), anaJoga a una inci-
dencia ac umulada calc ul ada por medio de tecnicas de supervivencia; esto es. por
supuesto, una consecuencia del caracter <<instantaneo de los estimados de tasas.
Con respecto a las suposiciones, todo los melodos para el calculo de las tasas de
incidencia comparten las suposiciones fundamentales del anali sis de los datos de cohor-
te que fueron discUlidos en secciones previas y que se resumen en el Esquema 2.2:
independencia entre la censura y la supervivencia y ausencia de tendencias sec ul a-
res . Se necesitan suposiciones adicionales en dependencia de los requerimientos
especfficos del metodo (por ejemplo, uniformidad del riesgo a traves de intervalos
definidos en la tabla de vida ciasica yio el anal isis ti empo-persona) .
Los epidemiologos expedmentados han aprendido que, si bien cada enfoque tie-
ne ventajas y desventajas, la decision Ultima acerca de c6mo presentar datos de inci-
!"lencia la !"licta e l pragmat ismo (y/o la preferencia persona l) . Por tanto, en li n estu!"l io
de cohone sin un grupo no expuesto dnterno - como es a menudo el caso en la
E ~ q u e m a 2.2
Supucstos ncccsarios para cI amllisis de supcrvivencia y cl tiempo-pcrsona
Anallsls de supervlvencla Tiempo-persona
Si hay plndidas durante La probabilidad de tener et desentace para observaciones censuradas
et seguimiento: es simitar a ta de los individuos que permanecen bajo observaci6n.
Si se utilizan intervalos, Las perdidas son uniformes a 10 largo del intervalo.
y hay perdidas durante
un intervalo dado:
Si el riesgo se calcula EI riesgo es uniforme N individuos seguidos a!o
en los intervalos: durante el intervalo largo de T unidades de tiempo
tienen los mismos riesgos
que T individuos seguidos
durante N unh1aC1es Cle tlempo.
Si el reclutamiento de los No hay tendencias seculares a 10 largo del periodo calendario
sujetos de estudio se cubierto por el reclutamiento.
hace durante un periodo
relativamente largo:
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 73
investigacion de epi demiologla ocupacional- la estimacion de densidades, mas que
de probabilidades, pennite utilizar tasas de poblacion disponibles como tasas de
control. Por otro lado, las probabi li dades se estiman tfpicamente en los est udios con
centrandose en el comportamiento temporal de una enfermedad - como en los est u-
dios de supervivencia despues del diagnostico de una enfermedad.
2olA. La tasa de ri esgo instantaneo
Una definicion altemativa para una tasa instantanea de incidencia es la Il amada rasa de
riesgo insfanraneo (hazard) 0 incidencia condicional instantanea oJilerza de morbilidad
(0 lIIorfalidad). En eI contexto de un estudio de cohorte, la tasa de riesgo instantaneo se
define como la probabilidad instamanea de cada individuo de tener cierto evento precisa-
mente en eI tiempo 1 (0 en un pequeno intervalo If, f + 8.1]), supuesto que (0 condiciona-
do a que) eI individuo estaba en riesgo en el momenta I. La tasa de riesgo instantaneo se
define para cada punto particular del tiempo durante el segui miemo. En tenninos mate-
maticos, se define para un intervalo de tiempo pequeno (8.1 cercano a 0) como sigue:
P (evento en el intervalo entre f Y II + 8.IJ I vivo en el momenta t)
h(l) = ---'-----------:---'--'--------''-----------'--
M
La tasa de riesgo instantaneo es tambien una tasa medida en unidades de tiempol.
Y es un concepto utH para cualquiera que Irate de entender algunas de las tecnicas
estadfsticas utilizadas en eI anal isis de supervivencia, particularmenle la metodologfa
conocida como milodos de regresi6n de rie.\'gos I'r0l'0rciollale.\" (vease Capitulo 7,
Seccion 7 AA). A pesar de su importancia {eorica, sin embargo, la rasa de riesgo ins-
tantaneo no puede obtenerse di rectamente en los est udios epidemiol6gicos. Esta fue-
ra de los Ifmites de este li bro discut ir las propiedades matematicas de la tasa de ries-
go instantaneo, que son complejas y que se abordan apropiadamente en li bros de
estadfstica(l6) . Es anaJoga, sin embargo, a la probabilidad condicional del evento que
se calcul a en el momento de cada evento utilizando el enfoque de Kaplan-Meier
(Tabla 2.3). Ademas, puede est imarse el riesgo instantaneo promedio para un cierto
lapso en la tabla de vida ciasica. La Jimci6n de riesgo instantaneo puede est imarse
ut ilizando tecnicas parametricas de anal isis de supervivencia (el lector interesado
debe consult ar textos especiali zados, como el de ColletFI6) .
23. MEDIDAS DE I'REVALENCIA
La prevalencia se define como la frecuencia de casos existentes, viejos y nuevos (de
aparicion reciente). Existen dos tipos de prevalencia, la prevalencia punt ual y la preva-
lencia de periodo (Tabla 2.1) . La plevalendll punlllal es la freeuencia de una enferme-
dad 0 condicion en un punto del tiempo; es la medida est imada en las Il amadas encues-
tas de prevalencia 0 transversales, tales como la Encuesta Nacional de Salud, Nutricion
y Examen (National Health, Nutrition and Examination Surveys, NHANES) conduci-
da porel Centro Nacional de Estadfsticas de Salud de los E.>;tados Unidos . La prevalen
cia de I'eriodo se emplea con menos asiduidad y se define como la frecuencia de una
74 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
enfennedad 0 condici6n existentes durante un lapso definido, tal como un ana. Un tipo
especial de prevalencia de penodo es la prevalencia {/culllulada a 10 largo de la vida,
que brinda un estimado de la ocurrencia de lIna condici6n en cualquier momenta
durante el pasado de un individuo. En general, cuando se emplea el lennina prevalen-
cia sin especificaci6n adicional, se da por sentado que se trata de prevalencia !'Unfllal.
Aunque la prevalencia es un Indice eXlremadamente ut H de la magnit ud de problemas
actuales de sai ud, en los es[udios etio16gicos eSla medida es menos expresiva que la
incidencia, porque es simultaneamente una fund6n de la incidencia y de la duraci6n de
la enfennedad despues de su comienzo. (La duraci6n esta. a su vez. detenninada por la
supervivencia para las enfermedades fatales 0 la curaci6n para las no fatales).
Aunque la dependencia entre la prevalencia puntual y la duraci6n de la enferme-
dad compromete la ut ilidad de la prevalencia al efecto de evaluar asociaciones entre
faclOres de ri esgo y enfennedad, su relaci6n con la incidencia permite que sea ut ili-
zada como una aproximacion del riesgo, y en ese sentido puede ser apropiada si
se comprenden adecuadamente sus limitaciones.
Las li mitaciones de la prevalencia punt ual pueden apreciarse al detenernos en la
f6nnul a que define su conexi6n con la incidencia y con la duracion de la enfennedad: "
I Ecuacion 2.3J
(
Prevalencia punt ual
I - Prevalencia pumual
) = Incidencia x duraci6n
N6tese que eI termino Prevalencia Puntual l ( I - Prevalencia Pumual) es el
de la prevalencia pumual (vease Secci6n 2.4).
En esta ecuaci6n y las que se derivan de ell a, la unidad de tiempo para la inciden-
cia y la duracion deberfa ser la misma: esto es, si la incidencia se da como promedio
anual, la duraci6n deberfa darse utili zando afios 0 fracciones de ano. Ademas, se
supone que la incidencia y la duraci6n de la enfermedad se han mantenido relativa-
mente estables a 10 largo de los anos . La Ecuaci6n 2.3 puede ser reescrita como:
I Ecuacion 2.4J
Prevalencia Punt ual = Incidencia x duracion x (I - Prevalencia Puntual)
* La derivaci6n de esta f6mmla es relativamcnte simple. La suposici6n principal es que la enferme-
dad esta en est ado est able. 10 que significa que la incidencia y el numero de casos existentes en cual-
quier punto dado (por ejemplo. X) son aproximadamente constantes. Para una enfemledad incurdble.
esto implica que el numero de nuevas casas durdnte un pcriodo de tiempo dado cualquiera es aproxi-
madamente igual al lIlimem de mllerles entre (os casas. Si N es el tamai'io de la poblaci6n.l es la inci-
dencia. y F es la tasa de Ictalidad. el numero de casos nuevos puede estirnarse multiplicando la inci-
dencia por cl numero de sujetos potencialmcnte susceptiblcs (N-X); a su ve"L. cl numero de muertes
p!.lede estirnarse multiplicando la tasa de casos fatales por el nurnero de casos prevalentes. Por tanto. la
suposici6n anterior puede formularsc wmo I x (N-X) .. F x X. Si no hay inmigraci6n.la tasa de
casos fatales es el inverso de la durdCi6n (D)' . Pm tanto. despuCs de una pcquei'ia m,mipulaci6n ari t-
mctica. y dividiendo el numerddor y cl denominador del termino de la derecha por N:
X
I x D .. -":-'-cc
(N - X)
Prevalencia
(t - Prevalencia)
Un rdzonarniento analogo puede aplicarse a las enfermedades no fatales para los cuales F es la
proporci6n de curddos.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 75
Como se disc utira en los Capft ulos 3 y 4, la Ecuaci6n 2.4 involucra a los dos ele-
memos de una enfermedad que son responsables de la diferencia entre la incidencia
y la prevalencia puntual: su duraci6n y la magnitud de su prevalencia punt ual. Cuan-
do la prevalencia puntual es baja - por ejemplo 0,05 0 menos - el termino ( I - pre-
valencia punt ual) es casi igual a 1,0. Siendo as!. se obt iene la siguieme bien conoci-
da f6nnula que establece la relaci6n entre prevalencia e incidencia:
Prevalencia Puntual ... Incidencia x duraci6n
Por ejemplo, si la incidencia de una enfermedad que se ha mantenido estable a
traves de los afios (por ejemplo, diabetes) es I % por ano, y su duraci6n aproximada
(supervivencia despues del diagn6stico) asciende a 15 anos, su prevalencia punt ual
sera aproximadamente IS %.
2.4. ODDS
EI odds es la razon entre la probabilidad del evento de interes y la probabilidad del
evento complememario (de que no se produzca el evento) . Puede definirse tanto para
la incidencia como para la prevalencia. Por ejemplo, cuando se trabaja con probabi-
lidades de incidencia, el odds es:
Odds = _ '_1-
1- q
(Altemat ivamente, a part ir del odds puede calcularse la probabilidad: q = d d . ~ " I
I I + odds!) .
EI o d d . ~ " de prevalencia es como sigue (vease tam bien la Ecuacion 2.3):
Prevalencia pumual
I - Prevalencia pumual
Tanto los odds como las proporciones pueden ut ilizarse para expresar la fre-
cuencia>, de la enfermedad. Un odds se aproxima a una proporci6n cuando esta ulti-
ma es pequena. por ejemplo, menos de 0, 1. As!,
Proporci6n = 0.05
OddJ" = 0,05 1 (1-0,05) = 0,05 /0,95 = 0,0526
Es mas sencill o captar el significado imui tivo de una proporci6n que el de un
o d d . ~ " , quizas porque en una descripci6n del odds la nat uraleza de este ulti mo como
raz6n no siempre se expresa explfcitamente. Por ejemplo, si la proporci6n de fuma-
dores en una poblacion es 0,20, el odds es
Proporci6n de fumadores
Odds = -,.::.:;;""'=:::,:=-c::;:=:;.:::'--
I - Proporci6n de fumadores
00,20 I (1 - 0,20) = 0,20 10,80 = 1:4 = 0.25 .
Proporcion de fumadores
Proporci6n de no fumadores
76 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Existen dos maneras ailernativas de describir el estimado de un odds: bien como
un numcro aislado, 0,25, (10 que supone que el lector entiende que ello expresa
intrfnsecamente una raz6n, 0,25: 1,0), bien como una raz6n - cn el ejemplo, 1 :4-
comunicando claramente el mensaje de que, en la poblaci6n de estudio, por cada
fumador hay 4 no fumadores.
EI odtis , como medida absoluta a i ~ l a d a de ocurrencia, no se utiliza virtualmente
nunca por los epidemi61ogos. Sin embargo, la raz6n de dos odds (el odds ratio) es
una medida de asociaci6n extremadamente popular debido tanto a que el metoda de
ajuste a traves de la regresi6n logfst ica es ampliamente ut ili zado. como a que por
conducto del odds ratio se puede muchas veces estimar el ri esgo relativo (medida
mas intuitiva y simple de comprender) en los estudios de casos y controles (veanse
Capitulo I, Secci6n I .4.2; Capitulo 3, Secci6n 3.2. 1; Y Capitulo 7, Secci6n 7.4.3).
BlBLlOGRAFiA
I. Websler's l1il1lh new wllegiale diclionary. Springfield. Mi riam-Webster [nc. 1988.
2. Bromberger JT. Matthews KA. Kull er LH el al. Prospective study of the determinants of
age at menopause. Am J Epidemioll997: 145: 124-133.
3. Mirza NM. Caufield LE. Black RE el a/. Ri sk factors for diarrheal duration. Am 1 Epide.
mio11997: 46: 776-785.
4. Breteler MMB. de Groot RRM. vall Romunde LKJ. Hofman A. Ri sk of dementia in
patients with Parkinson's disease, epilepsy. and severe head trauma: a register based
follow.up study. Am J Epidemio/ 1995: 142: 1300-1305.
5. Gane E. Saliba F. Garcfa Valdecasas IC el al. Randomised trial of efficacy and safety of
oral ganciclovir in the prevention of cytomegalovirus disease in liver.transplant reci-
pients. Lancel 1997: 350: 1729-1733.
6. Centers for Disease Control. Revisioll of the CDC surveillance case definition for acqui-
red immunodeficiency syndrome. JAMA 1987: 258: 1143-1145.
7. Kaplan EL. Meier P. Nonparametric estimation from incomplete observations. J Am SIal
Auoc 1958: 53: 457-481.
8. Reed LL Merrell M. A short method for constructing an abridged life table. Alii J Hyg
1939: 30: 33-62.
9. Pooling Project Research Group. Relationship of blood pressure. serum cholesterol.
smoking habit. relative weight and ECG abnormalities to incidence of major coronary
events: final report of the Pooli ng Project. J Chrol1 Dis 1978: 31: 201-306.
10. Gordis L. Epidemiology. Phil adelphia, WB Saunders Co: 1996.
II. Kahn HA, Sempos CT. Slalislicallllelhod.f in epidemiology. New York.Oxford Univer-
sity Press. 1989.
12. Checkoway H. Pearce NE. CrawfordBrown Dl . Research melhods in oculpilliol1a/ epi.
demiology New York, Oxford University Press. 1989.
13. Monson RR. Analysis of relative survival and proportional mortality. Complil Biomed
Res 1978: 7: 324-332.
14. Macaluso M. Exact stratification of person-years. Epidemiology 1992: 3: 441-448.
15. Pearce N, Checkoway H. A simple computer program for generating person-time data
in cohort studies involving time-related factors. Am J Epidemiol 1987: 125: 1085-
1091.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD 77
16. Collett D. Modelling .rurl'ival d(J/a in medical research. London. Chapman & Hall.
1994.
17. Rothman KJ. Greenland S. Modem epidemiology. 2.' ed. Philadelphia,
Publishers. 1998.
CAPITULO 3
Medici6n de asociaciones entre
exposiciones y desenlaces
3.1. INTRODUCCION
Los epidemi61ogos se imeresan a menudo en evaluar la presencia de asociaciones
expresadas mediante diferencias entre medidas de la frecuencia de las enfermeda-
des . Las medidas de asoc iaci6n puedcn basarse, bien en diferellcias absolutas entre
grupos que han de compararse (por ejemplo, expucstos frente a no expucstos), bien
en dijerencias relariva,\" de razones (Tabla 3. 1). Usualmente se opla por las medidas
basadas en dife rencias absolmas clIando se Irata de act ividades preventi vas 0 de
salud publica, puesto que Sli principal objet ivo es con frecuencia conseguir lIna
reducci6n absoluta del ri esgo de aiglin desenlace indeseado. Ademas, cuando el
desenlace de intcres es continuo, la est imaci6n de la diferencia media absoluta entre
individuos expuestos y no expuestos puede ser un me{Qdo apropiado para la determi-
nacion de una asociaci6n.
Las diferencias relativas, que pueden ser estimadas para desenlaces discretos, se
emplean general mente por los epidemiologos para la valoraci6n de asociaciones
causales (Tabla 3. 1).
3.2. MEDICION DE ASOCIACIONES EN UN ESTUDIO DE COHORTE
En estudios prospecl ivos tradicionales 0 de cohorte, los participantes se eligen de
una de las sigui entes dos maneras: I ) se eli ge una poblaci6n definida 0 una mues-
tra de ell a, cada uno de cuyos integrantes se clasifica con acuerdo al nivel de
Tabla 3.1
Tipos de medidas de asoeiaeion tmpleadas en estudios de epidemiologia analitica
Tlpo EJemplos
Diferencia Riesgo alribuible en expueslos
absoluta
Riesgo alribuible iX'blacional
Eficacia
Diferencia de medias
(desenlaces continuos)
Diferencia relativa Riesgo relativo 0 raz6n de lasas
Odds relalivo
Apiicaclon usual
Impacto de la prevenci6n primaria;
busqueda de causas
Impacto de la prevenci6n primaria
Impacto de la inteNenci6n sobre las
recaidas; letalidad. elc.
Busqueda de delerminantes
Busqueda de causas
Busqueda de causas
80 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
exposici6n, 0 2) se idemifican de modo especffico tanto sujetos expuestos como
no expucstos y se incluyen en el estudio. Estos individuos son emonces seguidos
de manera concurrente 0 no(1. 2) para aquila tar los desenlaces, de suerte que se
pueda est imar al guna medida de incidencia en cada grupo (veanse tambien los
Capftulos 1 y 2) .
Con el fin de simpli fi car los conceptos descritos en este capitulo, en la mayorfa
de los ejemplos que subsiguen se consideran solo dos niveles de exposici6n: expucs-
{Os y no expucs{Qs. Por otra parte, se da por sentado que el seguimiento se prolonga-
ra durante todo ellapso previsfO para IOOos los individuos de la cohort e (es decir. no
se contempla la posibilidad de casas censllrados; sin embargo, la discll si6n que sigue
tambien sirve por 10 general para la est imaci6n de riesgos y de tasas que contemplan
seguimiento incompleto y censura, descritos en el capitulo previo, Seccion 2.2.) . Por
razones de simplicidad, este capitulo se concentra casi exclusivamente en la raz6n
de dos probabilidades 0 de dos olidJ" (es decir, el riesgo relat ivo y el odds ratio) 0 en
la diferencia absoluta entre dos probabilidades (es decir, el riesgo atribuible). Sin
embargo, los conceptos descritos en relacion con dichas medidas tambien valen para
las otras medidas de asociaci6n, tales como la raz6n de tasas de riesgos instantaneos
(hazard ratio). Por ult imo, con el fin de describir medidas de asociacion, por 10
general se parte del supuesto de que las est imaciones no estan afectadas por confu-
sion 0 sesgo.
3.2.1. Riesgo relativo (Raz6n de Riesgos) y Odds Ratio
La Tabla 3.2 muestra una tabulaci6n cruzada ciasica de dos filas para la exposici6n
y dos columnas para la condici6n morbosa. De un total de (a+b) individuos expues-
tos y (c+d) no expuestos, a expuestos y c no expuestos desarrollan la enfermedad
de imeres a 10 largo del seguimiento. Las estimaciones de los riesgos y los odds
correspondientes se muestran en las ultimas dos columnas de la Tabla 3.2 . N6tese
que los odds de la enfermedad (Ia razon de la probabilidad de enfennar entre la de
Tabla 3.2
Tabul acion cruzada de exposicion y enfermedad ell un estudio de cohorte
Exposlcion Enfermos Sanos
Presente
,
b
Ausente
,
d
Incidencla de
la enfermedad
(Rlesgo)
,
q+"' --
,.b
,
Q" --
,. d
Odds probabllistlcos
de enfermar
,
--
Q.
,.b
--
"
1-(- ' )
"
1 - q.
,.b
,
~
c.d
"
"
1 - Q
1-(- ' )
,.d
,
-
b
,
-
d
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 81
no enfermar) se reduce aritmeticamente a la razon del nli mero de casos enfennos
dividida por la de individuos que no desarrollan la enfermedad para cada categorfa
de exposicion .
EI riesgo relativo de desarroll ar la enfermedad se expresa como la razon del ri es-
go (incidencia) entre sujetos expues!Os (q+) entre la de los no expuestos (q_):
1 Ecuacion 3. 1 J
Riesgo relat ivo (RR) = q+ =
q-
c
c+d
Para informarse sobre metodos de eSlimacion de Ifmites de confianza y valoreJ P
para un riesgo relat ivo, vease Apendice A, Secci6n A.3 .
EI odd.\ ratio de desarroll ar una enfermedad es la razon del odd.\ de enfermar;
puesto que este ejemplo se basa en los riesgos de incidencia 0 probabilidades, este es
ocasionalmente designado como odds relarivo.\ de riesgo 0 como odds I)robabilfsti-
cos relativos . Notese que la razon de los odds de probabil idad de enfermar es equi -
valente a la raz6n de productos cruzado (a x d)/(b x c). Usando la no{aci6n de la
Tabla 3.2 tenemos:
a
a+b
OddJ probabil fsticos I _ q+
relativos (OR) = - - = ! f ~ =
- q-
1_(_a )
a +b
,
I - q_
As!,
1 Ecuacion 3.21
c+d
(
c)
1- --
c + (/
O
ax d
R= --
bx c
a
a + b
h
( : )
a +h
=
--
,
(:) c +d
d
c+d
Para examinar metodos de es{imacion de li mites de confianza y va/oreJ p para un
odd.\ ratio. vease Apendice A, Secci6n A.4.
En el ejemplo hipotetico que se presenta en la Tabla 3.3, la hipenensi6n grave
y el infarto agudo de miocardio son, respecli vamente, el factor de exposicion y el
desenlace de interes. EI tamano muestral para cada nivel de exposici6n se fij6
arbitrariamente en 10.000 con el fin de faci li tar los d.lcul os . Para {ales datos.
puesto que la probabilidad (riesgo) de infano de miocardio es baja tanto para
expuestos como para no expuestos, los O(Id.\ probabi lfsticos de desarrollar la
enfermedad tanto entre hipertensos como en s ujetos norma les se aproximan a las
probabilidades respectivas (Tabla 3.3).
82 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 3.3
Estudio de cohortc hipotCtica de UII ano para la estimaci{m de incidcncia de infarto
agudo de miocardio en individuos COli hipertclIsioll sist61ica grave (> 180 mill Hg)
y tension arterial sist6lica normal 120 mm Hg)
Infarto de mlocardlo
Situacion
de la tensi on Numero Presente Ausente Probabilidad
Odds probabllfstico
arterial
de enfermar
Hipertensi6n 10.000 180 9.620 180/10,000" 0,0160 160/(10,000 - 180) ~
grave 180/9.820 '" 0,01833
Normal 10.000 30 9.970 30110.000", 0,0030 30/(10,000 - 30) '"
30/9.970", 0,00301
Como resultado, la razon de odd.\" probabilfsticos de enfermar (expuesto frente
a no expucsws) se aproxima a1 ri esgo relat ivo:
RR =
180
10 .000
30
10.000
OR probabilfstico =
0,0180 =6,00
0,0030
180
9.820
30
9.970
-;:0.:;:,0;0 18",3:;.-3 = 6,09
0,0030 1
Una situaci6n diferente emerge cuando las probabili dades de desarroll ar la enfer-
medad son ali as tanto entre expuestos como en no expuestos . Por ejemplo, Seitscr et
al.(l) examinaron 1a incidencia de reacciones locales en individuos aleatoriamente
asignados a un proceso de vacunaci6n inyectable para la influenza 0 a un grupo al
que se administr6 un placebo. La Tabla 3.4, basada en este estudio, muestra que
mientras 1a probabilidad (incidencia) de reacciones locales es alta, las estimaciones
de el oddJ' probabilfsticos de tener rea::ciones locales no se aproximan a las respecti-
vas probabilidades, y aSI que la odds ratio probabilfst ico de reacciones locales
(vacuna frente a placebo) es bastantc diferente del riesgo relati vo:
650 650
2.570
0,2529 = 3,59
1.920
0,3385 6
RR=
170
=
OR=
=
=44
0,0705 170 0,0759 '
2.410
2.240
Cuando la condic i6n tiene una incidencia alt a y cuando se tienen datos prospect i-
VQS, como fue el caso en este ensayo de vac linaci6n, entonces por 10 general es
mejor optar por el riesgo relat ivo por ser una medida de asociaci6n entre el factor de
riesgo y el desenlace de mas [aci! comprensi6n.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 83
Tabla 3.4
Incidcncia dc rcaccioncs localcs en vacunados y en un grupo placcbo, ensayo de vacu-
nacion contra la influcnza
Reaccl6n local
Grupo Numero Presente Ausente Probablildad
Odds probabltfstlco
de enfermar
Vacuna 2.570 650 1.920 650/2.570", 0,2529 650/( 2.570 - 650} "
.920 '"
Placebo 2.410 170 2.240 170/2.410::0 0,0705 170/( 2.410 - 170} "
17012.240", 0,0759
Nota; 8asado en datos para individuos de 40 anos de edad 0 mayores en Selt ser et al."I. Para evitar ambigileda
des de redondeo en los ejemplos subsiguientes basados en estos datos (Rgura 3.4, Tabla 3.7 y 3.9). los tamanos de
las muestras originales en el estudio (257 vacunados y 241 receptores de placebo) se multiplicaron por 10.
Fuente; Datos procedentes de R Seltser. PE Sartwell, and JA 8ell, AControlled Test 01 Asian Influenza Vaccine in
Population 01 families. American Journal of Hygiene, Vol. 75, 112 135 11:1 1962.
Aunque el oddJ' ratio es una medida valida de asociaci6n por sf misma, (vease
mas adelante), frecuentemente se usa como una aproximaci6n del riego relat ivo. EI
odds ratio como una eJtimacion del riesgo relati vo esta, sin embargo, sesgada en
direcci6n opuesta a la hip6tesis nula: esto es, tiende a exagerar la magnitud de la
asociaci6n. Cuando la enfennedad es relativamente rara, este sesgo dnherente
(huilt in bias) es despreciable, como se aprecia en el ejemplo de la Tabla 3.3. Sin
embargo, cuando la incidencia es alta, como en el ejemplo del ensayo sobre la vacuo
na (Tabla 3.4), tal sesgo puede sersustancial .
Una expresi6n de la relaci6n matematica existente entre eI odds ratio , por una
parte, y el ri esgo relativo por otra. puede obtenerse del modo siguiente. Supongamos
que q+ es la incidencia (probabilidad) entre expuestos (por ejemplo, vacunados) y q.
es la incidencia entre suj etos no expues(Os. EI odds ratio es entonces:
1 Ecuaci6n 3.31
e
OR=
q.
1- q.
e :-qJ
x
I - q+ q-
N6tese que el terminG q) q. en la Ecuaci6n 3.3 es el riesgo relati vo. As!, el ter
mino:
84 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
define el sesgo responsable de la discrepancia ent re el riesgo relativo y el odds ratio
estimado (sesgo inherente). Si la asoc iaci6n entre la exposici6n y el desenlace es
posit iva, q_ < q+, entonces (1 - q_) > (1 - q+) . EI sesgo sera por tanto mayor que 1.D,
de modo que el oddJ' ratio supone una sobreestimaci6n del riesgo relat ivo. Por ana-
logla, si el factor es protector, OCll fre 10 contrario - csto es, ( I - q_) < (1 - q+) - yel
ratio sobrest imara nucvamente la intcnsidad de la asociaci6n. En general, el
odd,\" ratio tiende a prod ucir una estimad6n mas distante de 1.0 que el riesgo relativo
en ambos lados de la escala (encima y debajo de 1.0).
En el ejemplo de hi pertensi6n!infarto de miocardia y la (Tabla 3.3), el sesgo es
de pequeoa magnitud, y la estimacion del odds ratio, aunq ue un poco mas distante
de 1.0, sigue siendo proxima al riesgo relat ivo; usando la Ecuaci6n 3.3:
O
. 6 1 - 0,0030 6 6 9
R = RR x sesgo lnherente= ,0 x = ,0 x I ,0 15 = ,0
1- 0,0 180
Sin embargo, en el ejempl o de las reacciones locales a la vac una contra infl uen-
cia (Tabla 3.4), existe un sesgo considerable cuando se usa el odds ratio para estimar
el riesgo relat ivo:
OR = 359 x 1- 0,0705 = 3,59 x 1.244 = 4,46
I - 0,2529
Independientemente de que el odlis ratio pueda prod ucir una est imaci6n adecua-
da del riesgo relativo 0 no, aquel es, como ya dij imos, una medida de asociaci6n
valida par sf misma. Y resulta especialmente valiosa porque puede ser obtenida a
partir rle resll lt arlos rle los est llrlios rle y conlroles y por'111e se ohtiene
directamente a partir de los modelos de regresion logfstica (vease Capitulo 7, Sec-
cion 7.4.3). Ademas, a diferencia del riesgo relat ivo, el olids ratio de un aconteci-
miento es el recfproco exac(Q del odds ratio del evento opues(Q (de que no se pro-
duzca). Por ejemplo, en el estudio de las reacciones locales a la vac una contra
infIuencia ya discut ido(3), el odds ratio de una reaccion local,
(
650 )
1.920
OR",,,moo 1oc.1 (.) = = 4,46
2.240
es el recfproco exacto del odds ratio de no tener una reacci6n local,
(
1.920)
650 I
=022=--
(
:z.:Z4U ) , 4,46
170
Este rasgo no 10 comparte el ri esgo relat ivo, como puede verse usando el mismo
ejemplo:
y
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 85
RR" acco6nloc. 1 (+)=
650
2.570
' 70
2.410
= 3,59
(
1.920)
2.570
R R ",ocdoo locol 1_) =
(
2240 )
2.410
,
= 0 8 ,. --
, 3,59
Este hall azgo, aparentemente parad6jico, es una consecuencia de la sensibilidad
del ri esgo relativo a la magnit ud de un desenlace: esto es, el ri esgo relativo de un
punto fi nal comti n se acerca a 1,0. Esto se aprecia nftidamente cuando se estudia el
complemento de un desenlace mu)' poco probable . Por ejemplo, si las tasas de letali -
dad en pacientes somet idos a cierta intervenci6n quirtirgica usando una tecnica
estandar y usando una nueva tecnica fueran, respecrivamente, 0,02 y 0,0 1, entonces
el riesgo relativo para el suceso relat ivamente raro (el de morin), en esre caso) serfa
0,02/0,0 1 = 2,0. Sin embargo, el ri esgo relativo de supervivencia serfa 0,9810,99,
numero virt ual mente igual a 1,0, eI cual sugiere que la nueva tecnica quinirgica no
afecta la supervivencia. Por otra parte, el odds ratio de mori r serfa
OR
morir
=
en tanto que el de sobrevivir serfa
0,02
1,0 - 0,02
0,0 1
1,0 - 0,0 1
0,98
= 2,02
_
""""0,;;-",0 ,,,,-, 98,--- ' ,0
OR""",-,;,'ir = 0 99 = 0,495 =--
, 2,02
' ,0 - 0,99
3.2.2. Ri esgo Atribuible
EI riesgo atribuible (RA) es una medida de asociacion basada en la diferencia abso-
luta entre dos estimaciones de riesgo. Dicho de otro modo, el RA est ima el exceso
de riesgo absoluto debido a una exposici6n dada. Puesto que el riesgo atribui ble se
usa a menudo para detectar una relacion causa-efecto, debe ser interpretado como
una verdaderafracci6n etiol6gica solo cuando ex isla una certeza razonable de que
hay una conexi6n causal entre la exposici6n y el EI termino fracci6n
lie exceso se ha sugeri do como una alt emativa al de riesgo atribuible 0 fraccion et io-
16gica cuando la causalidad no ha sido finnemente corroborada(4) . Debe advert irse
asimismo que, aunque las formu las y ejemplos en esta secci6n se refieren por 10
general a rieJ'gos atribuibles, son {ambien aplicables a tasas 0 densidades atribuibles;
es decir, si se usan datos que 10 que permiten es computar incidencia basada en per-
86 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sona-tiempo, entonces puede lIna rasa at ri buible entre los expucstos (vea-
se mas adelante) por conducto de tasas por persona-tiempo.
Como se discute extensamente por Gordis(2), eI RA asume diferentes formatos,
incluyendo los siguientes.
Riesgo Atribuible ellllldividuos Expuestos
EI RA .... es meramente la diferencia entre el riesgo estimado para diferentes niveles de
exposic i6n y un nivel de exposici6n de referenda; regularmeme, este ultimo no es mas
que la categorfa de los no expuestos. Suponiendo una exposici6n binaria, y llamando q+
al riesgo entre los expuestos y q_ al riesgo entre los no expucstos, RA."p simplemente es:
I Ecuaci6n 3.4 J
RA ..
p
= q+ - q-
El RA.
xp
mide el exceso de riesgo correspondiente a una categoria dada de exposi-
d6n. Por ejemplo, con los datos del ejemplo de la Tabla 3.3, la inddencia ac umulada de
infarto de miocardio entre hi pertensos (q+) es 0,0 18 (0 1,8 %), Y la correspondiente tasa
entre nonnotensos (grupo de referenda 0 de no expuestos) (q_) es 0,003 (00,3 %); as!,
eI exceso de riesgo asociado con la exposidon a la hipertensi6n es 0,0 18-0,003 = 0,0 15
(0 1 %) . Esto es, suponiendo que existe una relad6n causal (es decir, que no se trata ni
del efecto de un sesgo ni de un efecto de confusion, veanse Capft ulos 4 y 5), Y si el
exceso de inddencia fuera completamente reversible, al cesar la exposicion (la hi per-
tensi6n sist61ica grave) el riesgo entre eI grupo de expuestos se redudria de 0,0 18 a
0,003 . En la Figura 3. 1, las dos barras representan la incidencia acumul ada en expues-
lOS y no expueslos; asf, eI RAu
p
(Ecuaci6n 3.4) es la diferenda en altura de dichas
barras. (L.1 analogfa grMica para eI riesgo relativo IEcuaci6n 3.4J es cuantas veces
mayor es la barra de los expuestos que la de los no expuestos en la Figura 3. 1). N6tese
que el RA.,p - la diferenda entre dos medidas de incidencia- es tambien una magni-
IUd de incidenda y por ende se mide usando las mismas unidades. EI RA",p estimado de
I % en el ejemplo anterior representa el exceso absoluto en la incidenda que se
hubiera prevenido mediante la eliminaci6n de la hipertensi6n grave.
Puesto que la mayorfa de los efectos de exposicion son acumul at ivos, con el cese
de la exposici6n (incluso si estuviera causalmente relacionada con la enfermedad)
usualmente no baja el riesgo entre los su jetos expuestos hasta alcanzar el nivel halla-
do entre aquell os que nunca estuvieron expuestos. Asf, la maxima reducci6n del
riesgo es nonnalmente alcanzada solo a traves de la prevenci6n a la exposici6n y no
como result ado de que esta cese.
RA ....
p
porcetltual
Un RA
oxp
porcent ual (%RA"p) es meramente el RAexp expresado como un porcenta-
je de los q+ - el exceso asociado con la exposicion como un porcentaje del total q+.
Para una variable de exposicion binaria, eS(Q es:
I Ecuacion 3.5 J
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 87
\
RA_
I
-------- . --------- ---------
No expuestos Expuestos
Fi gura 3.1. Ricsgo atri buiblc ent re tXpucstos
En el ejemplo anterior, el %RA"p es
%RA ..
p
= 0,018 - 0,003 x 100 = 83,3 %
0,0 18
Si Ia causalidad estuviera confirmada, el R ~ x p porcentual puede interpretarse
como el porcemaje del ri esgo total entre los expuestos que es atribuible a la exposi-
cion. Puede ser liti! expresar la Ecuacion 3.5 en tenninos del riesgo relativo:
As!, en el ejemplo, al usar el riesgo relativo (0,018/0,003=6,0) en esta f6rmula, se
produce el mismo resultado que el que se obtiene aplicando la Ecuacion 3.5:
%RAox
p
=( 6,0 - 1,0) x 100=83,3%
6,0
La vemaja evidente de la f6nnula
lEcuacion 3.6]
(
RR - l ,O)
%RAoxr = RR x 100
consiste en que puede emplearse en los estudios de casas y controles, en los que los
datos de incidencia (es decir, q ~ 0 q_) no pueden obtenerse, pero donde puede usarse
el odds ratio como una estimacion del ri esgo relati vo si la enfennedad es relat iva-
meme rara (vease Seccion 3.2.1 ).
88 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Adviertase que el %RA." p es an:llogo al porcentaje de eficacia cuando se evalua
una imervenci6n tal como lIna vacuna. La fannula usual para la eficacia es equiva-
lcote a la f6rmula para el %RA ..
p
(Ecuaci6n 3.5) cuando q+ se reemplaza por qcont
(riesgo en el gmpo control, ej, el grupo que recibe placebo) y q_ se reemplaza por
qi n'"" (riesgo entre aquellos bajo intervcnci6n):
I Ecuaci6n 3.7J
Eficacia = ( q coot - q mterv ) X 100
q . ",,,
Por ejemplo. en un ensayo aiea{Qrizado para evaluar la eficacia de una vacuna,
los ri esgos en personas que reciben la vacuna y el placebo son, respectivamente, 5%
y 15 %. Usando la Ecuaci6n 3.7, la eficacia resulta seT 66,7 %:
Eficacla = x 100 = 66,7 %
. (15%-5%)
15 %
Altemativamente, puede emplearse la Ecuaci6n 3.6 para est imar la eficacia. En el
ejemplo que nos ocupa, el riesgo relat ivo (placebo/vac una) es, 15 %/5 % = 3,0. Asf,
Eficacia = ( 3,0 - 1,0 ) x 100 = 66,7 %
3.0
N6tese que el empleo de la Ecuaci6n 3.6 para calcul ar la eficacia requiere que cuan-
do se calcule el riesgo relat ivo, el gmpo que no recibe la intervenci6n (por ejemplo, pla-
sea (;omo exput:slo, y d grupo que redbt: 1a a(;liva (pur
ejemplo, el de la vacuna) sea el que se considera como de no Un enfoque
matematicamente equivalente consistiria en obtener primero el riesgo relat ivo, pero esta
vez poniendo en el numerador el riesgo de aquellos que reciben la intervenci6n activa
(por ejemplo, vacuna) y en el denominador aquellos que no la reciben (por ejemplo,
placebo) . En este caso, la eficada se calc ul a como el compl emento del riesgo relativo,
ej ., (1,0 - RR) x 100. En el ejemplo, usando este enfCKJue, la eficacia de la vacuna serfa,
Eficacia =[ 1,0 - ( 155 x 100 = 66,7 %
Como con el RA porcent uaL la correspondencia entre el riesgo relat ivo y el odds
en la mayor parte de las situaciones practicas permitirfa la estimaci6n de la eficacia
en los est udios de casos y controles usando la Ecuaci6n 3.6.
Riesgo Atribuible Poblaciollal de Lel'ill
EI riesgo atribui ble pobladonal de Levin (RApoo) estima la propord6n del riesgo de enfer-
mar en la poblad6n total asociada con la exposid6n
1b
), Por ejemplo, supongamos que la
prevalenda de la exposid6n en la poblaci6n (p,) asdende a 0,40 (y, asf la prevalenda de
110 eXl'osici6n, ( I - Po) es 0,60), y que los riesgos enU"e los expuestos y los no expuestos
son, respect ivamente, q+= 0,20 y q_= 0, 15. El riesgo en la poblad6n total(qlti es una
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 89
suma ponderada de los riesgos entre los expuestos y los no expuestos en la poblaci6n:
1 Ecuacion 3.81
En el ejempl o:
ql'oo= (0,20 x 0,40) + (0, 15 x 0,60) = 0, 17
EI RAl'oo es la diferencia entre el ri esgo en la poblaci6n total y el de los su jetos no
expuestos, 0 0, 17 - 0, 15 = 0,02, loque representa el exceso de riesgo en la poblaci6n
asociado con la exposici6n. Esto es, si la relaci6n fuera causal, y si el efecto de la
exposici6n fuera completamente reversible, el cese de la exposici6n producirfa un
decrecimiento en el ri esgo de la poblacion total (ql'oo de 0,17 a 0, 15, es decir, eI nivel
del riesgo en el grupo no expuesto) . EI RAl'oo usualmente se expresa como el ri esgo
at ri buible poblacional porcentual, % RAI'ob' En el ejemplo que nos oc upa, el %
RAl'oo es (0.02/0, 17) x 100, 0 apro."(imadamente 12%.
Matematicamente, el % RAl'ob puede expresarse como sigue:
1 Ecuaci6n 3.91
% RApob=L(ql'ob- q_)/q]>ooJ x 100
Como se vio en la Ecuad6n 3.8, la incidenda en eI tOlal poblacional es la suma de la
inddencia entre expues(os y no expuestos, ponderada por las proporciones de expuestos
y no expuestos en la pobladon. De modo que cuando la prevalencia de exposicion es
baja, la incidenda pobladonal sera pr6xima a la incidencia presente entre los no expues-
lOS. (Figura 32A). Analogamente, si la exposici6n es altamente prevalente (Figura 32B),
la inddenda poblacional sera cercana a la incidencia entre no expuestos. Como resul la-
do, el RAPnII se aproxima al RA.x
p
cuando la prevalenda de la exposici6n es alta.
Tras una simple mani pulaci6n aritmetica' , la Ecuacion 3.9 puede expresarse
como una fund6n de la prevalencia de exposicion en la poblacion y el riesgo relat i-
vo en la sigui ente formu la, que fuera introducida por Levin:
, Usando la Ecuaci6n 3.8, la Ecuaci6n 3.9 pucde ser reescrila como una funci6n de la prevaJen-
cia de la exposici6n (p,) y la incidencia entre expuestos (q. ) . como sigue:
[q. x I', ] + [q_ x (I - 1',)] - q_
% RA"", = x JOO
[q. xp, ] + [q_x (J 1',)]
[q. x 1', ] - [q_ xI',)]
-;-:=-,7'7""'-:-72-:- ' J()()
[q. x I', ] [q_ x I',)] + q_
Esla expresi6n puede ser aun mas simplificada dividiendo todos los terminos del numer..tdor y el
denominador por q_
q.
- xp,_ p,
q-
% RA"", = --'-----
q. I
_ xp,_ p, +
q-
p, x (RR - I)
p, x (RR 1) +1
9() EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
I Ecuaci6n 3 .1 OJ
p, x (RR - I )
% RAJ''''' = -"-':::"=-c-'-'--,- x 100
l', x(RR - I ) +!
Usando el mismo ejemplo de la poblacion con una prevalencia de exposici6n igual a
0,40 y un RR = 020/0, 15 = 1,33, la Ecuaci6n 3.1 0 produce e l mismo % RApobestimado
ames:
0,40 x (1 ,33 - I)
% R A ]'ob = 7"'0':::'''''7''''--,,-''-,-
0,40 x (1,33 - 1) + I
A
-,-O" ,,,
40
:c:c
x
-, O,,,,3,,3'-,- = 1 2 %
0,40 x 0,33 + 1
r------r------ -------- ----- --------
No expueslos Poblaci6n Expuestos
B
R ~ 1 b
M
lP
. ... ...... .... -... . .... . .......
NO expueslos Poblaci6n Expuestos
Figura 3.2. EI ricsgo atribuible poblacionai y su depcndcncia de 13 prevalcncia de 13
cxposici6n. Como la pobJaci6n se compone de individuos expuestos y no expuestos. la inci
deneia en la pobJaci6n es similar a la de los no expuestos cuando la exposici6n es poco pre-
valente (A) y es pr6xima a la que tienen los expuestos cuando la exposici6n es comlin (8).
Asf. para un riesgo relativo fijado (p. ej .. RR ... 2 en la figura). el riesgo atribuible poblacional
depende fuertemente de la prevalencia de la exposici6n.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 91
Para consultar un me{odo de c6mputo de los Ifmites de confianza para RA
pob
,
vease el Apendice A, Secci6n A.S.
La f6nnula de Levin es aplicable a los est udios de casos y controles (mediante el
reemplazo del riesgo relativo por eI valor del oddJ" ratio) cuando la prevalenda de la
exposici6n en la poblad6n de referenda es conocida. Esto subraya la importanda de
los dos elementos criticos que contribuyen a la magnitud del riesgo a{ribuible poblado-
nal: el riesgo relativo y la prevalenda de la exposici6n. La dependenda que {i ene el ries-
go at ribuible pobladonal de la exposidon se ilustra graficamente en la Figura 3.3; esta
mues{ra que para {Odos los valores del riesgo relat ivo. el riesgo atribuible poblado-
nal (RA) se incrementa marcadamente en la medida que la prevalenda de la exposi-
d6n crece.
Toda la discusi6n precedente es valida cuando la variabl e de exposici6n es binaria
(es decir, expuestos frente a no expuestos). Cuando la exposici6n se define a (raVeS de
mas de dos categorfas, una extension de la formu la de Levin fue propuesta por Walter(7) .

L I' j X (RRi - l)
% RApob =-'C"""c . ------ x 100 =
I+ L l'i x(RRj- l)
i.O
EI subfndice i denota cada uno de los niveles de exposici6n; 1'. es la proporci6n
en la poblaci6n que se estudia en eI nivel de exposici6n i; y RRj es el riesgo relat i-
vo RR no ajustado para el nivel de exposici6n i comparado con el nivel de los no
expueslOs (referenda).
100
RR '=' 10
80
RR",S
t RR",3
,
60
0
Q
RR",2

~
40
~
20
0
0 20 40 60 80 100
Prevalencia de expuestos (%oj
Fi gura 3.3. EI riesgo atribuibl e poblacional : dependencia de la prevalencia de exposi.
ci on y del riesgo relati vo
92 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Es importante enfatizar que la fannula de Levin y la extensi6n de Walter para expo-
siciones a varios niveles dan por sentado que no hay confusi6n (vease Capit ulo 5) . Si la
confusi6n estuviera presente, entonces no es correcto calcular el riesgo relat ivo aj us-
(ado (usando clI alquiera de los enfoques que se describen en el Capit ulo 7) e inser-
(arlo en las fannulas de Levin y de Walt er con el fin de obtener un RA
poo
aj ustado(8).
El enfoque correc(Q para dicho aj uste del RAp"" se ha descrito en alro sitio .
33. ESTUDIOS DE CORTE TRANSVERSAL, ESTIMACION PUNTUAL
DE LA RAZON DE TASAS DE PREVALENCIA
Cuando de 10 que se di spone es de datos procedentes de un es{udio transversaL las
asociaciones se estiman a menudo mediante el empleo de lIna razon de tasas puntua-
les de prevalencia (RTP). La capacidad de las RTP para estimar el ri esgo relativo
depende de la relaci6n entre la incidencia y la prevalencia punt ual, como se discutio
previamente en el Capftulo 2 (Secci6n 2.3, Ecuacion 2.4):
Prevalencia punt ual = Incidencia x Duraci6n x ( I - Prevalencia puntual)
Usando las notaciones Prev para la prevalencia, q para la incidencia y Dun)
para la duraci6n, y denotando la presenci a 0 ausencia de una exposicion dada
mediante + y - ~ ) , la relacion entre el RTP y la razon de incidencias es:
RTP = Prev+ =
Prev_
q+ X Dur+ x LI ,0 - Prev+J
q- x DUL x [1,0 - Prev_J
Como la razon de incidencias es el riesgo relat ivo, esta f6nn ul a puede ser replan-
{eada como:
I Ecuacion 3.II J.
RTP = RR x ( Dur+ ) x (....!....=!rev+ )
DUL 1- Prev_
As!, los dos fac{Qres de sesgo que diferendan al RTP del riesgo relati vo son la
raz6n de las duraciones de la enfennedad, (Dur..fDuL), y la razon de los complemen-
{OS de las estimaciones puntuales de las prevalencias ( I-Prev ..f l -Prev _) en expuestos y
no expuestos. En el Capit ulo 4 (Secci6n 4.4.2) se discuten e ilustran tales sesgos.
3.4. MEDICION DE LA ASOCIACION EN ESTUDIOS DE CASOS Y
CONTROLES
3.4.1. Odds Ratio
Uno de los mas importantes aportes cn materia de estimacion de ri esgos en epide-
mi ologfa se produjo en 1951 cuando Cornfield(<J) hizo notar que el oddJ ratio de
enfermar (OR.
nf
) y el odds ratio de estar expues{Q (ORnp) eran matematicamente
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 93
equivalentes. Esta simple pero crucial circunstancia pennite calcular el odds ratio de
enfermar en los est udios de casos y comroles, pues es algebraicamente idemico al
odd.\" ratio de estar expuesto.
Como ya se vio en la Ecuacion 3.2, la raz6n de los odds de desarroll ar una enfer-
medad entre expuestos y no expuestos se convierte en la raz6n de productos auza
(los, (a x d)/(b x c). Usando los datos plVsl'ectivos que aparecen en la Tabla 3.3, aho-
ra reorganizados como se muestra en la Tabla 3.5, y asumi endo que las celdas en la
tabla representan la distdbuci6n de los partic ipantes en la cohone durante el segui -
miemo de un ano. es posible lI evar adelante un anali sis de casos y controles compa-
rando los 210 sujetos que desarroll aron un infarto de miocardio (casos) con los
19.790 individuos que se mantuvieron libres de enfermedad coronada durante dicho
seguimi ento. EI odds absoillfo de exposicion (Odd,\"oxp) entre los casos y el odd.\" ana-
logo de exposici6n para los comroles se estima como la razon de la proporci6n de
individuos expuestos respecto de la proporci6n de individuos no expuestos:
a
Odd.\"nplm"",=
a +c
a
- -
( a )
c
1---
a +c
b
Odd'\"<xplcoorol.,=
b+d
b
- -
I_(_b )
d
b+d
La siguieme maniobra algebraica demuestra que el odds ratio de los expuestos
(OR ..
p
) es identico al odds ratio de enfennar (014nf; Ecuaci6n 3.2):
I Ecuacion 3. 12 J
a a
C a x d b
OR ..
p
= - = --- = OR., nf
b b x c
c
d d
Tabla 3.5
Estudio hipotctico de casos y controles sobre infarto del miocardio en relacion con
hipertension sistolica, basada en un aiio completo de seguimiento de la poblacion
tomada de la Tabla 3.3
Situaclon de la lenslon arterial sltollca'
Hipertensi6n grave
Normal
Tot31
Inlart o del mlocardlo
Presente
180 (a)
30 (e)
210 (a-+<:)
A U ! ~ e n t e
9.820 (b)
9.970 (d)
19.790 (b+d)
Hipertensi6n siSl6hca grave ., 180 mm Hg. y lensi6n arterial sisl6lica oormal < 120 mm Hg.
94 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Para el ejcmplo de la Tabla 3.5, el OR
oxp
es
180
30
0"",, = --;:-:=-
9.820
9.970
180 x 9.970 = 6,09 = ORe"f
9.820 x 30
En este ejemplo. basado en datos prospectivos, {Odos los casas y los no casas
(control es) han sido lI sados para la estimaci6n del odds ratio (suponi cndo un segui -
mi ento completo durante un ana de los 20.000 indi viduos). Sin embargo, los estu-
dios de casas y controles se basan tfpicamente en muestras. 5 i el numero total de
casas es pequeno, como en el ejemplo de la Tabla 3.5, el investi gador puede inten-
tar incluir todos los casas y una mue.stra de controles . Por ejemplo, si se trabajara
con el 100% de los casas pero con lIna muestra de aproximadamente el 10% de los
no casas fueran estudiados (Tablas 3.6), suponiendo que no hay variabilidad aleato-
ria, los resul tados sedan idemicos a los obtenidos cuando se incluyen todos los no
casos, como en la Tabla 3.5:
180
30
ORoxp = """""982 =
997
180 x 997
982 x 30
= 6,09 = ~ n f
Este ejempl o pone de manifiesto que la fracci6n muestral no tiene que ser la mi s-
rna en casos y en comroles . Sin embargo, para obtener estimaciones insesgadas de
los odds absolutos de exposic ion para los casos y para los comroles, las fracciones
de muestreo han de ser independientes de la exposici6n: esto es, elias deben ser apli-
cadas por igual a las celdas (a) y (c) para casos y en las celdas (b) y (d) para los con-
troles . (Para conocer acerca de excep:iones de esta regia, vease el Capitulo 4, Sec-
cion 4.2).
Tabla 3.6
Estudio de easos y controles de la rclacion de inrarto del miocardio y presencia
de hipertension sistolica grave incluyendo todos los casas y un 10% de la muestra
de los no casas tornado de la Tabla 3.5
Sltuaclon de ta tension arterlat slstollca"
Hipertensi6n grave
Normal
Total
Infarto del mlocardlo
Presente
180 (a)
30 (c)
210 (a+c)
Ausente
982 (b)
997 (d)
1.979 (b+d)
. Hipertensi6n sist6lica grave 180 mm Hg. y tansi6n arterial sist61ica normal <: 120 mm Hg.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
EI investigador selecciona muestras
J J
Total de casos: Total de no casas:
820 0,8 '" 656 4.160 0,5 " 2.080
____________________ t _____________ J _____________ ...... _,
Composici6n esperada de estas muestras
si la distribuciOn da vacunadosJplacebo es insesgada
--------------------,---------------r----------------- ---,
, ,

CAsas:
Vacunados: 650 0,8 '" 520
Placebo: 170 0,8 '" 136
NOCASQS:
Vacunados: 1.920 0,5 '" 960
Placebo:
95
Figura 3.4. &Ieccion del 80% del total de casas y 50% de no casas en UII cstudio de
casos Y cOlltroles procedente de la poblacioll que se estudia y que se muestra en la Tabla
3.4. La composicion esperada se supolle que 110 tiene variabilidad aleatoria.
Fllellle: Datos tornados de R Sdtscr.?E SartwelL and JA Bell. A Controlled Test of Asian Influen-
za Vaccine in a Population of families. AmericwI iOllrllai of flygielle. Vol. 75. 1 t2- 135.1!::1 1962.
En el ejemplo de las reacciones locales a la vacunaci6n (Tablas 3.4), un esludio de
casas y comroles podrfa haberse II cvado adelante incluyendo, por ejemplo, el 80% de
los casos que tuvieron tales reacciones y e150% de los controles. Partiendo de que no
hay variabilidad aleatoria. los datos que se hubieran obtenido serfan los que se regis-
tran en la Figura 3.4 Y se muestran en la Tabla 3.7. N6tese que el invest igador selec-
ciona casos por una parte y no casas por o[ra, y espera que las fracciones de mues[reo
con que 10 hace afccten por igual tanto a expuestos (vacunados) como a no expueslos
(no vacunados). Es de esperar que este patron se verifi que tamo para los casos como
para los no casos. Los result ados son, de nuevo, idemicos a los que se vieron en la
poblacion [o[al, en los cuales el (vcrdadero) odds ratio es 4,46:


136
ORoxp= = 4,46 = OR,of
, 960 )
( 1.1 20
EI hecho de que el ORe..
p
sea identico al OR
ool
explica por que la interpretacion
del odds ratio en los est udios de casos y comroles es prospectiva . As\, en el ejem-
plo basado en la estrategia de casos y comroles, (y suponiendo que el est udio es
insesgado y esla li bre de confusion), la interpretaci6n de los resultados es que para
individuos que recibieron la vacuna, el odds de desarroll ar reacciones locales es 4.46
veces mayor que el de aquell os que recibieron placebo.
96 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 3.7
Estudio de casos y controlcs sobre la rclacion entre ocurrcncia de rcacci{m local
e inlllunizacion previa contra innuenza
Vacunacl6n
Sf
No
Total
Casos con reaccion local
5:<0
136
820 x O,B ,,656
Controles sin reaccl6n local
960
1.120
4160 x 0,5 ,,2.080
NortE 8ocodo <>n uM muM!,,, pcrf<>ei3monto reprMcnt<tliv3 dol 80% do 100 ""Me y 0 1 60% do 100 control,," dol
estudio poblacional mos\raoo en la Tabla 3.4 (vease Rgura 3.4) .
Fuente: Datos 1ornados de R Seltser, PE Sartwell , aoo JA Bell. A Controlled Test of Asian Influenza Vacci ne in a
Population ollamili es, American Journal of Hygiene Vol. 75, 112135 1Cl1962.
Eluso de 1a raz6n de Odds
oxp
para los casas dividida par 1a de los controles,
se recomienda enfaticamente como el primer paso para el calculo de los OR
oxp
antes
que acudir a la razon de producws cruzados, de suene que se evite la confusi6n
sobre confi guraciones diferentes de las tablas, como, par ejemplo, cuando se ubican
los datos de los controles a la izquierda y los de los casas a la derecha:
E\posiciO/l
Sf
No
Commies
a>,
c
Casos
En este ejemplo. la aplicacion mednica de la raz6n de productos cruzados,
(a x d)/(b x c), produce una est imacion de l o d d . ~ ratio que es la inversa del verda-
dero Ol /dS ratio. Por otra pane, al dividir el odds de exposicion para los casos por
el que corresponde a los controles, produce el Ol/dS ratio correcto, (blt/)/(alc).
Odds ratio en esllldios de casos Y colltroles emparejados
En un estudio de casos y controles emparejados en el cual la razon entre el numero
de controles y casos sea I: I , un estimador insesgado del odds ratio se obtiene
mediante la division del numero de pares en los que el caso, pero no el control con el
que esta emparejado, esta expuesto (casoL+I, control 1- ]), entre el numero de pares
en los que el control esta expuesto pero no aSI el casa, (casol - 1. control I +J). La 16gi-
ca intuitiva que subyace as! como un ejemplo de tal enfoque se discu{en en el Capl-
{u lo 7, Seccion 7.3.3.
Odds ratio como una estimadon del riesgo reiatil'o: eI s"p"esto de baja prevalenda
En un eSllldio de casos y controles,el empleo del odds ratio para estimare! riesgo rei a-
!ivo se basa en el supuesto de que la enfermedad que se est udia tenga una incidencia
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 97
baja, de manera que se produce un pequeno se.\go inherente (Ecuad6n 3.3), como ya
fue discmido oportunamente (Secd6n 3.2.1 ). Cuando la incidenda de la enfennedad
es alta, eSle sesgo puede ser sustancial, tal y como se puso de manifiesto en el ejemplo
de la re1adon entre la vacunad6n contra la infl uenza y las reacciones locales.
Al igual que en los estudios prmpectivos (vease Secci6n 3.2. 1), el supuesto de que
la enfennedad es rara (escasamente prevalente) solo procede en sit uadones en las que
el odds ratio se ell/plea para estimar el riesgo relativo. Cuando el OlJd.\ ratio se usa
como medida de asociad6n sin mas, tal supuesto es obviamente innecesario. Ademas,
tal supuesto tampoco procede en situaciones en las que el gmpo control es una muestra
de la poblad6n tOlal(IO) , estrategia regularmente empleada en los estudios de casos y
controles dentro de una cohorte definida (Capit ulo I , Secd6n 1.4.2) .
La irrelevancia del supuesto de baja prevalenda cuando los controles confonnan
una muestra de la pobladon de referenda puede ser demostrada mediante compara-
don de los dlculos de los OlJdS ratios que se deri van al emplear diferentes tipos de
grupos control. En 10 que condeme a la tabulacion cruzada que incl uye todos los
casos y todos los no casos en una poblaci6n definida como la de la Tabla 3.8, cuando
los no casos se emplean como grupos control, como ya se vio (Ec uacion 3.2) el
OR ..
p
se emplea para est imar el OR
enf
dividiendo los Odds"p entre los casos por
dicho odd,\ en los controles:
a

c
ORexp = = - = ORen!
Oddsoxpcootroios b
"
Otra posibilidad es emplear el total de la poblaci6n est udiada al comienzo como
grupo control en lugar de circ unscri birse a los no casos. Si tal estrategia se emplea
en el contexto de un es(udio de cohorte, el est udio de casos y controles es entonces
denominado un estlldio de caso-co/wrte (Capitulo I , Secci6n 1.4.2), y la divisi6n del
Odds
up
para los casos entre el Odds" p para los controles (poblaci6n total) da lugar al
riesgo relat ivo:
I Ecuaci6n 3. 13 J
(-;;S;-)
RR
(
G+b)
c + (/
C:" )
Tabla 3.8
Tabulacioll cruzada de una pohlacion dcfillida segull exposicioll y desarrollo de
la enfermcdad
Exposlclon Casos No casos
Totat pobtaclon
(Casos + No casos)
Presente
,
b Hb
Ausente
,
d ,.d
98 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Ut ili zando nucvamente el ejempl o de la investigacion sabre vacunaci6n contra la
infl uenza y reacciones locales (Tabla 3.4) puede verse que un estudio de casos-
cohortc pudiera lI evarse adelante usando IOOos los casas y toda la poblaci6n en est u-
dio, esta en cali dad de grupo control. La raz6n del oddJ' de los expuestos para los
casas (Odds
oxp o
..,.) entre los odds de los expuestos en la poblaci6n {Olal bajo est udio
(Oddsnpf>Ob) produce el riesgo relativo:
170
Odds
expc
.....
Ods "ppoob
(
~ )
(
650 )
2.570 q
= -+ =3,59=RR
(
2.570 )
2 .410
(
170) q-
2.410
donde q+ es la incidencia entre expucslOs y q_ la incidencia entre no expucs(Os .
En esta estimaci6n del riesgo relativo todos los casas y el total de la poblaci6n
han sido incluidos . Sin embargo, puesto que las est imaciones insesgadas de
Odds
eJI pc
."" y de Odds<xppo/> nos proveen de un estimador insesgado del riesgo relat i-
YO, en un est udio casos-cohorte pueden ser comparadas una muestra de casos y una
muestra de la poblaci6n total. Por ejemplo, suponiendo que no hay variabilidad alea-
toria, muestras insesgadas del 40% de los casos y del 20% de la poblaci6n total pro-
ducirlan los resul tados contenidos en la Tabla 3.9; puede demostrarse que el produc-
to de la divisi6n del Odds ..
p
caso< entre el Odds" p po/> es identieo al riesgo relativo
obtenido prospectivamente para la cohorte completa, tal y como se muestra a cont i-
nuaci6n:
260
6'
OR" p= -- = 3,59 = RR
5 14
4'2
Tabla 3.9
Estudios de casos cohortes de la relacioll de yacunacioll previa y reacci on local
Vacunaci 6n previa
sr
No
Total
Casas de reaccion local
260
68
328
Muestra de cohorte
514
482
996
Nota: 8asado en una mueSlra aleatoria del estldio de poblacoo de la Tabla 3,4. con fracciones de mues\reo del
40% para los casos y del 20% para la cohorte.
Fuente: Datos \omados de R SeHser, PE Sartv,ell, ar.d JA Bell. A Controlled Tes\ of Asian Influenza Vaccine in a
Population of families, American Journal of Hygiene, Vol. 75, 1I2 135,itl 1962,
Nuevamente, en virtud del pequeno numero de casos en relaci6n al tamano
poblacional, 10 mas comun es que los estudios casos-cohorte procuren incl uir todos
los casos y una muestra de la poblacion de referencia.
Una de las ventajas del enfoctue casos-cohorte radiea en que este pennite una
estimaci6n directa del riesgo relativo, de manera que no hay que depender del
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 99
supuesto de baja prevalencia. Otra ventaja estriba en que, puesto que el grupo con-
[rol es una mues[ra de la poblacion de referencia, puede ob[enerse una est imaci6n
sin sesgo de la prevalencia de la exposici6n (0 de la distribucion de esta), necesaria
para la estimacion del RApob de Levin (Ecuaci6n 3.10). Un gmpo control formado
por una muestra insesgada de la cohort e (ambien permite la evaluaci6n de relaciones
entre diferentes niveles de exposici6n, e incl uso entre dichos niveles y o[ros desenla-
ces diferentes al que inic ialmente interesaba.
Ademas, hay ocasiones en las que la excl usion de casos del grupo control es diff-
ci l desde el punto de vista logfstieo y puede incrementar los costos. asf como el ago-
bio de los part ici pantes . Por ejemplo, en enfennedades con una alt a proporci6n de
sujetos en fase subclfnica (por ejemplo, colecistitis cr6niea 0 cancer de pr6stata), la
excl usi6n de casos de un conj unto de controles elegibles (por ejemplo. individuos
aparentemente saludables) requeri rfa la apl icaci6n de examenes mas 0 menos invasi-
vos (por ejempl o, rayos X contrastados, examen rectal) . As!, en estos ejemplos, un
enfoque de casos-cohorte pudiera ser oportuno: seleccionar controles de la pobla-
cion general independientemente de (es decir, ignorando) la posible presencia de la
enfermedad (clfnica 0 subclfnica) .
En tenninos generales, sin embargo, solo es apropiado lIevar adelante un est udio de
casos-cohorte cuando puede identificarse una poblaci6n definida de la cual tomar
casos, como cuando se opera con una cohone definida en el contexto de un estudio
prospectivo. Por o[ra parte, el desarroll o de est udios de casos-cohorte cuando se opera
con cohortes abiertas 0 poblaciones completas exige la suposici6n de que ell os
representan las poblaciones fuente de las cuales los casos proceden (Capft ulo I , Sec-
cion 1.4.2).
Debe enfat izarse que, cuando la enfermedad tiene baja prevalencia, la estrategia
de ignorar la situaci6n vigente en relaci6n con la enfennedad cuando se seleccionan
controles producirfa con (oda probabilidad unos pocos casos, a 10 sumo, incluidos en
el gmpo control: asf, en la practiea, la Ec uacion 3.1 3 sera casi identica a la 3.12 por-
que (a+b) ... b y (c+d) ... d. Por ejemplo, en el caso del infarto de miocardio y la
hipertensi6n que se expuso en la Tabla 3.3, la estrategia de caso-cohorte (seleccio-
nar una muestra del 50% de los casos y del 10% de los controles) darfa lugar al
siguiente est imado del odds ratio:
Odds "pCOk (*)
ORoxp = =
Odds "FOOC''''' ( 1.000)
1.000
= 6,00= RR
En este mismo ejemplo, una estrategia casos-no casos producirfa la siguiente
estimaci6n:
-,:O"d"d =,:::"
OR "p
Odds <xp '" coso.
(*)
= 6,09 = OR 'nf
)
En otras palabras, esta situacion es analoga a la que se discmi6 en la Secci6n
3.2. 1 en relaci6n con la simili tud de los odds ratio y el riesgo relativo cuando la
enfermedad es poco prevalente.
]00 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tambien result a uti! notar que, afortunadameme para nosotros (como epidemi6-
logos y como seres humanos en ri esgo), la mayorfa de los desenlaces morbosos son
relativamente poco frecuentes . Los desenlaces comunes (por ejempl o, con frecuen-
cias del 10% 0 mayores) se producen en ensayos cl fnicos, tales como el de las reac-
ciones a las vacunas antes descritQ, 0 en est udios clfnicos de pron6stico despues del
diagn6stico de cancer. Generalmente, para la mayorfa de las enfermedades, la inci-
dencia que arrojan los est udios basados en la poblaci6n no supera el 5%. En estos
ejemplos, como ya se discut i6, el olids ratio es a menudo una buena aproximaci6n
del riesgo relat ivo. De ello se deriva desde el punto de vista de la medici6n de la aso-
ciacion, que la estrategia de caso-cohorte es pr:kticamente equi valente a la de reali -
zar est udios tradicionales de casos y controles en los que los controles son no casos.
Influencia del marco muestral para la seleccioll de cOlltroles sabre la estilllacion
de parallletros mediallte el odds ratio de fa exposicion: incidencia aClllllulada
frent e a densidad de illcidencia
Ademas de considerar si los controles se seleccionan de entre los no casos 0 de la
poblaci6n bajo estudio, es importante especifi car el marco muestral para la selecci6n
de controles. Tal y como se discmi6 en el Capitulo I (Seccion 1.4.2), cuando se
eslan seleccionando conlroles de una cohorte defi nida, los marcos de mueslreo pue-
den consisl ir en: (I) la cohorte de partida 0 (2) sujetos en riesgo cuando los casos
ocurren duranle el periodo de seguimienlo (muestreo por dens idad) . La pri mera
alt ernativa (ejemplifi cada mediante el anal isis del estudio de la vacunacion contra la
infl uenza y las reacciones locales) ha sido designada como disel10 cm'o-eohorte y la
segunda como disefio de em'os y controleJ" unidado
ll l
). Como se demueslra de inme-
diato. los disefios de caso-cohorte y anidado permit en la esri maci6n del riesgo relal i-
vo y de la raz6n de lasas. respecl ivamenle. Una manera inl uitiva de concepluali zar
cual de esos dos parametros esta siendo estimado por el OR.,'P (ej ., ri esgo relal ivo 0
raz6n de tasas) es concebir a los casos como el numeradon) y los controles como el
denominadon, de la medida absoluta de la frecuencia de la enfermedad con la cual
los parametros se relacionan (vease el Capit ulo 2) .
Selecci6n de contlVle.\" de una cO/lOrte al comienzo de .I'll observuci6n: EI disel10 de
C(wH"Ohorte . Como ya se describio (Secci6n 1.4.2), cuando se emplea el disefio de
caso-cohorte, el grupo de casos se compone de casos identificados duranle el periodo de
seguimienlo, y los conlroles integran una muesl ra de la cohorte en el momento inicial
(Figura 1.20) . Los casos y el marco mucslral para los controlcs puedcn ser considcrados,
respeclivamenle, como el lipo de numerador y de denominadorque hubieran sido seiec-
cionados para calcul ar una probabilidad basada en la poblac i6n inicial, q. Asf. cuando se
eslan seieccionando eslos controles, el OR."p produce una rawn de la probabilidad para
expues(Os (q+) entre la que rige para no expuestos (q_): eslo es, la raz6n de incidencias
ac umuladas 0 el riesgo relat ivo. Pueslo que la distribuci6n de los liempos de seguimien-
to en la muestra de la cohorte inicial - que. por definicion. incl uye aquellos que no se
han perdido as! como los que habran de perderse mas adeiante durante ei seguimiemo-
sera diferenle de la distri bud6n de los casos (cuyo conj unto de riesgo' por definicion
Definido como el subconjunlo de los miembros de la cohorte bajo observaci6n en el momento
en que ocurre cada caso (vease secci6n 1.4.2, Figurd 1.21).
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 101
no incl uye perdidas antenores), es necesario corregir por perdidas que oc urren durante
el seguimiento en un esmdio caso-cohorte usando tecnicas de analisis de supervivencia
(vease Secci6n 2.2.1 ) .
Es tambien posible excluir casos del gmpo control cuando se tDma la muestra de
la cohone en el momento inicial: esto es, el marco muestral para los controles estarfa
conformado por individuos que se han mantenido li bres de la enfennedad a 10 largo
del seguimiento. Estas son las personas que hubieran sido elegidas como el denomi-
nador de los odds ba.wdos en la poblacion inicia/:
( ~ )
As!, el c6mputo del OR
np
cuando se aplica esta estrategia produce una est ima-
d6n del OR.
nf
, comparando el odds de desarrollar la enfermedad durante el segui -
miento entre los expuestos y los no expuestos al comienzo de la observaci6n .
Muestreo de densidad: diseiio anidado de caJos y commies . EI disefio anidado
de casos y controles se basa en muestreo de densidad de inddencia y tambien se des-
cri be en el Capitulo I (Secd6n 1.4.2) . Consiste en seleccionar un gmpo control que
represente la suma de las submuestras de la cohort e seleccionada durante el segui -
miento en los momentos aproximados en que los casos oc urren (conjunto de riesgo)
(Figura 1.21) . Estos controles pueden tambien ser considerados como una muestra
promedio de la poblad6n sobre todos los instantes en que oc urren los eventos
(vease el CapItulo 2, Secd6n 2.2.2) . Por 10 tanto, el OR"p aSI obtenido estima la
raz6n de tasas 0 la raz6n de densidad (0 tasa relat iva 0 densidad relativa) . Esta estra-
legia reconoce de manera explfcita que hay perdidas (observadones censuradas)
durante el seguimiento de la cohorte, en que los casos y los controles se eligen de las
poblaciones de referenda excluyendo las perdidas previas, emparejando aSI casos y
controles a 10 largo del seguimiento. Cuando los casos se excl uyen del marco mues-
Iral de los controles, el ORexp estima el odds ratio de densidad.
Un resumen de los efectos del marco muestral especffico para la selecci6n de
controles sobre el parametro estimado por el OR" p se muestra en la Tabla 3.10.
Tabla 3.10
Resumcn dc la innuenci a de la sclcccion dc controi cs sobre cI panimctro estimado
por el odds ratio de la exposicion en estudios dc casos y controles dentro de
una cohorte definida
Di seno
Caso-cohorte
Caso-controt anidado
Marco pobiaclonai para
ta seiecclon de controtes
Cohorte total al comienzo
(Cohorte total al comienzo
menos los suetos que se
convierten en casos durante
el seguimient()j
Poblaci6n en los momenlos en
que aproximadamente acunen
los casos durante el seguimiento
(Poblaci6n durante el seguimienlo
menos los casos)
Lo que estima et odds ratio
de la exposlclon
Raz6n de incidencias acumuladas
(riesgo relalivo)
(Odds ralio probabilistico)
Raz6n de tasas (de densidad)
(Odds ralio de densidad)
102 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Calculo del odds ratio wando hay mas de dos categorfas de exposici6n
Aunque los ejemplos que se han dado hasta ahora en este capit ulo se circunscriben a
solo dos categorfas de exposicion, con frecuencia hay mas de dos niveles de exposi-
ci6n que deben ser evaluados. Entre las vemajas de estudiar multiples categorfas de
exposici6n se halla la posibilidad de contemplar diferemes dimensiones de exposi-
ci6n (<<pasado [rente a aema! ) asf como patrones de gradiente <dosis-respuesta).
En el ejemplo que se muestra en la Tabla 3. 11 , los ninos con craneosinostosis que
son objetos de lIna craneostomfa. fueron comparados con ninos normales en relaci6n
con 1a edad matema(l2) . Para calcular el odds ratio para cada una de las diferentes
categorfas de edad materna, la edad materna mas joven fue elegida como categorfa
de referenda. Consecuentemente, para casos y controles separadamente, fue cal-
cui ado el odd.\ para cada categorfa de edad materna (respecto, en cada caso, de la
categorfa de referenda) (columnas 4 y 5). EI odd.\ ratio se calcula como la raz6n del
odd,\ de cada categorfa de edad materna en casos respec(O del odds en controles
(columna 6) . En este estudio se observ6 una relad6n credente (posit iva 0 directa)
entre la edad materna y el odds de craneosinostosis.
Cuando la exposid6n de la variable multini vel es ordinal (por ejemplo, categorfa
de edad en la Tabla 3.11 ), puede ser de interes aplicar una prueba de tendenda (vea-
se Apendice B).
3.4.2. Riesgo atribuible en estudios de casos y controles
Como fue advertido previamente (Secd6n 3.2.2), puede obtenerse el ri esgo atribui -
ble porcent ual para los expuestos en los estudios de casos y controles (casos - no
casos) siempre que el odds ratio sea un esti mador razonable del ri esgo relativo
mediante el reemplazo de su correspondiente valor en la Ecuad6n 3.6:
Edad
materna
(ai'ios)
(1 )
<20'
20-24
25-29
>29
Tabla 3.11
Distribuci6n de CllSOS de cmneosinostosis y controles normllies
con acuerdo a edad nmterml
Oddsdeedad Odds de edad
materna materna
especilicada especilicada
Irente a frente a
la de referencla la de referencla
Casos Controles entre casos entre controles Odds ratio
(2) (3) (4) (5) (6) " (4Y( S)
12 89 12112 89/89 1,00'
47 242 47/12 242/89 1,44
'"
255 56/12 255/89 1,63
58 173 58/12 173/89 2,49
. Categoria de referencia.
Fuente: Datos tomados de BW Aldeman ef a/ .. An Epidemiologic SILJC1y of Craniosynostosis: Risk Indicators lor
the Occurrence 01 Craniosyoostosis in Colorado, American Journal of Epidemiology, Vol. 128, 431 -438, 1Cl 1988, The
Johns Hopkins University Schoof 01 Hygiene & Public Health.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 103
I Ecuacion 3. 14J
(
OR- I,D)
%RA .. p = OR x 100
En estudios que conciernen a intervenci6n prevemiva, la medida anaJoga al
%RA.,xp es la eficacia (vease Secd6n 3.2.2, Ecuacion 3.7) . EI hecho de que el odds
ratio sea usual mente una buena estimacion del riesgo relativo hace posible el
empleo de la Ecuaci6n 3.14 en los est udios de casos y controles de la eficacia de una
intervencion tal como un cribadd
ll
).
EI mismo razonamiento vale para el uso de los est udios de los casos y controles
con la finali dad de estimar el riesgo atribuible poblacional empleando una variaci6n
de la formu la de Levin:
I Ecuacion 3. 15 J
b x (OR - I ,O)
% RAI'ub = -,---"-',:..c:=--"=.,-,-
h x (OR - 1,0) + 1,0
En la Ecuaci6n 3.1 5 la proporci6n de sujetos expuestos en la pobladon de
referenda, h, puede ser est imada mediante la prevalenda de exposicion entre con-
troles en la medida que la enfermedad sea poco frec uente y el gmpo de control sea
razonablemente representativo de todos los no casos en la poblad6n( Il). Obviamente,
si se tratara de un estudio de casa-cohorte, el supuesto de baja prevalenda no es
necesario (Secd6n 3.4.1 ), puesto que tanto el ri esgo relat ivo como la prevalencia de
exposid6n pueden ser estimados de manera directa.
Tal y como mostraron Levin y Bertell(l 4). si el odds ratio se emplea como una esti-
maci6n del riesgo relat ivo, la Ecuacion 3. 15 se reduce a otra mas simple:
m R" _ b o.",- b eoo'
'v ...... pob -
I ,D - h e,,",
Donde boo<., representa la prevalencia de la exposicion entre los casos - que es
a/(a + c) en la Tabla 3.8- y b
eon
, representa la prevalenda de exposicion entre los
controles, que es b/(b + d) en la propia Tabla 3.8.
35, EVALVACION DE LA FVERZA DE LAS ASOCIACIONES
Los valores de las medidas de asodacion di scutidas en este capitulo son con fre-
cuencia empleados para establecer jerarqufas en la importancia relativa de los fac-
tores de riesgo. Sin embargo, puesto que los factores de riesgo varian en fundon de
su modus operandi fisiol6gico, asf como en cuanto a sus niveles de exposici6n y
unidades, tales comparaciones no son procedentes . Reparese, por ejemplo, en 10
absurdo que seria dedr que la tension arterial sistolica es un factor de riesgo mas
importante a los efectos del infarta de miocardio que cI colesterol total , basado en
la comparacion del odds ratio asociado con un incremento de 50 mm Hg en la ten-
sion arterial sist61ica con aque! correspondiente a un mg/dl de incremento en el
104 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
colesterol serico total. Ademas, al margen del (amana de las unidades empleadas,
es difki l comparar las fuerzas de asociaci6n, dada la naturaleza unica de los dife-
fentes factores de riesgo.
Una manera alt ernativa de evaluar la fucrza de la asociaci6n de un factor de ri cs-
go dado con un desenlace consiste en estimar la intcnsidad de la exposici6n necesa-
ria para que el factor produzca lIna asociaci6n de la misma magnitud a la de cicrtos
factores de riesgo bien establecidos 0 viceversa. Por ejemplo, en un estudio reciente
Tverdal et U/.(IS) evaluaron el nivel de exposicion de cuatro factores de ri esgo bien
conocidos para la mortalidad por enfennedad coronaria necesarios para replicar el
riesgo relat ivo de 2,2 asociado con un consumo de cafe de nueve 0 mas tazas diarias.
Como se ve en el Esquema 3. 1, un riesgo relativo de 2,2 corresponde a un consumo
de tabaco de 4,3 cigarrillos diarios 0 a tener un incremento de la tension arterial sis-
161ica de alrededor de 6,9 mm Hg, y asf sucesivamente.
E ~ q u e m a 3.1
Una posiblc mancra de describir la fuerza de uua asociacion
entre un factor de ricsgo y un dcscnlacc
Un riesgo relativo de 2,2 para mortalidad pot concepto de enlermedad coronaria comparando hom-
bres que beben 9 0 mas tazas de cafe diarias Irente a menos de una taza diaria corresponde a:
Consumo de tabaco
Tensi6n arterial sist61ica
Colesterol serico total
Lipoproteina de alta densidad sarica
4,3 cigarrillos diarios
6,9 mm Hg
0,47 mmoVL
- 0,24 mmollL
Fuente: Datos provenientes de A Tverdal et al. , Coffee Consumption and Death from Coronary Heart Disease in
MtCldleAged Norwegtan Men and women, Brlfj5f1MediCal Journal, vo!. 300, 566-569, <l:> 1990.
GIro ejemplo procede de un estudio reali zado por Howard ef atJlb) , qui enes eva-
luaron la asociaci6n transversal entre habito pasivo de fumar y arteroesderosis sub-
cifnica detenninada por el grosor de las arterias coronarias (capas fnt ima y media)
medidas por ult rasonido modo- B. Puesto que el habiw pasivo de fumar aun no
habfa sido estudiado previamente en conexion con aleroscierosis directamente
visuali zada, su importancia como un factor de riesgo fue contrastada con la edad
como un detenninante conocido de la aterosderosis. (Esquema 3.2). Tal y como se
ve en el esquema, la asociacion transversal entre el habito pasivo de hlmar y la at e-
rosd erosis es equivalente a una diferencia de edad de un ano. Esto es. suponiendo
que la asociaci6n transversal representa adec uada mente a la re laci on prospect iva
entre la edad y la ateroscierosis, y que los datos son validos, precisos, y li bres de
confusi6n, el grosor medio de la arteria carotida de los fumadores pasivos parece
coincidi r con el que exhiben los que nunca fueron fumadores pero que son un ano
mas viejos. Esla inferencia fue extendida por Kawachi y Colditz(l7) qui enes, sobre
la base de los datos del estudio de Howard et ut., estimaron que el cambio en el gro-
sor de la pared relacionado con consumo pasivo de tabaco result arfa en un aumento
en el riesgo de eventos cifnicos cardiovasc ulares equiva lente a un incremento de 7
mm Hg de tension arteri al sist6lica, 0 0,7 mmollL de colesterol tota l - ci fras nada
desprec iables.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE 105
Esquema 3.2
Valor medio (en mm) del grosor determinado por cortes transversales
de la pared (media mas intima) de las arterias car6tidas en individuos fumadores
pasivos que nunca fueron fumadores activos, estudio ARIe, 1987 a 1989
ITM Media (mm) -
$ituaci6n como lumadores
pasivos de sujetos que nunca
lueron lumadores aclivos
Ausente
(n; t ,774)
0.70)
Presente
(n;3,358)
0,711
Incremento eSlimado
por cada ana de edad
0.011
Equivalente de edad en exceso que puede alribuirse a sar un fumador pasivo:
(0.7" - 0,700)/0,0";' ana.
Fuente; Datos tomados de G Howard et al., Active and Passive Smoking Ate Associated with Increased Caro-
tid Wall Thickness. The Atherosclerosis Risk il Study, Archives of International Medicine, Vol. 154.
1277'1282, ClI994, American Medical Association.
BIBLIOGRAFIA
I. Lilienfeld DE. Stolley PD. FOllndmions of epidemiology. 3rd ed. New York. NY: Oxford
University Press: 1994.
2. Gordi s L. Epidemiology. Philadelphia, WB Saunders: 1996.
3. Seltser R. Sartwell PE. Bell JA. A controlled test of Asian influenza vaccine in a popula-
tion of families. Am J Hyg 1962: 75: 112-135.
4. Greenland S. Robins 1M. Conceptual problems in the definition and interpretation of
attributable fractions. Am J Epidemiol 1988: 128: 1185-119 7.
5. Rothman K1 . Greenland S. Modem epidemiology. 2: ed. Philadelphia. Lippincott-Raven
Publishers: 1998.
6. Levin ML. The occurrence of lung cancer in man. ACf{/ Un Intem Cancer 1953: 9:
531-541.
7. Walter SD. The estimation and interpretation of attributable fraction in health research.
Biometrics 1976:32: 829-849.
8. Rockhill B. Newman B. Weinberg C. Use and misuse of popUlation attributable frac-
tions.Am J PI/blic Health 1998: 88: 15-19.
9. Cornfield J . A method of estimating comparable rates from clinical data: applications to
cancer of the lung, breast. and cervix. J Natl Cancer Inst 1951: II: 1269-1275.
10. Prentice RL. A case-cohort design for epidemiologic cohort studies and disease preven-
tion trials. Biometrika 1986: 73: I-II.
11. Langholz B. Thomas DC. Nested case-control and case-cohort methods of sampling
from a cohort: a critical comparison. Am J Epidemiol 1990: 131: 169-176.
12. Alderman BW. Lammer EI . Joshua SC et al. An epidemiologic study of craniosynosto-
sis: risk indicators for the occurrence of craniosynostosis in Colorado. Alii J Epidellliol
1988: 128: 431-438.
13. Coughlin SS. Benichou J . Weed DL. Attributable risk estimation in case-control studies.
Epidellliol Rev 1994: 16:51- 64.
14. Levin ML. Bertell SR. Re: Simple estimation of population attributable risk from
case-control studies. Alii J Epidellliol 1978: 108: 78-79.
15. Tverdal A. Stensvold 1. Solvoll K et al. Coffee consumption and death from coronary
heart disease in middle aged Norwegian men and women. BrMed J. 1990: 300: 566-569.
106 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
16. Howard G. Burke GL. Szklo M el al. Active and passive smoking are associated with
increased carotid wall thickness: the Atherosclerosis Ri sk in Communities study. Arch
In/ern Med 1994: 154: 1277- 1282.
17. Kawachi I. Colditz GA. Confounding. measurement error. and publication bias in studies
of passive smoking. Alii J Epidemiol1996: 144: 909-915.
PARTE III
AMENAZAS A LA VALIDEZ
Y PROBLEMAS
DE INTERPRETACION
CAPITULO 4
Fa/ta de validez: Sesgo
4.1. GENERALlDADES
El .\'C.\'g0 pucde definirse como el resuitado de un error .\"istelluirico en el disefio 0 la
conducci6n de un estudio. Este error sistematico se deriva de deficiendas en el meto-
do de selecci6n de los participantes del estudio 0 en los procedimientos de recogida
de la infonnaci6n relevante sobre la exposicion 0 la enfermedad; como consecuencia,
los resul tados observados del estudio tiel/den a ser dife rentes de los resultados verda-
deros. Es a tal tendellcia hacia resultados erroneos a 10 que se ll ama genericamente
sesgo. Como se disclitira en eslc capitulo, muchos tipos de sesgos pueden afectar a
los result ados del estudio. EI sesgo, junto con la confusi6n (vease Capit ulo 5) merece
consideraci6n detenida y suel e constituir un problema de gran entidad en los eSUldios
epidemiologicos observacionales. EI error sistematico (sesgo) debe distinguirse del
error debido a variabilidad aleatoria (error de muestreo), el cual es inherente al hecho
de que se hace una extrapolaci6n: por conducto de una muestra se estiman parame-
tros de la poblacion de referencia. Tales estimaciones procedentes de la muestra pue-
den diferi r sustancialmente de los parametros verdaderos debido al error aleatorio,
especialmente cuando la muestra con que se opera es pequefia.
N6tese que la definic i6n de sesgo se relaci ona con el proceso - es decir, con el
disefio y los procedimientos - del estudio. y no con los result ados de estudio part i-
cular al guno. Si el disefio y los procedimientos de un estudio son insesgados, el estu-
dio se considera valida porque sus result ados seran (en promedio) correctos . Un
disefio deficiente se cons idera sesgado (0 no valido) porque producira un resultado
err6neo en I'romedio; sin embargo, debido a la variabilidad muestral, un estudio que
uti lice metodos sesgados podrfa producir no obslante un result ado cercano a la
verdad (Figura 4.1) .
Se dice que existe sesgo cuando, en promufio, los resul tados de un numero infi-
nito de estudios (relacionados con una asociacion espedfica y una poblaci6n de
referencia) difi eren del verdadero resultado. Ese serfa el caso, por ejemplo, cuando
el promedio de los odds ratio procedentes de un numero grande (te6ricamente infi-
nito) de estudios de casos y controles fuera 2,0 a pesar de que en verdad no exista
asociaci6n (Figura 4.1 ). Esta definicion de sesgo, sin embargo, tiene escasa utilidad
para eI epi demiologo. quien debe inferir a partir de los resultados de un li nico est u-
dio. Aun cuando el epidemiologo lIeve a cabo una revision 0 un meta-anali sis, los
estudios publicados disponibles son solo una fracci6n de 10 que, bajo cualquier defi-
nici6n, puede considerarse un nli mero infinito de estudi os . (Un problema relacio-
nado es el sesgo de publicacion, - esto es, la tendencia a que sean publicados aq ue-
1I0s estudios cuyos resul tados han sido positivos; - puede verse en la Secci6n 4.5) .
110 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
-
Sesgo
VERDAD
Promedio de los resultados
Estudios con resultados
que se acercan a la verdad
Resultados de los estudios
Figura 4.1. Distribucion hipotCtica de result ados procedcntcs de un discno sesgado
El sesgo, por 10 tanto, debe serevaluado en el contexto de una considerac i6n cuidado-
sa del disefio espedfico del est udio. los metodos y los pmcedimiemos . La prevenci6n
y el control del sesgo se alcanzan en dos niveles: 1) asegurando que el disefio del
est udio sea apropiado para encarar las hip6tesis; y 2) estableciendo y vigilando cuida-
dosamente que los procedimientos de recolecci6n de los datos sean validos y confia-
bles. E.>;te ul timo lema se (rata en el Capitulo 8, destinado a discutir procedimientos
de control y aseguramiento de la cali dad en estudios epidemiologicos.
Muchos tipos de sesgos han sido descritos en la literatura epidemiol6gica (vease,
por ejemplo, SackeWI)). Sin embargo, la mayorfa de los sesgos relacionados con el
disefio y los procedimiemos de estudio pueden clasificarse en dos categorfas basi-
cas: de selecci6n y de informaci6n.
El sesgo de selecci6n se produce cuando los individuos tienen diferentes pro-
babilidades de ser incl ui dos en la muestra en dependencia de cuaJes sean sus
caracterfsticas relevames: es decir, la exposici6n y el desenlace de imeres. La
Figura 4.2 il ustra una sit uaci6n general donde los casos expuestos tienen mayor
probabilidad de ser seleccionados para el est udio que otras categorfas de indivi-
duos . Un ejemplo de este ti po de sesgos es el seJ'go de vigilancia medica, que
podrfa hallarse, por ejemplo, cuando se conduce un estudio de casos y controles
para examinar la re laci6n del uso de anticonceptivos orales con cualquier enferme-
dad que tenga un componente subclfnico imponante - tal como la diabetes . Debido
a que el uso de contraceptivos orales esta probablemente relacionado con una mayor
frecuencia de consult as mooicas, cualquier enfermedad subclfnica se diagnostica
con mayor probabilidad en estas mujeres que en otras. Consecuentemente, en un
esruciio en '1ue se comparen casos cic ci iahefes y confroles sin ci iahetes - , puci iera
observarse una asociaci6n espuria entre esta condicion y el uso de contraceptivos
orales. El efecto del sesgo de selecci6n sobre la direccion de la medida de asociaci6n
es, por supuesto, una funcion cuyas celdas en una tabla n x k (ej., una tabla 2 x 2 tal
como la most rada en la Figura 4.2) estan sujetas a una probabilidad espuriamente
mayor 0 menor, de selecci6n.
FALT .... DE VALIDEZ: SESGO
Poblacl6n de referencla
,- ------------,- -- -----------,
: Enfermos
: expuestos
: SanDs
: expueslos
muestra del estudlo
I II
Figura 4.2. Sesgo de scleccion: un grupo relevanle en la poblacion (casos expuestos en el
ejemplo) tiene una probabiJidad mas alia de eslar incluido en la muestra
EI sesgo de informacion resulta de una tendencia sistematica de los individuos
seleccionados para su inclusi6n en el esntdio de ser colocados erroneameme en Cafe-
gorfas diferentes de exposicion/desenlace, 10 que conduce a un error de clasijicacion.
EI ejemplo clasico de sesgo de informaci6n que engendra este tipo de errores es
el sesgo lie reel/erdo que acaece cuando la capacidad para recordar exposiciones
pasadas difiere en dependencia de que se trate de un caso 0 de un control. En el
ejemplo hipoletico i1ustrado en la Figura 4.3 los casos lienen una probabilidad mas
alta que los controles de consignar una exposicion pasada.
Poblacl6n de referencla
: ~ i e ~ ~ ~ ~ ----:- S ~ - ~ ~ ~ -------:
: expuestos : expuestos :
, ,
, ,
,- ----------- - -- ----------
, , ,
: Enfermos : Sanos ,
: no expueslos : no expueslos :
, : '
--------------'- -- -----------'
Casos ConlO!
,
E
I t I
j
I j
-- .
NE
muestra del estudio
Figura 4.3. Sesgo de mala cl asilicacion (informacion): se produce cieno grado de mala
clasificaci6n en la infomlaci6n sobre la exposici6n tanto en casos como en comroles. pero los
casos no expuestos en este ejemplo tienden a comunicar un grado de exposici6n pasada en
mayor medida que los comroles. E. expuestos: NE. no expuestos.
112 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
La que sigue es una discusi6n de los sesgos de infonnaci6n y de selecci6n mas
comunes que dis(Qrsionan las asociaciones entre exposici6n y desenlace en estudios
epidemiol6gicos observacionales. Inevitablemente, debido a que los diferentes tipos
de sesgos se solapan, cualquier intento de clasifi carlos entrana alguna duplicacion;
como puede advert irse f:kil mente, algunos ti pos de sesgos puedcn ser categori zados
como de J"e/eccion 0 lie informacion (0 de ambas maneras) . La clasifi caci6n de los
distintos tipos de sesgos que se examina en las secciones siguientes esla hccha, por
10 tanto, con propOs itos basicamente didacticos y bajo ningun concepto puede enten-
derse como una taxonomfa rfgida y mut uamente excl uyente.
4.2. SESGO DE SELECCION
EI sesgo de selecci6n ocurre cuando un error sistematico en la asignaci6n de los sujetos
- a la condicion de casos 0 de en los estudios de casos y controles,o a la con-
dic i6n de expuestos 0 no expuestos en los esmdios de cohorte- contribuye a distorsio-
nar nuestra apreciaci6n de la verdadera asoc iaci6n entre la exposici6n y el desenlace.
EI sesgo de selecci6n es a menudo denominado se.\-g0 Berhoniano, particul annente
cuando ocurre en los est udios de casos y comroles con paciemes hospi tali zados(2J).
Una representacion hi potetica del sesgo de seleccion en el contexto de un est udio
de casos y controles se observa en las Tablas de la 4.1 a la 4.4. Para faci li tar la com-
prensi6n, en elias se supone que la confusion esta auseme y que no hay ni variabili-
dad aleatori a ni sesgo de informacion (es decir, que no existe error de clasifi caci6n
ni en materia de exposicion ni en la condicion de caso 0 control, vease Seccion 4.3).
En la Tabla 4. 1 aparecen todos los casas verdaderos y los no casos verdaderos en
una poblacion de referencia de 10.000 sujetos incl uidos en un esmdio de casas y con-
{roles que evalua la relaci6n entre eI factor de riesgoA y la enfennedad Y. La Tabla 4. 1,
par tanto, muestra los verdaderos result ados que pueden ser ut ilizados como estan-
dar de oro para evaluar los result ados mostrados en las Tablas 4.2, 4.3 Y 4.4.
Tabla4.1
Esludio hipoletico de casas y conlrol es que ineluye lodos los casos Y lodos
los no casos de una poblacion definidaj se supone que no hay efcclo
Factor de rlesgo A
Presente
Ausenle
Total
Odds de exposici6n
Odds ratio
de confusion ni sesgo de informacion
Poblacl6n total
Casos
soo
SOO
1.000
500:500 '" 1 ,0:1 ,0

::4.0
(
1.800 )
7.200
No casos (controles)
1.600
7.200
9.000
1.600:7.200 e: 1,0:4.0
Nota: los resultaoos en esta tabla representan el .estiindar de contra el cual oomparar el resuHado de las
Tablas 4.2, 4.3. Y 4.4
FALT .... DE VALIDEZ: SESGO 113
Tabla 4.2
Estudio hipotetico de casos y controles conrormado por una muestra insesgada
del 50% de los casos y una muestra insesgada del 10% de los no casos procedentes
de la poblacion de rderencia que se muestra en la Tabla 4.1
Factor de rlesgo A
Presente
Ausenle
Tolal
Odds de exposicion
Odds ratio
Consecuencias
Muestra de la poblaclon
50% de los casos
250
250
1.000 x O.SO '" SOO
250:250" 1,0:1,0
( ~ )
10% de los no casos (controles)
18()
7211
9.000 >< 0,10 ,,900
180:720:: 1,0:4,0
-:=- :::4.0
(;: )
Odds de exposicion insesgado en casas y controles
Odds ralio insesgado
Tabla 4.3
Ejemplo de sesgo de selecciun al escuger los casus en un estudiu hipoteticu de casus
y contrules que incluye en III muestnl 1I1 50% de los casus y al 10% de los no CliSUS
de III pobiaciull de referencill que se muestra en III Tlibia 4.1
Factor de rlesgo A
Presente
Ausenle
Total
Odds de exposicion
Odds ratio
Consecuencias
Poblaclon total
Casos
500 x 0.60" ,,300
500 x 0.40" ,,200
1.000 x 0.50 '" 500
300:200 " 1,5:1,0
( ~ )
:::6.0
(
~ )
720
No casos (controles)
180
720
9.000 x 0, 10 ,,900
180:720:: 1,0:4,0
Odds de exposici6n sesgado en los casas
Odds de exposici6n insesgado en los controles
Odds ratio sesgado
Fracciones de muestreo diiereociales ajenas a la inleoci6n del invesligador y desconocidas para ill.
114 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 4.4
Ejcmplo del mismo nive! de sesgo de sclcccion ell 13 clcccioll de casos y controles
en un cst udio hipotCtico de casos y controles que illcluye ulla mucslra de 50%
de los casos y 10% de los 110 casos de la poblacioll que se mueslra en la Tlibia 4.1
Factor de rlesgo A
Presente
Ausenle
Total
Odds de exposici6n
Odds ratio
Consecuencias
Poblacl6n total
Casos
500 x 0,60' :0 300
500 x 0, 40' :0 200
1,000 x 0,50:0 500
300:200" 1 ,5:1,0
)
--==- :::4.0


655
No casos (controles)
1.800 x 0,136' '" 245
7.200 x 0,091' ,,655
9.000 >< 0, 10 ,,900
245:655" 1,0:2,67
Odds de exposici6n sesgado en igual grado
en casas y controles
Odds ratio insesgado
Las f,,,,,,,ion de rn"", I..c" 'on dcsconocida< para d in,''''l igador
En la Tabla 4.2 LI lia muestra del 50% de los casos y del 10% de los comroles se
selecciona de la poblac i6n {otal mostrada en la Tabla 4.1 . Una muestra insesgada tal
como eSla produce oddJ' de exposici6n insesgados en los casos y controles y, por
ende, tambien un odd.\ ratio insesgado. (EI uso de una fracci6n mayor de muestreo
para los casos que para los comroles en la Tabla 4.2 es IlpieO de muchos estudios de
casos y controles para los cuales se dispone de una fuente limitada de casos (vease el
Capitulo 3, Seccion 3.4.1 ). Sin embargo, a medida que la fracci6n de muestreo dell-
tro del grupo de casos y dentro del grupo de control es no eSla afeclada por la exposi-
cion, no se presenta sesgo de selecci6n.
En contraste con los enfoques que producen estimadores insesgados como los de
las Tablas 4.1 y 4.2, la Tabla 4.3 recoge un ejemplo de sesgo de seleccion: sin que eI
inve.\tigador esre avizorado de ella, la selecci6n de casos, pero no la de controles,
esta sesgada porque varia de acuerdo al grado de exposiei6n. En el ejemplo hipotet i-
co incl ui do en la Tabla 4.3, el investi gador decide seleccionar el 50 % de los casos y
el 10 % de los controles, como en la Tabla 4.2. Sin embargo, la selecci6n de casos no
es independiente del grado de exposici6n . Como consecuencia, aun cuando la frac-
cion de muestreo total para los casos es 50%, a los casos expuestos se aplica una
fracci6n de muestreo mayor que a los casos no expuestos, 10 que sesga el odd.\ de
en casos pem no en contmles, 10 clla l proo llce lin nrirh I'fII;n
gado. Es importame enfati zar que la diferencia en la fracci6n de muestreo de acuer-
do al nivel de exposiei6n en los casos no es una decisi6n deli berada del invest igador,
qui en ti ene la impresi6n de que tanto los casos expuestos como los no expuestos
estan sujetos a la misma fraccion de mueslreo preeslablecida de 50% aplicada a la
fuente total de casos. Los ejemplos mostrados en las Tablas 4.1 ala 4.3 se apliean en
FALT .... DE VALIDEZ: SESGO 115
una situad6n hi potetica en la cual existe una Usta de la pobladon de referenda defini-
da de la que seleccionara los casos y los no casos. A menudo tales listas no estan dis-
ponibles y por tanto los epidemi61ogos ut ilizan muestras convenientes de casos y con-
troles, 10 que da lugar a que la ocurrencia de sesgo de seleccion sea aun mas probable.
Un ejemplo hi potetico de sesgo de selecci6n es un est udio de anemia aplastica en
el cual los casos proceden de un hospital de referencia y los controles son padentes
con des6rdenes no malignos, ni hcmatol6gicos, identificados en el mismo hospital.
Puesto que los pacientes con anemia aplastica pueden ser remitidos a menudo a este
hospi tal para un trasplante de medula 6sea. algunas de sus caracterfsticas dife ri ran
de las de los otros pacientes: por cjemplo, pueden ser mas propensos a provenir de
familias numerosas (ya que con frccuencia tienen un familiar donante geneticamen-
te pareado) y a poseer seguro de salud 0 una mejor situaci6n econ6mica que les per-
mite sufragar los considerables costos involucrados en este procedimiento. Como
result ado, las exposiciones relacionadas con el hecho de tener una familia grande y/o
un nivel socioecon6mico alt o pueden estar diferencialmente distdbuidos entre casos
y controles, 10 que conduce a una distorsion de las asociaciones exposici6n-enferme-
dad.
Debido a que el sesgo diferencial como el que se ilustra en la Tabla 4.3 distorsio-
na la magnitud de una asociacion, los invest igadores a menudo intentan <<igualar el
sesgo entre los grupos objeto de comparacion. En los estudios retrospect ivos, por
ejemplo, suelen procurarse muestras de casos y controles que esten bajo el mismo
proceso de selecci6n. Por 10 tanto, para los casos identificados solamente en los hos-
pitales HI Y H2 entre vados hospitales que hacen las veces de poblacion base
(poblaci6n A), un gmpo de control apropiado serfa una muestra del conj unto de los
integrantes de la poblacion que, de haber enfennado hubieran acudido (0 hubieran
sido remitidos) a los hospitales HI Y H2. (Esta estrategia ocasionalmente se llama
basada ell los (;(ISOJ", ba.wuJa en la clfllica, 0 de confrole.\" ba.wuJa ell elllO.\"
La selecci6n de los controles, ignorando el proceso de selecci6n que hizo
que los casos en est udio se dirigieran a los hospitales HI Y H2 (por ejemplo, selec-
cionando los controles de la poblad6n total A), bien puede producir sesgo de selec-
cion si, por ejemplo. los dos hospitales donde los casos se identifican suministran
preferentemente a los pacientes que tienen caracterfsticas relacionadas a la exposi-
cion objeto de evaluacion.
Posiblemente, el mejor ejemplo de igualamiento exitoso de los procesos de
selecci6n esta dado por los eswdios de casos y controles en los que tanto los casos
como los controles se identifican entre mujeres que aceptan partici par en un pro-
grama de tamizaje(6). Las mujeres que partici pan en un programa de tamizaje de
cancer de mama tienen mayor probabilidad de estar bajo el efecto de factores de
riesgo conocidos de cancer de mama, tales como antecedentes famili ares de esa
entidad. Por tanto, si los casos diagnosticados por tamizaje se compararan con una
muestra de no casos seleccionada de la poblaci6n general, podrfa producirse una
sobreestimaci6n en la magnitud de la asociacion con algunos factores de ri esgo.
AI seleccionar tanto los casas como los controles entre las mujeres pesquisadas.
sin embargo, se consigue que ambos grupos tengan una mayor probabilidad de
exposici6n a factores de ri esgo conocidos. Este proceso se il ustra esquematica-
mente en el ejemplo hi potetico mostrado en la Tabla 4.4. En esta tabla un sesgo de
igual magnit ud result6 en la inclusion de proporciones mayores de sujetos
expuestos en el grupo de casos y en el grupo de controles. Como consec uencia,
116 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
aunquc el odds de exposici6n esta sesgado tanto en casas como en controles, como
se aprecia al compararlos con los verdaderos odds de exposici6n incluidos en las
Tablas 4.1 y 4.2,eI odds ratio es insesgado.
N6tese que la magnitud del sesga en la selecci6n de casas es la misma que la de
los comroles en la Tabla 4.4, 10 que conduce a 10 que Schl esselman(4 pag 128) ha ll ama-
do sesgo cOlllpellsarorio:
1,5
Odds observado
c
..... 1 0
Se.\"go = -"':,,-="'-=="'- = _ ' _ _
Odds verdaderomos 1,0
1,0
Odds observadocontrole.
Otlds verdaderorontroloo
1,0
2,67
1,0
4,0

Para que OCLI rra el sesga compensatori o, el mismo factor de sesgo (en este ejem-
plo, x 1,5) necesita estar presente tanto en el numerador (odds de exposici6n de
los casas, Odds
oxpk
.,.,.) como en el denominador (oddJ' de exposici6n de los contro-
les, Oddso_,pkootrol ) del odds ratio, de manera que se puede hacer una cancelaci6n:
x LsesgoJ
Oddsnplro",roi x [J'esgoJ
En el ejemplo,

..
(
1,0)
-- x 1,5
OR = ...:....:. 1"', 0-'---_
= rat io verdadero (OR)
H%)
=4,0
-- x 1,5
(
1,0)
4,0
(
1,0 )
2,67
En la practica es diffc il asegurar que el sesgo afecte por igual al oddJ' de exposi-
ci6n de los casos y al de los controles, y los intentos de introducir un sesgo compen-
satori o puede incl uso ll egar a ser comraproducente, como oc urrfa en el ejemplo de
anemia aphistica discut ido previamente. Otro ejemplo es un est udio que examina la
asociaci6n de consumo de cafe y cancer pancreatico debido a MacMahon et al.m, en
el cuallos comroles se seleccionaron de un grupo de pacientes vistos por los mismos
medicos que habfan diagnosticado la enfermedad en los casos. EI objet ivo de este
disefio probablemente fue consegui r que el proceso de selecci6n (incluyendo los ses-
gos de part ici paci6n) de los casos y los comroles fuera simil ar. Sin embargo, como
la exposici6n de interes era el consumo de cafe, y debido a que los pacientes vistos
por los medic.os que diagnostican el cancer de pancreas, a menudo tienen desordenes
gastrointest inales conducentes a la recomendaci6n de no tomar cafe, el intento del
investigador de introducir un sesgo de compensacion condujo a la selecci6n de con-
troles con un oddJ' de exposici6n inusualmente bajo. Esto dio lugar a una asoc iaci6n
posit iva (espuri a) entre el consumo de cafe y el cancer de pancreas, que no pudo ser
a la post re confirmada(8).
FALT .... DE VALIDEZ: SESGO 117
Siempre que sea posible, los sujetos de esmdio deberfan ser seleccionados de
poblaciones de referencia definidas. En los estudios de casos y comroles una muestra
de la poblacion definida de la cual se originaron los casos (igual que cuando se reali -
za un est udio de cohorte) constit uye el mejor tipo de gmpo control. Los esfuerLos
ori entados a introducir sesgo compensatorio cuando la seleccion del gmpo control se
basa en las caracterfsticas de los casos, pueden 0 no ser exitosos, aunque se subraya la
posibilidad de obtener medidas validas de asociaci6n aun cuando no sea posible obte-
ner estimaciones absolutas validas de la frecuencia de la enfennedad (odd.\").
Todos los ejemplos precedentes provienen de est udios de casos y comroles. por-
que estos estudios (jumo con los transversales) constituyen el ambito mas probable
en el cual las probabilidades de muestreo de los diferemes grupos de enfennedadl
exposici6n pueden resultar diferenciales (Figura 4.2). En un estudio de cohorte,
debido a que los participantes del estudio (expuestos y no expuestos) son selecciona-
dos (por 10 menos te6ricamente) antes de que la enfermedad realmente ocurra, es
menos probable que se produzca una selecci6n diferencial de acuerdo al estado mor-
boso. Para enfermedades con una larga fase preclfnica (por ejemplo, algunos cance-
res, enfermedad ateroescler6tica), los sesgos que resultan de cambios relacionados
con manifestaciones prodr6micas de la enfennedad (anteriores a la manifestaci6n
clfnica de la dolencia propiamente dicha) a menudo afectaran tanto a los indi viduos
expuestos como a los no expuestos, 10 que da lugar a una situacion simil ar a la de la
Tabla 4.4 (sesgo compensatorio).
EI fenomeno analogo mas importante del sesgo de selecci6n en el contexto de los
estudios de cohone se reladona al problema de pirdida diferencial del seguillliento;
esto es, si los individuos que se pierden del seguimiento a 10 largo del est udio son dife-
rentes de aquellos que se mantienen bajo observaci6n hasta que se produce ei evento 0
hasta la tenninacion del esmdio. Esta analogfa se discuti6 en la Seccion 1.4.2. y las
Figuras 1.1 3 y 1.18 subrayan la equivalencia te6rica entre los aspectos de la selecdon
de los casos y los controles (de una cohorte definida 0 hipotetica) y los relacionados con
perdidas diferendales en un estudio de cohorte. Los sesgos en los est imados de indden-
cia que pueden surgir como consecuenda de las perdidas se discutieron en la Secdon
2.2. Los indi viduos que se pierden del seguimiento (particularmeme cuando las perdi-
das son debidas a mortalidad por causas ajenas al desenlace de interes, a la migraci6n 0
a que rehusan continuar; vease la Tabla 2.4) tienden a tener diferentes probabilidades
del desenlace respecto de aquellos que se mantienen en la cohone todo el tiempo del
estudio. Por 10 tanto, los estimados de incidencia tienden a ser sesgados. Sin embargo,
como en eI estudio de casos y controles (Tabla 4.4), las medidas de asociaci6n relativas
(ri esgo reiativo, rawn de riesgo) seran insesgadas si el sesgo de los estimados de ind-
denda es de magnimd similar en los individuos expuestos que en los no expuestos (ses-
go compensatorio). En otras palabras, en un riesgo relativo sesgado 0 un est imado de
fawn de tasas, solameme apareceran sesgos si las perdidas del seguimiento son sesga-
das de acuerdo a alllbo.\: exposici6n y desenlace.
43. SESGO DE INFORMACION
EI sesgo de informacion en los estudios aparece como resultado de definiciones
imperfectas de las variables de estudio 0 como consecuencia del empleo de pro-
118 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cedimientos inapropiados para coleccionar los datos. Estos problemas puedcn
generar crrores de clasificaci6n de la exposici6n y/o de l desenlace para una pro-
porcion significativa de partici pames en el eSlUdio. A 10 largo de esta secci6n, los
terminos validez .. \"ensibilidad, especiJicidad y Jiabilidad se utilizan reiterada-
mente; tanto aquf como en el Capit ulo 8 (estrechamente relacionado con el
actual) emplearemos las definiciones usuales de los textos basicos de epidemiolo-
gfa (Esquema 4. 1).
Esquema 4.1
Dcfinicioncs de terminos relacionados con la c1asificacion de los individuos
en cstudios cpidcmiologicos
Valldez: capacidad de una prueba de distinguir entre aquellos individuos que lienen la enter
medad (u olra caraclerislica) y aquellos que no la lienen.
Senslbilidad: capacidad de una prueba de idenlilicar correctamenle a aquellos individuos
que lienen la enfermedad (0 caracterfstica) de interes.
Especlllcidad: capacidad de una prueba de idenlificar correclamente a aquellos individuos
que no lienen la enlermedad (0 caracteristica) de inleres.
Fiabllidad (repUcabilidad): grado en que los resultados oblenidos por una prueba son ralili-
cados cuando la prueba se repile.
Fuente: L Gordis. Epidemiology. pp. 59 Y 70. 1Cl19W WB Saunders Company.
Un eS/lIliio I'li/ido es equivalenle a un esludio insesgado - un esludio que, basa-
do en su diseno, mCiodo y procedimiento, producira (en promedio) resultados globa-
les cercanos a la verdad. Ul sellsibifidad y fa especiJicidad se definen como los dos
componentes princi pales de la validez. Notese que en los libros de textos basicos 0
los capitulos que discmen aspectos relacionados con el diagn6stico y el tamizaje
(por ejemplo, Gordis(<J), estos terminos tipicamente se refieren a la clasificaci6n
correcta de una condicion morbosa (situaci6n respecto de la enfenlledad). Sin em-
bargo, en este capitulo (asf como en el Capitulo 8), sellsibilidad y especificidad tam-
bien se refieren a la clasificacion del estado de expoJicion. Ademas de la variable de
exposici6n pri nci pal (por ejemplo, el factor de riesgo principal de intercs en el eslU-
dio), {ambicn pueden ocurrir errores de clasificacion de otras variables, tales como las
confusoras (vease Capitulo 7, Seccion 7.5).
4.3.1. Sesgo en la identificaci6n de la exposici6n
Problemas en la recoleccion de los datos de exposicion 0 una definic ion imperfecla
del nivel de exposici6n pueden conducir a sesgo. La identificaci6n del sesgo de
exposici6n es motivo de preocupaci6n principal mente en los est udios de casos y
controles, aunque no solo en ellos. Consecuentemente, la mayoria de los ejemplos
relacionados con este ti po de sesgo de informacion provienen de es{udios de casos y
controles. Dos de las subcategorfas principales de sesgo de identificacion de la expo-
sicion son el sesgo de recuerdo y eI sesgo del entrevislador.
FALT .... DE VALIDEZ: SESGO 119
Sesgo de recuerdo
EI sesgo de recuerdo dimana de un rec uerdo inexacto de la exposicion pasada y quizas
sea el tipo de sesgo de identificacion de la exposicion mas chado. Es fuente de preo-
cupaci6n especialmente en el contexto de los est udios de casos y controles, cuando a
los casos y a los controles se les pregunta sobre exposiciones en el pasado. La dific ul -
tad para recordar adecuadamente tales exposiciones preteritas introduce un error de
clasificacion del estado de exposicion. con el consec uente sesgo de los resultados del
est udio. Si el error de recuerdo difiere entre casos y controles. el error de clasificacion
se dice que es diferencial; cuando el error de recuerdo es de magnitud simil ar, se dice
que eI errores 110 diferencial, como se discute en la Secci6n 4.3.3 . Un ejemplo empf-
rico de sesgo de recuerdo fue documentado por Weinstock et aIJIO) , quienes, mediante
un cuest ionario, recolectaron infonnaci6n sobre el color del cabello y la propensi6n al
bronceado de la piel en el momenta inicial y despues de la ocurrencia del melanoma
en las partici pantes de una cohorte para el estudio de salud de las enfermeras (Nurses'
Health Study). En este estudio, los casos de melanoma tendfan a comunicar baja pro-
pension al bronceado de la piel con mayor frecuencia cuando la entrevista se veri fi-
caba despues del diagn6stico de melanoma, que cuando esta se llevaba a cabo antes de
la ocurrencia de la enfermedad, diferencia que no se observ6 entre los controles (los
resul tados de este est udio se disclllen en detall e en la Secci6n 4.3.3).
Entre los mNodos uti li zados para prevenir el sesgo de recuerdo se hall an la veri-
ficaci6n de la respuesta que dan individuos est udiados, eluso de controles enfer-
mos en los est udios de casos y controles, el empleo de marcadores objetivos de la
exposici6n, y la reali zaci6n de est lldios de cohone, los cuales abarcan a los estudios
de casos y controles dentro de una cohone.
Ln verificacion de la informacion ohtenida de los participames se hace ocasio-
nalmente mediante revisi6n de las hi storias cl fnicas de fannacias, hospitales u otras
fuentes, para los estudios de y cont roles. Entre los ejemplos se incl uyen los
est udios que examinan las relaciones entre el uso pasado de estr6genos y el cancer
de mama(l l) , en los que las respuestas dadas por casos y controles eran corrobora-
das por los medicos. Una estrategia simil ar puede ser utilizada en los estudios de
cohorte, para confirmar la informaci6n de los partic ipantes concerniente a los
desenlaces (por ejemplo, infano de miocardio) 0 para ident ificar y excl uir casos
prevalentes de la cohorte de base con vistas a est imar incidencia en el seguimiento.
En el est udio sobre riesgo de anerioesclerosis en las comunidades (ARIC), por
ejemplo, la informaci6n suministrada por los miembros de la cohone durante las
entrevistas peri6dicas en los ingresos para los desenlaces principales (tales como,
infano de miocardio) se veri fica sistematicamente mediante revisi6n de las histo-
rias cl fnicas reievantes(12).
Debido a que en los estudios de casos y controles el sesgo de recuerdo puede ser el
resultado de que los casos han estado mmiando en torno a las de su enferme-
dad, en alguna ocasion se selecciona lin grupo cO/llral fi)rmado par sujeto.\ enfermoJ'
en un intento por introducir un sesgo simil ar en el odds de exposicion de los controles.
Un ejemplo 10 brinda un estudio debido a Mele et al.(l l) en el cuallos casos de leuce-
mia se compararon con un grupo control fonnado por pacientes sintomaticos que, des-
pues de la evaluaci6n en las mism .... cl fnicas hematol6gicas que los casos, se encontr6
que no tenlan des6rdenes hematol6gicos. EI problema con eluso de un gmpo de con-
trol fonnado por enfermos, sin embargo, radica en que a menudo no resuita claro si el
120 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mencionado proceso de rumiaci6n relacionado con las enfermedades de los contro-
les es equivalente al de los casas con respecto a la magnit ud del sesgo de rec lIcrdo.
Los marcudores objetivos de fa exposici6n 0 fa slIscepfihilidad son menos pro-
pensos al sesgo de recuerdo que las respucstas directas de los sujetos de est udio. Un
ejemplo puede encontrarse en el estudio de factores de ri esgo de melanoma anterior-
mente citado(IO) . En contraste con el sesgo prescnte al comunicar propensi6n al
bronceado de la piel despues del diagn6stico de la enfermedad, las respuestas de
los casas y los controles en ClI anto a color del cabell o no mostraban ningun cambia
significativo al compararse con las que se daban a los cuest ionarios apl ieados ames y
despues del diagn6stieo de la enfermedad (vease Secci6n 4.3.3). Una raz6n probable
para expliearlo es que el color del cabello es evaluado mas objetivameme que la pro-
pensi6n al bronceado de la piel.
Cienos marcadores genetieos, por ejemplo, const ituyen exposiciones no de-
pendientes del tiempo y pueden ser medidas incl uso despues de que la enfermedad
haya ocurrido; por 10 tanto, posiblememe son menos propensas al sesgo (suponiendo
que el marcador genetico en cuesti6n no esta relacionado con la supervivencia, vea-
se Secci6n 4.4.2). Un ejemplo es la evaluacion de la capacidad de reparaci6n del
ADN como un marcador genetieo de la susceptibilidad al cancer de piel no melano-
ma inducido por luz ult ravioleta en casos y controles j6venes(14) .
Desafonunadameme, sin embargo, la mayorfa de las exposiciones ambiemales
que pueden ser evaluadas por medio de marcadores biol6gieos objetivos representan
exposiciones act uales mas que pasadas, tal como ocurre con los niveles de nieot ina
como indicio del habilO de fumar, de manera que son de ut ilidad li mitada(lS).
Los eSllldios de casos y controles anidados, 0 est udios de casos cohorte cuando
los datos prospect ivos estan disponibles (vease Secci6n 1.4.2), permiten la evalua-
ci6n de ciertas hi potesis libres de sesgo de recuerdo (0 sesgo temporal: vease Sec-
cion 4.4.2). Tfpieamente, en eslOs eSllIdios de casos y comroles, la informaci6n
sobre la exposici6n y los confusores se recolecta en el momento inieial, antes de que
ocurran los casos, 10 que reduce la probabi li dad de diferencias sistematieas en eI
recuerdo emre casos y controles. EI est udio ya considerado donde se examina la
relaci6n de la propensi6n al bronceado de la piel y el melanoma(lO) (vease en la Sec-
cion 4.3.3) es un ejempl o de un estudio de casos y controles dentro de una cohone
(la cohone del est udio de sal ud de las enfermeras); la aplicaci6n del cuestionario de
diagn6stieo pre-melanoma evita el sesgo de recuerdo que se observa cuando el ana-
lisis se basa en informaci6n obtenida del interrogalOrio post-melanoma(lOJ.
Aunque el sesgo de recuerdo de la exposiei6n es un problema tfpieo de los estudios
de casos y controles, tambien puede ocurrir en estudios de cohorte. En este ult imo tipo
de est udio tal sesgo podrfa estar preseme al comienzo de la investigaci6n, cuando la
categorizacion de los individuos segun nivel de exposici6n se basa en la informaci6n
sobre un pasado distame 0 reciente, as! como cuando se trata de clasificar a los partici-
pantes de una cohorte en el momento inicial segun la duraci6n de la exposici6n.
Sesgo del entrev;stador
Cuando la recolecci6n de los datos en un estudio de casos y comroles no esta enmas-
carada con respecto al estado de la enfermedad de los panie ipantes en el eSlUdio,
puede produci rse tanto el sesgo del observador al evaluar la exposici6n, como el del
FALT .... DE VALIDEZ: SESGO 121
entrevistador. EI sesgo del entrevistador puede produci rse como consec uencia del
afan por aclaran) las preguntas cuando tales aclaraciones no son pane del protocolo
de eSUldio, cuando se violan las reglas de la pmeba, 0 se pasan por alt o las especifi-
caciones del cuestionario. Desviaciones mas sutiles del protocolo, que pueden
incluir el enfasis que se ponga en algunas palabras cuando se trate de los casos pero
no de los controles (0 viceversa), no son faci les de ident ificar.
Aunque es diffc il de reconocer el sesgo del entrevistador. es importante estar
advertidos de su posible aparic ion e implementar procedimientos para mini mizar la
probabilidad de su ocurrencia. Los esfuerzos por prevenir el sesgo del entrevistador
incluyen un disefio cui dadoso y la conduccion de actividades de aseguramiento de la
calidad y de control (vease Capit ulo 8), el desarroll o de un manual detallado de ope-
raciones, entrenamiento del grupo de entrevistadores, la estandarizaci6n de los pro-
cesos de recolecci6n de datos, y el monitoreo de las actividades de recolecci6n de
datos. Medidas adic ionales para prevenir este sesgo son la reali zaci6n de subesUl -
dios de confiabilidad y validez, y el enmascaramiento ante los entrevistadores de la
condici6n (caso 0 control) que tenga el sujeto entrevistado.
Los sub-estudios de cOllfiabilidad y validez ell muestras se desc ri ben detallada-
mente en el Capitulo 8, Seccion 8.3. Ellos constit uyen una estrategia importante
que neces ita ser lIevada a cabo sistematicamente, con una retroalimentacion rapida
a los entrevistadores que no siguen el protocolo 0 que han encontrado problemas.
Debe notarse, sin embargo, que, en contraste con los estudios de fiabil idad de las
medidas de laboratorio, los sub-est udios de fiabi lidad de las entrevistas no son
faci les de conducir. Evaluar la fiabilidad de los datos de la entrevista es diffcil por-
que hay una variabilidad intrapartici pante cuando las entrevistas se hacen en
momentos distantes; por otra parte, el recuerdo de las respuestas previas por parte
del entrevistado puede inlluir en que este provea la misma respuesta. incluso sien-
do err6nea.
Al igual que para el sesgo de recuerdo. los est udios de vali dez que utilizan fuen-
tes independientes (por ejemplo, historias clfnicas) pueden ser conducidos para eva-
luar la exact itud de la recoleccion de los datos por parte de los entrevistadores.
Enmascarar ante los entrevistadoreJ' fa condici611 de que el intermgado sea un
cuso a un control es diffc il ; pero, si es posible, puede eliminar una importante fuente
de sesgo, particulannente cuando el entrevistador esta familiarizado con las hi pote-
sis del estudio. En ocasiones, incluir una pregunta de salud para la que cabe esperar
una respuesta afirmativa frec uente tanto en casos como en controles permite enmas-
carar a los entrevistadores con respecto a la hip6tes is pri ncipal del eSUldio y hacerles
creer que la hipotesis concierne a la pregunta erronea . Tal estrategia fue empleada
en un estudio de casos y controles de factores psicosociales e infarto del miocardio
en la mujer, en el que preguntas sobre la histerectomfa, que a menudo se respond fan
posit ivamente debido a la alta frec uencia de esta intervencion en Estados Unidos,
condujo a los entrevistadores a creer que el est udio estaba evaluando una hip6tesis
honnonal(lb) .
Un error cometido en un estudio temprano de cancer de pulmon y habito de
fumar conducido por Doll y HiW
I7
. en eI cual algunos controles estaban erroneamen-
te clasificados como casos. sugiere una est rategia adicional para evaluar la posibili-
dad de sesgo del entrevistador. En este est udio el odds de exposici6n al habito de
fumar entre los controles clasificados err6neamente fue muy similar al de los contro-
les no clasificados err6neamente, y mucho mas bajo que el de los casos, 10 que con-
122 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
finna la all sencia de sesgo del entrevistador. Este ejemplo sugiere la posibilidad de
ut ilizar casas y comroles fantasmas y/o deliberadamente hacer creer a los entre-
vistadores err6neamente que algunos casas son controles y viceversa con el fin de
evaluar el sesga del entrevistador.
4.3.2. Sesgo de identificaci6n del desenlace
El sesgo de identificaci6n del desenlace (por ejempl o. la enfennedad) puede oc urri r
por igual en los est udios de cahone y en los de casas y controles . La clasificaci6n
erronea de la enfermedad result ante puede deberse a lIna definicion imperfecta del
desenlace 0 a errores en la clapa de recolecci6n de los datos.
Sesgo del observador
En un estudio de cohortc la decisi6n acerca de si eI desenlace esta presente puede estar
afectada por el conocimiento del estado de exposici6n de los panici pantes en el esUl-
dio, partic ularmente cuando el desenlax no es inequi vocamente constatable, tal como
episodios de migrafia 0 sfntomas psiq uiatricos . EI sesgo del observador puede presen-
tarse en di ferentes etapas de la evaluacion del desenlace, ocasionalmente como result a-
do de la apli caci6n de crit erios clfnicos 0 patol6gicos. Un ejemplo bastante cmdo de
sesgo del observador se produce cuando se valora un especimen histol6gico para diag-
nosticar cirrosis alcoh6lica si el patologo conoce que eI paciente es alcoholi co. Un
ejemplo documentado de sesgo del observador se aprec ia a partir del efecto de la raza
del paciente sobre el diagn6stico de enfermedad renal hipertensiva en fase terminal
(ERHFf). En un estudio de simulac i6n conducido por Perneger ef a una muestra
de nefr610gos se Ie enviaron historias dfnicas de 7 pacientes con ERHFf. Para cada
hi storia, la raza at ri buida a cada paciente fue escogida aleatoriamente como blanca 0
negra. Las hi storias que identificaban la raza del paciente como negra tuvieron
probabilidad dos veces mayor de dar lugar a un diagn6stico de ERHFf que las histo-
rias en las cuales la raza del paciente se consignaba como blanca.
Como ya se mencion6, el sesgo del observador oc urre cuando la evaluaci6n del
desenlace no es independiente del conocimiento que se tenga acerca de la exposi-
ci6n. Por tanto, medidas concebidas para elllllascamr la Sifll(lcion en fermi/lo.\" de
exposici6/1 anfe los a cargo de decidir el dncnlace esr6 presellfe 0
no, podrfa/l te6ricamente prevenir el sesgo del observador. Cuando tal enmascara-
miento no sea practico, el sesgo del observador puede evaluarse estratificando
segun certeza de diagn6stico. Por ejcmplo, los nive les de exposici6n pueden eva-
luarse en relaci6n a la incidencia de [a enfermedad como probables
y definitivos. EI sesgo del observador deberfa sospecharse si se observa una aso-
ciacion sola mente para [as categorfas mas suaves (por ejemplo, enfermedad
posible) .
Olra estrat egia para prevenir el sesgo de l observador es reali zar ]a clasi ficaci6n
diagn6stica con ohserwuiores /llIilriples . Por ejemplo, dos observadores podrfan da-
sificar independientemente un evento, y si oc urre di scordancia, un tercer informador
decidirfa ; es decir, la decision sobre la presencia 0 ausencia del desenlace tendrfa
que contar con la conformidad de, par 10 menos, dos observadores. Esta estrategia,
sin embargo, aumenta los costos del estudio y puede llegar a ser prohibit iva.
FALT .... DE VALIDEZ: SESGO 123
Sesgo del que responde
Los sesgos de recuerdo (entre otros) atribuibles al informante estan usualmente aso-
ciados con la identificacion de la e:<posici6n en los estudios de casos y controles. Sin
embargo, el sesgo de evaluaci6n del desenlace puede ocurrir durante el seguimiento
de una cohorte cuando la informacion sobre el desenlace se obtiene a traves de la
respuesta de un panici pante: por ejemplo, cuando se recolecta informacion sobre
eventos para los cuales es diffc il obtener confi rmacion objetiva, tales como episo-
dios de cefalea migrafiosa.
Siempre que sea posibJe, la informacion dada por un part ici pante sobre la posibJe
ocurrencia del desenlace de inten:s deberfa confinnarse por medios mas objet ivos,
tales como la revisi6n de una hisloria cl fnica hospitalaria. Cuando la confinnaci6n
objetiva no es posible - por ejemplo, para eventos en pacientes no hospitali zados, 0
eventos para los cuales la verificaci6n por medio del laboratori o es imposible, tales
como ataques agudos de panico- para la prevenci6n del sesgo del infonnante pue-
de ser uti l contar con informaci6n detall ada no solamente sobre la presencia 0 la
ausencia de un evento dado. sino tambitn sobre sfntomas relacionados que pueden
ser parte de una constelacion diagn6stica. Por ejemplo, el cuest ionari o sobre oc u-
rrencia de un episodio de cefalea migrafiosa en un estudio debido a Stewart et al.('9)
incluyo preguntas no solamente sobre si un fuerte dolor de cabeza habfa ocurrido.
sino tambitn sobre la presencia de aura, nausea y fatiga que acompafiaban a la cefa-
lea. Tal estrategia penniti6 una clasificacion mas objetiva de las migrafias que la
simple determinacion de la presenc ia 0 ausencia de dolor. Para muchos desenlaces,
tales como la angina pectoris y la bronquitis cr6nica, se dispone de cuest ionari os
estandarizados (vease Capitulo 8) . La vali dez y las limit aciones de algunos de estos
instrumentos han sido evaluados. Como en el caso del cuestionario de Rose para el
diagnostico de angina pectoris(20231.
433. EI resultado del sesgo de informacion: el error de clasificacion
EI sesgo de informacion conduce a errores de clasificaci6n de la exposicion y/o
del desenlace. Por ejemplo, cuando hay sesgo de l recuerdo en un eSllldio de casos
y controles algunos individuos expueslOs se clasifican como no expuestos, y vice-
versa. En un est udio de cohorte, un desenlace positivo podrfa omiti rse . Paralela-
mente, un pse udoevento pudiera ser err6neamente clasificado como desenlace
posit ivo. Los ejemplos de errores de clas ificaci6n diferenciales y no diferenciales
en esta secci6n conciernen a los niveles de expos icion en los estudios de casos y
controles. EI error de clasificaci6n en cuanto a ser un caso 0 un control en los est u-
dios de casos y controles, y de la exposici6n y el desenlace de los de cohort e pue-
den inferirse faci lmente, aunque no han sido disc utidos especfficamente para evi-
tar repeticiones.
Existen dos tipos de sesgos de clasificacion: el no diferencial y el diferencial.
Error de clasificaci6n 110 diferencial
EI error de clasificaci6n no diferencial oc urre cuando el grado de error de clasi fi ca-
cion de la exposicion es independiente de que se trate de un caso 0 de un control.
124 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Error de clasiJicacion 110 dijerencial cUll/uio hay dos categorfas . EI Esquema 4.2
muestra un ejemplo hipotetico y mll y simplifi cado de error de clasificaci6n no diferen-
cial de exposid6n (dicot6mica) en un estudio de casas y commies . En este ejemplo. se
produce un error de clasificaci6n consisleme en declarar no expuestos al 30% de los
casas expucs!Os y al 30% de los controles expuestos. EI error de dasificaci6n no dife-
rendal tiende a sesgar la asociaci6n hacia la hip6tesis nllia cuanda hay do.'> categorfas
de exposici6n (por ejemplo, sf y no). (Vease en la proxima secci6n una discusi6n
del error de clasificaci6n de variables de exposici6n con mas de dos categorfas) .
En el ejemplo hipotetico mostrado en el Esquema 4.2. el error de dasificaci6n
oc urre solamente en una direcci6n: los indi viduos expuestos se clasifican err6nea-
mente como no expues{Os . Sin embargo, a menudo el error de clasifi caci6n ocurre en
ambas direcciones: esto es, parte de los sujetos expuestos se clasifican como no
expues{Os 0 falsos negativos (es decir, la clasificaci6n correcta de los verdadera-
mente expuestos, 0 sensibilidad, es menor que el 100%) y parte de los sujetos no
expues{Os se clasifican como expuestos 0 <<falsos positivos (es decir, la clasificaci6n
correcta de los no expues{Os, 0 especificidad, es menor del 100%) . En un estudio de
casos y controles el error de clasificaci6n no diferencial aparece siempre que la sen-
sibilidad y la especificidad de la clasificaci6n de la exposici6n es la misma para los
casos que para los controles, aunq ue menor de 100%. La estimaci6n del numero total
E ~ q u e m a 4.2
Ejemplo hipotCtico del efccto del error de elasificacion no diferencial de dos categorias
de exposicion, con el 30% de casos expuestos y e130% de controlcs expucstos elasifica-
dos erroneamente como 110 expucstos
Sin error de ciasil icacion
Exposici6n
Sf
No
(:: )
OR :0 -- :0 4,0
(:: )
Casos
50
50
Controles
20
80
30 % de error de ctaslficacion de la exposlcion en cada grupo
Exposici6n
Sf
No
(:: )
OR :0 -- :0 3,3
(:: )
Casos
50 -15 :0 35
50 + 15 :065
Controles
20 -6 :014
80+ 6 :086
Electo del error de clasificaci6n no diferenciaJ con dos categor ias de exposiciOn: sesgar el OR
hacia el valor nulo de 1,0 (con 10 cual sa "dil uye" la asociaci6n).
Nota: Los numeros en negritas represenlan irnliviGlJOS mal clasificados.
FALT .... DE VALIDEZ: SESGO 125
de individuos clasifi cados como expues(Qs 0 no expuestos utilizando los proce-
dimientos de recolecci6n de datos del est udio y las defi niciones del nivel de exposi-
ci6n es simil ar a la est imaci6n de los individuos positivos y negativos segti n la
prueba cuando se aplica un examen de tamizaje. Por tanto, las nociones de sensibili-
dad y especifi cidad, esquematicamente representadas en la Figura 4.4, pueden ut ili-
zarse para explorar el tema del error de clasificaci6n con mas profundidad.
Casos
Exp No exp
(Pos) (Neg)
Resultados
verdaderos: A C
Resultados
del estudio
E,p
No exp
! !
VP
FN
FP
VN
Total
de casas
VP+FP",a
FN +VN "'c
Controlas
Exp No exp
(Pos) (Neg)
B 0
! !
Tolal
VP
FN
FP
VN
de conlroles
VP+FP",b
FN+VN",d
OR verdadero
[AIC + BID]
OR mal c/asificado
[alc + bId]
Figura 4.4. Aplicacion de los concept os de sensibilidad/espccificidad en cI error de c1asi-
ficacion de la exposici{m: representaci6n esquemlitica de los odds ralio verdadero y del
correspondiente a mala clasificaci6n. La sensibilidad de la evaluaci6n de la exposici6n = VP I
(VP + FN): especificidad de la evaluaci6n de la exposici6n = VN/(VN + FP).
Un ejemplo hi potetico que il ustra el error de clasificaci6n no diferencial de la
exposici6n en un eswdio de casos y controles en ambas direcciones - es deci r, algu-
nos suje(Qs expuestos se clasifi can err6neamente como no expuestos, y algunos no
expuestos como expuestos - se presenta en el Esquema 4.3. Este recoge los efectos
Esquema 4.3
Efectos del error de c1asificacion no difercncial sobre los odds ratio
(sensibilidad = 0,90; espccificidad = 0,80)
Casos Conlroles
Exp No exp Exp No exp OR Verdadero
Dislribucci6n
50 50 20 80
50/50 + 20/80 =: 4.0
verdadera _
(eslandar de oro)
Tolal Control
Dislribuci6n an al asludio:
de casas en el esludio
rB
~ r - - '
~ ~
r - - 1
OR mal clasificado
Expueslo
10 ~
, 34
,
~
55/45 + 34/66 '" 2.4
No axpueslo
40 1 45 1
' 66
,
1- __ I , ,
{I} (II) (III) (IV) {V} (VI)
$ansibilidad (exp) 0
especificidad (no exp): 0.90 0.80 0.90 0.8{)
126 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
del error de clasificaci6n no dife rencial resu]t ante de la evaluaci6n de una exposi-
ci6n con una sensibilidad del 90% Y una especificidad del 80%. El hecho de que
estos valores de sensibilidad y espedficidad sean los mismos para los casas y los
controles haec que eSle tipo de error de clasificaci6n sea no diferencial.
El efecto new de clasificar crroneamente a los caso.\" con una sensibilidad del W%
y una especificidad del 80% se muestra en la columna (III) del Esquema 4.3 . Los
totales en dicha columna (III) indican eI numero de casas clasificados como
expuestos y no expucstoS en el est udio y reflejan el error de clasi ficaci6n debi-
do a que la sensibilidad y la especificidad no son perfeclas. Por 10 tanto. los casas
clasificados como expuestos incluyen tanto a las 45 personas verdaderamente
expuestas (<<verdaderos positivos) como a los 10 casos que, aunque no estaban
expuestos, estan clasificados err6neamente como tales <falsos positivos) debido a
una especificidad inferior al 100% (vease tambien la Figura 4.4). Similannente, los
casos clasificados en el estudio como no expuestos incluyen a los 40 casos verda-
deramente no expues(Qs (<<verdaderos negativos) y a los 5 casos expues(Qs clasifi-
cados err6neamente como no expuestos (<<falsos negativos) en vinud de que la sen-
sibilidad es Menor que el 100%. EI Esquema 4.3 tambien muestra datos si mi lares
para los EI efecto neto de la clasificaci6n de los controles por la exposi-
ci6n con la misma sensibili dad (90%) y especificidad (80%) que los casos se mues-
tra en la columna (VI). EI oddJ' ratio observado de 2,4 en el estudio subestima al ver-
dadero olids ratio de 4, tal y como cabe esperar cuando el error de clasificaci6n de
una exposici6n dicotomica es no diferencial entre casos y controles.
En el ejemplo incl uido en el Esquema 4.3 el error de clasificacion no diferencial
de una exposicion dicotomica aparece afectado por la sensibilidad y la especificidad,
de manera tal que el efecto neto se traduce en un sesgo del ratio hacia 1,0. Ade-
m:h!ie !iepen!ier!ie la sensihi li!ia!i y la especifici!ia!i !ie los proce!iimienlos !ie !iefi-
nicion y evaluaci6n de exposici6n. el grado de error de clasificaci6n {ambicn aumen-
ta cuando disminuye la prevalencia de exposici6n en los controles. Esto ocurre
panicul annente cuando el tamano de muestra del grupo control es mucho mayor que
el del grupo de casos: uti li zando las mismas cifras de sensibi li dad y especificidad
que los registrados en el Esquema 4.3. un ejemplo hi potctico se muestra en el Esque-
ma 4.4, en el cual un oddJ' ratio verdadero de 8, 1 esta muy sesgado hacia 1,0 debido
al gran aumento del numero de contmles y a su prevalencia de exposici6n relativa-
mente baja. (Esta nocion es similar al efec(Q de una prevalencia de enfermedad baja
sobre el valor predictivo positivo cuando se aplica una prueba para la deteccion (em-
prana de la enfennedad) . La Tabla 4.5 muestra ejemplos de los efectos de sensibili-
dad, especificidad y prevalencia de exposici6n de los controles sobre el odds ratio
observado cuando el verdadero oddJ' ratio es 4,0.
Error de clasificucion no diferencial c/lando hay lIIas de dOJ' categorias. La regia
de que la direcci6n de un sesgo de clasificaci6n no diferencial siempre diluye la
intensidad de la asociacion puede no mantenerse en algunas si tuaciones de error de
clasificaci6n no di fe renciales que involucran a mas de dos categorfas de exposicion.
En un ejemplo hipolctieo disculido par Dosemeci et al .\24) que involucra Ires niveles
de exposicion en un estudio de casos y controles (<<ning una, baja y alta) (Tabla
4.6) el 40% de los casos y de los controles en 1a categorfa de exposici6n alt a se
clasificaron erroneamente como penenecientes a la categorfa adyacente, baja; el
efec(Q neto fue un incremento en el odds ratio para la categorfa sin modifica-
ciones para la alta.
FALT .... DE VALIDEZ: SESGO
Esquema 4.4
Efcctos del error de c1asificacion no diferencial sobre el odds ratio cuando
la prevalencia de la exposicion en los controles es baja y el tamano mucstral
es mucho mayor en controles que en casos
Casas Controles
E,p Noexp Exp No exp OR Verdadero
Dislribucci6n
30 70 50 950
30nO .. SO/950,=, 8,1
verdadera -
(eslandar de oro)
Total Control
Dislribuci6n en el estudio:
de casos en el estudio
r - - t
OR mal clasificado
Expuesto
1 235 t
127




---'
41/49 .. 235n65 "2,3
56 1 59 t 1 765 t
No expuesto
1- __ I
760
, ,
(I) (II) (III) (IV) (V) (VI)
Sensibilidad (exp) 0
especificidad (no exp): 0,90 0,80 0,90 0.80
Tabla 4.5
Error de dasificacion no direrencial: Ejemplos hipotcticos de los efcctos
de la sensibilidad y la cspccificidad de la identificacion de la exposicion
y de la prevaiencia de la exposicion en controies sobre cI odds ratio cstimado
cuando cI odds ratio verdadero es 4,0
Senslbilidad' Especlflcidadt
Prevalencia de la exposiclon Odds Ratio
en los controles observado
0,90 0,85 0,200 2,6
0,60 0,85 0,200 1,9
0,90 0,95 0,200 3,2
0,90 0,60 0,200 1,9
0,90 0,90 0,368 3,0
0,90 0,90 0,200 2,8
0,90 0,90 o,on 2,2
NOla: Los numeros en negrilas represenlan el factor (sensibilidad especifiddad 0 prevalencia de la expos'd6n)
que varia, para valores fijaoos de los otros dos factores .
La sensibilidad de la identiiicaci6n de la expos'd6n se define como la proporci6n de lodes los verdaderamen-
Ie expueslos que son como tales en el eSludio.
t La especiiicidad de la idenlificaci6!l de la exposici6n se define como la proporci6n de todes los verdadera-
mente 00 expuestos que son correctamente clasificados en el eSludio,
F.I error fie para no fi e ex posicitin en e l ejem-
plo - esto es, entre alta>, y ninguna>, - produ jo la desaparici6n de la relaci6n ver-
daderamente gradual y, habiendose supuesto que no habfa error aleatorio, dio lugar a
la aparici6n de un patron tipo J. Adicionalmente, como demuestran Dosemeci et al ..
el error de clasificacion de categorfas de exposicion no adyacentes puede invenir la
direcci6n de la tendencia en la relaci6n.
Tabla 4.6
Ejemplos de los efectos de errores de clasificaci6n no diferencial que conciernen a tres categorfas de exposici6n; errores de clasificaci6n
del 40% entre alta y baja ( A) y entre alta y ninguna (8 )
Estado de exposiciOn
Estado de caso 0 control Ninguno
"jo
Alto
Distribuci6n verdadera
Casas 100 200 600
Controles 100 100 100
Odds ratio 1.00 2.00 6.00
A. Categorias adyacentes: 40%
de los casas y los controles
en clasWicados err6neamente
COJIIU
"'00'
100 200 CC + 240 MC 600 CC - 240 MC
=440 =360
Controles 100 l 00CC+40 MC looCC - 40 MC
=140 .6(j
Odds ratio 1.00 3. 14 6.00
6. Categorfas no adyacentes:
40 % de los casas y los controles
en "aHa" clasWicados err6neamente
como
Casas 100 CC + 240 MC 200 600 CC - 240 MC
=340 =360
Controles l 00CC+40 MC 100 looCC - 40 MC
= 140 .6(j
Odds ratio 1.00 0.82 2.47
Nota: ce, colTeclamenle clasilicado: Me, mal clasilicados.
Fuente: M Docemeci. S wacholder. at1d JH Lltl in, Does NondiHerentiai Misci<lssilication 01 Exposure Atways Bias a True Ellect Toward lhe Nul Value? America'! JOllna/o/ Epi-
demiology, Vol In 746748. () 1990. The Johns Unrversi1y School 01 Hygiene I> PUblic Healtl .

00
m
a

5
r
8
;;-
Z
"
m
" <

n
a
z
n


<
>
,
C
n

is
Z
rn
FALT .... DE VALIDEZ: SESGO 129
Error de clasificaci6n diferencial
EI error de clasificaci6n diferencial ocurre cuando el grado de error de clasificaci6n
difiere entre los grupos que se comparan . Mientras que la tendenc ia general del error
de clasificaci6n no diferencial de un factor de exposici6n dicot6mico es a debilitar
una asociaci6n verdadera, el error de clasificaci6n diferencial puede sesgar la aso-
ciaci6n bien acercandose, bien alejandose de la hip6tesis nula. Aun mas, es diffc il
predeci r la direcci6n del sesgo cuando se incurre en eI error de clasificaci6n di feren-
cia!. como resultado de un complejo entramado que involucra dife rencias de sensibi-
lidad, especificidad y prevalencia de exposici6n entre casos y controles.
Un ejemplo hi potetico de error de clasifi caci6n diferencial se expone en el Esque-
ma 4.5, en eI que la sensibilidad de identificar la exposici6n en los casos es del 96% y
en los controles es solamente del 70%. La especificidad en el ejemplo es 100% en
ambos: casos y controles. La mayor sensibilidad entre los casos da lugar a una
mayor proporci6n de sujetos verdaderamente expuestos que son identificados como
casos y no como controles, 10 que produce un odds ratio sesgado que se aleja de uno
mas que del verdadero odds ratio (verdadero OR = 4,0, sesgado OR = 5,7) para
subrayar las dificultades en la predicci6n de los result ados cuando hay error de clasi-
ficaci6n diferencial; si se hacen los mismos calcul os utilizando una especificidad
mas alta en los casos (100%) que en los controles (80%), el odd,\' ratio se sesga hacia
la hip6tesis nul a (Esquema 4.6), ya que una especificidad mas pobre en los controles
compensa la sensibilidad mayor en los casos.
La Tabla 4.7 muestra ejemplos de efectos aislados de sensibilidad (para una
especificidad del 100%) 0 especi ficidad (para una sensibilidad del 100%) sobre el
olfd,\ ratio en un estudio de casos y controles hipotetico con error de clasi ficaci6n
di ferencial de exposici6n y una prevalencia de exposici6n en los controles del 10%.
Un ejemplo de error de clasificaci6n dife rencial de la exposici6n fue brindado
por Weinstock et al .\lOl . Este ejemplo ya fue utilizado para ilustrar el concepto de
Esquema 4.5
Ejemplo hipotCt ieo del erct:l0 del error de c1asificacion direrencial sobre
eI odds ratio en eI eual, para la sensibilidad, casos > eontrol es, y para la
espccifieidad, easos = eontrol es
Casos Conlroles
E, p Noexp Exp No exp OR Verdadero
Oislribucci6n
5(J 5(J
20 80
SO/50 .. 20/80 '=' 4,0
verdadera __
(eslandar de oro)
Tolal Control
Oislribuci6n en el esludio:
de casas en el esludio
rB
~ r - - '
~ ~
r - - 1
OR mal clasificado
Expueslo
o 1 48 1
,
14
,
50 ~
~
' 86
, 4H152 .. 141t10 '" 5'"{
No expueslo
1- __ I
,
,
(I) (II) (III) (IV) (V) (VI)
Sensibilidad (exp) 0
especificidad (no exp): 0.96 1.00 0.70 1.00
130 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES

Ejcmplo hipotCtico del credo del error de c1asificacion difcrcncial sobre
los odds ratio, en eI cual tanto para la scnsibilidad como para la espccilicidad,
casos> controlcs
Casas Cantroles
Exp No exp Exp No exp OR Verdadero
Distribucci6n
50 50 20 80
SOl50 + 20/80 :0 4,0
verdadera _
(eslandar de oro)
en Contrale::;
Oistribuciones en el estudio:
el estudio en el eSludio



r - - I
OR mal clasificado
Expuesto
o I 48 I , 30
,
50

48/52 + 30170 '" 2.1
No expuesto
,
70
,
1- __ I , ,
(I) (II) (III) (IV) (V) (VI)
$ensibilidad (exp) 0
especificidad (no exp): 0,96 1,DO 0,70 0,80
Nora: La menor en los contmles aumenta el numero de exposiciones lalsas posilivas, 10 que com-
pensa por tanto la mayor sensibilidad en los caoos y diluye la iuerza de la asociad6n.
sesgo de reclIcrdo (vease Secci6n 4.3 .1 ). En este esi udio, se comparaban los casos
de melanoma y los comroles seleccionados de los partic ipantes de la cohortc del
estudi o de salud de enfermeras en relad6n con el registro del color del pelo y da
propensi6n al bronceado de la pieh>, ambos en el momento inidal del estudio y des-
pues de que el caw fuera diagnosticado. En este ejemplo, el error de clasificaci6n
diferencial probablemente se verifieD debido a que el estado morboso era conocido
por el panicipante, 10 ellal afcctaba pmcncialmcmc su rec lIcrdo de 1a exposici6n. Por
Tabla 4.7
Ejcmplo de los efectos de 13 sCIlsibilidad y especificidad diferenciales
de III evaluaci6n de III exposici6n sobre el odds ratio (OR) para un OR vcrdadero
de 3,86 y una prevalcncia de la exposicion en los controles de 0,10
Evaluaclon de la exposlclon
Senslbilidad' Especl flcldadt
e._
Coot_
e._
Cootro"
Odd,....,
0,90 0,60 1,00 1 ,DO 5,79
0,60 0,90 1,00 1,00 2,22
1,00 1,00 0,90 0,70 1,00
1,00 1,00 0,70 0,90 4,43
, La sensibil idad de la idenlii;caci6n de la exposici6n se define como la propord6n de lodos kls verdaderamen-
Ie expueslos que son correctamenle
t La de la idenl ificaci6n de la ex,cosici6n se define como la proporci6n de los verdaderamenle no
expueslos correctamenl e clasificados.
FALT .... DE VALIDEZ: SESGO 131
10 tanto, la entrevista de diagn6stico de premelanoma se supone que refleje exacta-
mente la verdadera asociaci6n. Los resul tados principales del est udio se resumen en
la Tabla 4.8. Para la discusi6n que sigue las categorfas asociadas con un aumento del
odd.\ utilizando los datos de casos y controles obtenidos despues de la ocurrencia del
melanoma se consideraron como correspondientes a los expuestos (<<rojo 0 rubio
y ningli n bronceado 0 un bronceado ligero para el color del pelo y la propensi6n a
broncearse, respectivamente) .
Tabla 4.8
Color del pelo reportado y propemion al bronceado dc la piei cntre casos incidentes
y controles en un estudio de casos y controles de melanoma dentro de la cohorte del
estudio de salud de las enrermeras
Informacion
dlagn6st lca Informacion
premelanoma dlagnost lca
("Estimdar de oro) post melanoma
Casos Controles Casos Controles
Color del palo
Raja a rubio (expueslos) 11 37 11 41
Casiano a negro (no expueslos) 23 197 23 193
Odds ralio 2,5 2,3
Propensi6n al bronceado
Ninguna, praclicamenle ninguna,
a ligera propensi6n (expueslos) 9 79 15 77
Media, promedio, profunda
a mucha pmpesi6n
(no expuestos) 25 155 19 157
Odds ralio 0,7 1,6
Fuente. MA Weinstock et ai, Recall (Report) Bias and Reliability in the Retrospective Assessment of Mefanoma
Risk. American Journal of Epidemiology, Vof 133, 240-245, <1:>1991, The Johns Hopkins University Schoof 01 Hygiene
&Pubfic HeaHh.
Comparado con los datos anteriores al desarroll o de la enfermedad, el odds para
el color del pelo aument6 ligeramente solo para los comroles cuando se usaron los
datos de la entrevista post melanoma (de 37: 197 a 4 1: 193); como result ado, el
odds ratio cambi6 re lativamente poco (prediagn6stico OR = 2,5, postdiagn6stico
OR = 2,3) . EI efecto del error de dasificaci6n diferencial en la propensi6n al bron-
ceado, sin embargo, fue notable, ya que condujo a una invers ion en la direcci6n de
la asociacion: suponiendo que no hay variabilidad aleatoria, la verdadera aso-
ciaci6n (ej ., la detectada utilizando la informaci6n del diagn6stico premelanoma)
harfan pensar en un efecto protector (OR = 0,7), en tanto que la asociaci6n observa-
da postdiagn6stico (OR = 1,6) sugiere un odds de melanoma mayor, asociado con
una baja propens ion al bronceado de Ia piel. Result a de interes advert ir que ei error
de clasificaci6n de la exposicion, lal como se mide por la propension al bronceado
de la piel, parece haber sido li geroen los controles (el odds de exposici6n cambi6 de
79/155 a 77/ 157) . En los casos, sin embargo, el efecto del error de clasificaci6n fue
sustancial, con un incremento de 9 a 15 en el nli mero de individuos clasificados
como expuestos entre la pri mera y la segunda entrevista.
132 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
La tabla cruzada de los datos del diagn6stico pre y postmelanoma permite el d lcu-
10 de la sensibilidad y la especificidad de la evaluad6n de la pmpensi6n al bronceado
de la piel en los casas. Como se mucstra en la Tabla 4.9, la sensibilidad de 89% de las
entrevistas para el diagn6stico post melanoma pennit i6 lIna correcta clasificaci6n en 8
de los 9 casos verdaderamente expucstos. Sin embargo, una especificidad de solamen-
Ie eI 72% condujo a un numero reiativameme grande de personas no expuestas colo-
cados en la celda de los falsos positivos, y produjo por tanto un incremento marca-
do en el odds de exposici6n post diagn6stico (odds de exposid6n verdadero en los
casas. 9:25 0 0.36: 1.0: odds de exposid6n sesgado. 15: 19 0 0.79: I m tal que el odds
ratio en el estudio postdiagn6stico esta en di recci6n opuesta al del verdadero valor.
Como se mencion6 previamente (Secci6n 4.3. 1), el error de clasificaci6n diferencial
en el estudio de Weinstock et (11 .(10) probablemente se debi6 al sesgo de rec uerdo. Un
error de clasificaci6n adicional puede haber ocurrido a result as de que las preguntas
sobre el color del pelo y la propensi6n al bronceado de la piel no eran exactamente las
mismas en las entrevistas que se realizaron antes y despues del diagn6stico.
Tabla 4.9
Dislribucion de casas incidenles en la cohorle del esludio de salud de las enfermcras,
de 1976 a 1984 acorde con las respucslas dadas sabre la propcnsion al bronceado de
la picl anlerior al desarrollo de melanoma y despucs de que se hiciera el diagnoslico
Informacion dlagnostlca
premelanoma (" Estandar de oro)
Nlnguna, pnictlcamente
Informacion
dlagnostlca
post melanoma
nlnguna, 0 IIgera
propenslon
Ninguna, practicamente
ninguna, 0 ligera propensi6n
al bronceado (<<expuestos"J
Media, promedio,
profunda 0 mucha propensi6n
al bronceado
(<<expuestos )
8 (V?)
al bronceado (<<no expueslos"J 1 (FN)
Tolal
(clasificaci6n verdadera) 9
$ensibilidad
8/9:0 89 %
Media, promedlo,
profunda 0 mucha
propenslon
al bronceado
("no expuestos)
7 (F?)
18 (VNJ
25
Especilicidad
16/25", 72 %
Total
(Claslflcaclon de
casos y controles)
15
19
34
NOla; VP. verdaderos FP, falsos posiwos; FN, falso oogativo; VN. verdaderos negativos.
Fuente; MA Weinstock et al., Recall (Report) BilS and Reliabili ty in the Retrospective Assessment of Melanoma
Risk, American Journal of Epidemiology, Vol 133. (1)1991 , The Johns Hopkins University Schoof of Hygiene
& Pubfic Health.
J<..lecto del error de clasificacioll de ulla variable cOllfusora
El error de clasificaci6n tambi en afecta a la eficiencia del aj uste para los efectos con-
fusores . Mientras que un error de clasificaci 6n no diferencial de un factor de riesgo
potencial ti ende a sesgar la medida de la asociaci6n hacia la hi p6tesis nula, el error
de clasificaci6n no diferencial de una variable confusora genera un aj uste imperfeclo
debido a confusi6n residual (vease Secci6n 7.5)<25).
FALT .... DE VALIDEZ: SESGO 133
Prel'encion del error de clasificacioll
EI error de clasificacion ha sido extensamente discut ido en la literatura epidemio-
logicp6.29) , 10 que da cuenta de su importancia en los estudios epidemiol6gicos.
Como se vio en los ejemplos descritos en esta seccion, el error de clasificaci6n
puede distorsionar seriamente la magnitud de una asociacion entre un factor de
riesgo y una enfermedad . Si el riesgo relativo 0 el odd.\" ratio verdaderos son proxi-
mos a I, un error de clas ificaci6n no diferencial pudiera enmascarar completamen-
te la asociaci6n: por ejemplo, para una exposicion con una prevalencia tan alta
como 16% (no muy diferente a la de muchos factores de riesgo), si el verdadero
olids ratio es aproximadamente 1.3, el odds ratio observado puede ser virtualmen-
te igual a 1 si un error de clasificaci6n no diferencial result a de un procedimiento
de medici6n cuyas sensibilidad y especificidad esten ambas alrededor del 70%. EI
error de clasificacion diferencia l, por otro lado, puede tanto difuminar como refor-
zar una asociaci6n, e incluso producir una asociaci6n espuria. Cuando la exposi-
ci6n es comun, no poder demostrar una relaci6n real, 0 concluir que una aso-
ciacion es real cuando real mente es espuri a puede traer consecuencias seri as para
la salud publica.
Usualmente no hay datos disponibles que permitan una comparacion entre indi-
viduos correctamente y err6neamente clasificados en tenninos de sus caracterls-
{icas (por ejemplo, nivel educacional): pero cuando existen, pueden ser informat i-
vas . Como se vio en la Tabla 4.9, de los 34 casos incidentes incluidos en el estudio
de casos y controles anidado de la cohorte del estudio de sal ud de enfermeras, 26
estaban correctamente clasificadas (S verdaderas positivas y IS verdaderas negat i-
vas)(IO) , y S fueron erroneamente dasificadas (7 falsas posit ivas y 1 falsa negat iva).
Podrla hacerse una comparacion, por ejemplo. entre los falsos positivos y los verda-
deros negativos por un lado (abordando eI aspecto de la especificidad) y entre los
falsos negativos y los verdaderos positivos por otro (abordando el aspecto de la sen-
sibilidad), En el estudio de salud de las enfermeras, los autores no comunicaron
diferencias importantes entre los casas clasificados correctamente y los clasificados
incorreclamente. (Cuando se est udia la propension al bronceado, no serla absurdo
poslular que el rec uerdo de la propensi6n al bronceado de la piel podfa estar influi -
do por factores tales como la historia familiar de enfennedades de la piel 0 desarro-
liar act ividades laborales al aire libre) . La similitud en las caracterfsticas pertinen-
{es de las personas correctamente clasificadas y las clasificadas err6neamente
puede qui zas indicar que el sesgo de recuerdo no es una explicaci6n probable para
el error de clasificacion, y surge la posibilidad de que el sesgo de informaci6n se
origine en problemas relacionados con el instrumento 0 el observador. Por tanto, la
comparaci6n entre sujetos err6neamente clasificados y no err6neamente clasifica-
dos no necesita cefiirse a las caracterfsticas de los entrevistados, y podrla incl ui r
problemas potenciales en los procedimientos de recolecci6n de datos. Cuando las
entrevislas se graban, la adherencia al protocolo por parte de los entrevisladores
puede ser comparada, Adicionalmente. deberfa oblenerse infonnacion sobre la con-
fiabi li dad y la validez del instrumento (por ejemplo, un cuestionario), como se dis-
cute en el Capit ulo S.
La prevenci6n del error de en la exposicion y el desenlace es una
funci6n del estado del de las tecnicas de medic ion que pueden apl icarse con
seguridad a un gran numero de sujetos que part icipan en estudios epidemiologicos.
134 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Eiuso de marcadores de exposici6n objet ivos (por ejemplo, bio16gicos), y las teen i-
cas diagn6sticas mas seguras para evaluar los deseniaces, tales como el uso de ultra-
sonido para diagnosticar arterioescleros is asimomatica('2), constituye la alt ernati va
mas eficiente para mitigar los cfcctos del sesga debido al error de clasificaci6n. Por
el momenta, si se conocen la sensibilidad y la especificidad de la medida del desen-
lace 0 de la exposici6n, entonces es posible corregir el impacto del error de clasifica-
cion ut ili zando fannu las que estiman un ri esgo relat ivo corregido . Tal correcci6n
puede ser, por ejemplo, lIna fund6n del ri esgo relat ivo observado y la sensibilidad
y especificidad estimadas de la clasificaci6n de exposici6n en el estudio(27.lOl. Cabe
adicionar que se han propuesto metodos de correcci6n que pueden ser aplicados a
sit uaciones en las cuales los errores de medic i6n afectan tanto a las variables de
exposici6n como a las covariables (sean estas categ6ricas 0 continuas)OIl .
4.4. SESGO DE INFORMACIONISELECCION COMBINADOS
En esta secci6n se discuten sesgos que tienen componentes de infonnaci6n y de
selecci6n. Se incluyen aquellos relacionados con la vigil ancia medica, con los estu-
dios transversales, y con la evaluaci6n por tamizaje. Las secciones sobre los sesgos
de evaluaci6n de estudios transversales y de tami zaje pueden parecer algo repet iti-
vas, habida cuenta de las discusiones previas sobre los sesgos de informaci6n y de
selecci6n en este capit ulo. Han sido incluidas aqul. sin embargo. porque contienen
ejemplos especfficos de estas areas en virtud de 10 cual pueden tener un valor afiadi-
do para aquell os lectores especial mente interesados en estudios de intervenci6n
transversales y de tamizaje .
4.4.1. Sesgo de vigilancia medica (0 de detecci6n)
En este tipo de sesgo la ocurrencia de una exposici6n medica presumi blemente rele-
vante conduce a una vigilancia mas estrecha de los desenlaces que se estudian, los
cuales, part ic ul armente si son subclfnicos, pueden incrementar la probabilidad de
detecci6n en los indi viduos expuestos. Por tanto, el sesgo de vigil ancia medica oc u-
rre cuando la identificaci6n del desenlace no es independiente del conocimiento de
la exposici6n . Por ejemplo, ciertas exposiciones pueden conducir a una vigilancia
medica mas acusada, expresada a traves de contactos medicos mas frecuentes, 0 de
preguntas y examenes mas profundos a los pacientes durante un contacto.
EI sesgo de vigilancia medica es particularmente probable cuando la exposici6n
es una condici6n medica 0 un tratamiento que conduce a examenes frec uentes y
detall ados - tales como la diabetes 0 el uso de anticonceptivos orales - y el desen-
lace es una enfermedad caracteri zada por una alta proporci6n de casas subcl fnicos, y
por tanto. mas probablemente diagnosticados durante los contactos medicos fre-
cuentes result antes de la necesidad de monitorizar la exposici6n. Por ejemplo,
aunque puede no haber fundamentos para creer que el uso de contracepti vos orales
favorezca los fall os renales, una asociaci6n espuria se observarfa si las mujeres que
taman contracepti vos orales fueran mas propensas a pasar examenes medicos, que
supongan medidas repet idas de la concentraci6n serica de creatinina.
FALT .... DE VALIDEZ: SESGO 135
EI sesgo de vigilancia medica puede apreciarse como un tipo de sesgo de selec-
cion. porque la ident ificacion del desenlace esta influida por la presencia de la expo-
sici6n. 0 como un sesgo de informacion. porque los sujetos expuestos son objeto de
examenes mas profundos que los no expuestos.
EI sesgo de vigil ancia medica se produce con mas frecuencia cuando el desenla-
ce se evalua a traves de canales medicos regulares. Alt ernat ivamente, cuando eI
desenface se evaltia sistelluiticamellfe, il1del'elldiellfemellfe de la eXl'osici6n, utili
zando WI diseno proJpectivo COIICurrenfe, la aparici6n del sesgo de vigilancia medi-
ca es menos probable(l). Por tanto, en la mayorfa de los grandes est udios de cohorte.
tales como el est udio clasico de Framingham(32) 0 el estudio ARIC ( 12) se usan mt ina-
riamente mdodos meticulosos estandarizados de evaluaci6n de los desenlaces .
Otra estrategia para prevenir el sesgo de vigilancia medica en los estudios de
cohorte consiste en enmascarar eI e,\tado de exposici6n ("!lalldo se evahia fa presen
cia del liesenlace .
Si estas estrategias no son posibles. como acaece cuando se lIeva a cabo un est udio
de casos y controles en el que el diagn6stico de la enfennedad puede haber estado ya
afectado por la presencia de la exposici6n. deberfa obtenel"se infimllaci611 sobre fa Fe
cuencia, fa illlem'idad y fa cafidad del c!lidado medico recibitio porlos participallle,\'
liel estlldio COli prop6sitos mw{[ticos . Por ejemplo, para evaluar la relaci6n entre eI uso
de la terapia de sustit uci6n hormonal y una enfermedad dada con un componeme sub-
clfnico (por ejemplo, diabetes no insulinodependieme) ut ili zando un disefio tradicional
de casos y controles, es medular contemplar los indicadores de cuidados medicos, tales
como la frec uencia de visitas medicas en el pasado y si el individuo tiene 0 no seguro
medico. Debido a que la educacion y el nivel socioecon6mico estan usualmente rela-
cionados con la disponibilidad y el uso de la atenci6n medica. ellos tambien deberfan
ser tornados en consideraci6n cuando se trata de prevenir el sesgo de vigil ancia medica.
Tambien es posible obtener informaci6n sobre variables que indicall Wlloci
miento de 10,\' problema,\' de sailld, tales como el cumplimiento de los examenes de
tamizaje y el conocimiento de enfermedad subclfnica 0 de los resultados de los ana-
!isis de sangre. Por ejemplo, en un est udio prospectivo de la relaci6n entre la vasec-
tomfa y el riesgo de cancer de pr6stata, la posibil idad de sesgo de vigil ancia se eva-
lu6 examinando variables que podfan reflejar una atencion medica mas intensa(H).
No se encontraron diferencias entre los sujetos que ten fan y que no tenfan reali zada
una vasectomfa con respecto al grado de conocimiento sobre su presi6n anerial 0 su
nivel de colesterol serico. Tambien fueron simi lares los porcentajes de los que habf-
an sido somet idos a una sigmoidoscopia en el contexto de un tamizaje, 10 que con-
dujo a los autores a concl uir que los hombres con vasectomfa no estaban somet idos a
un mayor grado de vigil ancia medica. Ademas, la frecuencia de los examenes recta-
les digitales fue simil ar entre los individuos vasectomizados (expuestos) y los no
vaseclOmizados (no expuestos). 10 que implica simil ar acceso a un procedimiento
que puede conducir al diagn6stico del desenlace del est udio.
Finalmente, cuando ocurre el sesgo de vigil ancia medica. la enfennedad tiende a
ser diagnosticada mas precozmente en los expuestos que en los no expuestos: conse-
cuentemente, la proporci6n de sujetos con la enfermedad menos avanzada en un
estudio de cohorte es mayor en el grupo expuesto. En un estudio de casos y contro-
les, el sesgo se concreta en el hecho de que se encuentra una asociaci6n mas fuerte 0
solo presente en los casos menos avanzados . En el estudio de cohorte ya discutido,
Giovannucci et al Pl) encontraron que el estadio de gravedad histol6gica del cancer
136 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
de pr6stata rue similar para los vasectomizados y para los no vasectomizados,
hallazgo inconsistente con 10 que se hubiera esperado si la vigil ancia medica hubie-
fa sido mas intensa en eI grupo de vasectomizados. La eJ'lrarijicacion pOl' gravedad
de la enfermedad ell ellllolllento del diagnosticv es, por tanto, lI na estrategia adic io-
nal para examinar y tomar en consideraci6n la posibilidad de sesgo de vigil ancia.
4.4.2. Sesgos transversales
Los sesgos transversales puedcn ser clasificados como sesgos incidencia-prevalencia
y sesgos temporales. EI pri mero es un tipo de sesgo de selecci6n, mientras que el
segundo puede ser considerado como un sesgo de informacion.
Sesgo de illcidell cia-prevalencia
El sesgo de incidencia-prevalencia procede de la incl usion de casos prevalentes en el
est udio. Como se discute en el Capitulo 3 (Seccion 3.3), la fuerza de una asociaci6n
a veces se estima milizando la razon de tasas de prevalencia y no mediante el riesgo
relativo, como cuando se analizan los datos de una encuesta transversal 0 cuando se
evalli an asociaciones transversales con la informacion inic ial de un estudio de co-
horte. Si el invest igador esta interesado en evaluar asociaciones potencialmente cau-
sales, el uso de la raz6n de tasas de prevalencia como un estimado de la razon de
tasas de incidencia esta sujeto a sesgo. La ec uaci6n 2.3, descrita en el Capitulo 2
(Seccion 2.3), muestra la dependencia del mids de prevalencia punt ual LPrev/( 1 -
Prey)! sobre la incidencia (Inc) y la duraci6n de la enfennedad (Dur), suponiendo
que la incidencia y la duracion son aproximadamente constantes:
Prev
-,-c'-:'::: __ = Inc x Dll r
1,0 - Prev
La Ecuacion 2.3 puede ser refonnulada como la Ecuacion 2.4:
Prev = Inc)( Dur x ( I ,0 - Prev)
Esta pennite apreciar que ademas de la incidencia y de la duraci6n, en la preva-
lencia influye el tennino ( I ,0 - Prey) (que, a su vez, depende obviamente de la mag-
nitud de la tasa de prevalencia punt ual).
La ecuaci6n 2.4 muestra que la raz6n de las tasas de prevalencia punt ual (RTP)
que pennite comparar los individuos expuestos (denotados por el subfndice +)
con los individuos no expuestos (denotados por el subindice - ) , obtenidos en est u-
dios transversales es una funci6n de I) la razon de las tasas de incidenc ia (RTI); 2) la
ra70n cle ]a cllJracion cle la enfermeclarl en 1m; incl ivicl llos explIestm; y la cluracion cle
la enfennedad en los no expuestos; y 3) la raz6n del termino ( 1,0 - Prev) en los indi-
viduos expuestos y en los individuos no expuestos . Las razones 2 y 3 representan
dos tipos de sesgo de incidencia-prevalencia, es decir, e! .\"C.\"gO de fa razon de (iura,
cion y e!Je.\go de fa razon de! complemento de fa I'revafencia I'untllal, respectiva-
mente, cuando la RTP se ut iliza para eslimar la RTi (vease Secci6n 3.3):
FALT .... DE VALIDEZ: SESGO 137
_ ([nc.) (DM.) (' ,0 - PV. )
RTP_ -- x -- X
11I c.. Dllr_ 1,0 - Prev_
Sesgo de raz6n de dllraci6n. Este tipo de sesgo (que podia interpretarse como un
tipo de sesgo de selecci6n) aparece cuando se esta milizando la RTP como una
medida de asociaci6n y la duraci6n de la enfermedad despues de su comienzo sea
diferente entre las personas expuestas y las no expuestas . (Debido a que la duraci6n
de una enfermedad cronica esta a menudo relacionada con la supervivencia. este tipo
de sesgo puede tambien ser designado como sesgo de supervivellcia). Para las enfer-
medades de baja prevalencia, cuando la duraci6n (0 el pron6stico) de la enfennedad
es independiente de la exposici6n (es decir, cuando la duraci6n es la misma en los
expuestos que en los no expuestos), la RTP es un est imador vinualmente insesgado
de la RTi. Por otro lado, cuando la exposicion no solamente aumenta el riesgo de
enfermedad sino que tambien afecta el pron6stico de la dolencia, el sesgo estara pre-
sente, como se muestra en los ejemplos siguientes .
Se.\"go de la raz611 del cOlllplemellfo de la prevalellcia punfllal. Si la duracion es
independiente de la exposicion, independientemente de la direcci6n del efecfO de l
factor sobre el desenlace, la RTP tiende a subest imar la jilerza de la asociaci6n
entre la exposici6n y dicho desenlace (es decir, la RTI resulta sesgada hacia 1,0) .
La magnitud de este sesgo depende de la RTP y de la magnitud absoluta de las
tasas de prevalencia puntual. Cuando la tasa de prevalencia puntual es mayor en
los expuestos que en los no expucstos (RTP > 1,0), la raz6n de los complementos
de las prevalencias puntuales, ( 1,0 - Prev+) / ( 1,0 - Prev-) es menor que 1,0. Esta
cercana a 1,0 cuando las tasas de prevalencia puntuales son bajas tanto en los
expuestos como en los no expuestos. aunque la RTP sea re lativamente alta. Por
ejemplo, si la prevalencia de la enfennedad en los suj etos expuestos es 0,04 y en
los suj etos no expuesfOs es 0,0 I, la RTP es alta (0,04/0,0 I = 4,0). pero el sesgo que
resul ta de la razon de los complementos de las prevalencias puntuales es solamen-
te 0,96/0.99 = 0,97 ... 1,0. Por otro lado, cuando la prevalencia es relativamente
alta en los individuos expuestos, la raz6n de los complementos de las prevalencias
puntuales puede ser marcadamente menor que 1,0, 10 que da lugar a un sesgo
imponante. Por ejemplo, si la prevalencia de la enfermedad en los sujetos expues-
tos es 0,40 y la prevalencia en los sujetos no expuestos esO,IO, la RTP es la misma
que en el ejemplo previo (4,0): sin embargo, la raz6n de los complementos de las
prevalencias puntuales es 0,6/0,90 = 0,67: esto es, la RTP subestima a la RTI en un
33%. La infIuencia de la magnitud de la prevalencia es a veces apreciable incluso
para un RTP bajo. Por ejemplo, si las tasas de prevalencias puntuales son 0,40 en
los expuesfOs y 0,25 en los no expuestos, la RTPes baslante baja (I ,6), pero el fac-
fOr de sesgo es 0,80: esto es, la RTP subestima a la RTi en un 20%. Obviamente, el
sesgo sera mayor cuanto mayores sean tanto la tasa de prevalencia como la RTP en
uno de los grupos (expuesfOs 0 no expuestos) . Para los eswdios de facfOres que
disminuyen la prevalencia de la enfermedad (es decir. RTP < 1.0). se apJica el
razonamiento recfproco: esto es, ( 1,0 - Prev+)/(l ,0 - Prev-) sera mayor que 1,0 Y
la magnitud del sesgo tambien eslara afectada por las tasas absolutas.
Ejelllplos de sesgos de illcidenciaprevalencia. En los ejemplos que siguen se
supone que la incidencia y la duracion de acuerdo a la exposici6n se han mantenido
eslables en el tiempo.
138 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Sexo e inJarto agudo de/miocardia en norfeamericallos: Los hom-
bres blancos noneamericanos tienen un riesgo mll cho mayor de infarto de
miocardia que las mujeres . Sin embargo, algunos estudios han demostrado
que aun despues de reali zado un aj uste cuidadoso por la edad, las mujeres tie-
ncn una supervivencia promedio mas cana que los hombres(34) . Por tanto, la
razon (DUfoombr.JDur muj.,.,) tiende a ser mayor que 1,0. como consecuencia de
10 cual la RTP que expresa la relaci6n entre el sexo y el infarto de miocardia
sobreslima la RTI.
Hdbiro de fimwr actual y ellft.lema: EI habito de fumar produce un aumento
sustancial del riesgo de cnfiserna. Ademas, la supervivencia (y por cnde la
duraci6n de la enfennedad) en los pacientes con enfisema que continli an
fumando despues del diagnostico es menor que la de aquellos que dejan de
hacerlo. Como resuli ado, las RTP estimadas en estudios transversales que
evalUan la asoc iacion entre el ha.bito de fumar en el momenta del est udio y el
enfisema tienden a subestimar la RTI.
TuberCIIlosis clfnica y reaccion PPD: En el contexto de las evaluaciones de la
relaci6n entre el tamano de la reacci6n al test de PPO en la piel y la tuberculosis
clfnica, un estudio basado en la poblacion Ilevado a cabo por George Comstock
y sus colegas (observaciones no publicadas) hace algunas decadas mostro que
las RTP subest iman las RTI (Figura 4.5) . Esta sub-estimaci6n fue probablemen-
te debida a la prevalencia relativamente alta de tuberculosis clfnica en esta
poblaci6n en eI momento en que se Il evo a cabo eI est udio y condujo por tanto a
la oculTencia del sesgo de la raz6n de los complementos de las prevalencias.
Raz6n de lasas
Raz6n de tasas de incidencia

Raz6n de tasas de prevatencia
1,0
Tamano de ta reaccion a ta tuberculina
Figura 4.5. Representacion esquematica de los resultados del estudio de Comstock et af .
(no puhlicado) en que se evalua la relacioll entre eI tamano de la reaccion PPD y la
tuberculosis clillica. Despues de una encuesta transversal inicial conducida en 1946.la
cohorte rue objeto de seguimiento en el tiempo para detenninar las tasas de incidencia.
Fuell/e: GW Comstock l'I at .. comunicaci6n personal.
FALT .... DE VALIDEZ: SESGO 139
Prevenci6n del sesgo de incidencia-I'revalencia. Si el objetivo es eval uar deter-
minantes poteneiales de enfermedad, siempre que sea pos ible, deberfan utilizarse
casos inc identes con el fin de evitar el sesgo de ineidencia-prevalencia. EI sesgo de
incideneia-prevaleneia, aunque es mas faei l de conceptuali zar comparando tasas
de ineideneia y prevaleneia (transversal), puede tambien veri ficarse en estudios de
casos y controles que utilicen casos prevalentes en lugar de solamente casos nuevos
(ineidentes). Por ejemplo, el habit o de fumar, al disminui r la superviveneia despues
del diagn6stico, hace que disminuya la duraeion de la enfennedad (como el infarto
de miocardio): consec uentemente. un esrudio de casos y controles basado en casos
prevalentes puede registrar una proporeion mas alt a de casos no fumadores (ya que
muchos fumadores habrfan sido e1 iminados del est udio por fall eeimiento) que la que
corresponderfa a un estudio basado en casos ineidentes, con el consecuente debi lita-
miento de la asociaei6n (vease Capftulo I , Figura I . 19) .
Dtro problema en los est udios de casos y controles consiste en que los nuevos
casos (fiagIlOJ"ticadoJ' son ut ilizados como aproximaeiones de nuevos casos de.wrro-
llados . Por tanto, para enfennedades que pueden evolueionar subclfnicamente a 10
largo de muchos afios antes del diagn6stico (tales como la leucemia linfocftica cro-
nica, la diabetes 0 la insufieieneia renal) eiertos casos que se presumen como inei-
dentes son de hecho una mezcla de casos prevalentes e ineidentes, y el sesgo de inei-
deneia-prevaleneia puede emerger sin que se percate el invest igador. Un estudio de
cohorte previene efieientemente el sesgo de ineideneia-prevaleneia siempre que sus
procedimientos incluyan una evaluaeion cuidadosa y se apl ique una exclusi6n de
casos prevalentes en el momento inieial, asf como una blisqueda sistematica y peri o-
dica de nuevos casos y desenlaces subclfnicos.
Sesgo temporal
EI sesgo temporal ocurre cuando la secueneia temporal apropiada necesari a para
demostrar la causalidad, Jactor de riesgo - enJermedad, no puede ser finnemente
establecida. En otras palabras, puede aparecer cuando sea dinc H 0 imposible conocer
que se produjo pri mero, la exposici6n 0 factor de riesgo potencial, 0 la enfennedad.
EI sesgo temporal oc urre tfpicamente en encuestas transversales cuando falta
infonnaci6n sobre la secuencia temporal del supuesto factor de ri esgo y el desenla-
ceo Por ejemplo, debido a que los datos de exposicion y del desenlace se recolectan
en el mismo instante, los resul tados de un estudio de prevalencia pueden establecer
una asociacion estadfstica entre niveles de creat inina serica elevados y la ocurreneia
de tension arterial alta. Debido a que la secueneia de tiempo no puede ser estableci-
da, una asociaei6n transversal entre estas variables puede significar 0 bien que la
creat inina serica alt a (un marcador de fallo renal) conduce a la hi pertensi6n, 0 vice-
versa. En un est udio prospectivo en eI que los niveles de presion arteri al se midan en
personas con niveles normales de creatinina serica que son entonces seguidos en el
tiempo para evaluar la apari ei6n de hi percreatinemia, obviamente se puede identifi-
car la secueneia temporal apropiada, y por tanto, apoyar la concl usion de que la
hipertension arteri al predice la insufieiencia renal incipiente
OS
).
EI sesgo temporal tambien puede oc urrir en los est udios de casos y controles
- aun en los que solamente se incl uyan nuevos casos (ineidentes) - cuando la expo-
siei6n se mide despucs de haberse producido el diagn6stico de la enfermedad en los
casos. Por ejemplo, debido a que la hepatitis viral detectada clfnicamente es mielot6-
140 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
xica, se ha sugerido que la exposici6n al virus de la hepatitis 8 (HBY) puede ser un
factor ctiologico de la Hamada anemia aplastica idiopatica (AA)(J6) . Sin embargo, el
sesga temporal podrfa explicar la relaci6n cnte el HBY y la AA en un est udio de
casas y controles si las muestras de sucro para la determinaci6n de los antic ucrpos a
la HBY y los niveles de antfgeno hubieran sida coleccionadas ames del inicio de la
AA, pucs(Q que los individuos con anemia aphistica pueden recibir transfusiones de
sangre contaminadas con HBY all n ames de que se les haga el diagn6stico. Por 10
tanto, la sec lIcncia inferida es HBV --+ AA, pero la verdadera secuencia es AA no
- rrall.'ifllsi6n de sangre - AA diagllosticada.
Un ejemplo del razonamiento que subyace bajo la posibilidad de sesgo temporal
viene dado por la asociaci6n entre tratamiento hormonal de reemplazo con estr6ge-
nos (THRE) en mujeres postmenopausicas y cancer de endometrid
1i
) . Aunque la
naturaleza causal de esta asociaci6n esta bien establecida, fue inicialmente motivo
de controversia sobre la base de que una mayor probabilidad de ut ilizar THRE resul -
taba de sfntomas que oc urrfan como consecuencia de cancer de endometrio incipien-
te, aun no Por tanto, en lugar de la sec uencia: THRE - cancer de
endometrio, la verdadera secuencia serfa: cancer de endometrio /10 diagnosficado -
sfllfomas - THRE - ct//lcer de endometrio (JiagnoJticado.
Otro ejemplo de sesgo temporal 10 aporta un est udio transversal en ninos holan-
deses donde se encontraron asociaciones negativas entre la posesi6n de un animal
domestico y la alergia, sfntomas respiratori os y asma(39) . Como fue acertadamente
advertido por los investigadores de este estudio, estos resul tados bien podfan haber-
se derivado del hecho de que las famili as son propensas a eliminar de sus casas (0 a
no adqui rir) animales domcsticos despues de que ocurren tales manifestaciones.
Este est udio tambicn subraya por que el termino causalidad inversa se miliza oca-
sionalmente en relaci6n con el sesgo temporal de este tipo.
Otro ejemplo de este tipo de sesgo fue sugerido por Nieto et aUlOl , quienes halla-
ron que la relacion entre el habito de fumar en el momento del estudio y el testimo-
nio de arterioesclerosis clfnica dado por el paciente (definida por ataque al corazon 0
cimgfa cardiaca diagnosticada por un medico) apareda con mas fuerza cuando se
ut ilizaban datos longitudinales que cuando se trataba de datos transversales (en con-
traste con la asociacion entre el habito de fumar y la arterioesc lerosis subclfnica, que
era igualmente fuerte para los datos longitudinales y transversales). Entre las posi-
bles explicaciones ofrecidas por estos autores para tales hallazgos estaba que la oc u-
rrencia de un ataque al corazon (pero no asf la presencia de aflerioesc lerosis subcl f-
nica) puede lI evar a abandonar el habito de fumar, y por tanto, a una dilucion de la
asociaci6n cuando se ut ilizan casos prevalentes (transversal mente) Este tipo de ses-
go puede aparecer incl uso en los analisis prospectivos cuando el desenlace de interes
es la mortalidad. Por ejemplo, la mortali dad a corto plazo de cancer de pulm6n pue-
de ser mayor en ex-fumadores que en los fumadores actuales debido a la tendencia a
abandonar el habito por parte de los individuos sintomaticos 0 que ya han recibido
un diagn6stico. Los epidemi610gos usualmente manejan este sesgo excl uyendo del
anal isis las muefles que ocurren dentro de un periodo especificado despues del
comienzo del est udio.
Para prevenir el sesgo temporal en una enc uesta transversal. ocasionalmente es
posible mejorar la informacion sobre temporali dad cuando se obtienen los datos a
traves de cuestionarios. La temporalidad de los posibles factores de riesgo tales
como el habito de fumar, la act ividad ffsica y las exposiciones ocupacionales, puede
FALT .... DE VALIDEZ: SESGO 141
ser evaluada en muestras transversales por medio de preguntas tales como: (.Cuan-
do est uvo usted por primera vez e:<puesto a ... ?. Para algunas enfennedades cr6ni-
cas, tales como la angina pectoris. tambien es posible obtener informaci6n sobre la
fecha de su aparici6n . Los invest igadores pueden entonces establecer la sec uencia
temporal entre el factor de riesgo y la enfermedad - suponiendo, por supuesto, que
la informaci6n proveida por los individuos encuestados sea exacta. (Obviamente, si
bien la temporali dad puede ser establecida en un estudio transversal, el investigador
lendra aun que li diar con el sesgo de incidencia-prevalencia). Cuando la fecha del
comienzo de la exposici6n es desconocida. como en el ejemplo de la hepat itis viral y
la anemia aplastica, la unica soluci6n es el empleo de datos prospectivos sobre la
exposici6n y el desenlace (un reto formidable en este ejemplo, dada la rareza de la
anemia aplastica).
Fi nalmente, es posible considerar el sesgo temporal que ocurre debido a que la
exposici6n sea una consec uencia de cierta enfermedad no diagnosticada - como en
el ejemplo de THRE y cancer de endometri o anterionnente expuesto- consideran-
do por que ocurri6 la exposici6n . En el est udio de Ant unes et (115
37
) , por ejemplo, los
datos pueden estrat ificarse de ac uerdo a la indicaci6n de uso de THRE, tal como el
metrorragia; si el sesgo temporal no es una explicaci6n probable para la relaci6n
entre el estr6geno y el cancer de endometrio, la asociaci6n se observara tanto para
mujeres a las cuales se prescri bi6 estr6genos debido a que estaban sangrando como
para aquellas a las cuales se les administraron estr6genos por otras razones (por
ejemplo, prevenci6n de osteoporosis) .
4A3. Sesgos relacionados con la evaluacion de las intervenciones de tamizaje
Como en cualquier Olro estudio epidemiol6gico. los est udios para la evaluaci6n de
intervenciones de tamizaje tambien son propensos a sesgos, de los cuales cuatro
ti pos son particularmente relevantcs: sesgo de seleccion, sesgo de incidencia-preva-
lencia, sesgo de longitud y sesgo de tiempo. (Para una cabal comprensi6n de estos
ti pos de sesgos, ellector debe revisar los conceptos que subyacen en la historia nat u-
ral de la enfermedad; para ello vea'ie, por ejemplo, Gordis(9) .)
Sesgo de seleccioll
EI sesgo de selecci6n proviene del hecho de que cuando la evaluaci6n del tamizaje
recae sobre un disefio observacionaL entonces los grupos bajo comparaci6n pueden
diferir sustancialmente con respecto a las razones para el tamizaje. Por tanto, por
ejemplo, las personas que estan incl uidas en un programa de tamizaje pueden tener
un nivel socioecon6mico superior que las que no part ici pan, con 10 que pueden tener
un mejor pron6stico, independientemente de la efect ividad del programa en cues-
tion . La prevenci6n de este tipo de sesgo de seleccion se lI eva a cabo mejor ut ilizan-
do un disefio experimental. Mientras que este tipo de sesgo afecta la vali dez interna
del estudio, un sesgo que afecta su validez externa ocurre cuando la efectividad del
tamizaje (0 de cualquier otra intervencion) varia de acuerdo a las caracterfsticas de la
poblaci6n en estudio, compromet iendose asi la generalizacion de sus resul tados a
otras poblaciones.
142 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Sesgo de illcidencia-prevalencia
EI sesgo de supervivencia OCll rre al comparar el pron6stico en casas prevalentes detecta-
dos en el primer tamizaje (el ell al es similar a una encucsta transversal) con el pron6stico
en casas incidentes dctectados en tamizajes subsiguientes. Este sesgo se produce porquc
los casas prevalentes incl uyen sobrevivientes de largo alcance, que tienen una mayor
supervivencia promedio que la de los casas incidentes, en los que esta representado todo
el especlro de niveles de gravedad. E.<; te tipo de sesgo puede ocurrir en estudios pre-
p o s t ~ ) . como cuanda se campara una estratcgia de tamizaje ut ilizado en el primer exa-
men del tamizaje (<<pre), que idemifica casas prevalentes, con una estrategia diferente a
la utilizada en tamizajes subsecuentes para identificar casos ind dentes (<<post).
Un sesgo reladonado es el ll amado se.\go de longill/d, presente cuando. como
evidencia de que el programa de tamizaje es efecti vo, se aduce un pron6stico mejor
para los casos detectados directamente por el procedimiento de tamizaje (por ejem-
plo, test de sangre oculta para el cancer colorrectal) que para los casos diagnostica-
dos entre unos y otros examenes de tamizaje. Para entender este tipo de sesgo es
imponame revisar brevememe algunos concep{Qs claves relacionados con la historia
natural de una enfe rmedad y el tamizaje.
La efectividad de un tamizaje esta positivamente reladonada con la extensi6n de la
fase preclfnica detectable (FPO; vease Figura 4.6 y, para las definiciones, la Tabla 4.10),
que en su momento refl eja la tasa en la cual la enfennedad progresa. Esto significa
que para enfermedades con una progresi6n rapida es diffcil , y hasta totalmente
imposible, mejorar el pron6stico por medio de una detecci6n temprana. Por ejemplo,
un promedio conn de FPO y una pobre supervivenci a caracterizan a la mayorfa de
los casos de cancer de pulm6n, para los que el tamizaje generalmeme no result a
efectivo. Por otro lado.la larga FPO en cancer cervico-uterino ill .\itu explica por que
el tratamiento que sigue a una prueba citol6gica positi va que sugiere un carcinoma
in J'ifu esta relacionado con una tasa de curaci6n de vinualmente el 100%.
Aparici6n
biol6gica
de la
enfermedad
A
Punto mas Punto en el Diagn6stico Desenlace
temprano en el que se realiza usual basado (par ejemplo,
que el diagn6stico el ciagoostico en enfermedad muerte,
es pasible
B
temprano sintomlttica recurrencia, etc,)
C
01 02 03
E F
I

Fase preclinica detectable
~ ,
Supervivencla despues del diagnostico temprano
~ , " ,
Tlempo de anticlpaclon Supervlvencla despues
del diagnOstlco usual
Puntos cr iticos
Figura 4.6. Hi stori a natural dc una cnfermcdad
Fuente: L Gordis, Epidemiology, 231 , 1996, WB Saunders Company.
FALT .... DE VALIDEZ: SESGO 143
Tabla 4.10
Historia natural de una enfermedad: definicion de los componentes
representados en la Figura 4.6
Componente
Fasa preciinicamente
detectable
Puntos criticos
Tiempo de
anticipaci6n
Aepresentado en
la Figura 4.6 como ..
EI intervalo entre
los puntos ByE
01.02y03
EI intervalo entre los
puntos eyE
Deflnlci6n
Fase que comienza cuando es posible un
diagn6stico temprano y termina con el punto
en el tiempo en el cual sa hubiera hecho el
diagn6slico usual basado 1m los sfntomas dQ
la entermedad.
Puntos luego de los cuales la detecci6n y
tratamiento tempranos son poco etectivos
trente al tratamiento que sigue al diagn6stico
usual. EI tratamiento es completamente ine
tectivo despues del ultimo punto critico (punto
03 en la tigura).
PeriodO entre el instante en que se produjo el
diagn6stico temprano y el momenta en el
cual se hubiera hecho el diagoostico usual
(basado en los sintomaSj.
Fuente: L Gordis. Epidemiology. 11:1 1996. WB Saurnlers Company.
Incluso con la misma enfermedad, independientememe del tamizaje, puede
rlemostrarse fllle los pacienles clt ya enfermerlarl tiene Itna FPO mayor ti enen mejor
pron6stico que aquell os en los que la enfermedad ti ene una FPO mas corta (por
ejemplo, cancer de mama postmenopausico freme a premenopausico, respect iva-
meme) . Por ejemplo, en el estudio del plan de seguros para la salud sobre la eficacia
del tamizaje para el cancer de mama, los Ilamados casos de .<intervalo - esto es,
casos que son clfnicamente diagnosticados durante el intervalo transcurrido entre
dos examenes de tamizaje - tenlan en promedio una tasa de letalidad mayor que los
casos subclfnicos diagnosticados como resultado del examen de Aunque
algunos de estos casos pueden haber sido falsos negat ivos no detectados por el exa-
men de tami zaje, y por tanto, no ser verdaderamente casos de intervalo, muchos fue-
ron probablemente caracterizados por tumores de crecimiento rapido. esto es, un
corto FPO (Figura 4.7). Se deriva de ell o que cuando se evalua un programa de tami-
zaje, debe tenerse en consideraci6n cuidadosa el hecho de que los casos detectados
por el procedimiento de tamizaje (por ejemplo, la mamograffa), que por tanto tien-
den a tener una FPO mas larga, tienen un pron6stico inherentemente mejor que los
casos dntervalo, independienrcmellfe de la eJecrividad del ramizaje. Pasar por alto
tal advertencia result a en un sesgo de longitud, que ocurre cuando un pron6stico
mejor para los casos rletectarlos por el tamizaje se IJli li za como inrl icio rle '1l1e el pro-
grama de tamizaje es efectivo, cuando en realidad puede ser debido a que la FPO era
mas larga en estos casos, rellejo de una enfennedad que progresa mas lemamente
que la de los casos intervalo,
UI prevcnci611 de sesgos de longitud puede conseguirse apelando a un experi -
memo y comparando el pron6stico de rodo.\ los casos (tanto los que tienen FPO lar-
144 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
2-------
3 - - - - - - - - - - - - - - - - - - - - - - - - - - ~ - - -
4----
5 -------
y
primer cribado
Tiempo .........
6-------
7 ----
8
T
segundo cribado
Figura 4.7. Represcnt acion esqucllul.ti ca de la longitud de ulla rase detectable prcclinica
(FPD) ell casos que ocurren durant e un programa de ta mizaje. Casos con una FPD mas
larga (casas N.
o
I, 3 Y 8) tienen una probabilidad mas alta de identificaci6n en cada examen
de tamizaje. Los casos con una FPO mas corta que ocurren entre los examenes de tamizaje
son los casos intervalo (casos N.o 2. 4.6 Y 7). El caso N.o 5 es un falso negativo (no detec-
tado por el primer examen).
gas como cortas) que ocurren en individuos asignados al eatoriameme a un programa
de tamizaje con los de (odos los casas que ocurren en los controles asignados aleato-
riamente a un gmpo que no sera. objeto de examenes de tamizaje.
Sesgo de anticipacion en eI diagll ostico
Ellapso que nos ocupa es aquel durante el cual el diagnostico puede antidparse debi-
do al tami zaje. Es eI tiempo que media entre el diagn6stico temprano (Figura 4.6, pun-
to C) y el momento en que el diagn6stico se hubiera producido si no se hubieran
aplicado pmebas para el diagn6stico temprano (Figura 4.6, punto E; vease tambien
Tabla 4- 10) . Este lapso, por tanto, esta contenido dentro de la FPO.
Cuando se evalUa la efecti vidad del tamizaje, el sesgo de antic ipad6n en el diag-
nostico ocurre cuando la supervivenda (0 tiempo libre de recurrenda) se cuenta des-
de el instante en que se hizo el diagn6stico temprano. Por tanto, aun cuando el tami-
zaje sea inefectivo. el diagnostico temprano afiade tiempo a la supervivenda contada
desde el momento del diagn6stico usual. La supervivenda puede entonces aumen-
tarse desde el momento del diagnostico temprano, pero no desde la aparid6n biolo-
gica de la enfermedad (Figura 4 .8)(42) .
El sesgo de antic ipadon en el diagn6stico ocurre solamente al estimar la supervi-
venda (0 tiempo transcurrido hasta eI desenlace de interes) desde el momento del
Comienzo
biol6gico
FALT .... DE VALIDEZ: SESGO
Diagn6stico
precoz
Muerte
: {l }Tiempo de
anticipaci6n
Paclente A --"t.' _____ ______ .ii ____ _
Comienzo
btol6gtco
Diagn6stico
basado en
sfntomas
{2}
Muerte
: .. ,
Paclente 8 --'t'-___________ 1L' _______ 1L' ___ _
Tiempo
145
Figura 4.8. Representacion csquematica del scsgo de anticipacion en eI diagnostico: a
pcsar del diagnostico temprano mediante tamizajc , la supervivcncia del paciente A es la
misma que la del paciente 8 , cllya enfermedad fue diagnosticada debido a los sfntomas clf-
nicos. en virtlld de que la supervivencia (A) = (I) tiempo debido a la anticipaci6n + (2)
Supervivencia (8).
Fuente: L Gordis, Epidemiology, 235 we Saunders Company.
diagnostico. Por 10 tamo, el sesgo de ant icipacion en el diagn6stico puede evit arse
calculando el riesgo de mortali dad 0 la tasa entre todos los sujetos objeto del tamiza-
je y los controles en lugar de la probabilidad acumulada de supervivencia (0 su com-
plemento, la probabilidad acumulada de letalidad) desde el diagnostico entre los
casos(9) . Si se opta por la supervivencia desde el diagn6stico como estrategia para
describir los resultados de la evaluacion de un proceso de tami zaje, debe esrimarse la
duracion promedio del ti empo afiadido por la antici paci6n mencionada y tenerla en
cuenta al comparar la supervivencia despues del diagn6stico entre los grupos inclui-
dos y no incl uidos en el tamizaje . Para que la supervivencia se considere aumentada
desde la aparici6n biologica, tiene que ser corregida por este concepto: esto es, debe-
rIa ser mayor que la supervivencia despues del diagn6stico usual mas dicho lapso
(Figura 4.9).
Si la enfermedad para un individuo dado se identifica a traves del tami zaje, es
impos ible conocer cuando el diagnostico usual se hubiera hecho si no se hubiera
llevado a cabo el tamizaje . Por tanto, no es posible estimar el tiempo de antic ipaci6n
para paciemes individuales, sino solamente un tiempo de ant ici pacion pmll/uJio. A
cominuaci6n se da una descripcion simplificada del enfoque basico utilizado para
estimar eI tiempo de ant ici pacion promedio. Una manera mas detallada de reali zar
tal estimaci6n escapa a los Ifmites de este li bro de texto de metodos intermedios, por
10 que habrfa que acudir a otra fuente(42).
EI primer paso en la esti macion del tiempo de antic ipaci6n promedio es la esti -
macion de la du raci6n promedio de la FPO. Como se menciono previamente. el
tiempo de ant icipacion es un componente de la FPO. Por tanto, para estimar el ti em-
po de ant ici pacion promedio es necesario pri mero estimar la duracion promedio de
la FPO (OurFlV), ut ilizando la conocida relacion entre la prevalencia (PreVFl'D), y la
incidencia (InCFI'D) de los casos precl fnicos: esto es casos en la FPO (vease tambi en
Capitulo 2, Secci6n 2.3, Ecuaci6n 2.4):
146 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
PreVFI'D = i nCFI'D )( DUf FPD X ( 1,0 - PrevFI'lJ)
La duraci6n de la FPO puede entonces ser facilmente derivada:
PreVFI'lJ
DUfFl'D =
incFI'u x ( I ,0 - PrevF\'l))
Si la prevalencia de la enfermedad no es mlly alta (por ejemplo, no mayor de
aproximadamente 5%), 1,0 - PreVFI'lJ estara cercana a 1,0, Y por tanto, la ecuacion
anteri or puede simpli ficarse:
Para apli car esta fannu la, la PrevA'U se estima utili zando datos del primer examen
de tamizaje de la poblacion objeto, que es equivaleme a una encuesta transversal. La
InCA'll puede estimarse en examenes sucesivos del tamizaje entre los sujetos objeto de
tamizaje que se enClIcnt ran libres de enfennedad en el momentQ del primer examen.
Una manera alternat iva de est imar InCA'll, que no requiere del seguimiento de los suje-
lOS objetos de tamizaje, es uti li zar la incidencia de enfennedad cifnica en la poblaci6n
de referencia, si esta disponible. El razonamiento en que se fundamenta eSle procedi-
miento, y una suposicion importante que j ustifica el lamizaje, es que, si se dejan sin tra-
lar, los casos precifnicos necesariamente se conveniran en casos cifnicos; por tanto, no
deberfa haber una diferencia entre la incidencia de la enfennedad cifnica y la de la
enfennedad preci fnica. Sin embargo. cuando dispone de informacion sobre incidencia
de enfermedad cifnica (por ejelll plo, basada en datos de registro de cancer), es illllXlr-
Comienzo
biol6gico
Diagn6sticc
precoz
: (l)Tiempode
Ganancia de supervivencia
para el paciente A
( M",,"
, anticipaci6n (3)
_
l ______ _____ _
Pacienle A y t t
Comienzo
biol6gico
Diagn slico
basado en
sintomas
{2}
Muerle
: .. . :
Pacienle 8 _.L ___________ --'y'---____ --'YL _____ _
Tiempo
Figura 4.9. Represent acion esquematica del sesgo de anticipacion en el diagnostieo:
suCni vencia del paciente A procedente del diagnOstiro temprano es mejor que la del
paciente 8 , puesto que la super vivencia (A) > (1) tiempo debido a la anticipaci{m + (2)
Supervivencia (8 ).
Fuente: L Gordis, Epidemiology, 235 1996, WB Saunders Company.
FALT .... DE VALIDEZ: SESGO 147
tante aj ustar por las diferencias en la prevalencia de los factores de riesgo, de la que se
espera que sea mayor en los sujetos objetos de tamizaje que en la poblaci6n de referen-
cia de la cual se obtiene aquell a informaci6n de incidencia clfnica. Por tanto, por ejem-
plo, una hi storia familiar de cancer de mama es mas preval ente en mujeres que son
objeto de tamizaje para cancer de mama que en el total de la poblaci6n femenina.
Despues de esto, utilizando el estimado de la duraci6n de la FPO, la esti maci6n del
tiempo de antic ipaci6n promedio necesit a tener en cuenta si eI diagn6stico temprano
mediant e tami zaje se hace en el primero 0 en los examenes de tamizaje subsiguientes.
La estimaci6n del tiempo de antici pacion de casos prec lfnicos prevalentes punt ua-
les detectados en el pri mer examen de tamizaje recae sobre la suposici6n relacionada
con la distribuci6n de tiempos de diagn6stico temprano durante la FPO. Por ejemplo,
si la distribuci6n de diagnostico temprano mediante tamizaje puede suponerse homo-
genea a traves de la FPO - esto es, si la sensibilidad de la prueba empleada para el
tamizaje es independiente del momenta en que se aplica dentro de la FPO (Figura
4.IOA) - eI tiempo de anticipaci6n de la prevalencia puntual de casos precl fnicos pue-
de simplemente esti marse como:
. ..., FPO
Tlempo de ant lcl paclon = --
2
La ultima suposici6n, sin embargo, puede no estar justificada en muchas situacio-
nes . Para la mayorfa de las enfermedades susceptibles de tamizaje (por ejemplo, can-
cer de mama), la sensibilidad de Ia pmeba de tami zaje, y por tanto, la probabilidad
del diagn6stico temprano, probablemente aumenta durant e la FPO (Figura 4.108)
A. Ln (lennibilidnd del exnmen de eribndn
es la misma a 10 largo de la lase
preclinica detectable (FPO):
Tiempo promedio de anticipaci6n _ 112 FPO
111111
I . 1--------
B. Sensibilidad del examen de cribado
durante la lase preclinica
detectable (FPO) como un
del progreso de la enlermedad:
FPD
Tiempo promedio de anticipaci6n < 112 FPO
1 1
Fase clfnica
1-. 1--- -----
FPD Fase clfnica
Figura 4.10. Estimaci{m del ticmpo de anticipacion como una fundon de la variabilidad
de la scnsibilidad del examcn de tamizaje durante la fase preclfnica detectable
148 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
como un resultado de la progresi6n de la enfermedad a medida que se acerca hacia
su fase sintomatica (clfnica) . Si este fuera el caso, una suposici6n mas razonable
consist irfa en que el tiempo de antic ipaci6n promedio fuera mcnor que la mitad de la
FPO. Obviamente, mientras mas larga sea la FPO, mas largo el tiempo de antic i-
padon bajo cualquier suposici6n distribucional. Ademas, debido a que el tiempo de
antic ipaci6n promedio es una fllnd6n de la validez del examen de tamizaje, este se
{Qrna mayor a medida que se desarroll an pmcbas de tamizaje de mayor sensibi lidad.
La duraci6n del tiempo de amici pad6n para casos preclfnicos incitiellfes ident ifica-
da en un programa donde se lIevan a cabo examenes de tamizaje repetidos es una fun-
cion de cuan a menudo se hagan los tamizajes - esto es, la duracion del intervalo entre
tamizajes sucesivos. Mientras mas cercanos en el tiempo esten los examenes de tamiza-
je, mayor sera la probabil idad de que ocurra un diagnostico temprano mas cerca del
comienzo de la FPO- , Y por tanto, mas se acercara el tiempo de anticipacion a la FPO.
La Figura 4.1 1 ilustra esquematicamente intervalos cortos y largos entre tamiza-
jes y su efeclO sobre el tiempo de antic ipacion . Suponiendo dos personas con FPO
similares cuya enfermedad comienza poco despues del tamizaje previo, aquell a con
el menor intervalo entre tamizajes (a hasta b, paciente A) tiene su enfennedad precl f-
nica recientemente desarrollada diagnosticada mas cerca del comienzo de la FPO
Tiempo __
1
Primer examen
de cribado
Tiempo de anlicipaci6n
1
Pacienle A
2,examen de cribado
Tiempo de anlicipaci6n
Pacienle B
2.examen de cribado
b
Figura 4.11. Relacion cntre rrecncllci a del tamizajc y duracion del tiempo de antici-
pacion. Las lfneas horizontales representan la duraci6n de la fase preclfnica detectable
(FPD). En el paciente A. el segundo examen de tamizaje se lIeva adelante muy poco despues
del primer examen de tamizaje: tiempo de anticipaci6n ... FPD. En el paciente B. el intervalo
entre tamizajes es mas largo: tiempo de anticipaci6n ... (.05) x FPO.
FALT .... DE VALIDEZ: SESGO 149
que la persona a la que corresponden intervalos de tamizaje mas largos (a hasta c,
pacieme B). Por tamo, la duracion del tiempo de amic ipacion sera mas cercana a la
duracion de la FPO para el paciente A que para el paciente B. EI tiempo de antic i-
pacion maximo, obviamente, no puede ser mayor que la FPO(43).
45. SESGOS AL COMUNICAR LOS RESULTADOS DEL ESTUDlO,
SESGO DE I' UBLI CACION
Algunos problemas comunes que pueden inlluir sobre la calidad del informe de los
estudios epidemiol6gicos y que pOOrfan potencialmeme crear sesgos se discuten en
detall e en el Capitulo 9. En esta seccion, nos centramos en un tipo especial de sesgo
de comunicacion: el sesgo de publicaci6n.
La aceptacion de la validez de los hallazgos publicados que .\e uplican a una
poblacion de referencia dada es(a condicionada por dos suposiciones importantes: I)
que cada est udio publicado sea insesgado y 2) que los estudios publicados constilll-
yan una muestra insesgada de una poblacion teorica de estudios insesgados (Figu-
ras 4.12 y 4.13). Cuando estas suposiciones no se cumpl en, una revis ion de la litera-
(ura basada en enfoques me(a-anaifticos 0 en {(!cnicas convencionales dara una
vision distorsionada de la asoc iaci6n de interes entre exposicion y desenlace. Que la
suposicion 1 se cumpla depende de varios factores, incluyendo la solidez de los dise-
fios empleados y de la caUdad del peer review. EI sesgo de publicacion, como se
define convencionalmente, ocurre cuando la suposicion 2 no puede cumpli rse por-
I ~ - L" "I,d;" p,bI;"d" roo";,",,,
/ : "'- una muestra de tados los estudios
insesgados
,
Poblaci6n de estudios
'" insesgados
. ~ ~
~
~
~
Resultados de los estudios
OR Verdadero
Fi gura 4.12. Los estudi os puhlicados constituyen una muestra represcntati va de una
pobl acion,. de referenci a teorica de estudios no sesgados (no hay sesgo de puhlicacion)
ISO EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Poblaci6n de estudios
insesgados
Estudios publicados, que
It{
no son una muestra
I represenlativa de tados
A los estudios insesgados
I Sesgo
1
Resultados de los esludios
OR en estudios
public ados
OR Verdadero
Figura 4.13 Sesgo de publica cion: los csludios publi cados COII StitUYCII una muestra sesga-
da de una pobJacioll de referenda t e6rica de estudi os inscsgados (sesgo de publi caci on)
que, ademas de la cali dad del (rabaja reporte, son Qlros los factores que deciden su
aceptahilidad para 1a publicaci6n. La direcci6n de los hall azgos es uno de es(Os fae-
(Ores . Por ejemplo, en un est udio lI evado a cabo haec algunas decadas, Sterling+t
l
demostr6 que el 97% de los trabajos publicados en cuatro revistas de psicologfa
mostraban result ados significativos al nivel alfa del 5%; por tanto, sugerlan fuerte-
meme que los resul tados ten Ian mas probabilidad de ser publicados si habfan llegado
a ese nivel de significaci6n convencional.
Invest igaciones subsiguiemes(4S.4<J) han confirmado la tendencia a publicar resul -
tados En un est udio realizado por Dickersin(47) que compara ensayos
cl fnicos aleatorizados publicados con otros ya concluidos por los mismos investiga-
dores pero todavfa no publicados, e155% de los publicados pero solo eI 15% de los
est udios no publicados favorecfan el nuevo tratamiemo que se estaba evaluando.
Una raz6n posible para eI sesgo de publicaci6n es la resistencia de los editores de
las revistas y de los revisores a aceptar resul tados negat ivos (l,no interesantes?).
Por ejemplo. en un est udio debido a Mahoney(SO) , a un grupo de 75 revisores se les
pidi6 que valoraran diferentes versiones (asignadas aleatoriamente) de un manuscri -
(0 ficl icio I .as secciones ne i ntmnllcciom) y ne (onas las versiones eran
identicas, mientras que las secciones de Result ados y Discusi6n eran diferen-
tes: iban desde result ados positivos a ambiguos>, a negativos. A los revisores
se les pidi6 que evaluaran los metodos, la presentaci6n de los datos, la contribuci6n
cieniffica, y el merilO de la publicaci6n. Comparando con los est udios negativos 0
ambiguos, los manuscri lOs con resultados positi vos sistematicamente reciblan
FALT .... DE VALIDEZ: SESGO 151
puntuaciones medias superiores para todas las categorfas, incl uyendo la categorfa de
evaluacion de los metodos, aunque la seccion metodos era identica en todos los
conjuntos.
Curi osamente, sin embargo, los edit ores y los revisores pueden no ser la unica
fuente de sesgo de publi caci6n. Por ejemplo, en el estudio de Dickersin et al .(47) se
detect6 que solo para el 12% de los estudios completos pero todavfa no publicados,
sus autores pretend fan publicarla. Entre las razones dadas por los autores para expli-
car por que renunciaba el 88% restante inclufan resul tados negativos (28%), fal-
ta de interes ( 12%) y problemas del tamano de la ( I 1%) .
Incl uso la fuente de financiaci6n parece interferi r con la probabilidad de publica-
cion. Davidson(S' ), por ejemplo, encontr6 que los ensayos clfnicos que favoredan
una terapeutica nueva sobre una tradicional que estaban financiados por la industria
fannaceutica tenfan un odd.\ de publicaci6n 5,2 veces mayor que la de ensayos
financiados por otras fuentes, tales como los Instit utos Nacionales de Salud.
Algunas fonnas de sesgo de publicaci6n son bastante sutiles, tales como el sesgo
de idioma>, (es deci r, la publicaci6n en una revista de habla inglesa frente a la publi -
caci6n en una revista en otra lengua) . Por ejemplo, Egger et al.(S2) compararon ensa-
yos clfnicos aleatorizados publicados por invest igadores alemanes en revistas alema-
nas 0 en revi stas inglesas entre 1985 y 1994. Cuando dos artkulos del mismo primer
autor eran comparados, no se encontraron diferencias en calidad entre los trabajos
escritos en aleman 0 en ingles. En contraste, se constato una diferencia fuerte, estadfs-
ticamente significat iva, con relacion a la significaci6n de los hall azgos: eI 73% de los
artfc ulos publi cados en ingles comunicaban un resultado estadfsticamente significati -
yo, rasgo presente en solamente el 35% de los artkulos publicados en aleman (OR =
3,8; ifmites de confianza del 95 % 1,3 - 11 ,3) . Estos result ados sugieren claramente
que ut ilizar eI idioma como uno de los criterios para seleccionar estudios para incl ui r
en un meta-analisis (un criterio que se adopta frecuentemente debido a razones practi -
cas 0 relacionadas con el acceso) puede socavar seri amente la representatividad de las
revisiones publicadas.
Los dos enfoques sistem:'iticos mas a menudo ci tados para evitar el sesgo de
publicacion son la creacion de registros de y la publicacion previa de
disenos de investigacion(B), La prevencion del sesgo de publicacion, obviamente,
requiere esfuerzos por parte de la comunidad cientffica como un todo, incl uyendo
los investigadores, los revisores y los editores de revi stas , Estos ulti mos han de
adverti r que la direccion de los hallazgos y la ausencia de result ados significativos
no deberfan contemplarse como criterio para rechazar 0 aceptar un trabajo.
BlBLiOGRAFIA
1. Sackett DL. Bias in analytical research. J Chron Dis 1979: 32: 51-63.
2. Last 1M. A Dklionary of epidemiology. 3: ed. New York. Oxford Universi ty Press .
1995:15 .
3. Lilienfeld DE, Stolley PD. FOllndations of epidemiology. New York. Oxford Uni versi ty
Press. 1994.
4. Schlesselman JJ . Case-conlrol sllidies: Design, condlld, analysis. New York. NY:
Oxford Universi ty Press . 1982.
5. Rothman K1. Greenland S. Modem epidemiology. 2.' ed. Philadelphia. Lippincott-Raven
Publishers: 1998.
152 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
6. Byrne C, Brinton LA. Haile RW el al. Heterogeneity of the effect of family history on
breast cancer risk. Epidemiology 1991: 2: 276-284.
7. MacMahon B. Yen S, Trichopoulus D el al. Coffee and cancer of the pancreas. N Eng/ J
Aled 1981: 304: 630-633.
8. Hsieh ce. MacMahon B. Yen S el al . Coffee and pancreatic cancer. N Eng/ J Med 1986:
315: 587-588. Letter.
9. Gordis L. Epidemiology. Philadelphia, WB Saunders, 1996.
10. Weinstock MA. Colditz GA. Willett we el al. Recall (report) bias and reliability in the
retrospective assessment of melanoma risk. Alii J Epic/ell/;ot 1991: 133: 240-245.
11 . Brinton LA. Hoover RN. Szklo M elili. Menopausal estrogen use and risk of breast can-
cer. Cancer 198]: 47: 2517-2522.
12 . Chambless LE, Heiss G, Folsom AR fI al. Association of coronary heart disease inciden-
ce with carotid arterial wall thickness and major risk factors: the Atherosclerosis Risk in
Communities (ARIC) study, 1987-1993. Alii} Epidemio/l997: 146: 483-494.
13 . Mele A. Szklo M. Visani G el al. Hair dye use and other risk factors for leukemia and
pre-leukemia: a case-comrol study. Italian Leukemia Study Group. Am } Epidemiol
1994: 139: 609-619.
14. Wei Q. Matanoski GM, Farmer ER el al. DNA repair and susceptibility to basal cell car-
cinoma: a case-control study. Alii} Epidell/iol 1994: 140: 598-607.
15 . Commonwealth of Australia, National Health and Medical Research Council. 77Ee heallh
ejJeclJ of passive smokillg. November 1997. Canberra: Australian Government Publis-
hing Service.
16. Szklo M. Tonascia L Gordi s L. Psychosocial factors and the risk of myocardial infarc-
tions in white women. Alii} Epidell/iol 1976: 103: 312-320.
17. Doll R'Hill AB. Smoking and carcinoma of the lung: preliminary report. B Med} 1950:
2: 739-748.
18 . Pemeger TV. Whelton PK, Klag Ml . Rossiter KA. Diagnosis of hypertensive endstage
renal disease: effect of patient's race. Alii} Epidemiol 1995: 141: 10-15.
19. Stewart WF. Linet MS, Celentano DD c/ al. Age and sex specific incidence rotes of
migraine with and without visual aura. Am} Epic/ell/iol 1991: 134: 1111-1120.
20. Rose GA. Chest pain questionnaire. Milbank Melli Fund Q 1965: 43: 32-39.
21. Bass EB, Follansbee WP, Orchard TJ . Comparison of a supplemented Rose questionnai-
re to exercise thalium testing in men and women.} Clin Epidemio/1989: 42: 385-393.
22. Garber CE, Carleton RA, Heller GV. Comparison of Rose questionnaire angina to
exercise thalium scintigraphy: different findings in males and females.} Clin Epidellliol
1992:45: 715-720.
23. Sorlie PD. Cooper L. Schreiner PJ el al. Repeatabilit y and validity of the Rose question-
naire for angina pectoris in the Atherosclerosis Ri sk in Communities study.} Clill Epide-
lIIio11996: 49: 719-725.
24. Dosemeci M, Wacholder S. Lubin lH. Does nondifferential misclassification of exposure
always bias a true effect toward the null value? Alii} EpidemioI1990: 132: 746-748.
25. Greenland S. The effect of misclassification in the presence of covariates. Alii} Epide-
mio11980: 112: 564-569.
26. Wacholder S. When measurement errors correlate with truth: surprising effects of non-
differential misclassification. Epidemiology 1995: 6: 157-161.
27. Flegal KM. Brownie C, Haas JD. The effects of misclassification on estimates of relative
risk. Anli Epidemiol 1986: 123: 736-751.
28. Flegal KM, Keyl PM. Nieto FJ . Di fferential misclassification arising from nondifferen-
tial errors in exposure measurement. A.III} Epidellliol 1991: 134: 1233- 1244.
29. Willet W. An overview of issues related to the correction of non-differential exposure
measurement error in epidemiologic studies. Sial Med 1989: 8: 1031-1040.
30. Thomas D, Stram D, Dwyer J . Exposure measurement error: influence on exposure dise-
ase. Relationships and methods of correction . Allnll Rev Pllblic Heallh 1993: 14: 69-93.
FALT .... DE VALIDEZ: SESGO 153
31. Amlstrong BG. TIle effects of measurement errors on relative risk regressions. Alii J Epi-
dell1ioI1990: 132: 1176-1184.
32. Kannel WB. CHD risk factors: a Framingham study update. Hosp Prat-o 1990: 25:
93-104.
33. Giovannucci E. Ascherio A. Rinun EB et al. A prospective cohort study of vasectomy
and prostate cancer in US men. JAMA 1993: 269: 873-877.
34. Goldberg Rl, Gorak El, Yarzebski J . A communitywide perspective of sex differences
and temporal trends in the incidence and survival rates after acute myocardial infarction
and out-of-hospital deaths caused by coronary heart disease. Cirwlalion 1993: 87:
1947_1953.
35. Pemeger TV. Nieto Fl, Whelton PK. A prospective study of blood pressure and serum
creatinine: results from the CLUE study and the ARIC study. JAMA 1993: 269:
488-493.
36. Szklo M. Aplastic anemia. En: Li lienfeld AM. (ed.). Reviews in cancer epidemiology.
vol l. New York. Elsevier North-Holland. 1980: 115-119.
37. Antunes CM. Stolley PD. Rosenshein NB. Endometrial cancer and estrogen use: report
of a large case-control study. N Engl J Med 1979: 300: 9-13.
38. Horwitz RI , Feinstein AR. Estrogens and endometrial cancer: responses to arguments
and current status of an epidemiologic controversy. Am J Med 1986: 81: 503-507.
39. Brunekreef B. Groot B. Hoek G. Pets. allergy and respiratory symptoms in children. lnl J
Epidell1iol1992: 21: 338-342.
40. Nieto FJ . Diez-Roux A. Szklo M. Comstock GW. Sharret AR. Short and long teml pre-
diction of clinical and subclinical atherosclerosis by traditional risk factors. Inl J Epide-
lI1ioI1999: 52: 559-567.
41. Shapiro S, Venet W. Strax P. Selection, follow-up. and analysis in the Health Insurance
Plan study: a randomized trial with breast cancer screening. NaIl Canar hw Monogr
1985: 67: 65-74.
42. Hutchison GB. Shapiro S. Lead time gained by diagnostic time screening for breast can-
cer. J Nail Canar Insl 1 Y6l:1: 41: 665.
43. Morrison AS. Saeening in chronic disease. Monographs in Epidemiology and Biostatis-
tics. vol. 7. New York. Oxford University Press. 1985.
44. Sterling TO. Publication decisions and their possible effects on inferences drawn from
tests of significance or viceversa. J Alii SIal A.uoc 1959: 54: 30-34.
45. Dickersin K. Hewitt P. Mutch L eI al. Perusing the literature: comparison of MEDLI NE
searching with a Perinatal Trials database. Control Clin Trials 1985: 6: 306-317.
46. Dickersin K. Chan S. Chalmers TC et al. Publication bias and clinical trials. COII/roi Clin
Trials 1987: 8: 343-353.
47. Dickersin K. Min Y- 1. Meinert CL. Factors influencing publication of research results.
JAMA 1992: 267: 374-378.
48. Easterbrook PL Berlin JA. Gopalan R el al. Publication bias in clinical research. umat
1991: 337: 867-872.
49. Dickersin K. Report from the Panel on the Case for Registers of Clinical Trials at the
eighth annual meeting of the Society for Clinical Trials. Conlrol Clin Trials 1988: 9:
76-81.
50. Mahoney Ml. Publication prejudices: an experimental study of confirmatory bias in the
peer review system. Cog Ther Res 1977: I: 161-175.
'i I . RA. Source of fllnrline Olllcome o f . .1 (;",1 In/pm MPff 191<11:
I: 155-158.
52. Egger M. Zellweger-Zahner T. Schneider M el al. Language bias in randomised contro-
lled trials published in English and Gennan. UJncetl997: 350: 326-329.
53. Piantadosi S. Byar DP. A proposal for registering clinical trials. Control Clin Trials 1988:
9: 82-84.
CAPITULO 5
La identificacion de asociaciones
no causales: confusion
5.1. INTRODUCCION
EI vocablo COllfllsi6n alude a una siwaci6n en la que se observa una asociaci6n
no causal entre una exposici6n dada y un desenlace, que ocurre como consc-
cuencia de la influencia de una tercera variable (0 de grupo de variables), a la
que usualmente se design a como variable conlusora, 0 simplemente como COII-
/llsor . Con forme fue discutido anteriormenle, la variable confusora ti ene que
eslar relacionada tanto con un supuesto factor de riesgo como con el desenlace
bajo estudio. En un eswdio observacional de cohone, por ejemplo, una variable
confusora diferirfa entre sujetos expuestos y no expueslos, y ademas estarfa aso-
dada con el desenlace de imen!s. Como se mostrara en los ejemplos que siguen.
eslo puede dar como resul{ado la aparid6n 0 inlensificad6n de una asodaci6n
que no es debida a un efeclo causal direclo, 0 bien puede producir la ausencia
aparenle (0 el debililamienlo) de una asociaci6n causal que es, en rigor, verda-
dera.
Desde un punlo de visla eminememenle epidemiol6gico, es lilH concepUlalizar la
confusi6n como algo dife renle a un sesgo en el senlido de que, atmque la relaci6n no
sea causal, sf es real (vease la Secci6n 5.4.7 para una discusi6n mas profunda de esle
conceplo). ESla disl inci6n li ene obvias implicaciones praclicas con respecfO a la
relevancia de los faclores de exposici6n como marcadoreJ" de la presencia 0 rie.\-go
de enfermedad con prop6silos de pesquisaje (prevencion secundaria) . Si, por olra
parle, el prop6sito del invesligador es ejecutar acciones de prevenci6n primaria,
enlonces la disl incion entre relaci6n causal y no causal se lorna crucial, ya que esla
ult ima se debera a los sesgos 0 al efecfO de uno 0 mas confusores. Como se describe
en delall e en el Capitulo 7, se dispone de diversas lecnicas esladfslicas para conlrolar
el efeclo de la confusi6n; la idea basica subyacente consisle en usar algun modelo
eSfadi\"fico para estimar cual serfa la asociaci6n enlre la exposici6n y el desenlace,
dado un valor 0 nivel constante de la posible variable confusora (0 variables confu-
soras).
Es mas verosfmH que la confusi6n lenga lugar en un estudi o epidemiol6gico
observacional que en uno experimental, porque la posibil idad de que los grupos
bajo comparacion (por ejemplo. expueslos y no expuestos) difieran con respeclo a
variables confusoras se minimiza en esl udios experimenlales gracias a la asigna-
d6n aleatoria. En esfOs liltimos, se selecdonan submuestras aleafOri as de la pobla-
d6n de referenda que se espera sean comparables en cuanlo a la dislribuci6n de
las variables confusoras conoddas y desconocidas, espedalmente cuando los
{amanos de mueslra son grandes. Sin embargo, aun cuando la variante de asigna-
156 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
ci6n aleatoria sea insesgada y las muestras sean grandes, puede haber diferencias
aleatorias entre el grupo experimental (por ejemplo, vacunados) y el control (por
ejemplo, aquellos que red ben placebo), las cuales podrfan generar un efec(O de
confus ion (Esquema 5.1). En un estudio observacional, ademas de las diferencias
aleatorias entre los grupos de comparaci6n, puede haber fae(ores relacionados con
la exposici6n capaces de confundi r la asociaci6n bajo estudio, como se ilustra en
los ejemplos que sigucn y en la secci6n siguiente, donde el lema se discute con
mas amplilud.
Esquema 5.1
Confusion e ll estudios cpidcmiolOgicos expcrimcntalcs y no cxpcrimcntales
Disano del estudio Experimental: ObseNacional:
Ensayo cl inico Estudio prospectivo
aJeatorizado
Variante de asignaci6n AsignaciDn alealoria
/ '"
Asignaci6n no aleatoria
A
A B A B
Ejemplo A", vaclX'la A::o tum adores
B '" placebo B '" no tum adores
Causa de confusi6n Diferencia(s} Diterencia(s} alealoria(s} y
(diferencia(s) aJeatoria(sj taclores asociados con la
entre grupos) exposicion de interes
Ejemplo 1. Las tasas de mortalidad bruta general en 1986 para seis paises en
las Americas()) fueron las siguientes:
Costa Rica:
Venezuela:
Mexico:
Cuba:
Canada:
Estados Unidos:
3,8 por 1.000
4,4 por 1.000
4.9 por 1.000
6,7 por 1.000
7,3 por 1.000
8,7 por 1.000
Admit iendo que este ordenamiento de la monalidad es preciso, la interpreta-
cion literal (y correcta) de estos datos crudos es que los E.>;tados Unidos y Cana-
da IlIvieron las tasas de muerte mas altas durante 1986. Aunque la valoraci6n de
datos brutos es uti! para prop6sitos de planificaci6n en salud publi ca, puede con-
ducir a errores cuando se usan tasas de mortalidad como indicadores del estado
de salud. ya que no toman en consideraci6n las diferencias de edades entre las
poblaciones. En este ejemplo. las alt as tasas de mortalidad en Canada y en los
Estados Unidos rellejan el hecho de que hay una proporci6n muy alt a de indivi-
duos viejos en estas poblaciones: debido a que la edad es un <<factor de riesgo
muy fuerte para la monali dad, tales diferencias estruct urales determinan que
estos paises tengan las mas altas tasas de mortali dad. L.1 inspecci6n de las tasas
especfficas de mortalidad (vease el Capit ulo 7, Secci6n 7.2) proporciona un cua-
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 157
dro muy diferente, con las tasas de monali dad mas bajas observadas en Canada,
los Estados Unidos y Costa Rica para cada grupo de edad. Con el aj uste por edad
(usando el metodo directo y la poblaci6n de America Latina en 1960 como
patron, vease el Capit ulo 7, Secci6n 7.3. 1), se invienen las posiciones relat ivas
de Estados Unidos y Canada (monalidad por 1.000: Costa Rica: 3,7: Venezuela:
4,6: Mexico: 5,0: Cuba: 4,0; Canada:3.2: Estados Unidos: 3,6). La edad es, por
tanto, un confusor de la asociacion observada entre pais y mortalidad.
EjelllJJlo 2. En un est udio de cohone Ilevado a cabo en Inglaterra(2
J
se comprob6
que los participantes que al comienzo test imoniaron una frecuencia de act ividad
sexual mas alta (como indica la frecuencia de orgasmos comunicada) tenlan un
decrecimiento del riesgo de monali dad en 10 :mos, comparado con quienes tenl-
an act ividad sexual menos intensa. (,Causa la act ividad sexual una monalidad
mas baja? 0, (,son las personas con los mas altos niveles de actividad sexual (0
capacidad para tener orgasmos) mas sal udables en general y quienes, conse-
cuentemente, tienen menos riesgo de mOl1alidad? Aunque los autores de este
est udio, estando avisados del problema, intentaron controlarlo aj ustando segun
cieno numero de variables asociadas con la salud (vease el Capitulo 7), la posibi-
lidad de un efecto por confll';i6n residual se mantiene y deja la concl usion en
tela de juicio (veanse la Secci6n 5.4.3 Y el Capitulo 7, Secci6n 7.5).
EjelllJJlo 3. La hemorragia gastrointestinal se ha considerado efecto colateral
de los antagonistas del cakio, empleados en el Iratamiento de la hi penensi6n.
Sin embargo, se ha sefialado que esta complicacion puede derivarse del uso
conc urreme de otras drogas de uso frecuente entre consumidores de antago-
nistas del caicio, u otros esrados m6rbidos que concomitan en estos pacien-
tes(3) . Act uando como confusores. estos estados m6rbidos concomitantes y/o el
uso de medicaciones adicionales pueden por tanto ser parcial 0 completamente
responsables de la asoc iaci6n observada entre los antagonistas del calcio y la
hemorragia digestiva.
Ejellll'lo 4. En un est udio anidado de casos y comroles entre hombres america-
no-japoneses. se ha descubierto que una dieta pobre en vitamina C esta relacio-
nada con el riesgo de cancer de colon(4). Aunq ue es pos ible que esta relaci6n
sea causal, una expl icaci6n al ternat iva consiste en que los individuos que con-
sumen mas vitamina C tienden a lener un est il o de vida en general mas saluda-
ble, y por tanto. estar bajo eI efecto de factores de protecci6n (por ejemplo,
olros elementos dieteticos, ejercicio ffsico) que actuan como confusores.
5.2. LA NATVRALEZA DE LA ASOCIACION ENTRE EL CONFVSOR,
LA EXI'OSICION Y EL DESENLACE
5.2.1. Regia general
EI asunto que hay que atender al valorar la confusi6n es si la asociaci6n entre la
exposici6n y un desenlace dado es inducida, fonalecida, debili tada 0 eliminada por
una tercera variable 0 grupo de variables (confusores) . La nat uraleza esencial de este
fen6meno se puede establecer como sigue:
158 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
La variable confusora se asocia causalmente con el desenlace
y
esta asociada causalmente 0 no con la exposici6n
PC'"
no es una variable intennediaria en el camino causal entre
exposici6n y desenlace.
Esta regia general se representa esquemat icameme en 1a Figura 5. 1. La aso-
dadon de imeres (es decir, si lIna exposic i6n dada esta causalmente relacionada con
el desenlace) se represema mediante una Ifnea discontinua y un signa de interroga-
cion; n6tese que esta Ifnea ti ene una flecha apuntando a1 deseniace, dado que el
asunto de imeres aquf es si la exposici6n causa el desenlace. (Una asociaci6n entre
exposici6n y desenlace tambi en puede OClI rrir porque este causa cambios en 1a
cxposici6n: es decir, wlI.wlidad inver.m , situaci6n examinada en el Capitulo 4,
Seccion 4 .4.2).
En la Secci6n 5.2.3 se di sc uten algunas excepciones a la regia general expuesta;
sus componentes se analizan detenidamente en la proxima secci6n (5.2.2), usando
los ejemplos previamente considerados como ilustraci ones (Figura 5.2). N6tese que
las variabl es confusoras en las Figuras 5.2A y 5.2B se ident ifican de manera extre-
madamente simplificada, <distribuci6n de la edad y salud genera! . respect iva-
mente) . En la Figuras 5.2C y 0 , las presuntas variables confusoras se representan
por un conjunto de variabl es mas 0 menos complejo. En la Figura 5 .2C, otros
E
-
-
-
0
?

Y
Fi gura 5.1. Definici{m general de confusion. El confusor (C) esta causalmente asociado con
el desenlace de interes (Y) y asociado causalmente 0 no causalmente con la exposici6n (E):
estas asociaciones pueden distorsionar la asociaci6n de interes: si E causa Y. Una flecha uni-
direccional indica que la asociaci6n es causal: una flecha bidireccional indica una asociaci6n
no causal.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 159
A
J
Pais
V
.
Distribuci6n : ?
por edad
~
1 Mortalidad
c
I Antagonistas
del calcio
/
.
Otros : ?
medicamentos
r
t
Comor I
bilidad
l! Hemorragia
gastrointestinal
B
Salud
general
o
SSE
~ t
Otras dietas
yestilos
de vida
Actividad
sexual
: ,
.
Mortalidad
Consumo de
vitamina C
: ,
.
,
Cancer
de colon
Figura 5.2. Represenlacion esquemalica de las relacioncs hipolclicas de confusores,
exposiciones de inlercs y desenlaces, basada en los ejemplos del lexlo. Una flecha unidi-
reccional indica que la asociaci6n es causal: una tlecha bidireccional indica una asociaci6n
no causal. Una flecha discontinua COil un signo de interrogaci6n indica la pregunta de inves-
ti gaci6n de interes. SSE. situaci6n socioecon6mica.
medicamentos estan relacionadas con la presencia de eslados morbidos concomitan-
tes (otras manifeslaciones de enfennedades que estan asociadas con hipertension, la
indicacion para la prescripcion de antagonislas del calcio). En la Figura 5.2D, el con-
fusof esta confinnado por una constelacion de variables relat ivas a la sit uacion socio
economica general (SSE) y caracterfsticas del estilo de vida que tienen sus propias
interrelaciones . Usualmente, oplar por la simplicidad en lugar de la complejidad se lOr-
na un compromiso a la hora de caraclenzar estas variables y de la concept uali zacion de
sus interrelaciones; esle compromiso es de relevancia direcla p..1ra el arle de la mode-
laci6n estadfstica y es el ndcleo central de la ciencia del analisis muiti vanante, herra-
mienta clave en epidemiologfa analftica (vease el Capfmlo 7, Seccion 7.4) .
5.2.2. Elementos de la regia general para la definicion de la presencia
de confusion
La Variable de confusion esta causa/mente asociada con eI desenlace
En todos los ejemplos incl uidos en la Figura 5 .2, las variables de confusion (distri-
bucion de la edad, salud general, otros medicamentos y otras caracterfslicas del est i-
10 de vida) detenninan en cierlO grado la verosimilitud del desenlace (tasa de morta-
]60 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Jidad, riesgo de mucrte, hemorragia gastrointestinal y ri esgo de cancer de colon, res-
pect ivamente).
EI deselliace esla asociado, casllaimetlle 0 no, cOllia exposicioll
Los ejemplos en la Fi gura 5.2 ilustran las farmas diferentes que aSLI men las rc-
laciones entre los confusores postulados y las respect ivas exposiciones de inten!s
(pais, act ividad sexual, antagonislas del calcio y consumo de vitamina C) . En las
Figuras S .2A y C, ,I(Jt:mas tIt: It:nt: r n: ladont:s los ut:st:n la(;t:s, los
confusores se relacionan con las exposiciones de modo no causal, sit uaci6n cO[J-
sistente con la definic ion tradic ional de confusi6n. Por ejemplo, en la Figura
S.lA, la re laci6n de la edad (e l confusor) con el pais (variable de inten!s) se pos-
tula como contextual y no causal; decir, delerminada por un conj unto de cir-
cunslancias hist6ricas y sociales propias de cada pais. Analogamente, en la Fi gura
5.2C, la asociaci6n entre el usn de antagonistas del caleio y las medicaciones con-
currentes se conceptuali za como no causal, de manera que, por ejemplo, los hiper-
tensos a los que se les ha eSlado prescribiendo antagonistas de caleio, probable-
mente tambien ut ilicen aspirina (Ia causa verdadera de sangramiento
gastrointest inal) debido a los dolores de cabeza inducidos por la propia hiperten-
si6n, y no porque la aspirina haga que los medicos presc riban antagonist as de cal-
cio. La aspirina, no obstante, se relaciona ca usal mente con la hemorragia gas-
trointestina l.
Las variables confusoras pueden ademas eSlar relacionadas con la exposici6n de
modo causal, como en el caso de la relaci6n postulada entre buena salud y act i-
vidad sexual ejempli ficada en la Figura 5.2B. Finalmente, el ejemplo en la Figura
5.2D muestra los diferentes tipos de relaci6n entre la exposici6n de interes con Ja
constelaci6n de factores incluidos en el complejo de confusi6n: por ejemplo, la
mas baja SSE puede estar causal mente relacionada con el consumo de vitamina C
en la medida en que determina el acceso a productos aliment icios que son ricos en
dicha vilamina (asociaci6n causal) . Por otra parte. algunas otras caracleristicas del
estilo de vida relacionadas con la SSE (por ejemplo, ejercicio ffsico) pueden estar
relacionadas con el consumo de vitamina de modo no causaL
Una ilustraci6n adicional de la regia segun la cual se prod uce la confusi6n cuan-
do la variable de confusi6n se relaciona causalmente con la exposici6n de interes se
muestra a traves del habito de fumar y el colesterol ligado a li poprotefnas de alta
densidad (HDL) (que no se muestra en la Figura 5.2). El habito de fumar. por ejem-
plo, se sabe que causa un decrecimiento en los niveles de HDUSJ; de ese modo, por
tanto, explica la posible relaci6n entre un bajo HDL y el cancer de pul m6n .
Pero no es una variable illtermedia enla cadena causal entre la exposicion
y el desenlace
La regia general para la definici6n de una variable de confusi6n excluye la situaci6n
donde la exposici6n determina la presencia 0 nivel del presunto confusor. En los
ejemplos anteriores. el supuesto de que tal situaci6n no existe puede no estar entera-
mente justificado. Por ejemplo, en el ejemplo de la Figura 5.28 , puede exist ir una
asociaci6n inversa entre la exposici6n y el confusor: es decir, el incremento de la
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 161

, - - - - - , ~ .. "
Salud
general
Actividad
sexual
Mortalidad
Fi gura 5.3. Modclos hipotCticos alternativos para las relaciones de la Figura 5.28:
salud general,. es la cadena causal de la rclacion entre actividad sexual y mortalidad
actividad sexual puede CUI/sa,. un mejoramiento de la salud general, 10 que a su vez
result a en un decrecimiento de la monali dad (Figura 5.3). Si este tipo de relaci6n
oc urre, y panicularmente constituye el linico mecanismo a traves del cual la act ivi-
dad sexual se relaciona con la monalidad (vease la Secci6n 5.2.3), la salud gene-
ral>, no debe ser considerada un confusor verdadero, debido a que es eI enlace entre
la aClividad sexual y la monali dad.
Olro ejemplo se refiere a la relacion causal conjet urada entre la obesidad y el
riesgo de monali dad. Aunque puede argumentarse que esta asociacion se debe al
efecto confusor de la hipenensi6n, una explicaci6n alternat iva es que la hipenen-
sion es una mediadom de la asociaci6n entre obesidad y monalidad, y no un con-
fusor(l;).
5.23. Excepciones de la regia general para la presencia de confusion
Collfusioll debida a asociaciolles aleatorias
Aunque la regia general es que la variable de confusion ti ene que estar causalmente
asociada con el desenlace (Figura 5. 1), en la practica es posible encontrar si tuacio-
nes donde una asoc iacion no causal (estadlstica) Il eva a la confusi6n. ASI, por ejem-
plo, en un estudio de casos y controles, la variabilidad del muestreo (aleatorio) pue-
de crear un desbalance entre casos y controles con respecto a la variable dada, aun
cuando no haya un desbalance en la poblaci6n total de referencia. Incluso en los
ensayos clfnicos aleatorizados, particularmente si el tamano muestral es pequeno,
desbalances que conciernen a variables relacionadas con el (los) desenlace(s) pue-
den ocurrir por azar. En estos ensayos los investigadores encaran el efecto de confu-
sion (producido aleatoriamente) usando alguna de las tecnicas disponibles de ajuste
(vease eI Capltul07).
162 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
El confusor como mriable intermedia en/a cadena causal de fa relacion
entre exposici6n y desenlace
Como ya se discut i6, el confusor potencial no debe ser una variable intcrmedia en la
cadena causal entre el posible factor de ri esgo y el desenlacc. De ahf que sea inapro-
piado aj ustar para una tal variable . Aunquc esta regia es valida en general, se produ-
cen excepciones cuanda el investi gador explora deliberadamente mecani smos que
explican la asociaci6n entre la exposicion y el desenlace de inten!s.
La asociaci 6n del habito de fumar materna durante el periodo de embarazo con
un im:n:rm:nlo t:[J t:l ri t:sgo lit: mm:rlt: pt:rinalai propon;ion(l un t:jernplo dt: una situa-
cion en la que puede ser apropiado aj ustar para una variable intennedia. Se sabe que
el bajo peso al nacer es un eslab6n import ante en la cadena causal entre el habito de
fumar y la muene perinatal (Figura 5.4).
Bajo peso
alnacer
Hltbito de fumar
de la madre
Muerte
perinatal
Fi gura 5.4. Represcntacion esquemat ica del bajo peso al nacer como el unico mecanis-
mo entre habito materno de fumar y mllerte perinatal
De modo que si la pregunta del estudio es i,causa el habiw de fumar la muerte
perinatal? (10 cual no apunta a un mecanismo espedfico, como serfa el caso en que
se examina una hip6tesis por primera vez), es a todas luces inapropiado ajustar para
un posible mecanismo , maxime si se (rata de un mecanismo clave como bajo peso al
nacer. No obstante, una vez establecido el eslab6n principal en la cadena de causali -
dad (bajo peso al nacer), se puede fonnular una pregunta diferente: i,es el habiw de
fumar el causante de muert e peri natal mediante otro(s) mecanismo(s) diferente(s) at
bajo "e.w (11 nacer? (Figura 5 .5) . En esta situaci6n procede tratar el peso al nacer
como un confusor (al menos en el sentido de que se garanti za su control); la pre-
sencia de un efecto residual (peso al nacer ajustado) del habiw de fumar sobre la
mort alidad perinatal indicarfa que, adie ionalmente al efecto negativo del peso al
nacer, el habito de fumar puede tener un efecw taxieo directo(7) .
En el ejempl o de obesidad e hipertensian que se mencion6 antes, aun cuando el
mecanismo pri nci pal por conducw del cualla obesidad incrementa la mortalidad sea
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 163
Habito de lumar
de la madre
Muerte
perinatal
Figura 5.5. Representacion esquematica de un mecanismo diferente al bajo peso alnacer
para explicar la relacion entre habito materno de fumar y muerte perinatal
un aumento de los niveles de presion arterial(6) , puede ser de interes examinar la aso-
ciacion entre obesidad y mortali dad, ajuslada por la hi pertensi6n, con el prop6sito de
explorar la posibilidad de que otros mecanismos pudieran explicar la relacion bajo
consideracion.
EI grado en el cual un mecanismo dado (0 confusores posi tivos) explica la rela-
cion de interes, se expresa mediante la comparacion de medidas de asociaci6n aj us-
ladas (A) y no ajusladas (N) (por ejemplo, un ri esgo relativo, RR). Esta comparaci6n
puede hacerse usando la razon de los RR. no ajuslados, RRN/RRA(S), 0 el porcentaje
de exceso de ri esgo explicado por [a(s) variable(s) ajuslada(s) mediante:
% Exceso de Riesgo Explicado = x 100
Como ejemplo de aplicaci6n de la f6rmu[a del porcentaje de exceso de riesgo,
si el riesgo relativo ajuslado es 2,0 y el riesgo relati vo no ajustado es 3,0, e[
mecanismo representado por la variable de ajuste (por ejemplo, bajo peso al
nacer) se puede considerar como responsable del 50% de la asociacion . Es impor-
lante tener presente, no obstante, que si persiste una asociacion residual despues
de haber sido controlada una variable supuestamente intermedia, de ahf no nece-
sariamente se deriva que tenga que existir otra cadena causal u Olros mecanismos;
la asociaci6n puede que se deba a una confusion reJidual (veanse la Secci6n 5.4.3
y el Capit ul o 7, Seccion 7.5). Por ejemp[o, aun cuando la hipertensi6n fuera un
mecanismo import ante, se podrfa observar una asociaci6n entre obesidad y mor-
lalidad despues de l control (ajusle) para niveles de pres ion sangufnea a causa de
errores de medicion . Se producirfa asf un aj uste incompleto para presi6n sanguf-
nea, Il evando a una confusi6n residual.
164 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
En resumen, al encarar el problema de la confusion cuando la exposicion y los
confusores son pane de la misma cadena causal ha de tenerse en cuenta la hi p6tesis
que se esta evaluando: en otras palabras, depende del modelo conceptual que se apli-
ca a las preguntas del estudio y a los result ados.
Corre/adoll exces;vQ entre el confusor y la exposici6n de interes
Aunque, por definici6n, una variable confusora esta correlacionada con la expo-
sidon de interes (Figura 5.1 ), en ocasiones la correlaci 6n es tan fuerte que los ajus-
tes result an difkiles, e incluso imposibles . Este es un problema analogo a la si tua-
cion conocida en bioestadfstica como colinealidad. Considerese, por ejemplo, la
exposici6n conramillacion ambiental y eI presunto confusor <<<i.rea de residencia.
Dada la correlacion virt ualmente perfecta que exhiben estas variables, serfa diffci l (0
imposible) controlar el efecto de residencia cuando se evalua el efecto de la contami-
nacion ambiental sobre los sfntomas respiratorios . La Figura 5.6 representa esque-
m,hicamente una correlaci6n perfecta entre exposici6n dicot6mica y variabl es con-
fusoras, que hace imposible el ajuste por el confusor. La situacion ideal para el
control efecti vo de la confusion se da cuando hay una clara correlacion ent re exposi-
cion y confusor, pero la variabilidad es suficiente para consentir una representaci6n
adecuada de todas las celdas de la tabulacion cruzada, como se muestra en la Figu-
ra 5 .7.
Un ejemplo de la dificult ad que aparece como consecuencia de la excesiva corre-
laci6n entre las variables se da al examinar el papel de los componentes de la dieta
como factores de ri esgo. Cuando se analiza la asociaci6n observada entre el consu-
mo dietetico de proteina animal y un determinado desenlace, puede resultar muy
~
"
in
:r
x
w
I.
Presente
A
CONFUSOR
Ausente
0
Figura 5.6. Correlaci{m perfecta entre t xposicion dicotomica de intercs y factor de con-
fusion: no hay celdas en las que la exp05icion cstc prcsentc y cl confusor estc ausente, ni
vicevcrsa
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 165
CONFUSOR
Presente Ausente
I.
c
~

A
B
z
~
-Q
u
in
0
~
x
w
c
~
C 0
,
<
Fi gura 5.7. Correlacion entre una exposicion de interes y un factor de confusion: las
cuatro celdas de la tabulacion cruzada de variables categoricas cstan reprcsentadas. En
esta representaci6n esquematica. los tamaiios mas grandes de las celdas A y D denotan la
magnilUd de la correlaci6n positiva entre la exposici6n y el confusor.
diffcil controlar el posible papel de confusi6n de las grasas en la dicta, dada la fuene
correlaci6n entre protefna animal y consumo de grasas(<J) . Gtros ejemplos de colinea-
lidad incluyen educaci6n1ingresos, HDL colesterol serico/tri gliceridos y razaiSSE.
Se tiene una sit uaci6n similar cuando los componentes de la misma variable de
exposici6n estan fuertemente correlacionados, haciendo muy diffcil el ajuste para
una de elias mientras que se presta menci6n a la contribuci6n <<independiente de la
Olra. Por ejemplo, puede ser muy diffcil, si no imposible, examinar la duracion del
habito de fumar mientras simullaneamente se controla de manera refinada la edad en
que se inic io el habito de fumar.
Como corolario de la discusi6n precedente, es importante subrayar que solamen-
{e es posible ajustar para un confusor mientras se examina la relaci6n entre exposi-
cion y desenlace cuando los niveles del confusor y los de la exposicion se superpo-
nen, situaci6n que no siempre se encuentra en los eSlUdios epidemiol6gicos
observacionales. Por ejemplo, serfa imposible ajuslar por edad si no exist iera super-
posici6n en las edades de individuos expuestos y no expuestos (por ejemplo, si todos
aquell os expuestos tuvieran mas de 45 anos y todos los no expuestos tuvieran menos
de esa edad) .
En relaci6n con este asunto se halla el sobreajllste (0 .w>breml'arejamiento. vea-
se el Capftulo 7. Secci6n 7.6) que se produce cuando el ajuste (0 el emparejamien-
to, vease el Capitulo I. Seccion 1.4.5) se lI eva a cabo para una variable {an fnti -
mamente relacionada con la variable de interes que no se produce variabilidad
alguna en esta ultima. Por ejemp[o, en un estudio de casos y controles, al tomar
casos muy similares 0 identicos a [os contro[es OCUfre que unos y olros tenninan
siendo muy simi[ ares 0 identicos con respecto a la exposici6n, 10 que da lugar a una
166 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
asociaci6n aparentememe nula. En general, siempre ha de tenerse presente que cuando
el ajuste se lleva a cabo para una dctcnninada variable de confusi6n, {ambitn se veril. -
ea para las variables con ell a relacionadas. Por ejemplo, c lI ando se aj usta por area de
res idencia, de hecho se ajusta, en una 0 en olra medida, por factores relacionados con
la residencia, tales como antecedentes emicos, renla, religi6n y habitos dieteticos .
5.3. EVALUACION DE LA PRESENCIA DE CONFUSION
En un estudio observacional , la evaluaci6n de los efec(Qs de confusi6n se lI eva a
cabo para variabl es que son confusor<:s conocidos 0 sospechosos . La ident ificaci6n
de confusores potenciales se basa usualmente en el conocimiento a priori de la aso-
ciacion dual entre el posible confusor con la exposic ion y con el desenlace, los dos
polos de la hip6t esis del estudio. En adicion al conoc imiento u priori acerca de las
asociaciones. es imponante verificar si la confusion esta presente 0 no en el estudio.
Hay varias vias para establecer la presencia de confusi6n, que estan relacionadas con
las siguientes preguntas:
I . (. Esta relacionada la variable confusora tanto con la exposic ion como con el
desenlace del estudio?
2. (. Tiene la asociaci6n exposici6n-desenlace observada en el anal isis crudo la
mi sma direcci6n y magnitud similar a las asociaciones que se producen dentro
de los estratos de la vari able confusora?
3. (. Tiene la asociaci6n exposici6n-desenlace observada en el anal isis crudo la
mi sma direcci6n y magnitud que las asoc iaciones obtenidas despues del con-
trol (aj uste) para la variable de confusion?
Estas di ferentes vias para establecer la presencia y magnitud de los efectos de confu-
sion se il ustran usando un ejempl o basado en un estudio hipotetico de casos y controles
donde eI sexo masculi no se valora como posible factor de riesgo para la infecci6n de
malaria. EI anali sis cmdo que se muestra en el Esquema 5.2 sugiere que los hombres
tienen un riesgo mas alto de contraer malaria que las mujeres (odds ratio LORI = 1,7;
Ifmites de confianza al 95%: I ,1-2,7). Se puede infenr que existe una asociacion real
entre ser de sexo masculi no y contraer malaria si estos result ados estan li bres de errores
aleatorios (muestreo) y sistematicos (scsgo): esto es, los hombres, sin discusion, tienen
un riesgo mas alto de infeccion en esta poblaci6n. De inmediato la pregunta es si la aso-
Esquema 5-2
Ejemplo de confusion: estudio hipot etico de sexo masculino como factor de riesgo
para la infeccion de malaria
Hombres
Mujeres
Total
Casos
88
62
150
Controtes
68
82
150
Totat
156
144
300
Oddsratio:1,71
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 167
ciaci6n es call.m/; es decir. si hay algo inherente al sexo que hace a los hombres mas
susceptibles de enfermar que las mujeres (por ejemplo, un factor hormonal). Altemati-
vamente, una caracteristica que este asociada tanto con el sexo como con un gran riesgo
de infectarse puede ser la responsable de la asociad6n. Una caracteristica de ese tipo es
el ambiente de trabajo, en el sentido de que individuos que fundamemalmente trabajan
en espacios abiertos (por ejemplo, agricult ura) estan mas expuestos a la picadura del
mosquito que transmite la enfennedad que aquellos que trabajan en areas interiores
(Figura 5.8). Es decir, si la proporci6n de indi viduos con ocupaci6n en areas exteriores
es m;'is ;l Ira en homhres '1"e en mujeres, e1 ;lmhiente lie Ir;lhajo polirfa explicar 1a ;lSO-
ciad6n observada entre sexo y malaria.
Trabajo aJ
ai re libre
Glmero
masculino
Malaria
?
Fi gura 5.8. Ambicntc dc trabajo como un posible eonfusor dc la asoeiaei{m entre eI scxo
masculino y cl ricsgo dc malaria
5.3.1. ;,Esta relacionada la variable de confusion con la exposicion
y con el desenlace del proceso estudiado?
En el Esquema 5.3 se muestran las asociaciones del confusor con la exposici6n y el
ambiente de (rabajo en este ejemplo hipotetico .
EI 43,6% (68/ 156) de los hombres, pero solamente el 9% ( 13/ 144) de las muje-
res, tiene ocupaciones fundamenlalmente en espacios abiertos, dando como
resultado un odds ratio de 7,8 .
Tiene ocupaciones fundamemalmente en espados abi enos e142% (631150) de
los casos de malaria, pero solo el 12% (18/ 150) de los controles eslaba en ese
caso; ello arroja un odd.\ ratio de 5.3 .
Las asociaciones positivas y fuert es del confusor (ambiente de trabajo) con el
factor de ri esgo de interes (sexo masculi no) y el desenlace (<<ser un caso) sugiere
que el ambienle laboral puede, en verdad, ejercer un marcado efeclo confusor.
168 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
E.iquema 5.3
Asociacioll del snpucsto confusor (trabaja fUlldamclltalmcllte en cspacios abicrtos)
COli la exposici6n de illtcres (sexo masculino) y eI desenlacc (malaria) en cI estudio
hipotCtico del Esquema 5.2 y Figura 5.8
Trabajan en Trabajan en
Conlusor espacios espacios Total
y exposlclon abiertos cerrados
Hombres 68 88 156 Odds ratio : 7,8
Mujeres 13 131 144
3(](]
Confusor
y desenlace
CasDS Controles
Trabajan en
espacios abiertos
63 18
Odds ratio ", 5,3
Trabajan en
espacios cerrados
87 132
Total 15O 15O
3(](]
5.3.2. ;,Tiene la misma direcci6n e identica magnitud la asociaci6n exposici6n-
desenlace observada en el amilisis crudo que las asociaciones observadas
dentro del estrato de la variable confusora?
L1 estratificaci6n de aClIerdo al confusor representa una de las estrategias para controlar
por su efecto (vease el Capitulo 7, 5ecci6n 7.2). Cuando hay un efecto de confusion, las
asociaciones que se yen a traves de los estratos de la variable potencial mente confusora
son todas de magnitud simil ar, pero son diferemes a las de la estimaci6n cmda. En el
ejemplo expuesto, los datos se pueden estratificar por medio del confusor (ambiente de
trabajo) para verificar si la asociaci6n entre la exposici6n (sexo masculi no) y el desenla-
ce (malaria) esta presente dentm de los estratos relevantes (ocupaciones fundamen-
talmente al aire li bre 0 fundamentalmente en espacios cerrados) . Como se muestra en el
E.,>quema 5.4, los odds ratio estimados en ambos estratos estan muy pr6ximos a uno y
difieren del resultado que arrojo el analisis cmdo (1,7 1), 10 que sugiere que el ambiente
de trabajo es un confusor que explica virtualmente toda la asoc iaci6n del sexo masculi -
no con la presencia de malaria. 5i la asociaci6n observada en el analisis no aj ustado
hubi era persistido dentro de los estratos del posible confusor, habrfa sido apmpiado
concl uir que eI efecto de confusion del ambiente de trabajo no explico la asociacion
observada entre sexo masculi no y malaria.
Con respecto al uso de la estratificaci6n como medio para verificar la presencia
de confusion, hay que enfatizar que, como demostraron Miettinen y Cook(lO) para
o d d , ~ ' ratios (y subsiguientemente Greenland
O '
) para razones de tasas y diferencias
absolutas entre razones), el odds ratio no ajustado es algunas veces diferente de los
o d d . ~ ratios especfficos segun estratos al/n euando la cOllfl.lsi6n esti 1ll.lSente. Por tan-
to, la estrategia de comparar estos odds ratios con el odds ratio combinado (no ajus-
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 169
Esquema 5.4
Analisis estratificado de la asociaci6n entre suo y malaria (del Esquema 5.2)
de acuerdo a si los individuos trabajaban rundamentalmente en espacios abiertos
o en espacios cerrados
TrabaJan
fundamentalmente
en espaclos
ablertos
TrabaJan
fundamentalmente
en espaclos
cerrados
Hombres
Mujeres
Total
Hombres
Mujeres
Total
Casos
53
10
63
Casos
35
52
87
Controles
OddS ratIO :: 1,06
3
18
Controles
53 Odds ratio :: 1,00
79
132
tado) para el estabJecimiento de confusion debe confirmarse a traves de la estrategia
arriba expuesta y de la que se expone a continuacion.
533. iTiene la asociaci6n exposici6n-desenlace observada en el amllisis crudo
identica direcci6n y magnitud a la observada despues del control (ajuste)
por la variable confusora?
Puede ser que la vIa mas indicada para detenninar si existe un efecto confusor sea la
comp..1raci6n entre asociaciones ajustadas y crudas . EI ejemplo sexo/infeccion por
malaria se usa ademas en el Capitulo 7, Seccion 7.3.3, para il ustrar el metodo de Man-
tel-Haenszel para calcular un odd.\ ratio ajustado. Conforme se describe en esa sec-
ci6n, el odds ratio ajustado de Mantel-Haenszel en este ejemplo es 1,0 1. (E.<;te odd.\
ratio es meramente un promedio ponderado de los odds ratios especfficos por estrato
que se muestran en el Esquema 5.4). La comparacion entre el odd.\ ratio crudo (1 ,7 1) Y
el ajustado por el ambiente de trabajo ( I ,0 I) es consistente y confirma la inferencia
basada en las estrategias previas en cuanto a que eI incremento en el riesgo de malari a
en hombres (odd.\ incrementados en un 7 1 %) se debi6 a que se trataba. con mayor pro-
babilidad, de trabajadores que se desempefian en espacios abiertos (Esquema 5.3).
Otro ejemplo que il ustra las dife rentes vIas para evaluar el efecto de confusi6n se
orrece medi ante un estudio de cohorte de empleados de edad media (Estudio de la
Compafifa Electrica del Oeste) que evaluo la relacion del consumo de vit amina C y
dosis de beta caroteno y el riesgo de muerte(12) . Para las tablas que siguen, el presun-
to factor de riesgo y se define sobre la base de un Indice resumen que loma en consi-
deracion los consumos de vitamina C y beta carotenos . Con el prop6sito de simplifi-
car, este Indi ce de consumo que define la exposici6n de interes se clasifica como
170 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 5.1
Razoncs de mortalidad no ajustadas y las correspondicntes razones de tasas
ell la poblaci{m del Estudio de la Compania Elcctrica del Oeste de acuerdo
31 indice de cOlISumo
indlce de
N.
G
de Mios-
Persona de
N.ode
Mortalldadfl.000 Razen de
consumo
observaci6n
Muertes Anos-Persona tasas
Bajo 10.707 195 18,2 1,00
MOderado lU.1:I5<! 16:i 15,0 U,!!2
Alto 11.376 164 14,4 0,79
Fuente; DK Pandey et al. , Dietary Vitamin C arICI [I-Carotene and Risk of Death in MiddleAged Men. The Wes-
tern Electric SlLKly. American Journal 01 Epidemiology, Vol 142, 1269-1278, Cl1995. Tile Johns Hopkins University
School of Hygiene & Public Health.
bajo, moderado 0 al(O. El confusor potencial para estos ejemplos es 1a condi-
cion actual en relaci6n con el habito de fumar, categorizada como ausente 0 presen-
teo En este ejemplo el asunto de interes es si existe una relaci6n inversa entre el {ndi-
ce de consumo y el desenlace, la tasa de muerte por todas las causas, y, si asi fuera,
si se puede explicar en parte 0 total mente por el efec(Q confusor del habito de fumar.
La primera via para evaluar si el efec(Q de confusi6n puede explicar la tendencia
que se ha1l6 en este estudio (Tabla 5.1) - esto es, si el confusor esta asociado con la
exposici6n y el desenlace- se ilustra en las Tabla.>; 5.2 y 5.3 . Una relaci6n inversa
entre el habi(Q de fumar actual y la exposici6n, indice de consumo. se observa en este
estudio: concretamente hay un porcentaje mayor de bajo consumo (y menor en las
otras dos categorfas) en fumadores actuales que en no fumadores (Tabla 5.2). $e
encontr6 tambh!n que para los fumadores actuales se registra un incremento de un
72% en la monalidad por todas las causas (Tabla 5.3). A causa de la asoc iaci6n dual
con el indice de consumo (exposici6n) y con la monalidad (desenlace), el habito de
fumar se puede considerar un confusor de la asociaci6n del indice de consumo com-
puesto vi tamina Clbeta caroteno con la mortalidad por todas las causas.
Tabla 5.2
Distribucion porccntual de alios-persona de observacion en la poblacion del Estudio
de la Compaliia Electrica del Oeste, segun al indice de cOlISumo vitamina C!beta
caroteno y M.bito de rumar actual
Olstrlbucl6n porcentual
[ndlce de consumo
Hilblto de
N.ode
fumar actual Indlvlduos
Aj'ios-
Persona
BaJo Moderado Alto
No 657 14.534 (t oo,O"!,,) 29,3 35.3 35,4
Sf 899 18.401 (100,0 %0) 35,0 31,1 33,9
Fuenl.r; DK Paooey er al., Dietary Wamin C aM aoo Risk 01 Death in MiddleAged Men. The Wes
lern Electric Study, American Journal of EpidemiokJgy. Vol 142, 1269-1278, 0 1995, The Johns Hopkins University
School 01 Hygiene & Public HeaHh.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 171
Tabla 5.3
Tasas de mortalidad y las correspondientes razones de tasas en la poblaci6n
del Estudio de la CompaiUa EI&trica del Oeste segun lul. bito de rumar actual
Hablto de fumar
actual
No
S;
N.
O
de Anos-
Persona
14.534
18.401
N.Ode
Muertes
165
357
Mortalldadl1000
personas-ano
11.3
19,4
Razon de
tasas
1,00
1,72
~ u e n t e : UII. I-'andey et al., uletary vrtamln t,; and 1It.;arotene and HISk ot ueath In MlddleAged Men. I ne wes
tern Electric Study, American Journal 01 Epkle:niDlogy, vol 142, 1269'1278, 1tl1995. The Johns Hopkins University
School 01 Hygiene & Public Health.
EI segundo enfoque para examinar la confusion (estrat ificaci6n de acuerdo a
las categorfas del confusor potencial) se ilustra en la Tabla 5.4, la cual muestra que
las razones de tasas en los estratos formados por las categorfas de l habito de fumar
act ual son similares a las razones de las tasas no ajustadas . Los resultados del ter-
cer enfoque (ajuste) se presentan en la Tabla 5.5, donde aprecia que la raz6n de
tasas ajustadas usando el mewda direcw (vease el Capftulo 7, Secci6n 7.3 .1 ).
Aunque li geramente debilit ada, la relacion inversa gradual de l fndice de consumo
con la mortalidad por todas las causas se mantuvo despues del ajuste por el habiw
de fumar act ual. De modo que se puede concl uir que, aunque el habito de fumar
act ual (categorizado dicot6micamente como s f 0 no) sat isface los dos crit e-
rios necesarios para definirlo como un confusor (estrategia I , Tablas 5.2 y 5.3), su
influencia fue la de un confusor extremadamente debil en este eswdio. Este leve
efecto de confusion se puede explicar por la re lat ivamente debil relacion entre el
habiw de hlmar y el fndice de consumo (Tabla 5.2) aparejada con una raz6n de
Tabla 5.4
Tasas de mortalidad y las correspondientes rawncs de tasas asociadas con el indice
de consumo vitamina Clbeta caroteno, de aCllerdo al h:ibito de rumar actual , Estudio
de la Compania EI&trica del Oeste
[ndlce de
Hablto de fumar consumo de N." de Mortalldadl1000 Razon de
actual IIltamlna C/ beta personas-ano personas-ano tasas
Caroteno
No Bajo 4.260 13,4 1,0
Moderado 5.1 31 10,7 0,80
Allo 5.143 10,3 0,77
S; Bajo 6.447 21,4 1,0
Moderado 5.721 18,9 0,88
Allo 6.233 17,8 0,83
Tolal Bajo 10.707 18,2 1,0
(no ajuslado) Moderado 10.852 15,0 0,82
Allo 11 .376 14,4 0,79
Fuente: OK Pandey er al., Dietary Vilamin C and [ICarolene and Risk of Oealh in Middle Aged Men. The Wes
lern Electric Study, American Journal 01 Epidemiology. vol 142, 1269 1278. 1tl1995, The Johns Hopkins University
School of Hygiene & Public HeaRh.
172 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 5.5
Razoncs de tasas para 13 mortalidad por todas las causas 110 ajustadas y ajustadas por
eI habito de rumar en cI Estudio de 13 Campania Electrica del Oeste
Razones de tasas del indice de consumo
vlt amina CfBeta caroteno
Razon de tasas
No ajustada
Ajuslada-
Baja
1.00
1 ,00
Moderado
0,82
0,85
Alto
0,79
0,81
Ajustadas usando 81 metoda directo y la coh,,'!e total (suma de arios-persona de oooorvaci6n para las I res
categorias del indice de consumo) como pobIad6n estlmdar (vease el Capitulo 7, Secd6n 7.3.1).
Fuente: DK Paooey 91 a/ . Dietary Vitamin C ard [I-Carotene and Risk of Death in Middle-AgM Men. The Wes-
tern Electric Study, American Journal 01 Epidemiology. Vol 142. 1269-1278, 11:1 1995. The Johns Hopkins University
School 01 Hygiene & Public HeaHh.
{asas de mortalidad {otal para la categorfa de los fumadores ac{uales de solamente
1,72 (Tabla 5.3) . Esto se debe probablcmente a la falta de especificidad del desenlace,
el cual incl uyo tanto las muertes relacionadas con el habiw de fumar como las no
relacionadas . (Se podrfa haber argumentado tambicn que el ajuste contempl6 sola-
mente dos categorfas del habi{o de fumar que no denen en cuenta ni su duracion ni su
cuantfa, 10 que da cabida a una sus{ancial confusion residual; vease Secci6n 5.4 .3).
5.4. ELEMENTOS ADICIONALES RELACIONADOS
CON LA CONFUSION
5.4.1. La importancia de utilizar diferentes estrategias para evaluar
la confusion
Aunque, como ya se di scuti6. el mejor argumento de caracler probatorio para sus-
{entar la presencia de confusion es la demostraci6n de que los es{imados crudos y
ajustados difi eren, es litH considerar las otras estrat egias di scutidas en eSle capftu-
10 para evaluar la confusi6n. Por ejemplo, la observaci6n de las direcciones de las
asociaciones del confusor con la exposicion y el desenlace proporciona una
expec tativa a priori en cuanto a si la elimi naci6n de la confusi6n conduce a un
inc remento 0 a una disminuci6n de la intens idad de la asociaci6n (vease la Sec-
ci6n 5.4 .4) . Si el estimado ajustado fuera inconsistente con 10 esperado, el proce-
dimiemo de aj uste {iene que verificarse para descartar un posible error. Por ejem-
plo, en un estudio de casos y controles donde los casos son mas jovenes que los
control es y la edad esta relacionada direc tamente (positi vamente) con la exposi-
ci6n de interes, es de esperar que la confus i6n de como resultado una esti maci6n
del riesgo relati vo no ajustado muy proximo a 1,0. Por tanto, se tendrfa algo
opuesto a 10 esperado - yen consecuencia requerirfa verificaci on - si se hubi era
encontrado que la estimacion no ajustada estaba mas alejada de la hip6t esis nula
que la ajustada.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 173
La estratificaci6n es ademas un paso litH cuando se anali zan datos epidemiol6gi-
cos, debido a que const ituye Olra estrategia que pennite la formu lacion de una
expectali va a priori de los efectos de la confusi6n sobre la asociaci6n y, de este
modo, de los efeclOs del ajuste sobre la asociaci6n (a pesar de la advertencia, a la
que se hi zo referencia previa, de que incluso cuando la confusion esta ausente, la
medida combinada de asociaci6n puede ser diferente de la de los estratos especffi-
cos). Por ejemplo, cuando los estimados en los estratos formados por el confusor
eslan mas cerca de la hip6tesis nllia que el valor combinado no ajuslado, el riesgo
relativo deberfa estar cerca de 1.0 despues del ajuste. (Las excepciones incluyen
determinadas situaciones en las que mult iples variables se confunden unas con
otras.) Adicionalmente, como se discute en los Capftulos 6 y 7, la estratificaci6n per-
mit e la valoracion de la interacci6n.
SA.2. La confusion no es un fenomeno de dodo 0 nada
En el ejemplo que se ex pone a traves de los Esquemas 5.2 hasta 5.4, la variable de
confusi6n (ambiente de Irabajo) enteramente responsable de la relaci6n entre la
exposici6n de interes (sexo masculi no) y el desenlace (malaria). En la Tabla 5.6 se
ofrece otro ejemplo de un efecto de confusion que expli ca IOtalmente la relaci6n: alii
se muestran los resultados ajustados y no ajustados del estudio sobre los antago-
nistas del calcio y la hemorragia gastrointest inal, discutido al inicio de este capitulo
(vease el ejemplo 3 en la Secci6n 5. 1)(3) . Debido a que la raz6n de lasas decreci6 de
1,8 a 1,5 tras el ajuste segun caracterfsticas demogrMicas y usa de otros medicamen-
tos, se puede concluir que esas variables confunden solo parcialmente la asociaci6n
entre los antagonistas del calcio y la hemorragia gastrointestinaL No obstante , cuan-
do Olras enfermedades concomitantes se luvieron en cuenta, la asoc iacion desapare-
Tabla 5.6
Riesgos relatiyos ajustados y no ajustados de hClIlorragia gastrointestinal alta
con respccto al uso de antagonistas del calcio, Personas adscritas a Medicaid
de Tcnnessc, de 65 y lIlas aiios de edad, de 1984 a 1986
No ajuslados
Ajustados par caracler islicas demograficast y por
el usa de olros medicamentos'
Lo anterior mas indicadores de comorbilidadf
Rlesgo relatlvo'
1,6
1,5
1, 1
Intervalo de
confianza 95%
1.2-2,7
1,0-2,2
0,7-1,7
'8asado en tasas de incidencia (por tiempo-persona) y modelos de regresi6n de Poisson (vl!anse
los Capitulos 2 Y 7) .
t Edad, raza, sexo y residencla .
Agentes anti-inflamatorios 00 esteroideos, corticoides orales, anHcoagulantes orales. y medicamentos antineo-
plas;cos.
I Uso racienle de cuidados ml!dicos (hospitalil.aciones y uso de nitralO).
Fuenle: WE Small ey el al. , No Association Belween Calcium Channel 810cker Use and Confirmed Bleeding
Peptic Weer Disease, American Joumalol Epidemiology, Cl1998, The Johns Hopkins University School of Hygiene &
Public Heallh.
174 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cio casi completameme. En muchos casas, sin embargo, el cfccto de confusi6n es
solamente parcial. En el ejemplo mostrado en las Tablas 5. 1 hasta 5.5, el aj uste por
el habiw de fumar tuvo solamente un ligero efec{o sabre la asociaci6n entre el {ndice
de conslI mo de vitamina Clbeta caroteno y mortali dad.
5.4.3. Confusion residual
La confusion residuaL que sera discutida con mayor deta ll e en el Capit ulo 7
(Secci6n 7.5). oc urre clI ando algunas de las categorfas de l confusor control ado
son tan amplias que se abI lene un aJuste imperfeclO, 0 cuando algunas variables
de confusion no se controlan. Por eso, en uno de los ejemplos ya discutidos (Ta-
bla 5.5), el de solo dos categorfas para el habito de fumar 0 ausen-
puede explicar la semejanza entre los riesgos relat ivos crudos y los aj ustados
por habito de fumar que expresan la relacion entre el Indice de consumo de vita-
mina C/beta caroteno y la mortalidad . Si el efecto de confusion del habito de
hlmar dependiera de otros componentes de la exposicion, ta les como cuantla,
duracion 0 fecha de abandono del habito, podrfa haber subsistido una confusi6n
residual marcada despues del ajuste basado en tan rudimentaria medicion del
habito de fumar.
Otro ejemplo es el estudio de la asociaci6n entre la actividad sexual y la mor-
talidad discutido previamente(2) . Conociendo la posibilidad de confusion, los
autores de este est udio aplicaron la regresi6n logfstica multiple (vease el CapIt u-
lo 7, Seccion 7.4.3) para ajustar por varias variables re lacionadas con la salud.
Los datos sobre estas variables se recogieron en el momenta del examen inicial,
incl uycndo la prcscncia dc cnfcrmcdad coronari a prcvalcntc, colcstcrol scrico
tota l, habito de hlmar, presi6n arteri al sist6lica, y ocupacion (manual contra no
manual). La menor mortalidad de los participantes en el estudio con mayor fre-
cuencia de re laciones sexuales pers isti6 cuando se aj ust6 por estas variables . Los
autores, sin embargo, concluyeron adecuadamente que a pesar de esto, la confu-
si6n bien puede explicar nuestros hallazgos; en tal contexto nos recuerdan que
en un estudio observacional, algunas variables no consideradas pueden confundir
la asociacion observada aun despues de haberse reali zado el ajuste inicial. Por
ejemplo, en este estudio, no se tomaron en consideraci6n otras enfermedades que
afectan tanto la actividad sexual como la mortalidad (por ejemplo, diabetes, y
posiblemente condiciones psiqu iatricas). Adicionalmente, diferencias sutiles en
el est ado de salud que no se aprecian por la presencia 0 ausencia de enfermedades
conocidas y fac tores de riesgo (por ejemplo, perfil psicol6gico 0 bienestar
general) se mant ienen sin ser consideradas, y por tanto, subrayan las dificultades
de tomar tota l mente en consideraci6n los efectos de confusion del est ado general
de salud en estudios observacionales.
Otro tipo de confusi6n residual se produce cuando la variable que se usa para el
aj uste es una trazadora imperfecta de la verdadera variable por la que se quiere hacer
el aj uste. As\, se ha cuest ionado la idoneidad del nivel educacional como un suceda-
neo de la clase social, particul armente cuando se comparan blancos y negros en los
Estados Unidos(ll).
Otras causas de confusion residual (por ejemplo, errores en la medici6n de la
variable confusora) se discuten en el Capitulo 7, Secci6n 7.5.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 175
SAA. Tipos de efectos de confusion: confusion negativa, positiva
y cualitativa
La confusion puede conducir a una sobreesti maci6n de la verdadera fuerza de la aso-
ciacion (confusion I'0sitiva) 0 a una subestimacion (confusion negativa) . En otras
palabras, la confusion posit iva exagera la magnit ud de la asociaci6n no ajustada
(frente a la aj ustada); la confusion negati va, la atenua. Adviertase que los terminos
.wbreestimacion y subestimacion se usan en relaci6n con la hi p6tesis nul a. As f, por
ejemplo. un odds ratio aj uslado de 0.7 es (en terminos absolutos) mayon> que un
odds ratio no aj ustado de 0,3; no obstante, el hecho de que el primero este mas pro-
ximo que el segundo al oddJ' ratio que indica no asociaci6n ( 1,0) defi ne el efecto de
confusi6n como positivo.
En la Tabla 5.7 se muestran ejemplos hi poteticos de esti mados de riesgos relati -
vos que il ustran el efecto de la confusion. Los primeros tres ejemplos muestran aso-
ciaciones no aj ustadas, en las cuales 0 bien desaparece, 0 bien se debili ta cuando se
aj usta por confusion. Los ejemplos de confusi6n posi tiva son abundantes, incluyen-
do la mayorfa de los que se usaron antes en este capitulo (por ejemplo, sexo/malaria
frente a ocupaci6n, el cual serfa analogo al ejemplo n.o I en la Tabla 5.7,0 el ejem-
plo de consumo de vitami na C/dncer de colon frente a estilos de vida saludables,
posiblemente comparable al ejempl o n.o 3 en la Tabla 5.7) .
Los ejemplos del n.o 4 al 6 en la Tabla 5.7 muestran la situaci6n inversa - es
decir, confusi6n negativa, en la cual el ri esgo relat ivo no ajustado es un estimado
por defecto del ajustado (frente a la hip6tesis nula). EI aj uste pone de mani fi esto 0
fortalece una asociaci6n que fue considerada como ausente (ejemplo n.o 4) 0 debili-
tada (ejemplos n.o 5 y 6) a causa de la confusion. Un ejemplo de confusion negativa,
en el cual el riesgo relat ivo aj ustado se encuentra bastante alejado de 1,0 cuando se
Ie compara con el valor no aj ustado, puede hall arse en un estudio de Barefoot et.
al.\ 14l . Usando la escala de Hostilidad de Cook-Medley, que es una subescala del
ampliamente utili zado Inventario Multifasico de Personali dad de Minnesota
(IMPM) para medi r constructos psicologicos, los autores examinaron la relaci6n de
la hostili dad con la incidencia de infarto agudo del miocardio. Aunque no se dieron
los result ados sin aj uste alguno, se informo de que el ri esgo relativo cambi6 de 1,2
cuando solamente se aj ust6 para la edad y el sexo y a alrededor de 1,5 cuando la ten-
Tabla 5.7
Ejemplos hipotCtieos de ri csgos relativos ajustados y no ajustados segun tipo
de conrusion (positivo 0 negativo)
EJemplo N. "
2
3
4
5
6
7
8
Tlpo de confusion
Positillo
Positillo
Positillo
Negalivo
Negalivo
Negalivo
CualitativCl
CualitativD
Rlesgo relatillo Aiesgo ralativo
no ajustado ajustado
3,5 1,0
3,5 2,1
0,3 0,7
1,0 3,2
1,5 3,2
0,8 0,2
2,0 0,7
0,6 1,8
176 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sian arteri al sist6lica, habito de fumar, trigliceridos, trabaja sedentario y desocupa-
cion sedentaria se incluyeron tambien en el modelo de regresi6n de riesgos propor-
cionales de Cox (vease el Capitulo 7. Secci6n 7.4.4) . Con atras palabras, se puede
conduir que una 0 mas de estas covariables adicionales (tension arterial, habita de
fumar, trigliceridos, est il o de vida sedentaria) fueron confusores negat ivos de la aso-
ciaci6n entre hostilidad e incidencia del infarto de miocardia.
Un caso extrema de confusi6n se tiene cuando su efeclo ocasiona la inversi6n
de la direcci6n de la asociaci6n (Tabla 5.7, ejemplos n.o 7 y 8), fenomeno que puc-
de designarse propiamcntc como confusi6n walitativtl . En el ejemplo n." I. Sec-
ci6n 5.1 , la raz6n de tasas crudas de morta li dad entre US/Venezuela es 8,7/4,4 =
1,98; sin embargo, cuando se usan las tasas aj ustadas por edad, esta raz6n pasa a
ser: 3,6/4,6 = 0,78. Los patrones opuestos de la razon de tasas crudas y ajustadas
se producen en virtud de la gran diferencia en las distribuciones de la edad entre
eslOs dos pafses.
A modo de resumen, la Figura 5.9 muestra representaciones esquematicas de
efectos de confusion negativos, positivos y cuali tativos .
ej. 1
..... ej.2
ej. 3
ej. 4
ej. 5
0,1
Riesgo relalivo
No ajuslado
D Ajuslado
10
Figura 5.9. Ricsgos rclativos (RR) 110 ajustados y ajustados : Se aprecia confusi6n negati-
va en los ejemplos 1 y 3 (los riesgos relativos ajustados estan bastante mas apart ados del
valor nulo de 1.0 que los no ajustados): se aprecia confusi6n posiliva en los ejemplos 2 y 4
(los riesgos relativos ajuslados estan mas pr6ximos al valor nulo de 1.0 que los RR no ajusla-
dos). EI ejemplo 5 denota confusi6n en la que cambia la direcci6n de la asociaci6n (confu-
si6n cllalilaliva).
La direccion de l efecto de confusion (positivo 0 negativo) se puede inferi r a
part ir de las direcciones de las asociaciones del confusor con la exposicion y el
desenlace, siempre que se conozcan. La Tabla 5.8 res ume 10 que debe esperarse
para los cam bios debido al ajuste en funci6n de las direcciones de estas aso-
ciaciones. De esta manera, se espera una confusion positiva cuando la asociaci6n
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES; CONFUSI6N 177
Tabla 5.8
Direcciones de las asociaciones del conrusor con la exposicion y eI descnlace
y 13 expectativa de cambio de la estimacion con el ajuste. (Se asume una relacion direc-
ta entre exposicion y descnlace, es decir, para exposicion/no exposicion, RR,
u odds ratio> 1,0)
La asoclaclon del La asociacion del Expectatlva de camblo
confusor con la confusor con el TIpo de confusion del estimado no
exposlcion es desenlace es ajustado al ajustado
Direcla" Direcla" Posiliva' No Ajuslada > Ajuslada
Direcla' Inversa
t
Negaliva
l
No Ajuslada < Ajuslada
Inversal Inversat Posiliva
l
No Ajuslada > Ajuslada
Inversa
l
Direcla' Negaliva! No Ajuslada < Ajuslada
Asociaci6n directa; la prasancia del confusor sa ralaciona con un aumanto da probabilidad da la axposicion 0
al desanlace.
Asociaci6n inversa: la prasencia del confusor se rei adona con una disminlJCi6n de la probabi lidad de la axpo--
sicion 0 del desanlace.
Confusi6n positiva; cuarnlo el electo de coofusi6n resulta en una medida no ajustada de asociad6n (por ajam
plo. riesgo relativo) bast ante mas apartada de]a hip6tasis nula que el astimaoo ajustado.
I Confusi6n negativa: cuarnlo al efecto de confusion rasul ta an una madida no ajustada de la asociacion mas
pr6xima a la hip6tesis nula que al astimado ajustado.
entre el confusor y la exposicion esta en la misma direccion de la asociacion entre
el confusor y el desenlace. Cuando estas asociaciones estan en direcciones diver-
gentes, habra una confusi6n negativa (0 una confusion cuali tat iva, en casos extre-
mos) .
SA5. Significacion estadistica en la evaluacion de la confusion
Es inapropiado descansar en la significacion esladfslica para idenl ificar la confu-
si6n. especialmente cuando, ya sea la expos ici6n (en esl udios de casos y conlro-
les) 0 el desenlace (en estudi os de cohone) varian marcadamenle con relacion a
la variable de confusi6n. Por ej emplo, en un est udio hipotetico de casos y conlro-
les donde se exam ina la relacion de oc urrencia de menopausia con la enfermedad
Y, en mujeres con edades entre 45 y 54 anos, pequenas diferencias estadfslica-
mente no significalivas en la edad entre los casos y los controles pueden causar
un efeclo confusor imporlanle en visla de la fuerte relacion enlre la edad y la pre-
sencia de menopausia en esle intervalo de edad. Por tanIo, aunque no hay aso-
ciacion de ninglin lipo entre la oClIrrencia de menopausia y enfermedad, si para
cada ano de edad el odds de menopa usia hipoteticamenle se incrementara de I: I
a 1,5 : I (para un incremento de prevalencia de la menopa usia de l 50 % al 60 %),
una diferencia de edad entre los casos y los conI roles tan pequena como lin ano
(Ia cual puede no ser esladfsticamenle significat iva si la muestra del estudi o no es
grande) resultarfa en un odds ratio de 1,5 para la menopausia no ajustada por la
edad (Figura 5. 10) .
Para aquellos que deciden usar el valor p como crilerio para idenl ificar confu-
sion, serfa juicioso el uso de un valor p mas dndll igente (conservador) como gufa
para identificar confusores: ejemplo, 0,20. Procediendo asf se permite la posibilidad
178 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
2
CaSDS
Conlroles
0+---
47 48
Edad media (anas)
Figura 5.10 Odds de la ocurrcncia de mcnopausia en un estudio hipotCtico de casas y
cOlltrol es. El odds de menopausia se incrementa en un 50% por cada aiio de edad. correspon-
diendo a una diferencia absoluta de 10% en la preva\encia de menopausia (en este ejemplo
60% y 50% en casos y controles respectivamente). Los casas y los controles tienen un ano de
diferencia en edad. De modo que. el odds ralio de 15 (15/ 1,0) retleja completamente la dife-
rencia de edad y no es consecuencia de una asociaci6n entre menopausia y enfennedad.
de aceptar 1a presencia de confusi6n ann cnando haya pequefias dife rencias entre
casas y controles en los est udios de casas y comroles. 0 entre sujetos expuestos y no
expues(Qs en est udios de cohorte. Esta estrategia, sin embargo, no deberfa sust ituir la
consideracion del investigador con respecto a la Jorraleza de las asociaciones del
presunto confusor con la exposicion y el desenlace como medio para identificar con-
fusi6n .
5.4.6. Confusion condicional
Una presunta vari able de confusi6n puede estar confundida por otras variables. Sien-
do aSI, una evaluaci6n univari ada puede sugerir que una variable Z es un confusor,
pero la misma vari able puede no act uar como confusora cuando se ajusta por otras
variables. De modo similar, puede que Z no aparezca como confusor univariadamen-
Ie porque esta negativamente confundida por otras variables, y en este caso el efec(Q
de confusion de Z puede hacerse evidente despues del aj uste.
5.4.7. Confusion y sesgo
(. Debe considerarse la confusi6n como un tipo de sesgo de selecci6n? Algunos
libros de texto de epidemiologla consideran que la confusi6n es Olro tipo de sesgo
(por ejemplo, Rothman y Greenland(' S)), esencialmente porque una asociaci6n con-
fundida puede entenderse como un estimado sesgado de una asociaci6n causal
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 179
(aquella que se expresa por el estimado ajustado, suponiendo que el procedimiento
de ajusle es apropiado y no esta sujeto a confusi6n residual ). En contraste, otros
libros de texto (por ejemplo, Lilienfeld y Stoll ey(16) y Gordis(l7)), dife rencian entre
asociaciones espurias debidas a sesgo y asociaciones (0 estadfsti -
cas>,) debidas a la confusi6n, sugiri endo as! que conjusi6n es di stinta de sesgo. La
16gica de mantener la confusi6n como algo conceptualmente diferente al sesgo se
puede describi r como sigue. Suponiendo que no hay variabilidad aleatoria. se
muestra una representacion esquematica de confusion y sesgo en las Figuras 5.11 y
5.12, respect ivamente. En estas figuras, los cfrc ul os represent an casos 0 controles,
Z el factor de confusion y X la exposicion de interes. Los cfrculos grandes y
pequefios denotan la poblacion de referencia y los subconjuntos de muestras del
estudio, respecti vamente. En la Figura 5.11 , la proporci6n de Z (por ejemplo, habi-
to de hlmar) en la poblacion de referencia es en verdad mas grande en los casos
que en los controles: as!, cualquier factor relacionado con Z, tal como X (por ejem-
plo, consumo de alcohol), es mas frecuente en los casos. En la confusion, las mues-
tras del est udio refl ejan muy bien el hecho de que X (por conducta de Z) es mas
com li n en casos que en controles. Por otra parte, en la Figura 5.12, la proporci6n
de casos y controles en los que Z esta presente es la misma que la de la poblaci6n
de referencia; sin embargo, en las muestras, el sesgo de seleccion ha resultado en
casos que tienen una proporcion mas alt a (espuriamente) de Z (y por tanto de X)
que los controles. Considerese, por ejemplo, un estudio de casos y controles en que
los casos proceden de hospitales que admit en preferentemente a pacientes con una
alt a SSE, y los controles se eli gen de entre los no casos de la poblacion de referen-
cia . Como result ado de este tipo de sesgo de selecci6n, se observaran asociaciones
positivas de exposiciones relacionadas con alta SSE.
Poblaci6n
de referencia
Muestra del
estudio
Z '" Con/usof
w(D a'cD
do ok
X :0 Presunlo !actof de riesgo
Figura 5.11. Rcprcscntaci{m esquenui tica de la conrusion. En la poblaci6n de referencia.
el factor de confusi6n Z es real mente mas comun en los casos que en los controles. Supo-
niendo que no hay variabilidad aleatoria.la frecuencia mas alta de Z en los casos (representa-
dos por las areas de intersecci6n sombreadas de los cfrculos) se refleja la muestra en que se
basa el estudio. y como resultado, la frecuencia de exposici6n de interes X (que. por defini-
ci6n. se relaciona con Z) es mas alta en los casos que en los controles.
180 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Poblaci6n ( \
O
CASOS ......
de referencia l ................... //
Muestra del
esludio

JAu
Ole[)
ok
z Factor relacionado con la selecci6n (por ejemplo, SSE alia)
X '" Presunto factor de riesgo
Figura 5. 12. Rcprescntacion esqucmalica del sesgo de seleccion. En la poblaci6n de
referencia.la proporci6n del factor Z es la misma en los casos y en los controles. Suponiendo
que no hay variabilidad aleatoria. la frecuencia mas alta de Z en la muestra de casos (repre-
sentados por las areas de intersecci6n sombreadas entre los cfrculos que denotan casos y Z)
es el resultado del sesgo de selecci6n dot:de la elecci6n de los casos esla intluida por la pre-
sencia de Z. SSE. situaci6n socioecon6mica.
Esta dist inci6n conceptual entre confusi6n y sesgo, quizas solo sea de interes
intelectual cuando se evalli an relaciones causales (porque, para aceptar una relaci6n
como causaL tanto la confusion como el sesgo tienen que poder ser descartados co-
mo explicaci6n probable); en todo caso, se torna importante cuando los result ados
epidemiol6gicos se consideran en el contexto de la practica de la salud publica. Aun-
que la confusi6n se clasifique 0 no como sesgo, hay un papel claro para asociaciones
verdaderas, aunque esten confundidas, ya que permiten la identificaci6n de trazado-
res que pueden ser utiles para definir gmpos de alt o riesgo con vistas a la prevenci6n
secundaria.
Como se resume en el Esquema 5.5, a los efectos de la prevenci6n primaria tiene
que exist ir una asociaci6n causal entre el factor de riesgo y la enfennedad; en otro
caso, la modificaci6n de dicho factor no conducirfa a una reducci6n del riesgo de
padecerl a. Sin embargo, para la prevenci6n secundaria, es suficiente que exista una
asociaci6n estadfsrica entre el factor de riesgo y la enfennedad, al margen de que tal
asociaci6n sea 0 no causaL Un ejemplo es la relaci6n de niveles altos de trigliceridos
sericos (TO) y la enfermedad arterioscler6tica. Durante afios, ha reinado incert idum-
bre con respecto al papel independiente de niveles altos de TO sobre el desarroll o de
arteriosclerosis, ya que esta relaci6n podrfa ser un mero reflejo de la fuerte relaci6n
inversa entre altos niveles de TO y bajos niveles de HDL que estan causalmente
al ciesarrollo cie (Figll ra .<; .1 1) . 0 no li n nexo causa l
entre altos niveles de TO y arteriosclerosis, no hay dudas de que individuos con alt os
niveles de TO son mas propensos al desarrollo de la arteriosclerosis. Por tanto, a
diferencia de una relaci6n espuria resul rante de sesgo. una relaci6n verdadera, aun-
que confundida, permite la identificaci6n de individuos con gran probabilidad de
ocurrencia de la enfermedad.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N 181
Esquema 5.5.
La relacion entre tipos de evidencias necesarias en estudios epidcmiologicos
y tipo de prevencion Ilevada a cabo (primaria 0 secundaria)
OBJETIVO
Prevenci6n primaria: prevenci6n 0 cese de la
exposici6n aJ factor de riesgo. (por ejemplo,
consumo de grasa salurada y arteriosclerosis) .
Prevenci6n secundaria: diagoostico temprano
a Iraves de tamizaje selectivo en sujelos de
allO riesgo (por ejemplo, tipificaci6n de indivi-
duos con niveles alios de Irigliceridos).
HDL bajo
TlPO DE EVIDENCIA NECESARIA
La asociaci6n causaJ debe eSlar presente; de
otro modo, la inlervenci6n sobre et factor de
riesgo no afectara el desenlace de la enferme-
dad.
Por ejemplo. si la grasa no causa la arterioscle-
rosis. un con sumo bajo de grasas no afecta el
riesgo de padecerla.
La asociaci6n puede ser causal 0 eSladislica
(Ia ullima no puede ser sesgada): esto es, la
asociaci6n puede ser confundida. Por ejempto.
aunque los individuos hipertrigliceridemicos
tengan una probabilidad mayor de desarrollar
la enfermedad arterioscler6tica debido al efecto
confusor de los niveles bajos de lipoproleinas
de alia densidad, la arteriosclerosis es real-
mente mas comun en estos individuos.
Trigliceridos
elevados
?
Arterioesclerosis
Figura 5.13. Relacion entre hipertrigliceridemia, bajos niveles de col esterol de alta den-
sidad y arteriosclerosis
55. CONCLUSION
La confusi6n acompafiada de sesgo constituye un notable inconveniente para la eva-
luacion de relaciones causales. En este capItulo se discutieron vados aspectos rela-
cionados, tanto con la definici6n de efec(Qs de confusion, como con vados enfoques
para verificar la presencia de confusion. La eval uacion de la confusi6n antes de
hacer aj ustes se destaco como medio para la prediccion de la magnitud y la direcci6n
182 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
de posibles cambias (sf se diem ese caso) en la medida de asociaci6n detectada
mediante ajuste. EI concepto de confusi6n residual (que se disclite ademas en el Capf-
mla 7), se imrodujo en este capitulo, as! como la noc i6n de que las prucbas estadfsticas
de significaci6n no deben usarse como un criteria para evaluar la confusi6n. Finalmen-
Ie , se discuti6 1a 16gica para no clasificar la confusion como un tipo de sesgo,en eI con-
texto de la utilidad de asociaciones confundidas pem verdaderas; como un modo de
identificar grupos de alto riesgo con prop6sitos de prevenci6n secundaria.
BlBLIOGRAFiA
I. Organizaci6n Panamericana de la Salmi/Pan American Health Organization. Las cOlldi-
ciolleJ de salmi ell las Americas. Washington, DC: OPSIPAHO: 1990, Publicaci6n Cien-
tifica n," 524,
2, Davey Smith G, Frankel S. Yarnell J .Sex and death: are they related? Findings from the
Caerphilly Cohort Study. Bf Med J 1997: 315: 1641-1644.
3. Smalley WE, Ray WA. Daugherty JR el al. No association between calcium channel bloc-
ker use and confirnled bleeding peptic ulcer disease. Am J Epidemiol 1998: 148: 350-354.
4. Heilbrun LK, Nomura A, Hankin JH el al. Diet and colorectal cancer with special
reference to fiber intake.fnl J Cancer 1989:44: 1-6.
5. Broda G. Davis CEo Pajak A el al. Poland and United States Collaborative Study on Car-
diovascular Epidemiology: A comparison of HDL cholesterol and its subfractions in
populations covered by the United States Atherosclerosis Ri sk in Communities study
and the Pol-MONICA project. Anefios(Jer Thromb Vc/Sc Bioi 1996: 16: 339-349.
6. Manson lE, Stampfer MJ. Hennekens CH el al. Body weight and longevity: a reassess-
ment. JAMA 1987: 257: 353358.
7. Rush D. A correction by the author: Maternal smoking: a reassessment of the associa-
Ilon wIth pennatal mortality. Alii J t'pidemiol 1 Y7J: Y7: 425.
8. Breslow NE. Day NE. Slalislicalmelhods in cancer research. Vol. f. The analysis of
casecol1lrol sludies. Lyon. France: International Agency for Research on Cancer Scien-
tific Publications . 1980.
9. Shimakawa T. Sorlie P. Carpenter MA el al. Dietary intake patterns and sociodemograp-
hic factors in the Atherosclerosis Risk in Communities (ARIC) study. Prev Med 1994:
23: 769-780.
10. Miettinen OS. Cook EF. Confounding: essence and detection. Am J Epidemiol 1981:
114: 593-603.
II . Greenland S. Absence of confounding does not correspond to collapsibility of the rate
ratio or rate difference. Epidemiology 1996: 7: 498-50 I .
12 . Pandey OK. Shekelle R. Selwyn BJ e/ al. Dietary vitamin C and l3-carotene and risk of
death in middle-aged men. The Westem Electric study. Am J Epidemiol 1995: 142:
1269-1278.
13 . Krieger N, Williams DR, Moss NE. Measuring social class in US public health research:
concepts. methodologies. and guidelines. Amw Rev Public Heallh 1997: 18: 34 1-378.
14 . Barefoot Jc, L1rsen S. von der Lieth L eI al. Hostility. incidence of acute myocardial
infarction, and mortality in a sample of older Danish men and women. Alii J Epidellliol
199'1: 42: 477_41<4.
15 . Rothman K1. Greenland S. Modern t'pidemi%gy. 2nd ed. Philadelphia. Lippincott. Ra-
ven Publishers. 1998.
16. Li lienfeld DE, Stolley PD. Foundalions of epidemiology. New York. Oxford University
Press. 1994.
17. Gordis L Epidemiology. Philadelphia. WB Saunders. 1996.
CAPITULO 6
Definicion yevaluacion
de la heterogeneidad de efectos:
Interaccion
6.1. INTRODUCCION
El {ennino interacci6n se emplea en epidemiologfa para descri bir una situaci6n en la
ellal dos 0 mas factores de riesgo modifican el cfccto que cada ellal Ilene sobre la
ocurrencia 0 eI nivel de un desenlace dado. Este fenomeno, tambitn conocido como
modificacion de efectos. debe dist inguirse de la confusion. Tal como se discllt i6 con
dctall e en el Capitulo 5, la confusion concierne a la situaci6n en la ellal una variable
que se asoc ia tanto con la exposici6n como con el desenlace de interes es responsa-
ble enteramente 0 en parte de la asociaci6n estadfstica observada entre la exposici6n
y el desenlacc. La interacci6n entre lIna variable dada (modi fi cador de efec(Os) y
dena exposicion es un fen6meno diferente, tal y como se detalla en las siguientes
secciones.
Con respeclo a las variabl es dicotomicas, la illleraccion signi fi ca que el efecto de
la exposicion sobre el desenlace difiere en dependencia de si olra variable (modifi ca-
dor de efectos) esta 0 no presente. Si la presencia del efecfO modificador potencia
(acent ua) el efecto de la exposicion de interes, entonces esta variable y la exposici6n
se consideran J'inirgicas (interaccion I'ositiva); si la presencia del modificador de
efecto disminuye 0 elimina eI efecto de la exposici6n de interes, puede decirse
entonces que el efecto modificador y la exposici6n son antugoniJtuJ (interacci6n
ncgativa). Este concepto puede ser eXlendido a vari ables continuas . En este contex-
fO, el fenomeno de la interaccion signi fi ca que el efecfO de la exposicion sobre el
desenlace difiere dependiendo del nivel de otra variable (la modificadora de efecto).
AI menos tres factores son necesarios para que el fenomeno de la interacci6n se
presente. En este capitulo, el principal factor de riesgo impmado sera designado
como facfOr A, la vari able que representa el desenlace, como Y, y el tercer facfOr
(modificador potencial de efecfO) como Z. Adicionalmente, aunque se reconoce que
hay diferencias en medidas relati vas y absolmas segun que se reHeran a un riesgo,
lasa u odds, los terminos genericos riesgo, rie.\'go arribuible y rie.\go relarivo seran
fundamentalmente los empleados . Por otra parte, el tennino hOlllogcncidad indica
que los efectos de un factor de ri esgo A son homogeneos 0 simi lares para los dife-
rentes estratos fonnados por el factor Z. Heterogeneidad de efecfOs, por tanto, alude
a fl ll e ciifieren entre
La discusion que sigue se basa en muy buena medida en la situacion mas simple,
aquell a que involucra a la interacci6n entre dos variables con dos categorfas cada
una, con un desenlace discreto (por ejemplo, la enfermedad esta 0 no presente) y con
asociaciones positivas (es decir, caraclerizadas por un riesgo relat ivo mayor que
1,0). Dtros tipos de interacci6n que pueden ser evaluadas, pero que no se discuten en
184 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
detalle en este li bra, abarcan los que se basan en mas de dos variables .<indepen-
diemes,o en variables cominuas. Fi nalmente, la palabra elecro, que deberfa ser
empleada con precauci6n cuanda se (rata de inferir relaciones et io16gicas a partir de
esmdios observacionaies('\ es frec lIcntemente invocada en este capit ulo en un sent i-
do alga laxo, de manera que pennita eI uso del termino modificacion de efeero.
La interacci6n puede seT definida de dos manera.>; diferemes aunquc compatibles.
Cada definicion conduce a una estrategia especffica para la evaluaci6n de la imeracci6n.
1. Definicion basada ell la IlOlIIogeneidad 0 la heterogeneidad de los efecto.\": La
interacci6n ocurrc cuanda eI efcc(O de un factor de riesgo A sobre eI riesgo de
que se produzca un desenlace Y no es homogeneo para los distintos estratos
formados por una tercera variable Z. Cuando es esta la definici6n que se
emplea. la variable Z suele ser cali ficada como lIIodiJicadora de eJeeto.
2. Defillici6n bas{/(ia en fa eOlllparaci611 entre efeetos cOlljllntos observados y
espemdo.\ liel factor lie riesgo A y IIlIa tercera variable Z: La interacci6n se
produce cuando el efecto conjunto observado de A y de Z difiere del que cabe
esperar si los efectos de A y de Z fueran independientes.
6.2. (,COMO SE MlDE EL EFECTO?
Una decisi6n importante en la evaluaci6n de la interacci6n usando cualquiera de las
dos definiciones concierne a c6mo medi r el efecto. EI efecto puede ser medido ya
sea a traves del riesgo atri buible (Illodelo aditivo) 0 mediante la diferencia relativa,
por ejemplo. usando el riesgo relativo (IIIOc/eiO IIIlI/riplicarivo). La base concept ual
para la evaluaci6n de la interacci6n, sin embargo, es la misma para ambos modelos.
6.3. ESTRATEGIAS PARA EVALUAR LA INTERACCION
6.3.1. Evaluaci6n de la homogeneidad de efectos
La variabilidad en materi a de susceptibilidad a que se produzca determinado desenla-
ce, dada una exposici6n a un factor de ri esgo, rellejada como heterogeneidad entre
individuos del efecto del factor de riesgo, parece ser un fen6meno universal tanto para
enfermedades infecciosas como para no infecciosas. Por ejemplo, induso cuando esta-
mos ante una asociaci6n fuerte, tal como la que se produce entre el habito de fumar y
el cancer pulmonar, no toda persona expuesta desarroll a la enfennedad. Suponiendo
que el azar no desempefia papel alguno en determinar quienes entre los fumadores
desarroll an cancer pul monar, ello demuestra que fumar en sf mismo no es una causa
suficiente. As!. los fumadores que desalTollan cancer pul monar probablemente difieran
de aquellos fumadores que no 10 desarroll an en que algun otro componente causaf)
debe estar presente entre fumadores que desarroll an cancer pulmonar para hacerlos
susceptibles de tener una enfennedad inducida porel habito. La presencia de este com-
ponente causal necesario puede ser concebida genericamente como un factor de sus-
ceptibilidad, que pudiera estar genetica 0 ambientalmente determinado.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 185
Una represemaci6n eloc uente aunque simplista del marco conceptual para la
interaccion definida como heterogeneidad de efectos se muestra en la Figura 6.1.
Tras observar que existe una asociacion estadlstica entre un factor de riesgo A y
un desenlace morboso Y, y admitiendo como razonablememe cierto que la aso-
ciacion no se debe a confusion 0 sesgo, la pregunta cmcial en la evaluaci6n de la
interaccion es: (, Varia la magnitud 0 la direcci6n del efecto A sobre Y concordame-
meme con la oc urrencia de alguna otra variable Z en la poblaci6n que se est udia?
Una respuesta posit iva sugiere la presencia de interaccion. Por ejemplo, puesto que
la diabetes es un factor de riesgo mas fuerte para la enfermedad coronaria (EC) en
mujeres que en hombres, se puede concl uir que hay interacci6n: esto es, que el gene-
ro modifica el efecto de la diabetes sobre el riesgo de Eel).
La conceptualizacion de interacci6n como ocurrencia de heterogeneidad de efec-
(Os de A (por ejemplo, la exposici6n al asbesto) de acuerdo con la presencia 0 ausen-
cia de Z (por ejemplo, fumar) explica por que la expresi6n, lIIodificaci6n de cicero se
usa como sinonimo de interaeci6n. Por ejemplo, el lenguaje apropiado a la hora de
describir la imeracci6n entre el habi(O de fumar y el asbesto en relacion con el riesgo
de cancer pulmonar es que, el efecto de la exposici6n al asbes(O sobre el riesgo de
cancer pulmonar es modificado por el habiw de fumar cigarrillos en el sentido de
que es mucho mas fuerte en fumadores que en no fumadores. La expres i6n lIIodifi
cador de eJeero sugiere que el investigador ha elegido algun tipo de nivel jerarquico
en la aproximaci6n a dos variables independientes: A es la variable fundamemal de
interes y Z es el modificador de efec(O. Desde el punto de vista prevent ivo, la varia-
/.Hay asociaci6n entre
ellaclO! de tiesgo X
y la enfermedad?
Si
/.Es ella debido a
Si
Asociaci6n espuria 0
sesgo 0 confusi6n? debida a confusi6n
No
Existe interacci6n 0
~
modificaci6n de efectos
/.Es la asociaci6n en los
subgrupos de similar
magnilud?
0;-
No hay interacci6n
Figura 6.1. Marco conceptual para la definicion de interaccion basada en eI concepto de
homogeneidad
186 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
ble no susceptible de intervenci6n (por ejemplo, un gen) es usualmente considerada
como modificador de efecto, en contraste con lIna exposicion que puede ser preveni-
da 0 eliminada.
Tal y como se mencion6 previamente, un aspecto clave en la evaluaci6n de la
interacci6n es que esta involucra al menos a tres variables: el factor principal de ime-
res A (por ejemplo, diabetes), el modificador de cfccto potencial Z (por ejemplo,
genera), y un desenlace especffico Y (por ejemplo, enfermedad coronaria). Pucden
existir, sin embargo, mas de dos variabl es independientes interact uando: por ejem-
plo. si la diabetes es un factor de ri esgo mas imponante para las mujeres que para los
hombres solo entre aquellos suje{Qs mas viejos. En este ejemplo hipotetico. la pre-
sencia simultanea de dos variables sedan necesarias para modificar el efecto de la
diabetes: genero yedad.
Deteccioll de interaccion aditiva: fa diferencia absofllta 0 lIlodelo de riesgo
atribllible
La interaccion aditiva se presema cuando el riesgo atribuible en los expuestos al fac-
tor A (RA ..
p
, es decir, la diferencia absolma de los riesgos entre los expuestos y los
no expuestos a A; vease Capitulo 3, Ecuaci6n 3.4) varfa (es heterogenea) en la medi-
da que cambia una tercera variable Z.
La manera mas simple de evaluar la interaccion en este ejemplo consiste en cal-
cular los ri esgos atribuibles para aquellos que estan expuestos al factor de riesgo A
para cada estrato definido por los niveles del modificador de efecto potencial Z.
Ejemplos hipoteticos de esta estrategia para evaluar imeracci6n aditiva se muestran
en la Tabla 6.1 y 6.2. En la Tabla 6.1, el exceso de riesgo absoluto de Y atribuible a A
no se modi fica en la medida que cambia la exposici6n a Z. En la Tabla 6.2, el riesgo
atribuible para A es mayor para aquellos que estan expues{Qs a Z que para los que no
10 estan, 10 que indica heterogeneidad de los efectos absolutos de A. Notese que, en
estas tab las hay dos categorfas de referenda diferentes para los riesgos atribuibles
asociados con A: para el estrato en el cual Z esta ausente, la categorfa de referencia
es Z auseme, A ausente: para el estra{Q en el cual Z esta presente la categorfa de
referencia es Z presente, A ausente.
Los patrones mostrados en las Tablas 6.1 y 6.2 pueden examinarse graficamente
(Figura 6.2A). Se emplea un grafico con escalas aritmeticas para evaluar la imerac-
z
No
Sf
Tabla 6.1
Ejemplo hipotCtico de ausencia de interaccion aditiva
A
No
Sf
No
Sf
Riesgo atribuible de A dentro de los estratos de Z.
Tasa de incidencia
(por 1.000)
10,0
20,0
30,0
40,0
Riesgo atribuible
(por 1.000)"
o
10,0
o
10,0
z
No
Si
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
Tabla 6.2
Ejemplo hipotctico de presencia de interacci{m aditiva
A
No
Si
No
Si
Tasa de Incldencia
(por 1.000)
5,0
10,0
10,0
30.0
Rlesgo atribuible
(por 1.000)'
o
5,0
o
20.0
Riesgo alribuible de A dentm de kls estratos de Z.
A. Inleracci6n aditiva
Ausente Presente
100 100
90
z.
b
80
b
80

6()
>
6()

z.
>
60


z-

z-

40

40





20

20
0 0

,.
0

0

A- A. A- A.
S, Interacci6n
Ausenle Presente
100 100
90 Z+
b
8.
> >

3()
z.



v?

20 z-
z-

15

15
10 10
if
10
if
10
A- A. A- A.
187
Figura 6.2. Evltluacion de la interal'Cion pur medio de gnificos. Pam la intemcci6n aditi -
va (A), sc emplean escalas aritmeticas en las ordenadas (las pendientes representan diferen-
ci as absolutas). La intemcci6n esta auscnte en el panel de la izquierda porque la diferencia
absoluta entre A+ y A es la misma, independientemente de la presencia de Z (60 - 30 = 40 -
10 = 30 por I (X){). La intemcci6n esta presente en el panel de la derecha porque la diferen-
cia absoluta entre A+ y A- es mayor cuando Z esta prescnte (90 - 30 = 60 por I J){)O) que
cuando Z esta ausente (40- 10 = 30 por 1.000). Para la interaccion multiplicativa (B), ha de
emplearsc una escala logarftmica en las ordenadas (las pendientes representan diferencias
relativas). La interaccion esta ausente en el panel de la izquicrda porque la diferencia relati -
va entre A+ y A- es la misma, independientemente de la presencia de Z (30115 = 20/ 10 = 2).
La interaccion esla presente en el panel de la derecha porque la diferencia relativa entre A+ y
A- es mayor cuando Z esta presente (90/ 15 = 6) que cuando Z esta auscnte (20/ 10 = 2).
188 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cion aditiva. Los ri esgos para carla categorfa del factor de riesgo A son ubicados en
el sistema de ejes separadamente para indi viduos expucslos y para aquellos que no
estan expucstos a la tercera variable Z. En este ti po de graficos (aritmCiicos), la incli-
naci6n (magnitud de las pendientes) es una fllnd6n de las diferencias absolutas. As!,
cuanda la diferencia absoluta en el ri esgo del desenlace (riesgo atribuible en aque-
lI os que estan expuestos a A) es la misma, independientemente de la exposici6n que
se tenga a Z, las dos Iincas son paralelas. Cuanda las diferencias absoluta difieren, 10
que pone de manifiesto interacci6n aditiva, las Ifneas no son paralelas.
Deteccioll de inleraccioll multiplicativa: fa diferellcia refativa 0 modelo de razon
La interacd6n multiplicativa se presente cuando la diferenda rei at iva
(razon) en el riesgo de un desenlace Y entre sujeros expuestos y no expuestos a un
presunto factor de riesgo A difiere (es heterogeneo) como una fundon de una terce-
ra variable Z. En las Tablas 6.3 y 6.4 se muestran ejemplos hipoteticos de la evalua-
don de la interacdon multiplicativa. (N6tese que, consistentemente con las
Tablas 6.1 y 6.2, hay dos categorfas de referenda diferentes para los riesgos relati-
vos asociados con A: para el estrato en el cual Z esta ausente, la categorfa de referen-
da es Z ausente, A ausente; para el estrato en el cual Z esta presente, la categorfa de
referenda es Z presente, A ausente). En la Tabla 6.3, el riesgo relativo para A es el
mismo tanto para aquell os que estan expuestos a Z como para los que no 10 estan.
z
No
Sf
z
No
Sf
Tabla 6.3
F.j .. mrio hirotelko til' 1I 11. .... nda til' mnitiriklltil'1I
A
No
Sf
No
Sf
, Riesgo relativo de Adentro de kls estratos de Z.
Tasa de incidencla
(por 1.000)
10,0
20,0
25,0
50,0
Tabla 6.4
Rlesgo atrlbulbte
(por 1.000)"
1,0
2,0
1,0
2,0
Ejemplo hipotCtico de interaccion multiplicatil'a
A
No
Sf
No
Sf
, Riesgo relativo de Adentro de kls estratos de Z.
Tasa de incidencla
(por 1.000)
10,0
20,0
25,0
125,0
Rlesgo atrlbulbte
(por 1.000)"
1,0
2,0
1,0
5,0
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 189
En la Tabla 6.4. el riesgo relativo para A es mayor para aquellos que estan expuestos
que para los que no eSlan expuestos a Z, 10 que sugiere que los efectos de A medidos
como riesgo relat ivo son heterogeneos en los que concierne a Z.
AI igual que para la interacci6n adit iva, la interacci6n multi pl icat iva puede ser
evaluada graficamente mediante la ubicaci6n en el grafico de las tasas para cada
categoria de A de acuerdo a los eSlratos definidos por Z (Figura 6.28). Para la eva-
luacion de la interacci6n mul ti plicativa, sin embargo, se emplea una escala logarft-
mica en el eje de ordenadas. Asi, la incl inaci6n de las pendientes es una funci6n de
las diferencias relativas: cuando las razones de riesgo para A son iguales para
expuestos y para no expuestos a Z, las curvas especfficas para Z son paralelas, eslO
indica la ausencia de interacci6n multi plicativa. Las lineas no paralelas sugieren la
presencia de interaccion mult iplicat iva.
63.2. Comparaci6n de efectos conjuntos observados y esperados
Como ya fue disc utido, una definici6n alternativa de interaccion se asoc ia a la situa-
cion en que el efeclO conjunto observado de A y Z difiere del esperado. EI efeclO
conjunto esperado puede est imarse apl icando el supueslO de que los efectos de A y Z
son independientes. As!, para comparar efectos conj untos observados y esperados de
A y Z, es necesario est imar primero sus efectos independientes.
Como ocurrfa en la evaluacion de la homogeneidad, la estrategia de comparar los
efectos conj untos esperados y observados se basa en un marco conceptual comun,
tanto para modelos aditivos como mul li plicat ivos: la unica diferencia entre estos
modelos radica en que se emplea la diferencia relativa 0 absoluta en la evaluaci6n de
la interaccion. EI marco conceptual que subyace a tal estrategia se muestra de mane-
ra esquemalica en el Esquema 6.1. En este esquema, los rectangulos designados con
las letras A y Z representan los efectos independientes del factor de riesgo potencial
A y del modificador de efecto Z. Si no hay interacci6n cuando la exposicion se pro-
duce en ambos factores, entonces el efecto conj unto debe coincidir con la suma de
los efectos independientes, como se representa mediante el rectangulo A + Z en el
Esquema 6.lA. (EI tennino suma no se usa aquf en el contexto de una simple suma
(aritmetica), 10 que 10 limitarfa al modelo adil ivo; mas bien, este alude a los efectos
combinados de A y Z). En el Esquema 6.1 B, el efeclO conjunto observado excede el
efecto conjunto esperado. EI area a la derecha de la linea punteada representa el ex-
ceso debido a la interaccion. Puesto que el efecto conjunto observado es mayor que
el esperado, hay una interaccion posit iva 0 sinergismo. Sin embargo, si el efecto
conjunto observado de A y Z es menor que el esperado, entonces hay una interacci6n
negativa 0 antagonismo (Esquema 6.1 C).
Detecciotl de itlteracciotl aditi va: la diferetlcia absoluta 0 lIl odelo
del riesgo atrwuible
Cuando se evalua la presencia de interacci6n aditiva mediante la comparaci6n de
efectos observados y esperados, el efecto conj unto de A y Z se estima como la suma
aritmetica de los efectos independientes medidos mediante riesgos atri buibles en
sujetos expuestos (RAexp). EI Esquema 6.2 presenta dos ejemplos hipotelicos que
]90 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
E.iquema 6. 1
Marco conceptual de 13 definicion de intcr acci on basada ell 13 compar acioll de cfedos
conjuntos cspcr ados y obscr vados
A. Cuando no hay interacciOn, el ejecta conjunto de los l actores de riesgo A y Z as igual a la
suma de sus efeclos independientes:
A z
Esperado
Observado
B. Cuando hay una interacci6n posifiva (sinergismo) el ejecto conjunlo observado de los facio
res de riesgo A y Z as mayor que el esperado cuando se suman los efeclos independientes
deAyZ:
A z
Expectador
Observador
"Exceso detlido a interacci6n positiva,
C. Cuando hay una inleracci6n negaliva, la suma de las areas para e/aclas independientes A y Z
deberfa ser de la misma Iongilud que 10 . esperado, con Iongilud menor para 10 Qobservaoo" .
A z
Expectador
Observador
'Thificit" deDido a inleracci6n negaliva
muestran la ausenda (A) y la presencia (8) de interacd6n aditiva. El pri mer paso es
calc ul ar las tasas de inddenda para cada una de las cuatro celdas de la tabla defi ni-
das por los factores A y Z. La celda que representa la ausenda de ambas exposicio-
nes (-1-) se designa como la categorfa de referend a. Los riesgos atribuibles observa-
dos en el Esquema 6.2 represeman las dife rendas observadas en la inddenda
absol u{a entre cada categorfa y la categorfa de referenda. De esta manera, es posible
separar los efectos independientes observados de A y Z Y asf estimar el efecto con-
j unto. Los significados de las diferemes categorfas en el Esquema 6.2 se descri ben
en la Tabla 6.S.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 191
Esquema 6.2
Detecci{m dc intcraccion a traves de la comparacion de cfcdos conjuntos esperados
y obscrvados: intcraccion aditiva
A. No hay interacci6n aditiva.
Z

lasas de Riesgos
incidencia atribuibtes
observadasll.OCO observadosl1.000
A A
-

Z
-

10,0 30,0 0,0 20,0
20,0 40,0

10,0 30,0
RA conjunlo esperado '" 1 0,0 + 20,0 '" 30,0
RA conjunlo observado '" 30.0
B. Interacci6n adiliva presente.
Factor Z
Ausente
Ausente
Presente
Presente
Z
-

Tasas de Riesgos
incidencia atribuibles
observadasll .000 observadosll .000
A A
-

Z
-

10,0 30,0
-
0,0 20,0
20,0 <;0,0

10,0 50,0
RA conjunlo esperado '" 1 0,0 + 20,0 '" 30,0
RA corjunlo observado '" 50,0
Tabla 6.5
Evaluacion de la intcraccion: modelo aditiyo
Factor A
Ausente
Presente
Ausente
Presente
Los rles90 atrlbulbles observados representan
Categoria de relerencia '" 0,0
Electo independienle deA (ej , en ausencia de Z}(ej. , en el
Esquema 6.2A, 30,0-1 0,0 '" 20. 0)
Electo independienle de Z (ej, en ausencia de A)(ej ., en el
Esquema 6.2A, 20,010,0 '" 1 0, 0)
Electo conjunlo de A y Z (ej, en Esquema 6.2A, 40.0-10,0 '"
30, 0)
La estimaci6n del efec(Q conjunto esperado (Esp) de A y Z medidos medianle el
riesgo atribuible (RA) se ll eva adelante medianle la simple suma de los ri esgos atri-
buibles independientes que se han observado (Obs), de la manera que sigue:
192 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
I Ecuacion 6. IJ
As!, el riesgo atribuible conjunto esperado en el ejemplo que se recoge en el
Esquema 6.2A es 20,0 + 10,0 = 30,0 i 1.000. Este efec!O conjunto esperado es iden-
{ieo a1 efeclo conjunto observado, 10 eual indica ausencia de imeracci6n adillva. Por
otra parte, el cfccto conjumo observado que se muestra en el Esquema 6.2B. que
asciende a 50.D/l.OOO. es mayor que eI riesgo atribuible esperado de 30,0/ 1.000, 10
ellal indica que hay interacci6n adiliva posit iva.
EI efeclo conjunto esperado (Esp) tambien puede estimarse mediante una inci-
dencia conjunta esperada. del modo que se muestra a continuaci6n:
I Ecuacion 6.2J
Esp IncA+z+ = Obs IncA_z- + (Obs IncMz- - Obs IncA_z-) + (Obs IncA_z+ - Obs IncA_z-)
= Obs Ine,,_z- + Obs RAA+z- + Obs RA,,_Zt
Por ejemplo, para el Esquema 6.2B
Esp IncA+z = 10,0 + (30,0 - 10,0) + (20,0 - 10,0) = 40,0/ 1.000
que es menor que la incidencia eonjunta observada de 60,0/ 1.000, 10 que nuevamen-
Ie indica una interaeci6n aditiva positiva.
Deteccioll de illteraccioll muftiplicativa: fa diferencia refativa 0 elmodelo
de razon
La estrategia para deteetar interaeci6n multi plicativa es an.i. loga a la que se emplea
para detectar interaeci6n aditiva; sin embargo, en la evaluaci6n de la interacci6n
multiplieat iva, el efeeto eonjunto esperado se est ima mult iplieando los efeetos relat i-
vos independientes de A y de Z:
I Ecuacion 6.3J
Los efeetos eonjuntos independientes expresados mediante riesgo relat ivo (RR)
se muestran en el Esquema 6.3, con interpretaciones similares a las realizadas para
la interacci6n adit iva basadas en el Esquema 6.2. En el Esquema 6.3A, el efeeto eon-
junto esperado (3,0 x 2,0 = 6,0) Y el observado son iguales, 10 eual sugiere que no
hay interaecion multiplicativa. En el Esquema 6.3B. el riesgo relativo eonjunto espe-
rado es tambien 6,0, pero el riesgo relat ivo eonjunto observado es 9,0, 10 eual indica
interaeci6n multi plicativa positiva.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 193
Esquema 6.3
Detecci{m de la intcraccion a traves de la comparacioll de cfedos cOlljulltos esperados
y obscrvados: intcraccioll multiplicativa
A. No hay interacci6n mutlipticativa.
Z
-

lasas de
incidencia
observadasl1 .000
A
-
- Z
10,0 30,0
-
20,0 60,0

RR conjunlo esperado '" 2,0 x 3.0" 6,0
RR conjunto observado '" 6,0
B. Interacci6n muHiplicativa presenta.
Z
-

lasas de
incidencia
observadasl1.000
A
-
- Z
10,0 30,0
-
20.0 90.0

RR conjunlo esperado e: 2,0 x 3,0" 6,0
RR cO:"ljunto observado e: 9,0
Riesgos
retativos
observados
A
-

0,0 3,0
2,0 6,0
Riesgos
relalivos
observados
A
-

1,0 3,0
2,0 9,0
633. Ejemplos de evaluaci6n de interaccion en un estudio de cohorte
Los datos de un estudio de cohone conducido en el condado de Washington, Mary-
land, permit en la evaluaci6n de interacciones aditi vas y multiplicativas entre el nivel
educacional de los padres y el habiw de fumar de la madre sobre los ri esgos de
muene neonatal y postneonatal(4) (Tablas 6.6 y 6.7) . Tal como se mueslra en la Ta-
bla 6.6A, tanto el ri esgo relativo como el ri esgo atribui ble para las asociaciones del
habi w de fumar de la madre y la mortali dad neonatal son heterogeneas en relaci6n
con el nivel educacional del padre. indicio de que hay interaccion tanto mulliplicati-
va como aditiva, 10 cual expresa la magnificaci6n del efecto del habito de fumar
sobre la mortali dad neonatal cuando el nive! educacional del padre es bajo. (Nolese
que la heterogeneidad en la Tabla 6.6 puede deberse a la confusion residual que
result a del uso de categorfas poco refinadas para la educaci 6n y el habito de fumar;
vcanse Capitulo 5, Secci6n 5.4.3 y Capitulo, 7 Secci6n 7.5. Para los propOsit os de
este ejemplo, sin embargo, se supone que la heterogeneidad no es debida a confu-
sion residual ). La interacci6n de ambas escalas se confinna cuando se comparan el
194 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 6.6
Tasas de mortalidad neonatal par 1.000 nacidos vivos de acucrdo al habito de rumar
de 13 madre y cducacion del padre, condado de Washington, 1953 a 1963
A. Estralegia de homogeneidad
Nivel Hablto de Numero Tasal1.000
de educaclon fumar de estlmado nacldos
del padre la madre de nacldos vivos villos RR"
o-a grados No 1.967 16,4 1,0
Sf
'"
40,1
',6
9+ grados No 5.967 14,9 1,0
Sf 3.833 17,1 1 , 1
B. Comparaci6n de eleclos conjuntos obseNados yesperados
Incidenclall.000 RAI/t.OOO
nacidos viI/os nacidos viI/os
Hablto de fumar (expuestos) Hablto
de la madre de lumar de la madre
NIl/a]
de educacion
del padre No Sf
9+ grados
(no expuestos) 14,9 17.1
0 - 8 grados
(expuestos) 16,4 4<,1
Efectos conjuntos esperados:
Aditivo - RA '" 1,5 .;. 2,2 '" 3,7/1,000 nacidos vivos
Multiplicativo - RR " 1, 1 >< 1,1 '" 1,2
Efectos conjuntos observados:
A d ~ i v o - RA",31,211,000
Multiplicativo - RR ,,3,1
Riesgo relativo.
t Riesgo atribuible.
No Si
0
','
1,5 31,2
RAt/l.ooa
nacidos viI/os
(expuestos)
0
29,7
0
','
RR"
Hablto de fumar
de la madre
No Si
1,0 1 , 1
1 ,1 3,1
FUMte. GW Comstock and FE Lundin, Parental Smoking and Perinatal Mortali ty, American Joumalof Obstetrics
and Gynocology, Vol 98, 708718, 1Cl 1967.
efecto conj umo observado y el esperado en la Tabla 6.68. Para el modelo aditi vo, el
riesgo atribuible conjumo observado es 3 1,2/ 1.000 naddos vivos, en tanto que el
esperado es solameme 3,7/ 1.000 (es dedr, I j + 2,2) . Para el modelo multiplicati vo,
los riesgos relati vos conj umos observados y esperados son 3, 1 y 1,2 respecti vamen-
te. Cuando se evalua la asociad6n del habit o de fumar de la madre y el nivel educa-
d onal del padre con la mort alidad postneonatal (Tablas 6.7 A Y 8 ), hay escasa 0 nul a
interacd6n en cualquiera de las escalas. Las pequefias di ferendas entre efectos con-
j untos observados y esperados (0 la ligera heterogeneidad de los efectos) son proba-
blemelHe debidas a la variabili dad aleatori a .
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 195
Tabla 6.7
Tasas de mortalidad postnconatal por 1.000 nacidos vivos de acuerdo allulbito
de fumar de la madre y educacion del padre,condado de Washington, 1953 a 1963
A. Estrategia de homogeneidad
Nivel Hablto de Numero Tasal1.000
de educaclon lumar de estlmado nacldos
del padre la madre de nacldos vivos vivos RR"
G-8 grados No 1.967 12,3 1,0
Sf
'"
19,6 1,0
9+ grados No 5.967 6.1 1,0
Sf 3.833 t t , t 1,8
B. Comparaci6n de efaetos conjuntos observados y esperados
Incidenclalt .000
nacidos vivos
Hablto de fumar
NII/el
de la madre
de educacion
del padre No Sf
9+ grados
(no expuestos) 6.1 1 t , 1
0 - 8 grados
(expuestos) 12,3 t9.8
Efaetos conjuntos esperados:
Aditil/o - RA '" 6,2 + 5,0 '" t1 ,21t .000
Multiplicatil/o - RR '" 2,0 >< 1,8 '" 3.6
Efectos conjuntos observados:
A d ~ i l / o - RA '" t3,711.000 nacidos vivos
Multiplicativo - RR '" 3,2
Riesgo relativo.
t Riesgo atritluible.
RA'/1.000
nacidos viI/os
(expuestos) Hablto
de lumar de la madre
No 51
0 5.0
6,2 13,7
RA1/1.0OQ
nacldos vivos
(expuestos)
0
7,5
0
5,0
RR"
Hablto de fumar
de la madre
No 51
1,0 1,8
2,0 3,2
Fuente: GW Comstock and FE Lundin. Parental Smoking and Perinatal Mortality, American Joumalof Obstetrics
and Gynecology, Vol 98, 708-718, 1tl 1967.
6.4, EVALVACION DE LA INTERACCION EN ESTVDIOS
DE CASOS Y CONTROLES
La di scusi6n precedente acerca de la evaluacion de la interacci6n ha descansado en
medidas absolutas 0 relativas de riesgo (tasas de incidencia, riesgos atribuibles y ri esgos
relati vos) obtenidas en estudios de cohone. La que sigue es una disc usion de los mis-
mos conceptos y estrat egias, pero aplicadas al anali sis de datos de casos y controles.
Debe notarse que . puesto que los estudios de casos y controles meramente proveen de
un enfoque eficiente para analizar d1tos de cohorte, el concepto de interacci6n no liene
un signifi cado especial en estos estudios. As!, la discusion que sigue solo procura facili-
tar la aplicaci6n del concepto de interacci6n al anal isis de datos procedentes de est udios
de casos y controles . Las f6nnulas presentadas en esta secci6n son indist intamente apli -
cabl es a los estudios de cohortes y a los estudios de casos y controles.
196 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
6.4.1. EVllluaci6n de homogeneidad de efectos
En un est udio de casas y controles la estrategia de homogeneidad puede ser emplea-
da solo para evaluar la presencia 0 la ausencia de interacci6n mul ti plicat iva. La
raz6n para ello es que las medidas absoiutas del riesgo de enfermar usualmente no
estan disponibles en los est udios de casas y comroles: por tanto. no es posible medir
la diferencia absoluta entre expuestos y no expucs(Qs (esto es, el riesgo at ri buible 0
exceso absoluto de ri esgo) en aqucll os sujetos expuestos al factor de ri esgo princi-
pal. Como consecuencia. la homogeneidad de los ri esgos atribuibles (en sujetos
expucstos) en los estratos farmadas por el modificador potencial de efeclo Z puede
no ser evaluable en estudios de casos y controles. Sin embargo, como se muestra en
la pr6xima secci6n, es posible evaluar interaccion adit iva en un estudio de casos y
controles mediante la estrategia consistente en comparar efectos conjuntos observa-
dos yesperados .
En la mayorfa de los estudios de casos y controles, la evaluacion de la homoge-
neidad de los efectos se basa en los odds ratios . Esta evaluacion, como se ilustra en
la Tabla 6.8, es analoga a la de los riesgos relat ivos. En esta tabla, los casos y los
controles se estrat ifican tanto considerando las categorfas del presunto factor de ri es-
go de interes A, como las del modificador de efecto potencial Z. Se emplean diferen-
tes categorfas de referencia para la comparacion de las razones de odds asociadas
con A en los estratos formados por Z: cuando Z esta ausente, la categorfa de referen-
cia - a la que corresponde un odds ratio de 1,0- es aquella en la cual A tambien
esta ausente. Por otra parte, para los individuos expuestos a Z, la categorfa de
referencia con un odds ratio de 1,0 se forma con sujetos expuestos a Z pero no
expuestos a A. As!, cada oddJ' ratio obtenido en la Tabla 6.8 se refiere al efecto de A,
primero en ausencia (mitad superior) y luego en presencia (mitad inferior) de Z.
Es imponante enfatizar que el oelth ratio para A cuando Z esta presente no repre-
senta el efecto independiente de A, sino mas bien el efecto de A en presencia de Z.
Este punto deberfa ser tenido en cuenta cuando se contrasta esta estrategia con la que
se describe en la secci6n que sigue, de comparar efectos conj untos observados y
esperados .
La interpretacion de los result ados de la Tabla 6.8 es clara: cuando la interacci6n
mult iplicativa esta presente, los odds ratios seran diferentes; cuando esta ausente,
seran simil ares. Por ejemplo, en el est udio de Shapiro et al .(S) se examina la interac-
cion entre el uso de anticoncept ivos orales y el habito de fumar intensamente sobre
el odds de infarto de miocardio (Tabla 6.9), los odds ratios no eran marcadamente
heterogeneos (4,5 frente a 5,6) indicando que la interacci6n mul ti pl icat iva, en caso
de estar presente, no era muy fuene. (Shapiro et a/ . examinaron tres categorfas del
habito de fumar: ninguno, de I a 24 cigarrillos por dfa, y 25 cigarrillos por dfa 0
mas . Con la fi nalidad de hacer mas simples las cosas, sin embargo, solo las catego-
rfas de no fumadores y de fumadores intensos se discuten en esta y en las secciones
subsigui entes.) En contraste, en el estudio de Coughlin(6) sobre la relacion existente
entre asma y cardiomiopatfa idiopalica dil atada (Tabla 6.10), a pesar de que los
numeros son pequefios, los oddJ' ratios parecfan ser bastante heterogeneos, sugi rien-
do de ese modo la presencia de interacci6n mul ti pl icat iva.
Se ha sefialado por Morabia et al,m que los odds ratioJ' pueden ser heterogeneos
cuando los ri esgos relat ivos no 10 son, fenomeno que estos autores denominaron
como la/a/acia de la interaccion . Morabia y colaboradores arguyeron que, aunque
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 197
Tabla 6.8
Esbozo de la tabla que ilustra la estrategia de homogeneidad para la evaluacion
de la interaccion multiplicatiYa en estudios de casos y controles
"Expuestos Odds
"Que
aA? Casos Controles Rallo slgnlflca?
Z ausenle No 1,0 Categoria de relerenda
Si '=' Electo de A en ausencia de Z
Z presente No 1,0 Categoria de relerencia
Si '=' Electo de A en presencia de Z
Tabla 6.9
La relacion dcllul. bito de rumar y los anticonceptiYos orales (AO) en relacion
con los odds de inrarto del miocardio en mujeres
Hilbito de lumar
intensamente'
No
Si
inlensas
'" 25 cigarrillosJdia.
U"
deAO
No
Si
No
Si
Odds ratio
1,0
4,5
1,0
5,6
i.Que slgnillca1
Categorfa de relerencia
Electo del uso de AO en no lumadoras
Categorfa de relerencia
Eleclo del uso de AO en lumadoras
Fuente: Shapiro et al .. OralContraceptive Use in Relation to Myocardial Infarction. Lancet. Vol t. 743-747.
o t979.
Tabla 6.10
La relacion de hipertension y asma con cardiomiopatia dilatada idiopatica
Hlpertensl6n Asma Odds ratio i. Que slgnlfica?
No No 1,0 Categoria de referencia
Si 2,4 Eleelo del asma en normotensos
Si No 1,0 Categoria de relerencia
Si 13,4 Eleelo del asma en hipertensos
Fuente: SS Coughlin, A Case-Control Studjt 01 Dilate<J Cardiomyopathy. Doctoral Dissertation, 109,01987 The
Johns Hopkins University School of Hygiene & Public Health.
la posibilidad de que se presente esta falacia es usualmente muy pequefia 0 des-
preciable en la mayor parte de los ejemplos de la vida real en relaci6n con la epide-
miologfa de las enfennedades cronicas, ella puede tornarse apreciable cuando el
riesgo del desenlace sea alt o, por ejemplo. en una situaci6n epidemica, 0 cuando se
estudian grupos de poblaci6n en los cuales hay una fuerte susceptibilidad genelica al
factor de ri esgo en enfennedades inducidas.
198 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
6.4.2. Comparaci6n de efectos conjuntos observados y esperados
La estrategia de comparar efectos conjuntos observados y esperados en los estudios
de casas y controles es si mi lar a la tecnica cmpleada cuando se di spone de datos de
incidencia. Esto es, los efeclOs indepcndientes de A y de Z se est iman con 1a final i-
dad de computar los efectos conjuntos esperados, los clI ales son entonces compara-
dos con los efec(Qs conjumos observados. Cuando los cfcctos conj untos esperados y
observados difi eren, se considera que hay interacci6n.
La Tabla 6.11 muestra de maDera esqucmatica c6mo puede consumarse 1a eva-
luaci6n de ambas interacciones, aditiva y multiplicativa, en los es(udios de casas y
controles . En esta tabla, los efectos independientes (medidos mediante odd,\ rario.\")
de A y de Z pueden estimarse mediante el empleo de una li nica categorfa de referen-
da fonnada por aquellos individuos no expuestos ni a A ni a Z. EI efecto de A sola-
mente - que es el efecto independiente de A en ausenda de L se estima mediante
el mids de la categorfa A+ L relati vo a aquell os de la categorfa de referenda, A- L.
Simi larmente, el efecto independiente de Z se estima mediante la razon de los odd,\
de la categorfa A_ z.. respecto de la categorfa de referenda.
Detecci6n de interacci6n aditiva
Tal y como ya se mendono, en los estudios de casos y controles no es posible
emplear la Ec uad6n 6.1 (ni la 6.2) (Secd6n 6.3.2), puesto que esto demanda datos
de inddenda usualmente no disponibles cuando se emplea dicho disefio. Conse-
cuentemente, es importante reformular esta ecuadon en {enninos de ri esgo relativo
o de odds ratios de manera que pueda ser aplicada a los datos procedentes de los
esmdios de casos y eontrolcs mostrados de manera esquemat ica en la Tabla 6.11 . La
Figura 6.3 pennite una derivad6n intuit iva de una formu la basada en oddJ ratios que
es equi valente a las Ecuadones 6.1 y 6.2.
En la Figura 6.3, el valor inicial (OR = 1,0) que se muestra en la col umna 1 repre-
senta el mids para individuos no expuestos ni a A ni a Z. EI exceso absoluto debido a
A (columna 2) y a Z (columna 3) se e:<presa por las zonas de las col umnas que estan
colocadas por encima de la Ifnea de partida. EI efecto conjunto esperado (columna 4)
es entonces el odds ratio en la situad6n de partida mas el exceso independiente debi-
do a A, mas el exceso independiente debido a Z, tal y como se ve a continuaci6n:
Tabla6.ll
Esbozo de la tabla para la evaluacion tanto de interaccion aditi va como multiplicativa
en los estudi os de casos y controles empleando la cstrategia de comparar cfedos
conjuntos esperados y observados
c, Expueslos
"Que se mlde? aZ?
Calegoria de relerencia No
Electo independiente de A No
Electo independiente de Z Sf
Eleeto conjunto observado Sf
i., Expuesl os
a A?
No
Sf
No
Sf
Casos Control Odds ratio
1,0



DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
(4) OR 0:4,0
(1jOR=1,0 Z
(3) OR" 3,0
(2jOR=2,0 g
I MI MI
A
Z
MI
Momento
inicial
Momento
inicial
.;. exceso
debido aA
Momento
inicial
.;. exceso
debido a Z
OR conjunto
esperado en la
suma de excesos
absolutos
independientes
debidos a A y a Z'
(SjOR-70
1
A
Z
MI
OR conjunto observado
> OR esperado,
Exceso
debido a I
(Interacci6n) no
explicable por el
exceso debido a A y Z
Figura 6,3, Representacion esquematica del significado de la rormula
OR
A

z
esperado = observado + OR
A
_
7ft
observado - 1,0
199
N61ese que cuando se adicionan los odd.! ratio.! indepcndientes para A y para Z, d valor inicial se adi -
ciona dos veces: conSCCllcntemcnte, cs nccesario sustraer 1.0 del OR conj umo espcrado: CSIO CS, OR
A

Z
+
espcrado = (Exccso dcbido a A + valor inicial ) + (Exccso dcbido a Z + valor iniciaJ) - valor inicial =
ORA+Z_ + ORA_Z+ - 1,0.
1 Ecuacion 6.41
Esp ORA+z+ = 1,0 + (Obs ORA+z- - I ,0) + (Obs OR
A
_
Z
+ - I ,0) =
= Obs OR,,+z- + Obs OR,,_z+ - I ,0
La derivaci6n fonnal de la Ecuacion 6.4 se demuestra del modo siguiente.
Comenzando con la Ecuacion 6.2. en la cual Esp Inc y Obs Inc denotan incidencia
esperada e incidencia observada, respectivamente (Secci6n 6.3.2) .
Esp IncA+z+ = Obs Inc,,_z- + (Obs IncA+z- - Obs IncA_z-) + (Obs Inc"_b - Obs IncA_z-)
Y, dividiendo cada termino de esta f6rmula por Inc,,_z- , la expresi6n puede poner-
se en {erminos del ri esgo relativo del modo siguiente:
Esp RRA+z+ = I ,0 + (Obs RR,,+z- - I ,0) + (Obs RR,,_z+ - I ,0)
y por {anto.
Esp RRA+z+ = Obs RRA+z- + Obs RR,,_z+ - I ,0
En un estudio de casos y controles, los riesgos relat ivos se est iman mediante los
odd.\ ratio.\ .
200 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
N6tese que la Ecuaci6n 6.4, aunque emplea odds ratio.\" 0 riesgos relmivos, se
basa en excesos absolutos positi vos y negat ivos, respect ivameme (riesgos atribui bles
entre expuestos), de modo que estima los cfcctos aditivos espcrados conjuntos. Un
ejemplo se muestra en la Tabla 6. 12, basado en el mismo estudio emplcado como
ejemplo en la Tabla 6.9. Los datos en la tabla sugieren que hay una fucrte interac-
cion aditi va, tal como
Esp ORA+Z+ = 10,5 Obs ORA+z+ = 39,0
N6tese tambien que la Ec uaci6n 6.4 no puede emplearse para evaluar interacci6n
aditiva cuando una de las variables (A 0 Z) ha sido objeto de emparejamiento, pucs-
to que su odd,\" ratio ha sido fijado en 1,0 por disefio (vease Capitulo I, Secci6n
1.4.5); en otras palabras, el efecto independiente de una vari able para la cual casos y
controles han sido emparejados no puede ser estimado. Puesto que la estrategia de
homogeneidad no puede emplearse para examinar interacciones adit ivas en los estu-
dios de casos y controles, se tiene como corolario que no es posible evaluar interac-
ciones aditivas entre un factor emparejado y otros factores en los est udios de casos y
controles (emparejados).
Deteccioll de interaccion lIlultiplicativa
En eSiudios de casos y controles, la evaluaci6n de la interaccion multi plicativa
basada en la comparacion de efectos conjuntos observados y esperados es analo-
ga a la estrategia empleada en el contexto de un estudi o de cohorte. La evaluaci6n
de la interacci6n multiplicati va comparando efectos conjuntos esperados y obser-
Tabl a 6.12
Ejemplo de como evaluar la interaccion en ambas cscalas en un estudio de casos
y controlcs emplcando las formulas Esp = Obs + Obs OR,I_Z+ - 1,0 (adith'o) y
Esp Obs OR A+7 .. = Obs OR.\+z.- )< Obs OR.\-z+ (multiplicativo): La rclacion
de personas que fuman intensalllente y uso de anticonceptivos orales (AO)
con eI odds de infarta del miocardia en mujercs
Habit o intense de fumar (Z)"
No
No
Sf
Sf
ORA.Z+obselVado: 39,0
ORA.Z+esperaClo:
Modelo aditivo: 4,5 + 7.0 - 1.0 10,5
Modelo multiplicativo: 4,5 7,0 '" 31.5
25 cigari llosJdia.
Uso de AO (A)
NO
Sf
No
Sf
Odds ralio
1,0
4,5
7,0
39,0
Fuente. Shapiro et a/ . Oral Contraceptive Use in Relation To Myocardiallnlarc:tion, Lancet, 743747, 1t1 1979.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 201
vados se basa en el mismo tipo de tabla empleada para la valoraci6n de la interac-
ci6n aditiva (por ejemplo, Tabla 6.12). La razon de odds (OR) conjuma esperada
se est ima meramente como el producto de la mult ipl icacion de los odds ratios
independiemes.
I Ecuacion 6.51
la cual es analoga a la Ec uacion 6.3 (tambien puede acudirse a estas ec uaciones
para evaluar interacci6n multiplicaliva cuando los odds ratiosl riesgos re lativos
son inferi ores a 1,0) . Usando los hallazgos de la Tabla 6.12, es pos ible est imar el
odds ratio conjumo esperado como Esp OR,\+z+ = 4,5 x 7,0 = 31,5. Puesto que el
odds ratio conjunto esperado (3 1,5) es bastame cercano al observado (39,0), la
interaccion, si esta presente, es debil en la escala mul tiplicativa, 10 cual conduce a
la misma conclusion antes obtenida al usar la estralegia de homogeneidad (Sec-
ci6n 6.4 .1 ) .
N6tese que, tal y como ocurrfa para la interacci6n adit iva, esta estrategia no
puede ser empleada para evaluar interacci6n mul tiplicativa entre una variable
pareada y Olro factor, puesto que no puede medirse el efecto independieme de l
pri mero. Sin embargo, la estrategia de homogeneidad puede ser aplicada para
evaluar interaccion mul tiplicativa en estudios emparejados de casos y controles.
Esto se hace mediame la estratificaci6n de conj untos emparejados de acuerdo a
los niveles de las variables emparejadas y evaluando la homogeneidad de los
odd.\" ratios a 10 largo de los estratos. De esta manera, en el ejemplo esquematico
que se muest ra en la Tabla 6.1 3, la heterogeneidad de los odd.\" ratios para consu-
mo del alcohol (basada en pares disc repames de casos y controles) en estratos
formados por el habiw de hlmar <Sf frente a No) sugiere la presencia de
Tabla6.13
Ejemplo hipotCtico de evaluacion de la interaccion en un cstudio de easos y controies
entre eonsumo de alcohol y de tabaeo, en cI que los casos y los controles eshln
emparejados segun lul.bito actual de fumar (<<Sf frente a No)
Habllo de Odds ratio para consumo de
Par N." fumar Caso Conlrol alcohol segun habll o de lumar'
No

2 No + OR '=' 211 "2,0
3 No
4 No

5 No

6 Si

;
Si

OR", 4/1 '" 4,0
8 Si
9 Si

10 Si

Nora: los signos (+) y {-I denotan kls consumido,es y no consumidores de alcohol ,espec!ivamente .
Uti lizando Ia ,az6n de pares disc,epantes.
202 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
interacci6n multi plicati va. En 1a Tabla 6.1 4 se resumen los aspec tos relacionados
con la evaluaci6n de interacci6n entre 1a variable de emparejamiento y otro fac(Or
en los estudios de casas y controles cmparejados .
Tabla 6.14
Resumen de los aspectos rclaciollados COli 13 evaluacion de la intcraccioll en estudios
de casos y controlcs cmparcjados US311do el cjcmplo del h:ibito de fumar como
variable de cmparejamicnto y cl alcohol como la cxposici6n de intcres
i.Es esta la
Escala Estrategla Informacion estrategla "Por que?
necesarla factlble?
Adiliva Homogeneidad Los RA para el No Oebido a que la lasa de
de efectos consumo de alcohol incidencia para el alcohol
de acueroo al de acuerdo con el hltbito de
hltbito de fumar tumar no esla disponible en
los eSludios de casos y
controles
Adiliva Eteclos Los OR que No EI OR que expresa el efecto
conjunlos expresen los independienle de tumar no
observados y efectos esta disponible debido a que
esperados independianles los casas y conlroles han
de fumar y consumir sido emparejados de acuerdo
aloohoj al habjlo de tumar
MuHiplicaliva Homogeneidad Los OR para el Sf Los OR para el consumo de
de efectos consumo de alcohol alcohol eslan disponibles
riA a<":IJArm al hahito para los riA y
de fumar controles de acuerdo al
habilo de tumar
MuHiplicaliva Eteclos Los OR que No EI OR que expresa el efecto
conjunlos expresan los efectos independienle de tumar no
observados y independienles esta disponible debido a que
esperados de fumar y consumir los casas y conlroles han
alcohol sido emparejados segun
de tumar
Nota; RA = riesgos atribuibtes en sujetos expuestos; OR .. odds ,-ario.
Tal y como se estableci6 al comi enzo de esta secci6n. las Ecuaciones 6.4 y 6.5
pueden tambicn aplicarse cuando se evallia interacci6n en estudios de cohorte. Por
ejemplo. usando los ri esgos relati vos de la Tabla 6.6. es posible construi r una tabla
simil ar a la Tabla 6. 11 (Tabla 6. 15) . N6{ese que en las Tablas 6.6 y 6.1 5 (odo padre
cuyo nivel educacional fuera de a 8 grados fue categorizado como expues{o.
Los efectos conjuntos esperados se expresan mediante riesgos relat ivos
( 1. 1 + I , I - I ,0) = 1,2 en una escala aditi va y ( I , Ix I, I) = I ,2 en una escala mult i-
plicati va (Tabla 6.1 5) . La diferencia entre estos valores esperados y observados de
los riesgos relati vos conj umos, de 3, 1, conduce a la misma conclusi6n alcanzada
previamente, cuando se usaron tasas de incidencia (Tabla 6.6), consistente con que
existfa imeracci6n en ambas escalas.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 203
Tabla 6.15
Tasas de mortalidad neonatal por 1.000 nacidos vivos de acuerdos al habilo de rumar
de la madre y de educacion del padre, condado de Washington, 1953 a 1963
Nlvel de educaclon HlIbito de lumar Tasall .000 Alesgo
del padre (grados) de la madre nacldo vivos relatlvo
Mas alto (9+) (<<no expuestos,,) No 14.9 1,0
Mas alto (9+) (<<no expuestos,,) Si 17.1 1 , 1
Mas bajo (G-8) (<<expuestos) No 16.4 1 , 1
Mas bajo (G-8) (<<expuestos) Si 46.1 3, 1
Fuente: GW Comstock and FE Lundin. Parental Smoking and Perinatal Al116Tican JoumalolObsletrics
and Gynecology. Vol 98. 708718. Cl l967.
65. MAS ACE RCA DE LA INTERCAMBIABILIDAD
DE LAS DEFINICIONES DE INTERACCION
Es hidl demostrar matematicameme que las dos definiciones de imeracci6n (es
decir, la que se basa en la homogeneidad de efec(Os y la que descansa en la compara-
cion entre efectos conjuntos observados y esperados) son completameme intercam-
biables: esto es, si los efectos son heterogeneos (es decir, hay interacci6n) entonces
el efecto conj unto observado es diferente del esperado y viceversa. Consideremos
por ejemplo dos variables, A y Z, Y sus efectos potendales en reladon con un desen-
lace dado. Para evaluar el efecto aditi vo conjunto, bajo la hip6lesis de no inlerac-
cion:
1 Ecuacion 6.61
Esp RRA+z+ = Obs RR.\+z+ = Obs RR
A
_
Zt
+ Obs RRA+Z- - 1,0
La Ecuaci6n puede ser refonnulada como:
1 Ecuaci6n 6.71
Obs RRA+z+ - Obs RRA_Z+ = Obs RRA+z- - I ,0
Tal y como se demostro previamente (Seccion 6.4 .2), para oblener el riesgo
relat ivo de la formu la con el fin de evaluar el efec(O aditi vo conjumo esperado,
(Odos los terminos de inddencia, en la ecuacion se dividen por la incidencia cuando
ambos fac(Ores eslan ausemes (es decir, por IncA_z-). Operando hacia aids, la
incidencia cuando ambos fac(Ores eslan ausentes, multiplicada por el riesgo re lati vo
para una calegorfa de exposici6n dada es igual a la incidencia en esa calegoria de
exposici6n (p. ej ., IncA+z- '" IncA_z- )( RRA+z-). De esle modo, la Ecuaci6n 6.7 es
equi valente a:
1 Ecuaci6n 6.81
204 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Por consiguiente, cuanda el efecto adit ivo conjunto observado de A y de Z es el
mismo que el efecto esperado (Ecuad6n 6.6), el efeclo de A en presencia de Z sera.
el mismo que el cfccto de A en ausencia de Z (Ecuacion 6.8) . Alternativamente,
cuanda los efectos conj untos observados difi eren de los esperados (es decir, cuanda
la imeracci6n esta presente), entonces los cfcctos de A variaran de acuerdo a la pre-
sencia 0 all sencia de Z.
El mismo razonamiento vale para la evaluaci6n de la imeracci6n multipli cativa.
Por ejemplo, bajo eI supuesto de no interacci6n en una escala multiplicativa, se tiene:
I Ecuaci6n 6.9J
Esp RRA+Z+ = Obs RRA+z+ = Obs RRA+z_ x Obs RR,,_z+
La Ecuaci6n 6.9 puede ser ahara rcformulada del modo siguieme:
I Ecuad6n 6.I OJ
Obs RRA+z+ lObs RRA_Z-t = Obs RRA+z-1 1,0
La equi valenda entre las Ecuadones 6.9 y la 6.1 0 significa que cuando los efec-
{Os conjuntos observados sean iguales a la multi plicad6n de los efectos indepen-
di entes (Ecuadon 6.9), entonces el riesgo relat ivo de un factor no varia como fun-
don del nivel del otro fac{Or (Ecuad6n 6. 10), y viceversa.
6.6. ;.CUAL ES EL MODELO RELEVANTE?: INTERACCION ADlTlVA
FRENTE A INTERACCION MULTU'LlCATlVA
La popularidad del aj uste de Mantel-Haenszel (Capllllio 7, Seccion 7.3.3) Y de los
metodos de regresi6n multipl e basadosen modelos multiplicativos (Capitulo 7, Secdo-
nes 7.4.3 hasta 7.4.6) ha conducido frecuentemente a que la interaccion se ident ifique
casi exclusivamente con la interacci6n multiplicativa. Si los oddJ ratios 0 los riesgos
relativos son homogeneos de acuerdo con los estra{Os de un potencial modificador de
efectos, puede concl ui rse que no hay interacci6n general , incl uso aunque esta concl u-
sion se aplique exclusivamente a interacci6n multiplicativa. Sin embargo, como se dis-
cut ira mas adelante en este capit ulo, si eI interes esta centrado en la prevencion de la
enfennedad, la interacci6n aditiva puede ser de mayor inten!s. Coherentemente con
ello, incluso cuando se usan los odds ratios 0 riesgos relati vos para descri bir los datos
del estudio, puede resultar importante explorar tambien la presencia de interaccion adi-
tiva. La presencia de interaccion adit iva puede sondearse incl uso en el contexto de
modelos inherentemente multiplicati vos, tales como el modelo de regresi6n
En las dencias biologicas, la noci6n de interacci6n ha estado int imamente rela-
donada con los mecanismos subyacentes en una relaci6n causal. Una di scusi6n de
los lfmites en el proceso de inferir acerca de mecanismos biol6gicos a part ir de la
observad6n de interacciones en estudios epidemiol6gicos pueden encomrarse en la
literatura(9) , pero esto esta mas ali a del alcance de este li bro de texto. Thompson(lO)
ha sefialado que la epi demiologia puede detectar la mayorfa de las asociaciones a
gran escala y que su sensibilidad para identificar variabl es imennedias ti ende a ser
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 205
limitada, 10 cual obslac uliza la interpretacion de las interacciones por conducto de
resultados de invesligaci6n epi demiol6gica. Usualmente, la interacci6n detectada en
est udios epidemiol6gicos puede meramente representar el efecto conj unto de las
exposiciones que ocurren tempranamente, antes del desarrollo de la enfermedad clf-
nica (Figura 6.4). Una interaccion detectada mediante observaci6n epidemiol6gica no
lOrna en cuenta las cadenas causales usualmente largas. Estas cadenas pudieran ser
caracterizadas por efectos conj untos multi pl icativos 0 adit ivos 0 por otros componen-
tes causales, necesarios para establecer entramados causales(2} responsables de la pro-
gresi6n temprana de la enfermedad de una fase (por ejemplo. cclulas metab6licamen-
te alteradas) a otra (por ejemplo, cel ul as que se mult iplican de manera anormal). La
incapacidad para describir las anormali dades celulares fisiol6gicas y anat6micas en la
secuencia patogcnica que conduce a la enfennedad limita ac usadamente la capacidad
de la epidemiologfa para seleccionar los mejores modelos de interacci6n. Como con-
secuencia, la selecci6n de un modelo por parte de los epidemi610gos es usualmente
detenninada por el pragmatismo (por ejemplo, cuando se selecciona el modelo esta-
dfstico con prop6sitos de ajusle 0 cuando se considera la posible aplicaci6n de hallaz-
gos en el establecimiento de polft icas de salud publi ca y prevenci6n) .
Desde el punto de vista de la traducci6n de los hallazgos epidemiol6gicos a prac-
ticas de salud publica, es importante la presencia de interaccion aditiva, incl uso
cuando la interaccion mul li pl icat iva esta ausente(IIJ. Un ejemplo hipotclico puede
aprec iarse en la Tabla 6. 16; allf se exam ina la relaci6n de antecedentes familiares de
una enfermedad Y y el habito de fumar con la incidencia de Y.
Aunque los riesgos relativos que describen la relaci6n entre el habilo de fumar y
la incidencia son homogeneos tanto en aquellos con antecedentes familiares como
en quienes no los tienen, los riesgos atribui bles difieren de manera marcada en
dependencia de una u otra situaci6n: 20% entre quienes tenfan el antecedente fami-
liar y solo 5% entre los que no 10 tenfan. Se registra entonces una fuerte interacci6n
adiliva pero no multi plicativa. Dependiendo de la prevalencia de la combinaci6n del
At + A2
i
i Cambios metab6licos 'f Mulliplicaci6n
Normal en las celulas de celulas
estudiadas an6malas
----
__

.. !f
.----
Ambito usual de los esludios epidemiol6gicos
Figura 6.4. Represcntacl6n esquem:hlca de una cadena causal en la cual sc producen
tanto efectos interactivos aditi vos como multiplicati vos. Las causas Al y A2 interactuan
de manera aditiva para producir cambios metabOlicos en las celulas de destino. Para la mul-
tiplicaci6n de celulas anomlales y la progresi6n de la enfermedad clfnica. se requieren facto-
res de riesgo adicionales (A3 y A4. A5 Y A6 respectivamente). que interactuan de manera
multiplicativa.
206 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 6.16
Ejcmplo hipotCtico de interaccion aditiva (interaccion de salud publica)
con intcraccion multiplicativa: Incidencia de la cnfcrmcdad Y por habito de fumar
y los antecedentes familiares de Y
Historia Alesgo atrlbulble Rlesgo
familiar
Fumadores Incidencia/IOO
(en los expuestos) relativo
Ausente No 5,0 Referencia 1,0
S, 10,0 5,0
',0
Presenle No 20,0 Referencia 1,0
S, 40,0 20,0
',0
amecedente familiar y del habito de fumar en la poblaci6n de interes, la prevenci6n 0
elimi naci6n del habiiO de fumar entre aquellos con antecedentes familiares posit ivos
comparados con aquellos que la tienen negat iva, podrfa conducir a una mayor reduc-
ci6n en el nlimero de casas incidentes en 1a poblaci6n de referenda *. La interacci6n
adit iva positiva puede incluso ocurrir en presencia de interacci6n multi pl icativa nega-
tiva (Tabla 6.17), y torna precedencia sobre la anterior en tenninos de definici6n de
gmpos de alto riesgo, que deberfan constituir el objelivo de la acci6n prevent iva. Una
discusi6n adic ional acerca de interacci6n multiplicat iva negativa e interacci6n aditiva
positiva, puede hallarse en la Secci6n 6.1 0 en este capitulo.
6.7. LA NATURALEZA Y RECU'ROClDAD DE LA INTERACCION
6.7.1. Interaccion cualitativa frente a interacci6n cuantitativa
Cuando existe asociaci6n entre el factor A y el desenlace Y y esta en la misma direc-
cion en cada uno de los estratos formados por Z pero la intensidad de la asociaci6n
Tabla 6.17
Ejemplo hipotctico de interaccion aditiva positiva y multiplicativa negativa:
incidencia de la enfermedad Y segun antecedcntes familiares de Y y habito de fumar
Historia Rlesgo atrlbulbie Rlesgo
familiar
Fumadores Incldenciall00
(en los expuestos) relativo
Ausente No 10 Referencia 1,0
S,
40 30/1 .000 4,0
Presente No 40 Referencia 1,0
S, 100 60/1.000
',5
* EI impacto de la eliminaci6n del habito de fumar entre aquellos que tienen antecedentes fami-
liares sc estima mejor por conducto de los riesgos atribuibles poblacionales. que toman en conside-
raci6n la magnitud de la intensidad de la asociaci6n entre el habi to de fumar y la enfermedad en cada
estrato de la historia familiar de la enfermeddd. asi como la prevalcncia de la presencia conjunta de
estos factores (vease Capitulo 3. Secci6n 3.2 2).
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 207
varia de un eslralo a olro, se dice que existe interacci6n cllantitativa. Por olra parte,
la interacci6n cualitativa se considera presente cuando los efectos de A sobre el
desenlace Y estan en direcciones opuestas (cruzamiento) de acuerdo a la presencia
de una tercera variable Z, 0 bien cuando hay una asociacion en uno de los eslratos
formados por Z pero no en el otro (Figura 6.5) .
A B
y y
X z. 'RR>' ,0, R'->O} L z. ,Ro",0, R-'>O}
Z - (RR"I,O, RA=O)
A-
Z - (RR<1 ,0, RA<O)
A. A-
A" Exposici6n da interes
Z '" Modificador de afaetos
Y '" Riesgo de desenlaee
Figura 6.5. La inter accion cualitati va siemprc sc \'C en ambas cscalas (aditiva y multipli-
cath'a) pucsto que cuando el riesgo relativo (RR) > 1,0, eI riesgo atribuible (RA) > 0; cuan-
do RR < l,o, cntonccs RA < 0; y cuando RR =1,0, RA = 0. En el caso A. hay cruzamiento:
esto es, RR
A
",,,-_ > 1.0 Y RA
A
",,,-_ > 0 cuando Z (modificador de efecto) esta presente, y RR < 1.0
Y RA < 0 cuando Z esta ausente. En B. RR > 1.0 Y RA = 0 cuando Z esta ausente.
Un ejemplo de interaccion cuali tativa aparece en el estudio de Estanton y
Gray(1 2). Para examinar los efectos del consumo de cafefna sobre eI tiempo de espera
para la concepcion, los autores obt uvieron informacion retrospect iva acerca de naci-
mientos que ocurrieron entre 1980 y 1990 en 1.430 panos correspondientes a muje-
res que no habian tornado anticoocept ivos. EI princi pal factor de exposicion fue el
consumo diario de cafefna, est imado como la ingesti6n de bebidas con cafefna
durante el primer mes del embaraw. La informaci6n acerca de la concepcion demo-
rada fue analizada como una variable dicotomica (menor 0 igual a un ano frente a
mayor de un ano) con el proposito de calcular riesgos relativos . Mientras que los
riesgos relat ivos estaban por debajo de I para el consumo de cafefna entre mujeres
fumadoras, un incremento en el riesgo de presentar concepcion demorada se apreci6
entre mujeres no fumadoras con un alt o consumo de cafeina (mas de 300 mg dia-
rios) (Tabla 6. 18) . De acuerdo con los autores, la interacci6n cualilativa encontrada
en su estudio se expl ica por el hecho de que el habito de fumar incrementa la lasa de
metaboli smo de cafefna, y que, en contrasle, el abandono del habito de fumar da
Ill gar a IIna m a ~ lenta eliminacitin fie la cafefna
En el ejemplo que aparece en la Tabla 6.1 8, los efectos de un alt o consumo de
cafefna parecen invert irse como ulla funcion del habito de fumar; es decir, hay una
asociacion posit iva entre el consumo en grandes cantidades de cafefna y la dil aci6n
en la concepcion entre no fumadoras, y una asociaci6n negativa entre fumadoras . La
interaccion cualitativa puede ser expresada por el tipo de cmzamiento (Figura 6.5A)
208 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 6.18
Relaci{m entre cI cOlISumo de caft'ina y el ricsgo de dilacioll de 13 concepcion
(mayor de un ano) de aClIcrdo al habito de fumar cntre 2.465 embarazos ocurridos
en mujeres que no ulilizaball allticollccptivos entre 1980 y 1990
MuJeres no fumadoras MuJeres lumadoras
Consumo
de cafeina Embarazos Abortos RR Embarazos Abortos RR
(m9"dia)
Ninguno
'"
"
',0
"
"
',0
H50
'"
69 0,9 233 33 0,7
151300 290 26 1 , 1 166 18 0,5
300 90 17 2,3 83 11 0,7
Fuente: CK Stanton and RH Gray, The Effects d Caffeine Consumption on Delayed Conception, American Jour-
nal of Epidemiology, Vol 142, 13221329 1Cl1995. The Johns Hopkins University School of Hygiene & Public Health.
o por una asociaci6n entre el fac{Qr de interes y el desenlace en presencia pero no en
ausencia de un modificador de efccto (0 viceversa) (Figura 6.58) . Un ejempl o del
ulti mo tipo de interacci6n se deriva de los result ados del ensayo clfnico aleatorizado
sobre el plan de seguros de salud 0 la efectividad de la mamograffa(l3). En este estu-
dio, el estado menopausico pareda modificar el efecto de la mamograffa en el senti -
do de producir una tasa mas baja de mortalidad por cancer de mama en el grupo que
habfa sido objeto de mamograffa, comparado con el grupo control, 10 cual se obser-
vo solo en mujeres postmenopausicas. En mujeres premenopausicas. no se hall aron
dife rencias entre las tasas del grupo experimental y del grupo control. Tanto el ejem-
plo de la cafefna. el habito de fumar y la concepcion demorada como el de la meno-
pausia, la mamograffa y el cancer de mama subrayan la noci6n de que cuando la
interaccion cualitati va esta presente, ella siempre se produce en los modelos aditivos
yen los multiplicati vos y es por tanto independiente de la escala de medici6n (Figu-
ra 6.5). Consideremos, por ejemplo, los datos que muestra la Tabla 6. 18: puesto que
el riesgo relati vo en mujeres no fumadoras con un consumo de cafefna por encima
de los 300 mg diarios es mayor que 1,0, el riesgo atribui ble, por definicion, debe ser
mayor que 0; en los fumadores, por otra parte, eI riesgo relat ivo es menor que 1,0; de
manera que, por definici6n, el riesgo atribui ble tiene que ser menor que O. Notese
que aunque la Tabla 6. 18 presenta solo riesgos relat ivos, y por tanto en una pri mera
mirada pudiera ser considerada como adecuada unicamente para la evaluacion de la
interaccion mult iplicativa, la ocurrenda de interacci6n cualitati va indica que la inte-
racdon esta presente en ambas escalas; en otras palabras, cuando hay interacci6n
cuali tativa, la escala no necesita ser especificada.
6.7.2. Reciprocidad de la interacci6n
La interaccion es completamente redproca en el caso de dos variables A y Z, dado
que si Z modifica el efecto de A entonces A modi fica el efecto de Z. Como se men-
cion6 previamente, la eleccion de A como presunto factor de riesgo y la de Z como
un modificador potencial de efecto son arbitrarias y la decisi6n acerca de d ial
desempefia un papel u otro es una funci6n de la hi p6tesis que esta siendo considera-
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 209
da 0 evaluada. Por ejemplo. puesto que el efecto de fumar cigarrillos sobre el cancer
pulmonar es fuerte. y puesto que esto ha sido finnemente eSlablecido. puede ser de
interes explorar su papel como un modificador de efecto cuando se estan evaluando
otros factores de riesgo potenciales para el cancer pul monar.
EI concepto de reci procidad de la interacdon se ilustra en la Tabla 6. 19,donde se han
reorganizado los datos de la Tabla 6. 18 de suerte que el habilo de fumar se convierte en
un factor de riesgo de interes y el consumo de cafefna se torna un modificador de efecto
(por razones de simplicidad. solo se emplean dos categorias de con sumo de cafefna). Tal
y como se ha vislo. el habito de fumar esta posilivamente asociado con la demora en la
concepci6n en madres que no lOman cafefna, pem parece ser un factor de proteccion
para aquellas que tienen un alto nivel de consumo. E.>;te patron es la imagen especular del
patron que exhi be la Tabla 6. 18, con 10 que se pone de manifiesto nuevamente que no
hay un patron jecirquico int rinseco cuando se decide que variable debe ser tratada en
calidad de modificador de efecto y cual en calidad de factor de interes primario.
Tabla 6.19
Relacion entre eI habito de fumar materno y el riesgo de concepcion demorada
de acuerdo con un consumo fuerte de cafclna entre 824 embarazos que ocurrieron
entre mujeres que no emplearon anticonceptivos entre 1980 y 1990
No consume cafeina
Consumo de cafeina
,, 300 mgldia
Fumadores Embarazos Abort os RR Embarazos Abortos RR
No m
"
' ,0
" "
',0
Si 76
"
2,'
83
"
0,7
Fuente. CK Stanton aoo RH Gray, The Effects of Caffeine Consumption on Defayed Cooceplion, American Jour-
naf of Epidemklfogy, Vol 142, 1322- 1329 11:1 1995, The Johns Hopkins University School 01 Hygiene & Public Health.
6.8, INTERACCION, EFECTO DE CONFUSION Y AJ USTE
Aunque, ocasionalmente, la misma variable puede ser a la vez un confusor y un
modificador de efecto. la confusi6n y la interaccion son fenomenos por 10 general
dist intos . Los efectos de confusion son indeseables, puesto que ellos dificu lt an la eva-
luad6n acerca de si la asociaci6n, ademas de estadfstica, es tambien causal. La inte-
racd6n, por otra parte, si es derta, es parte del entramado de y puede
lener impl icaciones importantes para la prevencion, tal y como ocurre en el ejemplo
del habito de fumar y el consumo de cafefna recogido en las Tabla.>; 6. 18 y 6. 19.
Cuando se encuentra que una variable cumple ambas condiciones, la de ser de
y Ia ele un mooific<1elor ele efecfo. improceelenle pm elich<1
variable. Cuando se hall a interaccion aditiva, no es apropiado ajustar por el modifi -
cador de efecto con la finali dad de oblener un riesgo atribuible ajustado, y cuando se
liene interaccion mult iplicativa, es inapropiado obtener un riesgo relat ivo aj ustado
por el modificador de efecto. Esto se debe a que, cuando hay interacci6n, la noci6n
de un valor medio (efecto principal) globalmente ajustado (ponderado) tiene poco
210 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sent ido. Por ejemplo. si los OR resultan ser 2,0 para hombres y 25,0 para mujeres,
un promedio que resuma el incremento en los oddJ' para (Odos los individuos,
independientemente del genera, earcee de sent ido. Esta noci6n es incl uso mas
importante cuando nos ocupamos de imeracci6n cualit ativa; si el oddJ' ratio para una
exposici6n dada es 0,3 en hombres y 3,5 en mujeres, un odds ratio promedio aj us-
(ado por genero puede indicar ausencia de asociaci6n, una inferencia il6gica dado
que asociaciones fuertes, aunq uc en direcciones opuestas, existen en ambos sexos
(para vcr un ejemplo adicional, acudasc al Capit ul o 7, Secci6n 7.3 .1 ).
Pues(Q que siempre se halla alguna heterogeneidad. con frecucnda el epidemi610go
se enfrenta a un dilema consislente en si ha de aj uslar por el posible modificador de
efec(Q 0 no. Una soluci6n es lIevar arelanle una prueba de hip6lesis estadislica y no
aj uslar si se rechaza 1..1 hip6lesis de nulidad para 1..1 homogeneidad (veanse la Secci6n 6.9
y el Apendice C). Pero si, porejemplo, los dos odds ratio son 2,3 y 2,6, serfa erroneo no
aj ustar y obtener un efec(Q ajustado promedio, independientemente del valor de p. (Si el
tamafio muestral es muy grande, una imeraccion de pequefia magnitud puede ser esta-
dfsticamente significativa incl uso en caso de que no tenga verdadero peso desde el pun-
to de vista medico 0 de 1..1 salud publica) . Por otra parte, si los odds ratio fueran 12,0 y
I j, incluso en caso de que la helerogeneidad no fuese estadfsticamente significativa, eI
aj uste podrfa eslar contraindicado. Aunque no existe una regia que establezca claramen-
te cuando ajuslar en presencia de hetemgeneidad, podrfa ser utilla consideraci6n de 1..1
siguiente pregunta: dado que se tiene una heterogeneidad de esta magnitud, (.deseo yo
estimar un efecto promedio (aj ustado) que sea razonablemente representativo de todos
los est ratos de la poblaci6n que se estudia formados sobre la base del presunto modifica-
dor de efectos?. Algunos ejemplos y posibles respuestas a estas preguntas se muestran
en 1..1 Tabla 6.20 y pudieran ayudar en la evaluaci6n pragmatica de este problema. Inde-
pendientemente de si un efecto aj ustado por Z se comunica 0 no. frecuentemente es
infonnativo comunicar los valores especfficos de los est ratos tambien.
Tabla 6.20
Riesgos relativos (RR) para el ractor A en relacion al descnlace Y, estratificado,
por eI modificador de decto potenci al Z
Presunlo modlflcador
de efeelo (Z)
Ausente Presente
2.3 2.6
2.0 20,0
0.'
3.0
3.0
4.'
Suponiendo que esta magnitud exhiba heterogeneidad, i,deberfa comunicarse
un efecto promedio ponderado (ajustado por Z) que se aplique a todos
los estratos de Z en la poblaci6n de eSludio?
Si; incluso si la diferencia en los RR es esladisticamente significativa,liene
sentido decir que, en promedio --es decir. independientemente de Z- el
riesgo relativo tiene un valor ubicado enlre 2,3 y 2,6.
Incluso si esta diferenda no es estadislicamenle signi!icativa, la
presentaci6n de un RR promedio ajustado por Z puede no ser apropia-
da en vista de la gran diferencia en la magnitud de los RR. Se recomien-
da presentar riesgos relativos especilicos para cada valor de Z.
No. Cuando existe una sospecha /undada de interacclon cuat itativa,
deberian presentarse los riesgos relativos especifioos para cada valor de Z.
Quizas. Aunque esta inleracci6n cuanlilativa puede ser de interes. los
efectos estan en la misma direcci6n y puede ser apropiado presentar un
riesgo relativo ajustado par Z. Ademas. seria aconsejable presentar
riesgos relativos especilicos para cada valor de Z.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 211
6.9. MODELACION ESTADiSTlCA Y PRUEBAS ESTADisTICAS
PARA LA INTERACCION
Los ejemplos que se dan en eSle capitulo conciemen al riesgo de enfennar en cali dad
de desenlace, pero la interacci6n puede ser estudiada con relaci6n a cualquier resul-
tado, por ejemplo, el valor medio de una variable fi siol6gica lal como los niveles de
glucosa.
Como ya se ha mencionado, es lambien posible examinar la interaccion para
variahl es conl inlJas , como clJ anlio se va lora la homogeneiliali li e los efeclos lie los
niveles continuos de presi6n sangufnea sobre el accidente cerebrovascular entre
hombres y muj eres, 0 entre blancos y negros. En eSla sit uaci6n, el invest igador a
menudo emplea modelos eSladfslicos mas complejos para evaluar la interacci6n, por
ejemplo, dncluye terminos de interaccion en la ecuaci 6n de regresion (vease CapI-
tulo 7, Secci6n 7.4.2). EslOs modelos tambi en pueden ser empleados para evaluar la
interaccion entre variabl es categ6ricas como una altemati va a los metodos de est rati -
ficaci6n que se presentaron en las secciones previas.
Otra pregunta con implicaciones practicas importantes es si la heterogeneidad
observada es prod ucida 0 no por mero azar. Cuando se emplean modelos de regre-
si6n para evaluar la interacci6n, la respuesta a esta pregunta viene dada simplemente
por la significaci6n estadlstica del tennino de interacci6n en la ecuaci6n de regre-
si6n (veanse Capitulo 7, Seccion 1.4.8 y Apendice A, Secci6n A.9) . Cuando se eva-
lua la interacci6n empleando las tecnicas de estratificacion descritas en secciones
previas, las pmebas estadfsticas formales permiten valorar si una heterogeneidad
observada es 0 no estadlsticamente significati va. Estas pruebas, incluyendo las pme-
bas para la interacci6n aditiva en estudios de casos y controles, han sido descritas
delall adamente en olros libros de textos (veanse por ejemplo, Schlesselman(l S) Sel-
vin( 16)) y se ilustran en el Apendice C.
Debe subrayarse nuevamente que las pruebas estadfsticas de homogeneidad, aun-
que util es, no son sufici entes para evaluar cabalmente la interacci6n. Cuando los
lamanos de muestra son grandes, como ocurre en un estudio mul ticentrico, incluso
una li gera heterogeneidad carente de valor practico pudiera ser estadfsticamente sig-
nificat iva. Por olra parte, aunque no sean estadfsticamente significativos, los estima-
dos de riesgos relativos puntuales marcadamente diferentes unos de otms, sugieren
la pos ibilidad de una helerogeneidad real. Ideal mente, aunque la heterogeneidad no
sea estadfsticamente significativa, si es acusada, deberla ser confinnada por un estu-
dio con poder estadfstico sufici ente como para detectarla.
6.10. INTERPRETACION DE LA INTERACCION
Hay muchas razones por las cuales el efecto observado de una exposici6n puede
diferi r en dependencia del nive l Ia presencia de lIna tercera variable . La aparente
heterogeneidad puede deberse al azar, a la confusion select iva 0 al sesgo. Ademas
podrfa resultar de una dosis heterogenea de exposici6n (frec uentemente descono-
cida por el invest igador) . La susceptibilidad diferencia l a diferentes niveles en la
patogenesis de la enfennedad de que se trat e puede ofrecer otra explicaci6n poten-
cial para la heterogeneidad de los efeclOs. A continuaci6n se ofrece una gUla prac-
212 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
fica resumida de los mas imponantes aspectos concernientes a la interpretacion de
interacciones observadas .
6.10.1. Heterogeneidad debida a variabilidlld aleatoria
La heterogeneidad puede ser result ado de la variabilidad aleatoria producida por la
estrat ificaci6n de acuerdo a un posible modificador de efecto. La variabilidad alea-
(Ori a puede producirse all n en easa de que se haya hecho una especificacion a
priori de la imeracci6n en el contexlo de la hip6tesis que va ser evaluada. Una
situaci6n mas cornun, sin embargo, se produce cuanda la interacci6n no ha sido
especificada a priori, pero el investigador decide lI evar adelante un analisis por
subgmpos. La decision de examinar subgrupos esla frecuentemente motivada por
hallazgos negativos en el es(udio. El investi gador puede decidir la evaluaci6n de
hip6tesis mas espedficas una vez que la asociacion original que ha post ul ado no
sat isfizo las expectat ivas. Entre las preguntas a posteriori que podrfa formu lar el
epidemiologo frustrado pueden, por ejemplo, estar las sigui entes: Puesto que no
pude encontrar una asociaci6n cuando se est udiaron a todos los partici pantes en el
est udio, lsere yo capaz de encontrar tal asociacion solo en los hombres? l En hom-
bres de edad avanzada? lEn hombres mas viejos con un nivel educacional
mayor?, y asf suces ivamente .
El tamano de muestra inevitablemente decrece en la medida en que se crean mas
estratos dentro de los subgmpos de anal isis, 10 que hace probable que no pueda des-
cartarse que la heterogeneidad observada sea debida solamente al azar. EI examen
por subgrupos deberfa ser considerado como una estrategia exploratoria. La detec-
cion de heterogeneidad deberfa evaluarse solo en la medida que haya mot ivos para
considerarla plausible. Un ejemplo puede hallarse en un est udio de intervenci6n
sobre multiples factores de ri esgo, ensayo cl fnico aleatori zado que evaluo la eficacia
de las estrategias de eliminaci6n de mul tiples factores de riesgo cardiovascul ares . Se
encontr6 un incremento de mortalidad entre participantes hipertensos con cambios
electrocardiografi cos que eran objeto de las intervenciones experi mentales(l7). Aun-
que no fue previsto cuando el est udio se planifico, el efecto adverso de la interven-
cion limitada a este subconjunto de partic ipantes condujo a la hip6tesis de que los
medicamentos depletadores de potasio pueden estar cont raindicados en pacientes
hi pertensos con trastornos cardiacos. Una vez observada por conducto del analisis
de subgrupos, la interacci6n debe ser confirmada en un est udio especial mente dise-
fiado para evaluarla.
6.10.2. Heterogeneidad debida a la confusion
Cuando se exploran las asociaciones entre A e Y en estratos defi nidos por niveles de
Z. los efectos de confusion diferenci ales acordes a dichos estratos pueden ser res-
ponsables de la heterogeneidad de los efectos. Como un ejemplo hipotetico, consi-
deremos un est udio de casos y controles con el cual se evalua la relaci6n entre el
consumo de cafe y el cancer Y (Tabla 6.2 1). El investigador desea evaluar el genero
como un posible modificador de efecto; de acuerdo con ell o estratifica los casos y
los controles segun consumo de cafe (sf/no) y segun genero. En este ejemplo, el
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 213
Tabla 6.21
Intcraccion aparcntc dcbida a la confusion (cjcmplo hipotCtico)
Generolhabito de fumar Consumo de cate Casos Controles Odds Ratio
Femeninofno fumador sr 10 10
No 90 90 1.0
Total 100 100
Masculino/total sr 38 22
No 62 78 2.2
Total 100 100
Masculinoflumador sr 35 15
No 35 15 1.0
Total 70
3(1
Masculinofno lumador sr 3 7
No 27 63 1.0
Total 30 70
Nora: Supor.ga que el h t l b ~ o de lumar causa cancer Y; que el 50% de kls lumadores pero sokl el10% de los no
fumadores lOman call!; que el consumo de caM no esta iooepeooientemente reladonaoo con el cancer Y; que todas
las mujeres son no fumadoras; y. finalmente. q...e el 70% de los casos de los hombres y el 30% de los controles mas
cul inos son fumadores.
habito de fumar es una causa de cancer Y, las mujeres (tamo casos como comroles)
incluyen solo no fumadoras, el habit o de fumar esta asociado con el consumo de
cafe, y entre los casos masc uli nos hay una proporci6n mas alIa de fumadores que
ent re los comroles. Puesto que el habito de hlmar se relaciona con el consumo del
cafe y con el cancer Y, eSle act lia como un confusor positi vo en hombres. Suponien-
do que el consumo de cafe no esta causal mente relacionado con el cancer Y. en
mujeres (qui enes son todas no fumadoras) se encontro un odds ratio de 1,0. EI
caracler confusor del habito de fumar en hombres, por Olra parte, es responsable de
que los casos masc uli nos lengan odd.\ mas alt os de consumir cafe que los controles,
y como una consecuencia que el odd.\ ratio este marcadamente por encima de 1,0.
Hay, por tanto, una apariencia de interaccion debida a la confusi6n por el habit o de
fumar li mitada a los hombres.
La posibilidad de que la interaccion pueda ser explicada parci al 0 enteramente
por el efeclo de la confusion torna esencial que se ajuste por confusores potencia-
les cuando se esta evaluando dicha interaccion . En el ejemplo de la Tabla 6.2 1, el
efecto confusor del habi to de fumar explica enteramente la apareme helerogenei-
dad de l consumo de cafe segun sex os. En la mayor parte de los ejemplos de la
vida rea l, la confus ion no explica completamente la heterogeneidad del efecto,
sino que mas bien la agranda 0 la disminuye . Yu et al .(' 8) ofrecen un ejemplo al
examinar la interaccion de l habito de hlmar cigarrillos y el consumo de alcohol
en portadores del antfgeno de superficie (HBsAg) en la hepat it is cronica B con
respecto al riesgo de cirrosis hepal ica (Tabla 6.22). Podrfa detectarse heleroge-
neifiafi no aj tl slafia pm e l hahiro fie fllmar fie ac tl erfio al constl mo fie alcoho l ,
hecho que se torno algo mas marcado para personas que fuman intensamente (20
cigarrillos diarios 0 mas) frente a no fumadores (pero menos para fumadores
moderados) cuando el riesgo relal ivo rue simult aneamente ajuslado por cinco,
factores de confusion lI sando el mode lo de ri esgos proporcionales de Cox (vease
Capllulo 7, Seccion 7.4 .4) .
214 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 6.22
Ri csgo rclatiyo de cirrosis hepatica de acucrdo al cOlISumo de alcohol y h:ibito
de fumar en portadores cronicos de HBsAg
Rlesgo relatlvo
N." total
Numero de Con ajuste
Variable
casos incidentes
Sin ajuste
mult lvariado
No bebedOf
No turnado.
'" "
',0 ',0
<20 cigarrosJdfa
'"
"
','
',5
,, 20 cigarros/dia
'" "
2,0
',9
Bebedor
No turnado.
'"
' ,0 ' ,0
<20 cigarrosJdia HJO 6
6,'
3,9
,,20 cigarrosJdia
"5
,
' ,4
9,3
SimuMneamente ajustado per edad, la situaci6n de ser 0 no portador de HBsAg en el momenta del recluta
miento, la elevaci6n de la coocentrad6n serica de aminotransferasa PO' 10 meoos durante 6 meses, el nivel educa-
cional y el 9"'PO sanguine<>, utilizalldo un modelo de riesgos propordonales de Cox (vlmse Capitulo 7, Se<x:i6n
7.4.4) .
Fuente: MW Yu el al., Prospective Study of Liver Cirrhosis in AsymplomatK: ChronK: Hepatitis B Virus Carriers,
American Journal of Epidemiology, Vol 145. 1039 1047 11:1 1997. The Johns Hopkins University School 01 Hygiene &
Public Health.
6.103. Heterogeneidad debida al sesgo
En 10 que concieme a la confusi6n.la heterogeneidad observada bien pudiera prove-
nir de un sesgo diferendal entre los Por ejemplo, en un esmdio de indden-
da de abortos espontaneos tratados medicamente en un condado de Carolina del
None, Savitz et al .(l9) encontraron que, globalmente, las mujeres negras paredan
tener un riesgo menor de aborto que las blancas. Los autores interpretaron este
hallazgo como algo probablemente producido por un sesgo debido al subregistro de
abonos entre las negras. Tal y como se muestra en la Tabla 6.23, cuando la estratifi-
cad6n fue realizada de acuerdo al nivel educadonal, el decredmiento aparente del
riesgo de abono en negras se present6 solo en el estrato de menor nivel educadonaL
Este patron de una aparente modificad6n del efecto de la raza por el nivel educa-
donal es probablemente debido a la subvaloradon del sesgo que opera solamente en
negras con un nivel educadonal menOL
6.10.4. Heterogeneidad debida a la intensidad diferencial de la exposici6n
Una interacdon aparente puede ocurrir cuando hay heterogeneidad en los niveles de
eXJlOsicion rle aCllerrlo a li n sllpllesto morl ificarlor rle efeclo Por ejemplo, en lin eSfl\ -
dio reciente de una epidemia de asma, White ef a/.l20) invest igaron eI papel del polvo
de soja en el aire originado por la carga de contenedores del puerto de Nueva Orl eans.
La asodaci6n fue mas fuene cuando la velocidad maxima del viento estaba por
debajo de 12 millas por horas (odds ratio igual a 4.4) que cuando la velocidad del
viento era mayor (odds ratio igual a 1.7) . Esta heterogeneidad fue debida, verosfmil -
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 215
Tabla 6.23
Riesgo de aborto espontaneo por 100 embarazos, corrcgido por abortos inducidos
en relacion a afios de cducacion materna: Condado de Alamance, Carolina del Norte,
19881991
Blanco Negro
NegroJBlanco
N." RiesgoJl00 N." RiesgoJl00 Ratio
Total 325 7,7 93 5,5 0,7
Anos de educacion
de la madre
<9 12 10,4 0
10-11 52 8,0 15 4,5 0,6
12 111 6,3 44 4,7 0,7
. 13 150 9,2 33 9,5 1,0
Fuente: OA Saviz at al .. Medically Treated Miscarriage in Alamance County, North Caroli na, 1988'1991, Ameri
can Journal of Epidemiology, Vol 139. 1100-1100, 11:1 1994. The Johns Hopkins University School 01 Hygiene & Public
HeaHh.
mente, a una exposici6n mas fuene al pol vo de soja resultante de una velocidad del
viento menor y no representarfa par tanto la verdadera interaccion usando un cri-
terio estrecho de susceptibilidad biol6gica diferencial bajo las mismas condiciones
de intens idad de exposici6n ambiental. Por razones praclicas, sin embargo, establ e-
cer este tipo de heterogeneidad tiene relevantes implicaciones para la salud publica.
6.105. Interacci6n y factores del huesped
La presencia y, en el fondo, la intensidad de la exposici6n pueden tambien oc urrir en
vinud de caracterfst icas anat6micas 0 fis iopatologicas del hucsped. Por ejemplo, se
encontr6 una interacci6n cualitati va en un est udio de casos y controles reali zado por
Reif ef U/ .(2] ) entre la forma del craneo en perros domesticos y la exposicion a humo
e tabaco en relacion al cancer pulmonar: el incremento en los de cancer pulmo-
nar asoc iado con el hecho de que el dueno del perro es un fumador se li mit6 a perros
con una nariz corta (braqui y mesocefalicos), presumiblemente debido a una barrera
mecanica para las partfculas carcinogenicas, representada por los cilins de los perros
con nariz larga (dolicocefalos). (Lna explicaci6n alternat iva es que hay diferencias
geneticas en la susceptibilidad al cancer pulmonar inducido por el habito de fumar
entre estos tipos de perros). En un estudio subsiguiente reali zado por los mismos
aUlores, una interacci6n cualitativa fue nueva mente encontrada entre la exposici6n a
humo de tabaco y la forma del craneo en relaci6n con cancer nasal, excepto que se
encontro un odds mayor de cancer entre los perros de nariz larga que entre los perros
de nariz corta(22) . esto condujo a los alllores a especular acerca de que un riesgo
incrementado de cancer nasal entre los perros que tenfan nanz larga puede explicarse
por la fil traci6n aumentada, y el impacto de panfcu las en la
Estos ejemplos subrayan la importancia de considerar la intensidad y/o la faci li -
taci6n de la exposici6n cuando se intenta explicar la heterogeneidad de efectos. Una
dosis efect iva de exposici6n es obviamente una fundon del resultado neto del monto
216 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
de la exposici6n en el ambiente individual (como en el ejemplo del paiva de soja),
la dosis absorbida dentro del organismo, y la dosis que alcanza los niveles celulares
(los ejempl os de cancer nasal y pulmonar caninos) .
Desde el punto de vista del huesped, los modificadores de cfecto pueden actuar en
diferentes puertas de entrada.>; (piel , aparato gastrointestinal, sistema respiratorio). Por
ejemplo, es bien conocido que la expmici6n a la misma intensidad de un p..1t6geno de
piel (por ejemplo, estreptococo) se relaciona con lIna probabili dad mayor de infecd6n en
individuos con rash en la piel que en aquell os que {cngan la piel normal. De ese modo,
los factores que producen lesiones en la piel (por ejemplo. alergenos en la pieL trauma
mecanico) interactlian con agentes infa::ciosos para incrementar el riesgo de infecci6n.
EI mecanismo biol6gico de los modificadores de efecto puede tambitn variar
en el ambit o celular 0 metab6lico. La interacci6n entre vias melab61icas y la
exposicion a factores de ri esgo se ejcmplifica mediante desordenes gem!ticos tales
como la fenilceton uria. En este trastorno, la incapacidad para oxidar un producto
metab6lico de la fen il alanina encontrada en muchos ali mentos puede dar lugar a una
grave deficiencia mental. Las diferencias genet icas entre individuos tambitn pueden
ser responsables de la suscepti bilidad diferencial entre individuos en relaci6n a una
enfermedad inducida por un factor de riesgo. Por ejemplo, a juzgar por los resulta-
dos de experimentos en ratones, es posible que los humanos, tambitn, tengan una
susceptibi lidad genetka di ferencial a la hipertensi6n inducida por el consumo de
sal(2]). En el marco inmunologko, son bien conocidas las interacciones entre ciertos
medkamentos (por ejemplo esteroides, inmunodepresores) y agentes infecciosos en
relacion con eI riesgo y/o la gravedad de las infecciones. EI ri esgo relativamente
bajo de enfermedad coronaria en mujeres blancas con niveles similares de exposi-
cion a factores de riesgo cardiovascular tradkionales con respecto a los hombres en
los Estados Unidos sugiere que las honnonas pudieran desempenar un pape l en ia
modificaci6n de efectos de tales factores de
6.11. INTERACCION Y BUSQUEDA DE NUEVOS FACTORES DE RIESGO
EN GRUI'OS DE BAJO RIESGO
La fuerza de una asociaci6n medida por conducto de una magnit ud relat iva (por
ejemplo, un ri esgo relati vo) es una funcion de la prevalencia relati va de Olros facto-
res de ri esgo(l5 25) . Este concepto parece haber sido reconocido por primera vez por
Cornfield e t al.(26.I'ig I'), qui enes establecieron:
Si cada uno de dos agentes no correlacionados. A y B. incrementan el riesgo de una enfer-
medad, y si el riesgo de enfennar ell ausencia de cualquiera de ellos es pequeno". enton-
ces el riesgo reiativo para A. .. es menor que ei riesgo (relativo) para A en ausencia de B.
Esta noci6n es facilmente comprens ible cuando consideramos una si tuaci6n en la
cual un factor de riesgo esta fuertemente asociado con la enfermedad, como en el
caso del habito de fumar y el cancer pulmonar: para examinar el papel de un factor A
mas dtbil , serfa intuiti vamente lagk o estudiar a los no fumadores, ya que de Olra
manera la inmensa mayoria de los casas eslarfan explicados por el habit o de fumar.
En otras palabras, se espera una magnificaci6n del riesgo relat ivo para A entre aque-
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 217
1I0s no expuestos al habito de hlmar (frente a fumadores), esto es, una interacci6n
multiplicat iva negativa('S). La tendcncia hacia una interacci6n mul ti pl icat iva negat iva
cuando se examinan efectos conj untos de un fac(Or de ri esgo fuerte Z y un factor de
riesgo debil A , puede ser intuit ivamente comprendida al considerar dos hechos: I ) el
riesgo absoluto maximo asociado con la exposici6n a cualquiera de los fac(Ores no
puede sobrepasar el 100 %, Y 2) mientras mayor sea el riesgo relativo independiente
asociado con la exposici6n a Z, mas se aproximara al 100 % el riesgo en los expues-
(Os a Z .
Con prop6sitos ilustrat ivos. supongamos un ejemplo hipotetico extremadameme
simpli sta que involucra los factores de riesgo Z y A mostrados en la Tabla 6.24, en la
cual la incidencia de base de la enfennedad (es decir, la incidenda en aquellos no
expues(Os a ninguno de los factores de riesgo) es alrededor del 10% Y el riesgo relativo
independiente para Z (es decir, en ausencia de A) es 9,0 (10 que supone que, entre
aquellos no expuestos a A pero expuestos a Z, la incidenda asc iende al 90 %). Pueslo
que la incidenda en los expuestos a A en el estrato de expuestos a Z no puede sobre-
pasar el 100 %, el riesgo relat ivo maximo posible para A si Z esta presente es 100 % """
90 % = I , I . Una diferenda absoluta simil ar del 10 % debida a la exposid6n a A en los
no expuestos a Z producirfa un riesgo relativo del 20 %""" 10 % = 2,0. Un razonamien-
(0 simil ar puede aplicarse a una situaci6n en la que Z es una constelaci6n de factores
de riesgo, en lugar de una variable simple: por ejemplo, cuando se estudian result ados
de una enfennedad cardiovascular, Z puede definirse como la presencia simultanea de
hi pertensi6n, hipercolesterolemia, habito de fumar, diabeles y as! sucesivamente.
Tabla 6.24
Ejemplo de interaccion negati va entre un factor de riesgo mas fuerte y uno mas debit
Tamaiio de Incidencia Riesgo atribuible Riesgo relativo Riesgo relativo
Factor Z Factor A
la poblacion 100 para All 00 para A para Z
Ausenle Ausente 1.000 10,0 0 1.0 1,0
Presenle 1.000 20,0 10.0 2,0 1,0
Presente Ausenta 1.000 90,0 0 1.0 9,0'
Presenle 1.000 100.0 10.0 1,1 5,0"
Riesgo relativo de Z en personas 00
.. Riesgo relativo de Z en personas expuestas
Un ejempl o se tiene en la conocida diferencia de sexos en relaci6n con la preva-
lencia de dlculos en la vesicul a. Se estima que en la poblaci6n general, el 80% de
las mujeres y el 8% de los hombres tienen enfermedad de la veslcul a(27) . Por tanto.
los riesgos relat ivos para factores de ri esgo diferentes al sexo tenderfan a ser mayo-
res en hombres que en mujeres.
Debido a su atractivo int ui tivo. la idea de est udiar factores de riesgo emergen-
en individuos que no poseen fac(Ores de ri esgo conocidos es ocasionalmente
considerada al di sefiar un estudio. Por ejemplo. en un estudio reciente del presunto
efecto protector de los antibi6ticos sobre la enfermedad coronari a (EC), Meier et
compararon el uso previo de ant ibi6ticos (oblenido a part ir de registros farma-
ceuticos) en casos de EC y en controles; al seleccionar estos grupos , los au (Ores
excl uyeron a todos los indi viduos que tuviesen una hi stori a conocida de enfennedad
coronari a 0 de otras enfermedades cardiovascul ares, as! como a los individuos que
218 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
padecieran hipertensi6n, hipercolesterolemia 0 diabetes. Es importante comprender,
sin embargo. que el uso de esta estrategia puede limitar la generali zaci6n de los
hallazgos del esmdio a la poblacion, que incluye tanto individuos de bajo como de
alt o riesgo. Ademas, las asociaciones que descansan en el sinergismo entre fac(Qres
de riesgo pueden no ser detectadas. Por ejemplo, si las infecciones no son causas
suficientes 0 necesarias para la arteriosclerosis sino mas bien estan involucradas en
la merogenesis en virtud de su sinergismo con alros fac(Qres de riesgo cardiovascu-
lares (por ejemplo, hipercolesterolemia, diabetes), como se ha sugerido en alro
5ill0(29) . entonces el enfoque de bajo riesgo puede subest imar el impac(Q potencial
de las infecciones, (0, por analogfa, de los antibioticos) sobre la arteriosclerosis.
6.12. INTERACCION Y
DE LAS ASOCIACIONES
Un importante supuesto cuando se generalizan resultados empfricos es que la pobla-
cion que se est udia debe tener en promedio susceptibilidad a la exposici6n bajo
estudio con respec(Q a un desenlace dado. Cuando la susceptibilidad es escasa, los
result ados no pueden ser f:k il mente generali zados . Por ejemplo, los resultados de un
esmdio sobre la efect ividad de una vacuna en ninos africanos puede no ser aplicable
a ninos suizos, ya que la nutric ion inadecuada en los primeros pudiera alterar signifi-
cativamente el sistema inmune y, por tanto, modificar la producci6n de anticuerpos a
los agentes muertos 0 inact ivados .
Cons ideremos, por ejemplo, los hall azgos en la Tabla 6.10 para valorar la
inlluencia de la interacci6n sobre la capacidad para hacer generalizaciones. Supo-
niendo que los hipertensos son efectivamente susceptibles de cardiomiopatfa induci-
da por el asma, los result ados en hipertensos son obviamente no generalizables a los
no hipertensos . De aquf se deriva que eillamado efecto promedio del asma sobre
la cardiomiopatfa es una funcion de la prevalencia de hipertensos en la poblacion a
la cual uno desea generalizar los resultados. Suponiendo que los odds ratio del est u-
dio de Coughlin(6) (Tabla 6. 10) representaban estimaciones verdaderas, en poblacio-
nes en las cual es la mayorfa de los individuos eran hipertensos, el odds ratio serfa
aproximadamente igual a 13,4: por otra pane, en poblaciones con una proporci6n
baja de hipertensos el odds ratio estarfa pr6ximo a 2,4. Mientras que el ejemplo de
hipertension y asma se basa en un mooificador de efecto facilmente medible (hiper-
tens ion), diferencias en la intensidad de una asoc iacion de poblaci6n a poblaci6n
puede tambien deberse a las diferencias ent re poblaciones con respec(Q a la preva-
lencia de modificadores de efecto ambientales 0 geneticos no medidos,
Aunque es diffcil establecer hasta que punto la susceptibilidad de una poblaci6n
en est udio difiere de la susceptibilidad promedio, la evaluaci6n de su perfil epide-
miol6gico (basado en factores de ri esgo bien conocidos) puede indicar cuan usual
o <<in usual resulta ser dicha poblaci6n. Asf. en estudios de cancer de mama, supo-
niendo que no hay sesgo, una poblaci6n en est udio en la cual no se encontr6 la bien
conocida asociaci6n con la edad en el momento del primer embarazo podrfa no tener
una susceptibilidad promedio, Sin embargo, esta estrategia es li mitada, puesto que
eI nivel de susceptibilidad a un factor de ri esgo conocido puede no ser representativo
del nivel de susceptibilidad en relaci6n con la exposicion que se est udia,
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS 219
BlBLlOGRAFiA
1. Petitti DB. Associations are not effects. Am J Epidemiol 1991: 133: 10 I-I 02.
2. Rothman KJ. Greenland S. Modem epidemiology. 2.' ed. Philadelphia. Lippincott-Raven
Publishers. 1998.
3. Kannel WB. Li pids. diabetes and coronary heart disease: insights from the Framingham
slUdy.AmHeartJ 1985: 110: 1100-1107.
4. Comstock GW. Lundin FE. Parental smoking and perinatal mortality. Alii J Obslel Gyne-
'011967: 98: 708-718.
5. Shapiro S. Slone O. Rosenberg L ei al. Oral-contrnccptivc usc in relation to myocardial
infarction. Lanai 1979: I: 743-747.
6. Coughlin SS. A case-control study of dilated cardiomyopathy. Doctoral dissertation.
Johns Hopkins University School of Hygiene and Public Health. 1987.
7. Morabia A. Ten Have T. Landis JR. Interaction fallacy. J Clin Epidellliol 1997: 50:
809-812.
8. Thompson WO. Statistical analysis of case-control studies. Epidemiol Rei' 1994: 16:
33-50.
9. Darroch J . Biologic synergism and parallelism. Am J Epidemiol 1997: 145: 661-668.
10. Thompson WD. Effect modification and the limits of biological inference from epide-
miologic data. J Clin Epidemiol 1991: 44: 221-232.
II. Rothman KJ, Greenland S. Walker AM. Concepts of interaction. Alii J Epidemiol1980:
12: 467-470.
12. Stanton CK. Gray RH. The effects of caffeine consumption on delayed conception. Alii J
Epidellliol1995: 142: 1322-1329.
13. Shapiro S. Venet W. Strax P. Selection. follow-up. and analysis in the Health Insurance
Plan study: a randomized trial with breast cancer screening. Nail Canur hw Monogr
1985: 67: 65-74.
14. MacMahon B. Pugh TE. Epidemiology: Principles and melhods. Boston. Mass: Li ttle.
Brown & Co .. 1970.
15. Schlesselman JJ . Case-cof1lrol slUdies: Design, L'ondllL"l, analysis. New York. Oxford
University Press. 1982.
16. Selvin S. Sia/is/ieal analysis of epidemiologic da/a. New York. Oxford University Press.
1991.
17. Cohen JD. Abnonnal electrocardiograms and cardiovascular risk: role of silent myocar-
dial ischemia. Am J Cardiol 1992: 70: 14F-18F.
18. Yu MW. Hsu FC. Sheen IS el al. A prospective study of liver cirrhosis in asymptomatic
chronic hepatitis B virus carriers. Am J Epidellliol 1997: 145: 1039-1047.
19. Savitz OA. Brett KM. Evans LE. Bowes W. Medically treated miscarriage in Alamance
County. North Carolina. 1988-1991 . Am J Epidellliol 1994: 139: 1100- 1106.
20. White Me. Etzel RA. Olson DR el al. A re-examination of epidemic asthma in New
Orleans, Louisiana, in relation to the presence of soy at the harbor. Am J Epidemiol
1997: 145: 432-438.
21. Reif JS. Dunn K. Ogilvie GK e/ al. Passive smoking and canine lung cancer risk. Alii J
Epidemiol 1992: 135: 234-239.
22. Reif JS. Bruns C. Lower KS. Cancer of the nasal cavity and paranasal sinuses and expo-
sure to environmental tobacco smoke in pet dogs. Am J Epidemiol1998: 147: 488-484.
23. Szklo M. Epidemiologic patterns of blood pressure in children. Epidemiol Rev 1979: I:
143-169.
24. Szklo M. Epidemiology of coronary heart disease in women. En: Gold EB. (ed.). The
dwnging risk of disease in womOl. Lexington. Mass: Collamore Press. 1984: 233-241.
25. Rothman KJ . Poole e. A strengthening programme for weak associations. In/ J Epide-
lIIio11988: 17: 955-959.
220 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
26. Cornfield J . Haenszel W. Hammond EC el al. Smoking and lung cancer: Recent eviden-
ce and a discussion of some questions. 1 Nail Cancer Insl 1959: 22: 173-203.
27. Greenberger Nl. Isselbacher KJ . Diseases of the gallbladder and bile ducts. En: lsse lba-
cher KJ . Braunwald E. Wilson lD el al .. (eds.). Harrison's Prindples of inlernal medid-
ne. 13: ed. New York. McGraw-Hill Inc. 1994: 1504-1516.
28. Meier CR. Derby LE. lick SS. el al. Antibiotics and risk of subsequent first-time acute
myocardial infarction. lAMA 1999: 2&1: 427-431.
29. Nieto Fl. Infections and atherosclerosis: new clues from an old hypothesis? Am 1 Epide-
m;011998: 148: 937-948.
PARTE IV
EL DESAFio
DE LA VALIDACI6N
CAPITULO 7
Estratificacion yajuste:
Amilisis multivariante en epidemiologfa
7.1. INTRODUCCION
Los esmdios de epidemiologfa analftica se disefian para evaluar la asoc iaci6n ent re
exposiciones ambientales u otras caracterfsticas de los individuos (por ejemplo, varia-
bles demograficas y poli morfismos gendicos) y el riesgo de enfermar. Incluso en caso
de que el intcres del epidemi61ogo re concentre en una exposici6n unica, nonnalmen-
Ie son varios los fac(Qres que deben ser considerados en el analisis, ya sea porque ellos
pueden distorsionar (confundir) la relaci6n entre la exposici6n y la enfennedad (vease
Capit ul o 5) como porque la magnitud de la asociaci6n entre la exposici6n y la enfer-
medad puede variar a 10 largo de los niveles de dichas variables (modifi caci6n de efec-
10; vease Capitulo 6). La eJtratificacion y el unulisis multivariunte (mode/acion) son
las herramientas analfticas empleadas para controlar los efec{os de confusi6n, para
evaluar la modifi caci6n de efectos. y para resumir la asociacion de varias variables
predictoras con el riesgo de enfermar de una manera efici ente .
EI me{odo mas simple para analizar la presencia de posibles confusores es la
es{rat ificacion; este es frecuentemente, un metodo muy infonnat ivo puesto que: I)
penni{e un examen directo y simult aneo de la posible presencia tanto de la confu-
sion como de la modificacion de efectos y; 2) el examen de resultados estratificados
es a menudo (itil para seleccionar la tecnica estadfs{ica apropiada para el ajuste (vea-
se mas adelante) .
EI anulisis mulrivariante se refiere a una serie de tecnicas analfticas. cada una
basada en un modelo matematico mas 0 menos complejo, que son utili zadas para Ile-
var adelante el ajuMe eJ"rad6"rico: esto es, la es{imacion de cierta medida de asociacion
entre una exposicion y una variable de desenlace mientras se controlan una 0 mas
variables confusoras. La modificaci6n de efectos puede tambien ser evaluada en el
contex{o del analisis multivariante. L1 proxima seccion presenta un ejemplo que ilus-
{ra la idea basica de la estratificaci6n y el ajuste como dos alt emativas a menudo com-
plementarias para ident ificar y controlar variables confusoras. Las siguientes seccio-
nes discuten con mas detall e algunas de las tecnicas de ajuste mas usadas en
epiclemiologfa . Ntilese q lle el emparejamienro, aclemas cle ser tina lecnica (i lil para e l
ajuste, constituye tambien un rasgo del disefio de un eSllldio (incluyendo el empareja-
miento individual y el de frecuencias); consecuentemente, ha sido previamente consi-
derado en el Capitulo 1 de este Hbm, en el que fueron discmidas las estrategias funda-
mentales de disefio observacional (Secci6n 1.4.5). En el presente capitulo, el
problema del emparejamiento indh'idual se vuel ve a considerar. pero solo en la medi-
224 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
da que se relaciona con la aplicaci6n de esta estrategia con vistas al ajuste en un segui-
miento propio de los eswdios de cahorte (Secci6n 7.4.6) y para demostrar su conver-
gencia analftica con el enfoque de Mantel-Haenszel cuanda los conjuntos empareja-
dos son tratados como estratos para el aj uste de un odds ratio (OR) (Secci6n 7.3.3).
7.2. TllcNICAS DE ESTRATIFICACION Y AJUSTE I'ARA RESOLVER
EL I'ROBLEMA DE LA CONFUSION
La Tabla 7.1 muestra un ejemplo de un esmdio de casas y controles sabre el sexo
masculi no como posible fac!Or de ri esgo para la infecci6n por malaria. Este ejemplo
fue considerado en el Capitulo 5 para ilustrar como evaluar si una vari able es confu-
sora (Secci6n 5.3). El analisis crudo contenido en la parte superior de la tabla sugie-
re que los hombres tienen un riesgo mayor de malaria (OR = 1,7 1). Si los errores
aleatorios y sistematicos (sesgos) se consideran poco probables como explicaciones
de la asociaci6n observada, entonces procede contemplar la posibilidad de que este
presente el fen6meno de confusi6n; esto es, hay que valorar si la asociacion puede
ser explicada por caracterlsticas que se relacionan tanto con el genero como con los
odd.\ incrementados de malaria.
Una caracterlstica de ese tipo es la ocupacion: los individuos que trabajan fun-
damentalmente en espacios abiert os (por ejemplo, trabajadores agrkolas) estan
expuestos con mas probabilidad a la picadura de mosquitos que aquellos que tra-
bajan en espacios cerrados y ti enen, por ende, un riesgo mayor de malaria. De tal
suert e , la asociaci6n observada pudiera ser explicada por ese conducto si la procli-
vidad a trabajar en espacios cerrados difiere entre generos. En la Seccion 5.3 se
vio que la oc upaci6n estaba relacionada tanto con el genero (la exposicion)
como con la malaria (el desenlace) (estrategia nli mero I para la evaluaci6n de la
confusion, vease Esquema 5.3); tambien se vio que cuando los datos se estratifica-
ban seglin tipo de ocupacion (estrat egia numero 2 para evaluar la confusi6n),
entonces los estimados estratificados diferfan de los estimados globales (cmdos).
Tales result ados son presentados en la parte inferior de la Tabla 7.1 . Los OR esti -
mados en ambos estratos son muy cercanos a I. AI estratificar los result ados del
eswdio de ac uerdo al confusor potenciaL se hace posible contra/a,. su efecto. Esto
es: puede evaluarse la asociaci6n entre el presunto factor de riesgo (en este caso, el
sexo masculi no) y la enfennedad (malaria) separadamente para aquellos que tra-
bajan fundamentalmente en espacios abiertos (OR = 1,06) Y para aquell os que tra-
bajan fundamentalmente en espacios cerrados (OR = 1,0) . EI hecho de que esos
OR espedfi cos de los dos estratos sean similares entre Sl y bastante diferentes del
estimado crudo sugiere que la oc upaci6n es, en efecto, un confusor de la asocia-
ci6n entre el sexo masc uli no y la presencia de malaria. En contraste con el estima-
do crudo (OR = 1,7 1), los OR de ambos estrat os son muy cercanos a I , esto sugie-
re que una vez que se ha tenido en Cllenta la ocupacion . ya no hay asociacion entre
el genero y la presencia de malaria; en otras palabras, que la asociaci6n cruda pue-
de ser explicada por el efecto confusor de la ocupacion . (Como se discmio en el
CapItulo 5, Seccion 5.3, los estimados no aj ustados de las razones de odd.\, las
razones de tasas y las diferencias absolutas, pueden ser diferentes en los estratos
espedfi cos incluso cuando la confusi6n no esta presente(I.2), As\, la evaluaci6n de
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 225
los efectos confusores potenciales por conducto de la estrat ificaci6n debe ser con-
firmada mediante el uso de O{ras estrategias discutidas en el Capitulo 5 y en este
capitulo).
Los datos estratificados que recogen las tablas 2 x 2 ubicadas en la parte inferior
de la Tabla 7.1 penniten un examen mas estrecho de por que la oc upacion es un con-
fusor en este ejemplo hipotetico: I ) e143,6 % (68/ 156) de los hombres tienen ocupa-
ciones que se desarroll an mayormente en espacios abiertos, comparado con solo un
9% (13/144) en el caso de las mujeres (OR = 7,8) Y 2) el 42% (63/ 150) de los casos
de malaria se desempefian principal mente en oc upaciones en espacios abiertos.
comparado con el 12% (18/ 150) de los controles (OR = 5,3) . Las fuertes asociacio-
nes pos itivas del confusor (ocupadon) tanto con el factor de riesgo de interes (sexo
masculi no) como con la situadon de ser un caso 0 un control explica el efecto con-
fusor (positivo) .
EI analisis estrat ificado tambien pennite la valoradon de la posible presencia de
interacciones. En el ejemplo antes mencionado, el hecho de que los OR espedficos
por estrato fuesen muy simil ares (homogeneos) (Tabla 7.1 ) indica que no hay inte-
mcdon (vease Capitulo 6), de manera que puede calcularse un odds ratio aj ustado
global mente por ocupaci6n. Como se describe mas adelante en este capitulo, esto
puede concretarse mediante el computo de un proll/uJio ponderado de las estimacio-
Tabla 7.1
Ejcmplo dc aml.lisis estratili cado: Estudio hipotCtico del gcncro masculino
como ractor dc ri esgo para la inrcccion por malaria
Anall si s Crudo
TocJcs los Casos y Con/roles
Casos Controies Total
Hombres 88 6B 156
Mujeres 62 82 144
Total 150 150 300
Anall si s estrat il icado por ocupaclon
Hombres
Mujeres
Total
Hombres
Mujeres
Total
I
Casos y Con/roles can ocupaciones propias
de espacios abiertos
Casos Controles Total
68
13
81
53
10
63
15
3
18
Casos y Con/roles can ocupaciones propias
oe eS(Ulcios ceffedos
Casos Controles Total
35 53 88
52 79 131
87 132 219
OR", 1,71
OR", 1,06
OR", 1,00
226 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
nes espedficas por estrmo usando, por ejemplo, el odd.\" ratio ponderado de Mantel-
Haenszel, OR
Wh
el eua] pasa a ser 1,0 1 en este ejemplo particular (vease Secci6n
7.3.3). A diferencia del examen de los resultados espedficos por estrato, el calculo
de este promedio ponderado (es decir,dei OR ajustado) req uiere del supuesto de que
1a asociaci6n sea hOllloginea a 10 largo de los estratos. En vista de la similit ud de los
OR calculados en los estratos , cabe aceptar el supuesto de homogeneidad para los
resultados que se mucstran en la Tabla 7.1. Por otra parte, clI ando los OR no son
demasiado si mi lares (por ejemplo, 1,4 Y 2,0), puede ser di fkil decidir si 1a heteroge-
neidad observada es 0 no real: esto es. si hay lI na verdadera modificacion de efectos.
o si meramente se trata de una consecuencia de la variabi lidad aleatoria causada por
el pequeno tamano que tienen las muestras en los estratos (vease Capitulo 6, Secci6n
6.1 0.1 ), en cuyo caso puede ignorarse esta heterogeneidad y proceder al aj uste . En
otras palabras, el problema consiste en decidir si la presencia de la interacci6n debe
o no ser aceptada por el invest igador. Como se di scuti6 en el Capitulo 6, Secd6n 6.9,
ademas de valorar la significaci6n estadfstica de la heterogeneidad observada, para
decidir si la interaccion esta 0 no presente, debe tenerse en Cllenta la magnitud de la
heterogeneidad; as!, OR espedficos por estralOs de 1,4 Y 20,0 rellejan con mayor
probabilidad una verdadera interacci6n que OR de 1,4 Y 2,0. Otros factores que
deberfan ser considerados son si la interacci6n es cuant it ativa (por ejemplo, OR
espedficos por estralO de 1,4 Y 2,0) 0 cualitativa (por ejemplo, OR espedficos de 1,4
Y 0,3) y. 10 que es mas importante, la plausibilidad biologica percibida.
Si se juzga que la interaccion esta presente, el aj uste (por ejemplo, obtener un
odd.\ ratio combinado) no se j ustifi ca, porque en este caso el odds ratio ajustado
no ti ene relevanda, como la tendrfa en el caso de un promedio ponderado de OR
espedficos heterogeneos. Consideremos, el estudio de Rei f et al.(3) citado en el
Capitulo 6. en el que se muestfa ]a e:dstencia de una asociac i6n entre el humo del
tabaco ambiental y el cancer de pulmon en perros de nariz corta (OR = 2,4) yestaba
virt ualmente ausente (OR = 0,9) en perros de nari z larga. La plausibilidad biol6gica
de esta posible interacci6n cualitati va se di scllli6 en la Secci6n 6.1 0.5. Aceptando
que esta interacci6n es real, el aj uste seg(jn fonna del cra.neo (longillld de la nariz)
obviamente no esta justificado, pues li n odd.\ ratio ajustado representa el odd.\ ratio
ponderado promedio de los OR espedficos por estrato de 2,4 y 0,9, 10 cual no ti ene
una interpretacion (jtil .
Otro ejemplo aparece en la Tabla 7.2, donde se resumen los result ados de un
estudi o de casos y controles sobre uso de anticoncepti vos orales como un posible
factor de ri esgo para el infarto de miocardio en mujeres en edad reproductora (4).
Como se mostr6 en la parte superi or de esa tabla, el odds de enfermar entre mu je-
res que usaban anticonceptivos orales se estimo en alrededor de un 70% mas alto
que eI odds entre aquell as que no usaron anticonceptivos orales . La posibilidad de
confusi6n por edad, sin embargo, se considero por los autores del estudio. Puesto
que era conocido que la edad estaba directamente relacionada con el desenlace (ries-
go de infarto de miocardio) e inversamente relacionada con la exposici6n (un uso
incrementado de antic.oncepti vos entre mujeres j6venes), esta podrfa aClUar como un
confusor negativo (vease Capitulo 5 Seccion 5.4.4).
En un analisis estratificado por edad, tambi en mostrado en la Tabla 7.2, salvo en
uno de los estratos los OR estaban mas alejados de 1,0 que el estimado global (crudo),
10 cual confirmaba la expectativa de una confusi6n negat iva (es decir, que la edad lIe-
vaba a una asociad6n cruda estimada en direccion de la nulidad). EI odd,\ ratio ajusta-
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 227
Tabla 7.2
Ejcmplo dc analisis estrat ificado: cstudio dc casos Y cOlltroics sobre el cfcdo
de anticonceptivos oralcs (AO) sobrc illfarto del miocardio cn mujercs
Anallsis Crudo
AO
No AO
Anallsis estratilicado por edad
Edad 25-29
Casas Coolroles
AO 4 62
NoAO 2 224
Edad 35-39
Casas Coolroles
AO 4 26
NoAO 33 330
Edad 45-49
Casos CoolrolQS
AO 6 5
NoAO 93 301
Todos los Casos y Con/roles
Casas Coolroles
OR:o 7.2
OR:ol.5
OR:o 3.9
29

234
AO
135
1.607
1 .742
NoAO
AO
NoAO
OR", 1.7
Edad 30-34
Casas Conlroles
9 33
12 390
Edad 40-44
Casas Conlroles
6 9
65 362
OR ",S.9
OR ",3.7
Fuente: Datos tom ados de S Shapi ro al a/. OralContraceptive Use in Relation to Myocardial lnl arction, Lancet.
Vol 1 , W743747, 101979.
do (vease Seccion 7.3.3) de los cinco OR espedficos por edad en la Ta-
bla 7.2 resulto ser 4,0, mas de dos veees mayor que el estimado cmdo. Como se men-
ciono previamente, hecho impifcito cuando se calcula cualquier promedio, este esti-
mado del odds ratio ajustado requiere del supuesto de que los OR sean homogeneos;
esto es, que las diferencias observadas entre los OR de los estratos son producto de una
variacion aleatoria. En este ejemplo, eI supuesto es probablemente razonable, dados
los pequenos tamanos muestrales en algunas de las celdas y debido a que todos los OR
estan en la misma direccion (indicando ausencia de interacci6n cualitativa; vease
(:;lpfllllo n, Seccitin n 7.1 ). Pm Olr:l p;lrle, ptJ(licr;l ;lrgiifrsc '1uc ctmnli-
tativas de la Tabla 7.2 son demasiado grandes, y por tanto que no procede la estima-
ci6n de un unieo odds ratio promedio (aj ustado) supuestamente representativo de
{odos los estratos de edad. En otras palabras, pudiera objetarse que el efecto parece ser
mas fuerte en mujeres mas j6venes de 35 anos (OR de 72 Y 8.9) que en mujeres mayo-
res (OR que se mueven entre 1,5 Y 3,9) . La aceptacion de esta heterogeneidad de OR
228 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sugiere un enfoquc alternativo consislente en calcular dos OR ajustados por edad: lIno
para mujeres entre 25 y 34 afios - cstoes, el odd.\" ratio promedio aj ustado para los dos
gmpos mas jovenes- y alro para mujeres entre 35 y 49 afios de edad - vale decir, eI
odds ratio promedio ponderado para los Ires grupos mas viejos. (Estos calc ulos produ-
cen valores de OR
MH
ascendentes a 8.3 y 2,7 respect ivamente: vease Secci6n 7.3.3).
Este ejempl o ilustra las vemajas de la estratificaci6n para la evaluaci6n de la pre-
sencia de confusion yl o interacci6n y para decidir clIando el ajuste es apropiado y
como debe ser Il evada adelante. Tambien pennite apreciar lIna situaci6n comlln del
an.i. li sis epidemiol6gico: la exposic i6n de imen!s parece tener efectos heterogeneos
de ac uerdo a cienas agrupaciones de una tercera variable, a veces no considerada a
priori en el analisis de los datos . Dado el gran numero de posibili dades para el agm-
pamiento de vari ables cuando se hace un analisis estratificado y teniendo en cuenta
la variabili dad aleatori a potencial de aparentes efectos subgrupales (Secci6n 6. 10. 1),
este tipo de anal isis, si no se basa en hi p6tesis que de antemano sean biol6gicamente
plausibles, deberfa considerarse exploratorio.
Puesto que los ejempl os previos se ocupaban de los OR, la interacci6n que inte-
resaba en esos casos era la multiplicativa. Sin embargo, ha de tenerse en mente que
si la medida de asociaci6n de interes es el riesgo atribuible (Secci6n 3.2.2), entonces
es la interacci6n aditiva la que debe considerarse (vease Secci6n 6.6), como se dis-
cuti6 en el contexto del metodo directo de aj uste en la Secci6n 7.3 .1.
7.2.1. Estratificaci6n y ajuste: slipuestos
Comparada con el ajuste, la estratificad6n esta virt ualmente (aunque no completamen-
Ie) li bre de supuestos. Solo se requiere el supuesto de que los estratos tienen sentido y
estan adecuadamente definidos . Esto significa que debe haber homogeneidad dentro de
cada uno de ellos. Por ejemplo, para los estratos de la Tabla 7.1 , se supone implfcita-
mente que hay unifonnidad en 10 que concierne a la asociaci6n de genero respecto de la
malaria en cada uno de los dos estratos ocupacionales (los que trabajan fundamen-
lalmente en areas cerradas y aquell os que 10 hacen sobre todo en areas abienas); de
igual manera , en la Tabla 7.2, se supone que la asociaci6n entre anticonceptivos orales y
el infarto de miocardio es homogenea dentro de cada grupo quinquenal de edad. Si este
supuesto no fuera apropiado en cada uno de dichos ejemplos, ot ras categorfas mas
precisameme defi nidas (por ejemplo, categorfas ocupacionales mas especfficas 0 inter-
valos de edad mas refinados, respect ivamente) hubieran tenido que ser seleccionadas
para el analisis estratificado. Este supuesto es equivalente al supuesto de la ausencia de
collfusi6n residual, descri ta mas adelante en este capftulo (Secci6n 7.5).
Para el ajuste, deben hacerse supuestos adic ionales. Tal y como se describe en la
pr6xima secci6n, todas las tecnicas de ajuste se basan en el supuesto de la vali dez de
algun ti po de modelo que resume la asociaci6n entre las vari ables que se
investigan. Ocasionalmente, el modelo estadfstico es simple, como en el caso de los
milodos de ajllste basados ell /a estratijicaci6n. es deci r. el aj uste directo y el indi-
recto (Secciones 7.1 y 7.3.2) 0 el metodo de Mantel-Haenszel (Secci6n 7.3.3). Como
se discuti 6 anteriormente, para el dlcul o de una media (ponderada) de cierto nume-
ro de OR especfficos por estrato, se asume que estos son homogeneos a 10 largo de
los estratos; esto es, que no hay interacci6n (mul ti plicat iva). Estos metodos de ajuste
mas simples, basados en la est ratificacion, son los mas comunmente empleados
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 229
cuando se controla por un numero limitado de confusores potenciales que son cate-
g6ricos 0 que pueden ser categorizados (vease Secci6n 7.3.4). Por otra parte, mode-
los matematicos mas complejos constituyen la base de los procedimientoJ' de ujusfe
mlllfivariunfes basados en los melOdos de regresi6n . Tal y como se describe mas
extensamente en la Secci6n 7.4, estos modelos mas complejos se emplean como
herramienta para la inferencia epi demiol6gica acerca de relaciones entre cierto nu-
mero de factores y una enfermedad, cuando se control an simultaneamente (se ajusta)
por el efecto potencial mente confusor de todos esos factores. Estos metodos de
regresi6n mul ti ple pueden tambien manejar covari ables cont inuas .
En los siguientes parrafos se describen brevemente algunas de las tecnicas mas
frecuentemente empleadas para el aj uste y eI anal isis multivariante de datos epide-
miol6gicos. Las Secciones 7.3 Y 7.4 describen las tecnicas basadas en estrati fi caci6n
y aquell as que se basan en los metodos de regresi6n mul ti ple. Cada una de estas tec-
nicas analfticas se basa en un modelo conceptual y en un modelo matematico; eslO
es algo a 10 que podemos aludir como modelo estadfstico. Las Secciones 7.5 y 7 .6
discuten algunas li mitaciones potenciales del ajuste multi vari ante (confusi6n resi-
dual y sobreajuste) y la secci6n final de este capftulo (Secci6n 7.7) presenta un resu-
men y una mirada global a los usos comunes de las tecnicas de la modelaci6n esta-
dfstica multi vari ada en la practica epidemiol6gica.
73. METODOS DE AJUSTE BASADOS EN LA ESTRATlFlCACION
73.1. Ajuste directo
EI ajusre directo ha sido tradic ionalmente empleado para aj ustar por edad cuando se
comparan tasas de morbilidad y mort alidad entre pafses 0 regiones, 0 entre dife ren-
tes periodos temporales. EI ajuste par edad, sin embargo, dista de ser la unica apl ica-
cion. La popularidad de melOdos estadfsticos matematicamente mas sofi sticados
(tales como aquellos que se presentan en las secciones que siguen) ha li mitado el
empleo del ajuste directo en la investigaci6n epi demiol6gica en arios recientes, pero
el metodo se mantiene como una tecnica inmediata, particularmente li tH para Hustrar
los principios basicos del aj uste estadfstico.
EI metodo directo se descri be en la mayor parte de los li bros introductorios de
epidemiologfa (por ejemplo, Gordis(S)). La Tabla 7.3 bosqueja el procedimiento
cuando 10 que se comparan son tasas de incidencia entre dos gmpos A y 8 (par
ejemplo, expuestos y no expuestos) estratificados de acuerdo a una variable supues-
tamente confusora (estratos desde i = I hasta k) .
*- Et termino ami/isis l/Jullimria/JIe comunmente se emplea en la literatura epidemiol6gica en
contrdste con cl anal isis crudo. que evalua la rclaci6n entre una variable y un desenlace. La mayor
parte de las veces. el termino IIIl1ifil"ariame se utiliza cuando se controla mas de una variable simul
taneamente (en contraste con el aIJ(i/isis bimriado). Sin embargo. este termino tiene por 10 general
un alcance semantico difercnte en el campo de la biocstadistica. donde ami/isis nlll/lil"arianle alude a
las tecnicas de regrcsi6n multiple que inwlucran a mas de una variable dependieflle.
N

Tabla 7.3
Ajuste directo para la comparacion de incidencias (0 en dos grupos de estudio
m
Grupo de estudio A Grupo de estudio B Poblaci6n esl{indar
IS
Presuntll Casas esperado$ Casas esperados

5
variable
confusora No. Casos Incldencla
cuando se usa cuando se usa
r
No I de A
'" B
8 No. Casos Incldencla
(1 ) (2) (3) (4) " (3Y(2) (5) (6) (7) " (sy(S) (8) (9) " (4) x (8) (10)" (7) x (8)
;;-
Z
Estrato 1
" ..
,-,
' ..
W, IAI X W, Is, X W,
"
m
""
,,,
' ..
Estrato 2
".
,-,
'.
"" '"
W, I,., x W,
/""" W
2
" <
'.
Estrato 3
".
,-,
'.
"" '"
'.
W,
I"" " W,
'
m
" W,

Estrato k
" ..
""
'.
""
"',
... W, lAO" W. ",X w 18
z
n

Total N, !(,
"
I W, I [I", ,,W;j I [4.."W.]

, , ,
N, X.
,
>
,
C
n

Incidencia ajustada
is
z
rn
I [I", X W,J

I W,
I [/& x Wi]

I W,
, ,
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 231
I. Para cada estrato de la variable supuestamente confusora, se calcul a la inci-
dencia para los dos gmpos de est udio (columnas 4 y 7).
2. Se ident ifica una poblacion estandar con un numero especffico de individuos
en cada estrato (columna 8) .
3. EI numero eJperado de casos en cada estrato de la poblaci6n estandar se cal-
cul a mediante la multi plicaci6n de las tasas especffi cas por estra{Q observadas
en el grupo de estudio A (columna 9) y en el grupo de est udio 8 (columna 10)
por el numero de su jetos en el estra{Q de la poblacion estandar.
4. Las sumas globales de casos esperados en la poblacion estandar (basadas en las
tasas de A y 8) dividido por el numero {Qtal de individuos en la poblaci6n estan-
dar son las tasas de incidencia ajl/Madas 0 eJtandarizadas; eS{Q es, las tasas de
incidencia que sedan observadas en A y 8 si tales poblaciones tuvieran exacta-
mente la misma distribuci6n de edad que la poblaci6n estandar o. inversamente,
la tasa de incidencia que hubiera sido observada en la poblaci6n estandar si esta
hubiese tenido las tasas esped ficas de los estratos del grupo de estudio A (/* A) 0
las tasas especfficas por estratos del grupo de eSllldio 8 (/ *8) .
Al observar las f6rmul as para el calculo de las tasas aj ustadas result ara obvio que
estas no son mas que prolllelbos pondemdoJ de las tasas especfficas por estratos en
cada gmpo de eSlUdio. donde los correspondientes numeros de suje{Qs en cada uno
de los estratos de la poblacion estandar son empleados en calidad de factores de pon-
deracion. EI hecho de que ambos promedios se computen empleando las mismas
ponderaciones permit e la comparaci6n. Las tasas aj ustadas result antes pueden
entonces ser aprovechadas para calcular tanto el riesgo atribuible aj ustado (RA)
entre los expuestos (para un error estandar de esta estimaci6n, vease el Apendice A,
Secci6n A.6) como el ri esgo relativo (RR):
RA aj ustado = 1* A - /*8
. 1* A
RR aJustado = --
I',
Tal y como se discuti6 en la secti6n previa. el princi pal supuesto implkito en el d l-
culo de riesgos atribuibles 0 riesgos relativos aj ustados obtenidos por ajuste di recto es
que los efecto.\ SOli hOlllogeneos a 10 largo de los estratos de la variable 0 variables confu-
soras: esto es, si se calcula una medida global resumen del efecto a 10 largo de los estratos
de una variable dada, se supone que este promedio es razonablemente representativo de
{odos y cada uno de los estratos involucrados. Una especificacion adicional de este
supuesto se hace necesaria: si la homogeneidad se refiere a una escala absolllla (modelo
aditivo) 0 a una escala relati va (modelo mult iplicativo). Este concepto se ilustra de mane-
ra simplificada por conducto de situaciones hipoteticas como las most radas en las Tablas
7.4 Y 7.5, en las que hay una fuerle confusi6n debida a la edad: esto es, el desenlace es
mas frecuente en personas mayores que en sujetos mas j6venes, y los gmpos en estudio
son complelamenle rliferenles en rebcion con b s rlisrrihllciones segfin erlarl.
En la Tabla 7.4, los riesgos atribuibles son homogeneos a 10 largo de los dos estra-
lOS de edad (RA especffico del estrnto igual a 10%) y ambos son diferentes del riesgo
atribuible cmdo global (20%), hecho que revela un efec{Q de confusi6n por edad.
Puesto que los riesgos atribuibles especfficos por estratos son homogeneos (identicos
en este ejemplo hipotet ico) el promedio ponderado de estas diferencias (es decir, el
232 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.4
Ejcmplo hipotCtieo del ajuste directo cuando las dircrcncias absolutas especfficas
por cstratos (ricsgos atribuibles) SOli homogencas
Edad
(anos)
Grupo de estudio A Grupo de estudlo B
N Casos Tasa ('Yo) N Casos Tasa ('Yo) RA (%) AR
<40
. 40
To!al
100
200
""
20 20
100 50
120 40
Caleulo de estimaciones ajustadas:
400
200
'"
Poblaci6n estandar mas joven
Casos Casos
Edad esperados esperados
40
80
'20
(anos) N con lasas A con lasas 8
<40 500 100 50
. 40
'00
50 40
Total 600
'50
90
Tasas ajusladas (%) 25
"
RA 10 %
RR 1,67
Nota: RA, riesgo atribui ble; RA, riesgo rel ativo
Tabla 7.5
10
40
20
10 2,00
10 1,25
20 2,00
Poblacl6n estandar mas vleja
Casos Casos
esperados esperados
N con lasas A con lasas B
' 00
20 10
500 250 200
600 270 210
45
'5
10 %
1,29
Ejcmplo hipolctico de ajuste dirccto cuando las direrencias relativas espccfl'icas
por estrato (ricsgos rclativos) SOli homogcllcas
Edad
Grupo de estudio A Grupo de estudio B
(arios) N Casos Tasa (%) N Casos Tasa (%) RA (%) RR
<40
@
6 6 400
"
, ,
2,00
. 40 200 60
""
200
" " "
2,00
Total
'00
66 22 600 42 7
"
3, 14
Calculo de estimaciones ajustadas:
Poblaci6n eslandar mas joven Poblacl6n estandar mas vleja
Casos Casos Casos Casos
Edad esperados esperados esperados esperados
(arios) N con tasas A con tasas 8 N con lasas A con lasas 8
<40 500
""
"
@
6
,
. 40
@
""
"
500
' 50
75
Total 600 GO
"
600
'56
78
Tasas ajustadas (%) W 5 26 n
RA 5 % 13 %
RR 2,00 2,00
Nota: RA, riesgo atribuible: RR, riesgo rel ativo
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 233
riesgo atribuible ajustado) no varia con la eleccion de la poblacion estandar (mitad
inferior de la Tabla 7.4). Sin embargo, ello no es cierto cuando se calcula un ri ego rela-
tivo ajustado en este ejemplo: puesto que los riesgos relativos varIan con la edad, el
riesgo relativo ajustado (es decir, el promedio ponderado de los riesgos relativos no
homogeneos segun gmpos espedficos de edad) depende de a cuM estrato se Ie ha dado
mayor peso cuando se eli gi6 la poblaci6n estandar. Por ejemplo. puesto que el riesgo
relativo es mas alto entre los j6venes (2.0) que entre los viejos ( 1,25), el uso de una
poblacion estandar mas joven resulta en un ri esgo relativo ajustado mas alto ( 1,67) que
el que se obtenla cuando se usaba una poblacion estandar mas vieja (I .29).
En concl usion, puesto que los ri esgos atribuibles son homogeneos (es decir, no
hay interacci6n aditiva), es apropiado usar directamente tasas ajustadas con el pro-
p6sito de calcular un riesgo atribuible ajustado por edad. Sin embargo. dada la hete-
rogeneidad de los riesgos relativos por edad, no es apropiado estimar un ri esgo rela-
tivo ajustado por edad en este caso. N6tese que, en esta situaci6n, el riesgo relativo
aj ustado puede variar dependiendo del estandar que se haya elegido. Esto es un
asunto de especial preocupacion en situaciones en las que hay una interaccion fuer-
te, sea cualitativa 0 cuantitati va.
Una situacion opuesta a la que se recoge en la Tabla 7.4 se muestra en la Tabla 7.5 .
En el ejemplo hipotetico contenido en esta tabla, los riesgos relativos espedficos por
est ratos son homogeneos; sin embargo, esto no se cumple para los riesgos atribuibles.
ASI, los riesgos relativos ajustados son identicos, independientemente de cual haya sido
la eleccion de la poblaci6n estandar, pero el valor del riesgo atribuible ajustado estima-
do depende de a cual estrato se Ie haya otorgado mayor peso. Porejemplo.la poblacion
estandar mas vieja produce un riesgo atribuible ajustado mas alto puesto que el riesgo
atribuible es mayor para los mas viejos (15%) que para los mas j6venes (3%) . Como
consecuencia. la heterogeneidad de los ri esgos atribuibles en los estratos especfficos.
puede tornar inadecuado el dlculo de un riesgo atribuible ajustado por edad. Por otra
parte, un riesgo relativo ajustado por edad refleja de manera precisa la homogeneidad
de los efectos multiplicativos por la edad cuando se comparan los gmposA y B.
Otras consideraciones practicas acerca del metodo directo de ajuste se desarro-
llan a continuacion.
Este metodo es empleado para la cOIIIl'aracion de tasas en dos 0 mas gmpos de
estudio; el valor absoluto de una tasa aj ustada no es usualmente el ndcieo del anal i-
sis, puesto que dicho valor depende de la selecci6n de la poblaci6n estandar, la cual
es frecuentemente arbitraria.
Se cuenta con diversas opciones para la eleccion de la poblacion estandar, varias
de las cuales se enumeran y comentan a continuacion:
I. Una poblaci6n enteramente art ificial (por ejemplo, I .000 SlUetos en cada estrato).
2. Uno de los gmpos de estudio. Esto hara los dlculos mas simples y ahorrara
tiempo, ya que las tasas observadas en el grupo elegido seran las de la pobla-
cion eSlandar que es, por defi nici6n, estandarizada>, .
" Cuando uno de los grupos de esludio es particulannenle pequeno debe USaThe como el eslandar.
de manerd tal que se minirniee la variabilidad aleatoria. Esto es dcbido a que euando el grupo mas
pequeno sc ernplea wmo eslandar. no hay nel"Csidad de ernplear sus tas.as especfficas por estrdto. esta-
disticamente iJ\Cslables, pard eslimar los niimeros esperados de eventos. pueslo que su las.a obscrvada
tOlal es la ajuslada. Adernas. las lasas especfficas por edad mas precisas de la olrd poblaci6n (mayor)
produce un niimem de evenlos espcrados mas eSlable y as! una lasa ajuslada lambicn mas precisa.
234 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
3. La suma de las poblaciones 0 grupos en est udio .
4. Una poblacion que puede ser, 0 bien lI na poblacion de referenda, 0 bien lI na
poblaci6n externa, tal como 1a poblacion del estado, de 1a provincia 0 del
pais del que proceden los gmpos objeto de estudio (0 el mundo completo,
cuanda se Irma de comparar vari as palses). Cuando se comparan grupos ocu-
pacionales entre residentes de un area metropoli tana , por ejemplo, serfa razo-
nable seleccionar como el estandar a la poblaci6n trabajadora del area metro-
poli tana total. Aunque esta elecci6n no deja de ser arbitraria, las lasas
aj ustadas result antes seran por 10 menos en alguna medida representat ivas de
las verdaderas lasas del grupo estudiado.
5. La asf Hamada poblacioll est6ndar de variallza minima, la cual prod uce los
estimados ajustados mas estables estadisticamente yes, por tanto, particular-
mente (i ti! cuando los tamanos de muestra son pequenos. Cuando dos grupos
se comparan, usando la misma notac i6n que en la Tabla 7.3, para cada estrato
(i), se calcula la poblacion estandar de minima varianza especffica por estrato
del sigui ente modo:
I Ecuaci6n 7. 11
W, = -,---'----,---
1 1
II Ai X IIlIi
-- +--
nM nlli
Para el ejempl o mostrado en la Tabla 7.4, la poblaci6n estandar de mInima
varianza serla por tanto:
Estrato de edad por debajo de 40 anos :
100 x 400
Poblacion estandar = = 80
100+400
Estrato de edad mayor 0 igual a 40 anos:
Poblacion estandar =
200 x 200
200 + 200
= 100
N6tese que si uno de los gmpos (por ejemplo. poblacion A) es mucho menor que
el otro: esto es, si nAi nlli entonces (l.lnAi)>> (1/IIIIi), y aSI la ecuaci6n 7.1 se reduce a
Wi '" " Ai , ci rcunstancia que otorga respaldo fonnal a la recomendaci6n mencionada
anterionnente consistente en que cuando uno de los gmpos es pequeno. este deberla
ut ili zarse como el estandar .
Aunque, como ya se mencion6, el metodo de aj uste directo ha sido tradicio-
nalmente empleado para reali zar comparaciones, aj ustadas por edad, de tasas
de mortali dad y morbilidad por tiempo 0 lugar, este es un metodo apropiado
para Hevar adelante el aj uste para cualquier variable categ6rica. Tambien puede
usarse para ajustar simult aneamente por mas de una variable (vease eI fonnato
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 235
Tabla 7.6
Ejemplo de formato de tabla para usar el mCtodo dirccto en el ajuste simultaneo
por genero, raza y educaci{m (categ6ricamente definida)
Genero Raza
Educaclon
Estratc
Tasa del grupo Tasa del grupo Pcblaclon estandar
(alios) de estudlc A de estudlo B (ponderaclones)
Hombres Negros <12
. 12 2
Blancos <12 3
. 12 4
Mujeres Negras <12 5
. 12 6
Blancas <12 7
. 12 8
en la Tabla 7.6). Obviamente, la ul tima aplicaci6n estara li mitada si hay dema-
siados estratos y los datos estan dispersos .
EI metodo directo puede ser empleado para ajustar cualqui er tasa 0 proporcion
(mortalidad, tasa de letalidad, incidencia por persona-tiempo, prevalencia) . Pue-
de tambien ser uti l en el contexto de los estudios de casas y controles con la
finalidad de obtener proporciones ajl/stadas de casos expuestos y comroles, que
en su momento podrfan ser empleadas para calcular un odds ratio ajustado.
73.2. Ajuste indirecto
AI igual que el metoda de ajuste directo, el ajuste indirecto ha sido tradic ionalmente
usado para aj ustar datos de mortalidad 0 morbilidad por edad. En el metodo indirecto
de aj uste, particul annente popular en el campo de la epidemiologfa ocupacional, el
nlimero de eventos esperados, (por ejemplo, muert es) en un grupo de estudio (por
ejemplo, una cohorte ocupacional) se calcula mediante la apli caci6n de tasas de
referencia (tasas estanda",) al nli mero de individuos en cada estrato del gmpo 0 gru-
pos de estudio. Para cada gmpo, la rawn del nli mero total de eventos observados res-
pecto del numero esperado (si las tasas en el gmpo de estudio fueran las tasas estan-
da",) nos provee de un estimado del riesgo relativo ajustado por el factor 0 de la razon
de tasas que compara el grulJO de estlldio con la I'oblacion que sirvio como fuellfe
para las rasas lie referencia (Tabla 7.7). Cuando se usa en el contexto de los datos de
mortalidad, esta raz6n es conocida como la ruzon e.l"tandarizada de lIIorrafidad
(REM), con tenninos similares empleados para los datos de morbilidad, tales como
razon de inciliencia eJtandarizada (RIE) y ruzon de I'revalencia (RPE).
EI lI amado metodo indirecto se considera particulannente uti! ya sea cuando
los ri esgos espedficos 0 las tasas espedficas por estrato se desconocen en uno de
los grupos bajo comparacion, 0 cuando los grupos que se estudian son pequefios,
de manera tal que las tasas esped ficas por estrato se consideran demasiado inesta-
bles, dando lugar a nlimeros espcrados que serfan estadfsticamente poco confia-
bles si se empleara el metodo dirccto (columnas 9 y 10 en la Tabla 7.3) .
236 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.7
Ajuste indirccto: Comparacion de la mortalidad obscrvada en ulla poblaci6n
de cstudio con la de una poblaci6n de referenda extcrlla
Variable
presuntamente
confusora
" )
ESlrato 1
ESlrato 2
ESlrato 3
ESlrato Ie
Total
Poblacl6n de estudio A Poblacl6n de referencla
No.
I')
n"
n.
n.
n.
Muertes esperadas
en A sl esla poblacl6n
Muertes Tasa tuviera las tasas de la
observadas de mortalldad poblacl6n de referencia
I')
")
' "
M,
'.
M,
'.
M,
'"
M,
I x ...
REM '"
Raz6n estandarizada de mortalidad
MJertes observadas I )(.;
"'uertes esperadas I 1M, >< "IV]
,
(5) .. (4) ~ (2)
M, ~ n A1
M" n ....
Me, ~ n",
M . ~ nA.
I [ M ~ n .. J
Cuando se ha aplicado un ajuste indirecro, no es apropiado definir la poblaci6n
que ha servido como fuente de las tasas como una pobladon estandar; la razon
es que la verdadera pobladon estandar es realmente el grupo de estudio al que se
aplican las tasas de referenda externas <estandan) . Puesto que el dlculo de las
REM 0 las RIE se basa en la aplicadon de las tasas de la pobladon de referenda a la
distribudon de cada grupo de estudio, cuando se compara /IIlis de IlII grul'o de estu-
dio con fa jile/lte de tm'as de referenda, las REM resultan estar ajustadas por di fe-
rentes estandar (es dedr, los mismos grupos de estudio). Como corolario, la compa-
rad6n de las REM para diferentes gmpos de estudio puede no ser apropiada, como
se ilustra en el ejemplo hipotetico contenido en la Tabla 7.8. En este ejemplo, los dos
grupos de estudio tienen identicas tasas espedficas por edad; sin embargo, puesto
que las di stribudones por edad di fieren, las tasas globales crudas son diferentes
( 18,3% Y 11 ,7%) . La aplicadon de las tasas estandar (de referenda) a cada uno de
estos gmpos de estudio resulta en nlimeros esperados que no son uniformemente
ponderados y, consec uentemente, en diferentes REM (0,42 Y 0,64). Como se di scu-
ti6 en detalle por Annstrong(6J , esta situad6n surge cuando las razones de tasas en
los grlJpos fi e eSflJfiio y en la pohlacirin fie referenda no son homogeneas a 10 largo
de los estratos.
De manera que el uso de las REM para comparar los grupos de estudio, aunque
es una practica relativamente comun en la literatura epidemiol6gica, no siempre es
apropiada. Las REM son adecuadas, obviamente, cuando la comparad6n de interes
es la que se reali za entre cada grupo de estudio y la poblad6n de referenda. N6tese,
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 237
Tabla 7.8
Ejemplo hipotetico de dos grupos de cstudio con idCllticas tasas especificas
por edad pero d istribuciones de edad diferelltes : cl uso del metodo illdirccto
empleando tasas de referenda externas resulta en REM diferelltes
Grupo de estudlo A Grupo de estudi o B
Tasas
Edad
(anos) N defuncl ones tasa N
externas de
defunci ones tasa referencia (%)
. 40
Total
100 10
500 100
600 110
Edad (anos)
<40
. 40
Numero total esperado
REM (obervado/esperado)
" '"
20%
18,3%
""
<00
600
'"
20
70
"'"
, ,."
' 0%
50%
11.7%
N." esperado de defunclones obtenldos
mediante apllcaclon de tasas
de referencia a los grupos A y B
Grupo de estudlo A Grupo de estudi o B
12 % ... 100,,12 12 % ... 500:::60
50% ... 500",250 50% ... 100:::50
,.,
<10
110/262: 0,42 70/110::: 0,64
sin embargo, que cuando las REM se obt ienen solo para un par de pobladones (por
ejemplo, un gmpo ocupadonal frente a la pobladon total del area que sirve como
fuente de tasas estandar, 0 cua[quier gmpo de es{udio frente a la poblad6n de
referenda), los metodos directo e indirecto convergen: en esta sit uadon, el d lculo
de las REM tambien puede ser interpretado como metodo directo, con uno de los
grupos bajo comparadon (ej., un gmpo ocupadonal) sirviendo como poblad6n
estandar (Figura 7.1 ).
Presunta
variable
confusora
Estralo 1
Estralo 2
Estralo 3
Estrato k
Distribucion de la
poblacl on A
veces
Tasas especfficas
por estrato en la poblaclon B
M,
M,
M,
Mk
Figura 7.1. Cuando se comparall solo dos poblacioncs, los metodos dircdo c illdirccto
convergclI . El enfCKjue puede ser considerado como un metodo directo en el cual una de las
poblaciones (A) es la estandar 0 como un metodo indirecto empleando la olra poblaci6n (8)
como la fuente de las tasas de referenda (<<eslandaf).
238 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
7.3.3. Metodo de Mantel-Haenszel para ajustar la estimaci6n de UUlI medida
de asociaci6n
Cuando la medida de asociaci6n de interes es el odds ratio (por ejemplo, euando uno
esta analizando resultados de un estlldio de casos y controles) frecuentemente se
aplica el metodo descrito por Mantel-Haensze({7) para calcular el odds ratio ajustado
global por uno 0 mas confusores potenciales definidos categoricamente. La Tabla
7.9 muestra la notaci6n para la formulaci6n del olids ratio ajuslado de Mantel-
Haenszel para datos estral ificados en k eslratos:
I
O
_
--'----'N"'-, _
RMf.=
I b,c,
N,
10 eual es equivalenle al promedio ponderado de los OR espedficos por estralo*.
Para el error estandar y la eslimaci6n de un intervalo de eonfianza, vease Apendice
A, Seeci6n A.8.
EI dlculo de los OR
MH
se iluslra en los sigui enles ejemplos. En la Tabla 7.1 la
asociaci6n cruda enlre la presencia de malaria y el genero sugeria que los hom-
bres len ian un riesgo mayor de enfermar; sin embargo, euando la asociaci6n se
examino teniendo en cuenta eslratos de ocupaci6n, no se observ6 asociacion con
el genero en ninguna de las calegorias ocupacionales. Ademas de inspeccionar
los OR espedficos por oeupaci6n, se puede ealcular un olfd.\ ratio resumen, que
expresa la asociaci6n ajuslada por oeupaci6n entre genero y ma laria. EI OR
MH
ajuslado (el promedio ponderado de los OR espedfieos por estralo) se calcula de l
modo siguienle:
Tabla 7.9
Notacion para eI cilculo del odds ratio ajustado de Mantel-Haenszel en un estudio
de casos y controles, estratificado de acuerdo a una variable confusora potencial
Estrato I Casos Controles Total
Expueslos
"
0 ,
m"
No expuestos c, d,
m"
Total
n"
n., N,
* N6tese que esta f6rmula es algebraieamente idCntica a la siguiente:
" b,c; x a,{l;
OR
_
-'----" NC,
"" =
I h,c;
; N;
As!. el OR
M
" es un promedio ponder.tdo de los OR espedficos por estr.ttos (OR;) con pesos
iguales a (b;e;l N;).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 239
I
53 x 3 35 x 79
+
OR
MH
=
N, 81 219
= 1,01
I bjCj
10 x 15 52 x 53
+
N, 81 219
N6tese que el estimador del OR,\IH se ubica entre los est imados especffieos por
estrato (1,06 Y 1,00) . Sin embargo, esta mas proximo al estrato ocupacion funda-
mentalmente en espacios eerrados puesto que el tamafio de muestra es mayor en
este estrato, para euyo eomponente la est imaci6n recibe, eonsee uentemente, mas
peSO (bj Cj / M) cuando se ealc ula el promedio aj ustado.
En el ejempl o de la Tabla 7.2, el est imado aj ustado por edad es:
I aid.
4 x 224 9 x 390 4 x 330 6 x 362 6 x 301
+ + + +
N, 292 444 393 442 405
OR
MH
= =
=4,0
I bjci
2 x 62 12 x 33 33 x 26 65 x 9 93 x 5
+ + + +
N, 292 444 393 442 405
EI modelo estadfstico implfcito en el procedimiento de Mantel-Haenszel para el
dlculo de un odds ratio ajustado es que haya homogeneidad de efee(Qs (expresada
por los OR en este caso) a 10 largo de las categorfas de la variable de estratificaci6n.
En otras palabras, se supone que no hay interacci6n multi plicativa entre la exposi-
cion y la variable de estrat ificaci6n (vease Seccion 6.3.1). Especfficamente en el
ejemplo de la Tabla 7.2, euando se calc ula un odds ratio global ajuSlado, se supone
que el odds ratio del infarto de miocardio en relacion al uso de anticonceptivos ora-
les es aproximadamente igual a 4 (el promedio ponderado calculado) para todos los
estratos de edad. Como fue analizado previamente (Secci6n 7.2), en este ejemplo las
diferencias observadas en los valores de los OR especfficos por eslrato sedan una
consec uencia de la variaci6n aleatoria; si la heterogeneidad observada se considera
excesiva, entonces una opcion es calcular OR aj ustados separados por edad para
mujeres mas j6venes y mas viejas (vease Secci6n 7.2), de la manera siguiente:
I ad
4 x 224 9 x 390
+
=
N, 292 444
= 8,3
=
I b,t-i
2 x 62 12 x 33
+
N, 292 444
I all;
4 x 330 6 x 362 6 x 301
+ +
=
,
N, 393 442 405
= 2,7
=
I bjLj
33 x 26 65 x 9 93 x 5
+ +
N, 393 442 405
240 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Razon de tasas ajustada segun Mantel-Haenszel
El metoda de Mantel-Haenszel ha sida extcndido al calculo de una raz6n de tasas
aj ustadas en el contexto de un estudio de cohortes con datos de incidencias basados
en pag 219.
221
). La Tabla 7. 10 muestra el farmata general de los datos
para cada una de las tablas especfficas de los estratos. Basandonos en la nolacion de
esta tabla, el estimado de la razon de tasas aj ustada de Mantel-Haenszel se calcula
como sigue:
I
ali yo;
RRMH =
T,
I
(lo; Y Ii
T,
Un ejempl o de la apl icaci6n de estas f6nnulas se presenta en la Tabla 7.11 , basado
en datos de uno de los ejemplos empleados en el Capit ulo 5 para ilustrar las u!cnicas
para 1a evaluaci6n de la confusi6n (Secci6n 5.3 ('1)) . N6tese que la RRMH estimada que
compara el alto fndice de consumo de vitaminas con el bajo valor que se obtiene
en la Tabla 7.11 es identica a la correspondiente razon de tasa aj ustada seglin habiw de
fumar que fue presentada en la Tabla 5.5 basada en el metodo directo de ajuste.
Metodo de Malltel-Haenszel y el odds ratio para datos de casos
y colltmles emparejados
Tal y como se presema en los textos basicos (por ejemplo, Gordis('!), y como se di s-
cuti6 brevemente en la Secci6n 3.4 .1 , en los estudios de casos y controles empareja-
dos, el odds ratio se calcul a mediant e la division de los nlimeros de pares en los cua-
les el caso esta expuesto y el control no 10 esta por el nli mero de pares en los que el
caso no esta expuesto y el control si 10 esta. En la Tabla 7.12 , cada celda representa
el nlimero de parejas para la categorfa correspondiente definida por la condicion de
caso 0 control y de exposicion. As!, en la Tabla cruzada de 2 x 2 mostrada en ellado
izquierdo, el odds ratio se estima como la raz6n de pares discordantes, b/c . Un ejem-
pl o se puede ver en la parte derecha de la tabla , a partir de una comunicaci6n del
Tabla 7.10
Nolacion para el caleulo de la razon de tasas ajustadas de Mantel-Haenszci
en un estudio prospectivo basado en lasas de incidencia de tiempo-persona
cstratilicadas de acuerdo a una variable confusora potencial
Estrato i Casos Controles
Expueslos
No expuestos
Y.
Total
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 241
Tabla 7.11
Ejemplo para cl caiculo de la razon de lasas ajuslada de Mantel-Haenszel (RR.\lII):
Datos de mortalidad en individuos con indice de consumo de vilamina
CIBetacarotenos alto y bajo segun hiibito de fumar, Estudio de
No lumadores
Fumadores
la Compaiiia de Electricidad del Oesle
[ndlce de Consumo de
Vltamlna C/ Beta- Numero de
carotenos defunclones
Ano 53
Bajo 57
TOlal
Ano 111
Bajo 138
TOlal
I a"yOi
53 4.260
i Ti 9.403
RR .... :0
"
,
8 .. y1i
T, 9.403
Personas
alios
5.143
4.260
9.403
6.233
6.447
12.680
111 6.447

12.680
138 6.233

12.680
Alesgos
relatlvos
por estratos
RR:o 0,77
RR:o 0,83
'" 0,81
Nota: La categoria "moderada_ del indicede consumo de de la Tabla 5.4 se ha omitido PO' simplicidad.
Todas las ra20nes de tasas en la labia comparan los que tienen nivel _aho_ del indice de consumo de vitamina con los
que lienen nivel -ba;O-.
Fuente: DK Pandey at al., Dietary Vi tamin C and !ICarotene and Risk 01 Death in Middle-Aged Men. The Wes
tem Electric Study, American Journal of Epidemiology, Vol 142, 12691278, 1Cl1995, The Johns Hopkins Unive,sity
School of Hygiene & Publi c Health.
Tabla 7.12
Configuration para una tabla 2 x 2 para calcular un odds ratio emparejado y un ejemplo
NOTACION
Controles
Expuestos
Casas Expueslos
No expueSlos
OR emparejado:o
,
,
No expuestos
b
d
EJEMPLO'
Controles
CMV+ CMV-
Casos CMV+ 214 65
42 19
OR emparejado:o :: :0 1,55
Not"; C"d" celd" ,epre3ent" el nume,o P"'" cad" categ<>, i" delinidB 3"9':'n 3e \,ete de un caM> 0 un
conl,oI y sag.:.n nivel de exposici6n .
los casos ,epresentan individuos con a,terOoesclerosis carolidea delinida por el ultrasonido modo B; los con-
troles son individuos sin arterioescierosis individual mente emparejados con los casos por grupo de edad, sexo.
etnia, centro y fecha de examen. La situaci6n rob,e la infecci6n por cytomegalovirus (eMil} se define de acue,do a
la presencia 0 ausencia de anticuerpos sericos IgG.
Fuente: PD Sorlie al al., CytomegalovirusJHerpesvirus and Carotid Atherosclerosis: The ARIC Study. Journal of
Medical Virology, Vol 42. J3-37,1Cl1994. John Wiley & Sons.
242 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Est udio de Riesgo de Arteriosclerosis en Comunidades (ARIC) sabre 1a asociaci6n
entre la infecci6n cr6nica por citomegalovirus (CMV) y la arterioesclerosis carotf-
dea (medida a (raves delultrasonido modo B) (IO) . En este estudio, los casas de artc-
rioesclerosis y los controles fueron individualmente emparejados por edad, sexo,
etnia, centro y fecha del examen; el odds ratio pareado (es decir, el odds ratio con-
trolando por todas las vari ables de emparejamiento) se estima como 65/42 = 1,55.
La base radonal para la estimaci6n del odd,\" ratio como la raz6n de pares discordan-
tes en un est udio de casas y controles emparejados es faci lmente captada mediante
1a aplicacion del metoda de Mantel-Haenszel para promediar OR estrat ificados.
Los datos de la Tabla 7.1 2 pueden ser reorganizados como se aprecia en la
Tabla 7.1 3, donde cada uno de los 340 pares en este estudio es ahora un estrato
con un {amano n = 2. Las result antes 340 {ablas de 2 x 2 puede ser organizadas
como se ve en la Tabla 7.1 3 puesto que los pares pueden ser solo de I de los 4
posibles tipos (cada una de las celdas de la Tabla 7.1 2): Por ejemplo, para el pri-
mer tipo de par, en el cual tanto el caso como el control son CMV+ (celda a en
el panel de la izquierda de la Tabla 7.12), habrfa un total de 2 14 {ablas identicas;
para el segundo ti po (la celda b, discordante, con caso expuesto y control no
expuesto) habrfa 65 tablas; y asf sucesivamente. En las dos ultimas columnas de la
Tabla 7. 13, se indica la contribuci6n al numerador y al denominador del OR
MH
de
cada uno de los 340 pares.
Tabla 7.13
Calculo del odds ratio emparej ado para los datos de la Tabla 7.12, basado en el enroque
de cstimacion de Mantel-Haenszel
Contrlbuclon
de cada par
aIOA"H
N.ode
Numerador Oenominador
Cuatro t lpos pares en la
( ' ~ d) ( b ~ ' )
posibles de pares E,. Casos Controles Tabla 7.12
Tipo 1 Concordante

0 0 2 a::: 214 0 0
Tipo 2 Oiscordante

0
0 2 b",65
'I,
0
Tipo 3 Oiscordante

0
0 2 C:: 42 0 'I,
Tipo 4 Concordante

0 0
2 d ~ 1 9 0 0
(214xO}+(65><1I2)+(42xO)+(19xO) 65><112 65 b
OR""", :: ""
(21 4 x O) + (65 >< O) + (42 x 112) + (19 x 0) 42>< 112 42 C
Nota: Exp, estalus de exposici6n.
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 243
N6tese que la cont ri buci6n (tanto al numerador como al denominador) de todos los
estratos basados en pares concordantes es siempre D. mientras que los pares discordantes
contribuyen al numerador (pares tipo b) 0 al denominador (pares tipo C). Todas
estas contribuciones. que son siempre 112 - esto es, ( Ix I) I 2- se cancelan. con el ver-
dadero ntl mero de pares discordantes en el numerador y en el denominador resultando
en la bien conocida fonnula OR
MH
= ble. Asf. esta f6nnula representa Ill! promedio pan
derado de los OR para (Jaros esrrmijicados (empleando eI enfoque de ponderaci6n de
ManrelHaellszel) (Jande los estrarw' se definen sabre la base de pares emparejado.L
73A. Limitaciones del ajuste con metodos basados en la estratifi caci6n
Las tecnicas descritas en las secciones previas (aj uste directo e indirecto. odd.\ rario
de Mantel-Haenszel 0 raz6n de tasas) pueden utilizarse para el au<i li sis mul tivari an-
te; esto es, para controlar simult aneamente mas de una covariable. Esto puede hacer-
se simplemente mediante la constmcci6n de estratos configurados sobre la base de
todas las posibles combinaciones de las variables de aj uste (por ejemplo, vease
Tabla 7.6) . Estos metodos basados en la estratificaci6n, sin embargo, tienen li mita-
ciones practicas para el ajuste mult ivariante:
I . Aunque puedan ser empleados para ajustar varias covariables simult aneamen-
te, el ajuste se lleva adelante solo para la asociaci6n entre una variable inde-
pendiente y un desenlace a la misma vez. Por ejemplo, para evaluar la aso-
ciaci6n de los anticonceptivos orales con el infarto de miocardio mientras se
controla por edad y nive! educacional serfa necesario crear tablas 2 x 2 para
los anticonceptivos orales frente al infarto de miocardio para cada uno de los
estratos resul tantes de combinar la edad y el nivel educaciona!. Sin embargo.
si la exposici6n de interes es el nivel educacional y las covariables para las
cuales ha de hacerse un ajuste son la edad y el uso de los anticonceptivos ora-
les. un nuevo conj unto de tablas 2 x 2 han de crearse (que representan la edu-
caci6n frente a infarto de miocardio para cada estrato definido por las catego-
rfas de edad y empleo de anticonceptivos orales).
2. Estos metodos permiten el ajuste solo para covariables categ6ricas (por ejem-
plo, genero); las continuas deben ser categorizadas, tal como 10
fue la edad en el ejempl o de la Tabla 7.2. Las diferencias residuales dentro de
estas categorfas definidas de manera mas 0 menos arbitraria pueden prod ucir
una confusi6n residual (Secci6n 7.5 Y Capitulo 5, Secci6n 5.4.3) .
3. Finalmente, los datos se toman dispersos cuando los estratos son demasiado
numerosos . Para eI metodo directo, por ejemplo, si el tamano muestral de un
estrato dado es 0, no esta ninguna tasa espedfica por estratos para
la aplicaci6n a la poblaci6n estandar en ese estrato; en tal caso, la tasa ajusta-
da no se puede calcular.
As\, en la practica, los metodos de estratificaci6n se li mitan usual mente al ajuste
simult aneo por unas pocas variables confusoras categ6ricas (por 10 general una 0
dos), con un pequeno numero de categorfas en cada cua!. Cuando se necesita un
aj uste simultaneo por covariables mUlt iples (incl uyendo variables continuas), 10 que
tfpicamente se aplica son los metodos basados en las tecnicas de regresi6n mul ti ple.
244 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.4. TECNICAS DE REGRESION MULTIPLE PARA EL AJUSTE
Las tecnicas de regresi6n multi ple son mas adecuadas para encarar las dificultades
relacionadas con la aplicaci6n de las lecnicas mas simples que se di sc lI tieron hasta
ahara, ya que permit en el examen de los cfcctos de todas las variables de exposici6n
de manera recfproca y simult anea ajustando para todas las otras variables en el
modelo. Ademas, JX:nniten ajustar por covariables continuas, y, dentro de Ifmites
razonables, son generalmeme mas eficientes que los metodos basados en la estratifi -
cadDn para el uso de datos dispersos. Ali n mas. ademas de ser empleadas para el
aj uste mult ivariante, las lecnicas de regresi6n multiple son lit il es con vistas a la pre-
diccion - esto es, para estimar el valor de cierto desenlace como una funci6n de
valores de variables independientes especificadas, tal como en el caso de la ecuaci6n
de prediccion de ri esgo coronari o desarroll ada en el esmdio de Framingham a traves
de la regresi6n 10gistica(ll) (vease Seccion 7.4.3).
Las Secciones que siguen describen cuatro de los modelos de regresi6n mas fre-
cuentemente empleados para el aj uste multi variante en epidemiologla: I) La regre-
sion li neaL empleada cuando el desenlace es una variable continua (por ejemplo,
tension arterial); 2) La regresi6n loglstica, preferentemente empleada cuando el
desenlace es categorico (incidencia acumulada, prevalencia); 3) Modelo de riesgos
proporcionales (Cox), empleado en analisis de supervivencia; 4) Regresion de Pois-
son, usada cuando el desenlace de interes es una tasa de incidencia (basada en perso-
nas ti empo). La di scusi6n detallada de estas tecnicas desborda el alcance de este
capitulo; por ello se sugiere al lector que acuda a textos de estadlstica generales (por
ejemplo, Armitage y Berry(l 2)) y a las referencias especfficas que se dan en cada una
de las secciones. En su lugar, la discusi6n se centrara en aspectos aplicados de la
regresi6n mUltiple.
A pesar de sus diferentes aplicaciones, e incluso aunque solo uno de los mode-
los esta especfficamente definido como li nea l, la medula de todas las tecnicas
de regresion discut idas en este capitulo es una funcion li nea l. Ell o puede apre-
ciarse claramente en la Tabla 7.14 en la cual la parte derecha de todos los mode-
los es exac tamente la misma (b
o
+ h,x, + blX2 + ... + bkXk): ella explica por que
son colectivamente abarcados por la expresion lIIodelo lineal general. N6tese que
los modelos listados en la tabla difi eren solo en relaci6n con el tipo de variable
dependiente (0 desenlace) posrul ada para ser re lacionada con los predictores de
manera li neaL Consec uentemente, y como se subraya en las secciones que
siguen, la interpretacion de los coeficientes de regresion multiple es similar para
todos esos modelos, variando solamente en dependencia de la variable de res-
puesta .
En la proxima seccion se revisa el concepto de regresi6n lineal en el contexto de
la situaci6n mas simple: cuando esta involucrada solo una variable predictora (una
x) . Las cuatro secciones sigui entes se destinan a examinar brevemente los rasgos
basicos de los modelos de regresion listados en la Tabla 7.1 4. Finalmente, las Sec-
ciones 7.4.6, 7.4.7 Y 7.4.8 cubren aspectos concerni entes a la aplicaci6n de estos
modelos en estudios emparejados y anidados y en situaciones en las que el modelo
<<li neal no es razonable, asi como aspectos relacionados con la inferencia estadist i-
ca basada en los estimados de los padmetros.
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 245
Tabla 7.14
Modelos de regresion multiple e interpretacion de los coeficientes de regresion
Lineal
Logistico
Poisson
Modelo
log (odds) '" Do.;. b, x, .;. b,x .;. ... .;. b,x,
log (riesgo instantaneo) '"
be,.;. 1>,x, .;. b,x, .;. ... .;. b,x,
log (tasas) '"
be,.;. 1>,x, .;. b,x, .;. ... .;. boX,
7 A.1. Regresion lineal: Conceptos generales
Interpretacion de 1>,
Incremento en el resultado del valor
medio de y (variable continua) por
unidad de incremento en x" ajustado
por todas las otras variables en
el modelo.
Incremento en el109 odds por unidad
de incremento en x" ajustado por
todas las otras variables en el modelo.
Incremento en el109 riesgo instantaneo
del resultado por unidad de incremento
en x" ajustado por todas las otras
variables en el modelo.
Incremento en el109 de la tasa del
resultado por unidad de incremento
en x" ajustado por todas las otras
variables en el modelo.
La regresion lineal simple es una lecnica estadfstica usual mente empleada para eva-
luar la entre oos cont inuas I.a Figura 72. por ejemplo, mlles-
Ira la ubicaci6n en un sistema de ejes de valores transversales de tensi6n arterial
sist6lica (TAS) y el grosor de la capa intima-media de la car6tida (G1M) , una medi-
da de arteri oesclerosis obtenida mediante el ultrasonido modo B. en un subconjun-
to de 1.410 participantes del eswdio ARion). Cada punto en el diagrama de disper-
sion representa a un indi viduo con su correspondiente TAS y GIM en la abscisa y en
la ordenada, respeclivamente. Puede apreciarse que, aunque se trata de una nube de
puntos muy amplia, hay ciena tendencia a que los valores de GIM sean mas alt os
cuando la TAS es tambien mas alta, y viceversa. Este patron permite la evaluaci6n
acerca de si la TAS y el GIM estan linealmente asociados . La hip6tesis que conside-
ra que hay una posible asociaci6n lineal entre estas dos variables continuas puede
expresarse a (raVeS de las sigui entes preguntas:
1. (, Esta asociado el incremento medio de los niveles de GIM con un incremento
dado en los valores de TAS aproximadamente constante a 10 largo del recorri-
do completo de los valores de TAS?
2. (, Puede suponerse que la asociaci6n entre la TAS y el GIM sigue un patron de
lfnea recta (//Ior/plo onnne la nllhe oe alreoeoor oe la lfnea
es solo consec uencia del error aleatorio?
Ademas de la inspeccion visual de la nube de puntos (por ejemplo, Figura 7.2), la
evaluacion de si la relacion entre las dos variables continuas (por ejemplo, TAS y
GIM) es 0 no estadfsticamellfe compatible con una Ifnea recta perfecta puede reali -
246 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
2.00
,
,
1.75
,
,
1.50 "
,
"
,

"
1.25
E
E
1.00
~
B
0.75
,
0.50
0.25
0.00
0 20 40 60 80 100 120 140 160 180 200
TAS (mm)
Fi gura 7.2. Rcl acion entre tension artt ri al sist6li ca (TAS) y grosor de la capa intima
medi a de la car6tida (GIM) en UII subconj unto de participantes en cI cstudio ARIC
zarse por conducto del coeficiente de correlaci6n lineal de Pear.wn (r) (vease, por
ejemplo. Armitage y Berry( 12 p 163 _ 16S), aSI como una aplicacion en el Capitulo 8, Sec-
cion 8.4.2) . Los valores del coeficienle de correlaci6n se mueven en el recorrido que
va desde - 1,0 (c uando hay una correlaci6n negat iva perfecta, es decir, cuando (odos
los puntas fannan LIlia lfnea recta perfecta, con una pendiente negat iva) hasta + 1,0
(cuanda hay LIlia correlaci6n positiva perfecta, es decir, cuando los puntos fonnan
una Ifnea recta con una pendiente positiva). Un valor de 0 indica que no hay correla-
cion lineal al guna. En el ejemplo de I .. Figura 7.2, el valor del coeficiente de correla-
cion de Pearson es 021, al que corresponde un valor de P igual a 0,0001. Este
pequeno valor de P del ejemplo sugiere que hay algun tipo de correlacion lineal
entre TAS y GIM probablemente no explicable por el azar, incluso aunque la magni-
tud de este coeficiente implica que la correlaci6n es solamente moderada. Tal con-
clusion se ajusta con la vision grafica que muestra la Figura 7.2: aunque hay una
tendencia a que los valores mayores de TAS se asocien con valores mayores de
GIM, tambi en hay una dispersi6n sustancial de los valores alrededor de esta hipote-
tica relacion lineal.
N6tese que el valor del coeficiente de correlaci6n no contiene informacion acerca
de la fuerza de la asociaci6n entre las dos variables; tal magnitud esta representada
por la pendiente de Ia linea hipotetica, la cual infonna la magnitud del incremento
esperado del valor del GIM por cada unidad de incremento en la TAS. Para estimar
la fuerza de la asociaci6n lineal, es necesario hall ar la formula para la linea de regre-
sion que mejor se ajuste a los datos observados. En general, esta Ifnea puede ser
expresada en terminos de dos parametros ([30 y 13 1) los cuales relacionan el valor
medio (esperado) de la variable dependiente (convencionalmente denotado como
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 247
E(y) Y ubicada en la ordenada del sistema de ejes) como una funci6n de la variable
pruJicrora 0 il/dependiellte (convencionalmente deno{ada como x, en las abscisas).
La f6rmula general de la linea de regresi6n es:
(a part ir de este punto, E(y)>> se denota como y" para simpli ficar la notacion) .
La Figura 7.3 muestra la representaci6n gra.fica de esta linea de regresi6n gene-
ral. Una inspeccion de esta f6rmula y de la figura pennite una comprensi6n inmedia-
(a de la interpretacion que corresponde a cada uno de los dos parame{ros Iio y 11 1:
es el intercepto que es el valor estimado de y cuando x es igual O .
es el coejiciellte de que es el incremento estimado en la variable
dependiente (y) por unidad de incremento en la variable predictora (x) . As!,
cuando x = I, entonces y = + para x = 2, Y = f30 + Y as! sucesivamen-
te o Este coeficiente de regresion, desde el punto de vista geome{rico, es la pen-
diente de la Ifnea de regresi6n y relleja lafilerza de la asoc iacion entre las dos
variables, eS(Q es, cuanto incremento (0 disminucion, si se (rmara de una Ifnea
descendente) cabe esperar que se produzca en y en la medida que x crece.
N6tese que el valor absoluto de 13 1 depende de las unidades de medici6n tanto
dex como de y .
Una vez que se formul a el modelo eJtadfstico, la pregunta pr:ktica es c6mo est i-
mar la linea de regresion que mejor se aj uste a un conjunto de da(Qs, tales como los
de la Figura 7.2. (En la regresi6n lineal, el procedimiento convencional para est imar
los coeficientes de regresi6n L 0 J es el metodo de minimoJ
Este cOllsiste ell hallar los valores de los parametros que mi ll imizall la suma de cua-
drados de las distancias verticales entre cada uno de los puntos observados y la linea.
y
" J
o
'.
. '
1 Unidad
Figura 7.3. Represcntacion gnlfica y matematica de un modclo lincal
248 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Para obtener dctalles acerca de los metodos que permiten estimar la regresi6n li neal,
vease un tcxto de estadfstica general tal como el de Annitage y Berry(1 2) 0 el de
Kl einbaum et al ( l ~ ) 0, uno al ga mas especiali zado, como el de Draper y Smith(lS).)
Por ejemplo, la Figura 7.4 mucstra la linea de regresi6n que mejor se ajusta a los
datos observados que fueron recogidos en la Figura 7.2. La notaci6n tradicional-
mente usada para representar la Ifnea de regresi6n estimada es como sigue:
Esto es: los sfmbolos de los parametros denotados por la letra griega beta se reem-
plazan par la let ra b para dejar claro que se trata de eJ"rill/aciolles . El Icnnino de error,
e, represema la diferencia entre cada valor observado de y, y el correspondiente valor
predicho por el modelo (por ejemplo, la distancia vertical entre cada punto de la nube
de la Figura 7.4 Y el valor de y en la linea). (Por razones de simplicidad, el tennino del
error sera omitido en el resto de este Capitulo) . Regresando a la Figura 7 .4, la f6rmula
mat ematica para la estimaci6n de la Ifnea de regresi6n mostrada en la fi gura es:
I Ecuaci6n 7.21
GiM (mm) =0,4533 + 0,0025 x TAS (mm Hg)
El valor del intercepto (0,4533 mi limetros, en este ejemplo) es puramente te6ri-
co; carece de toda relevancia biol6gica en este caso. Corresponde al GIM estimado
cuando la TAS es igual a O. Esto es: cuando la ec uaci 6n de arriba se reduce a GIM
(mm) = 0,4533. EI hecho de que el intercepto carezca biol6gicamente de significado
es (fpico en muchas aplicaciones de la regresi6n lineal en la invest igaci6n biomedica
2.00


1.75


1.50
. ~



1.25
E
.s 1.00

~
"
0.75


0.50
0.25
0.00
0 20 40 60 80 100 120 140 160 180 200
TAS (mm Hg)
Figura 7.4. Linea de regrcsion que mejor se aj usta a los datos (estimacion por minimos
cuadrados) para la nube de puntos de la Figura 72 (vease texto)
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 249
puesto que el valor 0 para muchas variables no es biologicamente posible 0 no tiene
relevancia pract ica. Esto se ilustra en la Figura 7.4 Y se reneja esquematicamente en
la Figura 7 .5.la cual muestra como el valor del intercepto es una mera extrapolaci6n
de la linea de regresi6n para alcanzar la ordenada (eje y), mas ali a del recorrido de
valores biol6gicamente plausibles' .
EI valor del coeficiente de regresion es mas relevante en la mayorfa de las cir-
cunstancias en que se emplea regresion li neal. En el ejemplo de arriba, el estimado
del coeficiente de regresion para la TAS implica que, en estos datos transversales, un
incremento de la TAS ascendente a un mm Hg se asocia con un incremento prome-
dio de 0,0025 mm en el GiM. Este coeficiente de regresion es la pendiente de la
Ifnea en la Figura 7.4, la cual expresa lajilCrzu de la asociacion entre TAS y GIM, en
contraste con el coeficiente de correlaci6n, el cual s610 comunica el grado en el cual
el conj unto de datos cuant itat ivos se ajusta a la linea recta.
GIM (mm)
Recomdo de
1.20
1.00
0.80
0.6()
0.40
0.20
o
val ores biologicamente
plansibles
.... -_ .. -.-.-.. --
Valores .,/ .. -.-.-.. -_ ...

Extrapolaci6n de la recta
b
o
de regresi6n
20 40
6()
80 100
lAS (mm Hg)
\
.
_.-.-., -
Recla de regrasi6n
e:o;timada
120 140 160 180
Fi gura 7.5. Dat os obser vados y ext rapolaci6n de la linea de regresi6n hacia el ej e de
ordcnadas (intcreepto)
* EI valor que tiene el intereepto es crucial si 101 intenci6n del investigador es emplear los resul
tados de rcgresi6n para predecir el valor espcrddo de 101 variable depcndiente. dadas ciertas carOle
teristicas . Para resolver la ecuaci6n. se nccesita usar los valores de todos los cocficientes, induyendo
el intercepto (vease el ejemplo en el contexto de 101 regrcsi6n logistica en la Secci6n 7.4.3).
Una via pard mejorM 101 intelJlrctaci6n del intel'l"Cpto consiste en hal"Cr trdnsfomlaciones de las varia
bles continU,l\ originales en 101 regresi6n . Por ejemplo. 101 media de tension sanguinea sist61i ca pudierd
sustrdersc de 101 tensi6n arterial de cada individuo en 101 poblaci6n de estudio de 101 Figurd 7.4. Esta nueva
variable (es decir. la diferencia entre 101 presi6n arterial de cada individuo y !a media) podrfa entonces ser
empleada en 101 regrcsi6n. en lugar del verdadero V"dlor de tensi6n arterial. En este caso. a pcsar de que el
interl"Cpto continua estando definido como el valor estimado del GIM pard un individuo con un valor
nulo pard la variable indepcndiente (x). este puede ser interpretado como el V"dlor de GIM que cOlTCspon
deria a un individuo wn 101 tensi6n sanguinea promedio igual a la de 101 poblaci6n de estudio.
250 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EI modelo arriba comentado parte del supuesto de que el incremento es lineal:
esto es, que el incremento en GIM como una fllncion del incremento de la TAS es
constante. Este supucsto es(a implfcito, obviamente, en el hecho de que se informa
un unico coeficiente de regresion en la ecuaci6n (incremento de 0,0025 mm en GIM
por carla mm Hg de incremento en la TAS), el ella] supucstamente se aplica al reco-
rrido complcto de valores de la TAS. Si este simple modelo es 0 no apropiado
depended de las circ lI nstancias particulares, como se discute mas dctall adamentc en
la Secci6n 7.4.7.
Otro importante aspec!O, cuando se interpreta la pendiente (coeficiente de
regresi6n) de lIna fll nci6n de regresi6n, es la unidad de medida a la que este corres-
ponde. Por ejemplo, puede expresarse como eI incremento en GIM por 5 mm Hg de
incremento de la TAS, mejor que por un mm Hg, 10 cual serfa entonces traducido
como un valor de 5 x 0,0025 = 0,0 125 mm en este ejemplo. Es diffci l exagerar la
importancia que tiene la especificacion de las unidades en que se expresan las varia-
bles x e y cuando se comunica e interpreta la magnitud del coeficiente de regresion
(pendiente) para todos los modelos de regresion (Tabla 7. 14) .
Es imponante recordar, sin embargo, que la comparacion de la fuerza de la aso-
ciacion entre diferentes variables (particularmente variables cont inuas) basada en el
tamano de los coeficientes de regresi6n debe ser, por 10 general, evitada. Esto se
relaciona con el problema general que entrana la comparaci6n de la intensidad de las
asociaciones entre diferentes variables que ya fue discutido en el Capftulo 3 (Sec-
cion 3.5) . Una disc usion adic ional del problema se presenta en el Capitulo 9, Sec-
cion 9.3.4.
El coeficiente de regresion (bd est ima el incremento promedio en la variable
dependiente (por ejemplo, Gl M), por unidad de incremento en la independiente
(por ejemplo. TAS) y. como cualqui er otra estimacion estadfstica. esta suje(a a la
incenidumbre y al error aleatorio. Es imponante, por tanto, estimar el error estan-
dar del coefi ciente de regresion para evaluar su significacion es(adfsrica y calc ul ar
los Ifmites de confianza en torno a la estimacion puntual (veanse Seccion 7.4.8 Y
Apendice A) . El est imado del error estandar es facil de obtener por conducto de la
mayorfa de los paquetes estadfsticos que tratan la regresion lineal; para el coefi-
ciente de regresion de b
l
=0,0025 en el ejemplo, el error estandar se est imo como
ES(b
1
) = 0,00032.
Tanto la lfnea de la Figura 7.4 como la correspondiente formul a matematica
(Ecuacion 7.2) pueden entenderse como una manera de resumir datos (una especie
de caricatura) que intenta capturar su esencia a la vez que evita detall es innecesa-
rios y abmmadores sujetos a variabilidad aleatoria y a error de medicion (vease Sec-
cion 7.7) . El atract ivo del modelo propuesto en el ejemplo - que la relaci6n entre
TAS y GIM es lineal- radica en su simplicidad y en el hecho de que el coeficiente
de regresion tiene una interpretacion muy simple e inmediata: es la pendiente de la
funci6n de regresion, 0 el incremento promedio en GIM (en mm) por cada milfmetro
de Hg de incremento en la TAS . Sin embargo, este modelo puede no ser apropiado, 0
bien no ser el que mejor describe los datos . Es. par ejemplo. posible que parametros
adicionales que describan una relacion mas compleja (por ejemplo, una curva)
pudieran describir los datos mucho mejor. Adic ionar nuevos parametros al modelo
(por ejemplo, un tennino cuadratico) podrfa adicionar capacidad a la prediccion -
por ejemplo, al tomar en consideraci6n relaciones curvilfneas (vease Seccion 7.4.7).
Sin embargo. frecuentemente esto da lugar a una interpretacion mas compleja de los
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 251
coeficientes de regresion. Usualmente hay un compromiso entre la simplic idad
(interpretabilidad) y la complej idad (poder predict ivo, ajuste estadfstico) en cual-
quier modelo estadfstico. En la ultima secci6n de este capftulo (Seccion 7.7) se dis-
cuten brevemente varios aspectos conceptuales relacionados con el arte y la ciencia
de la modelaci6n estadfstica.
Un ejempl o adicional del uso de la regresi6n li neal 10 ofrecen los anali sis ecolo-
gicos discut idos en el Capit ulo I. La Figura 1.1 0 muestra las tasas de mortalidad por
enfermedad corona ria en hombres procedentes de 16 cohortes incl uidas en el est udio
de 7 pafses frente a un est imado del consumo medio de grasas en cada shi o est udia-
do('6). La figura tambien muestra el valor del coeficiente de correlaci6n (r = 0,84), el
cual indica en que medida la nube de puntos se aj usta a una Ifnea recta; la ecuaci6n
de regresion correspondiente es:
y= - 83+(25,l x x)
donde y es la tasa de mortali dad coronaria en 10 afios (por 10.000) y x es el porcen-
taje de calorfas procedentes de grasas en la dieta. Las est imaciones de la regresi6n
pueden ser interpretadas del modo sigui ente:
EI intercepto (-83) carece basicamente de significado 0 posibilidad de interpre-
taci6n en la vida real, puesto que el representa la tasa te6rica en un pafs don-
de no hay consumo alguno de grasa. Su valor negat ivo pone de manifiesto el
caracter meramente te6rico de su posible interpretacion .
EI coeficiente de regresion (25,1) representa el incremento promedio estimado
en la tasa de mortali dad por enfermedad coronaria en 10 afios (por 10.000) aso-
ciada con un I % de incremento en la proporci6n de calorfas que provienen de
la grasa en la dieta. En otras palabras, de ac uerdo con este modelo, un in-
cremento de I % en la proporc ion de calorfas procedentes de las grasas se rela-
ciona con un incremento de 0,00251 (0 2,s1 por 1.000) en la mortali dad coro-
naria en diez afios . (Obviamente, cualquier inferencia causal generada a part ir
de datos como estos debe tener en consideracion la posibilidad de la falacia
ecologica). Como en el ejemplo precedente, el modelo anterior tambien supone
que el incremento es lineal: es decir, que el aumento en la mortali dad como
funci6n del incremento de grasa en la dieta es constante, de manera que es tan
dafiino que el nivel de grasa en la dieta cambie del 10% al I I % como 10 serfa
un cambio del 40% al 4 1 %. Por otra parte, una inspeccion cuidadosa de los
datos de la figura sugiere que el incremento en la mortali dad pudiera ser no
lineal; es deci r, que la relaci6n pudiera ser curvilfnea, con un incremento mas
agudo en la mortali dad para niveles mas alt os de consumo de grasas en la dieta
que para niveles mas bajos. Para examinar esta hip6tesis alternat iva, serfa nece-
sario probar modelos no lineales mediante la inclusi6n de terminos cuadraticos
o variables dummy (vease Seccion 7.4.7).
Escapa al alcance de este texto di scutir propiedades estadfsticas y supuestos
relacionados con el uso de la regresion lineal. Disc usiones detall adas de estos t6pi-
cos pueden hall arse en li bros de texto acerca de estadfstica general (por ejemplo,
Armitage y Berry (1 2) , asf como en li bros mas especializados (por ejemplo, Draper y
Smith('S)) .
252 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.4.2. Regresi6n lineal multiple
La extensi6n del modelo de regresi6n lineal si mple (vease scedan previa) a lIna situa-
ci6n multivariada se basa en el Hamada modelo de regresion lineal III/illiple . Los
modelos de regresi6n lineal multiple son tfpicamente empleados para los ajustes cuan-
do la variable que mide el desenlace (Ia y 0 variable dependiente) es continua , aunquc
una aplicacion para desenlaces binarim se di sclI te brevemente al final de esta secci6n.
La cuesti6n es si una variable dada (XI) esta linea/mente asociada con el resultado (y)
despues de haber controlado cicrto numcro de covariables (por ejemplo. x, y x,) . EI
correspondiente modelo de regresi6n lineal se escribe del modo siguiente:
y = o + l X I + !l2X2 + fhx3
Los factores de riesgo conjetufados (las x 0 variabl es independientes) pueden ser
tanto continuos como categ6ricos (por ejemplo, dicot6micos), como OCUfre en el
ejemplo que se muestra debajo. Las variables categ6ricas pueden tener multiples
niveles, que pueden ser tratados como ordinales 0 transfonnados en un conjunto de
variables binarias (indicadoras) (vease Secci6n 7.4.7).
Consideremos un ejemplo del uso de regresi6n li neal multi ple. Puede ser de inte-
res conocer si la presi6n sangufnea sist6lica (TAS) esta linealmente asociada con el
GIM (entendida esta variable como una posible indicaci6n de la presencia de arte-
rioesclerosis) as! como si dicha asociaci6n es independiente de la edad, el genero y
el peso corporal. En la Tabla 7. 15 se presentan los resultados de una serie de analisis
de regresion multiple para responder esta pregunta usando el subconj unto de indivi-
duos del estudio ARIC que fue empleado en el ejemplo de la secci6n precedente(Il).
El primer modelo se basa en el mismo ejemplo discmido anteri ormente e incl uye
solo TAS como variable independiente (Figura 7.4 y Ecuaci6n 7.2) . El modelo 2 adi-
ciona la variable edad y puede escribirse del modo siguiente:
GIM (mm) = i30 + 13 1 x TAS(mmHg) + f32 x edad (anos)
Tabla 7.15
Amlli sis de regresion lineal multiple de la asociacion transvcrsal entre
tension arterial sistolica y GIM en un subconjunto de participantes
de la cohorte del condado Washington del Estudio de Riesgo
de Arteriosclerosis en Comunidades (ARIe) ,
edades de 45 a 64 anos, 1987 a 1989
Coeficlente de regresi6n lineal
Modeto 1 Modelo2 Modelo 3 Modelo4
Intercepto 0,4533 -0,0080 0,0107 -0,0680
Tensi6n arterial sist61ica (l mm Hg) 0,0025 0,0016 0,0014 0,0012
EClaCl (1 ano) No Incluldo 0,0104 0,0096 0,0099
Genero (1 '" hombres, 0 '" mujeres) No incluido No incluido 0,0970 0,0981
Indica de masa corporal (1 kgtm') No incluido No incluido No incluido 0,0033
Nota ; EI grosor de la intimamedia de las artEnas carotideas (GIM), me<Jido en milimetros: promedkl de las
me<Jiciones del uHrasonido moOO B tomado en 6 sitios de las arterias car6tidas a ambos lados del cuello.
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 253
Los valores estimados de los coeficientes de regresion, obtenidos por el metodo
de mfnimos cuadrados (vease 10 anterior), se exponen en la Tabla 7.1 5 (modelo 2).
Usando estos valores, la ecuacion puede ser escrita nuevamente como una funci6n
de las estimaciones: esto es, en funci6n de b
o
, hi y h2 (otra vez omitiendo el tennino
del error, e, por razones de simpliddad):
1 Ecuaci6n 7.31
GIM (mm) = -0.0080 + 0.0016 x TAS (mm Hg) + 0.0 104 x edad (anos)
Para representar este modelo grMicamente serfa necesario un sistema de ejes tri -
dimensional: uno para la TAS, otro para la edad, y un tercero para el GIM. La nube
de puntos sera una nube tri dimensional en este espacio con tres ejes. EI modelo en la
Ec uacion 7.3 expresa la fonnu la de un plano que se supone que nos provea de una
buena representaci6n de la nube tridimensional 0, dicho de otro modo, de las rela-
ciones li neales entre las tres variables. Cada uno de los coefi cientes de regresi6n en
el modelo 2 puede ser interpretado del modo siguiente:
EI intercepto (h
o
= -0,008) corresponde al GIM estimado de un individuo con
cero anos y con TAS = 0 mm Hg; como en el ejemplo precedente, esto repre-
senta una extrapolaci6n carente de uso pr:ktico e incl uso de interpretaci6n
alguna (vease Secci6n 7.4.1 ).
EI coeficiente de regresion para la TAS (b
l
= 0,00 16 mm) representa el incre-
mento promedio estimado en GIM por cada mm Hg de incremento en la TAS
habiendose controlado eI elecro de fa edad (es deci r, luego de el iminar las aso-
ciaciones de la edad tanto con la TAS como con el GIM).
Similannente, el coeficiente de regresion para la edad (h2 = 0,0 104 mm) repre-
senta el incremento promedio estimado en GIM por ano de incremento en la
edad mientras se conrmfa por la TAS (esto es, luego de eli minar las asociacio-
nes de la TAS tanto con la edad como con el GIM) .
(Para ver una derivaci6n sucinta y una interpretacion adic ional de los coeficientes
de regresi6n aj ustados en el contexto de la regresi6n lineal mul ti ple, consult ese el
libro de Khan y Discusiones mucho mas detall adas sobre la regresi6n
multiple pueden hallarse en los ya mencionados libros de texto de estadfstica).
N6tese que el coeficiente estimado para la TAS (hi = 0,00 16 mm) en el modelo 2
es mas JX:q ueno que eI coeficiente correspondiente en el modelo I (0,0025 mm).
Esto se debe a que la edad es un confusor de la relaci6n entre la TAS y el GIM. En
otras palabras, algunas de las relaciones aparentes que se observaban entre la TAS y
el GIM en el analisis crudo (modelo I) eran debidas al hecho de que las JX:rsonas
con mayores valores de TAS tienden a ser mas viejas, y las JX:rsonas mas viejas tien-
den a tener mayor grado de arterioesclerosis. En el modelo 2, la fuerza de la aso-
ciacion entre TAS y GIM esta reducida en virt ud de que el efecto de confusi6n de la
edad (positivo) se elimina, al menos parcial mente (vease Secci6n 7.5).
Un importante supuesto implfcito en el modelo de la Ecuaci6n 7.3 es que no hay
interaccion entre TAS y edad, las dos variables incluidas en el modelo. En otras pala-
bras, el hecho de suponer que el cambio en y asociado con el cambio de una unidad
en XI es constante en el recorri do entero de X2 y viceversa, esta implfcito en la formu-
254 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
laci6n de este modelo estadfstico (y = b
o
+ b,x, + b2x2). En este ejempl o, el incremen-
to en el GIM por unidad de incremenlQ en la TAS, la estimaci6n hi = 0,0016 mm, no
solo esta aj ustada por la edad sino que lambicn debe ser aplicable a individuos de
todas las edades (y el inverso es cicrto para b
2
). 5i hubiera interaccion, esto es, si el
cfccto de la TAS sabre el GIM fuera diferente entre individuos mas viejos y mas
j6venes - entonces el modelo resli mido en la Ecuaci6n 7.3 no serfa apropiado.
Como se discute en el CapItulo 6, cuando un facIQr dado (en este ejemplo, la edad)
modi fica el cfccto de la variable de interes (en este ejemplo, TAS) se recomienda
que la asociaci6n entre la variable de inten!s y el desenlace sea evaluada en estratos
formados por las categorfas del modificador de efecto. Asf, en lugar de un ajuste por
edad, deben emplearse modelos estratificados por edad (es decir, modelos separados
para cada grupo de edad), situacion analoga a la de los ejemplos discutidos en la
Seccion 7.2. Una tecnica analftica alternat iva para encarar el problema de la interac-
cion en el contexto de la regresi6n mul ti ple consiste en incl uir ferminM de infe-
mcci6n (tam bien conocidos como ferminM I'roductos) en la ecuaci6n de regresion.
Por ejemplo, en la presente ilustraci6n, si se sospecha una interacci6n entre la TAS y
la edad, entonces puede emplearse el modelo siguiente:
I Ecuacion 7.41
GIM = + x TAS) + (fh x edad) + Ifh x (TAS x edad)]
donde (TAS x edad) representa una nueva variable que se obl iene multiplicando
los valores de TAS y de la edad para cada sujeto. Notese que si TAS y edad fueran
variables binarias, este modelo serfa an:llogo a los modelos estrarificados. En com-
paracion con los analisis estratificados. el uso de los terminos de interaccion incre-
menta la eficiencia estadfstica y tiene la ventaja de pennitir la evaluaci6n de la
interaccion con 0 entre variables cont inuas . EI termino de interacci6n puede ser
conceptuali zado como el exceso en el cambio no explicado por la suma de los
efectos individuales de dos variables independientes (x); esto se representa
esquematicamente en la Figura 6.3 del Capit ul o 6 (interaccion) por el exceso. <<I ,
sobre el efecto conjunto de la columna (parte derecha) . Si hay interacci6n, la
inclusion del termino correspondiente en el modelo es importante a los efectos de
la predicci6n, puesto que eJ incrementa el monto de la variabilidad en el desenlace
explicado por el modelo completo frente a la suma de los efec(Qs aislados de los
predict ores individuales .
Notese que cuando dos variables X2 Y Xl imeracruan e interesa el efecto de otra varia-
ble XI> entonces es importante ajustar XI por X2, x), y el lennino de interacci6n
Ajustar por el tennino de interaccion es importante puesto que las distribuciones de X2 0
de X3 (cuando se examinan individualmente) pueden ser las mismas para diferentes
categorfa de XI (digamos, expuesws frente a no expuesws) pero las distribuciones de la
presencia con junta de X2 y Xl pueden ser diferentes, y asf el termino de interaccion
puede act uar como una variable de confusion. Ademas. como la interaccion por sf mis-
rna es susceptible de efcctos de confusi6n (vease Capftulo 6, Secci6n 6.10.2), es obvia
la importancia de aj ustar el tennino de interacci6n segun otras variables en el mOOeh
Para mas delalles acudase a li bros de bioestadfsrica (por ejemplo, Annitage y BerryI2).
EI modelo 3 en la Tabla 7.15 agrega una nueva variable, el genero. Se trata de una
variable dicotomica, a la que se ha asignado arbitrariamente el valor I para hombres
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 255
y el valor 0 para mujeres. Como con cualquier otra variable, el coeficiente b
3
= 0,097
se interpreta como el incremento ajustado, en GIM (mm) por un incremento de una
unidad en el genero, solo que 10 que esto efect ivamente significa en el caso del
genero es una diferencia promedio en GIM entre hombres y mujeres, ajustada por
otras variables en el modelo (TAS y edad) (Figura 7.6). (Si la variabl e genero hubie-
ra sido codi ficada como I para mujeres y como para hombres, entonces los resul -
(ados hubieran sido identicos a los mostrados en la Tabla 7.1 5, salvo que el signa del
coeficiente habrfa sido negat ivo - es decir, b
3
= .....(),097, representando la diferencia,
mujeres menos hombres. en GIM).
La interpretacion de los coeficientes en el modelo 4, mos{rado en la Tabla 7.1 5,
es consistente con la de los modelos 2 y 3 excepto en que hay un ajuste adicional
para el Indice de masa corporal (1J\.1 C). Tal y como se vio en la tabla, la magni{ud del
coefici ente para la TAS disminufa en los modelos 3 y 4, sugiriendo que no solo la
edad sino {am bien el genero, y el IMC eran confusores (positivos) de la relaci6n
observada entre la TAS y GIM. EI incremento en GIM por mm Hg en la TAS des-
pues de controlar simuitaneamente por edad, genero e IMC (modelo 4; 0,00 12 mm)
es alrededor de la mitad del valor estimado cuando no se ajustaba por ninguna de
estas variables (modelo I ; 0,0025 mm). Con prop6sitos inferenciales, es importante
considerar la posibilidad de que los confusores no incluidos en el modelo y la confu-
GIM (mm)
1.20 :
1.00 :
0.80 :
0.60 , .. .
0.40 :
b
o
0.20 :
o
j
............................ ............. , . 1,,
Ganero
Fi gura 7.6. Interpretacion gralica del cocliciente de regresion para una variable dicoto-
mica tal como el genero (como en I()s model()s 3 y 4 de la Tabla 7.15). Por analogia c()n la
si tuaci6n de regresi6n c()n una variable continua independiente (per ejemplo. Figura 7.4), la
linea de regresi6n se ubica gnificamente entre los dos conglomerados, incluso aunque no
haya valores posibles entre x = 0 y x = I. N61ese que el intercepto (h
a
) corresponde al valor
GIM medio en mujeres (x = 0). mientras que el coeficienle de regresi6n (hi) representa la
diferencia promedio entre hombres y mujeres.
256 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sian residual debida a, por ejemplo, la clasificaci6n err6nea de covariables tales
como el IMC, puedan ser responsables de al menos una parte del efecto residual
aparente de la TAS, como pone de manifiesto un coeficiente de regres i6n de 0,00 12
mm (vease Secci6n 7.5) .
Tal y como se indica en la Figura 7.4. un modelo con lIna variable independiente
(modelo 1) puede ser f:kilmente representado en un grafico; tal es el caso del mode-
102, aunq uc ei requerirfa un grMico tridimensional. En contraste, los modelos 3 y 4
(es decir, modelos de regresi6n con mas de Ires dimensiones - con una variable y y
mas de 2 variables x) no pueden ser representados graficamente. Sin embargo, la
interpretacion de los coeficientes de regresion en los modelos 3 y 4 sigue siendo
an<i. loga a la de los modelos I y 2: eSIOS coeficiemes aun representan el incremento
promedio estimado en la variable y por unidad de incremento en la correspondieme
variable x, aj ustado simult aneamente por {Qdas las otras variables independientes
presentes en el modelo. Notese que, como extensi6n de la di scusion del modelo 2
arriba considerado, las fonn ul aciones para los modelos 3 y 4 tambien implican una
falla de illferaccioneJ entre las variables indepelldientes incl uidas en el modelo: en
otras palabras, el efecto de cada vari able (cada estimacion b) se asume que es cons-
tante a 10 largo de todos los niveles de las otras variables . La presencia de interaccio-
nes supondrfa un anali sis estratificado 0 la incl usion de terminos de interacci6n en
el modelo (vease anterionnente).
La Tabla 7.1 6 recoge un ejemplo adicional de result ados de la regresion lineal
multiple tomados de un estudio que evalua variables correlacionadas con el cont eo de
leucoci tos en adul{Qs de edad media(171 . AI imerpretar los hallazgos en la tabla, deben
ser remarcados los siguientes puntos: I) todos los coeficiemes se refieren a unidades
de la variable dependieme - esto es, 1.000 leucocitos por mm
3
; y 2) cada coeficieme
de regresi6n li neal represema el cambio esperado en el comeo medio de leucoci tos
para una unidad dada de cambio de la variable independiente, miemras que se ajusta
simult aneameme por todas las otms variables incluidas en el modelo de regresi6n.
Para ser interpretable, deben especificarse las unidades de los coeficientes de regre-
si6n (por ejemplo, para la edad un incrememo de 5 afios) (vease Secci6n 7.4. 1) . EI
signa negat ivo de un coeficieme significa que, en promedio, el conteo de leucoci{Qs
dislllinilye a medida que crecen los valores de la variable x correspondiente.
A continuaci6n se ilustra como han de imerpretarse los da{Qs de la Tabla 7.16:
EI comeo medio de leucocitos disminuye en (0,066 x l.OOO)/mm3 (0 66 celu-
las/mm3) por una unidad de incremento en la edad (es decir, 5 afios), despues
de controlar por todas las otras variables de la tabla. Esto es equi valente a una
disminucion promedio aj ustada de 13,2 celulas/mm
3
por afio de edad (es deci r,
66/5 afios), 0 132 celulas/mm
3
por 10 afios de edad, y asf sucesivamente .
Puesto que la variable sexo es categ6rica, una lmidad de incremento efecti -
vamente representa la di ferencia promedio entre hombres y mujeres . La esti -
maci6n del coeficiente de regresi6n (b = 0.478) puede, por tanto, imerpretarse
como que los hombres ti enen en promedio 478 leucociws mas por mm) que las
mujeres, luego de ajustar por las otras variables li stadas en la tabla.
Tengase en cuenta que el valor del imercep{Q fue omitido en la Tabla 7.1 6, ya que
no tiene ni valor practico ni interpretacion al guna en este ejemplo. (Su interpretaci6n
serfa que es igual al numero esperado de leucoci{Qs para una persona con un valor 0
IMPORTANTE
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 257
Tabla 7.16
Analisis de regresion lineal multiple de variables demograficas y constitucionales
relacionadas con eI conteo de leucocitos (en mil es por mmj) enlre personas que
nunca rumaron (n = 5.392) en la ("ohorte del Esludio de Ri esgo de Arterioesclerosis
en Comunidades (ARIC), 1987 a 1989
Variable Coeflclente de Error estandar
(I ncremento para b) regresl6n lineal' d. b
Edad (5 arios) -0.066 0.019
Sexo (1 :0 hombres. 0 '" mujeres) 0.478 0.065
Raza (1 :0 blanco. 0 :0 negro) 0.495 0.122
Escala de actividad en el trabajo (1 unidad) -0.065 0.02t
Pliegue subescapular (t o mm) 0.232 0.D18
Tensi6n arterial sist61ica (to mm Hg) 0.040 0.D11
FEVI (1 L) -0,208 0.047
Frecuencia cardiaca (t o latidos/min) 0.206 0.020
, Todos kls coei icientes de regresi6n SOn estadisticamente (Estadislico de Wald: ver Secci6n
7.4.8). P<:O.OI.
Fuente: FJ Nieto et a/ . Leukocyte Count GJrrelates in MiddleAged Adul ts: The Atherosclerosis Risk in Commu-
nilies (ARle) Study, American Journal 01 Epidemiology, Vol 136. 525537 11:1 1992, The Johns Hopkins
School of Hygiene & Public Health.
en todas las variabl es independientes - es decir, una mujer negra recien nacida, con
= 0 , sin larifi os fiei corazon, etc)
En esta secci6n y en las secciones previas, los me(Qdos de regresion lineal han
sido descri (Qs en el contexto de Sll aplicaci6n usual ; esto es, para la evaluaci6n de
predictores de Ilna variable de desenlace continua (por ejemplo, GIM). Sin embargo.
es posible extender este metodo a la evaluaci6n de variabl es binarias (dicotomicas).
tales como la presencia de arterioesclerosis carotfdea definida como variable categ6-
rica (presente 0 ausente) . 0 la ocurrencia de un evento incidente (por ejemplo. enfer-
medad. muerte). usando el enfoque propuesto por En esta situaci6n. los
coeficientes de regresi6n se interpretan como la predicci611 del incremento ell fa pro-
babilidud (prevulellcia a incidellciu) del de.\enlace de interes en relaci6n a un incre-
mento dado 0 cambio en el valor de las vari ables independientes. mientras se ajusla
simult aneamente por todas las ot ras variables en el Una cautela
teorica que ha de observarse al aplicar este metodo se relaciona con la violaci6n de
algunos de los supuestos basicos de la relaci6n li neal (por ejemplo. que los errores e
estan distribuidos normalmente: vease Annitage y Berry(12). Otro importante pro-
blema se relaciona con las extrapolaciones a valores extremos. puesto que pueden
result ar en estimaciones absurdas de las probabilidades predichas (por ejemplo.
'1ue 0 0 que I ) Como consecuencia fie e l mooelo
de regresion lineal binaria de Feldstein ha cafdo en desuso, particularmente debido a
la creciente disponibilidad de poderosos recursos computacionales. tales como el
modelo de regresi6n logfstica y los metodos relacionados con el (veanse las seccio-
nes siguientes) . Sin embargo, el enfoque parece producir estimaciones ajustadas en
lfnea con aquellas que son obtenidas mediante otras estrategias de regresion.
258 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.4.3. Regresi6n logistica multiple
Para variables binarias de respuesta tales como la OClI rrencia de la muerte, 1a enfer-
medad, 0 la recuperaci6n, eI modelo de regresi6n logfstica ofrece una alternativa
mas robusta que la regresi6n lineal multiple binaria. El modelo de regresi6n logfstica
supone que la reladan entre un valor dado de lIna variable x y la probabilidad de un
desenlace binario sigue 1a asf lI amadaflll1ci6n logistica:
[Ecuadon 7.5J
donde P(ylr) denota la probabilidad (P) del desenlace binario (y ) para un valor dado
de x. El resuitado de esta ecuadon, una probabi lidad, se constrifie a valores en el
recorrido de 0 a I.
La Figura 7.7A muestra un panorama grafico de esta funci6n en el caso de lIna
variable cont inua x. Procede puntualizar que el aspecto de esta funcion parece ser
biologicamente plausible para eI ti po de relaciones dosis - respuesta observada en
toxicologfa y la evaluaci6n de riesgos- esto es, situaciones en las cuales bajas dosis
de x inducen una respuesta debi l hasta cierto umbral, despues del cualla respuesta se
incrementa marcadamente pero, mas ali a de cierto nivel de x, ocurre un efecto de
sat uracion (cuando la probabi lidad de desenlace se torna proxima a uno). La plausi-
bilidad biologica, sin embargo, no es la princi pal raz6n para explicar la popul ari dad
de la regresi6n logfstica para el anal isis multi vari ante de predictores de un desenlace
binario. Mas bien, las razones por las que este es uno de los metodos mas popul ares
para el anali sis mul tivariante de datos epidemiol6gicos son la conveniencia e inter-
pretabilidad de las estimaciones de sus parametros, f:kilmente convert idos en es-
A
B
1,0 5
0,8
"

,
~ 0,6
~

..


:5 g

0,4
n
'g;


0,2
~
0,0 -0
X X
1
log [ ( 1 ~ P ' j I " Do + tv
P()Ax) ::
1 +e -(Ilo
b
,>l
Figura 7.7. Dos formulacioncs matcmaticamente equivalentes de la funcion de rcgresion
logistica
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 259
timaciones de odds ratio; esw es obvio cuando la Ecuacion 7.5 se expresa de una
manera matematica equivalente como la que sigue:
1 Ecuacion 7.61
log (_P_) = log odds = b
o
+ b1x
I - P
donde P es la variante simpli ficada para expresar P(ylx) en la Ec uacion 7.5.
Esta expresion es analoga a la fllncion de regresion lineal simple (Seccion 7.4.1),
excepto en el hecho de que la ordenada es ahora el logaritmo del odds (log odds,
tambien conocido como logir), en lugar del valor medio usual de una variable cont i-
nua. Asf, si la relacion entre la exposicion (x) y la ocurrencia del desenlace se supo-
ne que se aj usta al modelo de regresion logfstica, esto impl ica que el log oddJ" del
desenlace se incrementa lineal mente con x (Figura 7.78 ) .
En el contexto de un estudio de collOrte (en el cual se obtienen datos sobre la
incidencia del desenlace) , la interpretacion de los parametros de la ecuacion de
la regresion logfstica es an:lloga a la de los parametros del modelo de regresion li ne-
al (Seccion 7.4.1 .), del modo siguiente:
EI intercepw (b
o
) es una estimacion del log odds del desenlace cuando x=O.
Como en la regresion lineal, este valor puede no tener una interpretacion ut il en
sf mismo cuando x = 0; en ese caso es una mera extrapolacion del recorrido
real (posible) de los valores de exposicion .
EI coeficiente de regresion logfstica (b
j
) es el incremento del estimado del log
odds del desenlace por unidad de incremento en el valor de x: o. en otras pala-
bras. e
b
, es el odds ratio asociado a un incremento de una unidad en la x .
Como ilustracion del significado de b
l
en una fllncion logfstica, consideremos
una situacion donde x es la variable dicm6mica sexo, para la cual valores de I 00 se
asignan a hombres y mujeres, respectivamente. Una vez estimado el valor del coefi-
ciente de regresi6n, las ec uaciones de regresion logfstica pueden ser fonnuladas para
cada genero del modo siguiente:
Para hombres: log (odd.\-)homb> = b
o
+ b
l
X I = b
o
+ b
l
Para mujeres: log (odds)mujere. = ho + hi X 0 = ho
As!, b
l
es la diferencia en el log odds entre hombres y mujeres, 10 cll al, como un
resultado de las propiedades aritmeticas de los logaritmos, es tambien el log odd,\"
ratio que compara hombres y mujcres:
(
(olids)t.;,mbru )
b
l
= log(odd)homb< - log(odds)mujere, = log = 10g(OR)
( Odd,\-)mujere.
Del mismo modo, si la variable x en la Ecuacion 7.6 es continua, el coeficiente de
regresion, hi, que representa el incremento en log odds por unidad de incremento en
260 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
x, puede ser convertido en el lag del udds ratio cuando se campara cualquier valor
de x con un valor(x - I).
Consecuentemente el oddJ' ratio correspondiente a una unidad de incremento en la
variable independiente (por ejemplo, cuando se comparan hombres y mujeres en el
ejemplo anterior) es el ant il ogaritmo (es decir, la funci6n exponendal) del coeficiente
de regresi6n, b j :
OR = eh
l
A modo de ejemplo, la Tabla 7. 17 llluestra los coeficientes de regresion logfstica
correspondientes a las asociaciones entre varios fac(Qres de riesgo y la incidencia de
enfennedad coronaria (Eq en un subconjunto de partic ipames del est udiQ ARIO I9).
Es(Os an.i.lisis se basan en la incidencia acumulada de EC entre el examen inicial
( 1987-1989) Y diciembre de 1994, para 3.597 p..1rtic ipantes del condado de Washi ngton
quienes estaban libres de EC c1fnica al comienzo. Un total de 171 eventos incidentes de
EC (infarto de miocardio, muerte por EC, 0 cimgfa coronaria con bypass) fueron iden-
tificados al final del seguimiento. (Para mas detall es sobre los metodos y result ados de
este est udio de seguimiento en la cohorte completa de ARIC, vease Chambless
et al Y'll)). L1 columna rotulada coeficiente de regresion logfstica en la Tabla 7. 17 pre-
senta el intercepto y los coeficientes de regresion ajustados para las variables indepen-
dientes consideradas. Cada coeficiente de regresion de la Tabla 7.17 se aj usto por todas
las otras variables en el modelo (li stadas en la tabla) y pueden ser convert idos en odds
mtioJ" ajustados (vease ultima columna) . Por ejemplo, para el genero, el odds ratio de
la EC incidente que compara hombres con mltieres es:
ORoombn>sin",jer<. = elJOi S = 3,70
Tomando un ejemplo de una variable contin ua, la tension arterial sistolica (TAS),
el odd.\" ratio aj ustado para una unidad de incremento ( I mm Hg) es:
ORl mmHg7AS = e!l Jll 6i = 1,017
Tabla 7.17
Result ado del amHisis de una regresion logistica de predictorcs binarios
y continuos de la enrermedad corona ria y su incidenci a en la cohorte del condado
de Washington del Estudio de Riesgo de Arterioesclerosis
en Comunidades (ARIC), edades de 45 a 64 en el momento inici al , 1987 a 1994
Vari able
Intercepto
Genero (hombres :01, mujeres '" 0)
Fuma (si 1 ,no . 0)
Edad (1 ano)
Tensi6n arterial sist61ica (1 mm Hg)
Colesterol serico (1 mg/dL)
Indice de masa corporal (1 kg/m')
Coeficlente de
regresl 6n togist ica'
-8,9502
t .3075
0.7413
0.0114
0.0167
0.0074
0.0240
Odds Ratio
3,70
2,10
1.011
1,017
1,007
1,024
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 261
Adviertase que el odd.\ ratio para la TAS es muy pequeno porque se calcula para
un incremento muy reducido de la variable independiente ( I mm Hg) . Un odds ratio
relacionado con una unidad de la TAS clfnicamente mas signifi cativa, tal como 10
mm Hg de incremento, puede, si embargo, ser facilmente obtenido mediante
transfonnaci6n del valor del coeficiente en esta unidad de TAS y entonces recalcular
el correspondiente odds ratio:
Los OR para la edad, colesterol serico e fndice de masa corporal en la Tabla 7.1 7
tambien corresponden a cambios pequenos ( I ano, 1 mgldl, y 1 kg/m\ respect iva-
mente) y pueden similannente ser convertidos a unidades con mas sentido. Para el
colesterol :rerico, por ejemplo, e l odds ratio correspondiente a 20 mg/dl de incre-
mento es:
1, 16
Para la edad, el odd.\ ratio correspondiente a un incremento de 5 anos es:
ORSaAo, de e<bd = eS. OJlJ 14= 1,06
La validez de estos d lculos depende de uno de los supues(Qs princi pales subya-
centes en eluso de variables cont inuas en los metodos de regresion multiple (veanse
tambien secciones 7.4.1 y 7.4.7): que las relaciones sean lineales (en la escala de los
log OlJd.\, en este caso particular) a 10 largo del recorrido completo de los datos (por
ejemplo. para la edad. que el incremento en los log odd.\ de la incidencia de EC aso-
ciada con un incremento de una unidad en la edad es el mismo a 10 largo del recorrido
de edades de los partici pantes en eI est udio). Este supuesto, sin embargo, puede ser
suavizado si las variables continua5 se convierten en variables binarias de exposic ion,
tales como, mas viejos frente a mas como categorfas de edad, 0 hiper-
tensi6n presente frente a hi pertensi6n ausente, como se ilustr6 en la Tabla 7.18.
Notense los cambios en los valores de las estimaci ones resumidas en la Tabla 7.18,
comp..1rados con los de la Tabla 7.1 7. Las definiciones de genera y habito de fumar no
cambiaron, pero debido a que las covariables de ajuste (todas las otras variabl es) 10
hici eron, los coeficientes de regresion y correspondientes OR para el
genero y el habito de fumar son li geramente diferentes. Sin embargo, las est imaciones
para los otros predictores cambiaron de manera mas acentuada, como resultado de su
transformacion de la condici6n de continua>; (Tabla 7.17) a categoricas (Tabla 7.18).
Por ejemplo, el OR ajustado para la hipertensi6n ( I ,67) en la Tabla 7. 18 se int erpreta
como la raz6n de los odd.\ de incidencia de EC para individuos que cumplen los crite-
rios empleados para definir hipertension (tensi6n arterial sisr6lica C!: 140 mm Hg 0
dia>;tolica C!: lX) mm Hg 0 terapia antihipertensiva) a los odds de aquellos que no c um-
plen ninguno de esos criterios de hipertension. Esto es muy diferente de la estimacion
para la TAS en la Tabla 7.1 7, tanto en valor como en interpretac i6n. N6tese que la defi -
nicion dicotomica de hipertension (0 la de cualquier otra variable intrfnsecamente con-
tinua), a la vez que evita el supuesto de linealidad inherente a la definici6n continua,
no esta libre de supuestos, ya que implica que el riesgo de EC sea homogeneo dellfro
de la>; categorfa>; de hipenensi6n. Si hay un gradiente de riesgo dentro de las categorfas
262 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.18
Rcsultado de UII analisis de rcgresioll Iogfstica de prcdictores binarios de ellfcrmcdad
coronaria (EC) en la cohortc del condado de Washington, Estudio de Ricsgo
de Arteriosclerosis en Comunidades (ARIe), edades de 45 a 64 alios
en cI momento inicial , 1987 a 1994
Variable
Coeficlente de
reg res ion logfstica
Odds Ratio
Inlercepto
Genero (hombres :0 I , mujeres :0 0)
Fuma (si::o l , no:oO}
Edad avanzada* (si ::: 1, no ,,0)
Hipertensi6n" (si ::: 1, no ,,0)
Hipercolesterolemia'" (si " I , no::: O)
Obesidad .. (si ::: 1, no '" 0)
, Edad ., 55 ai'Kls.
--4.5670
1.3106
0,7030
0.1444
0.5103
0.4916
0,1916
" Tensi6n allaria] sist61i ca ., 140 mm Hg 0 di ast6lica ., 90 mm Hg 0 18,apia antihipertensiva,
,., Colesterol serico total ~ 240 mgldL 0 tratamento hipolipemiante .
looice de masa corporal ~ 27,8 k!}lm' en hombres y ~ 27,3 k!}lm' mujeres.
3,71
2,02
1,16
1,67
1,63
1 ,21
de hipenensi6n, esta infonnaci6n se pierde en el modelo. Advienase que la perdida de
infonnaci6n puede resultar en confusi6n residual (Secci6n 7.5). Consideremos, por
ejemplo.la evaluacion de la asociaci6n entre el habit o de fumar y el odds de EC. con el
ajuste por hipenensi6n (y otras variables), como se expone en la Tabla 7.1 8: dado el
hecho de que la relacion entre la tensi6n arterial y EC sigue un patr6n dosis-respuesta
(una gradacion), la confusion residual pudiera haberse producido en caso de que los
hipenensos entre fumadores hubi eran tenido valores de tension arterial mas altos que
los hipertensos entre no fumadores . A pesar de la posible perdida de informacion, a
diferencia de algunos de los ejemplos discutidos previamente, eluso de variables dico-
tomicas como las que se muestran en la Tabla 7.1 8 pennite una interpretacion del
illfercepto en la regresi6n logfstica que pudiera ser (i til de varias maneras.
En primer lugar, en el contexto de datos procedentes de un estudio prospectivo, y
sobre la base de la Ecuacion 7.6, el intercepto puede interpretarse como el logaritmo
del oddJ' para individuos con valores nulos para todas las variables independientes.
Por ejemplo, de acuerdo a los resultados presentados en la Tabla 7.18, el intercept o
representa ellogaritmo del odds de casos incidentes de EC para mujeres no fumado-
ras que tienen edades entre 45 y 54 afios, no hipertensas, no hipercolesterolemicas, y
no obesas. Este valor se calcula como -4,567 + 0, 0, transfonnado al valor
correspondiente en la escala arit metica, odds = e _ ~ . S t . 7 = 0,0 104.
Si el prop6sito es predictivo, este resultado puede ser traducido a uno mas faci l-
mente interpretable, el estimado de incidencia (probabilidad, p) acumulada, (vease
Capitulo 2, Seccion 2.4) del modo que sigue:
Odds 0,0104
P = -:-=-::='c- = -:-'-';:-':'c:-:- = 0,0 103, 0 1,03%
1 + Odds 1 +0,0 104
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 263
Este ejemplo subraya la utilidad del intercepto cuando los valores nulos caen den-
lro del recorrido de valores de las variables independientes que resultan biol6gicamen-
te plausibles . En contraste, la interpretacion del intercepto por sf mismo carece de sen-
tido cuando se usan resultados tales como los que aparecen en la Tabla 7.1 7.
Segundo, como ocurre en los modelos de regresi6n en terminos generales, el
intercepto se necesita en la regresi6n logfstica para obtener la probabilidad predi-
cha (incidencia acumulada) del desenlace para un individuo poseedor de ciertas
caracterfst icas dadas . Por ej emplo, basandonos en los resultados que aparecen en
la Tabla 7. 18. la probabilidad de EC para un hombre fumador. menor de 55 afios.
hipenenso, no hipercolesterolemico, y obeso puede est imarse simplemente me-
diante la sustituci 6n de los val ores de cada variable x en una ec uaci on de la forma
que se muestra en la Ecuaci6n 7.5, tal y como se aprecia a continuaci6n:
1
-;-,--:-:"",",-;-;-:;:;-",,;;-c;;;:;;-:-;-;;;;::;- = 0, I 357 = I 3,57 %
I + e-+4.S67 + 13106 + 0.703 +0.1 916)
De igual forma, los resultados de la Tabla 7.1 7 pueden usarse para estimar la proba-
bil idad de EC en un individuo con valores espedficos de cada uno de los parametros
fi siol6gicos medidos . Esto puede hacerse para un individuo con valores promedios en
tOOas las covariables. Por ejemplo, los valores promedio de las covariables presentadas
en la Tabla 7.17 para los individuos de esta cohorte de ARIC fueron los siguientes
(n6tese que el valor promedio de las covariables dicot6micas es la propord6n de indi-
viuuos (;0[1 d valor qut: fut: (;ouifi(;auo (;omo I): mas(;uli no = 0,469; habi to ut:
fumar =0,229; edad = 54,7 arios; TAS = 119, 1 mm Hg; colesterol = 217,7 mgldl; IMe
= 27,8 kg/m2. Asf, usando los resultados de la Tabla 7. 17, la probabilidad predicha de
EC incidente para un <<individuo promedio en la cohone sera:

I + +! I Jl)7S )< 0..169) + (0.7413 x 0)29) . x S-I .7) + (00167 )< II<J.I ) . (00074 x 21 7.7) . (O.N x 271111
-;-,--,-:, 1",,;;;:::;- = 0 0364 = 3 64 %
I + e-'- 3.276-1WU)' ,
(EI concepto de individuo I'romClJio es abstracto, especialmente con respeto al
promedio de variables binarias. Por ejemplo, en este caso, significa un individuo que
tiene 0,469 de masculinidad y 0,229 de habito de fuman) y que tiene un valor
medio para las otras covariables cont inuas) .
Como otro ejemplo de la aplicaci6n del mOOelo logfstico para la predicci6n, los
investigadores del estudio de Framingham prOOlljeron la Hamada ecuaci611 de riesgo
IIlIilfiple de Framingham, que puede usarse para estimar el riesgo de enfer-
medad cardiovascular a 10 largo del tiempo para una persona con un conjunto dado
de valores para varias variables relevantes (genero, edad, colesterol serico, tensi6n
anerial sistolica, habito de fumar cigarrill os, hipertrofia vent ricular izquierda segun
ECG e intolerancia a la glucosa)(II).
264 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EI uso de estos modelos con prop6sitos prediclivos supone, desde luego, que el
modelo se aj uste razonablemente bien a los datos. Ademas. la discusi6n anterior
sabre la interpretaci6n del intercepto y de los calculos de las probabilidades estima-
das del evento es relevante cuando los datos son prospect ivos. EI uso del modelo de
regresi6n logistica para el an.i. li sis de datos de cohorte, sin embargo. se limita a que
el modelo ut il ice datos de incidencia acumulada y, por tanto, tiene que descansar en
dos importantes supuestos: que el seguimiento de los part ici pames del estudio sea
compl c{Q, y que el tiempo transc lI rri do hasta la ocurrencia del evento 0 desenlace no
tienen importancia. EI hecho de que estos supuestos normalmeme no resul ten satis-
fechos viene subrayado por las entradas tardfas en muchos est udios de cohorte en los
que el reclutamiento se lleva a cabo a 10 largo de un periodo de tiempo mas 0 menos
extenso; por perdidas subsecuemes en el segui miemo; y por la vari abilidad de los
periodos de latenda para la mayorfa de los desenlaces de interes, 10 que convierte al
tiempo que transc urre hasta que se produce el evento en un dato importante (vease
Capitulo 2, Secdon 2,2), Para el anali sis de datos de cohorte con un seguimiento
incompleto para algunas observadones se dispone de herramientas de anali sis multi-
variame mas apropiadas, como se vera en las dos secdones siguiemes ,
La aplicacion mas frecuente del modelo de regresi6n logfstica se da en el contexto
de los est udios de casos y controles, dDnde constituye la herramienta analftica funda-
mental para los anali sis multivariantes(21 22) , En un eJ'tudio de caso.\' Y COnfroles, la
interpretacion de los coeficientes de regresion es identica a la de un estudio de cohorte
(es decir, el log del odds ratio), como se muestra en los ejemplos que siguen, Por olra
parte, cuando los datos provienen de un estudio de casos y comroles, el interceplo no
es interpretable de una manera sencill a, ya que las fracciones de muestreo para casos y
controles han sido arbitrari amente detenninadas por el investigador (para una discu-
sian mas tecnica de este aspecto. vease Schlesselman (22)), Un ejemplo del uso de la
regresion mul tiple en un eSllldio de casos y comroles procede de un estudio de la sero-
prevalencia del virus de la Hepatitis B en trabajadores de la salud en Boston a fi nales
de los afios setenta y comienzo de los ochenta - esto es, antes de la introduccion de la
vacuna para el virus de la Hepat itis B 1l3). En la Tabla 7.1 9 se presentan algunos hall az-
gos de este eSlUdio. espedficamente o ~ resultados de un anali sis de regresi6n logfstica
multipl e orientado a la ident ifi caci6n de vari ables asociadas con los OlJd,\, de positivi-
dad a la Hepatitis B por medio de anticuerpos stricos. L.1 tabla muestra tanto los coefi -
dentes de regresion logfstica como los OR correspondientes, (asf como los intervalos
de confi anza aI 95%: veanse Secd6n 7,4.8 y Apendice A, Secd6n A.9) , EI intercepto
fue omitido debido a su irrelevancia (vease arriba) , Debe advertirse que las primeras
Ires variables son dicotomicas; consecuentemente, el coeficiente de regresion para
cada una de estas variables representa la diferencia en ellog odds entre las dos catego-
rfas correspondientes (en olras palabrns, el ant ilogaritmo del coeficiente de regresi6n
representa el odd,\, ratio que compara la categorfa de exposicion - codificada como
uno- con la categorfa de referencia codificada como cero). Por ejemplo, para la
variable reciente puncion con aguja , el valor 0,8459 es la diferencia estimada en el
log odds de anticuerpos positivos entre aquellos con y entre aquell os sin una historia
de redente pund6n con aguja, despues de ajustar por todas las otras variables de la
labia, Consecuentemente, el odd,\, ratio asociado con la reciente puncion con aguja se
estima como eJl.l59 = 2,33. Las dos variables que se hall an mas abajo en la Tabla 7.19
(edad y afios de ocupacion) fueron introducidas en el modelo como cont inuas, y los
coefidentes de regresion asf como los OR correspondientes son los que corresponden
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 265
Tabla 7.19
Analisis de regresion logistica mult ivariada de ractores de ri esgo para la presencia
de anticuerpos sericos del virus de la Hepatitis 8 en trabajadores de la salud,
80ston, Massachusetts, 1977 a 1982
Caracteristlca
Exposici6n ocupacional aI contacto con sangre (sf/no)
Reciente punci6n con aguja (sf/no)
Serologfa positiva al virus de la Hepatitis A (sf/no)
Edad (1ano)
Arios en la ocupaci6n (t ano)
Coeficlente de
reg res ion logrstica
0.7747
0.8459
0.6931
0.0296
0.D19B
Odds ratio (Intervalo
de conllanza 95%)
2,17 (1 ,31 - 3,5B)
2.33 (1. 19 - 4.57)
2,00 (1 ,13 - 3,54)
1,03 (0.99 - 1.06)
1,02 (0,97 - 1,0B)
Fuente: A Gibas el al. , Prevaleoce ar.d Incidence 01 Vi ral Hepatitis in Health Workers in the Prehejlatitis B Vacci-
nation Era, American Journal 01 Epidemiology, Vol 136, 603610 Cl1992, The Johns Hopkins University School of
Hygiene & Pubfic Health.
a un incremento de un ano. Por ejemplo, para anos de ocupad6m>, el valor 0,0 198
representa el incremento estimado ajustado en el log odds de antic uerpos positivos por
cada ano de incremento en la durad6n del empleo como trabajador de la salud. En
otras palabras, el oddJ' ratio ajustado correspondiente a un incremento de un ano de
ocupad6n se estima como eOJlI98 = 1,02.
Debe vol verse a enfatizar que el modelo de regresi6n logistica es un mOlielo /i-
neal ell la escala de log Olids, como se vio en la Ecuaci6n 7.6. En tenninos pr:kticos,
eslo signi fica '1lJe ClJ anno ti na variahl e continlJa se inl mntlce como tal , e l coefici enle
resul tante (y los correspondientes OR) supuestamente representan el incremento li ne-
al en log odds (0 el incremento exponendal en odds) por cada unidad de incremento
de la variable independi ente a 10 largo de IOlio el recorrido lie l o . ~ va/ores de x. Por
ejemplo, el incremento estimado en los odds de anticuerpos de Hepatitis B positivo
por cada ano de ocupaci6n (es decir, OR = 1,02) mostrado en la Tabla 7. 19 se supo-
ne que sea el mismo cuando se comparan 3 anos de ocupaci6n con 2 que cuando se
comparan 40 anos con 39. Nuevamente, como se discut e en las Secciones 7.4.1 y
7.4.7, si este supuesto es incorreclo (por ejemplo, si el incremento en el riesgo de
infecd 6n asociado con un ano de cambio en la ocupadon es mayor en los trabajado-
res que han sido contratados mas recientemente, y por tanto, menos experimenta-
dos), el modelo anterior sera incorreclO y deben emplearse modelos alternati vos que
manejen definic iones categ6ricas de la variable (variables dummy) u ot ra forma de
parametrizacion (por ejemplo, terminos cuadraticos) .
7 AA. Modelo de riesgos proporcionales de Cox
Cuando el analisis se basa en datos del tiempo transcurrido hasta deno evento
(supervivenda), una de las opciones es modelar los datos empleando la escala de
riesgos (0 fuerza instantanea de la morbilidad 0 la mortali dad 0 hazard) (vease Capi-
tulo 2, Secci6n 2.2.4) . El supuesto subyacente en el uso de este enfoque es que la
exposici6n a cierto factor de riesgo (0 la presencia de d ena caracteristica) se asocia
266 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
con un incremento relat ivo fijo en el riesgo instamaneo del desenlace de interes,
comparado con un valor basal 0 ri esgo de referenda (por ejemplo, el riesgo en los no
expucstos). En otras palabras, se supone que en cualquier momenta dado del riempo
(t), el ri esgo en los sujetos expuestos a cicrto factor de riesgo lh l(t)1 es un mul ti pio
de algun riesgo subyacente lho(t)l. La Figura 7 .8 il ustra este modelo, susceptibl e de
ser matematicamente formu lado del modo siguiente:
I Ecuaci6n 7.7J
h,(t) = ho(t) x B
ES(Q es, en cualquier punta dado en el tiempo, el riesgo para aquellos que estan
expuestos al factor XI es igual al riesgo que corresponde a aquellos que no estan
expuestos a eJ, multiplicado por un factor constante (B) . Los riesgos, tanto en expuestos
como en los grupos de referenda. pueden ser aproximadamente constantes 0 pueden
incrementarse con eI tiempo (vease Figura 7.8A, por ejemplo, el riesgo instantaneo de
monr a medida que eI individuo envejece) 0 fluctuar en el tiempo (vease el ejemplo
hipotetico de la Figura 7.8B, por ejemplo, el nesgo de un acddente a medida que cam-
bia la velocidad a la que se conduce el aut om6vil) . En ambos ejemplos de la Figura 7.8
se supone que en cualquier punto dado en el ti empo, el riesgo entre los expuestos (por
ejemplo, neumaticos viejos en los coches) se multiplica por dos independientemente
del ri esgo de base (por ejemplo, neumaticos nuevos): en otras palabras, la raz6n de
riesgo (0 riesgo relat ivo), comparando expuestos y no expuestos, es constant e.
Para estimar B - el factor de multi plicacion constante en la Ecuad6n 7.7 - es
conveniente definirlo en tenninos de la fund6n exponencial: B = e
b
, obtenida
mediante la reformulaci6n de la Ecuaci6n 7.7 del modo sigui ente:
I Ecuacion 7.8 J
A
B
Expuestos
Expueslos
~ No expuestos
NO expueslos
~
Tiempo Tiempo
Figura 7.8. Ricsgo en el tiempo en dos si tuaciones hipotcticas en las cualcs los indi viduos
expucstos tienen dos veces mas riesgo que los que 110 estall expucstos. A) representa una
situaci6n con un riesgo relativamente estable que crece lentamente con el tiempo. tal como los
riesgos de morir en los individuos de edad adulta: B) representa una situaci6n en la que el ries-
go fluctua en el tiempo tal como el riesgo de tener un accidente automovilfstico. que se incre-
menta 0 disminuye como funci6n de la velocidad del autom6vil en cualquier instante dado. con
la presencia de la exposici6n (por ejemplo, tener neumaticos gastados) que duplica el riesgo de
tener un accidente, comparado con su ausencia (conducir con nemm'iticos adecuados).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 267
Si ho(t) representa el ri esgo instantaneo en el grupo no expuesto en cualquier
momento del ti empo, entonces la raz6n de riesgos instantaneos (RI) que compara los
expuestos y los no expuestos es:
0, aplicando logaritmos:
RJ = h ,(t) = eb
ho(t)
log(RI) = b
N6tese que, puesto que tanto la raz6n de riesgos instantaneos como el odds ratio
son medidas multiplicativas de asociaci6n (es decir, lineales en una escala logarftmi -
ca), muchos aspectos relacionados con la interpretaci6n del coeficiente de regresion
en el modelo de riesgos proporcionales (que esrima la razon de los logaritmos de los
riesgos instantaneos) son similares a los de la interpretacion del coeficiente de regre-
si6n en el modelo de regresion logfstica (el cual estima ellogaritmo del o d d . ~ ratio).
As\, los aspectos de interpretacion relacionados con el tipo de variable indepen-
diente incluida en el modelo (continuas, ordinales, categ6ricas) son similares en el
modelo de regresi6n de Cox yen el modelo de regresi6n logfstica.
La Tabla 7.20 muestra los resultados de dos analisis alternati vos que emplean la
regresion proporcional de Cox (modelos I y 2) para evaluar predict ores de EC inci-
Tabla 7.20
Resultados del aniilisis de regresion proporcionai de Cox de prcdictorcs binarios
y continuos de la incidencia de enfermcdad coronaria (EC) en la cohorte del condado
de Washington en cI Estudio de Ricsgo de Arteriosclerosis en Comunidades (ARIC),
edades de 45 a 64 al10s en el momento inicial , 1987 a 1994
Modelo Variable
Coeflciente de Raz6n de rlesgos
regresl6n de Cox Instantaneos
Genero (hombres", 1. mujeres" 0) 1.2569 3.52
Fuma(si",l.no:O) 0,7045 2,02
Edad (1 ano) 0,0120 1,012
Tensi6n arterial sist61ica (1 mm Hg) 0,0152 1,015
Coleslerol serico (1 mgtdl) 0,0067 1,007
Indice de masa corporal (1 kglm2) 0,0237 1,024
2 Genero (hombres" 1. mujeres '" 0) 1,2669 3,55
Fuma(si= l .no"O) 0,6803 1,97
Edad avanzada' (si =1. no ,,0) 0,1391 1,15
Hipertensi6n" (si " I, no ::: 0) 0,5030 1,65
Hipercolesteloremia'" (si '" 1. no ,,0) 0,4552 1,58
Ooosidad (si = 1. no " 0) 0, 1876 1,21
Edad .. a 55 ai'Kls .
.. Tensi6n arterial sist6lica .. de 140 rnm Hg 0 diast6lica .. de 90 mm Hg. 0 terapia antihipertensiva .
... Cole sterol oorico total .. de 240 mgJdl 0 tratamiento hipolipemiante .
.... indice de masa corporal .. que 27,8 kglm' en hombres y .. 27,3 kgfm' en mujeres.
268 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
dentc en la cohorte del condado de Washington del estudio ARIC. N6tese que en
esta tabla las variables independientes incl uidas como predictoras son las mismas
que las previamente empleadas para il ustrar el modelo de regresi6n logfstica
(Tablas 7. 17 Y 7. 18). Aquf el desenlace de interes es tambien la EC inc idente pero,
en contraste con el analisis de regresi6n loglstica (el eual supone que lodos los part i-
cipantes tienen complctado el seguimiento y que se obtuvieron los odd.\" de inciden-
cia acumulados), los coeficientes de regresi6n en la Tabla 7.20 taman en cuenta el
fiempo de vCllrrenciu de cada evento, as! como el tiempo de ccnsura para los
partic ipantes que no fueron observados para el segui miento comple{o (vease Capftu-
102, Seccion 2.2).
As\, tambien en contraste con la regresion logfstica, donde los antilogaritmos de
los coeficientes de regresi6n se interpretaban como OR, la exponenciacion de los
coeficientes de regresi6n (beta) en la Tabla 7.20 produce los riesgos instantaneos
(anaJogos a los ri esgos relat ivos) .
Hay una notable similit ud entre las est imaciones obtenidas de la regresion logfs-
tica en las Tablas 7.17 y 7.1S (odds ratio de incidencia acumulada; tiempo hasta el
evento y censura no considerada) y las est imaciones de Cox en la Tabla 7.20 (razon
lie riesgos instantal/eos; tiempo hasta el evento y censura tomadas en Cllenta). Esta
similit ud es probablemente debida a las siguientes circunstancias: I) La EC es
relativamente rara, y por tanto, los OR estimados a part ir de la regresion logfstica se
aproximan a la ruzon de riesgoJ" instantaneOJ" (Ia cual se asemeja a un riesgo relat i-
yo) eSlimada por la regresi6n de Cox; y 2) las perdidas en el seguimiento y las perdi-
das hasta los eventos son probablemente no dife renciales entre los grupos de exposi-
cion, y asf los sesgos result antes de l o ~ factores relacionados con el {iempo tienden a
cancelarse mutuamente, 10 cual representa un fen6meno comparable al sesgo de
compensaci6n descrito en la Secci6n 4.2.
Cabe subrayar que, a dife rencia de los result ados obtenidos a part ir de la regre-
sion logfstica, en el modelo de Cox no hay un intercepto. La importante cont ri buci6n
de Cox consistio en construir un metodo para estimar los parametros de regresion en
el modelo de riesgos instantaneos I'l"Ol'orcionale.\" sin necesidad de especifi car el
valor 0 la fonna del rie.\"go instanfllneo de base (h
o
), que es el equivalente al inter-
cepto (24). Se han desarroll ado metodos que penniten la estimaci6n de la funcion de
supervivencia subyacente basados en los result ados de un analisis multivariante de
regresi6n de Cox; los detall es acerca de esta y de otras aplicaciones del modelo de
Cox pueden hall arse en la creciente literat ura sobre el tema, y en los libros de (exto
ya disponibles sobre anal isis de supervivencia(2S1b) .
EI modelo de Cox lambien se denomina modelo de riesgoJ" I'l"Oporcionales . Este
(ennino enfatiza la suposici6n de proporcionali dad; esto es. el supuesto de que la
exposici6n de interes multi plica a los ri esgos instantaneos de base (los riesgos ins-
(antaneos en los no expuestos) por un factor constante, e
b
(vease Ecuaci6n 7.S) en
cualquier punto durante el seguimiento. Como ilustra la Figura 7.S, esto impl ica que,
independientemente del valor de riesgo inswnuineo de base en el tiempo, los
expuestos tienen un rie.\"go instanuineo igual al riesgo inJ"tantaneo de base multipli -
cado por e
b
. La necesidad de este supuesto esta implfcita en el hecho de que se est i-
ma una razon de riesgos instanuineos para el segui miento completo. Si los riesgos
instantaneos no son proporcionales en el tiempo - esto es, si la razon de riesgoJ" ill.\"
Wntaneos cambia en el tiempo- el modelo necesita tenerlo en cuenta mediante la
estrat ificacion de ac uerdo al tiempo de seguimiento. Esta situaci6n podrfa ser
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 269
adecuadamente descrita como un caso de interacci6n tiempo-exposici6n - vale
decir, una situaci6n en que se presenta modificacion de efecto (vease Capitulo 6) -
en la cual el tiempo modifica la relaci6n existente entre la exposici6n y el desenlace.
Para una descripci6n mas detallada de mNodos de evaluacion del supuesto de
proporcionali dad cuando se aplica el modelo de Cox asf como aproximaciones para
tener en cuenta las interacciones entre tiempo y exposici6n, se remite allector a tex-
tos mas especializados (por ejemplo, Coll et
m
) 0 Parmar y Machin (26)).
7 AS. Regresi6n de Poisson
El modelo de regresi6n de Poisson es otro metodo de analisis de regresion multiple
para datos de una cohorte con desenlace dicot6mico y uno 0 mas predictores categ6-
ricamente definidos. Se trata de una tecnica empleada, sobre todo, en situaciones en
las cual es los desenlaces de interes son tasas (y razones de tasas); especialmente
adecuada para esmdiar enfermedades raras en poblaciones grandes. EI modelo espe-
cifica que la magnitud de la tasa es una funci6n exponencial de una combinaci6n
lineal de covariables y parametros desconocidos:
Esta ecuacion puede ser refonnulada como el logaritmo de la tasa, que es la
variable dependiente de una funcion lineal:
1 Ecuaci6n 7.91
La Ecuaci6n 7.9 es tambien Il amada un modelo log lineal, reflejo de que se trata
simplemente de una transfonnaci6n logarftmica de una variable de desenlace (una
tasa en este caso) relacionada con una ecuaci6n li neal de predictores. Si la Iasa>, se
descompone en sus dos componentes (numero de eventos en el numerador y perso-
nas-tiempo en el denominador) la Ecuacion 7.9 puede se reformulada del siguiente
modo:
log (eventos/persona-tiempo) = b
o
+ b,x, + b 2X2 +
log (eventos) - log(persona-tiempo) = b
o
+ b,x, + b 2X2 +
log (eventos) = log(persona-tiempo) + b
o
+ b,x, + hX2 +
N6tese que en la ecuaci6n anterior el logaritmo persona-tiempo se incorpora
<compensado en terminos estadlsticos) al intercepto (ahora representado como
b
o
*) del predictor li neal multiple, y la variable de desenlace ahora es un conteo, el
numero de eventos (transformados en logaritmos). Para este tipo de variable de
desenlace (un conteo), y para eventos razonablemente raros como los que se evaluan
270 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
en la mayorfa de los est udios epidemio16gicos, se supone que la base mas apropiada
para el procedimiento estadfstico de estimaci6n de los para.metros en el modelo ante-
rior es la distribuci6n de Poisson. (Varios libros de texto ofrecen mas detall es sabre
las propiedades estadfsticas y los lI SOS de la distribuci6n de Poisson. Vease, por
ejemplo, Armitage y Berry(1 2) :
Nuevamente, la interpretacion de los coeficientes de la Regres i6n de Poisson
es ana loga a la de los coeficientes de la regres i6n logfstica y a la de los modelos
de Cox, excepto que donde en estos ult imos modelos se abl iene odds ratio y
raz6n de riesgos instantaneos respect ivamente. en la regres ion de Poisson 10 que
se abliene es la raz6n de fasas. Por ejemplo, cuando se comparan expuestos (por
ejemplo, X I = I) Y no expuestos (t / = 0), la Ecuacion 7.9 se red ucir<i. a 10 si-
guiente:
Para los expuestos: log (tasa."p) = b
o
+ hi X 1 + hX2 +
Para los no expuestos: log (tasaoo.,p) = ho + hi X 0 + b 2X2 +
Sustrayendo las ecuaciones anteri ores: log (tasa." p) - log (tasa
ooup
) = b
l
de manera que:
(
(asa.,xp )
log = log(raz6n de tasas) = b
l
{asa
oo np
Consecuentemente, el antilogari{mo de la es{imacion del coeficiente de regresi6n
(e
bl
) corresponde a la raz6n de tasas que compara expuestos y no expuestos. ajustada
por {odas las o{ras variables incl uidasen el modelo (X2' .. . ,Xk) .
Como se sefial6 anteriormente, para usar la regresion de Poisson, todas las
vari ables independientes (x) necesitan ser categoricas, puesto q ue el metodo esta
de{erminado para usar el monto total de tiempo persona y el numero tota l de
eventos por categorfa 0 celda (que representan a cada combinacion unica de pre-
dictores) . Por ejemplo, la aplicaci6n del metoda de regresion de Poisson al anali-
sis de incidencia de EC en el estudio ARIC, incluyendo las mismas vari ables que
en el mode lo 2 de l ejemplo de la regresi6n de Cox (Tabla 7.20) se muestra en los
datos de la Tabla 7.2 1. La exponenciacion de los coeficientes de la regresi6n de
Poisson produce estimaciones de razones de tasas aj ustadas que sirven para com-
parar expuestos (0 aquellos con la caracterfstica codificada como I) y no expues-
tos.
Para ll evar a cabo el analisis de regresion de Poisson en la Tabla 7.2 1, tuvo que
identificarse cada combinaci6n unica de las 6 variables independientes (total 2
6
= 64
celdas), el numero total de personas liempo, al que cont ri buyeron todos los indivi-
duos en cada celda, tuvo que sumarse y tambien {uvo que ident ificarse el numero
total de eventos ocurridos entre estos individuos . Los datos especfficos por celda tie-
nen el aspecto que puede apreciarse en la Tabla 7.22, en la cual se muestran 8 de las
64 celdas, donde PA indica al numero total de personas-afios en cada celda (log PA
es ellogaritmo de ese valor) y EC es el numero correspondiente de eventos de enfer-
medad coronaria. El d lculo de los coeficientes de regresion (beta) incluidos en la
Tabla 7.2 1 se baso en dichos datos .
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 271
Tabla 7.21
Resultados de un amllisis de regresion de Poisson, de predictores binarios de incidencia
de enrermedad corona ria (EC) en la cohorte del Condado de Washington
en el Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIC),
edades de 45 a 64 alios en el momento inicial , 19871994
Variable
inlerceplo
Genero (hombres", I, mujeres ,,0)
Fuma (si " 1, noe:oO
Edad avanzada' (sf", 1, no ::: 0)
Hipertensi6n" (sf", I. no ,,0)
Hipercolesterolemia'" (si: 1, no ::: 0)
Obesidad .. (sf", 1. no '" 0)
, Edad ., 55 ai'Kls .
Coeficienle de Raz6n de
Regresi6n de Poisson lasas
--6.3473
1.1852 3.27
0.6384 1.89
0,2947 1,34
0,5137 1,67
0.6795 1,97
0.2656
1,'"
.. Tensi6n arterial siSl6Hca ., 140 mm Hg odiasl 6lica ., 90 mm Hg 0 lerapeulica anlihipertensiva .
... Colesl erol oorico 101al ., 240 mgldL 0 I ralamienlo hipolipemianle .
.... [,..tHce de masa corporal ., 27,8 k!}lm' en hombres y ., 27,3 k!}lm' mujeres.
7 A.6. Nota sobre modelos para el amllisis multivariante de datos procedentes
de estudios de casos y controles emparejados y anidados
En los de casos y confroleJ' emparejados (vease Seccion 1.4.5), la tecniea
de an.i. li sis multi variante mas frec uentemente usada es la regresion log6'fica comJi
donal . Este mCiodo es analogo al del modelo de regresi6n logfstica ya presentado
(Seccion 7.4.3), excepto en que los parametros (intercepto y los coefidentes de
regresi6n) se estiman tomado en cuenta ( condidonados P0f),) el emparejamiento
de casos y controles con respecto a las vari ables consideradas con ese fin . La inter-
pretacion de los coefidentes de regresi6n logfstica condidonal es la misma que la
que corresponde a la regresi6n logfstica ordinaria, salvo que estos coefidentes han
de ser considerados aj ustados no solo por las variables incluidas en el modelo sino
tambien par las variables de emparejamiento. Detall es acerca de las propiedades
estadisticas y las aplieadones del modelo de regresion logfstiea condidonal pueden
ser encontrados en otro sitio (por ejemplo, Hosmer y Lemeshow(21 ), Breslow y Day
(27)) . Este modelo es partieularmeme litH para el anal isis de est udios en los que los
casos y los controles estan individualmente empurejudos . Un ejemplo puede hallarse
en el examen transversal de variables asociadas can la arterioesclerosis carotidea en
el est udio ARlC(28). Para este los casos (n = 386) se definieron como indivi-
con allmenfO fiel grosor fie la {nt ima mefi ia (Ci IM, fiefin icion anterior) fie
la arteri a car6tida a partir de mediciones de imagenes del ul trasonido modo B. Los
controles en este estudio se seleccionaron entre individuos con GlM bajo y fueron
emparejados individualmente a cada caso en base a sexo, raza, gntpo de edad (45-54
055-64 afios), centro de est udio y fecha de examen. Al gunos resultados selecciona-
dos de este est udio se presentan en la Tabla 7.23 . Cada uno de los OR en esta tabla
272 EPIDB110LOGfA lNTERMEDlA; CONCEPTOS Y APLlCAClONES

~
'"
N
" "
'" '"
"
'" '"
0 0 0 0

N
"
,
'"
N
"
,
m
'"
,
0
'"
0 N
" " ",
0,
N N
'"
",
, ,
'" '"
ri ~
.,;
"
0
N 0 0
-
'"
W
~ ~ ,
,
~
'" '"
~
N
..,
0, 0,
'"
,
", ", ",
'"

~
0 0
"
,
'"
" '"
~ N

,
'" '"
N ~
,
'"
'"
'"

C

0
C

0 0 0 0

D
"
0
~
,
E
~

.,
~
~
~


ii

0 0 0
~
N
3
;;
N
~ ..

"
K
:0
~

'"

..

c
~
~
..
' .
c
,

0 0 0 0
"
<
'.
K


..



~


"
0
c
~

~
> 0 0 0 0

c. ~
E

~

~
Q

E

0 0 0
,

g
ii

0 0 0




N M
"
N ~
$

'" '" '"
0
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 273
Tabla 7.23
OR ajustados'" para la arterioesclerosis carotidea en relacion a factores de riesgo
cardiovascular sclct:cionados en 386 parejas n de la cohorte del Estudio de Riesgo
de Arteriosclerosis en Comunidades (ARIC) examinadas entre 1987 y 1989
Varlabte y
categoria de referencla
Odds Ratio ajustado
Odds ratio ajustado de manera multlvariada'"
por edad (Intervato (I ntervato de conflanza
de conflanza at 95 %) at 95%)
Actual lumador versus nunca fum6 0 dej6 de fumar 3,3 (2,34,7) 3,9 (2,65,9)
Siempre fum6 versus nuca fum6 2,B (2,04,0) 3,1 (2,1 4,6)
Hipertenso versus normotenso 2,7 (1,9 3,B) 2,9(1,94,3)
LDL cole sterol
., 160 vs < 100 mg/dL 2,6 (1,6 4.4) 2,0 (1,1 - 3,7)
100 - 159 vs < 100 mgfdL 1,6 (1,0 2,6) 1,4 (O,B 2,4)
'Obtenido por regresi6n Iogistica condicional.
,- Emparejados por sexo. raza. grupos de >!dad (45 - 54 0 55 - 64 ai'Kls). centro de estudio y lecha de examen.
,-, Ajustados par edad (como variable continua) y todas las demas variables li sladas en la tabla, ademas de las
variables de emparejamiento.
Fuente: G Heiss el al., Carotid Atherosclerosis Measuroo by BMode Ultrasound in Populations: Association with
Cardiovascular Risk Factors in the ARIC S t ~ , American Journal 01 Epidemiology, Vol 134, 250-256 Cl1991. The
Johns Hopkins University School 01 Hygiene & Public Health.
se obtuvo mediante exponenciacion del estimado del coefici ente de regresi6n (e
b
)
obtenido de un modelo de regres ion logfstica condicionado por las variables de
emparejamiento; por tanto, par definici6n, las est imaciones mostradas en la tabla
estan ajustadas no solamente por todas las variables mostradas en la tabla, sino tam-
bien par los factares de emparejamiento. N6tese que para evitar la confusi6n poten-
cial residual resuit ante deluso de categorfas ampli as de edad para el emparejamien-
w, los invest igadores de este estudio tambien ajustaron por la edad como variable
continua (veanse Secci6n 1.4.5, Figura 1.24, y Secci6n 7.5) .
En los estudios en los cual es los casos y los controles son emparejados por fre-
cuencia (vease Seccion 1.4.5), una estrategia mas eficiente cons iste, simplemente,
en usar regresion logfstica ordinaria e incluir las variables de emparejamiento en el
modelo. Un ejemplo de un estudio pareado por frecuencia, citado en el Capitulo I ,
es eI examen de la relacion entre ant icuerpos de ciwmegalovims (CMV) y arterioes-
clerosis(29). La Tabla 7.24 muestra la asociaci6n entre los niveles de antkuerpos de
CMV en muestras de suero coleccionadas en 1974 y la presencia de arterioesclerosis
carotfdea en el primero de los dos examenes del est udio ARI C ( 1987- 1992)(29). Estos
OR fueron obtenidos a part ir de los coefkientes estimados en los modelos de regre-
sion logfstka que contenfan las variables de emparej amiento (OR eml'arejado.\") Y
variables adicionales por las cuales se ajusta (OR ajll.\/(uJos).
ESflldios lie ca.\"O.\ y contmies anidados, en los cuales los controles se seleccionan
entre los miembros del conjumo en ri esgo, esto es, entre los miembros en ri esgo
de la cohorte en el momento en que oc urre el caso (vease Capitulo I , Secci6n 1.4.2),
pueden ser considerados y anali zados como esmdios emparejados de casos y con-
troles en los cual es los casos y los controles se emparejan segun duracion del segui -
274 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.24
Casos y controlcs, scgun 13 presencia de arteriosclerosis carotidea, ell cl Estudio
de Ricsgo de Arteriosclerosis en Comunidades (ARIC) ell rclacion COli los valorcs
de los nivclcs de anticllcrpos a citomcgaiovirus (CMV), altos 0 modcrados rrente
a positivos y ncgativos en mucstras sericas colcccionadas en 1974
Niveles de OR empareJados" OR ajustados"
anticuerpos (I ntervalo de conllanza (I ntervalo de confianza
de CMV Casos Controles del 95 %) del 95 %)
Saja 31 51
1,0 .... 1,0 ..
Moderado 104 94 1,9 (1,13,2) 1,5 (0,82,9)
Allo 15 5 5,2(1,716,0) 5,3 (1 ,518,0)
, Bajo: raz6n posilivoloogativo<4; Moderado; raz6n de 4 a 19; AIIo: raz6n positivolnegativo '" 20.
o. OR oIltenidos por analisis de regresi6n Iog[slica que iocluye las variables de emparejamiento por fre-
cuencias: edad (categori as de 10 ar'los) y sexo .
... OR obtenidos por analisis de regresi6n log'stica multipfe que incluye las variables de emparejamiento por
frecuencias: edad (categorias de 10 ar'los) y sexo mas la edad de forma continua, el Mbito de lumar (fumador actual
exiumador versus nunca ha fumado), aoos de educaci6n (> 12 vS ,. 12), hipercolesterolemia, hipertensi6n, di abe-
tes y sobrepeso .
.... Categori as de relerencia.
Fuente: FJ Nieto et al . Cohort Study of Infection as Risk Factor lor Carotid Intima-Medial Thic-
kening a Measure of Subcli n;cal Atherosclerosis, Circulation, Vol 94, 922927 11:1 1996.
miento (Figura 1.2 1) . Tal y como ocurre con otros estudios de casos y controles
emparejados, la tecnica de anal isis multivariante mas frecuentemente sugerida es la
regresi6n logfstica condicional en la que la variable condicional es la duraci6n del
seguimiento. Este tipo de modelo de regresi6n logfstica condicional es analogo al
modelo de regresi6n de riesgos proporcionales de COX(30) . Ademas de las ventajas
logfsticas inherentes (vease Capitulo I, Secci6n 1.4.2), el estudio de casos y contro-
les anidados se ha convertido en un di sefio de estudio al que se acude con regulari-
dad como resultado de la extendida disponibi li dad en afios recientes de paquetes
estadfsticos que pueden llevar a cabo este tipo de anal isis condicional. Su creciente
popularidad se puede atest iguar por eI numero creciente de estudios que la ut ilizan.
En el disefio alternati vo a los esturlios de casas y comroles dentro de una cohone
bien definida, los asf llamados eSfudios lie cusos-cohorfe, los casas que ocurren en la
cohone durante el segui miento se comparan con una muestra aleatoria de la cohone
de base (subcollOrfe) (vease Capftulo I , Secci6n 1.4.2). Puesto que se identifica una
muestra de la cohone de base y de los casos que ocurren durante el seguimiento
(vease Figura 1.20), la regres i6n de riesgos proporcionales instantaneos de Cox pue-
de ser empleada para el analisis multi variante en este tipo de estudi o. Debe en-
fat izarse que cuando se emplea este disefio puede producirse heterogeneidad mues-
(ral, puesto que el grupo de casos puede incluir casos que estan y casos que no estan
en la muestra de la cohone. Esta heterogeneidad debe tomarse en consideraci6n so
pena de introduci r sesgos . Afortunadamente, tal y como se ha descrito en otro
sitio(lU2) , el modelo de Cox puede adaptarse a esta situaci6n pennitiendo entradas
tardfas (para los casas fuera de la subcohorte).
A modo de ejemplo de este enfoque, la Tabla 7.25 muest ra los result ados para un
esmdi o descrito al final de la Secci6n 1.4.2. Este es un estudio de caso-cohorte que
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 275
Tabla 7.25
Razones estimadas de riesgos instantiineos crudas y ajustadas de enfermedad
coronaria incidente (e intervalos de confianza al 95%) segun nivel de titulos
de anticuerpos a C. PllelllRolliae en cl momento inicial, 1987 a 1991*
Ajuslado por variables demograficas'
Ajuslado por variables demograficas"
y factores de riesgo'"
Titulos de antlcuerpos IgG
para C. Pneumon/ae
Negatlvo 1:8 1:32
1,2 (0,7 - 2,1)
1,1 (0,6 - 2,3)
., 1:64
1,6( 1,02,5)
1,2(0.7 - 2,1)
, Estimados a parti, kls modekls de regresi6n de riesgos proporcionales ponderados con ent,adas ta,dias para
casos iuera de la subcohorte y estimacklnes robustas de la varianza segim el metodo de Barlow. (>11
,. Edad (continua). sexo, raza y centro.
,., Hatlito de l uma" hipe,coleste,olemia, hipertens;6n, diabetes y nivel educadonal.
Fuente: Datos de FJ Nieto et al. , Chlamydia Pneumoniae Inl ection and locioon Coronary Heart Disease: The
Atherosclerosis Risk in CommunitieS (ARIC) Study, American Journal of Epidemiology, 1101150, 149- 156 <:>199-9, The
Johns Hopkins University School 01 Hygiene & Public Health.
se llevo adelante dentro de la cohorte ARIC que examina la asociaci6n entre ant i-
cuerpos sericos contra C. Pnelllll oniae y EC incidente a 10 largo de un seguimiento
de 3 a 5 anos(33). Los 246 casos incidentes de EC se compararon con una muestra
estratificada de 550 panicipantes de la cohone original empleando un analisis de
regresi6n de Cox . que toma en consideraci6n el tiempo transcurrido hasta el evento
y permite entradas tardfas para manejar el diseno muestral propio del estudio caso
cohone. Como en los ejemplos prcvios, cada una de las razones de riesgos instanta-
neos mostradas en la tabla fueron oblenidas mediante la exponenciacion de los
correspondientes coeficientes de regresi6n del modelo de regresi6n de Cox. Los
resultados de la Tabla 7.25 sugiercn que el ri esgo inslantaneo aparentemente incre-
mentado de enfermedad coronaria en aquellos sujetos con altos niveles de anticuer-
pos a C. Pneullloniae en eI momento inicial puede ser en buena medida explicado
por un efecto confusor positivo de Olros faclores de riesgo.
7.4.7. Modelaci6n de las relaciones no lineales con modelos de regresi6n lineal
Los estudios epidemiol6gicos emplean con frccuencia escalas continuas para medir
parametros fisiologicos u otras caracterfsticas, tal es como las disculidas en el ejem-
plo de secciones previas. Dos definiciones diferentes de tales variabl es fueron
empleadas para ilustrar la aplicaci6n de un IIllmero de modelos de ajuste: cont inuas
(por ejemplo, niveles de tension arterial sisr6lica - Tablas 7. 15 ; 7. 17, Y 7.20 modelo
I) 0 dicotomicas (por ejemplo, hipertensi6n - Tablas 7.18; 7.20, modelo 2; y 7.21).
En esta secci6n se di sc uten brevemente las li mitaciones posibles de estos modelos y
algunos enfoques altemativos.
Para ilustrar los problemas rclacionados con la selecci6n del enfoque modelador,
la Figura 7.9A muestra una relaci6n hipoletica en forma de J, observada (supuesta
276
y
y
, ,
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A
c
-'
o
B
y
:
, ,
---
o
y
:
:
:
............ - ~
Transformada Referencia x,
,
X2 )(3 X4
variabies dummy
Figura 7.9. Ejcmplo hipotCtico de una rclaci{m tipo J (verdadcra) obscrvada cntre X y
ulla variable de dcsclliacc Y (A); B, C y D ilustrall la rclacioll obscrvada (Iinca de pun-
tos) con modclos altcrnativos snpcrpucstos: x continua (8), x dicot6mica (C), y variable
dummy para los quilltil es de x (D)
como cierta) entre un predicwf cont inuo (x) y LI lia variable de desenlace (y). Notese
que aquf y podrfa ser cualquiera de las variables dependientes en los modelos resu-
midas en la Tabla 7.1 4; por ejemplo, una variable cont inua tal como el grosor de la
int ima-media de la car6tida cuanda se usa regresi6n lineal, 0 ellag odd.\" de la anc-
rioesclerosis carotfdea (definida como una variable binaria) cuando se usa regresi6n
logfstica. Este li po de relaci6n ha sido encontrada, por ejemplo, en estudios epide-
miol6gicos del peso corporal y su efecto sobre la monali dad(34JS), en los que ha sido
observado un riesgo mas alto de monali dad en individuos de bajo peso (posiblemen-
(e porque hay una morbilidad cr6nica subyacente), un ri esgo menor en individuos de
peso normal, y un incremento sostenido en la mortalidad en sujetos con sobrepeso
y obesos . (Glros ejemplos de {ales relaciones tipo J 0 U, son aquell os entre el coles-
(erol serico y la mortalidad
W
, y entre el consumo de alcohol y la enfennedad coro-
naria(37)).
La Figura 7 .9B ilustra el empleo de un modelo de regres i6n lineal para explicar
la relaci6n observada entre x e y . Una est imaci6n de l coeficiente de regresion, b,
representarfa el incremento promedio lineal de y (por ejemplo, mortalidad) por un i-
dad de incremento en la variable continua x (por ejemplo, peso corporal); esto es, la
pendiente de la Ifnea recta en la Figura 7.9B. Gbviamente la es(imaci6n de un coefi-
ciente de regresi6n lineal general tal como se muestra en la Figura 7.9B, ignora el
hecho de que, efecti vamente, hay una di.Hllinllci611 de y en el recorrido mas bajo de
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 277
x, con incremento suave de y en la zona media del recorrido de x. y finalmente un
incremento pronundado de y en el recorrido superior de x . Puesto que esro ulti mo es
mas pronundado que el primero, el valor promedio de b result ara positivo; sin
embargo, como se deduce inmediatamente de la Figura 7.98. tal estimad6n no
representa adec uadamente la verdadera relad6n de x con y, en la medida que ella
falsamente la asoc iadon negat iva observada para bajos valores de x y
subest ima la fuerte asodad6n positiva que se vio para valores alt os de x.
Para el modelo mostrado en la Figura 7.9C,x se define como una variable dicot6mi-
ca con las categorfas 0 y I representadas en las abscisas del grafico. ACfUando de este
modo, el modelo supone que hay un fen6meno de umbra!: esto es, que la relaci6n
entre la x y la y es plana para el recorrido mas b..1jO de los valores de x y que hay un
subito incremento en y a partir de cierto umbral x (que es el punto de corte para definir
a x como una vari able categorica), despues del cual no hay incremento adicional en y
en la medida que x se incrementa. El coeficiente de regresi6n estimado en este caso
representa la diferencia en el valor promedio de y entre las categorfas mas alta y mas
baja del recorrido de x (vease Figura 7.6); esto es, la distancia vertical (en unidades de
)') entre las dos barras horizontales que muestra la Figura 7.9C. Como en el modelo
mostrado en la Figura 7.9B, este tambitn pasa por alro un importante rasgo de la rela-
d6n exiSfente entre la x y la y, concretamente, que)' disminuye cuando x crece para
valores bajos de x, mientras que ocurre 10 contrario para los valores elevados.
Uso de mriables indicadoras (dummy)
Para tomar en cuenta estos patrones, se necesitan modelos mas elaborados y comple-
jos. Una opcion, a menudo empleada en epidemiologfa, consiste en dividir la variable
independiente cont inua en varias categorfas (par ejemplo, en cuart il es 0 quint iles), mi-
lizar entonces una variable dumm)' como indicador para cada categorfa y permitir que
la pendiente (el cambio en y) varfe de categorfa en categorfa. A continuaci6n se pre-
senta un ejemplo del uso de variables dumm)' para modelar categorfas multinivel de
una variable independiente que no esta li nealmente reladonada con el desenlace. Con-
sideremos el modelo que se aprec ia en la Figura 7.90. En este panel, el recorrido de
valores de x ha sido dividido en cinco panes: concretamente, en cinco grupos definidos
por los quintiles de manera que cada uno contiene aproximadamente al 20% de los
individuos ordenados de ac uerdo al valor de x de menor a mayor. Un conjunto de
variables dumm)' 0 indicadoras (categoricas) puede entonces definirse, tantas como el
nli mero de categorfas tenga la variable independiente menos uno, cuatro en este caso.
Una de las categorfas se selecciona en calidad de referencia, y a cada una de las res-
tantes categorfas se Ie asigna el valor uno para una de las variables dumm)' y cero para
las otras (Tabla 7.26) . Notese que para la categorfa arbitrariamente elegida como
referenda (el quintil mas bajo en este caso), las cuatro variables dumm)' tienen valor
cero, Cada una de las dumm)' representa a las restantes quintas partes, Asf, el modelo
correspondiente a la Figura.>; 7.9D puede escribirse del modo siguiente:
IEcuadon 7.IOJ
278 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.26
Dcfiniciones de las variables dummy para cI modclo de la Figura 7.9D
Variables dummy
Quinta parte de x
" " "
'"
1 (referencia) 0 0 0 0
2 0 0 0
3 0 0 0
,
0 0 0
5 0 0 0
Debe notarse que estas cuatro variables dUIIIIII)' corresponden a diferentes catego-
rlas de LI lia unica vari able, x . En efeclo, debido ala all sencia completa de intersec-
cion entre estas variables (ningun individuo puede tener un valor de uno para mas
de LI lia de tales variables, simplemente porque ningtin indi viduo puede pertenecer a
mas de uno de esos cinco segmentos mut uamente excluyentes), el modelo en 1a
EClI aci6n 7.10 puedc reducirse a las siguientes ecuaciones para cada LI lia de las quin-
tas partes:
Para los individuos pertenecientes a 1a pri mera quinta parte, todas las variables
dummy tiene un valor de 0, asf y = b
o
Para los individuos pertenecientes a la segunda qui nta pane, donde solo Xl = I ,
Y = b
o
+ b
l
X l
Para inrlivirl uw; penenecienres a ]a rercera '1lJ inla parle, y = ho + h ~ x ~
Para individuos penenecientes a la cuarta quinta parte, y = b
o
+ b) X)
Para individuos pertenecientes a la quinta pane superior, y = b
o
+ b
4
X
4
As!, los coeficientes de regresion tienen la sigui ente interpretacion:
b
o
= valor promedio de y entre los indi viduos de la categorfa de referencia (pri-
mera quinta parte).
b
l
= diferencia promedio en el valor de y entre individuos de la segunda quinta
parte y los de la primera quinta parte.
b
2
= diferencia promedio en el valor de y entre individuos de la tercera quinta
parte y los de la pri mera quinta pane.
b) = diferencia promedio en el valor de y entre individuos de la cuarta qui nta
parte y los de la pri mera quinta parte.
b
4
= diferencia promedio en eI valor de y entre individuos de la ul tima quinta
parte y los de la pri mera quinta pane.
La di fe rencia entre cada quinta parte y una q uinta parle di ferente que no sea la de
referencia se obtiene faci lmente mediante sustraccion de los respecrivos coeficientes
de regresi6n. Por ejemplo, la diferencia ent re la ul tima quinta pane y la segunda
quinta parte puede calcul arse como b
4
- b
l
.
En la Figura 7.9D, b
o
representa el valor de y correspondiente a la barra horizontal
para la categorfa de referencia, y cada una de las otras b representa la distancia ver-
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 279
tical (en unidades de y) entre las barras hori zontales para cada una de las quintas par-
tes y la quinta parte de referenda. En el ejemplo hi potetico que muestra esta figu ra
los valores de hi y h2 seran negat ivos (puesto que el valor promedio de y en sujetos
de la segunda y la tercera qui ntas partes son inferi ores que el promedio del valor de )'
en la primera) mientras que los valores h, y h4 seran positivos. N6tese que la selec-
don de la categorfa de referenda es puramente arbitraria y en buena medida inconse-
cuente. Por ejempl o, puesto que la quinta parte es la categoria con el valor de
)' mas bajo, el cual pudiera ser considerado el recorrido nonnal para x, podrfa haber
sido selecdonada como la categorfa de referenda en el ejemplo anterior. Si esto hubie-
ra ocurrido, ho habrfa representado el valor promedio para los individuos en esta nueva
categoria de referenda, y los restantes b (todos positivos en esta situaci6n) habrfan
sido las diferencias promedio entre cada una de las otras partes y la segunda.
Notese, ademas, que si el modelo de la Ecuad6n 7.1 0 hubiera incluido otras variables,
cada una de las estimaciones para las diferencias entre cada categorfa y la categorfa de
referenda habrfan resultado ajustadas por esas otras variables .
En la Tabla 7.27 se presenta un ejemplo de division de variables independientes
continuas en varias categorias cuando se usa el modelo de regresi6n logfstica multiple.
Esta tabla muestra resultados correspondientes al examen de las asociaciones transver-
sales entre caracterfsticas sociodemograficas y la prevalencia de sfntomas depresivos
entre americanos de origen mexicano que p..1rt icipan en la Encuesta por Examen de
Salud y Nutric i6n Hispanica en los Estados En esla tabla, los coefidentes
de regresi6n logfstica y los correspondientes odds ratio (y los valores de P adjuntos
- vease eSladfstico de Wald en el Apendice A, Secdon A.9) se presentan uno al lado
del otro. N6tese que todas las variables fueron inlroduddas en el modelo como catego-
ricas, incluyendo variables que podrian haber entrado como continuas (por ejemplo,
edad. ingresos). Con la excepcion del sexo y la situacion laboral. todas las variables de
la tabla tienen mas de dos categorfas. Para cada una de estas variables, una de las cate-
gorfas se emplea como referencia (es dec ir, no tiene coeficiente de regresi6n). EI valor
de su odds ratio es, por definidon, 1,0. Todas las olras categorfas han sido modeladas
como variables dumm)' . Para cada ll na de estas categorfas, se estima un coefidente de
regresion logfstica. La exponendacion de dicho coefidente produce una estimad6n
del oddJ" ratio que permite comparardicha categorfa con la de referenda. Por ejemplo,
para la edad, el grupo de edad mas joven (20-24 afios) fue elegido como referenda. EI
coefidente para 25 a 34 afios esO,1866, correspondiente a un odd,\" ratio de eil
lS
I!6 =
12; para el proximo gmpo de edad 35-44 afios, el coeficiente es negativo (-0,1 11 2),
indicando asf que el log odds en esta categorfa es menor que el de la categorfa de
referenda, loque se traduce en un odd.\" ratio inferior a uno (OR = e .(U1 12 = 0,89); y a>; f
sucesivamente. Para afios de educaci6n e ingresos, las categorfas mas alta>; fueron ele-
gidas como referenda>;; de haber elegido los autores las mas bajas, los resultados
habrfan sido los redprocos de aqllellos que se muestran en la tabla. Resulta muy
impon ante reparar en que, como ya se sefial6 antes en esta propia secdon, al descom-
poner la>; variables cont inuas en variables dummy (categori cas), es posible modelar
adec uadamente relaciones no li neales observadas en estos datos empleando un modelo
lineal. Por ejemplo, el uso de dnco variables dummy (mas la categorfa de referenda)
para la edad en la Tabla 7.27 sugiere la presencia de un patron de a>;pecto J invert i-
do, puesto que el odd.\" ratio es mayor para la categorfa (25 a 34 afios) que para la
categorfa de referenda (20 a 24 afios), pero consistente y credentemente mas bajo
para las categorfas de edades mas avanzadas .
280 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 7.27
Amilisis de rcgrcsi6n logfstica para la asociacion entre varias caractcrlsticas
sociodcmograficas y 13 prcvalcncia del cstado depresivo, Encuesta
par Examcn de Salud y Nutricion Hispanica, amcricanos de origcn mexicano
entre 20 y 74 aDos de edad, 1982 a 1984
Caracterfstlca
Inlercepto
Sexo (femenino vs masculinoj
Edad (Anas)
2024
25 34
35 44
4554
55 - 64
6574
Estado civil
Casado
Matrimonio disuello
Nunca se cas6
Arias de educaci6n
06
7 - 11
12
. 13
Ingresos anuales de la vivienda (US$)
0-4.999
5.000 - 9.999
10'()()O19.999
., 20,000
Empleo
(no empleado versus empleado)
Lugar de nacimiento/cultura
Nacido en EE UU/de origen saj6n
Nacido en EE UUlbicultural
Nacido en el e xlranjerolbicultural
Coeliciente de
regresl6n logistlca
-3,11 87
0,8263
0, 1866
-0,1112
-0, 1264
-0, 1581
-0,3555
0,2999
0,7599
0,8408
0. 4470
0,2443
0, 7055
0, 7395
0,4192
0, 2668
-0,3667
-0,6356
Nacido e n el e xlranjero Ide origen mexicaro -0,8729
Odds ratio
2,28
1,00
1,20
0,89
0,88
0,85
0,70
1,00
1,35
2,14
2,32
1,56
1,28
1,00
2,02
2,09
1,52
1,00
1,31
1,00
0,69
0,53
0,42
Valor de P
0,0001
0,11
0,60
0,52
0,32
0, 19
0,18
0,004
0,002
0.014
0,21
0,019
0,009
0,08
0,20
0,004
0,026
0,0003
Fuente: EK Moscicki et al., Depressive SymplOOls among MexicanAmericans:The Hispanic Health and Nutri
tion Examination SUlVey, American Journalof Epide:niology. Vol 130. 348360 1C1989, The Johns Hopkins University
School 01 Hygiene & Publ ic Health.
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 281
EI uso de las variables dummy es en ocasiones ineludible, como cuando se modelan
variables categ6ricas politomicas no ordinale.\ tales como situaci6n marita!>, 0 dugar
de nacimiento/cultura en la Tabla 7.27. Por ejemplo, un hall azgo potencialmente
importante de este ami.lisis es que, comparado con sujelos nacidos en los E.>;tados Uni-
dos, americanos de origen mexicano anglo-orientados, la prevalencia de un estado
depresivo parece ser significal ivamenle menor entre los nacidos en el extranjero, pani-
cul annente entre aquellos que son de ori gen mexicano. Nuevamenle, es imponanle
considerar que el estimado para cada cada variable se aj usta por lodas las Olras variables
que ap..1recen en la tabla. Las variables no incluidas en el modelo. sin embargo, podrian
aun confundir estas asociaciones (vease Seccion 7.5); adema.,>, las inferencias causales
basadas en los datos mostrados en la Tabla 7.27 pueden estar afectadas por su naturale-
za transversal y los sesgos relacionados con esta (vease Capftulo 4, Seccion 4.4.2) .
Con respecto a variables continuas 0 categ6ricas ordinales, las variables dummy
pueden servi r como un paso intermediario 0 exploratorio para evaluar si es apropiado
un modelo de Ifnea recta, 0 si algunas categorfas tienen que ser redefinidas 0 reagrupa-
das. Por ejemplo, despues de mirar [os resultados mostrados en la Tabla 7.27, se podria
simpli ficar la definici6n de la variable dngresos mediante la agrupaci6n de las dos
categorias de < 10.000 USD en una sola, en vista de que sus odds de depres i6n aparen-
tan ser homogeneos. Ademas, debido a [a aparici6n de un incremento li neal aproxi-
mado en los odds de depresi6n de acuerdo al decrecimiento de los niveles de educa-
ci6n, los autores podrian haber simplificado mas el modelo mediante el remplazo de 3
variables dummy para educacion con una unica variable ordinal (de I a 4 0 de 0 a 3); e[
valor del coeficiente en el ultimo caso podrfa interpretarse como el incremento en el
log odds por unidad de incremento (0 disminuci6n en este caso) en el nivel de educa-
ci6n, En otras palabras, el ant il ogaritmo de este coeficiente serfa la est imaci6n del OR
que compara cua[quier par de categorfas ordinales adyacentes de educaci6n (es decir,
comp..1rando aquellos O!: a 13 afios con los que tienen 12 afios, 0 aquellos con 12 afios
con los de 7 a II afios, 0 aquellos de 7 a I I afios con los de 0 a 6 afios) .
EI ult imo enfoque, frec uentemente usado en epidemiologfa (como cuando se rede-
finfan los niveles de ciertos parametros sericos, nutrientes, etc., de acuerdo a cuartiles,
quintil es, etc,) es esencialmente equivalente a usar una variable cont inua, excepto en el
hecho de que los valores posibles de x estan ahora restringidos a valores enteros de I a
4,0 de I a 5, y asf sucesivamente. Las ventajas de este enfoque, comparado con un
modelo mas complejo que incluya cierto numero de vari ables dummy son que ( I) el
modelo result ante es mas parsimonioso y mas simple de expli car (vease Secci6n 7,7)
(2) la prueba estadfstica de los correspondientes coeficientes de regresi6n (veanse la
proxima Seccion y el Apendice A, Seccion A,9) es el analogo multivariante ajustado
de la prueba para eval uar la relaci6n dosis respuesta descrita en el Apendice B, Es
importante tener en mente, sin embargo, los peligros implfcitos en el uso de estas defi-
niciones ordinales de las variables independientes sin considerar la posible presencia
de patrones, tales como los representados esquematicamente en la Figura 7,9A,
Tecnicas altemativas para la mode/adon de asociaciones no lineales
EI uso de funciones matematicas mas complejas constit uye otro enfoque para modelar
asociaciones p..1ra las cuales una funci6n lineal simple (por ejemplo, una Ifnea recta)
parece no constimir un aj uste adecuado, Ejemplos de estos modelos alternativos in-
282 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cluyen el uso de terminos cuadciticos (con 10 ellal puede modelarse una relad6n curvi-
Ifnea simple) 0 fundones mas complejas de tipo polinomial, 0 de alros tipos para
modelar relaciones con aspec(O de U 0 de J (por ejemplo, Figura 7 .9A). Aunque una
di sclI si6n de estos modelos esta fuera de la perspectiva de este li bra (vease, por ejem-
plo, Armitage y Berry (12)), en las Fi gura.>; 7. 10 Y 7.1 I se recogen dos ejemplos.
La Figura 7.1 0 se basa en un estudi o que examin61a relaci6n entre IMe y por-
centaje de grasa corporal en varias poblaciones de descendientes de africanos(3<J) . La
Figura 7.lOA mucstra el diagrama de dispersi6n. para los sujc{Os masculi nos y
femen inos combinadas, del subconj unto de Nigeria en esc estudio: mientras que las
Figuras 7.10 B Y C muestran Ifneas de regresi6n estimadas por separado para hom-
bres y mujeres. N6tese que despues de evaluar diferentes opciones de modelaci6n,
los autores concluyeron que la relaci6n entre el IMC y la grasa corporal queda mejor
descrit a por un simple modelo lineal en los hombres.
% Grasa corporal = - 2 1,37 + 1,5 1 (IMC)
en tanto que para las mujeres fue necesario adoptar un modelo curvilfneo (que inclu-
ye un termino cuadratico):
;;
&
60
8
50
40


30


20
. ~
~ 10
~
0
~
"
60
~
A
8
50
40


30
~
20
. ~

~
10
0
~ 0 10 20 30 40 50 60
Indice de masa corporal
B
Hombres
/// /
0 10 20 30 40 50 60
Indica de masa corporal
;;
&
8





. ~
~
~
~
60
50
40
30
20
10
0
C
Mujeres
0 10 20 30 40 50 60
Indice de masa corporal
Figura 7.10. Rclncioncs entre el Indice de mnsn corporal y cI porccntnje de grnsa corpo-
ral para hombres y mujeres ell Nigeria , 1994-1995. A. diagrama de punlos de los datos
crudos (hombres. +: mujeres. 0). 8 Y C, lfneas de regresi6n estimadas para hombres y muje-
res. respectivamenle.
Fuenle: reproducido con permiso de A Luke el al. , Relation Between Body Mass Index and Body Fat
in Black Population Samples from Nigeria, Jamaica and the United States. American Journal of Epide
miology, Vol 145, 62()"628 1997, The Johns Hopkins University School 01 Hygiene & Public Health.
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 283
% Grasa corporal = -44,24 + 4,0 I (IMC) - 0,043 (IMCr
La Figura 7. 11 procede de un estudio por simulaci6n de la dispersi6n de dos enfer-
medades trasmit idas sexualmente (gonorrea y clamidiasis) basada en diferentes supues-
(OS concemientes a patrones de transmisi6n(-iO). La Figura 7.11 , espedficamente, muestra
la prevalencia de estas enfennedades de acuerdo a la tasa de contacto efectiva (una fun-
ci6n de la media y la varianza del nlimero de parejas sexuales): en la fi gura se muestran
las prevalencias estimadas (observadas) en cada una de las simulaciones (los puntos), asi
como los modelos estadfs{icos esti mados que mejor se ajustan a los datos observados
para (;,uJa t:nft:nm:tlatl . Estas fundont:s son li tilt:s para la prt:tlk-
ci6n (vease anterionnente) . Por otra pane, ninguno de los parametros de estos modelos
(por ejemplo, b) = 1,89) tiene una interpretaci6n clara en tenninos de resumen de la aso-
ciaci6n entre las variables de imeres (por ejemplo, tasa de contac(Q efectivo y prevalen-
cia de gonorrea) . EI compromiso emre la simplicidad y la interpretabilidad por una par-
te y el ajuste adecuado por otra, esta en el centro del arte y la ciencia de la modelaci6n
estadistica, tal y como se sefiala brevemente en la secci6n de resumen de este Capitulo
(Secci6n 7.7).
10,0
o gonorrea
j. clamidia
8,0
,
6,0

0
c



4,0
2,0
0,0 ..
0,0 2,0




..
4,0
Tasa de contacto e/activo


0


6,0 8,0
Figura 7.11. Modclos de simulacion para la di spersion de la gonorrea y la Chlamydia
tracllOmatys: las t asas de prcvalenda de gonorrea y clamidiasis (como porcentajes de la
pobladon modelo) como rundon de las t asas de contacto crectivo. Cada punto representa
una ileraci6n de la simulaci6n. Las lfneas s6lidas represenlan funciones hiperb6licas de la
forma y = [bo(x - b ) ]1 [b,+ (x - b)].las cuales fueron ajusladas a los puntos con un progra-
rna de ajuste curvilfneo no lineaL En esta eCllaci6n, y es la prevalencia y x es la tasa de con_
tacto efectivo: el valor del panimetro estimado resullanle fue: para gonorrea . b
o
= 10.08. b) =
I .89. b, = 3.18. y para la clamidiasis, b
o
= 11,12, b
l
= I ,85, b, = 2.0.
Fuente: reproducido con permiso de M Kretzschmar, YTHP van Ouynhoven. and AJ Severijnen,
Modeling Prevention Strategies for Gonorrhea and Chlamydia Using Stochastic Network Simulations,
American Journal of Epidemiology, Vol 144, 306-317, 1996, The Johns Hopkins University School 0/
Hygiene &Public Health.
284 EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
7.4.8. I'ruebas estadisticas e intervalos de confianza para las estimaciones
de la regresi6n
Los va lores de los parametros del modelo de regresion lineal , tra.tese del caso sim-
ple (Seccion 7.4.1 ) 0 del multiple (Seccion 7.4 .2,), se estiman mediante el metodo
de III/nilllo.\" cuadrado.\" ordil/ario (MCO). Este metodo de estimaci6n es bastante
senci ll o y, en el caso de la regresi6n lineal simple, puede resolverse con una calcu-
ladora de bolsillo; para la regresion lineal multi variame, sin embargo. se requiere
algebra matricial. Por otra parte, el metodo de los mfnimos cuadrados simples no
puede ser empleado para los otros tres metodos de regresi6n descrit os en las seccio-
nes precedentes. Los metodos de la regresi6n logfstiea, la regresion de Cox, y la
regresion de Poisson requieren un proceso it erati vo de est imacion basado en el
metoda de I/uixillla veroJ'illlilirud (MMV), tarea notablemente all anada por las
modernas computadoras y los programas informatieos estadfst ieos (una introduc-
cion general de los principios de la verosimilitud y el MMV, puede hall arse en
Clayton y
Como con cualquier otra estimaci6n eSladfstica, los parametros de regresi6n
obtenidos cuando se emplea MCG 0 MMV estan sujetos a la incertidumbre inheren-
Ie a la variabi li dad muestral. Asf, ademas de los coefieientes de regresion, los al go-
ritmos de eslimacion proveen el errorestandar asociado al parametro estimado (vea-
se, por ejemplo, Tabla 7.1 6) . Con la estimadon puntual del coeficiente de regresi6n
y su error estandar (en cualquiera de los metodos de regresion descritos en la seccio-
nes precedentes) puede reali zarse una prueba de hi potesis para evaluar si el coefici-
ente de regresion en cuesti6n es 0 no estadfslieamente significativo: esto es, si la
hi potesis nul a (Ho: f3 = 0) puede ser rechazada con un cieno nivel de significad6n
(error alfa) . Esta prueba, que emplea elliamado de Waltl, se describe bre-
vemente con algunos ejemplos en el Apendice A, Secd6n A.9. Similarmeme, puede
construirse un intervalo de confianza para el valor de los coefidemes de regresi6n
empleando la estimad6n puntual y el error estandar del coefidente de regresi6n
(vease Apendiee A) . Como se ilustra en los ejemplos del apendice, para modelos
multiplicat ivos (por ejemplo, logfstieo, de Cox, de Poisson), la exponenciacion de
los extremos inferior y superior de los intervalos de confianza para los coeficientes
de regresi6n da lugar a los Ifmiles de confianza correspondiemes para las medidas
multipl ieat ivas del efecto (por ejemplo, odds ratio. razon de riesgos instantaneos,
raz6n de tasas).
Ademas del estadfstico de Wald y los Ifmit es de confianza para evaluar la re le-
vancia estadfslica de cada para metro de regresion estimado. Olros parametros esti-
mados 0 pruebas son utiles para la comparacion de diferemes modelos; estos
incluyen el valor de R2 en el comexto de la regresi6n li neal, el cual da una es-
timaci6n de la proporci6n de la varianza de la variable dependiente explicada por
las variables independientes, asf como la prueba de la raz6n de verosimilirud
(PRV), una prueba de significadon que compara modelos procedentes de metodos
de regresi6n basados en MMV. Adieionalmente. existen varias tecnicas numerieas
y graficas susceptibles de ser empleadas para evaluar los supueslOs estadfslicos y
el ajusle de los datos a un modelo partie ul ar 0 a un conjunto de variables indepen-
dientes. Para tener mas detalles acerca de estos met odos, eI lec tor puede acudir a
textos mas avanzados, tales como los sigui entes: Armitage y Berry (1 2), Kl einbaum
et al . 0 Clayton y Hill s (4 1).
ESTRAT1FlCACl6N Y AJUSTE: ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 285
75. AJUSTE INCOMPLETQ, CONFUSION RESIDUAL
EI problema de la confusi6n res idual, presente cuando el ajuste no elimina completa-
mente el efecto de confusion debido a una variable dada 0 a un conjunto de variables,
fue introducido en el Capitulo 5, Secci6n 5.4.3 . Las fuentes para el ajuste incompleto 0
confusion resi dual son diversas; las mas importantes se discuten de inmediato.
1. Definicion inadecuada de las wregor[as de la variable de confuJion . Esta-
mos en ese caso. por ejemplo. cuando se intenta el ajusle por una variable
continua utilizando categorfas que son excesivamente amp lias. As!, la Tabla
7.28 muestra los resultados de diferentes alt ernativas para el ajuste de la edad
cuando se explora la relaci6n transversal entre la situacion de la mujer en rela-
cion a la menopausia y la EC prevalente empleando datos no publicados pro-
cedentes del estudio ARlC. La disminuci6n en el odds ratio cuando se ajusta
por edad como variable continua, indica que los estimados ajustados por
edad usando definiciones categoricas de la edad no eli minaron por entero su
efecto confusor. La inferencia de que la mejor alt ernati va para el ajuste de la
edad en la Tabla 7.28 es el modelo que emplea la edad como una variable con-
tinua, requiere obviamente la suposicion de que la prevalencia de EC se incre-
menta li nealmente con la edad a 10 largo de todo el recorrido de edades de los
part ic ipantes en el estudio. Este es un supuesto en principio correclo en este
ejemplo particular, dado la estrechez relativa del recorrido de edades de la
poblaci6n en estudio (mujer<!s de edad media). Sin embargo, podria no ser ese
el caso de otras situaciones. Por ejemplo, si el recorrido de edades de los indi-
viduos en el estudio cubriera toda la vida, un modelo lineal no seria razona-
ble. ya que la tasa de incremento por edad del riesgo de EC es diferente entre
indi viduos mas j6venes que entre indi viduos de mayor edad. En esta situa-
cion. un modelo similar al nlimero 3 de la Tabla 7.28 (que define la edad cate-
goricamente) podria haber sido el mas apropiado. Otro ejemplo de confusi6n
potencial residual se relaciona con el ajuste seglin habito de fumar empleando
categorias de definicion tales como fuma en la actuali dad , ex fumador, 0
nunca fumo. La variabilidad en la dosis acumulada dentro de las primeras
Tabla 7.28
Relacion transversal entre menopausia natural y enfermcdad coronaria (EC)
pre\'alente, Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIC),
edades 4564, 19871989
Modelo
Crudo
2 Aiustado por edad usando dos categor ias:
4554 y 55-64 anos (Mantel Haenszel)
3 Ajustado par edad usando cuatro categorias:
4449, SO-54, 55-59 Y 6064 anos (Mantel-Haenszel)
4 Ajustado par edad como variable continua
(regresi6n logistical
OR
4.54
3,35
3.04
2.47
Intervalo de
conflanza al 95%
2.677,85
1,60 6,01
1,37-6.11
1.314,63
286 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
dos categorfas (es decir, en el nli mero promedio de cigarrillos diarios 0 de
paquctes por ana, tiempo desde que se abandono el habito, etc.) puede ser
grande, producicndo en tal caw una confusi6n residual importante clI ando se
evaluan relaciones entre variables confundidas por el habiw de fumar.
2. La variable empleada para eI ajl/sle eJ" lin sueet/tineo ill/perfecto de la con(li-
ci6n 0 fa por fa waf se desea ajustar. Para una vari able dada en
un estudio epidemiol6gico, es importante considerar el problema de su vali-
dez por construCfo: esto es, el grado en el ell al ella representa la exposicion 0
el desenlace que supucstameme representa(42). Un ejemplo Ifpieo que conduce
a la confusion residual es eI usa de la educaci6n para ajustar por clase social
cuando se evaluan diferencias ctnicas (por ejemplo, diferencias entre blancos
y negros) en un desenlace dado, ya que pueden existir diferencias residuales
en eI acceso a bienes y nivel de ingresos entre grupos raciales 0 etnicos, e
incluso denrro de cada categorfa de un nivel
3. Orms ill/portanres no jilelVn incluitfos ell elll/Olfelo. Si algunas de
las variables de confusi6n se dejan fuera del modelo, el est imado aj ustado
obviamente aun estara confundido. Los resul tados en la pri mera fil a de la
Tabla 7.25, por ejemplo, se aj ustan por variables demograficas. Si ellos hubie-
ran sido los unicos resul tados di5ponibles (bien debido a que se careciese de los
datos sobre los posibles confu5ores adicionales considerados en el segundo
modelo, bien porque estos datos, aunque disponibles, hubieran sido considera-
dos no impol1antes por los investigadores), su interpretaci6n habrfa sido que un
alto nivel de anticuerpos a C. pneullloniae se asociaba con un incremento del
60% en la razon de riesgos instantaneos ajustada>, de enfermedad coronaria.
N6tese que incl uso el segundo modelo, que implica que la asociaci6n es debil 0
inexistente. puede estar sujeto a confusi6n residual. debido a la no inclusion de
confusores adicionales (no medidos 0 desconocidos). Gtro ejemplo es el estudio
que muestra una asociaci6n entre act ividad sexual frecuente y baja mortali -
dad(-U), discutido en el Capit ulo 5, Secci6n 5.4.3. Como se mencion6 entonces,
la monali dad mas b.. 1ja de los part ici pantes en el estudio con una frecuencia mas
alta de relaciones sexuales persi5t i6 luego de ajustar mediante regresion logfst i-
ca multiple por cierto numero de presuntas variables confusoras . En su discu-
si6n, los autores de aque! est udio espec ulaban que los confusores desconoc idos
pudieran ser responsables de tales resultados. Aunque ellos no discut ieron que
vari ables especffi cas pudieran ser responsables de la confusion residual, al
menos dos posibilidades pueden sugeri rse: primero, la clase social, importante
determinante tanto de la enfennedad como de la mOl1ali dad, se tuvo en conside-
racion solo de manera muy cmda mediante una variable ocupacional dicotomi-
ca (ocupaciones manuales y no manuales); por tanto, una confusion resi-
dual sustancial puede haber pennanecido. Por otra parte, la unica enfermedad
prevalente por la cual se ajust6 fue la enfermedad coronaria; otras enfermedades
que afectan tanto la actividad sexual como la mortalidad (por ejemplo, diabetes,
quizas condiciones psiquiatricas) no fueron aparentemente consideradas y
podrfan ser responsables de ciena confusi6n residual.
4. Errores de clasiJicacion ell las de confusion. Gtra fuente de confusion
residual es la dasificadon erronca de los confusores, 10 cual desemboca en ajus-
tes imperfectos(-Is
l
. Por ejemplo, si no hay asociaci6n causal entre la exposici6n y
el desenlace, pero la asociaci6n confundida se refleja en un riesgo relativo u odds
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 287
ratio mayor de 1,0, entonces el ajuste por confusores mal c1as ificados puede no
producir un riesgo relati vo u OR ajustado de 1,0. Un ejemplo de este fenomeno,
basado en datos hipoteticos, se presenta en la Tabla 7.29. Dicha tabla muestra los
mismos datos de la Tabla 7.1 (parte izquierda); en este ejemplo, aunque el OR
cmdo sugiri o que, comparados con las mujeres, los hombres tenfan un ri esgo de
malaria un 7 1 % mayor, en anali sis estratificados por ocupaci6n tal asociaci6n
desaparece y el OR
MH
ajustado por ocupaci6n pasa a ser I ,0 I (veanse Secciones
7.2 y 7.3.3) . Cuando ocurre una c1asificaci6n erronea de los confusores (parte
derecha de la tabl a). el resultado ajuslado del (1.30) se afecta por confu-
si6n residual y fracasa en su imento de eliminar completamente eI efecto de la
confusion que produce la ocupacion. N6tese que el ejemplo en la Tabla 7.29 es
uno de los casos mas simples de error de c1asifi caci6n: es no diferencial y solo en
una direcci6n. Pat rones mas compl ejos de este error de clasificaci6n (por ejem-
plo, direccional 0 diferencial) pueden conducir a consecuencias impredecibles en
terminos de la magnillld de los est imados ajuslados.
Tabla 7.29
Datos hipotCticos que muestran la confusion residual resultante del error
de clasilicacion no diferenciai de una variable confusora (estado ocupacional )
Hombres
Mujeres
Tolal
TOOos los Casos y Con/roles
Casos
88
62
150
Conlroles
68
B2
150
Tolal
156
144
300
OR::: 1,71
CLASIFICADOS CORRECTAMENTE
$iluaci6n ocupacionaJ"
CLASIFICADOS INCORRECTAMENTE
$iluaci6n ocupacional"
Ocupacionf:s propias de espacios atJierlos
Casas Conlroles Tolal Casos Conlroles Tolal
Hombres 53 15 68 OR::: 1.06 35" 10 45 OR::: 1.00
Mujeres 10 3 13 7 2 9
Tolal 63 18 81 42 12 54
Ocupaciones propias de espacios cerrados
Casas Conlroles Tolal Casos Conlroles
Hombres
I
53 88
I
53" 58 111 OR::: 1,33
Mujeres 79 131 OR::: 1.00 55 eo 135
Tolal 87 132 219 108 138 246
OR .... correcto :o 1,01 OR .... mal clasificado " 1 ,30
V6,,"() T"blo 7.t .
.. Error de clasificaci6n no diferencial: un tercia de todos los individuos con ocupaciones principalmente en
espacios abiertos (independientemente del sexo 0 de que se trate de un caw 0 de un control) se ciasihcan errnooa-
mente atribuyendoles ocupaci6n principafmente en espados cerraoos (todos los numeros err6neamente
se redondean af entero mas cercano). Por ejerrplo, de los 53 casas masculi nos con ocupaciones en espados abler-
tos, 18 (_ 53 X 0,333) se err6neamente como individuos que trabajan en espacias cerrados, 10 que deja a
35 sujetos en esa cekfa; a su vez, 53 casos masculinos (35 correctamente ciasificados + 18 erroooamente clasilica-
dos) se incluyen ahara en el estrato correspor.ciente a ocupaciones en espados cerrados
288 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.6. SOBREAJUSTES
Tal y como se mencion6 en el Capitulo 5 (Secci6n 5.2.3), el aj uste para una variable
dada impli ca tambicn un ajuste, al m ~ n o s parcialmente, para variables relacionadas
con ella. As!, clI ando se ajusta para el nivel educacional, implkit amente se ha produci-
do tambien un ajuste por ingreso, al menos en derta medida. Como se menciono pre-
viamente, dependiendo de las caraclerlsticas especfficas de la poblaci6n que se est u-
dia, el ajuste por residencia puede resultar en ajustes por variables relacionadas, {ales
como sit uad6n socioeconomica 0 enloma etnico. El sobreajllJ"fe (0 sobreempareja-
miento para una variable ajustada por conducto del emparejamiento) se dice que OCll -
rrc cuando se ajusta inadvertidamente para una variable que, 0 esta en eI camino causal
que vincula la exposici6n con el desenlace (siendo asf una causa dntermedia>,), 0 tiene
una relad6n tan fuerte con la exposicion 0 con el desenlace, que la verdadera relaci6n
se di storsiona(46). EI sobreajuste puede, por 10 tanto, oscurecer eI verdadero efecto 0
crear un efecto aparente que realmente no existe(47) .
Un ejemplo 10 aporta el ajuste por hipertension en ocasi6n del examen de la aso-
ciacion entre el sobrepeso y el accidente cerebrovascular hemorragico. ?uesto que la
hi pertension es probablemente el mecanismo mas comun para explicar esta aso-
ciacion, el aj uste por concepto de este rasgo puede condudr a un oscuredmiento de
la relaci6n entre la obesidad y el accidente cerebrovascular. Como se di scuti6 en el
Capitulo 5, serfa , sin embargo, apropiado aj ustar por una causa intermedia 0 un vin-
culo ffsico 0 biol6gico cuando se evalua la presencia de efectos residuales debido a
mecanismos alt ernati vos.
EI sobreajuste puede tambitn oc urrir cuando se ajusta por una variabl e Intima-
mente relacionada con la exposid6n de interes. Un ejemplo tfpico de sobreajuste
notable es eI que introduce el ajuste por residencia cuando se estudia la relaci6n de
la contaminaci6n ambi ental con las enfermedades respi ratorias. Otros ejemplos
incluyen situaciones en las que diferentes variables que representan constructos
solapados se ajustan simult aneamente; tal es el caso cuando en el mismo modelo de
regresi6n se incluyen educad6n, ingresos, ocupaci6n y medidas de ingreso agrega-
das (ecoI6gicas) u otros indicadores socioeconomicos. Puesto que todas estas varia-
bles son marcadores de clase sodal , su colineali dad producirfa coefidentes de
regresi6n difkil es de interpretar y hasta carentes de sentido.
El problema del sobreajuste subraya la necesidad de considerar los detenninantes
biol6gicos de la relaci6n que se valora. as f como reali zar una evaluaci6n cuidadosa de
las reladones entre las variables de confusi6n postuladas, por una parte, y la exposi-
ci6n y las variables de desenlace por otra , como se di sc mi6 en el Capft ulo 5.
7.7. CONCLUSION
Nll es/ro propOsi/o es descllbrir y I'lilorar la lIal liraleza y la slis/allcia del alma, v. solo
el1toIlLes. todos los aLTidell/es penelleciell/es a ella.
Arist6teles (citado por Durrant (-Ill . pI, i .. IS,)
Los modelos estadfsticos son resumenes concept uales y mat ematicos que estable-
cen la presencia de un derto patr6n 0 asociaci6n entre los elementos de un sistema
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 289
(por ejemplo. factores de riesgo conjeturados y la enfermedad). EI epidemiologo
empl ea mOOelos estadfsticos para sinteti zar concisamente patrones mas amplios en
los datos e interpretar eI grado de evidencia en un conjunto de dalos relevanle a una
hip6tes is particular (49 Pas 106-1) . Cuando se intenta ident ificar patrones de asociaciones
entre exposiciones y desenlaces en epidemiologfa, el prop6sito del proceso modelador
usualmente es hall ar el modelo estadfstico mas pan'imonioso - esto es, el modelo mas
simple que describa satisfactoriamcnte los datos. Una manera simple de comprender
esta idea es concebir el mOOelo estadfstico como un bOJ'quejo 0 una caricarura de la
asociaci6n que se investiga. Por tanto.la mOOelaci6n estadfstica podria verse como un
proceso anaJogo al que sigue un caricaturista tratando de hall ar las pocas Ifneas con las
cuales capturar la esencia del personaje que esta siendo caricaturi zado, como se Hustra
en la Figura 7. 12 . Los cual ro paneles en esta figura pueden ser concebidos como cua-
lro mOOelos del presidente de los Estados Unidos William J. Cli nton. EI modelo en
la Figura 7.l2A es el mas simple pero fall a en representar efectivamente a la persona
que se esta Iratando de rellejar (la mayor parte de las personas no reconocerfan al pre-
sidente Clinton si solo se exhibiera esta figura). Algunas, pero no IOOas las personas,
reconocerfan a Cli nton si unicameme se les muestra la Figura 7. 128 , pero virtualmen-
Ie tOOos 10 reconocerfan en el bosquejo contenido en la Figura 7 .l 2C. Asf, cuando se
procura hall ar un modelo sucinto, parsimonioso, para describir la esencia de un indivi-
duo, las altemativas contenidas en las Figura 7. 128 Y 7.1 2C sedan las mas adecuadas.
EI modelo de la Figura 7.1 20 se ajusta mejor a ios datos pero pagando el precio
de hacer que cada uno de los elementos contenidos en el bosquejo sea menos lit H a los
efectos de captar la esencia de este individuo.
Este proceso es simil ar al prOOucido cuando se emplea la modelaci6n estadfstica
en el analisis epidemiol6gico. Tal y como sefiala Zegeri
49
), los modelos estadfsticos
deberfan considerarse como herramientas para la ciencia mas que <<J eyes de la
naturaleza: Los modelos estadfsticos para los datos IIIlIIca .wn verdaderos . Si un
modelo es 0 no verdadero es irrelevante. Una pregunta mas apropiada es si obtene-
mos la conclusi6n cientffica correcta cuando suponemos que el proceso bajo estudio
se comporta de acuerdo a un modelo estadfstico particular (49.p.g. 1(64) .
La pregunta crucial entonces es si el modelo se ajusta a los datos razonabl emente
bien con la finalidad de ayudar al investigador a obtener inferencias apropiadas. Esto
significa que preguntas como si el valor estimado para el parametro (por ejemplo, hi =
0,0025 mm en la Tabla 7.1 5, modelo I) es una estimado perfecto de la verdadera
relaci6n entre la tension arterial Sisl61ica y el grosor de la fntima-media carotfdea, 0 si
la verdadera relacion entre estas dos variables es eXaCf(/mellfe li neal (por ejemplo,
Figura 7.4) no son tan importantes. Frecuentemente, las preguntas relevantes son si
hay un incremento mas 0 menos lineal y cual es el incremento promedio aproximado
sobre y por unidad de x luego de controlar por ciertas covariables. Sin embargo, debe
enfat izarse nuevamente que, como en el ejemplo de la Figura 7.9, un mOOelo nunca
debe ser adoptado por el solo hecho de que sea simple si no consigue describir adecua-
damente la asociaci6n de interes (por ejemplo, Figuras 7.980 C).
EI atractivo de los modelos li neales simples radica precisamente en su simplici-
dad y en la interpretabilidad de los parametros, tal y como ocurre con la Ifnea recla
que expresa el incremento esperado en el grosor de la fnt ima-media carotfdea para
un aumento dado de la tensi6n arterial sist61ica (Figura 7.4) . Suponiendo que el
modelo es apropiado (es decir, que la asociaci6n es li neal) es posible calcular los
paramelros (interceplO y coeficiente de regresion lineal de la recta) que mejor se
290 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A
c
B
o
~
D
Figura 7.12. Construcci6n de un modelo del presidente Clinton.
Fuente: Kevin KAL Kallaugher, 1986, BaHimore Sun Cartoonists and Writers Syndicate.
corresponderfan a los datos (Ec uaci6n 7.2). As!, el supucsto es que la linea en la
Figura 7.4 relleja la verdadera esencia de la relaci6n existente entre la tensi6n arte-
rial sist6lica y el grosor de la Int ima-media y que la nube de puntas alrededor de la
lfnea (los datos observados) es simplemente milia (vale decir: variabilidad dentro de
individuos 0 error aleatori o).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 291
La misma 16giea se apl iea para situaciones que incorporan las relaciones mut uas
entre diferentes variables correlacionadas tanto con la exposicion (par ejemplo, ten-
si6n arteri al sist6lica) como con el desenlace (por ejemplo, grosor de la fntima-
media), tales como los modelos del 2 al 4 en la Tabla 7. 15. Estos modelos de regresion
mult iple 0 IIIlIlrivarianreJ", a la vez que no dejan de asumir que la relaci6n entre estas
variables es li neal, definen un esp?.cio mult idimensional donde pueden contemplarse
las relaciones mut uas entre la variable dependieme y las independientes. As\, cada esti-
maci6n de estos modelos de regresi6n multi ple (cada coeficiente de regresion) se diee
que ha sido ajl/Mado par todas las otras variables en el modelo. aunque es imponante
considerar siempre las limitaciones potenciales de este tipo de inferencia, como se dis-
cute en las Secciones 7.5 y 7.6. La discusi6n precedente es valida para tOOos los mOOe-
los li neales generales presentados en las secciones anteriores de este Capftulo (vease
Tabla 7.14), los cuales difi eren solo con respecto al ti po de vari able dependiente y,
consecuentemente, a la interpretacion del coeficiente de regresi6n correspondiente.
Puede producirse, desde luego, que los datos no se ajusten a uno de eS(Qs mode-
los <<li neales simples. Por ejemplo, si se observa el ti po de nube de puntos de las
Figuras 7.9, 7.10, 0 7.1 1, probablemente serfa necesario usar algun enfoque de
modelacion mas complejo de entre aquellos discut idos en la Seccion 7.4.7 (vari ables
(fUIIIIIIY, terminos cuadratieos, etc.). Ademas, si se sospecha que dos 0 mas de las
covari ables en el modelo interact uan (es deci r, si ulla lIIodiJica el ejecta de la otra),
se necesitara la estratifieaci6n 0 la inclusi6n de terminos de interacci6n para tener en
cuenta tales interacciones.
Nuevamente, el investigador tiene que reali zar una suene de compromiso entre la
simplicidad (interpretabilidad) y eI aj uste del mOOelo. 19norar la posibil idad de que
una asoc iacion li neal pudiera no ser una buena manera de descri bir la asociaci6n de
interes pOOrfa dafiar seriamente las conclusiones. Result a difkil exagerar la impor-
tancia de examinar cuidadosamente los datos . EI uso de variables dUlllllly para exa-
minar patrones de asociaci6n a la largo del recorrido de valores de las vari ables con-
tinuas fue brevemente disc utido en la Secci6n 7.4.7. Li bros de estadfstiea mas
avanzados cubren con detall e otras herramientas estadfstieas para evaluar la bondad
de aj uste de los mOOelos descritos (veanse, par ejemplo, Draper y Smith(l5) para
modelos lineales, Hosmer y Lemeshow(21) para modelos logfstieos, y Coll et(25) para
la regresion de Cox). Si una Ifnea recta no es un modelo apropiado, han de adoptarse
modelos mas complejo, tales como aquellos vistos en las Figuras 7.10 y 7.11 , un
proceso que podrfa considerarse an:llogo a ir de A a 8 a C 0 a 0 en la Figura 7.9.
La discusion precedente concieme al uso de modelos estadfsticos en la ident ifica-
ci6n y descripcion de asoc iaciones entre exposiciones y desenlaces en epidemiologfa.
Sin embargo, los modelos estadfstieos pueden tambien desempefiar un papel en mate-
ria de pruficci611, como se ilustr6 en la secci6n de la regresi6n logfstiea en este capftu-
10 (Seccion 7.4.3) . En este caso, la obtencion de un modelo tan parsimonioso como
sea posible ya no es tan imponante. Efectivamente, para obtener una prediecion efi caz
del valor esperado de la variable dependiente, cuanto mas complejo sea el mOOelo,
mejor. Puesto que la interpretacion de los parametros en sf mismos no es el objetivo.
los mOOelos complejos (por ejemplo, Figuras 7.10 y 7. 11 ) son perfectamente adecua-
dos para predecir. Volviendo a la analogfa del caricaturi sta (Figura 7.1 2), si su objetivo
fue ident ificarcon precisi6n al individuo (porejemplo, jsi eI caricaturi sta estaba traba-
jando para la policfa en la creaci6n-prediecion del retra(Q de un sospechoso!), eI
modelo mas complejo, el que aparece en la Figura 7.90 serfa el que habrfa que elegir.
292 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.7.1. Selecci6n del modelo estadistico correcto
Hasta aqul, la disc ll si6n se ha centrado fundamentalmente en aspectos de modelaci6n
con respecto a laforllla de la relaci6n existente entre cicrt a variable independiente y
una variable dependiente . Obviamente, sin embargo, este no es el linico problema de
la modelaci6n estadfstica. Qlras decisiones fundamentales en cualquier anal isis mlll -
tivari ado 0 de regresi6n multi ple son: 1) la selecci6n de la lecnica espedfica basada
en la regresion 0 en la estratifi cacion; y 2) la elecci6n de las vari ables que han de ser
incl uidas en la ecuaci6n multivariante 0 en el esquema de estratificad6n.
Ln eleccion de fa recnica de ajusre (basada en la estrat ificaci6n 0 en la regresi6n)
es con frecuencia materia de preferencia personal 0 conveniencia. La selecci6n de
una tecnica de aj uste particular sobre las otras que se han descrito en secciones pre-
cedentes de este Capitulo (y ot ras no recogidas aquf) se basa con frec uencia en el
ti po de disefio del estudio, el ti po de vari ables (dependiente e independientes) que se
investigan, y el ti po de medida de asociaci6n que uno desea manejar. La Tabla 7.30
resume como las tecnicas de aj uste descrit as en este Capitulo se relacionan con los
disefios fundamentales de est udio, el tipo de variable, y las medidas de asociacion.
Tabla 7.30
Tecnicas analiticas comunmcnte ('mpieadas y disponibles para la evaluacion
epidemiologica de relaciones entre exposiciones y desenlaces
TIpo de lIarlable Tecnica Medlda de asocl aci6n
Tipo de estudlo
dependiente (desenlace) multillarlada aj ustada
Cualquiera Pan'lmetros biol6gicos Analisis de lIarianza Diferencia entre medias
continuos Regresi6n lineal Coeficiente de regresi6n
lineal
Transllersales Enfermos/No enfermos Ajuste di recto Raz6n de tasas de
prellalencia
Ajuste indirecto Raz6n estandarizada de
prellalencias
MantelHaenszel Odds ralio
Regresi6n logistica Odds ralio
Casos - Conlroles Enfermos/No enfermos Manlel-Haenszel Odds ralio
Regresi6n logistica Odds ralio
Cohorte Incidencia acumulada Ajuste di recto Riesgo relalivo
(al final del seguimienlo) Ajusle indirecto Tasa de incidencia
eSlandarizada
Mantel -Haenszel Odds ralio
Regresi6n logistica Odds ralio
Incidencia acumulada Modelo de Cox Raz6n de riesgos
(Iiempo hasla el evento) instanlaneos
T>1':;>1 r h ~ inc.irlflnr.i>1 M>1ntAI -H>1AnpAI R>17rm rlfl '>1':;>1':;
(por tiempo-persona) Regresi6n de Poisson Raz6n de lasas
Casos y conlroles Estado de enfermedad Regresi6n logistica Raz6n de riesgos
anidado Caso dependiente del tiempo condicional instanlaneos
cohorte anidado (Datos de tiempo hasta Modelo de Cox con
el evenlo) entradas aHernas
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA 293
Los metodos de anal isis de varianza y modelos de regresi6n lineal estan indicados
cuando la variable de desenlace cs cont inua. Cuando esta es una variable binaria
(como ocurre frecucntemente en epi demiologfa) las tecnicas de aj uste basadas en los
populares modelos multipli cativos anterionnente descri tos (por ejemplo, odds ratio 0
razon de tasas global de Mantel-Haenszel, regresi6n logfstica, regresion de Cox, regre-
si6n de Poisson) tienden a producir resultados simi lares como se il ustra a traves de la
similitud de los result ados que se obtuvieron en las Tablas 7.1 5, 7. 17, 7.1 8, 7.20 Y
7.2 1. Un ejemplo anaJogo puede hall arse en Khan y Sempos(S) quienes utilizaron dife-
rentes metodos de aj uste basados cn la estratificacion y en la regresi6n mUl tiple para
obtener estimaciones ajustadas de las asociaciones de tres fact ores de riesgo (hi perten-
si6n, edad, sexo masculi no) con EC en un subconj unto de participantes del est udio de
Framingham. Todos los metodos dieron lugar a estimaciones basicamente equivalen-
tes, que conduclan, por tanto, a conclusiones similares . Como sefiala Greenland(SO) ,
muchos de eS(Qs metodos frec uentcmente empleados en epi demiologfa (por ejemplo,
Mantel-Haenszel, logfstico, Poisson, Cox) se basan en supuestos simil ares (relaciones
mult ipl icat ivas entre factores de riesgo y enfennedad) y tienen parecidos significados
epidemiologicos. Asf, no es sorprendente, que, con la excepcion de circ unstancias
extremas (por ejemplo, groseras violaciones de los supuestos ba.>;icos del modelo,
valores aberrantes extremos) con frecuencia ellos produzcan resultados simil ares.
EI problema de qlle variables indel'endientes (confusoras) han de ser induida.\
en el modelo esta en el centro de la discusi6n sobre el topico de la confusi6n en
general (Capit ulo 5) y de la confusion residual en particul ar (secci6n 7.5) . Una dis-
cusion detallada de las tecnicas estadfsticas que podrfan ser (jt il es en la selecci6n de
un conjunto particular de vari ables para un modelo esta fuera del marco de este
libro. Una elocuente revision general puede hall arse en el artfculo de Greenland(SO) .
Una recomendaci6n importantc cuando se selecciona un modelo estadfstico par-
ticular es realizar un (l/uiliJi.\ de sensibilidad: eS(Q es, examinar si se obtienen resul-
tados similares cuando se han empleado diferentes modelos 0 se han hecho dife ren-
tes supuestos para el
Debido a la creciente facilidad y disponibilidad de comput adoras y de programas
infonnaticos, en los ul timos afios se ha visto un florecimiento del analisis multi va-
dante en el anal isis de la literat ura biomedica, tanto en 10 cuant itativo (un uso mas
intenso) como en 10 cuali tativo (una ampliaci6n en el espectro de variantes emplea-
das) . Estos modelos matematicos altamente sofisticados, sin embargo, raramente eli -
minan la necesidad del examen cuidadoso de los datos ori ginales por conducto de
diagramas de dispersion, simples tablas de n x k y anal isis estratificados.
BlBLlOGRAFiA
I. Miettinen OS. Cook EF. Confounding: essence and detection. Alii J Epidemiol1981:
114: 593-603.
2. Greenland S. Absence of confounding does not correspond to collapsibility of the rate
ratio or rate difference. Epidemiology 1996: 7: 498-50 I .
3. Reif JS, Dunn K. Ogilvie GK el al. Passive smoking and canine lung cancer risk. Am J
Epidemiol1992: 135: 234-239.
4. Shapiro S. Slone D. Rosenberg LeI al. Oral-contraceptive use in relation to myocardial
infarction. Lancel 1979: I: 743-747.
5. Gordis L. Epidemiology. Philadelphia, WB Saunders. 1996.
294 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
6. Armstrong BG. Comparing standardized mortality ratios. AnI! Epidemiol 1995: 5: 60-64.
7. Mantel N. Haenszel W. Statistical aspects of the analysis of data from retrospective stu-
dies of disease. J Nail Cancer Insl 1959: 22: 719-748.
8. Kahn HA. Sempos CT. SlaliSliea/methods in epidemiology. New York. OxfordUniver-
sity Press. 1989.
9. Pandey OK, Shekelle R. Selwyn BJ fI al. Dietary vitamin C and and risk of
death in middle-aged men: the Western Electric study. Alii J Epic/ell/;ot 1995: 142:
1269-1278.
10. Sorlie PD. Adam E, Melnick SL el ai. Cytomegalovirus/herpesvirus and carotid atheros-
clerosis: the AR1C Study. J Mcd Viro! 1994: 42: 33 37.
11. Kannel W8, McGee D. Gordon T. A general cardiovascular risk profile: the Framingham
study. Alii J Cardiol1976: 38: 46-51.
12. Armitage P. Berry G. Slatislh'al melhods in medical research. 3.' ed. London. England:
Blackwell. 1994.
13. Nieto FJ. Diez-Roux A. Sharrett AR el al. Short and long term prediction of atheros-
clerosis by traditional risk factors. J elin Epidemiol 1999: 52: 559-567.
14. Kleinbaum IXi. Kupper LL Morgenstern H. Epidemiologic researdl: Principles alld-
qllaf1lilalive lIIelhods. Belmont. Calif: Lifetime Learning Publications. 1982.
15. Draper NR. Smith H. Applied regressioll analysis. 3: ed. New York. John Wiley.
1998.
16. Keys A. Sel'ell COlllllries: A m1lltil'arime analysis of dealh alld L'orollary heart disease.
Cambridge, Mass: Harvard University Press. 1980.
17. Nieto FJ. Szklo M. Folsom A el al. Leukocyte count correlates in middle-aged adults: the
Atherosclerosis Risk in Communities (ARIC) study. Alii J Epidelllioll992: 136: 525-537.
18. Feldstein MS. A binary multiple regression method for analyzing factors affecting peri-
natal mortality and other outcomes of pregnancy. J Roy Slat Soc fA/1966: 129: 61-73.
19. ARIC investigators. The Atherosclemsis Risk in Communities (ARIC) study: design and
objectives. Alii J Epidemiol 1989: 129: 687-702.
20. Chambless LC, Heiss G. Folsom AR. el al. Association of coronary heart disease inci-
dence with carotid arterial wall thickr.ess and major risk factors: the Atherosclerosis Risk
in Communities (ARIC) study. Am J Epidellliol 1997: 146: 483-494.
21. Hosmer OW. Lemeshow S. Applied logislh' regression. New York: John Wiley. 1988.
22. Schlesselman JJ . Case-I'oll lral .f/1ulies: Design, cond1ld, allalysis. New York. Oxford
University Press. 1982.
23. Gibas A. Blewet DR. Schoenfeld D/\. . Di enstag JL. Prevalence and incidence of viral
hepatitis in health workers in the prehepatitis B vaccination era. Alii J Epidemiol 1992:
136: 603-610.
24. Cox DR. Regression models and life table (with discussion). J Roy Slat SOL' {BI 1972:
34: 187-220.
25. Collet D. Modelling sllrl'il'al da/a inmediml researd1. London. England: Chapman &
Hall. 1994.
26. Pannar MKB. Machin D. SlIrl'il'al analysis: A pradiml approad1. Chichester. England:
John Wiley. 1995.
27. Breslow NE. Day NE. Slalislimlmelilods in callcer research: Vol I. 77le analysis of mse
con/rol s/1Idies. Lyon. France: Int ernational Agency for Research on Cancer Scientific
Publications. 1980.
28. Heiss G. SharrettAR. Barnes R el al.Carotid atherosclerosis measured by B-mode ultra-
sound in populations: associations with cardiovascular risk factors in the ARIC study.
Am J Epidemiol 1991: 134: 250-256.
29. Nieto FJ. Adam E. Sorlie Pel al. Cohort study of cytomegalovirus infection as a risk fac-
tor for carotid intimal-medial thickening, a measure of subclinical atherosclerosis. Circ1l-
lalion 1996: 94: 922-927.
ESTRATlFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA 295
30. Pearce N. Incidence density matching with a simple SAS computer program. In/ J Epi-
demiol 1989: 18: 981-994.
31. Barlow WE. Robust variance estimation for the case-cohort design. Biometrics 1994: 50:
1064-1072.
32. Thomas D. New techniques for the analysis of cohort studies. Epidemiol Rev 1998: 20:
122-136.
33. Nieto Fl. Folsom AR. Sorlie P etili. Chlamydia pnellmoniae infection and incident coro-
nary heart disease: the Atherosclerosis Risk in Communities (ARIC) study. Am J Epide-
mioI1999: 150: 149-156.
34. Waaler HT. Height. weight and mortality: the Norwegian experience. Ac/a Med Scan
Supp11984: 679: I-56.
35. Allison DB. Faith MS. Heo M. Kotler DP. Hypothesis concerning the U-shaped relation
between body mass index and mmality. Am J Epidemiol 1997 :146: 339-349.
36. Fagot-Campagna A, Hanson RL. Narayan V et al. Serum cholesterol and mortalit y rates
in a Native American popUlation with low cholesterol concentrations: a U-shaped asso-
ciation. Circlilation 1997: 96: 1408- 1415.
37. Thun M1, Peto R, Lopez AD e/ al. Alcohol consumption and mortality among
middle-aged and elderly U.s. adult s. N Engl J Med 1997: 337: 1705-1714.
38. Moscicki EK. Locke BZ. Rae OS. Boyd 1H. Depressive symptoms among Mexican
Americans: the Hispanic Health and Nutrition Examination Survey. Am J Epidemiol
1989:130:348-360.
39. Luke A. Durazo-Arvizu R. Rotimi C, el al. Relation between body mass index and booy
fat in black population samples from Nigeria. Jamaica. and the United States. Am J Epi-
demiol1997: 145: 620-628.
40. Kretzschmar M. van Duynhoven YTHP. Severijnen A1. Mooeling prevention strategies
for gonorrhea and chlamydia using stochastic network simulations. Am J Epidemiol
1996: 144: 306-317.
41. Clayton D. Hill s M. Stalislicalll10dels in epidemiology. Oxford. England: Oxford Uni-
verslly I'ress : I'NJ.
42. Krieger N. Williams DR. Moss NE. Measuring social class in US public health research:
concepts. methodologies. and guidelines. Ann Rev Pllblic Health 1997: 18: 341-378.
43. Kaufman JS. Cooper RS, McGee DL. Socioeconomic status and health in blacks and
whites: the problem of residual confounding and the resiliency of race. Epidemiology
1997: 8: 621-628.
44. Davey Smith G. Frankel S, Yarnell J . Sex and death: are they related? Findings from the
Caerphill y Cohort Study. Br Med J 1997: 315: 1641-1644.
45. Greenland S. The effect of mi sclassification in the presence of covariates. Am J Epide-
mio11980: 112: 564-569.
46. Last JM. A Dictionary of epidemiology. New York: Oxford Universit y Press . 1995.
47. Breslow N. Design and analysis of case-comrol studies. Anl1ll Rev Pllblic Heallh 1982:
3: 29-54.
48. Durrant M. Aristotle's De Anima in Focus. London, ORoUiledge: 1993.
49. Zeger SL. Statistical reasoning in epidemiology. Am J Epidemiol 1991: 134: 1062-1066.
50. Greenland S. Mooeling and variable selection in epidemiologic analysis. Am J Pllblh'
Heallh 1989: 79: 340-349.
51. Robins 1M. Greenland S. The role of model selection in causal inference from non-expe-
rimentill rlmil . Am.l F.pidPlllinI 19Rfi: 121: 192-402.
CAPITULO 8
Aseguramiento y control de la caUdad
8.1. INTRODUCCION
Como con olros tipos de invcst igaci6n cmpfrica, la validez de las inferencias realizadas
a partir de los resultados de la invesligacion epidemio16gica depende de la exacti md de
los metodos y procedimientos empleados. En lajerga epidemio16gica. eltermino vali-
dez (0 exactiflld) se refiere a la ausencia de sesgo. Los sesgos mas comunes, y algunos
enfoqucs para prevenirlos de manera que se maximice la validez de los resultados del
estudio y las inferencias, se discutieron en el Capftulo 4. Este capft ulo exti ende la dis-
eli sion de los aspectos relacionados con la exact itud de la recolecci6n y el procesa-
miento de los datos que deberfan considerarse clIando se disefian y realizan estudios
epidemio16gicos. Ademas de la validez 0 la ausencia de sesgos, el presente capitulo
tambien aborda aspectos relacionados con la evaluaci6n y el aseguramiento de lafiabi-
lidad (precision, reproducibilidad) de los datos recogidos.
Aunque los tenninos aseguramrento de la calidad y control de calidad se utilizan
a veces indistintamente o. aun mas a menudo. juntos en un solo termino. control de
calidad. con prop6sitos sistematiz.adores. las actividades orientadas a asegurar la
calidad de los datos antes de su recolecci6n se entenderan en este capftulo como ase-
guramienfO de /a calidad, y los esfuerzos para Ilevar el control y mantener la cali dad
de los datos durante la conduccion del est udio se entenderan como control de cali-
(/ad.
Las act ividades de control de calidad y aseguramiento de la calidad son compo-
nentes claves de la invest igaci6n epidemiol6gica y se comprenden mejor en el con-
texto de los rasgos principales del disefto de un eswdio epidemiol6gico. Los aspec-
tos mas relevantes del disefto de un estudio, adecuadamente tratados en el texto de
Kahn y Sempos(l) , proveen el marco adecuado para la elaboraci6n que sigue (Tabla 8. 1).
Puede decirse que la mayorfa de los componentes de un est udio se relacionan con el
aseguramiento 0 el control de caUdad de una manera u otra en el amplio contexto de
la vali dez y la fiabilidad de la tnvesti gacion epidemiol6gica. Este capitulo, sin
embargo, se concentra en el examen en las actividades mas tradicionalmente com-
prendidas dentro del dominio del aseguramiento de la caUdad 0 de su control: esto
es, en los puntos 7 y 8 de la Tabla 8.1. Para una revision sistematica adic ional de este
t6pico. vease Whitney et al.(2) .
Para ilustrar algunos de los aspectos tratados en la discusi6n que sigue, el Apen-
dice D incluye una transcripcion textual del protocolo de aseguramiento y control de
la calidad para dos procedimientos Il evados a cabo en el estudi o de cohortes multi-
centrico sobre arteriosclerosis (Est udio del Riesgo de Arteriosclerosis en Comunida-
des, ARIOJ)): presi6n arterial y venipuntura(4) .
298 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.1
Elementos rclc\'antes del disciio de UII estudio epidcmiologico
Actlvidad (Aseguramiento de la Calldad,
AC, 0 Control de la Calldad, eel
1. Formulaci6n de la (0 las) hip61esis principal
(es) del estudio (AC)
2. Una especilicaci6n a priori de las variables
coniusoras polenciales (AC)
3. Delinici6n de las caracteristicas de la
poblaci6n en estudio para la validez axler
na (capacidad de generalizaci6n) de los
pmp6sitos (AC)
4. Delinici6n de la estralegia de diseno (por
ejemplo. cohorts , casos y controles, C<'. W
cohorte) y de los grupos que han de com
pararse, y especificaci6n de los procedHes
de selecci6n para la validez inlema (com
parabilidad) (AC)
5. Delinici6n de la estrategia de diseno y
muestras para estudios de tiabilidad y \'ali -
dez (AC/CC)
6. Especificaci6n de la potencia necesaria
para detectar la(s) asociaci6n(es) conjetu-
rada(s) para un nivel de significaci6n dado
(AC)
7. Estandarizaci6n de pmcOOeres (AC)
8. Actividades durante la recolecci6n de
datos; incluyen el analisis de datos de con-
trol de calidad y acciones remOOiales (CC)
Comentarlos
La hip6tesis debe especificar las variables inde-
pendientes (por ejemplo, factor de riesgo) y
las variables dependientes (par ejemplo.
enfermedad 0 desenlace) . Si los investiga-
dores planifican analizar la interacci6n. las
hip6tesis de estudio deben especificar el (0
los) (es) de efecto(s) potencial(es).
Una revisi6n de la literalura pertinente puede ayu-
dar a los investigadores a las prin-
cipales variables confusoras y, poi" 10 tanto.
ayudar en la elecci6n diseilo mas apropia-
do (por ejempto, casos y controles empareja-
dos frente a no emparejados) y a seleccionar
los datos qua sa necesita recolectar.
La capacidad de generalizar los resultados a
otras poblaciones esta condicionada por
diversas circunstancias. que incluyen las
diferencias en la distribuci6n de los modi fi-
cadores de efecto y las caracterfsticas de la
poblaci6n estudiada. Una caracterizaci6n
detallada de los participantes en el estudio
permite a los consumidores de datos
decidir si los resultados son aplicables a la
poblaci6n objeto de estudio.
La selecci6n de los grupos que van a ser com-
parado:'; se relaciona con la prevenci6n del
sesgo de selecci6n y el nivel de confusi6n
que se espera. Se debe especificar la astra-
tegia para la busqueda de confusores. ade-
mas de los sugeridos por estudios previos.
Se debe especiticar el enfoque de selecci6n de
muestras para estudios de mediciones
repetidas (fiabilidad) 0 comparaciones con
estandares de oro (validez) .
La estimaci6n del tamailo de muestra es un impor-
tante elemento que permite decidir si el esludio
bene suficiente potencia a un nivel dado de
error de primer tipo, y esto debe tomaren cuen-
ta la(s) interacci6n(es) potencial(es). si esta(n)
especificada(s) en la hip6tesis esludiada.
Incluye la preparaci6n de manuales escritos
que contengan una descripci6n detallada de
los procederes para la selecci6n de la
poblaci6n estudiada y la recolecci6n de los
datos, asi como el entrenamiento y certi fica-
ci6n del equipo de investigadores.
Abarcan el control 0 veri ficacion de los proce-
deres de recoleccion de datos, asi como la
conducci6n de estudios en muestras para
aquilatar la validez y fiabilidad de las mOOi -
ciones. 10 que pudiera dar lugar al reentre-
namiento y recerti ficaci6n de miembms del
equipo de investigadores.
Continua
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 299
Tabla 8.1
Elementos relevantes del diseii o de un estudio epidemi ologico (collt i lll/acioll)
Act lvldad (Aseguramlento de la CaUdad,
AC, 0 Control de la CaUdad, CC)
9. Anaiisis de datos
10. Informe de resultados
Comentarlos
EI analisis de dalos se debe hacer de acuerdo
a un plan preestablecido. Se deben hacer
esluerzos para establecer estrategias de
analisis po!" adelantado (por ejemplo, la
elecci6n de puntos de corte" cuando se
usan datos continuos u ordinales para crear
categorfas discretas). EI anal isis debe pro-
ceder a partir de las estrategias mas senei-
lias (descripci6n de datos, calculo de madi-
das no ajustadas de asociaciOn, enloques
simples ajustados) y continuar entonces con
la aplicaci6n de modelos mas complejos
(por ejemplo, regresi6n logistica 0 de Cox).
Los investigadores tambiEm deben especifi-
car las estrategias analiticas que emplearan
para evaluar la validez y fiabilidad de los
procederes.
Los resultados sa deben informar tan pronto
como sea posible despues que fin81icen las
actividades de recolecci6n de datos, de
manera que sa preseNe la oportunidad del
estudio. Para evitar sasgos de publicaci6n,
los datos sa deben informar independiente-
mente de la direcci6n de los resultados
(vease Capitulo 4, SecciOn 4.5). Los instru-
mentos empleados y los datos de control de
calidad deben estar disponibles para la
comunidad cientilica, si sa requiere.
Fuente: HA Kahn and CT Sempos, Statistical Merhods in Epidemiology. 11:1 1989. Oxford University Press.
8.2. ASEGURAMIENTO DE LA CALIDAD
Las act ividades de aseguramiemo de la calidad antes de la recolecci6n de los datos se
relacionan con los procedimientos de estandarizaci6n y, por tamo, de prevenci6n 0,
por 10 menos, de minimizaci6n de los errores sistematicos 0 aleatorios que pueden
aparecer en la recolecci6n y anal isis de los datos . Tradicionalmeme, estas act ividades
comprenden la preparaci6n detall ada del protocolo, el desarrollo de los instrumemos
y procedimientos para la recolecci6n de los datos y sus mamtales de operaci6n, y el
emrenamiento y cenificaci6n de las personas que trabajaran en el equipo de invest i-
gacirin. (EI cleS;l rmll o fie m;lntmles fl tle especifi'1t1en las ;lctivicl;lcles cle l conlrol fie];'l
caUdad tambien puede verse como una act ividad del aseguramiento de la caUdad) .
EI disefio de las actividades de aseguramiento de la cali dad deberfa ser seguido
por pruebas y estudios pil oto sobre eslas act ividades. Los result ados de las pruebas y
de los esludios pil oto, a su vez, contribuyen a modificar los procedimientos y hacer-
los aSI mas eficientes, vali dos y confiables.
300 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
8.2.1. Protocolo del estudio y mammies de operaci6n
EI prorocolo del eJ"!udio consiste en una descripc ion de los componentes generales
de la investigacion, incluyendo los que se mucstran en 1a Tabla 8.1 . Provee lIna
panora.mica global de las estrategias que lI evan al desarrollo de manua les de ope-
rad6n mas detallados. El protocolo describe el di sefto general y los procedi-
mientos utilizados en el est udio (incluyendo los que se relacionan con el mucstreo
y el reclutamiento de los participantes) y ayuda al equi po de investi gadores a com-
prender el contexto en el ellal se llevan a cabo sus act ivi dades especfficas. Los
mGllualeJ" de opemci6n deben contencr descri pciones dctallarlas acerca de como
se llevan a cabo exactamente los procedimientos especfficos de cada instrumento
para recoger los datos, de manera que se garantice que las {areas se desempenara.n
{an uniformememe como sea posible. Por ejemplo, la descri pcion de los procedi-
mientos para las mediciones de tension arterial deben incluir la calibracion del
esfigmomanometro, la posicion del participame, los lapsos que ha de haber entre
mediciones, el tamano del manguito y la posicion de este en el bmzo. Con respec-
to a las emrevis{as, el manual de operaciones debe comener las instrucciones acer-
ca de como debera hacerse exactamente cada pregunta durante la entrevista (ins-
(rucciones pregunta por pregunta 0, utili zando la jerga epidemiologica, p por
P) . La estandari zacion de los procedimiemos desempena un papel partic ul ar-
mente medular en los estudios mult icemrico, en los que varios tecnicos llevan a
cabo los examenes 0 administran los mi smos cuestionarios a los part icipantes en
el estudio, reclutados y examinados en distimas clfnicas 0 lugares. Un manua l de
operaciones detail ado es important e para lograr el mayor nivel posible de unifor-
midad y estandarizaci6n de los procedimientos de recogida de los datos en tada la
poblacion de estudio.
En los estudios grandes que involucran diferentes mediciones, los malllwle.\
de operuci6n pueden hacerse especfficos por actividad: esto es, pueden prepa-
rarse manu ales de operacion separados para di ferentes aClividades relacionadas
con los datos, tales como entrevislas, recoleccion y procesamiento de muestras
de sangre y pruebas de la funcion pulmonar. Los manuales de operacion deben
desarroll arse lam bien para la lectura y cl asificacion de los dalos, como cuando
se codifican hall azgos electrocardiograficos u{ilizando el codigo de Minnesota(4)
o clasificar una enfermedad en diferentes categorfas diagnosticas, lales como
infart o de miocardio definiti vo, probable 0 ausente)-)-(S). Puede tambi en
desarroll arse un manual especificando como se crean variables deri vadas para
los propositos del estudio, esto es, variables para el analisis basadas en combi-
naciones de variabl es crudas obtenidas durant e la recoleccion de los datos.
Un ejemplo es la definicion de hiperfensi61l (presente 0 auseme) basada en nive-
les de tension arterial medidas con esfigmomanomelro, pero lam bien a partir
de la comunicacion hecha por un part icipante seglin la cual un medico ha diag-
noslicado una hipert ension 0 que consume regularmeme medicacion antihiper-
lens iva .
Se refiere a q by q's una manerd que !ienen los epidemi61ogos de habla inglesa para abreviar
question by question , (Nola del T. )
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 301
8.2.2. Instrumentos para la recol ecci6n de los datos
La confecci6n (0 selecci6n) de instrumentos para la recogida de los datos y sus
correspondientes manuales de operaci6n es un paso crucial en el disefio del estudio y
debe Ilevarse a cabo de acuerdo a reglas bien establecidas. como en el caso del dise-
fio del cuestionario(6. 7) .
Siempre que sea posible, es aconsejable seleccionar instrumentos de recolecci6n
de datos y procedimientos que hayan sido ut ilizados con exito en estudios previos
para medir factores de riesgo sospechados y enfennedades como desenlace de inte-
res. Entre otros ejemplos, pueden mencionarse el cuestionario desarroll ado por
Rose(8) para identificar angina pectoris (eillamado cuestionario de el cues-
donario de la Sociedad Americana del T6rax (American Thoracic Society) para eva-
luar sfntomas respi ratorios(9) , los procedimientos para la medici6n de la tensi6n arte-
rial seguidos por la Encuesta nacional de examenes de salud (National Health
Examination Surveys)(lO) y los cuest ionari os de frec uencia en el consumo de alimen-
tos disefiados por Block ef al.(II) 0 Willett ef al .(12) para evaluar habitos dieteticos.
Ocasionalmente, la validez y la fi abilidad de tales instmmentos y procedimientos
previameme probados se conocen(l2), 10 que permi te hasta cieno punto la evaluaci6n
de sesgos posibles y errores en la clasificaci6n (vease mas adelante). Ademas, el usa
de instrumentos y procedimientos ya establecidos permit e comparar los hallazgos
obtenidos con los de los estudios previos y faci litar de ese modo la preparaci6n de
revisiones y el desarrollo de metaanalisis(Il).
En ocasiones. un instmmemo bien establecido se modi fica para adec uarlo a los
prop6sitos del estudio. La modificaci6n de un cuestionario puede hacerse, por ejem-
plo, para incluir 0 excl uir variables, 0 para reduci r la duraci6n de la entrevista. EI
grado hasta el cual la version modificada de un instmmento mantiene la vali dez y la
fiabilidad ori ginales puede evaluarse comparando los result ados que se dan al ut ili-
zar ambos instrumentos en la misma muestra. Tal evaluaci6n, sin embargo, puede
verse afectada por la falta de independencia entre dichos inst rumemos cuando se
aplican a los mismos individuos (es deci r, las respuestas al cuest ionari o que se apli-
que en segundo lugar pueden estar influidas por el recuerdo del part ici pante de las
respuestas que dio al primer cuestionario).
Cuando no se dispone de instmmentos efectivamente utilizados en el pasado, se
hace necesari o crear instmmentos especiales que se adecuen a los prop6sitos del
estudio; en tales casos deberfan lI evarse a cabo estudios piloto que pennitan aquila-
tar la validez y fiabilidad de los imtrumentos y los procedimientos de medici6n rela-
cionados, preferi blemente antes de comenzar las actividades de recolecci6n de los
datos (vease mas adelante) .
8.23. Entrenamiento del equipo de investi gadores
EI entrenamiento de cada persona del equipo de investigadores debe tener el objetivo
de familiarizar profundamente a esa persona con el 0 los procedimientos bajo su res-
ponsabilidad . Estos procedimientos incluyen no solo la recolecci6n de los datos y
los procedimientos para su procesamiento sino {ambien la planificaci6n de las citas
para entrevistas 0 las visitas a las clfnicas en el estudio, la preparaci6n de materiales
para los entrevistadores y otros recolectores de datos, la calibraci6n de los instm-
302 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mentos y la asignaci6n de los entrevistadores a los part ici pames en el est udio. EI
entrenamiento debe tambien involucrar a los lecnicos de laboratorio y a los encarga-
dos de la lec(ura y clasificaci6n de los datos obtenidos de examenes tales como los
electrocardiogramas 0 imagenes de rcsonancia magnctica, 0 de estudios de ultraso-
nidos en modo B. En los est udios multicentricos, el entrenamiento de los tecnicos de
{odos los centros part ici pantes se real iza habitual mente en un lugar central camli n.
El entrenamiento concluye con la certificaci6n de los miembros del equipo de inves-
tigadores para reali zar eI procedimiento espedfico. Particularmente en los estudios
con una duraci6n relativamente larga (tales como los est udios prospect ivos conc u-
rrentes; vease Gordis(14) , se lIevan a cabo recert ificaciones peri6dicas, con el
reentrenamiento de cualquier miembm del equipo de investigadores cuyo desempe-
fio en la conducci6n de las tareas para la recert ificaci6n se considere inadecuado.
Pero. debido a que el reentrenamiento y la recert ificaci6n se hacen cuando las activi-
dades de recolecci6n de los datos estan ya en ejecuci6n, nonnalmente se clasifican
como actividades del control de cali dad mas que del aseguramiento de la calidad.
Para la estandarizaci6n de la recolecci6n de los datos y los procedimientos de
clasificaci6n es menester que se entrene cuidadosamente a todo el personal del est u-
dio que este involucrado en la recolecci6n; debe hacerse enfasis especial en la nece-
sidad de que se cumplan celosamente los procedimientos especificados en el manual
de operaciones (vease arriba). EI entrenamiento minucioso de los recolectores de los
datos es clave para prevenir errores de clasificaci6n (Capitulo 4, Secci6n 4.3.3), de
posible aparic i6n cuando los procedimientos de recogida no se aplican de manera
uniforme .
8.2.4. Estudios piloto y pruebas previas
La verificaci6n de la fac fi bilidad y et1ciencia de los procedimientos del est udio se
lIeva a cabo a traves de pruebas previas y est udios pHoto. A menudo los terminos
prueha previa y estlldio pi/oro se usan indist intamente; sin embargo, una dist in-
ci6n (i til es que la prueba previa implica la evaluaci6n de procedimientos especffi-
cos en una muestra rapida, tomada de cualquier manera 0 de conveniencia (por
ejemplo, en las mismas personas del equi po de invest igadores 0 en sus amigos 0
familiares) con el fin de deteclar problemas graves; el est udio pil oto, en cambio, es
un ensayo formal de los procedimientos de l est udio por cuyo conduclO se pro-
cura reproducir todo eI fl ujo de operaciones, en una muestra tan similar como sea
pos ible al universo de participantes en el est udio. Los resultados de las pruebas
previas y de los est udios pHoto se utilizan para evaluar el recl utamiento de los par-
tici pantes y los procedimientos de recogida de los datos y, si es necesario, corregir
estos procedimientos antes de que comience el trabajo de campo. Por ejemplo,
despues de la prueba previa y de Ilevar a cabo el estudio piloto de un cuestionario.
pueden evaluarse los siguientes elementos: flujo de las preguntas, presencia de
preguntas sensibles. pertinencia de la categorizaci6n de la variables. grado en que
el lenguaje empleado resulla comprensible tanto para el enc uestado como para el
enc uestador, y claridad de las instru::ciones que se dan al enc uestador pregunta
por pregunta.
Los eSludios pHoto tambien permiten la evaluaci6n de estrategias alt ernativas
para el reclutamiento de los part ici pantes y la recolecci6n de los datos. Por ejemplo,
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 303
un est udio piloto puede lI evarse a cabo para evaluar si el empleo del telefono const i-
tuye una buena alternativa en lugar de las entrevistas persona a persona. que son mas
caras y consumen mas ti empo.
Un resumen de algunos de los pasos crudales para el aseguramiento de la cali dad
se muestra en el Esquema 8. 1.
Esquema 8.1 .
Pasos para eI aseguramiento de la calidad
1. Especificar la hip6tesis de estudio.
2. Especificar al diseno general para evaluar la hip6tesis de estudio __ desarrollar un protocolo
general del estudio.
3. Seleccionar 0 preparar instrumentos especificos, y desarrollar pmcedimientos para la reco-
lecci6n de datos y su procesamiento __ Oesarrollar manuales de operaci6n.
4. Entrenamiento del equipo -- del equipo.
5. Con un equipo de trabajo certificado, realizar una prueba previa y un estudio piloto para la
recoleccion de los datos y para I)s instrumentos y procedimientos que se utilizaran en el
procesamiento; incluir en el estudio piloto estrategias alternativas para la recolecci6n de
datos (por ejemplo, entrevistas telef6nicas frente a entrevistas por via postal).
6. Si fuera necesario, modificar los puntos 2 y 3, Y reentrenar el equipo sabre la base de los
resultados del punto 5
83. CONTROL DE CAUDAD
L1S act ividades de control de calidad comienzan despues de iniciada la recolecci6n de
los datos y el procesamiento. EI escrutinio de los datos del control de calidad es la base
para posibles acciones remediales que conduzcan a minimizar los sesgos y los proble-
mas de fi abilidad. L1S estrat egias de control de calidad incl uyen observaci6n de los
procedimientos y desempefio de los miembros del equi po de invest igadores 10 que per-
mite la identificaci6n de obvias desviaciones del protocolo y est udios especiales de
validez y fi abilidad usualmente Ile\'ados a cabo en muestras de los sujetos en interva-
los espedficos a 10 largo dellapso de recolecci6n de los datos y el procesamiento (vea-
se Apendice D). Lo que sigue es un resumen de las estrategias e indices de control de
calidad mas comunes. L1 di scusi6n estadistica profunda de los indices de fiabilidad y
validez esta fuera de los Ifmites de este libro; en su lugar. las secciones siguientes se
concentran en su apli cabilidad, su interpretacion y sus li mit aciones.
8.3.1. Verificaci6n de las observaciones y valoraci6n de las tendencias
Para identificar problemas en la puesta en practica de los procedimientos del est udio
por parte de entrevis(adores. tecnicos y procesadores de datos. los supervisores pue-
den controlar la cali dad de estos procedimientos mediante la observaci6n del equi po
de in\'estigadores por endma del hombro . Por ejemplo, la verificad6n por obser-
vad6n de la calidad de las mediciones de tensi6n arterial se hace a menudo por
estetoscopios dobles: esto es, U{ili zando un estetoscopio que permita ados obser-
vadores medir los niveles de presion arterial simult aneamente. EI cont rol por obser-
304 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
vad6n de las entrevistas puede hacerse grabando todas las entrevislas y revisando
una muestra aiea{Qria de estas para valorar el grado de adhesi6n de los entrevistado-
res al protocolo y la exactitud de las respuestas grabadas.
Otra tecnica de control mtinariamente ut ili zada en los est udios epidemiol6gicos,
particularmente en los multicentr1coS, en los que los part ici pantes se reci utan y los
datos se recogen a 10 largo de periodos prolongados, es la evaluaci6n estadistica de
las tcndencias en el tiempo del descmpefio de cada observador (entrevistador y tec-
nieo cifnico 0 de laboratorio )<2) . En el estudio ARIC, por ejemplo, el centro coordina-
dor realizaba mtinariamente (carla Ires meses) d. lculos eSladfsticos usando la {en-
sion arteri al y otras variables medidas por cada tecnico para todos los part icipantes
del estudio. Despues de aj ustar por edad, sexo y otras caracterfsticas relevantes, se
anali zaban para cada {ecnico las tendencias temporales de estas estadfsticas (vease
Apendice D) . Si se detectaban desviaciones que no pod fan expli carse por cambios
en la composicion demogra.fica de los gmpos de part ici pantes, se notificaba al coor-
dinador cifnico correspondiente y se Il evaba a cabo una revisi6n de la adhesion al
protocolo por parte del tecnico afectado.
Cada tipo de medici6n puede requeri r un enfoque especial de veri ficacion de la
caUdad. Para la tensi6n arteri al y las medidas antropome{ricas, por ejempl o, la eva-
luaci6n mtinaria del dfgito de prefercncia se lI eva a cabo de manera directa. Para
estudios que utilizan centros especializados para la lect ura y clasificaci6n de las
mediciones reali zadas en diferentes centros (por ejemplo, ultrasonido, imagenes de
resonancia magnCi ica, Rayos X) , el control de la calidad de los datos en el tiempo es
mas complicado, porque tanto la recolecci6n de los datos de campo como los proce-
dimi entos centralizados de lec{ura y asignaci6n de puntos pueden ser fuentes de error
y variabilidad(2). EI control de caUdad de los datos de laboratorio puede requerir eI uso
de estandares externos 0 internos (datos combinados). como se di scute mas adelante.
8.3.2. Estudios de validez
En los estudios epidemiologicos, part icularmente los que involucran a gran cantida-
des de indi viduos, a menudo es necesario establecer un compromiso entre la exact i-
Iud por un lado y los costos y molestias de los participantes por otro. Los procedi-
mientos diagn6sticos muy exactos son usualmente muy invasivos y/o muy caros
para ser aplicados en estudios con un gran volumen de personas sanas; la informa-
cion exacta sobre caracterfsticas complejas del est ilo 0 habitos de vida requiere a
menudo del uso de cuestionarios largos (que suponen, por tanto, un alto consumo de
tiempo) . Consecuentemente, los epidemiologos deben con frecuencia adaptarse a
instrumentos menos invasivos 0 mas agiles, 0 a procedimi entos que, aunque mas
baratos y mas aceptables para los part icipantes en el est udio, pueden dar lugar a
errores relati vamente importantes en la evaluaci6n de las variables de interes . Los
eSllldios de validez en submuestras de partic ipantes que pasan por ambos procedi-
mi entos. el general para todo el estudio y uno mas exacto que sirve como prueba de
oro, permiten la evaluacion del impacto de esos errores sobre los est imados del
estudio.
A cont inuaci6n se descri ben algunos de los enfoques aplicables a la evaluaci6n
de la validez en el contexto de los eSlUdios epidemiol6gicos. En la Secci6n 8 .4 se
examinan los fndices de vali dez mas comunmente ut ili zados.
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 305
Mezclas estatldarizadas para mediciones de laboratorio
Cuando se ut ili za sangre u otro especimen biol6gico, un enfoque posible para lI e-
var adelame un est udio de va li dez es aprovechar la existencia de un programa de
control de calidad externo bien establecido. Este enfoque consiste en utili zar el
mismo 1'00/ biol6gico (por ejemplo, suero) para comparar medic iones obtenidas al
aplicar los procedimientos del eSludio con los resullantes derivados de la aplica-
ci6n de las pruebas de oro. Los va lores de referencia que sirven como prueba
de oro pueden medirse lambien en una combinaci6n de mueslras externa al est u-
dio (Ia l como una combinaci6n proveida por el programa de eSIandarizaci6n de
colesterol serico de los Cemros de Control y Prevenci6n de Enfermedades (Cen-
ters for Disease Control, CDC)(15) . Alt ernat ivamente, puede crearse una muestra
global imerna combinando especimenes obtenidos de los partici pantes del estudio
y probados por un laboratorio estandar ajeno al estudio. (Cada unidad muestral
incluida en la global esta formada por espedmenes biologicos conformados por
vados partici pantes, de manera que se use una cantidad tan pequefia como sea
posible de especimen de cada individuo en el estudio). Idealmente, las desviacio-
nes, si las hay, de las medic iones de l estudio de los resultados del verdadero
estandar deben ser aleatorias durante la recolecci6n de los datos y las act ividades
de medici6n; es importante conocer que estas desviaciones no deben variar en
dependencia de la presencia y nivel de variables re levantes como la exposici6n
principal y el result ado de interes, 0 el liempo de reclulamiento, 0 eI de segui -
miento de los partici pantes, para que no ocurran errores de clasificacion diferen-
ciales (Capit ul o 4. Secci6n 4.3.3) .
Un ejemplo del usa de una combinacion interna de muestras es un est udio de
vali dez en un programa masivo de cribado de colesterol serico que invol ucr6 a 1.880
residentes del condado de Washi ngton, Maryland. Las medidas de cribado se hadan
en sangre obtenida pinchando la yema del dedo sin exigencia de ayuno. En un con-
junto de 49 personas examinadas, quienes tambien partici paban en un est udio car-
diovascul ar mayor, el colesterol serico podfa lambien medi rse en un laboratorio
estandar nacionalmente reconocido (Comstock, comunicaci6n personal, 199 1). Las
medidas estandar se hacian en estado de ayuno bajo condiciones cuidadosamente
controladas . La validez (es dec ir, sensibilidad y especificidad; vease Secci6n 8.4.1)
de las medidas del cribado podfan, por tanto, evaluarse ut ilizando los valores estan-
dar dellaboratorio como pmeba de oro.
Un ejemplo de un est udio que partic ipo en el programa de estandarizaci6n del
colesterol serico del CDC se debe a Burke et a/ .(I6), quienes estudiaron las tendencias
en el tiempo de los niveles medios de colesterol de los participames del estudio
Encuesta del Coraz6n de (ECM). En este Irabajo, los valores obtenidos
al apl icar los procedimientos del ECM se comparaban con los obtenidos con la pme-
ba de oro (CDC). Se encontro que los valores del ECM eran mas bajos que los del
CDC, asf como que la diferencia era mayor al principio que al final del est udio. En la
Figura 8.1 se muestra esquematicamente este fen6meno de sesgo diferencial en el
liempo, al que genericameme se alude como desviacion temporal. Una vez que se esti-
ma la magnitud de la desviaci6n lIIilizando el estandar, se pueden lII i1i zar lecnicas esta-
dfsticas estandar para estimar los valores corregidos. Por tamo, con la correcci6n
para la desviaci6n temporal, el decrecimiento temporal en el nivel de colesterol en el
ECM se estimo que era inc1uso mayor que el observado sin la correcci6nY'
306 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Coleslrol
sarico
promedio
Val ores observados
Tiempo
Figura 8.1. Dircrcncia cntre valorcs '"crdadcros y obscrvados ell un est udio cpidc-
miol{)gico COli scguimicnto en el ticmpo. Los verdaderos valores son aquellos determina-
dos por ellaboratorio estandar y los valores observados. los determinados por ellaborato-
rio del estudio.
Otros enfoques para examillar la validez
La comparaci6n de datos de todo el estudio con result ados de prucba de oro en
muest ras de los part icipantes en el estudi o no se limita a las mediciones de laborato-
rio; se aplica tambien a datos del cuestionario. Por ejemplo, en un estudio de casas y
comroles que eva!lia la relaci6n de la terapia de reemplazo honnonal con el cancer
de mama, la informacion dada por los panici pames del estudio fue verificada con-
tactando a los medicos que presumiblemente hicieron estas prescripciones(l7). Otro
ejemplo 10 ofrece un estudio que consider6 la vali dez del cuest ionario de frec uencia
alimemaria de Wi ll en en una muestra de 173 mujeres seleccionadas entre las mas de
W.OOO panicipames del Estudio de Salud de Enfenneras (Nurses Health Study)(12) .
Todas las partic ipantes en el estudio respondieron al cuest ionario de frecuencia ali -
mentaria de 16 items, que es relativamente simple y faci l de administrar y que mide
la frecuencia promedio aproximada de consumo de ali mentos seleccionados. Ade-
mas, las mujeres de la muestra ll enaron un diario de dieta a 10 largo de una semana,
que fue ut ilizado como prueba de oro para evaluar la vali dez del cuestionario de
frecuencia alimentaria aplicado a toda la cohone. (A esta muestra tambien se la apli-
co el cuestionario de frecuencia ali memaria en dos ocasiones en un periodo de un
ano para evaluar su fiabi li dad: vease Secci6n 8.3.3) .
En algunos estudios la se busca solo para las respuestas posit ivas dadas
por algunos panici pantes. Sin embargo, es importante evaluar muestras tanto de res-
puestas positi vas>, como porque ello permite la estimaci6n de la sensibi-
li dad y de la especificidad de la estrategia basica de recoleccion de datos del estudio
(vease Secci6n 8.4.1) como. por ejemplo. cuando se confirman datos de entrevistas
tanto a panici pantes que comunican el uso de pfldoras amiconceptivas orales como a
otras que afirman no hacerlo. Adicionalmente, la informacion debe recogerse por
separado para los gmpos que se comparan (por ejemplo, casos y controles, 0 expuestos
y no expuestos) de manera que se pueda establecer si hay 0 no errores de clasifi caci6n
y, si los hay, si son diferenciales 0 no diferencial es (vease Capitul o 4, Secci6n 4.3.3) .
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 307
Dispotlibilidad y validez de los datos de estudios previos
En ocasiones, existen datos de estudios previos sobre la validez de un procedimiento
dado. Por ejemplo, se han publicado datos sobre hipertension comunicada por los pro-
pios partici pantes la cual nunca habra sido diagnostic ada por un profesional de salud en
aproximadamente 8.400 partici pames de la Encuesta Nacional sobre Salud y Nut ricion
III (National Health and Nutrition Examinat ion Survey, NHANES III), una invest iga-
ci6n nacional desarroll ada en los Estados Unidos entre 1988 y L.1 disponibili-
dad de datos de una pmeba, pmeba de orO, que comprenden niveles reales de tensi6n
arterial medidos en estos particip..1ntes e infonnes del uso de medicaci6n antihipertensi-
va hace posible estimar la sensibilidad y la especificidad de 10 que infonnan los propi os
participantes, tanto para la muestra 10lal como para subconjumos definidos segli n carac-
leristicas sociodemograficas (vease Secci6n 8.4.1) .
De fonna parecida. un estudio de la validez de variables amropometricas comu-
nicadas por los propios sujetos se condujo entre los partic ipantes del ESlll dio Fami-
liar de Cllnicas de Investigaciones de Lfpidos (Li pid Research Cli nics Family St udy,
LRC) . Los pesos y tall as fueron por una parte infonnados por los propios partic ipan-
les y, por olra. objet ivamente Como en el ejemplo previo, los alllores de
este estudio examinaron la validez de la informaci6n comunicada por los propios
part icipantes sobre el peso y la talla de acuerdo a la edad y sexo del part ici pante, e
identificaron diferenc ias importantes (vease Secci6n 8.4.1 ).
Los estudios que descansan sobre informaci6n comunicada por los sujetos estudia-
dos, tal como la hipertension y el peso/talla, pueden utili zar los estimados de validez de
estudios previos para evaluar los posibles errores de clasificaci6n resultames deluso de
este tipo de infonnaci6n en sus propias poblaciones de estudio. En este caso. sera nece-
jll7.gar si los rl e valirl e7. en rlichos previos (pOT ejem-
plo, NHANES III 0 el LRC Family Study) son relevames y aplicables a la poblaci6n
de estudio en cuesti6n, como se di scute brevememe en los parrafos siguientes.
J mportallcia y limitaciolles de los estudios de validez
Como se ilustra con detenimiento en el Capllllio 4, la presencia y la fuerza de aso-
ciaciones observadas en los estudios epidemiol6gicos dependen de la validez (y de
la fiabilidad) de las variables cmciales del estudio, 10 que a su vez delennina la pre-
sencia de errores de clasificaci6n y el grado en que se producen (vease Capit ul o 4,
Secci6n 4.3.3). Por tanto, un elemcnto importante en el proceso de inferencia causal
es el conocimiento de la vali dez de la exposici6n, el desenlace y las variables confu-
soras pri nci pales. Ha sido claramente demostrado que muchas variables, incluso las
consideradas como aceptablemente objetivas, ti enen una validez relativamente
pobre (Tabla 8.2)C20) . Considerese, por ejemplo, un estudio de casos y controles en el
cual la infonnacion sobre habito de fumar se obtiene de un fami li ar pr6ximo en
lugar de provenir directameme de casos y controles. Supongamos que en este estu-
dio la prevalencia de fumadores en el gmpo cont rol es del 10% asi como que, ade-
mas, el odds ratio verdadero asociado con el habilO de fumar (2,25) puede obte-
nerse por medio de entrevistas personales directas. Utili zando las cifras de
sensibili dad y especificidad para el habit o de fumar que se muestran en la Tabla 8.2
(ultima fila), si el error de clasificaci6n fuera no diferencial, el odd,\' relat ivo observa-
308 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.2
Ejcmplos de scnsibilidades y especiflcidades que se atribuyclI a difcrcntes prucbas
cmpJcadas en cstudios epidcmiologicos
Prueba
Tolerancia de la glucosa segun
criterios del proyecto del grupo
universitario de diabetes
Prueba cilol6gica de cuello ulerino
Ulcera peplica por cuestionario
Ensayo de protoporfirina por
microhematocrito
Cueslionario de Rose
Circuncisi6n si 0 no, por
cuestionario
HAbito de 'umar segun familiar
cercano
Enfoque de validacion"
Cohorte
Crilerios de la OMS
8iopsia
Oiagnoslico radiol6gico
Concentraci6n de ~ o m o en
sangre
Enlrevista clinica
Casas y contro/as
Examen medico
Cueslionario personal
Senslbilidad Especlficldad
(%) (%)
91 94
86 91
50 98
95 73
44 93
53 44
94 88
'Para las fuentes Dibliognllicas de los estudiosde validaci6n origin ales, vease Copeland er al.''''l ,
Fuenl.r; KT Copeland el a/ .. Bias Due to Miscla,siiication in the EstimaHon of Relative Risk, American Journal
of Epidemiology, Vol 105, 488495, 11:1 19n, The Johns Hopkins University School of Hygiene & Public Health.
do (sesgado) en el estudio estarfa casi un 30% mas cerca de la hipritesis nula (es
decir, 1,63) de 10 que estarfa el verdadero valor. (Para el calculo de estimados sesga-
dos basados en cifras de sensibilidad y especificidad . vease Capitulo 4. Secci6n
4.3.3). Con estos mismos niveles de sensibilidad y especificidad , una asociacion mas
debil podrfa no haberse advert ido. Obviamente, como tambien se menciono en el
Capitulo 4. Secci6n 4.3.3, el conocimiento de los niveles de sensibilidad y especifi-
cidad de variables err6neamente clasificadas (como se muestra en la tabla) permite
la correcci6n de una estimaci6n sesgada. Ademas, la evaluaci6n de niveles de vali -
dez es crucial en los esfuerzos continuos para desarrollar procedimientos de recolec-
cion de datos cada vez mas exactos sin sacrificar su eficiencia.
A pesar de la importancia de llevar a cabo eSlUdios de vali dez, deberfa enfati zar-
se que tales estudios. especialmente (pero no exclusivamente) los relacionados con
datos del cuest ionario, pueden (ener limitaciones importantes. y sus resultados han
de interpretarse con precauci6n . Primero. la pmeba de oro en sf misma puede no
ser enteramente valida. En los eSlUdios de validacion de informacion sobre dieta. por
ejemplo, datos diarios. a menudo uti li zados como pmeba de oro, pueden tener sus
propias limitaciones con respecto a la medici6n de consumo de ali mentos(21) . Del
mismo modo. el uso de historias medicas, que no son concebidas principal mente con
objetivos invest igativos, para validar infonnaci6n recogida por entrevistas, puede
ser problematico: ell o se debe a que estas hi storias no estan estrictamente estandari-
zadas y a menudo les falta informacion re1evante. Como consecuencia, incluso datos
importantes relacionados con la historia medica del paciente pueden tener exactitud
(y fiabilidad) li mitada. Para obtener informacion sobre habilOS 0 conductas (por
ejemplo, historia pasada de habit o de fumar) que no se recogen rut inariamente en las
hi storias clfnicas, la informacion brindada por el paciente puede ser mas exacta.
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 309
Otro problema relacionado con los est udios de validez es que, aunq ue estos es(U-
dios normalmente se realizan en una muestra aleatoria de part icipantes, la muestra
frecuentemente constiwye un grur-o seleccionado de individuos especialmente mot i-
vados . Debido a que, por definic ion, el procedimiento de la pmeba de oro tiende a
ser mas invasivo y molesto (10 que, ademas del costo, puede precisamente haber sido
en primer lugar la raz6n para no emplearlo como medio princi pal de recolecci6n de
los datos en todo el estudio), no es infrec uente que los estudios de validez incluyan
voluntarios que cooperan. Como result ado, los niveles de vali dez estimados en estos
part icipantes pueden no ser representativos de los verdaderos niveles de validez en
toda la poblaci6n, particul armente para datos concernientes a un cuest ionari o. Por
ejemplo, en el estudio de validacion del cuest ionario de dieta de Willett antes descri -
to, fueron invitadas a panici par 224 enfermeras seleccionadas al azar entre las part i-
cipantes de Boston (las part ici pantes de otros lugares se excl uyeron por razones
logfsticas); de estas 224, 5 1 declinaron partic ipar, sali eron del estudio 0 no ten Ian
infonnaci6n suficiente sobre aspectos medul ares para la validaci6n del est udio. Por
tanto, las 173 mujeres sobre las cuales se evalu6 a la postre la vali dez y la reproduci-
bilidad (73% de las original mente invit adas a panici par del subconjunto de Boston)
pueden no ser representativas de todas las partic ipantes en el est udio.
Una preocupacion adic ional proviene de que el tamano de muestra habitual men-
te pequeno y la imprecision estadistica resul tante de los est udios de validez limit an
la aplicabilidad de sus result ados . Esto es especial mente problematico si los est ima-
dos de sensibilidad y especificidad se milizan para corregi r los del riesgo relativo
o del odds ratio observados en el estudio. Una correcci6n basada en estimados de la
vali dacion que estan marcadamente afectados por un error aleatorio puede producir
mas dano que beneficio: en otras palabras, el est imado corregido puede ser incl u-
so menos correcto que el original.
Fi nalmente, es imponante comprender la necesidad de ser cauteloso cuando se
extrapolan de una poblaci6n a otra los resul tados de un est udio de validacion, espe-
cialmente cuando el instrumento de recolecci6n de datos es un cuest ionario. Por
ejemplo, la validez del cuestionario de frecuencia alimentari a de Willett, que fue
estudiada en una cohone de enfermeras puede no ser generali zable a otras poblacio-
nes con diferentes caracterlsticas socio-demografi cas y educacionales, 0 con dife-
rencias en materia de actitud y conciencia hacia la salud . Particul annente conflictiva
es la generali zacion de ci fras de vali dez para instrumentos de entrevista concebidos
para est udiar poblaciones cul tu ralmente diferentes. A menudo. es menester desarro-
liar instrumentos espedficos para cierto entorno cul tu ral: tal fue el caso, por ejem-
plo, del cuestionario de frecuencia alimentaria desarroll ado por Mart in Moreno et
al.\22) para ser aplicado a la poblacion espanola.
833. Estudios de fiabilidad
En contraste con los estudios de validez. los de fi abilidad evaluan el grado en que los
result ados concuerdan cuando se obtienen de diferentes maneras: esto es, diferentes
observadores, instmmentos de estudio 0 procedimientos; 0 de la misma manera,
pero en diferentes momentos . Para evaluar la fiabilidad es importante considerar
todas las fuentes de vari abilidad de un estudio epidemiologico. Ideal mente, la unica
fuente de vari abilidad deberfa ser la que hay entre los participantes. Desafort unada-
310 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mente, tambien inlluyen otras fllentes de variabilidad sabre cualquier medic i6n dada
en casi todas las situaciones de la vida real. Tales fuentes incluyen:
Variahilidad debidv a la imprecision del observador 0 de/metoda, que puede
clasificarse en dos tipos:
I. Dellfro (0 intra) observador u variabilidad dentro delmetodo, tal como la
variabilidad de una determinaci6n de laboratorio realizada dos veces en la
misma muestra por el mismo tecnico, ut ili zando la misma tecnica, 0 la
variabilidad de una respucsta a una preguma dada por los mismos panic i-
panics cuanda la entrevista se produce en diferentes momentos (suponiendo
que la respuesta no depende del tiempo) .
2. Entre (0 inter) observador 0 variabilidad entre merodos, tal como la varia-
bilidad de una determinacion de laboratorio reali zada en la misma muestra
por dos (0 mas) tecnicos difcrentes uti lizando la misma pmeba 0 test, 0 la
variabil idad de una detcnninacion de laboratorio rcalizada en los mismos
individuos por el mismo tecnico, pero utilizando diferentes pruebas 0 tests .
Variabilidad dentro de los I'llrticil'ante.\ del eJ'll1dio, tal como la variabilidad
en habitos y conductas (por ejemplo, variabilidad en el consumo de ali mentos
dfa a dfa) 0 variabilidad fisiol6gica en los niveles hormonales 0 en la tensi6n
arteri al. Por ejemplo, la Figura 8.2 muestra los valores de tension arterial sis-
200
~
180
I
E
5
160

.0
~
.;;
140

"


120
0
,0

0
~
100
80
r ' - - ~ " Participante A
Promedio
Participante B
Momento de la medicion
Tiempo
Figura 8.2. Valores de tension arterial sistolica hipotCticas en dos indi viduos en cI tiem-
po. El participante A es hipertenso (presi6n sist61ica promedio, 174 mm Hg): el par-
ticipante B es nonnotenso (tensi6n arterial sist6lica promedio, 135 mm Hg). Si ellos se
miden en el momento indicado por la tlecha. un error de clasificaci6n puede producirse debi-
do a la variabilidad entre individuos: el participante A sera mal clasificado como llOrmoten-
so (tensi6n arterial sist6lica por debajo 160 mm Hg) : ademas.la tensi6n arterial del partici-
pante B sera considerada mas alta que la del participante A.
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 311
t61ica de dos individuos en eI tiempo. En este ejemplo hipotetico. uno de los
individuos es hipertenso y el otro no (es decir, sus niveles promedio de ten-
si6n arterial estan respect ivamente por encima y por debajo de l punto de cor-
te para la definic i6n de hipertensi6n sist6lica, 160 mm Hg) . Sin embargo,
debido a la variabilidad fisiol6gica de los niveles de tension arterial dentro de
individuos, la tension arterial de A ocasionalmente se sumerge por debajo del
punto de corte para declararhipertension . Si la medici6n se produjera en uno
de esos momentos, ese partic ipante serfa clasificado err6neamente como
En este ejemplo. la vari abilidad dentro de individuos enmas-
cara la variabilidad entre individuos (la diferencia en los valores promedio
verdaderos que dist ingue a los partic ipantes A y B como hipertenso y nor-
motenso respect ivamente) . A diferencia que 10 que acaece con la variabilidad
debida al metodo/observador, la variabilidad dentro de individuos es real; sin
embargo, tiene consecuencias simi lares a las que result an de la vari abilidad
debida a errores de medici6n donde tambien se introduce ruido en la detec-
cion de diferencias entre los partic ipantes del estudio, que es el prop6sito
usual de la investigaci6n epidemiol6gica. AI igual que los errores debidos al
metodo de medici6n (que se originan en el observador, en el instmmento 0 en
el procedimiento), la variabilidad intraindividual enmascara la verdadera
variabilidad entre individuos y de esta forma produce errores de clasificaci6n.
Obviamente, mientras que los procedimientos de aseguramiento de la calidad
intentan preveni r 0 minimizar la variabi li dad intra e inter observador, la varia-
bilidad fisiol6gica dentro de individuos no es suscept ible de prevenci6n . Sin
embargo, su inll uencia puede minimizarse estandarizando el momenta de
recogida de los datos para medidas con fluct uaciones conocidas en el tiempo,
ta les como los niveles de hormonas esteroideas 0 ac tividad [(sica. 0 estandari-
zando las condiciones de medici6n para variables afectadas por el estres 0 la
acfividad (por ejemplo, la tension arterial deberfa medirse despues de un
peri odo de descanso en un ambiente tranquil o) .
Todas estas fuentes de variabilidad, si estan presentes, tienden a disminuir la fia-
bilidad del valor medido de una variable dada; para cualquier medici6n dada, se afia-
diran a la variabilidad del verdadero valor para el individuo en cuesti6n cuando se
compara con el resto de los individuos en la poblaci6n bajo esmdio.
Los est udios de fiabi lidad du rante la recolecci6n de los datos y las act ividades de
procesamiento, consisten regularmente en hacer mediciones aleatorias repetidas que
a menudo se denominan medidas fantasmas. La Figura 8.3 ilustra esquematica-
mente una de las formas que asumen los est udios de fiabilidad en el caso de un espe-
cimen biologico(23). Los est udios de fiabi li dad pueden incluir medidas repet idas en eI
mismo individuo para evaluar la variabil idad dentro de individuos. Las medidas de
la fiabilidad dentro de laboratorios (0 tecnicos) pueden reali zarse dividiendo la
muest ra en dos alfc uotas, que entonces se miden por el mismo laboratorio (0 tecni-
co) en diferentes momentos (Figura 8.3. alfcuotas 1.1 y 1.2). Una alfcuota adic ional
(alkuota 1.3) puede enviarse a otro laboratorio (0 tecnico) para eval uar la fiabilidad
entre laboratorios. Es importante que todas estas detenninaciones repetidas en
muestras fantasmas se conduzcan de manera enmascarada. Tfpicamente, los fantas-
mas se intercalan espacialmente en el grupo de muestras que se envfan a un labora-
torio 0 tecnico dado, de manera que se logre el enmascaramiento.
312 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Sangre
ffK:olectada
(1 medicKin)
Para medir la variabi!idad denlro de individuos
Sangre
recolectada
(medJda repetida)
------------ _. _ ....................... -
Alicuota
>.2
Alicuota 1.3
Para medir \'ariabilklad intra laboraloria
Envier Alicuota 1.2 al mi,;mo lab.
1 semana despuils
Para Ill" ....
~ .. "r Variab Td
I, ad entre /abo
E'lViar AUcu Iatorios
a un iaboraror 010:'11.3
Alicuota 1.2:
Determinaci6n del lab.
hecha por el mismo lab.
2 semanas despuils
AliclJota 1.1
Determinaci6n dellaboratorio
en la misma semana
10 dO'erama
Alicuota 1.3:
DeterminacKin hecha
por un lab.difarenta
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~
Tiempo
Figura 8.3. Disciio de UII cstudio para evaluar la variabilidad entre indi viduos y entre
laboralorios, y denlro de ell os
Fuente: LE Chambles et al., ShortTerm Intraindividual Variability in Lipoprotein Measurements:
The Atherosclerosis Risk in Communities (ARIC) Study, American Journal of Epidemiology, Vol 136,
1069- 1081, @1992, The Johns Hopkins University School 01 Hygiene & Public Health.
AI igual que para las determinaciones de laboratorio. los esmdios de fiabilidad para
otros tipos de mediciones (por ejemplo, rayos X) pueden concretarse por medio de exa-
menes 0 lectura.,> repet idas. La variabi lidad dentro de individuos para muchos de estos
examenes es li mitada 0 nula (por ejemplo, la variabilidad a conn plazo de la imagen
radiol6gica de un tumor). Las fuentes de variabilidad que deberian evaluarse incl uyen la
forma en la que se realizo el examen (por ejemplo, la posicion del partici pante en el
equipo) y la lect ura (0 interpretacion) . (Vea.'>e ejemplos en la Seccion 8.4.2 que il ustran
la evaluacion de la fiabilidad de los lectores de esmdios poli somnograficos para deter-
minar la presencia de des6rdenes respiratorios relacionados con el suefio).
Evaluar la fi abilidad de cada tipo de medicion tiene sus propias singularidades y
retos . L.1S determinaciones antropometrica.'>. tales como tall a de un aduito, tienen poca
(si es que tienen alguna) variabilidad intraindividuo (por 10 menos a corto plazo); la
evaluacion de la variabilidad entre observadores es bastante sencill a. Por Olro lado. la
evaluaci6n de la fiabili dad dentro de observadores de tales mediciones puede ser un
reto porque es diffc il cegar allector. ya que d 0 ell a puede reconocer al partic ipante
como alguien a quien ya ha medido (y por tanto recordar la lectura anterior y/o hacer
un esfuerzo para ser mas preciso que 10 usual). Simil armente, est udiar la fiabili dad de
respuesta.,> a cuestionarios es dificiL ya que el rec uerdo del 0 la partic ipante sobre su
respuesta anterior inll ui ra en las respuestas que de al cuest ionario en una segunda oca-
si6n (tanto si 10 apl ica diferente como si 10 hace el mismo encuestador).
Al igual que con los estudios de validez. es importante evaluar si los estimados
de fiabilidad obtenidos para la muestra de los part ici pantes del estudio difieren en
dependencia de caracterfsticas relevantes. 10 que puede dar lugar a tasas dife rencia-
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 313
les de errores de clasificaci6n. Por ejemplo. la fiabilidad del cuest ionario de frec uen-
cia alimentaria de Willett en el Estudio de Salud de Enfermeras se compar6 entre
subgmpos de part icipantes, definidos en funci6n de la edad, el habito de fumar, el
consumo de alcohol y de los terciles de peso corporal relat ivd
24l
. En este estudio, no
se observaron diferencias imponantes en la reproducibilidad de los estimados del
consumo de nutrientes entre las diferentes categorlas, 10 que sugiere que los errores
de medicion resultantes de la fiabilidad imperfecta de la informacion sobre consumo
de nlllrientes era probablemente no diferencial (vease Capftulo 4, Secci6n 4.3.3).
Finalmente. como en el caso de los estudios de validez. es importante ser cautelo-
so cuando se generali zan result ados de un esmdio de fiabilidad para un instrumento
dado de una poblacion a otra: igual que la vali dez, la fiabilidad puede ser una funcion
de las caracterlsticas de la poblaci6n que se estudia. Aun siendo apropiado utilizar
estimados de fiabilidad y validez ya publicados, se recomienda que en las etapas de
planificacion de un estudio, siempre que sea posible, se evaluen la validez y fi abilidad
de los instmmentos fundamentales, particulannente de los cuestionarios. Es ademas
importante evaluar la variabilidad imraindividuo, ya que puede tambitn diferir de
acuerdo a ciertas caracterlsticas de la poblaci6n, y afccta por tanto la generali zacion
de los result ados de fiabilidad. Por ejemplo, la variabilidad diaria en los niveles seri-
cos de las hormonas gonadales (por ejemplo, estr6genos) es mucho mayor en las
mujeres premenopausicas que en las postmenopausicas; por tanto, independiente-
mente de la pmeba diagn6stica Ulilizada, la fiabilidad de los niveles de honnonas
gonadales para mujeres mas j6venes no es extrapolable a mujeres de mas edad.
SA. INDICES DE VALlDEZ Y FlABILlDAD
En esta secci6n se descri ben brevemente al gunos de los Indices de vali dez y fiabili -
dad mas frecuentememe utilizados y se chan ejemplos de estudios publicados. Algu-
nos de estos fndices, tales como la sensibi li dad y la especificidad, se relacionan con
la evaluacion de la validez, mient ras que otros, tales como kuppa 0 el coeficiente de
correlaci6n intraclasico, se aplican tfpicamente en la evaluaci on de la fi abilidad
(Tabla 8.3). Sin embargo, algunos de estos Indices se utili zan indistintamente para
evaluar validez y fiabilidad. Por ejemplo. Indices que, por 10 general , se usan como
indicadores de fiabilidad, tales como el porcentaje de concordancia 0 el coeficiente
de correlaci6n intraclase, se ut ilizan a veces para valorar la validez. En la vida real.
puede no di sponerse de una verdadera prueba de oro: por tanto, a veces result a
diffc il distinguir entre las medidas de validez y las de fiabilidad. Cuando no se iden-
tifica claramente una pmeba de oro, los resul tados de la vali deb) se cons ideran a
menudo como estimados de fiabilidad illfermetodo.
SA.I. Indices de valldezlnabllldad para datos categ6rlcos
Sensibilidad y especificidad
La sensibilidad y la especificidad son los dos Indices tradicionales de validez cuando
las definiciones de la exposicion y eI desenlace son ambas dicot6micas. La exposicion
314 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.3
Resumen de indices 0 Cllfoqucs graficos mas rrccucntcmcnte cmplcados para cvaiuar
13 validcz y 13 fiabilidad
En mayor medlda usada para el/alnar .
Tlpo de variable indlce 0 tecnlca Valldez Flabilidad
Calegorica $ensibilidadfespecificidad H
Estadfstico J de Youdeo H

Porr:flnt;ljA rlA

H
Porcentaje de concordancia posiliva

H
Estadfstico kappa

H
Continua Diagrama de dispersi6n (graficos de correlaci6n)

H
Coo/ieiente de correlaci6n ineal (Pearson)

Coo/ieionte de correlaci6n ordinal
(Spearman)

Coo/ieiente de correlaci6n intraclase

H
Diferencia media denlro de pares

H
Coo/ieionte de variaci6n H
GraJico de Bland-Altman H H
Nota ; ++, el indioo as apropiado para medir la magnitud de la validez 0 la fiabilidad, .;. SU iooicacion es en algu
na me<Jida cueslionable.
bajo estudio 0 la categorizaci6n del desenlace se contrasta con un metodo mas exacto
(la pmeba de oro, que se supone representa el verdadero valor y, por tanto, esta libre
de errores). La sensibilidad y la especi ficidad son medidas tambitn frecuentemente
utilizadas en el contexto de la evaluaci6n de herramientas para diagn6stico y cribados;
en ese contexto. los libros de epidemiologfa basica usual mente las describen en rela-
ci6n con la evaluaci6n de la condici6n moroosa (el desenlace) . Como medidas de
control de la calidad en un estudio epidemiol6gico analftico, sin embargo, estos Indi-
ces se aplican a la evaluaci6n de ambos: las variables de exposici6n y las de desenlace.
Las definiciones de los {enninos .wmsihilidad y eJpecijicidad se presentaron en el
Capitulo 4, Cuadro 4.1. De nuevo, el d lculo de la sens ibilidad y la especi ficidad
para una variable binaria se muestra esquematicamente en la Tabla 8.4. (EI Apendice
A, Secci6n A.iO. muestra el metodo para el dlcul o del intervalo de confianza para
los estimados de la sensibilidad y la especificidad).
Tabla 8.4
Rcprcsentacion esqucmatica del calculo de la scnsibilidad y la espccificidad
para una variable binaria
Resultados del estudlo
Positivos
Negativos
Total
Resultados de la Prueba de Oro
Positivos Negativos
, ,
,
d
Sensib lidad '" a I (a.;. c)
Especilicidad d I (b .;. d)
Total
N
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 315
En la Tabla 8.5,se muestra un ejemplo, basado en un est udio reali zado en el Con-
dado de Washington, Maryland, y discutido previamente en las Secci6n 8.3.2, en el
cuallas pmebas realizadas por puncion del dedo se comparaban con medidas estan-
dar del laboratorio (<<prueba de de los niveles de colesterol serico. Para la
Tabla 8.5, los valores anormales se definen arbilrariamente como los que se corres-
ponden con 200 mgldl. La sensibilidad y la especificidad de estos datos result aron
ser 18/ 19 = 0,95 y 11/30 = 0,37, rcspect ivamente. Aunque la capacidad de la prueba
de cribado para identificar individuos verdaderamente hipercolesterolemicos fue
muy aceptable. su capacidad para identificar sujelos normal es>, fue pobre (63% de
los nonnales eran fal sos positi vos).
Tabla 8.5
Comparacion de valores de cribado de colesterol scrico en condiciones de terreno
y valores registrados en un laboratorio estandar
Vatores del crlbado
Positivos
Negativos
Total
Vatores estandar del taboratorlo
Anonnal' Normal
"
19
11
19 30
Total
37
12
49
'Anormal: colesterol serico 200 mgldl para el cribado y II esttmdar de laboratorKl, respectivamente.
Fuente: Datos no publicados tom ados de GW Comstock, 1991 .
En el fi e Ia valioe7. oe Ia infonnacion comtl nicaoa por los propios
sobre peso y talla entre los part ici pantes en el Estudio de Familia LRC mencionado
previamente(1 9J, los individuos se clasificaban en cuatro categorfas de acuerdo a su
indice de Masa Corporal (IMC, medido en kglm
2
): bajo peso (IMC < 20), peso
nonnal>' (IMC = 20-24,9), sobrepeso (IMC = 25-29,9), Y obeSO (IMC O!: 30). EI
IMC se calculaba sobre la base de infonnacion dada por el propio individuo y tam-
bien mediante la medici6n del peso y la lalla. La tabulaci6n cmzada entre medidas
comunicadas por los propios part icipantes y mediciones objetivas de las categorfas
deliMC se presenta en la Tabla 8.6. A partir de estos datos se puede evaluar la vali dez
de una definicion binaria de sobrepeso y obesidad basada en infonnacion comunica-
da por los propios partic ipantes construyendo las tablas dos por dos (2 x 2) que rcco-
ge la Tabla 8.7. N6tese que los estimados de validez difi eren segli n el punto de corte
adoptado. Por ejemplo, para la definic i6n A, sobrepe.l"o se define como IMC O!: 25
kglm!, 10 que produce una sensibilidad de 3.234/3.74 1 = 0,86 Y una especificidad de
3.580/3.7 14 = 0,96. Para la definicion 8 (lado derecho de la Tabla 8.7), la obesidad>,
se definio como IMC O!: 30 kglm\ con los respecti vos estimados de sensibilidad y
especificidad de 0,74 y 0,99. Adviertase que en este ejemplo, la sensibilidad es menor
'1lle Ia hay llna menm pmporcion oe posil ivos>, '1lle oe fal sos
probablemente como conscc uencia del esti gma asociado con la obesidad
en nuestra sociedad, 10 que resulta en una mayor proporcion de individuos que subes-
timan que los que sobrestiman su peso.
Gl ros aspectos relacionados con la sensibilidad y la especi ficidad que deberfan
ser subrayados incluyen los sigui entes. Primero, la dependencia de los estimados de
316 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.6
Tabul aci{1II cruzada de las categorias a partir de cOlllulli cacioncs del propio illdividuo y
la mcdici on objcti va de cuatro indices de masa corpor al. 7.455 participantes adultos
del Estudio Famili ar de Llpidos, 19751978
Categorra de IMe basada en medlclones
IMe basado en
autorreportes
BaJo peso Normal Sobrepeso Obeso Total
Flajo
",
'"
0 0 MO
Normal 72 2.868 505 2 3.447
$obl-epasD 0 134 2.086 280 2.500
Obeso 0 0 59 809 868
Total 534 3.180 2.650 1.091 7.455
Nora: bajo peso IMe < 20 K!}Im' , peso normal lMC = 20-24,9, sobrepeso IMe = 25-29,9, Y obeso IMe 30 K!)Im'
Fuente; FJ Nieto-Garcia, TL Bush. 300 PM Keli , Body Mass Definitions of Obesity: Sensitivity and Specificity
Using and He;ght. Epidemiology, Vol 1, 146-152,1tI 1990.
sensibilidad y especificidad del punto de corte ut ilizado demuestra que hay derta
arbitrariedad al evaluar y comunicar la validez de definic iones binarias de variables
cominuas de exposici6n y de desenlace. Este problema no debe confundirse, sin
embargo, con la dependencia que tienen los valores predictivos de la prevalencia
de la condici6n". A di fe rencia de 10 que ocurre con los valores predict ivos positi vo y
negativo, la sensibilidad y la especificidad estan condicionadas por los tmales en la
ulti ma fila de la tabla (los numeros de positivos y negativos) y, por tan-
to, son te6ricamente independientes de la prevalenda de la dolencia. Sin embargo, la
creencia comun de que la sensibilidad y la especificidad son propiedades inherentes
(fijas) a la prueba (0 criterio diagn6stico 0 procedimiento) en sf misma, indepen-
diemememe de las caracterfsticas de la poblaci6n bajo estudio, puede ser result ado
de un pensamiento excesivamente simpli sta. Esto es particularmeme derto con rela-
, Los valores prcdi cli vos positivos y negJtivos son medidas utilizadas en el conlexlo de la eva-
luaci6n de procedimientos pard diagn6slico} para cribado. ademas de la sensibilidad y la espccifici-
dad. El \"alar prediClh'o posifil"O (VPP) es la pmporci6n de verdadems posilivos entre los individuos
para los que la prueba da positivo (porejemplo. en la Tabla 8.7.la definici6n A. 3.234/(3.234 + 134)
'" 0.96. EI \"alar prediclh'o lIegmil"O (VPN) es la pmporci6n de verdadems negativos rcspecto del
total de resultados negativos. Una caraclerislica importanle de estos indices es que. ademas de su
dependencia de la sensibilidad y la especificidad de la prueba en cuesli6n, son una funci6n de la pre-
valencia de la condici6n. Por ejemplo, en la Tabla 8.7. la prevalencia de sobrcpcso (definici6n A) es
50.2% (3.74In .455): si la pre valencia hubiefd sido 10%. aun con los mismos niveles de sensibilidad
y especificidad pard el peso y la lalla comunicados por los pmpios participanles que los del esludio
familiar LRC, el VPP hubierd sido solamente 0,71. (Eslo puede demostrarse como sigue: utili zando
la notaci6n de la Tabla 8.4. y suponiendo el mismo total N '" 7.455. el valor espcrddo de la celda a
",ria M 1.1 (7 " 0 .10 " O.)/'/l) Y d d" b h 2/l)/. .4 [7.4<;<; " (1 _0 .10) " (1 _0 ,Q/l)I : por ' ;In_
to. VPP '" 641.11(641 J + 268.4) '" 0,70).
Eslos indices tienen rclevancia limilada en el conlexlo de evaluar la influencia de la validez sobrc
los estimados de las medidas de asociaci6n y, por tanto. no se disculen aqui. Una exposici6n delalla-
da acerca de su uso e interpretaci6n. asi como una discusi6n sobrc la raz6n de vemsimili lud y otros
elementos de la validez mas rclevanles para el cribado y las decisiones clinicas. puede enCOnlrdThe
en libms de texto basicos de Epidemiologia Clfnica(" ' '').
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 317
Tabla 8.7
Tabulacion cruzada de las categorias basadas en informacioncs dadas por cl propio
individuo y en medicion bin aria del fndice de masa corporal (IMC). 7.455 participan.
tes adultos del Estudio Familiar de L1pidos, 19751978 (vease Tabla 8.6)
Definicion A: Sobrepeso
IMC
basado en
autorreporte
Sobrepeso
No sobrepeso
Total
Categoria de IMC
basada en mediclon
Sobrepeso
No
sobrepeso
3.234 134
507 3.580
3.741 3.714
Definicion B: Obeso
IMC
basado en
autorreporte
0"'00
No obeso
Total
Categorra de IMC
basada en medlclon
Obeso No obeso
809 59
282 6.305
1.091 6.364
Nota: sobrepeso IMe = 2529.9 kgl.rr. y ot-eso IMe '" 30 kglm'
Fuente: FJ Nieto-Garci a. TL Bush, and PM Keli, Body Mass Definitions of Obesity: Sensitivity and
Using Self lnformed ar.d Height, Epidemiology, Vol 1, 146-152, <1:>1990.
cion a dolencias basadas en una escala continua que se ha convertido mas 0 menos
arbitrariamente en una escala binaria (por ejemplo, obesidad, hipert ensionyn.
Para una variable continua. la probabilidad de clasificar err6neamente a un verdade-
ro positi vo como negativo (es decir, I-sensibilidad, 0 celda c en la Tabla 8.4) tiende a
ser mayor para los individuos cuyos valores verdaderos eSlan cerca del valor escogi-
do como punto de corte, tal como los hipertensos con valores de presi6n arterial sis-
t61ica cercanos al tradicionalmente definido como punto de corte para definir valores
altos>)- (por ejemplo. 140 mm Hg) . Por tanto. aun para la misma prueba (0 procedi-
miento diagnostico) y el mismo punto de corte, el nivel de c1asificaciones err6neas
sera mayor si la dist ribuci6n de los valores (es decir, el espectro de gravedad>, de la
dolencia) esta mas cercana a la de los verdaderos negat ivos, como se ilustra en la
Figura 8.4.
Por lanto, la sensibili dad y la especifiddad de una definidon dada de una enfenne-
dad (es decir, basada en un punto de corte de una distribud6n continua) sf depende de la
distribud6n de la gravedad de la dolencia. La validez de una pmeba tambien puede
variar de una pobladon a otra cuando la prueb..1 no es un marcador directo de la enfer-
medad. Por ejemplo, la especificidad de una pmeba de sangre oculta en heces para el
diagn6J' fico de cancer de colon varia en dependenda de la prevalencia de otras enfenne-
dades que tambien causen sangramiento gastrointestinal, tales como la ulcera peptica 0
el p..1rasitismo. Simil armente, la capacidad de la prueba de denvado proteico purificado
(DPP) para el diagnostico exacto de la tuberculosis humana es una fundon de la preva-
lenda de las infecciones por mycobacterias at fpicas en la pobladon a que se aplica.
Como se discutio anteriormente, otra limitacion de la generali zaci6n de los est i-
mados de sensibilidad y especificidad obtenidos en estudios de validacion, especial-
mente cuando la informacion se obtiene a traves de un cuestionario. es que esas
medidas pueden variar segun las caracterfsticas de los individuos en cuest i6n. Algu-
nos ejemplos se muestran en la Tabla 8.8. En el estudio de Nieto-Garda et al.('9) , la
validez de la definicion de obesidad (IMC C!: 30 kg/m2) basada en informacion de
peso y talla comunicada por los propios participantes variaba sustancialmente en
dependencia de la edad y del sexo. Los est imados de sensibi lidad ut ilizando ellMC
318 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Punta de corte
Verdaderos Verdaderos
,
,
,
,
, -
Gravedad
,
,
Gravedad
Espectro amplio en la gravedad
de los verdaderos positivos
!
Pocos ---,--'" Alta
falsos negativos sensibilidad
Espectro estrecho en la gravedad
de los verdaderos posilivos
Muchos , Baja
faJsos negativos sensibilidad
Figura 8.4. Dos situaciones hipotCticas que cOllduccn a estimacioncs dircrclltes de 13
scnsibilidad dcpcndiclldo del cspcctro de gravcdad de una condicioll dada (par cjcmplo,
tension arterial sist61ica en la abscisa) induso annque sc cmplcn la misma prucba y cI
mismo punta de corte (]>or ejcmplo, tension arterial sist61ica 140 mm Hg para la defi-
nicion de hipcrtcnsi{m) en ambas situacioncs
como prueba de oro (74% en total ) variaron desde mas del 80% en adul -
{Os j6venes de ambos sexos a menos del 40% en hombres de mayor edad.
La Tabla 8.8 tambien muestra las marcadas di ferencias que se observan en la sensi-
bili dad correspondiente al diagn6stico basado en la infonnacion comunicada por los
propios participantes en dependencia del gmpo emico y de la utilizaci6n que hicieran
de la atenci6n sanit aria (indicada por la visit a a un medico en el ano anterior) en la
encuesta NHANES III. Sobre la base de eS{Qs datos, los autores concluyeron que el
uso de informacion comunicada por los propios participantes como aproximacion para
la prevalencia de hipertensi6n ... es apropiada entre blancos no hi spanos y mujeres
negras no hispanas y en personas que tu vieron un contacto medico en los 12 meses
anteri ores. Sin embargo, la hipertensi6n comunicada por los propios participantes no
es apropiada .. entre mexicano-americanos ni en individuos sin acceso a at enci6n
medica regulaf( 18. pag.684) . Estos ejemplos il ustran la influencia de variables sociodemo-
grMicas cruci ales sobre los estimados de validez, y sirven como una demostraci6n
empfrica de los problemas relacionadm con la extrapolacion de estimados de validez a
poblaciones con caraclerfsticas diferentes a aquell as en las cuales se evaluo ori ginal-
mente. Ademas .la gran variabilidad de los esti mados de validez de acuerdo a variables
demograficas, tales como las mostradas en la Tabla 8.8, sugiere que si estas variables
representan las exposiciones de interes (0 estan correlacionadas con elias), pueden sur-
gir errores de clasifi caci6n diferencial (vease Capitulo 4, Seccion 4.3 .3).
Finalmente, es importante hacer enfasis en que, como se discut io previamente en la
Seccion 8.3 .2, la validez de al gunos items de infonnacion que son ampliamente mili za-
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 319
Tabla 8.8
Ejemplos de rcsultados en subgrupos de la scnsibilidad
dc la informacion obtenida mcdiante comunicacion brindada por los propios sujetos
cn dos estudios epidcmiologicos
Estudlo
Nielo-Ga,cia el a,' OI
Obesidad basada en
peso y talla autorreportadas'
Vargas et af ' WI Hipertensi6n
basada en autorreportel
Categorfa
Edad ,:aflos) 20-29
30-39
40-49
SO-59
60-69
70-79
Blancos
Visila al medico el ano anterior
Negros
Visila al medico el ano anterior
Mexicano-americanos
Visila al medico el ano anterior
Hombres Mujeres
Sensibllidad (%)
"
"
73 85
69
"
65 81
46 75
38 68
Sf 71 73
N9 43 57
Sf 80 74
N9 36 73
Sf 61 65
N9 21 65
'Basado en datos tomado del Estudio Fam;/iar de LipidDs (vease el texto); verdadera delinida como
Indice de Masa Corporal igual 0 superior a 30 kglm' .
'Basado en datos del NHANES III (ver texto); hipertensi6n. verdadera definida como tensi6n arterial sist61i ca
medida ., 140 mmHg. tensi6n arterial diast6lica ., 90 mmHg. 0 uso de me<Jicamentos antihipertensivos.
dos en los ambientes clfnicos 0 en esmdios epidemiol6gicos no pueden tomarse como
ciertos. La Tabla 8.2 muestra al gunos ejemplos de result ados de est udios de validacion
de diversos datos clfnicos 0 de historias clfnicas, tal como se resumen en una revision
hecha por Copeland ef aU
m
). N6tese que algunas de las pmebas incluidos en la Tabla
8.2 tienen escasa sensibilidad pero exhiben aceptable especificidad, tal como la ulcera
peptica comunicada por los propios part ici pantes y la definic i6n de angina del cuestio-
nario de Rose. t>;tos no deteclan el 50% 0 mas de los casos identificados por rayos X 0
por entrevista clfnica. respectivamente, mientras que clasifican correctameme a casi
todos los no casos. Por otro lado,otras pruebas tales como la infonnacion sobre si el
individuo fue objeto 0 no de circuncisi6n, sufren del problema opuesto, que tiende a
identificar a mas del 80% de los casos verdaderos positivos (de acuerdo a un examen
ffsico), mientras que a la vez clasifican a una gran proporci on de verdaderos negativos
como (falsos) positivos ( l-esp = 56 %) . La pobre especificidad de la circuncisi6n a par-
tir de 10 comunicado por los propios participantes subraya el hecho de que incl uso Items
de informacion que podrian considerarse altamente validos debido a su naturaleza
objetiv3, estan sujetos a errores. Gtro ejemplo viene dado por los hallazgos de un
estudio realizado por Fikree ef al.(2'j) sobre la vali dez del infonne de los esposos sobre
los result ados del embarazo de sus esposas . En este estudio, lIevado a cabo en una
muestra de 857 parejas seleccionadas de una poblaci6n trabajadora en Burlington, Ver-
mont, los informes de las esposas fueron utili zados como estandar contra eI que se eva-
320 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
luaban los infonnes de los esposos . La sensibilidad de los infonnes de los hombres
sabre embarazos con niftos de bajo peso al nacer fue del 74%, la de aborto espontaneo
fue del 71,2% y la de aborto inducido del 35, 1%. La validez era mas pobre entre los
individuos mas j6venes y con menor nivel de educaci6n. Los autores de este eSUldio
conduyeron que serfa pmdente evit arel uso de los esposos como infonnantes alterna-
ivas sabre de las hi storias reproduclivas de SlI S esposas)P<J p21i) .
El estad{slico J de Youdell
Descriw por Youden(30) en 1950, eI estadfstico J es un Indice resumen de la validez
que combina la sensibilidad y la espedficidad. Se calcula como:
J = sensibilidad + especificidad - 1.0
Por ejemplo, para los datos que se muestran en la Tabla 8.5:
J = ( 18/ 19) + (1 1/30) - 1,0 = 0947 + 0,367 - 1,0 = 0,3 14 (0 31,4%)
EI valor 1.0 se sustrae de la suma de la sensibili dad y la especificidad, de manera
que el valor maximo del fndice sea 1,0 cuando haya concordancia perfecta. Aunque,
teoricameme, el valor de J puede ser negat ivo, hasta - 1,0 (es decir, en presencia de
di screpancia perfecta, cuando la prueba siempre di screpa de la prueba de o r o ~ ) , un
minimo mas realista para el recorrido de J en la vida real es J = 0, que se obtiene
cuando la prueba funciona igual que el simple azar (es decir, sensibilidad yespecifi-
cidad = 0,5). Notese que este fndice otorga igual peso a la sensibilidad que a la
especificidad; por tanto, supone que ambos son componemes igualmeme imponan-
tes de la vali dez. Por ejemplo, para los datos de la Tabla 8.7, los valores de J para la
informaci6n comunicada por los propios panic ipantes son 82% y 73% para los
sobrepesos y los obesos respectivamente. (N6tese que el ultimo es casi identico
a la sensibilidad estimada de la obesid1d basada en la comunicacion brindada por los
propios sujetos 174%J debido ala especificidad casi perfecta 199%J en este caso, un
valor que practicamente desaparece al sustraerse I en el dlculo).
Las formu las para el dlculo del imervalo de confianza para el estimado del esta-
distico J se proveen en el Apendice A, Seccion A .11 .
Debido a que el estadistico J Ie asigna igual peso a la sensibilidad que a la especi-
ficidad , se necesita utilizar indices alt ernativos cuando estos componemes de la vali -
dez no se consideran igualmente importantes en una situaci6n dada.
Porcelltaje de cOllcordallcia
EI porcemaje de concordancia emre dos conj umos de observaciones se obt iene al
rl ivirlir e l nllmem rle ohservaciones emparejarlas '1lJe se hall an en las ce1rl as en las '1lJe
hay concordancia, entre el numero total de observaciones emparejadas (Figura 8.5).
Como ejempl o del dlculo del porcentaje de concordancia, la Tabla 8.9 muestra los
resultados de lecturas repetidas de imagenes de Ultrasonido modo B de la bifurca-
cion de la carotida izquierda , realizad1s para examinar la fiabi li dad de la idemifica-
cion de placas ateroescler6ticas en el estudio ARICO!). Cuando se utiliza una defini -
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 321
Observaci6n n, 1
Prueba .;. Prueba -
N
Prueba .;.
0
0
0
,
[J
,0
0

>

n
0
Prueba -
[J
d
")
Observaciones concordantes
(a + d)
Porcenlaje de concordancia. x 100
(a+b+c+d)
Fi gura 8.5. Porcentaje de concordancia para resultados de una prueba emparejada
binari a (positivo frente a negativo: por ejemplo, aquellos obtenidos por dos observadores 0
metooos diferentes 0 por el mismo observador en dos momentos diferentes): proporci6n de
resultados concordantes entre todos los evaluados.
cion binaria de la variable (presencia de placa 0 normal) , como en el ejemplo mos-
trado en la tabla. el porcentaje de concordancia puede calc ul arse simplemente como:
. , 140+725 8
PorcentaJe de concordancta = x 100 = 7,7 %
986
El porcentaje de concordancia no solamente es el mCiodo mas simple de resumir
el concordancia para variables categ6ricas, sino que riene la ventaja adic ional de que
puede computarse para cualquier nlimero de categorfas, no solamente para dos como
en el ejemplo precedente. Por tanto, en el estudio de fiabili dad de las lect uras del
ultrasonido carotfdeo(l ,), a los lectores que detectaban una placa se les pedfa tambien
Tabla 8.9
Concordancia entre la primera y la segunda Iccturas para identificar placa
de arteriosclerosis en la birurcaci{m carotidea izquierda mediante examen
de ultrusonido modo B en cI cstudio de ri esgo de Ateroesclerosis en Comunidades ARIC
Primera lectura
Placas Normal Total
Segundn lectum Plncns
'" "
Hl2
Normal 69 725 794
Total 209 777 986
Fuente: R U al ai" Reproducibility el Exlracranial Carotid Atherosclerosis Lesions Assessed by BMode Ultra
soooo: The Atherosclerosis Risk in Communities Study, Ultrasound Moo Bioi, vel 22. 791799. ot>l 996,
322 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
que evaluaran 1a presencia de sombras acusticas (una atenuaci6n de los ecos detras
de las placas que a menudo reflejan 1a presencia de calcificaci6n de las placas: por
ejemplo, lIna placa ateroescler6tica avanzada) . Los resultados de las lecturas de
rcproducibi li dad de 1a bifurcaci6n carotfdea izquierda en este estudio cuando se uti -
liza la definicion mas fina de la placa se muestran en la Tabla 8. 10: el porcentaje de
concordancia en este caso puede calcul arse como:
Porcentaje de concordancia =
17 + 104+725
986
Tabla 8.10
x 100 = 85,8%
Concordancia entre la primera y scgunda Icctura para idcnlificar placas
de arteriosclerosis COli 0 sin sombra acustica en la bifurcacion carlltida izquicrda
Primera lectura
p"," S' Sdo Placas Normal Total
Segunda lectura P"," S' 17 14 6 37
Solo Placas 5 104 46 155
Normal 5 64 725 794
Total 27 162 777 986
'Placa"," sombra (acustica),
FUMre: R li or ai" Reproducibi lity of Extracranial Carotid Atherosclerosis lesions Assessed by BMode Ultra
sound: The Atherosclerosis Risk in Communities Study. Ulrrasound Moo BiO/, Vol 22, 791 799, ClI996.
Los result ados de otra evaluacion de fiabilidad. basados en los datos de un
eswdio de la relaci6n entre la superexpresion de la protefna p53 y el perfil de fac-
tores de ri esgo de cancer de mama. se muestran en la Tabla 8. 11 (32) . Como parte
de los procedimientos de control de la calidad en este estudi o. 49 secciones de
tumores de mama se tifieron 2 veces y la tabla cruzada resultante de los datos des-
pues de las primeras dos tinciones muestra que el porcentaj e de concordancia es
de 100 x ( 14 + 7 + 2 1)/49 = 85.7%.
Aunque el porcentaje de concordancia es el paradigma de los indices de fiabili-
dad para variables categ6ricas. tambien puede ut ilizarse para evaluar la validez: esto
es, puede mili zarse para examinar el concordancia entre los result ados de la prueba y
una presunta prueba de oro. En tal caso, el calculo se reali za obviamente sin con-
dicionamientos sobre este ult imo (como es el caso de los calculos de sensibi li dad y
especificidad). Por ejemplo, en la Tabla 8.5, el porcentaj e de concordancia es mera-
mente el porcentaje de las observaciones que caen en las celdas de concordancia
entre el total , 0 100 x ( 18 + II ) I 49 = 59,2%. De forma parecida, en los result ados
del estudio de validez mostrados en la Tabla 8.6, el porcentaj e de concordancia entre
las categorfas del peso basadas en la c,omunicacion brindada por los propios sltj etos
y las medidas de peso y talla es 100 x (462 + 2.868 + 2.086 + 809)17.455 = 83,5 %.
Una li mit acion del enfoque con el porcentaje de concordancia es que sus valores
tienden a ser altos siempre que la proporci6n de resultados negat ivo-negati vo es alIa
(resullante de una baja prevalencia de positividad en la poblacion de estudio), parlku-
larmente cuando la especificidad es alta. Por ejemplo, en la Tabla 8.7, el porcentaje de
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 323
Tabla8.ll
Reproducibilidad del proccdimiento para sobre exprcsion de p53 en 49 scccioncs cancer
de mama: cstudio de Los Pafscs Hajos sobre contraceptiYos oralcs.
Primera linci6n
Total
Segunda linci6n 1'53, 14 1 15
p53. 7 2 9
p53 4 21 25
Total 14 12 23 49
Fuente; K van der Kooy el a/ .. p53 Protein Overexpression in Relation to Risk Factors lor Breast Cancer. Ameri
can Journal of Epidemiology, Vol 144, 924-933, <t>1996, The Johns Hopki ns University School of Hygiene & Public
Health
eoncordancia es mayor para la definic i6n 8 (95,4%) que para la A (9 1 ,4%), aun euan-
do la sensibilidad fue 12 puntos mas baja en 8 que en A (74% Y 86% respeetivamen-
Ie); esto puede expl icarse en parte ror el heeho de que la prevalencia de la eondici6n es
menor en 8 que en A, 10 que inlla la eelda negat ivo-negativo, y en parte por el hecho
de que la especificidad es mayor en 8 que en A (esta cereana al 100% para el primero).
Como una il ustraci6n mas, la Tabla 8.1 2 muestra la situaci6n hipolelica de una pobla-
ci6n en la cualla prevalencia de obesidad fue 20 veces menor que la observada en la
poblaci6n LRC, pero los niveles de sensibilidad y especificidad eran {o.\ lIIislIIOS que
los observados en la Tabla 8.7, definic i6n 8 (exeepto por redondeo) . En esta situaci6n,
el porcentaje de eoncordancia aumentara del 95,4% a eerca del 99%; esto es, sera casi
Tabla 8.12
Resultados hipotCticos basados ell tl ejemplo de la Tabla 8.7 (definicion H) suponiendo
los mismos valorcs de validez pero prevalencia aproximadamente 20 vcces menor
que la hallada en el estudio
Calegoria segun IMC basado en medici6n
IMC basado en la comunicaci6n
de los propios participantes
Obesos No obesos Total
Obesos 41 69 110
No obesos 14 7.331 7.345
Total 55 7.400 7.455
(41 + 7.331)
Porcentaje de concordancia: >< 100", 9B,9%
7.455
2
PCP' '=' 100", 49,7%
(55 + ItO)
CCC;C
Porcentaje de concordancia posili .. a de Chamberlain: '=' ..., x 100 '" 33,1%
(41 +69+ 14)
'Porcentaje de concordaocia
324 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
perfecto solo como resultado de la disminuci6n de la prevalencia. Notese que, de for-
ma anaJoga, el porcentaje de concordancia tambien tiende a ser alto clIando la preva-
lcnda de la condici6n es mlly alta (10 que da lugar a una abultada proporcion de obser-
vaciones positivo-positivo), particularmente clIando la sensibilidad es alta.
Al igual que con la sensibilidad y la especificidad , los errores estandar y los ]fmi-
ICS de confianza para el porcemaje de concordancia se calculan como para cualqui er
proporcion (vease Apendice A, Seccion A. IO).
Porcelltaje de cOllcordancia positivas
En parte para superar las li mitaciones del porcentaje de concordancia como Indice
de fiabilidad clIando la prevalencia de la condici6n es muy baja (0 muy alt a), se han
propuesto por 10 menos dos medidas de concordallcia positiva(3l) :
I. Porcentaje de cOllcordallcia posifiva: numero de unidades para las que ambos
observadores comunican un resultado positivo, entre el nlimero promedio de
positivos dados por ambos observadores. Utili zando la notaci6n de la Tabla
8.4, esto se formu la como sigue:
a
PCP=------"---
2a
x I 00 = -,-----='------,-,- x I 00 =
[(a + c) + (1 + b)]
( (a + c) ~ (1 + b) )
2a
-;::---;---:- x 100
(2a +h+c)
2. Porcentaje de cOllcordallcia pOJ'itiva lie Chamberlain: nlimero de unidades
para las que ambos observadores comunican resultados positivos entre el
nlimero de observaciones para las que al menos un observador 10 hace(34).
a
pcp de Chamberlain = -,----';--,-,- x 100
(a+h+c)
EI dlculo de estos dos Indices se ilustra en el ejemplo de la Tabla 8.12. Notese
que los dos indices estan algebraicamente relacionados:
Estad{stico kappa
PAP
PCP de Chamberlain = -:::-'-''':-=-
(2 - PAP)
Las medidas de concordancia anteriormente expuestas tienen una limituci6n
import ante. No tienen en cuenta la concordancia que puede ocurri r solo por azar:
esto es, no toman en consideraci6n el hecho de que aunque ambas leclllras no
tlIvieran ninguna relaci6n (por ejemplo, ambos observadores clasifican al azar),
exist ira algun grado de concordancia debido solamente al azar. Una medida que
corri ge el resultado teniendo en cuenta esta realidad es el estadistico kappa(6) (K),
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 325
definido como la fraccion de la concordancia observada que no es debido al azar
con relacion a la concordancia maxima posible no debida al azar cuando se utili-
za una clasificacion categ6rica de una variableo5.l7). Esta definicion se entiende
f:kilmente si se cons idera la formula para el calculo de K:
_
P", o_-", P,,--
K=
1,0 - p.
donde Po es la proporci6n de concordancias observadas y P, es la concordancia debida al
azar; eslO es, la proporcion de concordancias que se espera ocurran solo por obra del azar.
El K se cabl la a partir de las celdas mostradas en la diagonal de una tabla cruza-
da, que representa concordancia completa entre dos conjuntos de observaciones. La
concordancia por azar es el que se esperarfa si ambos observadores clasificaran las
respuestas al azar. La concordancia total por azar es la suma de la concordancia por
azar para cada celda en la diagonal. El numero esperado solo por este concepto en
cada celda es el producto de los IOtales marginales correspondientes dividido por el
gran total. (N6tese que este es el mismo metodo empleado para calcular los valores
esperados bajo la hip6tesis nula para una pmeba de Ji -cuadrado en una tabla de con-
tingencia). Por ejemplo. la concordancia atribuible al azar para la celda placa-pla-
ca en la Tabla 8.9 es (209 x 192)/986040.7. Y el de la celda normal-normal
es (777 x 794)/986 0 625,7. La concordancia total esperada por azar es por tanto
(40,7 + 625,7)/986 = 0,676. (Una via rapida para el dlculo de la proporci6n de
concordancia por azar para cada celda consiste en dividir los productos de los marge-
nes por el cuadrado del total: esto es, combinar ambos pasos - el dlculo del mimero
esperado y el de la pIVI'orci6n esperada- en uno. Por ejemplo, para los datos de la
Tabla 8.9, la proporci6n esperada para la celda placa-placa es [209 x 192[1986
2
, Y el
de la celda normal-norma1 es 1777 x 794J/986
1
. La concordancia total por azar es
por 10 tanto [209 x 192 + 777 x 794J/986
2
= 0,676). Puesto que la concordancia
observada para esta tabla fue 0,877 (vease anterionnente), se tiene
K = 0,877 - 0,676 = 0 62
1,0 - 0,676 '
Las f6nnulas para el error estandar y el intervalo de confianza para kappa se dan
en el Apendice A, Secci6n A. 12.
Los valores posibles de kaplJa oscilan entre - I y I , aunque los valores por debajo
de 0 no son muy realistas en la practica (la concordancia observada seria peor que
el que producirfa solamente el azar). Para la interpretacion de un valor dado de
kappa se han propuesto diferentes clasificaciones
oll
.
38
.-W) (Figura 8.6). De estas, la
mas ampliamente utilizada probablemente sea la de Landis y Koch(38) . Es impor-
tante tener en cuenta, sin embargo, que estas clasificaciones son
para cualquier valor dado de kappa, el grado de sesgo por error de clasificaci6n
que resultaria de aplicar el instrumento/lector correspondiente dependera de otras
circunstancias, tales como la prcvalencia dc la condici6n y la distribuci6n dc los
margenes (vease mas adelante).
AI igual que el porcentaje de concordancia, kappa puede estimarse a partir de tablas
3 x 3,4 x 4 0 k x k. Por ejemplo, eI valor de kappa para las lect uras repetidas de los
examenes ult rasonograficos de la bifurcaci6n carotfdea en el est udi o ARIC mostra-
das en la Tabla 8.10 pueden calcul arse como sigue:
326 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
1,0
0,8
0,6
0,<
0,2
0,0
,
Landis
Koch {1977}
Casi
perfecta
Notable
Moderada
Aceplable
Reducida
Pobre
- 1,0 - ------
Altman {1991 }
"oy
buena
Buena
Moderada
Aceptalje
"'""
Fleiss (1981 )
Excelenle
1-----1(0,75
D,
aceptable
buena
"'""
)
Byrl (1996)
Excelenle
Muy buena
Buena
Aceptable
Reducida
Pobre
Concor
dancia
I Inexislente I
______ 1
I
0,92)
Fi gura 8.6. Clasificacioncs propucstas para 18 int erpret aci on de UII valor de kappa.
Acuerdo observado (vease antes) = 0,858
Acuerdo por azar =
1(27 x 37) + ( 182 x 155) + (777 x 794)]
(986)'
= 0,665
(0,858 - 0,665)
(I - 0,665)
0,576
Tambien igual que el porcentaje de concordancia, kappa se miliza principal men-
Ie para 1a evaluaci6n de la fiabilidad: esto es, cuando no hay un estandar claro y
result a apropiado darle igual peso a ambos conjuntos de lecturas . Sin embargo, tam-
bien se ut ili za ocasionalmente para la evaluaci6n de la validez, en la comparacion de
los result ados de una prueba con los de una prueba de orO . En la Tabla 8.6 la
concordancia observada entre categorias de lMC basado en la comunicaci6n brinda-
da por los propios suj etos y las de la prueba de oro (lMC basado en mediciones)
es 0,835 (vease texto anterior). La concordancia esperada por azar serfa:
[(534 x 640) + (3 .180 x 3.447) + (2.650 x 2 .5(0) + ( 1.09 1 x 868)[
7.455
2
Por tanto,
K = (0 ,835 - 0,340) = 0 75
(I - 0 ~ 4 0 ) ,
= 0,340
Kappa tambien se ut ili za frecuentemente en situaciones en las cuales, aunque
exisle una prueba de oro, esla esta suj eta a errores no despreciables y, por tanto, eI
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 327
invest igador es reticente con respecto a tomarlo tal como se observa (como se supo-
ne cuando se calculan la sensibilidad y la especificidad de la prueba). (Como se
menciono previamente. en esta silUaci6n, puede ser preferi ble referi rse a la compa-
racion entre la prueba de oro y la prueba examinada como una evaluaci6n de la
fiabilidad imermetodos y no de la vali dez) . Un ejemplo es un estudio que utiliza
niveles sericos de cotinina como prueba de oro para evaluar la vali dez de l
habito de fumar reportado por mujeres en este ejemplo la prueba
de oro tambien esta sujeta a errores que vienen del laboratorio y tambien de la
variabilidad intra-individual. y el calculo de kappa que result o ser de 0.83. Ademas.
para evaluar indirectamente que metodo (comunicaci6n brindada por los propios
sujetos 0 nivel de cotinina serica) tenfa mayor validez predictiva (y fiabilidad), los
autores compararon la magnitud de su correlaci6n con un result ado que, como es
bien conocido, esta fuertemente relacionado con el habito de fumar de la madre: el
peso del nino al nacer. La correlaci6n entre la cotinina serica y el peso al nacer (r =
0.246) fue solo li geramente mayor que la observada entre el habito de fumar comu-
nicado por los propios participames y el peso al nacer (r = 0,20), 10 que sugiere que,
en esta poblacion, la cotinina serica y la comunicacion brindada por los propios
sujetos son simil armente adecuadas como marcadores de exposici6n actual al habi-
to de fumar. (Las li mitaciones de las inferencias basadas en el valor de l coeficiente
de correlacion se discuten mas adcl ame; vease Seccion 8.4.2).
Otro ejemplo de la aplicacion de kappa para evaluar la fiabi lidad intermetodos 10
tenemos en un eSlUdio que compara la capacidad funcional basada en el desempeno
y la que result a de una autoevaluaci6n en una poblaci6n anciana de Barcelona, Espa-
Algunos result ados seleccionados de este est udio se muestran en la Tabla 8.1 3.
Notese que los autores comunican medidas de vali dez (sensibilidad y especificidad)
y fiabilidad (porcentaje de concordancia y kappa); por tanto, dejan a cargo del lector
la elaboraci6n del juicio acerca de sf la evaluaci6n de desempeno en un momenta
dado constituyo 0 no una prueba de oro apropiada.
Se dispone de extensiones del estadfstico kappa para la evaluaci6n de clasificaciones
mul tiples (0 medidas repetidas m(iJt iplesYJt.) . Un ejemplo de esta apl icaci6n de kap/Ja
puede encomrarse en un eSllldio que evalua la fi abilidad de la clasificacion diagn6stica
de visitas de emergencia y sus implicaciones para estudios de poluci6n del ambientd+l).
L.1 concordancia (kappa) entre el diagnOstico obtenido a partir de la base de datos del
hospital y la realizada por seis clasificadores extemos (medicos de emergencia a tiempo
completo) de concordancia a la categoria diagnostica y el nivel de polucion del dfa se
presenta eficientemente por los autores (como se muestra en la Figura 8.7) .
Kappa pOllderado
Cuando los desenlaces del est udio pueden expresarse con mas de dos categorfas,
unos desacuerdos pueden ser mas marcados que otros; en esta silUacion, debe consi-
derarse el uso del kappa ponderado. Una ejemplo de su apl icaci6n es la comparaci6n
ent re ellMC comunicado por los propios partic ipantes y el que se basa en medicio-
nes, discUlido anterionnente (vease Tabla 8.6) . Cuando el estadfstico kappa se caicu-
16 para estos datos (K = 0,75), se supuso que solo valla la pena considerar el concor-
dancia total (la diagonal en la Tabla 8.6): esto es, cualqui er tipo de desacuerdo,
independientemente de su magninld, se tomaba como tal. Un enfoque alt ernativo
Tabla 8. 13
Concordancia entre invalidez comunicada), desempelio obsen 'ado en una muestra de 626 indh'iduos de 72 alios 0 mas de edad,
en Barcelona, Espaiia.
"Necesidad de ayuda" para caminar comunicada Desempeno al caminar 4 metros
Incapaz Capaz Sensibiliclad' Especificidad' % de concordancia Kappa
Si
No
15
11
12
571
0,58 0,98 96 0.55
al caminar comunicadaOesempefio al caminar 4 metros

Despaclot Rapldot Senslbilldad Especlflcidad % de concordancla Kappa
Si
No
85
56
75
367
O,6()
DificuHad" allevantarse de una silla comunicadaDesempeno al levantarse 5 veces de una silia
0.83 78 0.41
Incapaz Capaz Sensibiliclad Especificidad % de concordancia Kappa
Si
No
71
"
"
"5
0.63
(0.54 - 0.72)1
0.92
(0.89 - 0.94)1
'La soosibifidad y fa especificidad se caiccjaron considerando el examen de desempeno fisico como oprue!la de
'. Despae;o.. y se de aeuerdo a si el eamin6 4 metros en mas 0 00 mooos de 7.5 segundos respectivamoote.
'Los inte.vakl, de COnlMz.a para estos estimados y una ilustrad6n de su eatrulo pueden verse 00 el Apendice A, Secckl nes A.l0 y A.12.
86
(83 - 89)1
0.55
(0.47 - 0.63)1
Fuentu. M FM er el al. , Corll'anson of PeriOfmanceBased and Functklnal Capacity in SpMish Eiderly, AmericM JO<lnal of Epidemiology, Vd 149, 228-235,
1!:1 1999, The Johns Hopkins University SeMel of Hygiooe & Publ ic
W
N
00

5
8
;;-
z
I
8
Ii

<
>

n


rn
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 329
,,0 -,---------_
0,9
0,8
IT
,
0,7
~
"-


~
0,6
~
0,5
0,4
O , 3 ~ - - - - - - - - - - - - - '
TOOos loS avaluadores
Figura 8.7. Fiabilidad dc la dasificadon diagnostica dc las visitas dc cllIcl"gcnda scgun
catcgorfa diagn6stica: la clasificaci6n se hacfa segun la base de datos del hospital y seis
evaluadores externos. Base de datos del departamento de emergencia del Hospital Regional
Saint John. Saint John. New Brunswick. Canada. 1994. Los sfmbolos oscuros representan
dfas de alta poluci6n y los claros representan dfas de baja poluci6n. *. P (dfas de baja polu-
ci6n vs dfas de alta poluci6n) = 0.002 . . asma: . enfennedad pulmonar obstruct iva cr6ni-
ca: ... infecci6n respiratoria: ... enfemledades cardiacas: . otras.
Fuente: OM Stieb el a/ .. Assessing Diagnostic Classification in an Emergency Department: Impli-
cations for Daily Time Series Studies of Air Pollution, American Journal of Epidemiology, Vol 148,
666-670, 1998, The Johns Hopkins Uni\'ersity School of Hygiene & Public Health.
cuando se calcula el valor de kappa es asignar pesos disti ntos a diferentes niveles de
desacuerdo. Por ejemplo, la Tabla 8.14 muestra los mismos datos que la Tabla 8.6,
pero tam bien indica que el peso total (1,0) se Ie asign6 a las celdas de la diagonal
que representan el acuerdo perfecto, un peso de 0,75 se les asign6 a los desacuerdos
entre categorfas adyacentes, uno de 0,5 a los desac uerdos correspondientes a una
distanci a de dos categorfas, y un peso de a los desacuerdos de 3 categorfas. EI d l-
cul o de l amado ob.\ervado en la Tabla 8.1 4 es anaJogo al de una media ponderada
en el sent ido de que consiste meramente en multiplicar el numero en cada celda por
el peso correspondiente, sumar todos los productos y di vidir la suma por el gran
total. Comenzando en la primera fila con la celda que denota bajo peso para
ambos ensayos y procediendo de izquierda a derecha en cada fila, el acuerdo obser-
330 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.14
Calculo de kappa pondcrado: tabulacion cruzada de cuatro catcgorfas de iudice
de masa corporal comunicada por los propios participantcs y basada en mcdiciones.
7.455 participantcs adultos del Estudio Familiar de Clfnicas de luvcstigacioll de Lipidos,
19751978. (VCase Tabla 8.6)
Categorfa segun IMe medido
IMe basado
Sajo peso Normal Sohrepeso OOOso
en aulorreporte
Bajo peso 462 (1 ,0)" 178 (0,75) 0(0,5) 0(0)
Normal 72 (0,75) 2.868 (1,0) 505 (O.7S) 2 (0,5)
Sobrepeso o (0,5) 134 (0,75) 2.086 (1 ,0) 280 (0,75)
OOOso 0(0) o (D,S) 59 (0,75) 809 (1,0)
Total 534 3.1 80 2.650 1.091
, N.' obselVado (peso para el calculo de kawa).
Total
640
3.447
2.500
868
7.455
vado (P Of' en el que las letras 0 Y I' denotan observado y ponderado respectiva-
mente) es
P"p= (462 x 1 + 178x O,75 +0+0+ 72xO,75 + 2.868x I +505 x O,75+2x0.5+
+ 134 x 0,75 + 2.086 x I + 280 x 0,75 + 0 + 0 + 59 x 0,75 + 809 x
1)17.455 =0,959
EI crilculo de Pop puede simplificarse reorganizando esta ec uaci6n, agmpando las
celdas con pesos igual es (y omitiendo las que tienen ceros):
P"p = 1(462 + 2.868 + 2.086 + 809) x 1 + (178 + 72 + 505 + 134 + 280 + 59) x
0,75 + (2) x 0.5117.455 = 0959
EI dlculo del (lel/erdo 1'0" aza,. (Pop' en el que la letra e denota esperado sOlo
por el azar) en este ejemplo, se realiza como sigue: I) multipli que los to(ales margi-
nales correspondientes a las celdas con un peso de 1,0; entonces sume estos produc-
(Os y multi plique esta suma por el peso de 1,0; 2) haga 10 mismo con las celdas con
pesos igual a 0,75 asf como para las celdas con pesos de 0,5 (es decir, incluyendo
aquell as con valores observados iguales a cero); y 3) sume (Odos los resultados ante-
riores y divida la suma por el cuadrado del gran total como sigue:
Pop = 1(534 x 640 + 3.1 80 x 3.447 + .. . ) x I + (534 x 3.447 + .. . ) x
0,75 + (2.650 x 640 + 1.09 1 )( 3.447 + 534 x 2.500 + 3. 180 x
868) x 0,5JI7.455
2
= 0,776
Una vez que se obti enen los valores ponderados de acuerdos observados y por
azar, la formu la para el kappa ponderado es identica a la del no ponderado:
Pov,.- P,w
I ,O - P,w
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 331
Utilizando esta f6rmula para calcular el kappa ponderado de la Tabla 8.4 se
tiene:
Kw = 0,959 - 0,776 = 0,82
1,0 - 0,776
Notese que en eI ejemplo anterior, el peso de 0,5 asignado a un desacuerdo de dos
categorfas se miliz6 solo como ejemplo hipotetico para el calculo del kappa pondera-
do; en la realidad, uno estarfa poco incl inado a darle peso alguno a desacuerdos entre
tales categorfas extremas como obeso versus normal 0 sobrepeso versus bajo
peso. En general los pesos asignados a las celdas, aunque algo arbitrarios, deberian
ser seleccionados sobre la base de la percepci6n del invest igador acerca de cuan serios
son los desacuerdos para el confexfO ell que seran utilizados. Por ejemplo, en un
ambiente clfnico donde un diagn6stico confirmatorio de cancer de mama a partir de
biopsias puede ser seguido de una mastectomfa, no es aceptable nada fuera de un
acuerdo perfecto. (En la pr:ktica, en esta situacion el desacuerdo entre dos observado-
res se juzga y dirime por un observador u observadores adidonales). Un ejemplo de
naturaleza diferente es la inclusion de casos de infarto del miocardio definitivos 0
probables>, en el numerador de tasas de inddenda para analizar asociaciones con fac-
tores de riesgo en un est udio de cohortes (vease, por ejemplo, White et al.(S)); esto pue-
de ser aceptable, 10 que just ifi ca el uso de un fndice ponderado similar al mostrado en
la Tabla 8.15 para el calculo de kap!)(l entre dos evaluadores. N6tese que en este ejem-
plo, el esquema de ponderaciones se determino reconociendo que el desacuerdo entre
probable 0 definitivo por un lado y ausente por otro, parece ser mas serio que el
que existe entre definit ivo y probable. Obviamente, el investigador deberfa asig-
nar mas peso a los desacuerdos menos extremos que a los mas extremos. En eI ejem-
plo hipotet ico de la Tabla 8. 15, al acuerdo perfecto en el diagn6stico de infarto de mio-
cardio entre dos observadores se Ie asign6 un peso de 1,0 (como en el calculo del
kappa no ponderado); al desacuerdo definit ivo versus probable se Ie asigno arbi-
trariamente un peso de acuerdo de 0,75, 10 que reconoce la seriedad menor con rela-
ci6n al peso de asignado al desacuerdo entre ausente y las ot ras categorfas. Si se
utilizara una categorfa diagn6stica adic ional y aun mas suave, posible, al desa-
cuerdo entre, por ejemplo, definitivo y podrfa darsele un peso mas peque-
fio (ej, 0,5) que el que se asigno a las celdas definitivo-probable. Un enfoque simil ar
podrfa milizarse para los datos mostrados en la Tabla 8. 10, en la cual el desacuerdo
entre las lecturas placa + y podrfa no considerarse tan notable como
el que existe entre cualquiera de las dos y la normal.
Tabla 8.15
Ponderaciones de acuerdo para el cilculo de kappa: un cjcmplo hipotCtico de dasifica-
cion del inrarto de mi ocardio mediante ccrteza de diagnostico
Observador N." 1
Observador N.
o
2 Definitivo Probable Ausenle
Definilivo 1,0 0,75 0
Probable 0,75 1,0 0
Ausente 0 0 1,0
332 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
En cualquier caso, el valor del kappa ponderado depended obviamente del
esquema de ponderaciones elegido. Esta arbitrariedad ha sido cdtkarla y es una de
las debilidades de l kappa particularmente cuanda se agrupan varia-
bles cont inuas en multiples categorfas ordina les (por ejemplo, las categorfas de l
I Me en la Tabla 8.6) . En este ultimo caso, sera mejor utilizar ciertos esquemas de
ponderaciones para kal'l'a* que son equivalentes al coeficiente de correlaci6n
intraclase descrito en la Secci6n 8.4 .2.
Depelldellcia de kappa de fa pre valencia
Una li mitaci6n importante de kuppa cuando se campara la fiabilidad de un procedi-
miento diagn6stico en poblaciones diferentes es su dependencia de la prevalencia de
verdaderos positivos en la poblaci6n(37). A cont inuaci6n se muestra un ejemplo
que ilustra como las diferencias en las prevalencias afecta a los valores de kappa.
Considere una condicion dada Y, que sera buscada por cribado independiente-
mente por dos observadores (A y B) en dos poblaciones dife rentes I y II , cada una
con un tamano de 1.000 individuos . Las tasas de prevalencia en estas poblaciones
son, respectivamente, 5% y 30% como las que podrian obtenerse para hipertensi6n
en poblaciones de mayor edad y poblaciones mas jovenes. Por tanto, los numeros de
verdaderos positivos son 50 para la poblacion I y 300 para la poblacion II. La sensi-
bil idad y la especificidad de cada observador (que supuestamente no varian con la
prevalencia de Y) son, para el observador A, SO% Y 90% respectivamente, y para el
observador B 90% y 96% respectivamente.
Estos niveles de sensibili dad pueden apl icarse a los verdaderos posit ivos en las
poblaciones I y II para obtener los resul tados mostrados en la Tabla S.16. Por ejemplo,
para la poblaci6n I, como se ve en el total de la fila, skndo la sensibilidad del observa-
dor A igual a 0,80,40 de los 50 sujetos verdaderos positivos se clasifican correctameme
por el 0 ella, mientras que 10 se clasifkan erroneamente como (falsos) negat ivos. Para
el observador B, que tiene una sensibilidad de 0,90, estos numeros son, respect ivamen-
te , 45 y 5. N6tese que la celda de concordancia - esto eS,el numero de personas clasifl -
cadas como por ambos observadores A y B - es meramente la sensibilidad
conj unta aplicada al gmpo total de casos positivos: por ejemplo, para la poblaci6n I,
(O,SO x 0,90) x 50 = 0,72 x 50 = 36. Con Ires de estos numeros; esto es, los clasificados
como posit ivos por A, los clasificados como por B, y los d asificados
conj untamente como positivos>, - es posible calcular las otras celdas de la Tabla S.16.
En la Tabla S.17 se hacen dlcul os similares para los verdaderos negalivos, uti li -
zando los valores de especificidad para los observadores A y B. De nuevo, el ntl me-
ro de verdaderos negat ivos clasifi cados como tales por ambos observadores se obtie-
ne apl icando la probabilidad conjunta que tienen ambos observadores de detectar un
S" h" d"m'Htr;ujo (por FI"iss(36I) 'I"" p:lr" v:.r;"hl", ordin"I", """ndo los p,,,o, .
w,' (i: I. ,."k: j: I . .. "k). se definen como
1 (i - })'
Wi) : - (k - l)'
donde k es el numem de categorfas en la tabla de contingencia el valor del kappa pondcr.ldo es
idCntico al del coeficiente de corrclaci6n intraclase (vcase Secci6n 8.4.2).
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 333
Tabla 8. 16
Resultados de las mediciones realizadas por los observadores A y B en poblaciones
de verdaderos positiYOS con difertntes tasas de prtvalencia de la condicion medida ,
cada una con una poblacion de tamano 1.000
Poblacl6n I Poblacl6n II
(prevalencla ,,0,05) (prevalencla ,,0,30)
Observador A Observador A
Observador B p" N ..
Total p"
N., Total
Po. 36"" 9
'5'
216"" 54 2701
N.,
,
5 24 6 30
Total 40' 10 50' 2401 60 300'
'Numero de verdaderos obtenido medianle la de la prevalencia por II tamar'Kl de la
poIl laci6n tOlal: por ejemplo, para la poblaci6n I, 0.05 1.000.
"Obtenido mediante aplicaci6n de la sens Dilidad conjunta de los observadores A y B al numero lotal de verda
deros posil ivos: por ejemplo, para la poIllacion I, (O,SO . 0,90) 50.
' Obtenido medianle la aplicaci6n del nivel de sensibilidad del observador B al numero tOlal de verdaderos posi
tivos en las pobIaciones I y II : por ejemplo. para la poblaci6n I. 0,90 . 0.50.
' Obtenido mediante la aplicaci6n del nivel de sensiDilidad del ooservador A al numero total de verdaderos posi
tivos en las pobIaciones I y II : por ejemplo. para la poblaci6n I. O,SO. 0.50.
verdadero negati vo (0,90 para A por 0,96 para 8 ) al numero total de verdaderos
negativos en cada poblacion: porejcmplo, en la poblaci6n I, (0,9() x 0,96) x 950 = 821.
Los resul tados totales mostrados en la Tabla S. IS se obti enen sumando los datos
de las Tablas 8.1 6 Y 8. 17. Los calculos de kappa para las poblaciones I y II, utilizan-
do los datos mostrados en la Tabla S.I S, arroj an los siguiemes valores:
Tabla 8.17
Resultados de las mediciones realizadas por los observadores A y B en poblaciones
de verdaderos positiYOS con difertnt es tasas de prtvalencia de la condicion medida ,
cada una con una poblacion de tamano 1.000
Poblaci6n I Poblacl6n II
(prevalencia ,,5%) (prellalencla ,,30%)
Observador A Observador A
Observador B p" N ..
Total p"
N., Total
p"
,
34 38 3 25 28
N., 91 821" 9121 67 60S"' 6721
Total 95 855'
950' 70 630'
700'
'Num",o "" v",dad",o. r><>gativo. OOI"niolo. al ' u.l,a" , "I num",o d" v",da<kl ,o. po. itivo. (Tabla 8.16) al
tamano lotal de la poblaci6n: por ejemplo para a poblaci6n I. 1.000 - 50.
,. Obtenido al aplicar la especil icidad conjunta de los observadores A y B al numero 10tal de verdaderos negati
vas: por ejemplo. para la poIl laci6n I (0,90 . 0.g6). 950 (resultados redondeados)
' Obtenido al aplicar I I nivel de del observador B al numero total de verdaderos negativos en las
poIl laciones I y II: por ejemplo. para la pobIadoo I. 0,96.950
' Obtenido ill apli car II nivel de especificidad del ooservador A al numero total de verdaderos negativos en las
poIl laciones I y II: por ejemplo. para]a pobladoo I. 0,90.950.
334 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8. 18
Resultados de las mcdiciones hcchas por los obscrvadores A y 8 para poblacioncs
totales I y II obtcllidos mediante combillacioll de los resultados de las Tablas
8.16y8.17.
Poblacl6n I
(prevalencla :: 5%)
Observador A
Obscrv:ldor B P N.,
P
N"
Total
K=
40 43
95 822
135 865
Poblaci6n I
0,862 - 0,804 = 0,296
1,0 - 0,804
Tol:!1 P
83 219
917 91
1 ,000 310
K=
Poblaci6n II
(prevalencia " 30%)
Observador A
N., Tol;:,1
79 298
611 702
690 1 ,000
Poblaci6n II
0,830 - 0,577 = 0,598
1,0 - 0,577
Por tanto, para la misma sensibilidad y especificidad de los observadores, el
valor de kuppa es mayor (al rededor del doble en este ejemplo) en 1a poblaci6n en 1a
ellal la prevalencia de positividad es mayor (Poblaci6n II) que en 1a que es menor
(Poblaci6n I) . Se ha desarroll ado una formu la que expresa el valor de kappa como
funci6n de la prevalencia y la sensibilidad/especific idad de ambos observadores(17) , y
se demuestra que. para niveles de sensibilidad y especificidad fijos. kappa ti ende a 0
a medida que la prevalencia se acerca a 0 0 a I.
Un problema adicional es que, parad6jicamente, se pueden obtener valores altos
de kappa cuando los margenes de la tabla de contingencia no estan balanceados(
6 47
);
Por tanto, kappa tiende a ser mayor cuando la prevalencia de positividad es diferen-
(e entre los observadores A y 8 que cuando ambos observadores comunican preva-
lencias simi lares. Consecuentemente, kappa premia indebidamente una evalua-
cion diferente de positi vidad entre observadores.
La discusi6n ant erior sugiere que las comparaciones entre poblaciones 0 entre
di ferentes manifeslaciones de una condicion (por ejemplo, sfntomas) pueden ser
improcedentes; se deriva de aquf que mili zar un valor espedfico de kappa obtenido
en una poblaci6n objeto dada para predecir el val or en otra poblacion solo se justifi -
ca si las {asas de prevalencia de la condici6n, 0 condiciones, de interes son similares
en ambas poblaciones y si j ueces dife renles (0 lec(uras diferentes) proveen estima-
dos de prevalencia de positi vidad razonablemente similares . Por ejemplo, en el estu-
dio de fiabilidad del ultrasonido carotfdeo ARIOJ'J, los autores evaluaron la fiabili-
dad de la identificaci6n de las placas (con 0 sin sombreado) no solamente en la
bifurcaci6n carotfdea (vease Tabla 8.10) sino lambitn en la car6{ida comlin y en la
car6tida interna. Los resultados del kappa ponderado para los {res segmentos arteria-
les se muestran en la Tabla 8.1 9. Notese que ambas leclllras dieron lugar a porcenta-
jes razonablemente simil ares de prevalencia de placas para todos los sitios de la arte-
ria car6tida. Sin embargo, ha de advert irse que para cada lectura hay diferencias
imponantes en las prevalencias de placas entre silios. Por tanto, al comparar estos
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
Tabla 8.19
Kappa ponderado y prevalencia de placas (con 0 sin sombreado) en dos lecturas
del examen de ultrasonido mooo 8 en tres segmentos de la arteria carotldea,
Estudio de Riesgo de Arteriosclerosis en Comuuidades (ARIC)
Prlmera leetura Segunda lectura
335
Segmento de la
carotlda
% de Prevalencla % de Prevalencla Kappa ponderado
de placas de placas
Car6tida comun 5,0 6,0 0,47
Bifurcad6n de la 21.2 19,5 0,60
Car6tida interna 7,7 7,3 0,69
'Veanse datos en la Tabla S.10. N61ese este valor de kappa ponderado es ligeramente mayo< que el valo<
no ponderado de 0,576 (vease tedo).
Fuente: R li II a/ . ReprodlJCibil ity of E><1racraniaf Carotid Atherosclerosis lesions Assessed by B-Mode UHra-
sound: The Atherosclerosis Risk in CommunitieS StLJCfy, Ulrrasound Moo BioI. Vof 22, 791799, ClI996.
valores de kappa entre los segmemos arteriales, los autores correctamente hicieron
notar que el bajo va lor del coeficiente de kappa ponderado ... en la arteria car6tida
comtin puede deberse parcialmente a la baja prevalencia de lesiones en este seg-
mento(li 7% .7')7) . (Por otro lado, aunque la prevalencia es casi tan baja en la
car6tida interna como en la car6t ida comun. el va lor mas alto de kappa se encuen-
tra en la primera, probablemente debido a que las imagenes reales de la car6t ida
interna eran de mejor calidad que las de otros silios) .
A pesar de estas limitaciones, kappa provee un estimado uti! del grado de
concordancia entre dos observadores 0 pruebas eliminando el efecto que se espera
que ocurra puramente por azar. 10 que explica su popularidad. Aun mas. bajo ciertas
condiciones, y en pane debido a su dependencia de la prevalencia. kappa puede ser
ut il como un fndice para predecir eI grado en que se atenua el odds ratio por errores
de c1asificad6n no dife rendales
(
7) : esto es, puede ut ilizarse para evaluar la validez
del valor que alcance la medida de asociacion basada en datos obtenidos con un ins-
trumento 0 prueba dados.
En resumen, aunque claramente se trata de una medida ut i! de fiabilidad para
variables categoricas, kappa deberfa utilizarse e interpretarse con cautela. La mayo-
rfa de los expertos estan de acuerdo en recomendar su uso conjunto con otras medi-
das de concordancia, tales como los indices de porcentajes de concordancia ya des-
critos. Cuando se utiliza, sin embargo, es importante tomar en considerad6n su
variabilidad como una funci on de la prevalencia de la condid6n y del grado de simi-
litud entre observadores con respecto a la prevalenda de posit ividadOU
3
.41.47) .
8A.2. Indices de validez y fiabilidlld parll dlltos continuos
Esta secd6n describe algunos de los metodos disponibles p..1ra aquil atar la validez 0 la
fiabilidad de una medida continua dada. En la Tabla 8.3 se enumeran y se descnben
brevemente los indices que se utilizan mas frecuentemente con ese fin . Como se apre-
cia all f, algunos de estos indices pueden utili zarse para evaluar la validez (por ejemplo,
cuando mediciones de muestras de suero reali zadas en deno laboratorio se comparan
con medidones de las mismas muestras pero obtenidas en un laboratorio de referenda;
336 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
vease Secci6n 8.3 .2), mientras que otras se milizan mas frecuemememe en est udios de
fiabilidad (por ejemplo, para evaluar medidas repetidas de un paramctro continuo den-
lro de observadores, entre observadores 0 entre individuos; vease Secci6n 8.3.3).
Los datos que se muestran en la Tabla 8.20 se utilizaran para ilustrar las medidas
de fiabi lidad discutidas en esta secci6n. En esta tabla se exhiben datos parciales obte-
nidos durante un estudio de fiabilidad de la evaluaci6n de resultados de la polisomno-
graffa (PSG) para el proyecto del Estudio de la Salud del Coraz6n y el Sucno (Sleep
Heart Health Study, SHHS), est udio poblacional sobre las consecuencias cardiovas-
culares de des6rdenes respiratorios durante eI sueno (por ejemplo. la apnea del sue-
n o ) ( 4 ~ ) . En el SHHS, los registros del PSG obtenidos de 6.440 pal1icipantes en seis
centros se enviaron a un local central de lectura para clasificacion (estado del sueno y
dlculo de Indices de des6rdenes respiratorios durante eI sueno). EI diseno y los resul-
tados del estudio de fiabilidad que se desarroll6 para eI SHHS fueron detall adamente
descritos(49) e incluyeron ambos aspectos: la fiabilidad dentro y entre clasificadores de
las variabl es relacionadas con los des6rdenes respiratorios durante el sueno y el esta-
dlo del sueno. Para los prop6sitos de este ejemplo, la Tabla 8.20 muestra s610 datos de
dos medidas de des6rdenes respiratorios durante el sueno (lndice apnea-hipoapnea,
IAH, y el Indice de despertares, 10) para 30 registros de PSG que fueron lefdos por
dos de los clasificadores (clasificadores A y 8 ) para evaluar la fiabilidad entre clasifi-
cadores, aSI como 10 registros que fueron examinados dos veces por uno de los clasi-
ficadores (clasi ficador A) como parte del esmdio de fiabilidad dentro de clasificado-
res.
Las medidas de validez y fiabilidad descritas en los parrafos siguientes son de
dos tipos . EI primero consiste en Indices basados en la evaluad6n de la correla-
ci6n entre dos conj untos de valores que se comparan (grafico de correlaci6n, coefi-
dentes de correlaci6n) . EI segundo consiste en medidas basadas en la cOII/paracia/l
emparejada de las dos medidas consideradas (diferenda media, coefidente de vari a-
d6n y grafico de Bland-Altman).
Grafteo de eorrelaci6n (Diagrama de dispersion)
La manera mas simple de comparar dos conj untos de observaciones consiste simple-
mente en situar en un sistema de ejes los valores para cada metodo y examinar cui -
dadosamente los patrones observados en el diagrama de di spersi6n. Por ejemplo. las
Figuras 8.8A y 8.88 muestran la correlad6n entre los valores de IAH e 10 obtenidos
por los evaluadores A y B. Las Figuras 8.8C y 8 .80 se corresponden con la fiabi li -
dad dentro de evaluadores: esto es, estos graficos muestran los valores de IAH e 10
resultantes de las 10 observadones rcpet idas realizadas por el evaluador A. Mues-
(ran que las observadones de IAH (Fig uras 8.8A y 8.8C) estan fuertemente correla-
donadas (como se expresa por estar casi perfectamente superpuestas a las Iineas de
45
0
que se corresponden con el acuerdo perfecto) . Para el 10, aunque parece haber
una correlacion. se observa una di spersion importante alrededor de las Ifneas ideales
de 45
0
. I Las diagonales, 0 Iineas de identidad en la Figura 8.8 pasan a (raVeS del ori-
gen con una pendiente de 45
0
; son equivalentes a Ifneas de regresi6n (vease Capitulo
7, Secci6n 7.4. 1) con intercepto = 0 y coeficiente de regresi6n = 1,0 unidad. 1
Aunque los graficos de correlad6n simple son uti les para dar una idea del grado
de acuerdo entre dos medidas. no son tan sensibles como otras tecnicas graficas
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 337
Tabla 8.20
Datos para un estudio de fiabilidad de la medicion de desardenes respiratorios
durante el sueiio, variables obtenidas de un registro polisomnografico domestico
Estudio
N,"
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
" 22
23
24
25
26
27
28
29
30
Indice de Apnea-Hipoapnea'
Evaiuador A
Primera Segunda
medici6n medici6n
1.25 0.99
1.61 1,57
5.64 5.60
0,0 0,32
12.51 11.84
22.13 21.64
2.68 1.77
2.19 2.18
8.52 8.67
0.33 0,16
0,00
2.70
3,03
3,49
1.12
4,94
9.52
27,90
5.58
6,59
I .U8
5.46
0.00
2.32
1.93
17,68
2.54
6,50
2.09
11.09
L Oenlro de evaluador J
Evaiuador B
1,38
2,05
5,50
0.00
11,03
21,34
2,39
2,04
8,64
0,16
0,00
2,"
2.1 1
3,3<J
0,98
4,09
8,47
25,47
5,21
6,94
1 ,:i<!
5,16
0,00
1,64
1,38
18,74
1,70
6,34
2,35
9,25
L ______ Entre evaluado ________ J
fndice de despertaresl
Evaluador A
Prlmera
medlcl6n
7,08
18,60
20,39
16,39
27,95
29,57
13,50
24,50
14,63
11 ,15
19,52
18,91
17,98
15,78
0.00
8,15
20,36
36,62
18,31
17,56
8,14
17,30
16,39
29,29
18,80
10,92
12,53
24 ,94
18,66
12,50
Segunda
medicl6n
7,65
23,72
39, 18
26,77
22,64
34,20
14,31
21,35
13, 42
13,12
l Oenlro de evaluador.J
Evaluador B
8,56
19,91
25,17
22,68
17,21
27, 15
18,66
20,58
15,61
13, 10
19,05
18,59
10,78
12,64
7,04
10,75
20,61
34,90
20,84
24,28
<!2,B4
19,38
22,68
65,09
18,75
20,97
13,38
43,92
18,02
23,25
L ______ Entre evaluadores. _______ J
Nora: los datos parciales fueron obtenido, como parte de un estudiD formal de fiabilidad en el Estudio de la
Salud del Coraz6n y el Sueoo (Sleep Hearl Hea/rh Study, SHHS)I ..... ,. Estos datos. amablemente pmveioos por
investigado,es del SHHS. se presentan con pr0p6sitos didacHcos. los indices derivaoos de la validezlliabi lidad no
deben interpretaroo como una rep,esen1aci6n precisa y completa de la fiabilidad de kls procedimientos de puntaje
en el SHHS; para conocerla. kls iectores deben dirigi,se al iniorme orOginall"l.
'EI indice de ApneaHipoapnea; nume,o promedio de episodios de apnea e hipoapnea PO' ])oras de suel'io
(apnea, cesaci6n del flujo de aire por 10 segu'ldos 0 mas; hipoapnea, disminuci6n en ei liujo de ai,e 0 excursi6n
loracico-atxiominal '" 30% por 10 segundos 0 mas acompar'iada de una disminuci6n '" 4% en la sa1uraci6n de oxige-
no).
I Indiee de desperta,es; nume,o medio de veees que se produce una 1,ansici6n del estado de sueoo al de vigilia
duran1e cada hora de sueoo.
338
m
0
~



>
w
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A

IAH. entre evaluadores 10, entre evaluadores
30 70

25
60
20
15
10
5


10 15 20 25 30
Evaluador A
C
IAH, Denlro de evaluadores (evaluador A)
25
O ~ ~ - - - r - - ~ ~ - - ~
o 5 10 15 20 25
f'rimera medici6n
0
'"
. 2
~
~


0
,
~
JI
50
40
30
20
10

O ~ ~ - r ~ ~ - - ~ ~ ~
o 10 20 30 40 50 60 70
Evaluador A
o
10. Denim de evaluadores (evaluador A)
50
40
30
20

10
0
0 10



20


30
Primcrn mcdici6n
40 50
Figura 8.8. Diagrama de dispersion para los datos de fiabilidad entre y dcntro de eva-
luadorcs cOlltcllidos en la Tabla 8.10. A: valores de IAH entre evaluadores (evaluadores A
y B): B: valores de ID entre evaluadores (evaluadores A y B): C: valores de IAH dentro de
evaluadores para mediciones repetidas del evaluador A: 0 : valores de [D dentro de evalua-
dores para mediciones repetidas del evaluador A. Las [incas rectas diagonales en estos gnHi-
cos representan las lfneas de identidad. esto es. rectas sobre las que estarfan los puntos si el
acuerdo fuese perfecto. IAH e 10 se expresan como los nlimeros medios de episodios por
hora de sueiio.
alt ernati vas (vease grMico de Bland-Alt man mas adelante) para la detecci6n de al gu-
nos patrones en los datos.
Coeficiente de Correlaci6n Lineal, Co"elacioll de Rallgos, Regresioll Lilleal
EI coeficiente de correlaci6n de Pearson (usualmente denotado por r) es una medida
del grado en que un conj unto de puntos en un diagrama de di spersion se acerca a la
situaci6n en la cHal (odos estan exactamente sobre una linea recta(l950) . El recorrido
de posibles valores de,. va desde - I (cHando hay una correlaci6n nega!iva perfecta
entre los dos observadores) a I (cHando hay una correlaci6n positiva perfecta).
Mientras mas cerca de 0 esten los valores de ,.. mas debil es la correlaci6n (sea nega-
!iva 0 posi{iva) entre dos conjuntos de valores . Por ejemplo, los valores de r para los
diagramas de dispersi6n en la Figura 8.8 son:
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
IAH: Entre evaluador (A), n = 30:r = 0,995
Oentro de evaluador (C), n = 10:r = 0,999
10: Entre evaluador (B), n = 30:r = 0,655
Oentro de evaluador (0), n = lO:r = 0,710
339
EI dlculo del coeficiente de correlaci6n de Pearson es bastante senci ll o y puede
hacerse con la mayorfa de los paquetes estadisticos e, incluso, con la mayorfa de las
calculadoras de bolsillo que incluyen funciones avanzadas.
Aunque la r de Pearson es probablemente una de las medidas de acuerdo para
variables cuantitativas mas ut ilizadas en la literatura medica (en ambos tipos de estu-
dios, de validez y de fiabilidad) tambien es una de las menos apropiadas(SI .S4). Sus
principales limitaciones pueden resumirse como sigue .
Primero, la r de Pearson es un indice de asociaci6n lineal, pero no necesariamen-
Ie una buena medida de concordancia. No es sensible a di ferencias sistematicas (ses-
gos) entre dos observadores, como se ilustra en la Figura 8.9. Los valores de los coe-
ficientes de correlaci 6n (r = 1,0) en esta fi gura indican correlaci6n li neal perfecta
entre los dos observadores en los tres paneles . Sin embargo, la concordancia perfec-
ta de valores ocurre solo en la Figura 8.9A, en la cual todas las observaciones estan
sobre la linea de identidad (es decir, para cada par de observaci ones, el valor del
observador 8 = valor del observador A). En la Figura 8.98 los puntos estan sobre
una Ifnea recta perfecta pero la pendiente de la Ifnea es diferente de 1,0: esto es,
comparado con el observador A, el observador 8 tiende a leer los valores mas altos a
niveles mas bajos. La situaci6n que se il ustra en la Figura 8.9C tambien muestra una
falt a de concordancia debido a observaciones sistematicas del observador 8 a nive-
les mas altos a 10 largo de todo el recorrido de valores (10 que result a en una linea de
regresi6n con un intercepto diferente de cero).
La ulti ma silUaci6n (Figura 8.9C) es particularmente posible en presencia de
diferencias sistematicas entre lectores, cambios en el tiempo en la capacidad del lec-
tor para aplicar los crit erios del estudio, uso de reactivos vencidos en ciertas tecnicas
de laboratorio. y aSI sucesivamente. En estas si tuaciones, el uso exclusivo de la r de
Pearson puede provocar una evaluaci6n incorrecta de la concordancia. Un ejemplo
de la vida real relacionado con datos del LRC (veanse Tabla.>; 8.6 y 8.7) en el cual eI
coeficiente de correlaci6n de Pearson entre IMC comunicado por los propios part i-
A
r '" 1.0
m
j
n
o
Observador A

B
r"I,O
."

".

Observador A


C
r ::: 1.0


"
" .

Observador A
Fi gura 8.9. Los cocficient es de corrdacion son igualmente altos cuando ambos obser va-
dores !cen el mismo valor (A) que cuando hay una diferencia sistematica ent re los
obscr vadores pero las lecturas var ian simult aneamente (8 y C)
340 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cipantes y basado en medic i6n objet iva>, fue de 0,96. Olros est udios han mostrado
correlaciones fuertes similares entre e ~ t o s enfoqucs para medir IMe, 10 que ha lleva-
do a algunos autores a conduir que los pesos comunicados por los propios partici-
pames eran extraordinariamente exactos a traves de estas variables .. . y puede obviar-
se la medici6n real del peso en investigaciones epidemioI6gicas(SS) . Sin embargo,
es!a concl usion puede ser equivocada, porque aun cuando 1a correlaci6n sea alt a,
existe lI na tcndencia sistematica de los individuos a subest imar sus pesos (usualmcn-
Ie concomitante con lI na sobreestimaci6n de sus tallas). Como resultado, en la Tabla
8.6 hay un mayor numero de individuos por arriba (y a la derecha) de la diagonal de
concordancia perfecta que por debajo de esta. De aqui se obt iene que si ellMC basa-
do en infonnaci6n dada por el propio individuo se empleara para definir vari ables
categ6ricas para obesidad 0 peso relativo, este error sistematico resultara en una
concordancia menos que perfecta (y, por tanto, en errores de clasificacion), como
indican los valores de sensibil idad y de kaplJa calcul ados de los datos del est udio de
LRC en la Tabla 8.6.
Segundo, el valor de r es muy sensible al recorrido de val ores. La influencia de l
recorrido de valores sobre la r de Pearson se il ustra en las Fi guras 8. IOA y 8. 108 .
En este ejemplo hipotetico, ambos lcctores se suponen simil annente fi ables. Pero,
debido a que los valores muestrales tienen una distribucion mas ampli a en la Figu-
ra 8.108 que en la Figura 8. IOA, los coeficientes de correlaci6n seran mas altos en
la pri mera. Esto tambien puede ilustrarse ut il izando los datos reales de la Figura
8.88 . Como se menc iono antes, la r de Pearson para el conjunto total de 30 observa-
ciones repet idas de 10 por los evaluadores A y B fue de 0,655 . Sin embargo, si este
conjunto sc divide en dos subconjuntos, uno que incluye los estudios en los cuales el
evaluador B lee valores de 10 < 15 (n = 8) y otro en el cual el evaluador B lee los
valores de ID > 15 (n = 22). los coeticientes de correlacion estimados son: 0.59 y
0,5 I , respectivamente: Esto es, ambos coeficientes son menores que el r basado en el
conjunto completo de tres observaciones, 10 que int uitivamente no tiene mucho scn-
lido.
Como corolari o de esta dependencia del recorri do de valores, el coeficiente de
correlaci6n de Pearson es indebidamente sensible a valores extremos (los II amados
olllliers, en ingles). Por ejemplo, la Figura 8.IOC es una repeticion de la Figura
8.1 08 pero con una observacion adicional con un valor extremo; este valor abe-
rrante tiene una enonne influencia en la definici6n de la linea de regresion y del
valor del coeficiente de correlacion, que aumenta de 0,8 en la Figura 8.I OB a 0,95 en
la Figura 8.1 0-C.
A pesar de sus propiedades indeseables, el coeficiente de correlaci6n de Pearson
se ut iliza a menudo como la princi pal, y a veces como la unica, medida de fi abilidad
consignada en est udios biomedicos 0 epidemiol6gicos. Esto puede tener que ver con
la tradici6n, el reconocimiento de patrones y la imitaci6n (<<todo el mundo la
usa)(52). Algunos argumentan que r e ~ una medida apropiada para estudios de fiabi-
lidad cuando el objetivo es valorar si dos conjuntos diferentes de observaciones cla-
sificarlan (ordenarfan) a los sujetos de la misma manera; si la r de Pearson es alt a.
estarla j ust ificado milizar la distribucion de los valores estudiados para clasificar a
los sujetos. Sin embargo, si esc fuera eI caso, el coeJiciente de correlaci6n de Spear
man (tambien II amado ordinal 0 coefi ciente de correlaci6n de rangos y denota-
do por r ,) es mas apropiado. Este coeficiente lorna el valor + I cuando los rangos
emparejados estan exactamente en el mismo orden, un valor de - I cuando los rangos
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 341
A B C
r '" 0.4
r:o 0.6 r '= 0,95
m m m
0 0 0
~ ~ ~
0 0

0




~

~

. -.: ..... .-.: .....
0

0 0
0 0

0

.. ..

Observador A ObservadOf A Observador A
Figura 8.10. EI coeficiente de corrclacion de Pearson es muy sensible al recorrido de
valores y la presencia de valores extremos. Ejemplos hipotcticos
estan exactamente en orden inverso. y un valor de 0 cuando no hay correlaci6n entre
el orden de los dos conjuntos de valores emparejados . Por ejemplo, los valores de r,
para los diagramas de dispersi6n de la Figura 8.8 son 0,984 (IAH, entre), 0,58 (10
entre), 0,976 (IAH, dentro) y 0,757 (10, dentro), Aunque mas congruente con el
objelivo de evaluar la consistencia de los rangos y menos dependiente de valores
aberrantes, el coeficiente de correlacion de Spearman no resuelve la olra limitaci6n
del r de Pearson ya disc uti da: su insensibilidad a la falta de concordancia debido a
diferencias sistematicas en los valores entre observadores.
Final mente, debido a su aparici6n re lativamente frecuente en la literatura bio-
medica, merece atencion el uso de las pruebas de significacion estadfstica para
evaluar el coeficiente de correlacion (de Pearson 0 de Spearman) en el contexto
de los estudios de validez y fiabilidad, EI dlcul o de un valor de P para un coefi-
ciente de correlaci6n (es decir, e\'aluar la hip6tesis nul a Ho: r = 0,0) no es ut il en
este contexto por razones tanto teoricas como practicas: I) la hip6tesis nula de
que no hay re/acion ente dos pruebas (0 entre dos observadores) que miden
supuestamente la misma variabl e 0 constructo, es il6gica. Demostrar que puede
ser rechazada no es muy informativo; 2) aun cuando la fiabilidad sea bast ante
pobre (por ejemplo, r s 0,3 0 0,4), el valor correspondiente de P puede ser sign i-
ficalivo si el tamafio de muestra es razonablemente grande. Por tanto, un valor de
P altamente significativo puede imerpretarse err6neamente como evidencia de alta
fiabilidad>, cuando de hecho su unica interpretacion es que es casi seguro que se
rechazarala hip6tesis nula (sin sentido de cualqui er manera), Se ha propuesto como
una alt ernati va y como un enfoque mas (i tWSlj que 10 que se ponga a prueba sea la
hip6tesis de correlaci6n virt ual mente perfecta (por ejemplo, Ho: r = 0,95), Otra
alt ernativa 16gica, mejor que el usar el valor P asociado, es calcular los Ifmit es de
confianza para el coefici ente de correlacion,
La disc usi6n precedente sugiere que el coeficiente de correlacion debe uti li zarse
juiciosamente, Mas especfficamente, su interpretacion se mejora sensiblemente con
la consideracion de posibles diferencias sistemat icas entre las mediciones, EI uso de
un diagrama de dispersi6n ayuda a detectar estas diferencias sistematicas, la presen-
cia de datos aberrantes y diferencias entre variables con respecto al recorrido de sus
valores . A continuaci6n se disc uten otros fndices de fiabilidad que evilan al gunas de
las desventajas inherentes a la r de Pearson.
342 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Una aitcrnat iva a la r de Pearson es fa regresi6n lineal, que provee una medida de la
pendiente y del intercepto de la fllnd6n de regresion (vease Capit ulo 7, Secci6n 7.4.1),
Y permite por tanto la eval uaci6n de sil uaciones tales como las il ustradas en 1a Figura
8.9, en la ellal el intercepto no es nulo 0 en la ell al existe una diferencia sistematica
entre observadores . La regresi6n li neal, sin embargo, no esla li bre de problemas cuan-
do se utiliza para anali zar datos de fiabilidad: uno imponante, por ejemplo, es que no
contempla el hecho de que los errores de medici6n ocurren en este caso para ambas
variables, la dependiente y la independiente(SI). lEn la regresion lineal ordinal, 1a lI a-
marla vanahle inrlepenrl ienre, x , se lihre cie error, y se consiclenm los
errores (variabi lidad estadistica) en la variable dependieme; vease Capit ulo 7, Sec-
ci6n 7.4.11. La regresion li neal es mas utH para prop6silOs de cali braci6n que para
eval uar fiabilidad: esto es, es mas util para predecir resultados u obtener valores
corregidos una vez que una diferenda sistematica se identifica y se cuant ifica .
Coeficiente de correlacion illlerclase
EI coeficiente de correlacion (CCI) 0 coeficiente de fiabilidad (R) es un
est imado de la fraccion de la variabilidad total que se debe a la variacion entre indi-
viduosObj.t) . Idealmente, un estudio epidemiol6gico deberia ut ili zar procedimientos
alt amente estandarizados y mCiodos de recolecci6n de datos certificadamente val i-
dos y fiables. Bajo estas circunstancias optimas la mayor parte de la variabilidad
puede alribuirse a diferencias entre los partici pantes en el estudio (variabilidad entre
individuos) (vease Seccion 8.3.3) .
La formu la general del CCI es por tanto:
Vb Vb
CCI = - =
V, V
b
+ V.
En ell a Vb = varianza entre individuos, V, = vari anza total, que incluye a ambas (Vb y
V. ) y V, = varianza no deseada <error) . V, incl ui ra componentes diferentes dependien-
do del diseno del estudio (vease Figura 8.3). Por ejemplo, en un esmdio de fiabilidad
dentro de laboralOrios, incluira la varianza debida al error laboratorio/metodo. En un
esmdio de fiabilidad dentro de individuos (es decir, leclllras 0 detenninaciones repetidas
reali zadas par el mismo observador 0 tecnico sobre la misma unidad de observaci6n), Ve
sera la varianza est imada dentro de individuos . Puede tambien ser combinaci6n de estos,
como, par ejemplo, en un esmdio que evalua la variabilidad dentro dellaboratorio y den-
lro de individuos de los paramelros plasmaticos de hemostasia e inllamacion(SS).
EI CCI es equivalente al estadfstico kappa para variables cont inuas y tiene el mis-
mo recorrido de valores pasibles (de - 1,00 mas realistamente, de 0, a + 1,0, en caso de
concordancia perfecta). Tiene la ventaja, sobre el coeficiente de correlaci6n de Pearson
o de Spearman, de que es una verdadera medida de concordancia, que combina infor-
macion de la correlacion y de las diferencias sistematicas entre observaciones(S-l). Sin
embargo, como en el caso del coeficiente de correlaci6n de Pearson, el eel esta afec-
lado par el recorrido de valores de la pablacion que se estudia. N6tese en la formula
anteri or que cuando Vb es pequeno, el CO tambien 10 sera . EslO es panicularmente
importante en est udios dentro de pablaciones en las cuales los valores de exposici6n
son 0 muy altos 0 muy bajos. Por ejemplo, un consumo alto de grasa animal en algu-
nas poblaciones puede producir en niveles de colesterol unifonnemente altos . Un coe-
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 343
ficiente de fiabilidad bajo resultante de una pequena variabilidad de los niveles de
exposicion puede infl uir negat ivaJrente sobre la potencia de un estudio epidemiologi-
co y dificultar, por tanto, la evaluaci6n de una asoc iacion. Obviamente, CCI tambien
sera bajo cuando exista una variabilidad intraindividual sustancial del factor de interes,
como en el caso de niveles honnonales gonadales en mujeres pre-menopausicas .
EI CCI puede calcularse a partir de una tabla de Analisis de Varianza (ANOVA),
aunque se ha propuesto una f6rmu la mas simple, basada en las desviaciones estan-
dar de los dos conj untos de observaciones y la suma y desviacion estandar de las
diferencias emparejadas(S-I ) (vease Apendice E). Por ejemplo. aplicando esta f6rmu-
la, el CCI para los datos del estudio de fiabilidad entre lectores incluidos en la
Tabla 8.20 puede estimarse como 0,99 para IAH y como 0,58 para el lO. Como ocu-
rre con kappa, el CCI tambien puede extenderse al dlculo de la fiabi li dad ent re mas
de dos observadores. Por ejemplo. en el estudio real (completo) de fi abilidad de la
escala del sueno en el SHHS (Sleep Heart Health el CCI comunicado para
los tres evaluadores fue de 0,99 para ellAH y 0,54 para ellO.
Como ejemplo adic ional, la Tabla 8.2 1 muestra el CCI para tres medidas de Ifpi-
dos en una muestra del examen inicial del Estudio de Riesgo de Arterioesclerosis en
Comunidades (Atherosclerosis Ri sk in Communities, ARI C)(23). EI alto CCI obteni-
do para el colesterol total y la HDL-colesterol total en este est udio sugiere que la
proporci6n de la varianza debida a la variabilidad dentro de individuos 0 a proble-
mas dellaboratorio para estos analitos es pequena; por otro lado, se encontr6 que el
CCI para una fracci6n de HDL (HDL
2
) era mucho menOL
Diferellcia media y prueba t pareada
El promedio de las dife rencias entre los dos valores de los pares de observaciones es
una medida del grado de diferencias ent re los dos conjuntos de lect uras.
Una pmeba con el estadfstico: f pareada' puede reali zarse para calcular la signifi ca-
cion estadfstica de la diferencia obtenida.
Tabla 8.21
Cocficicntcs dc oorrclacion intcrdasc (CCI) y eocficientcs dc vari acion (CV) para
analitos sclcccionados cn cl Estudio dc Ricsgo dc Artcriosclerosis cn Comunidadcs (ARIC)
Anatlto
Cole sterol total
Cole sterol HDL
HDL2
CCI
0,94
0,94
0,77
Incluye la variabilklad dentro de indivkluos y la dellaboratorio.
CV(%)"
5,1
6,8
24,8
Fuen!e: LE Chambless e! al., Short-Term Irtraindivklual in Lipoprotein Measurements: The Atherosclerosis Risk
in (ARIC) Study, American Joumal 01 Epidemiology, Vol 136. 1069'1081 , <!:>1992, The Johns Hopkins
School 01 Hygiene & Pubi;c Health
Una prucba r parcada puede calcularse simplemente dividiendo el valor medio de todas las difc-
rcncias emparejadas por su error csloindar (cs decir.la dcsviaci6n estandar sobre la rdlz cuadrdda del
lamano de la muestrd):
prucha I = .l,_,
s,_'/\fn
344 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Este Indice se utiliza tfpicamente para eval uar validez, ya que constituye un est imado
directo del grado de para uno de los conj untos de medidas cuando se justifica uti-
lizar el otro conj unto como estandar de oro. Por otro iado, puede (ambitn utilizarse en el
contexto de est udios de fiabilidad emparejada, como cuando se evaluan las diferencias
sistematicas entre lectores de una prucba. Por ejemplo. para el estudio de fiabilidad entre
evaluadores de la Tabla 8.20, la diferencia media entre las primeras observadones
hechas por el evaluador A y eI evaluador B fue 0,367 (DS = 0,703) para IAH y -3,327
(DS = 8,66 1) p..1fa ID. Aunque SlI magnitud es bastante pequcfia, particulannente para el
IAH, ambas diferencias son estadfsticamente significativas al nivel convencional (P <
0,05),10 que sugiere la existenda de una variabilidad sistematica entre evaluadores. En
el infonne de Whitney et al.(49), este fndice se utiliz6 para evaluar fiabilidad dentm de
evaluadores.
Oeberfa tenerse precaud6n cuando se utiliza la diferencia media como una medi-
da de vali dez 0 fiabilidad sin un examen cuidadoso de los datos (por ejemplo, mirar
un diagrama de dispersion 0 un graftco de Bland-Altman; ver mas adelante), ya que
su magnitud puede depender fuertemente de valores extremos.
Coeficiente de variabilidad
Otro Indice de fiabilidad a menudo empleado en est udios epidemiol6gicos es el Coe-
fidente de Variabilidad (CV), que es la desviadon estandar expresada como porcen-
taje del valor medio de dos conj untos de observaciones emparejadas. En un analisis
de datos de ftabilidad se calcula para cada par de observaciones y luego se promedia
para todos los pares de las medidas originales y replicadas. Su est imaci6n es muy
sencilla. La varianza de cada par de mediciones es:
,
V; = I (x;j _ X;)2
j - I
en la cual i es un par dado de medidas repetidas (indexadas por i) en la misma mues-
tra 0 individuo, Xi! y X;2 son los de estas dos medidas y Xi es su media.
La desviacion estandar (OS) para cada par de observaciones es la rafz cuadrada
de Vi de manera que para cada par de medidas, el CV (expresado como porcentaje)
es:
OS ;
CV;= -_- x 100
x,
Por ejemplo, para el ultimo par (el n.o 30) de lecturas entre evaluadores de IAH
en la Tabla 8.20 ( II ,09 Y 925, media 10, 17) este calculo es como sigue:
VJ() = ( 11.09 - 10, 17)2 + (9,25 - 10,17)2 = 1,693
de modo que el coefici ente de variabilidad resultante para esc par,
YI,693
CV.lO= x 100= 12,8%
10,17
Este calculo tendrla que repetirse para todos los pares de medidas y el coeficien-
te de variaci6n global serfa el promedio de todos los CV de los pares. Mientras mas
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 345
pequeno sea el CV, menor variaci6n habra entre las medidas repli cadas. Obviamente,
si no hubiera diferencia al guna entre los valores emparejados (concordancia perfec-
ta), el valor del CV serfa cero. Por ejemplo, los valores del CV global entre evaluado-
res para las 30 observaciones emparejadas de la Tabla 8.20 son 10,1 % para el IAH y
22,8% para el 10. Ademas de los eCI previamente discutidos, la Tabla 8.2 1 muestra
los CV para el colesterol serico total, eI HOL colesterol y el HOL
2
en el estudio de
fiabilidad de cohorte ARion). Consistentemente con los CCI, los CV son bastante
bajos para el colesterol total y para el HOL total, pero altos para la fracci6n H O ~ , 10
que indica una imprecision sustandal en la medici6n de esta ulti ma fraccion .
GraJieo de BlalldAltmall
Esta es una tecnica grafica muy uti l que complementa eficientemente al diagrama
de dispersi6n comun (vease explicaci6n anterior) para el examen de los patrones de
di sc repancia entre medidas repetidas (0 entre una medida dada y la pmeba de
oro) . No es mas que un grafico de dispersion donde la diferencia entre las medidas
emparejadas (A B en la ordenada) se asocia con su valor medio L(A+B)I2, en la abs-
cisaJ . A parti r de este grafico es mas fac il que en un diagrama de dispersi6n corri en-
te, evaluar la magnitud de discrepancia (incluyendo diferencias sistemat icas), detec-
tar valores extremos y observar si existe alguna tendencia(SI.S2). Por ejemplo, las
Figuras 8.II A y 8.1 1 B muestran los graficos de BlandAltman para las medidas
entre evaluadores de los datos de IAH e 10 de la Tabla 8.20. N6tese que, compara-
dos con los diagramas de dispersion correspondientes (Figuras 8.8 A Y 8.8B), estos
cuadros revel an mas claramente algunos patrones interesantes de los datos:
Hay una li gera diferencia sistematica entre las dos medidas, representada por
la desviaci6n de cero de la Ifnea horizontal que se corresponde con la di feren-
cia media.
Pueden estar presentes valores aberrantes: en la Figura 8. 11 hay una medida
con media IAH mayor que 25 y una con media ID mayor que 40, claramente
fuera del recorrido de la diferencia media 20S.
Los graficos proveen una idea mas clara de la magnitud de la discrepancia en
comparacion con la medida real. En la Figura 8.11 A, por ejemplo, todas menos
una (0 quizas dos 0 tres) de las di ferencias medias de IAH estan dentro del
recorri do (media 20S), que se extiende aproximadamente tres unidades de
IAH: el ulti mo es un valor relati vamente pequeno en el recorri do de los valores
de IAH en la absc isa. En contraste, el recorrido (diferencia media 20S) para
el 10 (Figura 8.11 B), a la vez que conti ene todas las observaciones excepto
una, se extiende casi 35 unidades de 10, que es practicamente el recorrido
completo de los valores de 10 observados en estos indi viduos.
EI grafico de IAH en la Figura 8. II A sugiere que la discrepancia entre evalua-
dores aumenta a medida que crece el valor real deliAH. Sin embargo, este
patron no es evidente para ei lO (Figura 8,I IB).
N6tese que si se utili za este enfoque grafico cuando una de las medidas puede
considerarse la prueba de oro, uno podrfa estar inclinado a representar esta ultima
en la abscisa en lugar de ubicar alii la media de ambas medidas. En este caso, la des-
346 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A B
IAH 10
3
20


+2D5

2 +2D5
10



-.

- .




0
Media
,.



..
Media
.-
. - - 10

. - .
0
.- .


"



- 20 - 2D5
-0 -0
E- l - 2D5
0. 0.
- 30

- 2

-<0

0 5 10 15 20 25 30 0 10 20 30 40 50
Media de IAH denlro de las parejas Media de 10 dentro de las parejas
Figura 8.11. Graficos de Bland-Altman para los IAH y los ID para los estudios de fi abi-
Iidad cntre cvaluadorcs de la Tabl a 8.20. Las [fncas horizontales representan la diferencia
media denlro de pares (0.367 y -3.327. para IAH e ID. respectivamente) y la media 2 des-
viaciones estandar (I OS = 0.703 para IAH y 8.661 para JD). Los IAH Y los ID se expresan
como el mlmero medio de episodios por hora de sueiio.
viaci6n vertical respecto al cero representara. 1a magnitud del sesgo del valor exami-
nado con respecto al valor de la prueba de oro.
85. REGRESION A LA MEDIA
El fenomeno conociflo como n In IIwrlin aparece en fie los prohle-
mas y enfoques anaifticos descritos en las secciones previas y merece una breve discu-
si6n. Este es un fenomeno bien conocido, ampli amente discutido por Oldham en
I 962{Sej) , que expresa la tendencia de los valores altos de las variables continua<; (por
ejemplo, presion arterial) medidos en cualquier momento, a descender, y de los valores
bajos a aumentar, cuando se hacen medida<; repet idas. Esta tendencia puede ser un
efecto de la variabilidad intraindividual (como se il ustra en la Figura 8.2) 0 de errores
de medicion aleatorios. Como ejempl o. cuando se repiten medic iones de los niveles de
tension arterial en un grupo de individllOS, muchos valores convergen (regre.wm) hacia
la media. Un corolario de este hecho es que se ha de actuar con cautela cuando se ana-
li zan datos con medidas repelidas en eI tiempo y cuando se anali zan datos de correla-
ci6n con valores ba<;ales(S7). En adici6n, la regresion a la media subraya la conveniencia
de ut ili zar la media de medidas repetida<; mejor que la<; medida<; simples para parame-
tros fis iol6gicos que flucul an (como es el caso de la tension arterial, entre otros
muchos ejemplos) . Esto es particularmente importante en los est udios en los que se
utiliza un punto de corte como criterio de incl usion en el est udio, tal como el punto de
corte para diagnosticar hipertension en algunos ensayos clfnicos. Muchos individuos
seleccionables sobre 1a base de una medida no serfan incluidos si se II ti li zara la media
de mediciones repetidas de la tensi6n arterial sistolica en lugar de una sola medida. L1
regresion a la media tambien puede ocll rrir en otras sit uaciones, como en un est udio de
ca<;os y controles en eI cuallos casas son individuos cla<; ificados como hipertensos y
los controles son los clasificados como nonnotensas . 5i la clasificacion de casas y
controles se basa en una sola medida de la presi6n arterial para cada individuo, los
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 347
errores de clasificaci6n debidos al fen6meno de regresi6n a la media pueden provocar
ei llamado s e . ~ ' 8 0 de diluci6n I'or regresi6n (vease Capit ulo 4, Secci6n 4.3.3).
BlBLiOGRAFIA
I. Kahn HA. Sempos CT. Slalislicalmelhoils in epidemiology. New York. Oxford Univer-
sity Press. 1989.
2. Whitney CWo Lind BK. Wahl PW. Quality assurance and quality control in longitudinal
studies. Epidemiol Rev 1998: 20: 71-80.
3. ARIC Investigators. The Atherosclerosi s Risk in Communities (ARIC) study: design and
objectives. Am J Epidemiol 1989: 129: 687-702.
4. Prineas RJ . Crow RS. Blackbum H. The Minnesola Code Manual of eleclrowrdiograp.
hii-' findings. Littleton. 10hn Wright PSG. 1982.
5. White AD. Folsom AR. Chambless LE e/ al. Community survei llance of coronary heart
disease in the Atherosclerosis Ri .i k in Communities (ARIC) study: methods and initial
two years' experience. J Clin Epidemiol 1996: 49: 223-233.
6. Sudman S, Bradburn NM. Asking queslions. San Francisco. l ossey-Bass Publishers.
1982.
7. Converse 1M, Presser S. SlIrl'ey liues/iom: Handcrafting Ihe Standardized Questionnai.
re. Newbury Park, Calif: Sage Publications, 1986.
8. Rose GA. Chest pain questionnaire. Milbank Mem Fllnd Q 1965: 43: 32-39.
9. Comstock GW. Tockman MS. Helsing KJ et al. Standardized respiratory questionnaires:
comparison of the old with the new. Am Rev Respir Dis 1979: 119: 45-53.
10. Burt VL. Culter JA. Higgins M el al. Trends in the prevalence, awareness. treatment. and
control of hypertension in the adult US population: data from the health examination
surveys. 1960 to 1991. Hypertension 1995: 26: 60-69.
II. Block G. Hartman AM. Dresser eM et al. A data based approach to diet questionnaire
design and testing. Am J Epidemiol1986: 124: 453-469.
12. Willett WC. Sampson L. Stampfer Ml et al. Reproducibility and validity of a semiquan-
titative food frequency questionnaire. Am J Epidemiol 1985: 122: 51-65.
13. Dickersin K. Berlin lA. Meta-anal ysis: stateof-the-science. Epidemiol ReI' 1992: 14:
154- 176.
14. Gordi s L. Epidemiology. Philadelphia, WB Saunders, 1996.
15. Lippel K. Ahmed S. Albers JJ e/ al. External quality-control of cholesterol analyses per-
fonned by 12 lipid research clinics. Clin Chem 1978: 24: 1477- 1484.
16. Burke GL. Sprafka 1M. Folsom AR el al. Trends in serum cholesterol levels from 1980
to 1987: the Minnesota Heart Survey. New Engl J Med 1991 :324:941-946.
17. Brinton LA. Hoover RN. Szklo M et al. Menopausal estrogen use and risk of breast can-
cer. Cancer 1981: 47: 2517-2522.
18. Vargas CM. Burt VL. Gillum RF. Pamuk ER. Validity of self-reported hypertension in
the National Health and Nutrition Survey 1Il. 198891. Prel' Med 1997: 26: 678-685.
19. Nieto-Garda FJ . Bush TL, Keyl PM. Body mass definitions of obesity: sensitivity and
specificity using self-reported weight and height. Epidemiology 1990: I: 146-152.
20. Copeland KT, Checkoway H. McMichae l AJ e/ al. Bias due to misclassification in the
t:slimaliulL uf rdalivt: ri sk. Am J E"idemiul 1977: 105: 488-495.
21. Block G. A review of validation of dietary assessment methods. Am J Epidemiol 1982:
115: 492-505.
22. Martin- Moreno 1M. Boyle P. Gorgojo L. Maisonneuve P. Fernandez-Rodriguez JC. Sal-
vini S. Willett We. Development and validation of a food frequency questionnaire in
Spain. Int J Epidemiol 1993: 22: 512-519.
348 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
23. Chambless LE. McMahon RP. Brown SA. Patsch W. Heiss G, Shell Y- L. Short-tenn
intraindividual variability in lipoprotein measurements: the Atherosclerosis Risk in
Communities (ARIC) study. Alii J Epidemio/ 1992: 136: 1069-1081.
24. Colditz GA, Willet We. Stampfer ML Sampson L. Rosner B. Hennekens CH, Speizer
FE. The influence of age. relative weight. smoking, and alcohol intake on the reproduci-
bility of a dietary questionnaire. 111/ J Epidell/iv/ 1987: 16: 392-398.
25. Sackett DL. C/iniw/ epidemiology: A muic scienu for ciiniml medicine. Boston. Li ttle.
8 rown.I991.
26. Fletcher RH. Fletcher SW. Wagner EH. Cliniml epidemiology: The e.uel1lia/.t. 2.' ed.
Baltimore, Williams & Wilkins, 1988.
27. Ransohoff OF. Feinstein AR. Problems of spectrum and bias in evaluating the efficacy of
diagnostic tests. N Engl J Med 1978: 299: 926-930.
28. Brenner H. Gefeller O. Variation of sensitivity. specificity. likelihood ratios and predicti-
ve values with disease prevalence. Sial Med 1997: 16: 981-991 .
29. Fikree FF, Gray RH. Shah F, Can men be trusted? A comparison of pregnancy histories
reported by husbands and wives. Am } Epidemio/1993: 138: 237-242.
30. Youden WJ. lndex for rating diagnostic tests. Canar 1950: 3: 32-35.
31. Li R. Cai J . Tegeler C el al. Reproducibility of extracranial carotid atherosclerosis
lesions assessed by B-mode ultrasound: the Atherosclerosis Risk in Communities study.
Ullrasollnd Med 8io11996: 22: 791-799.
32. van der Kooy K. Rookus MA. Peterse HL. van Leeuwen FE. p53 protein overexpres-
sion in relation to risk factors for breast canceL Am J Epidemio/ 1996: 144: 924-933.
33. Cicchetti OV. Feinstein AR. High agreement but low kappa: II. Resolving the paradoxes.
J Clin Epidemiol 1990: 43: 551-558.
34. Chamberlain 1. Ginks S, Rogers P e/ al. Validity of clinical examinations in mammo-
graphy as screening tests for breast canceL Lance11975: 2: 1026-1030.
35. Cohen JA. A coefficient of agreement for nominal scales. Edllc Psychol Meas 1960: 20:
37-46.
36. Fleiss JL. SlalislicallllelllOdsfor rales and proportions. 2: ed. New York, John Wiley
and Sons. 1981.
37. Thompson WO, Walter SO. A reappraisal of the kappa coefficient. J Clin Epidemiol
1988: 41: 949-958.
38. Landis JR, Koch GG. TIle measurement of observer agreement for categorical data. 8io-
metrics 1977: 33: 159-174.
39. Altman 00. Praclical slalislics for medical researd1. London. Chapman and Hall: 1991.
40. Byrt T. How good is agreement. Epidemiology 1996: 7: 561.
41. Siegel OG. Podgor MJ , Remaley NA. Acceptable values of kappa for comparison of two
groups. Am J Epic/emiol. 1992: 135:571 -578.
42. Klebanoff MA. Levine RJ , Clemens JO el al. Serum cotinine concentration and reported
smoking among pregnant women. Am J Epidemiol 1998: 148: 259-262.
43. Ferrer M, Lamarca R. Orfila F, Alonso J . Comparison of perfonnance-based and self-
rated functional capacity in Spanish elderly. Alii J Epidemiol 1999: 149: 228-235.
44. Stieb OM, Beveridge RC, Rowe BH ('I al. Assessing diagnostic classification in an emer-
gency department: implications for daily time series studies of air pollution. Am J Epide-
lIIio11998: 148: 666-670.
45. Maclure M, Willett WC. Misinterpretation and misuse of the kappa statistic. Alii J Epide-
lII;uI1987: 26: 161-169.
46. Feinstein AR, Cicchetti OY. High agreement but low kappa: I. The problems of two para-
doxes. J Clin Epidemiol 1990: 43: 543-549.
47. Byrt T. Bishop J . Carlin lB. Bias, prevalence and kappa. J Clin Epidemio/1993: 46:
423-429.
48. Quan SF, Howard BY, lber C el al. TIle Sleep Heart Health Study: design, rationale and
ASEGURAMIENTO Y CONTROL DE LA CAUDAD 349
methods. Sleep 1997: 20: 1077-1085.
49. Whitney CWo Gottlieb D1. Redline S et al. Reliability of scoring disturbance indices and
sleep staging. Sleep 1998: 21: 749-757.
50. Amlitage P. Berry G. Statistical methods in medical research. 3.' ed. London: Blackwell.
1994.
51. Altman DG. Bland 1M. Measurement in medicine: the analysis of method comparison
studies. Statistician 1983: 32: 307-3 17.
52. Bland JM. Altman DG. Statistical methods for assessing agreement between two met-
hCKis of clinical measurement. umcel 1986: I: 307-310.
53. Hebert JR. Miller DR. The inappropriateness of conventional use of the correlation coef_
ficient in assessing validity and reliability of dietary assessment methods. Ellr J Epide-
lI1io11991: 7: 339-343.
54. Deyo RA, Diehr P, Patrick DL. Reproducibility and responsiveness of health statistics
measures: statistics and strategies for evaluation. Controlled Clin Trials 1991: 12:
142S-158S.
55. Sakkinen PA. Macy EM. Callas Pel al. Analytical and biologic variability in measures of
hemostasis. fibrinolysis. and inflammation: assessment and implications for epidemio-
logy. Am J Epidell1iol 1999: 149: 261- 267.
56. Oldham PE. A note on the analysis of repeated measurements of the same subjects.
J Chron Dis 1962: 15: 969-977.
57. Nieto-Garda FJ . Edwards LA. On the spurious correlation between changes in blood
pressure and initial values. J Clin Epidell1iol 1990: 43: 727-728.
PARTE V
COMUNICACION DE RESULTADOS
CAPITULO 9
La comunicacion de los resultados
de la investigacion epidemiologica
9.1. INTRODUCCION
La comunicaci6n oral y escrita de los resultados de la investigaci6n no solo suel e
estar llena de jerga especiali zada sino que a menudo se caracteriza por errores sistc-
maticos que podrfan clasificarse propiamente como sesgos. EI presente capftulo revi-
sa algunos conceptos y enfoques basicos relevantes para la comunicaci 6n de result a-
dos epidemio16gicos y discute errores comunes que se cometen cuanda se comunican
resultados empfricos. Aunque algunos de estos crrores pueden depender de fallas
cometidas durante el disefio y la conducci6n del estudio y son, por tamo, difkil es, si
no imposibles, de rectificar, muchos pueden prevenirse durante la preparaci6n de la
comunicaci6n de los result ados. Este capitulo no esta concebido para hacer prescrip-
ciones sino mas bien para discutir algunos aspectos que vale la pena {ener en cuenta
cuando se prepara un infonne sobre hall azgos epidemiol6gicos.
9.2. QUE COMUNICAR
A pesar de la flexibilidad necesaria en el estil o y el contenido de los infonnes acerca de
estudios epidemiol6gicos, el Esquema 9. 1 resume algunos de los aspectos medulares
que deben considerarse cuando se prep.."\ran tales infonnes. Obviameme, no todos los
items que se Hstan en este esquema son relevantes para {odos los informes de hallazgos
empfricos . En los pan-afos se discUlen brevemente aspectos seleccionados, de
entre aquellos que se resumen en el E.,>quema 9. 1, que a menudo se olvidan cuando se
describe la justificaci6n del estudio, su disefio y se discuten sus result ados.
9.2.1. Objetivos del estudio y/o hipotesis que se desarrollan
durante su concepcion
Los objetivos del estudio y las hip6tesis que gufan su desarroll o han de enunciarse
explkitamente, por 10 general al final de la introducci6n. Una fonna frecuente de
estructurar la introducci6n del trabajo es vinculando la evidencia previa sobre la
materia (de est udios epidemiol6gicos y otros, como experimentos con ani males) con
las preguntas especfficas que justifican el est udio actual.
354 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Esquema 9.1
Aspectos que dcbcn scr considcrados cualldo se prcparan informes epidcmioJogicos
1. Inlroducci6n
a. Revisi6n $ucinla de la fundamentaci6n del estudio: plausibilidad biol6gica *
10 que resuna novedoso en asle estudio
b. Enuncie una 0 mas hip6tesis (especifique las interacciones si son parte de la hip6tesis).
2. Metooos
a. Describa las caracterfsticas de la poblaci6n bajo estudio (pof ejemplo: edad, saxo), el ambi-
to (por ejemplo: pacientes hospitalarios. muestra basada en la poblaci6n) y marco temporal
del esludio.
b. Describa los criterios de inclusi6n y de exclusi6n.
c. Describa los procedimientos de recolecci6n de los datos; brinde cifras de y tiabili-
dad de los pmcedimientos, si las conoce.
d. Especilique el 0 los criterios para la identificaci6n de variables conlusoras.
e. Describa los metodos esladisticos; explique el 0 los crilerios para la categorizaci6n de las
variables de estudio.
I . Fundamente por que cree que las sLPOsiciones que subyacen en el modelo seleccionado
son razonables (por ejemplo, para ell'so del Modelo de Cox, que la raz6n de riesgos instan
taneos es constante a 10 largo del tiempo de seguimiento) .
3. Resultados
a. Presente los datos con el minimo de modelaci6n (distribuciones de frecuencia, medianas,
medias, diferencias no ajustadas).
b. Presente los datos estratilicados.
c. Prasanta los dolo::; utilizondo mlls complajo::; para utilicc al modalo mll::; pomimo
nioso que se ajuste a los datos (por ejemplo, odds ratio ajustado por el metoda de Mantel
Haenszel si solo necesitan ajustarse una 0 dos
d. Cuando se postulen interacciones a priori (0 se exploren a posteriori), considere la evalua-
ci6n de las aditivas y las multiplicativas.
4. Discusi6n
a. Revise los resultados principales del estudio y haga enfasis en las similitudes y diferencias
con la literatura.
b. Revise las fortalezas y las limitaciones del estudio. Considere los sesgos y los electos de
confusi6n como explicaciones alternativas a sus resultados. Comente sobre posibles erro
res en la clasificaci6n de los datos en el contexto de la validez y la liabilidad conocidas del
instrumento utilizado para la de los datos.
c. Sugiera maneras especilicas de rectif'car algunas de las desventajas de las investigaciones
previas y del presente estudio, de manera que sirva de ayuda para que investigaciones lutu
ras aborden el mismo 0 los mismos problemas.
d. Si es apropiado y esta respaldado por los datos, discuta las implicaciones de los resultados
del estudio para la practica medica a Ia politica de salud .
si al procaso patol6gico qua se investiga es biol6gico 0 fisiol6gk:o par naturalaza. Para los astu
dios apidemiol6gicos que tratan aspectos psicosocialas, por ajamplo, los aspectos ralavantas astarlm basados
an al modelo te6rico psicosocial que subyace bajo el lan6mano qua se asta eSILJdiando.
Fuente; Datos de HA Kahn y CT Sampos, Statistical methods in epidemiology. 1t11989. Oxford University Prass.
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 355
Si el est udio no tiene hipritesis especfficas - esto es, cuando se trata de un est u-
dio exploratorio de reladones mUlt iples entre exposiciones y desenlaces (es decir,
una expedicion a pescar, como se Ie conoce en la jerga epidemioI6gica) - ello
debe enunciarse claramente en la Introducci6n. En muchas encuestas y est udios epi-
demiologicos grandes, docenas 0 dentos de variabl es pueden cmzarse en la busque-
da de posibles asociaciones. Por ejemplo, hasta 1.000 tab las de 2 x 2 que muestren
datos combinados pueden generarse de una encuesta con informacion de 100 varia-
bles de exposicion con dos categonas y 10 result ados binarios posibles (por ejemplo,
la prevalencia de 10 enfermedades diferentes) . Teoricamente. aun cuando ninguna
de estas variables de exposici6n estuviera verdaderamente asoc iada con los resulta-
dos, el azar solamente, determinara que en aproximadamente 50 de los 1.000 cmces
se encuentre una asociadon estadfst ica significativa al nivel de p.s 0,05. La publica-
don selectiva drcunscrita a estos hallazgos significativos>, supone un sesgo de
publicadon (vease Capitulo 4, Secci6n 4.5).
Por ejemplo, Friedman et al.
OJ
publicaron un trabajo que comunica por primera
vez una relaci6n gradual fuerte entre el conteo leucocitario y el riesgo de infarto del
miocardio. En la discusi6n de eSlOS resultados, entonces inesperados, los autores
abrieron, como era debido, la seccion de discusion de su articulo con el siguiente
enunciado: Nuestro hall azgo de que el conteo leucocitario es un predictor de infar-
to del miocardio debe observarse en el contexto del estudio exploratorio que hemos
venido reali zando. AI buscar en aproximadamente 750 variables recogidas para eva-
luar nuevos predictores del infarto del miocardio ... (' p(278)
De hecho, estos resultados fueron replicados mas adelante en un numero impor-
tante de otros estudios; a pesar de esto, la naturaleza causal de la asociaci6n es aun
mot ivo de controversia(!I. Por otro lado, (,cuantos otros resultados de la literatura
medica y epidemiol6gica que son j ustamente el producto de un hallazgo casual en
una expedici6n a pescar, dan lugar a un mgido en los medios masivos (Figura
9. 1) pero no son nunca replicados en 10 sucesivo?
EI argumento anterior tambicn se aplica a los infonnes sobre interacdones. Debi-
do a que la modificaci6n de efectos puede ocurrir por azar (vease Capitulo 6, Sec-
don 6.10), ellector necesita considerar si una interacdon comunicada fue mas bien
un evento casual result ante de cru zamientos estratifi cados mult iples entre las varia-
bles de estudio en lugar de un hal lazgo esperado, basado en una hipotesis plausible
previamente establecida.
9.2.2. Descripci6n de la validez y la fiabilidad de los instrumentos
para la recol ecci6n de datos
Cuando se describen los procedimientos para la recolecdon de datos, es importante
infonnar, siempre que sea posible, acerca de las medidas correspondientes de vali -
dez y fiabilidad (vease Capitulo 8). Deben evitarse enunciados como este .<ia validez
/ fiabilidad de (el cuestionario) ha sido comunicada en otro lugar (Referenda)>>, ya
que tales palabras no son informat ivas para el lector sin ti empo 0 sin posibilidades
de acceso al articulo fuente. Aun mas, el resultado anterior puede interpretarse como
que el instmmento es vali do y confiabl e. cuando realmente con frecuencia se
refiere a it ems de cuestionarios que tienen una vali dez 0 fiabi lidad de pobre a mode-
rada (por ejemplo, coeficientes kappa 0 coefidentes de correlaci6n intraclase con
356 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Fi gura 9.1. La puhlicacion acritica de halJazgos basados ell cxpedicioncs a pescar
cnvian mClIsajcs confusos y a vcccs contradictorios a la poblaci6n y dan Ingar a ulla
dllica vision de la im'cstigacioll medica y cpidcmiologica .
Fuente: Jim Borgman. The Cincinnati Enquirer, King Features Syndicate. Impreso con permiso de
King Features Syndicate.
valores entre 0,20 y 0,40, como se ha vista, por ejemplo, en estudios de validaci6n de
datos sabre la dicta). En el caso de cuestionarios. un problema especial es que SII vali -
dez y fiabilidad pueden ser LIlia fllnci6n de las caracterfsticas de la poblaci6n de estudio
(por ejemplo, nivel educacional): es decir, puede ocurrir que la validez 0 1a fiabilidad
de los numeros obtenidos de una poblad6n dada no sean extensibles a otra pobladon
(veanse Capitulo 8, Secdones 8.3 .2 y 8.3.3). De fonna similar, como se discute en el
Capitulo 8, la validez 0 fiabilidad de cicrtos instmmentos 0 pmebas puede ser diferente
entre pobladones como fundon de la di stribud6n subyacente de la caracterlstica eva-
luada. Por tanto, es imponante que sean comunicados no solamente los resultados de
los estudios de validez y fiabilidad, sino tambien que se afiada un resumen de las carac-
terfsticas de los individuos que partidparon en estos esmdios . Obviamente, los infor-
mes sobre hallazgos del estudio tambien deben incluir resultados de los subestudios
internos para el control de calidad, si estan di sponibles (vease Capftulo 8).
9.2.3. Razonamiento para la selecd6n de las variables confusoras
Los infonnes de los estudios epidemiol6gicos observadonales frecuentemente omi-
ten la descripci6n de los criterios de sclecd6n de las variabl es confusoras . Por ejem-
plo, (,estuvo la selecci6n de las variables potencialmente confusoras basada inicial-
mente en la li teratura y fue verificada subsecuentemente con los datos del estudio?
(,Se explor6 en el estudio la presencia de nuevos confusores que no hubieran sido
considerados en estudios anteriores? Yen tal caso, (,que enfoques analfticos se utili -
zaron para examinar la confusion? (vease Capftulo 5, Secci6n 5.3) .
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 357
9.2A. Criterios para la selecci6n de puntos de corte cuando se establecen
categorias para variables continuas U ordinales
Los enfoques comunes para la calegorizadon de variables continuas u ordinales inclu-
yen el usn, bien de estandares estableddos (por ejemplo, elevadones anonnales del
segmento ST-T observadas en el trazado electrocardiogra.fico para definir isquemia
miocardica),o bien de distribuciones de los datos del estudio (por ejemplo, uso de los
percentil es como puntos de corte). En ocasiones, los investigadores selecdonan pun-
tos de corte que han sido ampliamente ut ilizados con prop6sitos clfnicos 0 en investi-
gadan epidemiol6gica previa (ej ., definir la hipertension como nivel de la tensi6n
arterial sist6lica O!: 140 mm Hg 0 nivel de la tensi6n arterial diast61ica O!: 90 mm Hg; 0
definir la hipercolesterolemia como nivel de colesterol serico O!: 240 mgldL) . Cuando
no existen tales puntos de corte, particularmente cuando se invest igan asociaciones
novedosas entre un factor de riesgo y una enfennedad, el investigador puede estar
interesado en el uso de tecnicas exploratorias para optimizar y explorar las consecuen-
das del empleo de diferentes puntos de corte para anali sis de regresion categoricos(3) u
ordinales(4). En cualquier caso, la comunicaci6n deberfa describir explfcitamente el
metodo utilizado para este proposito; omitir la definicion clara de los criterios para la
selecd6n de categorfas para las variables de interes puede sugerir que los datos fueron
reagrupados una y otra vez hasta conseguir resultados agradables para el investigador
(por ejempl o, hasta que se alcanzo significad6n estadfstica) .
9.25. Datos no modelados y parsimoniosamente modelados
rrent e a completamente modelados
Para proveer informacion previa adec uada que coloque los hall azgos del estudio en
la perspect iva apropiada, deberfan presentarse resultados no modelados y parsi-
moniosamente modelados, incluyendo las caracterfsticas de la poblaci6n de est udio
y las distribudones univariadas y estratificadas de las variables de eSllldio claves.
Los autores deben evit ar la tentacion de comunicar solamente los resul tados de la
modeladon estadfstica completa, ya que los resul tados no ajustados pasan por una
modeladon mfnima y por tanto son mas representativos de la pobladon en est udio;
podrfa incluso argumentarse que, si los resultados aj ustados y no aj ustados son simi-
lares, solo deberfan presentarse los liltimos . En cualquier caso, es ventajoso presen-
tar los resultados no aj ustados j unto con los aj ustados (vease tambien el Capitulo 5,
Secdon 5.3); esta estrategia no solo permit e una visi6n adic ional sobre la fuerza del
efecto de confusion, sino que tambien ayuda a eluddar mecanismos subyacentes.
Una ilustraci6n de la ventaja de mostrar medidas ajustadas y no ajustadas de aso-
dadon la ofrece un est udio sobre la relaci6n de la clase social con la enfennedad
carotfdea arterioesclerotica(S). El debili tamiento de la reladon resultante del ajuste
por los factores de riesgo cardiovascul ares mayores (por ejemplo. hi pertensi6n,
habito de fumar e hi percolesterolemia) da una medida de la importanda de estos
factores como mediadores. Debido a que la reladon puede ser, sin dudas, explicada
por estos factores (por 10 menos pardalmente), es inapropiado mostrar solamente
los resul tados ajustados .
Otro ejemplo 10 tenemos en el hecho siguiente: suponiendo que no hay errores de
medic ion, la diferenda en la magnitud de las asoc iadones ajustadas y no ajustadas,
358 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
por el peso al nacer entre el habito de fumar de la madre y la mortalidad perinatal,
relleja la importancia del bajo peso al nacer como mecanismo que explica la aso-
dadon (Capitulo 5, Figuras 5.4 Y 5.5). Idealmente, el papel de cada confusor poten-
cial individual deberfa eval uarse de maDera que se identifique el origen exacto de la
confusion ylo del mecanismo que relaciona al fac!Qr de riesgo de interes con el
desenlace. Las fannulas para evaluar la influencia de una variable dada que relleje
un mecanismo que relacione al factor de inten!s con el desenlace 0 con el grado de
confusi6n positiva se dan en el Capitulo 5, Secci6n 5.2.3 .
9.2.6. Evaluaci6n de la interacci6n
Muy a menudo. el extendido cmpleo de la regresi6n logfstica, la regresion de Cox y
otros modelos similares, da como resultado que se aborde casi excl usivameme la inte-
racd6n multi plicativa. Sin embargo, como se discuti6 en el Capft ul o 6, la evaluaci6n de
la interacci6n aditiva es de gran importancia para los profesionales de la sal ud pli bli-
ca(6.7) y deberfa Ilevarse a cabo independiemememe del modelo ut ilizado para anali zar
datos epidemiol6gicos . Es importame recordar que el uso de la regresi6n logfstica u
otros modelos multiplicativos>, no impide la evaluacion de la interacci6n aditiva(8).
93 . COMO COMUNICAR
9.3.1. Evitar la arrogancia cientffica
Cuando se comunican los resultados de estudios individuales, particul armente los de
est udios observadonales, los epidemiologos con frecuenda no reconocen sufi-
dentememe que ningli n estudio puede bastar por sf solo para sacar conclusiones y
que se necesita de la replicad6n para mini mizar los efectos del azar 0 los problemas
de disefio. Un est udio individual brinda, en el mejor de los casos, solamente una pie-
za de un enonne rompecabezas, casi ili mitado. Por tanto, en general, es aconsejable
evitar enunciados definitivos>, tales como este esmdio demuestra inequfvocamen-
te que ... cuando se interpretan los resultados de solo un est udio observacional. En
general, se hace una Il amada a la precaud6n cuando se interpretan los result ados de
la invest igaci6n observadonal.
9.3.2. Evitar la verbosidad
Como en toda comunicaci6n cientffica, es importante ser tan conciso como sea posible
cuando se comunican los resultados de estudios epidemiol6gicos. En un editorial escri-
to hace pocos anos, Friedman!9l subraya la posibilidad de transmit ir las mismas ideas de
forma abreviada sin perdida de claridad ni significado. Considerese el siguiente parrafo
de 77 palabras; tornado de un trabajo enviado a una revista epidemioI6gica(9):
Otras investigaciones que exploran la asociaci6n entre multiparidad y esclerodermia
han obtenido informaci6n sobre la multiparidad utilizando medidas sucedaneas. La
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 359
cantidad de dinero gastado en paiiales. sin considerar la inflaci6n. se ha utilizado como
aproximaci6n por parte de varios grupos de investigadores y todos han comunicado
que no se observaron diferencias significativas una vez que los datos se estratificaron
por edad en el ultimo embarazoa termino. En el anal isis que aquf realizamos se encon-
traron resultados similares.
Una red ucci6n signi fi cat iva de su largo (hasta unas 45 palabras) recomendada
por Friedman('}) no solamente preserva el signi fi cado del parrafo, sino que mejoro su
claridad:
Qtros investigadores han utilizado medidas sucedaneas de multiparidad. tales como la
cantidad de dinero gastado en panales. sin considerar la inflaci6n. AI igual que nuestro
estudio. ninglin otro revel6 diferencias significativas una vez que los datos se estratifi-
caron por edad en el ultimo embarazo a termino.
933. Facilitar la lectura
Qtra manera de hacer que la comunicaci6n de los hall azgos epidemiol6gicos sea
mas eficiente, paniculannente cuando se cree que algunos de los lectores pudiera no
estar familiarizado con al gunos de los terminos ut ili zados en el articulo, es apelar a
un lenguaje tan si mple como sea posible . Se di spone de varias fonnas para estimar el
nivel educacional que han de tener los lectores a los que va dirigido eI trabajo para
poder comprender adecuadamente la redacci6n empleada(Hl.l l) . Considerese, por
ejemplo, la formula SMOG, util para establecer dicho nivel con el fin de adaptar un
texto escrito en ingles al de los lectores a quienes va dirigido(12), un enfoque que nos
recuerda la necesidad de mantener simplicidad maxima del lenguaje cuando nos
comunicamos con el publico en general. La f6rmul a es faei l de aplicar: I) seleceione
30 oraciones del texto del trabajo, 10 del pri nci pi o del texto, 10 del medio y 10 cer-
canas al final; 2) cuente las palabras con 30 mas sflabas; 3) obtenga la raiz cuadrada
de este numero; y 4) anada 3 a esta raiz cuadrada para obtener el nivel escolar, equi -
valente en los EE UU, necesario para entender el informe. Por ejemplo, si hay 100
de tales palabras, el nivel necesario sera ,
indice SMOG = V 100 + 3 = 13
es decir, se necesitarfa un nivel de educaci6n sec undaria superi or (high school) . AI
aplicar esta formula, Freimuth(IO) concl uyo que los paeientes que rec il)Cn panfletos
educaeionales sobre la mamograffa, del Centro de Deteceion de Cancer de Fox (Fox
Chase Cancer Center), necesitarfan tener por 10 menos dos anos de educaeion secun-
daria superior para ser capaces de entenderl os . Aunque existe una diferencia obvia
entre los lectores de literatura ciemffica y los lectores usuales de panfletos educaeio-
nales, la f6nn ul a SMOG y otras anaJogas pueden ser ut il es para los epi demiologos
que necesiran inreraclllar con el pllhlico lego pm ejemplo, para comunicarse con la
prensa 0 hacer que sean comprensibles sus puntos de vista en una corte j udicial.
En vista de su especificidad cultural y suponiendo que la literatura epidemiolo-
gica se lee en todo el mundo, deberfan evit arse la jerga y las abreviat uras, 0 ut ili zar-
las de fonna esporadica solameme cuando han alcanzado una aceptaci6n universal,
como ocurre con tenninos como ADN 0 IgG, abreviaturas uti li zadas ampliameme
360 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
como EC (para enfennedad coronaria), SE (para sit uaci6n socioecon6mico) 0 VIH
(para el virus de la inmunodeficiencia humana) pueden ser aceptables si se escriben
apropiadamente cuando aparecen por primera vez en el articulo. Sin embargo, incl u-
so el amplio uso de estas abreviat uras comli nmente reconocidas puede lI evar a algu-
na confusion: por ejemplo, en los palses de habla hispana, 1a abreviatura AIDS
(acquired immunodeficiency syndrome) se conviene en SIDA (.\I"drome de
inlllunOliejiciellcia adquirida), que a su vez puede verse por los lectores
angloparlantes como un error de la abreviat ura SIDS. que denota sudden infant
liearh syndrome (sfndrome de mucne sli bita infamil) . En cualquier caso, deberfa
recordarseles a los autores que el abuso de abreviat uras. aunque abrevia el manuscri -
to, tiende a disminuir la faci li dad con que se lee, particularmente para lectores no
enterameme fami liari zados con el tema especffico de investigaci6n. Considerese el
siguieme parrafo. tomado del resumen (estmct urado) de un trabajo publicado en una
revista medica importameC"), donde el uso de abreviat uras hace que el texto resulte
virt ualmente incomprensible para ellector medio' :
Metodos y resultados: Relative LV myocardial MMP activit y was determined in
the nonnal (n = 8) and idiopat hic DCM (n = 7) human LV myocardium by subs-
trate zymography. Relati ve LV myocardial abundance of intest inal collagenase
(MMP- l ), stromelysin (MMP-3), 72 KD gelat inase (MMP-2), 92 KD gelat inase
(MMP-9), TI MP-9, and TIMP-2 were measured wit h quamitive immunoblotting.
LV myocardial MMP zymographic activity increased wit h DCM compared wit h
nonnal (984 149 versus 4 13 64 pixels, P < .05) . With DCM, LV myocardial
abundance of MMP- l decreased to 16 6 % (P < ,05), MMP-3 increased to 563
2 12% (P < ,05), MMP-9 increased to 422 64% (P < ,05), and MMP-2 was
unchanged when compared wit h normal. LV myocardial abundance of TIME- l
and TIME-2 increased by > 500 % wit h DCM. A high-molecular-weight immu-
nocreative band for both TI ME- I and TIME-2, suggesting a TIMElMMP com-
plex, was increased> 600% wit h DCM.
9.3.4. ReaIizar inferencias apropiadas
Entre los mas comunes errores inferenciales en los informes epidemiol6gicos se
incluyen: que se de por sentado que una asociaci6n estadfstica puede automatica-
mente interpretarse como causal, eluso de la significaci6n estadfstica como el crite-
rio princi pal para juzgar si existe 0 no asociaci6n, y la comparaci6n de la hlerza>,
de las asociaciones para diferemes fac{Qres de riesgo ut ilizando la magnit ud de los
coeficientes de regres i6n 0 las estimaciones de ri esgo deri vadas.
La presencia de una asociacion (aul/que sea estad{sticamente significativa)
no relleia necesariamente causalidad
El hecho de que las asociaciones estadfsticas no son necesari amente causales se dis-
cute extensamente en los li bros de texto basicos de epidemiologfa y estadfstica (por
* El siguiente parrdfo no se ha Irdducido pard conservar el senlido con que fue insertado en el texlo
por los aulores. (Nola de los traductores).
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 361
ejemplo, Armitage y Berry('S)) y en los Capftulos 4 y 5 de este libro. Sin
embargo, los epidemi61ogos uti li zan a menudo el tennino eJecto (0 sugieren la
noci6n de causalidad a partir de asociaciones estadfsticas: por ejemplo, Una
disminuci6n de X condujo a una disminuci6n en Y ), aunque ello no este demostra-
do, dado que la mayorfa de los estudios etiol6gicos son observacionales por natura-
leza(l 6).
Aun mas preocupante, por su frec uente ocurrencia, es la suposici6n impl kita de
que un est imado aj ustado esta li bre de confusi6n. La precauci6n de no dar por senta-
do que la confusi6n ha sido eliminada es crucial. pues incluso cuando se milizan
modelos multivariantes como una vfa para ajuslar por todas las variables confusoras
conocidas, la posibi lidad de confusi6n residual debe considerarse casi siempre explf-
citamente (como se discule en el Capit ulo 7, Secci6n 7.5).
La significadon estad{stica no es una lIl edida de laJuena de tllla asodadon
Es error comun que se descri ba una asociaci6n que no es estadfsticamente significa-
!iva como no existente. Por ejempl o, puede comunicarse correctamente en el resu-
men de un trabajo que no se ha encontrado una asociaci6n estadiJ'ficulllenfe signifi-
cativa entre la depresi6n y el desarrollo subsiguiente de cancer de mama, ya que el
riesgo relativo estimado fue de 1,5, con un Ifmite inferior del intervalo de confianza
al 95% que sobrepasa escasamente el valor para la hip6tesis nula. Pero serfa err6neo
si este hallazgo se interpretara subsecuentemente por otros amores como pmeba de
que no hay asociaci6n . Simil armente, sobre la base de los resultados hi poteticos que
se muestran en la Tabla 9.1 , particul armente debido a la sugerencia de que hay una
relaci6n dosis-respuesta para todos los result ados examinados, serfa un error con-
d uir que el habito de fumar esta relacionado con la mortalidad debida a cancer del
pulm6n y a enfermedad coronaria pero 110 a la lIIortalidad I'0r accidellfe cerebro-
vascular (ACV), Es importante recordar que la significaci6n estadfstica y el ancho
del intervalo de confianza dependen fuertemente del tamano de la muestra; un
numero menor de muertes por ACV comparado con muertes por enfermedad coro-
naria, podrfa explicar por que la ult ima y no la primera asociaci6n se encontr6 esta-
dfsticamente significativa en una sit uaci6n como la mostrada en el ejemplo hipolet i-
code la Tabla 9.1.
La inferencia de que no hay asoc iaci6n cuando la asociaci6n no es estadfsticamen-
Ie significativa (0 cuando el intervalo de confianza induye al valor de la hip6tesis nula)
Tabla 9.1
Razones de t asas de mortalidad ajustadas por edad par a fumadores actuales
y ex fum adores frente a no fum adores, segun causa de muerte , ejemplo hipot ctico
Causa de muerte
Cancer de pulm6n
Enfermedad coronaria
Accidente cerebro-vascular
Aaz6n de t asas de mort alidad (I nlerval o de conflanza aI 95%)
Fumadores Exfumadores No lumadores
8.0 (3.0-21 ,3) 2.5 (0,9-6,9) 1.0
2,3 (1,6-3.3) 1.5 (1.1 -2,0) 1.0
2,2, (0,9-4,9) 1.4 (0.8-2,5) 1.0
362 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
no considera el hecho importante de que la verosimilimd de los valores denIm del imer-
vala de confianza es maxima para el estimador pumua!(Ii). Nuestra impresion es que
muchos autores que publican en las revistas mooicas (e incluso en las epidemio16gicas)
yen al intervalo de confianza al 95 % como un tipo de recorrido plano (y cerrado) de
posibles valores para el parametro de interes. En alras palabras, IOOos estos valores
induidos en el intervalo se suponen igualmente probabJes (Fi gura 9.2A). Por
tanto, en el ejemplo hipotetico anterior (riesgo relarivo estimado IRRJ para habito de
fumar actual y AVE 2. 1: intervalo de confianza al 95%:
0.9-4.9). debido a que el intcrvalo de confianza del 95% incluye al valor de la hip6rcsis
nul a (Le., el valor RR = 1,0 es posible), este result ado puede interpretarse erronea-
mente como rellejode que no hay asociac i6n. E.<; ta es una interpretacion erronea, porque
la verosimili tud de cualquier valor dado del verdadero parametro que se estima no es
uniforme a traves del recorrido de valores contenidos en el intervalo. E.<; I/uiximo en eI
valor lie la estimaci6n puntual (porejemplo, RR = 2,1) Y decrece a medida que los valo-
res se alejan de el (Figura 9.28). El valor RR = 0,9 (ellfmite inferior del intervalo de
A Interpretaci6n err6nea
estimaci6n puntual
95%IC
B Interpretaci6n correcta
estimaci6n puntual
95%IC
Figura Y.2. Interpretacion corrccta e incorrecta de los intervakls de cont"ianza (Ie): la veroslml-
litud de cualquier valor dado dentm del recorrido no es unifonne (como se muestra en A): es maxi-
ma en el estimado puntual del par:'imetro que se mide y decrece a lnedida que los valores se alejan de
el (B). (La verosimilitud es una medida del apoyo que ofrece un grupo de datos a un valor particular
del panimetro de un mooelo probabilfstico). Para mas detalles de este concepto estadfstico funda-
mental. el lector deberfa remitirse a textos mas especializados (por ejemplo. Clayton and Hills<18I).
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA 363
confianza) es muy improbable (al igual que el valor superior, RR = 4.9). Aun mas, los
valoresfuera de los Ifmites de confianza tambien son posibles (pero menos pmbables).
Si el tamano de la muestra del estudio hubiera sido mayor, el mismo estimado del RR =
2,1 podrfa haber estado asoc iado con un intervalo de confianza del 95% que no incluye-
ra el valor de la hipritesis nula (por ejemplo, 1,1-2,7). EI intervalo de confianza mera-
mente expres..1 la incertidumbre estadfstica de la estimadon puntual y no deberfa inter-
pretarse mecanica y erroneamente como un recorrido de valores igualmente posibles.
La magll illld de los estimadores de la asociacioll de las distilltas variables
pllede 110 ser directamellte comparable
La comparacion de diferentes variables con respecto a la fuerza de su asociaci6n con
un resultado dado se introdujo en el Capitulo 3, Secci6n 3.5, a la cual se remite al
lector. A continuad6n se bri nda una extension de esa disc usion.
Para tener un ejemplo de una situad6n donde es inapropiado comparar los valo-
res de una medida de asodacion entre variables, considerense los resultados del
analisis de regresion logfstica incl ui dos en el Capitulo 7. Tabla 7. 17: la inferencia
de que la asociacion para eI sexo es mas fuerte que para la edad, basada en eI hecho
de que el odd.\ ratio es mayor para la primera (3,70) que para la segunda variable
(1,0 I I ) es daramente errado en vista de la impactante diferencia en la nat uraleza y
la magnit ud de las unidades utilizadas (en el ejemplo que se muestra en esa tabla,
masc uli no/femenino frente a un ano de edad). Mientras que eSle ejemplo subraya
las dificu llades en la comparacion de variables discretas con variables cont inuas,
tam bien la comparad6n entre variables continuas es una fund6n de la magnitud de
las unidades utilizadas para cada variable: por tanto. en la Tabla 7.17. serfa inapro-
piado comparar el aumento en el odd.\ de la enfermedad coronaria re lacionado con
un cambio en el nivel de colesterol total de I mg/dL (odd,\' ratio = 1,007) con el
correspondiente a un cambio de I kg/m2 en el Indice de masa corporal (odds ratio =
1,024) ya que estas unidades (la anchura a 10 largo del eje de la x para la cual
se calcula el odd.\ ratio en este caso) son mas bien arbitrarias . Por ejemplo. si en
lugar de I mgldL se adoptara I cg/mL (es decir, 10 mg/dL) como unidad para
medir el colesterol serico, el Olid.! ratio correspondiente (basado en los resultados
de la Tabla 7.17) serfa e(lO x 0.0074) = 1,08: esto es, mayor que el odds ratio para
I kglm2 de fndice de masa corporaL
En algunas ocasiones los autores intentan el udir este problema calculando los Il a-
mados coefidentes de regresi6n estandarizados p..1ra las variables continuas. Estos
se obtienen utilizando una desviad6n estandar como unidad para cada variable (0 sim-
plemente multiplicando cada coefidente de regresi6n por la desviadon estandar de la
variable): se argumenta que esta estrategia permite comparar diferentes variables den-
Im de un estudio 0 la misma variable entre esmdios(i<J) . Este enfoque, sin embargo,
adolece de serios problemas(20), incluyendo los siguientes: I) cuando se comparan
variables diferentes en el mismo estudio, las variables con menos variabilidad [enddn
unidades de desviadon estandar mas pequenas que las que presentan mayor variabili-
dad: y 2) cuando la misma variable se compara entre est udios diferentes, el hecho de
que una desviad6n estandar depende fuertemente de la distribud6n de la variable y de
las caracterfsticas del diseno de cada estudio da lugar a coefidentes de regresi6n que
no son nada estandarizados, y por tanto, no comparables entre esmdios .
364 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Un problema adicional y fundamental es que estas comparaciones no toman en
consideraci6n la nat uraleza biol6gica de cada fac(Qri
21
) . Como se discute en el Capit u-
lo 3, Secci6n 3.5, la Indole biol6gica unica de cada variable haec diffci l comparar la
fuerza de su asoc iaci6n con la de alras variables. Cons iderese, por ejemplo, un estu-
dio en el ella] un cambia de I mgJdL en el colesterol serico total se campara con un
cambia en la presion sangufnea de I mm Hg a los efectos del ri esgo de enfermedad
coronaria; debido a que los mecanismos mediante los cuales estas variables producen
el proceso pato16gico subyaceme (arterioesclerosis) y sus manifes taciones clfnicas
(por ejempio, infano de miocardia) pueden ser muy diferentes . esta comparadon
serfa di fkil , si no imposible, de j ustificar.
En el Capft ulo 3, $ecci6n 3.5, se sugiri6 un mNodo para comparar diferentes
variables, consistente en estimar la intensidad de la exposici6n necesaria para que
cada factor de ri esgo de inten!s produjera una asociadon de la misma magnitud que
la de factores de riesgo bien establecidos. Ademas, Greenland et UI .(22 ) sugieren un
procedimiento segun el cual se compara el aumento en el nivel de cada factor nece-
sario para cambiar el riesgo del resultado en una cantidad fija, tal como + 50%.
9.35. Tablas y tiguras
No existe una manera estandar de comunicar los hall azgos en el texto y en tablas; y la
necesidad de dirigirse a di ferentes audiencias (por ejemplo, expertos frente a publi co
en general) y ut ilizar diferentes vehfculos (por ejemplo, revistas cientfficas frente a
revistas de nmicias) ll ama a la flexibilidad . Sin embargo, parece haber algunas reglas
sencillas que, si bien no se siguen siempre, deberfan considerarse sistematicamente .
Tab/as
A continuaci6n se presentan gufas generales que condernen a la presentaci6n de las
tablas.
Titulos y encabezamientos. Las tablas deben estar claramente tilUladas, con
{{tulos aut oexplicativos. 6pt imamente, los lectores deberfan ser capaces de
entender las tablas aunque las examinen aisladamente . Desafortunadamente,
para comprender e interpretar las tab las publicadas en la literatura, a menudo
debe leerse el trabajo complelO 0 al menos la secci6n de Metodos (por ejem-
plo, los subgrupos relevantes no estan bien definidos 0 el result ado no se espe-
dfica ni define en la tabla). $e recomienda eI uso generoso de notas al pie de
las tablas para conseguir que sean autoexplicat ivas .
Unidades . Deben espedficarse las categorfas para las variables discretas y las
unidades para las continua.>; . Por ejemplo, un OR allado de la variable edad no
tiene sentido a menos que se enunde tambien si la unidad es un ano de edad 0
algun otro agrupamiento. Igualmente, un OR al lado de la variable no es
muy informativo a menos que se espedfiquen categorfas que se comparan.
Comparubililiad con otras reportes. A menudo es uti I presentar los resul tados
de una manera que permita la comparadon con la mayor parte de infonnes pre-
vios . Porejemplo, puede ser mas util presentar la edad ut ili zando agmpamientos
convendonales (por ejemplo, 25-34. 35-44. etc.) que no convendonales (por
ejemplo, 23-32, 33-42, etc.) .
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA 365
COIIIl'arando datos entre Olra estrategia ut il , que facilita
la comprensi6n del signifi cado de los result ados, es presentar los datos esta-
dfsticos que proveen la comparaci6n de imen!s pri ncipal uno al lado del otro.
Por ejemplo, cuando se preseman los resul tados de un estudio de cohorte, la
faci li dad de comparar tasalanos-persona una allado de la otra permite que la
tabla (en blanco) A que se muestra debajo, sea mas amistosa para leer que la
Tabla B.
Tabla A Presentaci6n preferible
N.
O
de aiios-persona Tasa I aiio-persona
Expuestos No Expuesws Expuesw$ No Expuestos
Tabla B Presentaci6n menos deseable
Expuestos No Expuesws
aiios-persona
Tasa I
aiio-persona anos-persona
Tasa I
ano-persona
EI mismo principio se apl ica a las dist ri buciones de frec uencia. Los datos
sobre diabetes de acuerdo al habito de fumar
(21
) pueden presentarse como se
muestra en ellado derecho de la Tabla 9.2 0, con un formato menos deseable,
en ellado izquierdo.
Evita,. redundancias . Aunque hay alguna comroversia en cuamo a las ventajas
de comunicar los resultados de las pruebas estadfsticas 0 los estimados de pre-
cision (es decir, imervalos de confianza)(24), que se evite la redundancia no es
Tabla 9.2
Numero y distribucioncs porcelltuaies de illdi viduos con y sin diabet cs mellitus,
de acuerdo COil el habito de fumar ell cI momento inicial del cstudio
Presentacl on Presentaclon
menos deseable preferl ble
Diabetes No Diabetes N." %
No No
Fumadores N." % N." % Diabetes Diabetes Diabetes Diabetes
Actuales 90 t9.6 2.307 t6,2 90 2.307 t9.6 18,2
Anteriores 70 12.7 1.136 9,1 70 1.136 12,7 9,1
Nunc ...
'"
27,0 2.553 20,4
'"
2.553 27,0 20,4
Oesconocido 287 40.7 6.566 52,3 287 6.566 40,7 52,3
Fuente: ES Ford and F De Stefano. Risk Factors for MOrlafity from Al l Causes and from Coronary Hearl Dise-
ase among with Diabetes. Findings from the National Health and Nutri tion Examination Survey I, American Jour-
nal of Epidemiology, vol 133, 1220-1230, 11:1 1991. The Johns Hopkins University School of Hygiene &. Public
Health.
366 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
objeto de discusi6n; por tanto, es por 10 general indeseable, por ejcmplo, que
aparezcan en la misma tabla los valores para Ji-c uadrado, el error estandar y
los valores de p. Olro tipo de red undancia procede de la repet ici6n en el tcxto
de todos 0 casi todos los result ados de las tablas, a menudo incluso los valores
de P o los Ilmites del intervalo de confianza. Mientras que alguna repet ici6n
de este tipo puede ser li tH, el texto debe hacer enfasis principalmente en los
patrones de asociaci6n y no repetir 10 que las tablas exhiben claramentc.
EI cambia de denoll/il/adores . En la mayorfa de los esmdios, el nli mero de
individuos para los que falt a alguna infonnaci6n difiere de una variable a alra.
Cuanda ocll rrc esta situaci6n, [os totales deben darse para cada variable de
manera que el lector pueda juzgar si la magnit ud de [as perdidas es tal que
introduce dudas sobre la precisi6n y la exact itud de la infonnaci6n . Una estra-
tegia ut i[ consiste en afiadir una categorfa de desconocido 0 no respuesta>,
para cada variable; alt ernativamente, las aparentes inconsistencias en [os
denominadores pueden expl icarse en notas al pie.
Presellfar los datos parsimoniosGmente. A menudo debe seleccionarse entre dar
una infonnaci6n estadfstica .<intermedi:v, u ofrecer una mas sencilla de interpre-
tar. Por ejemplo, dada la opci6n de presentar un coeficiente beta de un modelo de
regresi6n logfstica 0 el OR correspondiente, este Ult imo es usual mente preferible,
particulannente cuando el prop6sito de la comunicaci6n es presentar una medida
ajustada de asociaci6n mas que una f6rmul a necesaria para la predicci6n. Otro
ejemplo se presenta cuando se incluye en la comunicaci6n un coeficiente beta
correspondiente a un tennino de interacci6n>" este es diffci l de interpretar fuera
del contexto predictivo de la f6nnula de regresi6n y que puede implicar que exis-
ten efectos aun en la presencia de interacci6n (Tabla 9.3A). Usual-
mente es mas litH mostrar resultados estratificados (Tabla 9.38).
Algunos de los princi pios que acaban de discmirse se ilustran en el ejemplo hipoteti-
co de la Tabla 9.4A y [a Tabla 9.48 (preferible) . En la Tabla 9.4A, se dan los coeficien-
les beta y no los riesgos relat ivos, no se muestran unidades p..1ra las variables y se dan
Ires estadfsticos (error estandar, Ji cuadrado y valores de P). En la Tabla 9.48 , en cam-
bio, se dan las unidades que corresponden a los riesgos relativos y,en lugar de tres (algo
redundantes) estadfsticos, solo se muestran los intervalos de confianza del 95%.
Figllras
Las reglas que gufan la presentaci6n de datos en forma tabular generalmente se apli -
can tambien a las fi guras. Al gunos de los aspectos que debfan considerarse, espedfi-
camente cuando se preparan las fig uras, se disc uten a continuacion.
Uso del !ormaro de figllm.\. Evitar el abuso de graficos y fig uras: esto quiere
decir que no se han de mostrar los datos en figuras cuando podrfan ser faci l-
mente comunicados en el texto. Un ejemplo de este tipo de graficos superfl uos
se ilustra en la Figura 9.3. La informacion en esta figura, obviamente, podrfa
ser sucintamente descrita en el texto. La Figura 9.3 ejemplifica 10 que Tufte(25)
ha Il amado una baja raz6n datos-tinta>, (low dara-ink rario): mucha tinta para
muy pocos datos .
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA 367
Tabla 9.3
Tasas de incidcncia de cancer dc colon por 1.000 habitantcs, por cinco afios entrc los
participantcs del ccnso dc 1963 con 4564 afios de cdad en cl momento inicial,
por sexo y residencia, Condado dc Washington, Maryland, 19631975
Caracterlstlca
Total
Sexo
Hombres
Mujeres
Residencia
Rural
Urbana
Termino de interacci6n
(sexo x residencia)
S",o
Hombres
Mujeres
N."
8.674
9.294
N."
17.968
8.674
9.294
8.702
9.266
A

tncldencla de cancer de colon
Tasa/1.000
Crudas Ajustadas
6,5 6,5
5,5 5,2
7,3 5,6
7,6 9,7
5,4 4,5
-4,6
Incldencla de cancer de coton Tasa/1.00n
Crudas Ajustadas
Rural Urbana Rural Urbana
5,5
9,7
5,6
5,2
5,9
10,1
5,6
5,2
F"""/fJ. UnpulJlislltJ oJdt" fro, n GW
Tilll/o.\ y r6lulos. Al igual que las tablas, los tft ulos deberfa n ser tan autoexpli
cati vos como sea posible. Las ordenadas y las abscisas deberfa n rotul arse con
sus unidades . Cuando el grafico incl uye vari as ifneas, es ut i! organizar y colo
car las leyendas tan cerca como sea posible del orden y lugar de las categorfas
correspondient es en la figura real. Por ejemplo, en la Figura 9.4A, la leyenda
Prevalencia
de diabetes
(%J
Mujeres
10%
Hombres
Figura 9.3. Ejemplo dc uso supcrnuo dc una figura. Los nnicos dos datos (prc\'alcncia
en hombres y mujercs) podrian dcscribirsc racilmcntc en eI tcxto
368 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 9.4
Ecuacion de ricsgos multiples para la enfcrmcdad coronaria: modclo de rcgresi6n
de Cox que rclaciona la presencia de los factores de ricsgo ell el momento illicial
COli la illcidcllcia de ellfermcdad coronaria
Variable
Edad
Coleslerol
Habilo de 'umar
Historia de enfermedad
corona ria en los padres
Variable
Edad
Colaslaro]
Habilo de 'umar
Historia de en!ermedad
corona ria en los padres
A
Coeflclente II Error estandar
0,149
0,013
0,380
0,152
ComparaclOn
de riesgos
B
10 anos de diferenda
40 mg/dL de difarencia
20 cigarrillos par dia
Irente a no fumadores
Presenle vs ausente
0,027
0,003
0.125
0.392
Raz6n
de rlesgos
4,5
1,7
2, 1
1,2
JI'
29,97
15,36
9.28
0,15
Valor de P
0,0000
0,0001
0,0020
0.7000
Intervalo de confianza
a195 %
2,6 - 7,6
1,3 - 2,2
1,3-3,5
0,52,5
para cada una de las eurvas esta debajo de la fi gura y el lee{Or tiene que
moverse de arriba hacia abajo del grMico a la leyenda para haeer corresponder
cada eurva con el gmpo correspondiente, Por otro lado, en la Figura 9.4B, la
leyenda esta all ado de las curvas, pero el orden en el que aparecen las curvas
y el orden para las leyendas raza!sexo esta en posicion opuesta. Colocando la
identifieacion raza-sexo allado de las curvas reales, la Figura 9.4C parece mas
facilmeme eomprensible.
Escala ell las ordenada.\. La eseala en el eje de ordenadas deberfa ser eon-
sistente con la medida que se esta representando en el grafieo. Por ejemplo,
cuando se representan graficamente medidas relativas de asociacion (por
ejemplo, ri esgos relat ivos u odd,\ ratios) en grafi eos de barras deberfa ut ilizar-
se un valor base de 1,0 Y una escala logarftmica. Un ejemplo se muestra en la
Figura 9.5, en la eual se comparan tres maneras alt ernati vas de represemar
graficamente los ri esgos relat ivos correspondientes ados niveles diferentes
asociados con cierta variabl e (RR = 0,5 Y RR = 2.0). En la Figura 9.5A en la
cual el valor de part ida es (un valor <<irreai en una escala relati va), la impre-
si6n visual que dejan las barras es que el ri esgo relativo del lado derecho es
cuatro veces mayor que el de la izquierda. 10 que eareee de sent ido toda vez
que estos dos riesgos relativos estan en direeciones opuestas. EI graftco de la
Figura 9.58 , aunque representa una mejorfa con relaci6n al mostrado en la
Figura 9.5A, ya que su valor de partida se corresponde con el ri esgo relati vo
nulo corree{O (RR = I), todavfa es una representaci6n di storsionada de la mag-
nitud de los ri esgos relativos, ya que ut iliza una eseala aritmetica en el eje de
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 369
Tasa
Tasa
TU(lU
A
.... ......
..... .. ..
.. .. ... .. ....
Edad
-- Hombres negros
- - - Mujeres negras
Hombres b1ancos
.......... Mujeres b1ancas
B
,--'
. . . ' ......
.........
......... ..
Edad
C
-- Mujeres blancas
- - - Hombres blancos
Mujeres negras
.. ........ Hombres negros
Hombres negros


. .... .... .
.........
................... ..
Edad
Hombres blancos
Mujeres blancas
Figura 9.4. Ejemplos de maneras de rotular curvas en una figura
ordenadas. La altura de la barra correspondiente al riesgo relativo de 2,0 es
dos veces mayor que la correspondieme al riesgo relat ivo de 0,5, cuando de
heeho , cie la magnilllri , all n'1 l1e en
direeciones eontrarias. La representaci6n correela se exhibe en la Figura 9.5C,
la eual uti li za una escala logarftmica en el eje de ordenadas. Aun euando todos
los riesgos relat ivos esten en la misma direcci6n, el usa de una eseala aritmet i
ca en las ordenadas es inapropiado euando el objet ivo principal es la evalua
cion de tendencias li neales de diferencias relati vas (razones) . La Figura 9.6A
370 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A
RR
2,0
l ,Of-- +-I-
0,5
o \-'--'--'-'--''-
Nivel del
factor de riesgo
Escala aritmelica
B
RR
2,0
1,0 h--,-LJL
0,5
Escala aritmelica
c
RR
2,0
1,0 h--,--L-'--:---
Nivel del
factor de riesgo
Escala logar ilmica
Figura 9.5. Rcprescntacion gr alica de los ricsgos rclativos con escalas aritmcticas (A,
origclI en 0; 8 origcn ell 1,0) Y COli escala logaritmica (C)
muestra un ejemplo: en ella se utiliza una escala aritmetica y la impresi6n
visual es que el ri esgo relat ivo aumema mas ra.pidamente en los niveles altos de
la variable X. Cuando, en lugar de esto, se utiliza LI lia escala logarft mica (Figu-
ra 9.6B), se obtiene la impresi6n correcla: el aumento del ri esgo relativo es
lineal. La ClI fvatura en 1a Figura 9.6A es producto de 1a nat uraleza exponencial
de todas las medidas relat ivas de efecto. Aunque un observador entrenado pue-
de inferir correctamente que el patron de la Figura 9.6A es lineal en una escala
exponenciaL el uso de una escala logarft mica en el eje de ordenadas, como se
observa en la Figura 9.68 , es menos propi ciatorio de malas interpretaciones.
(Una excepci6n posible de la regia de que los riesgos relativos 0 los odd.\ ratios
se comunican mejor ut ili zando una escala logarftmica en una fi gura se produce,
quizas, cuando se evalua una interacci6n aditiva en fonna grafica, como se ilus-
Ira en la Figura 6.2 del Capit ulo 6. En esta situacion, los ri esgos relat ivos 0 los
odds ratios se utilizan como aproximaciones a los ri esgos atribui bles, y por
tanto, el objetivo esta en los excesos absolutos mas que en los relati vos)
En ocasiones, el uso de una escala logarftmica en el eje de ordenadas puede
ser pragmaticamente necesario para incl uir (odos los datos en el grafi co, como se
i1ustra en la Figura 1.7. Capitulo I . Eluso de una escala logarftmica y no de una
aritmetica en e1 eje de ordenadas pennite representar grMicamente e1 amplio
recorrido de rasas incluidas en el analisis de los efectos de la edad, la cohorte y el
periodo (de 2-3 por 100.000 en los que rienen entre 40 y 44 afios de edad de las
cohortes de nacimiento de 1920 a 1930, a 200-500 por 100.000 en los de 80 atlOS
o mas de las cohones de nacimiento de 1905 a 19 10). Debe hacerse hi ncapie en
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA 371
A
RR, escala aritmelica
16,0
Nivel del factor de riesgo
B
RR, escala Iogarilmica
2
8,0/
4,0/
3 4
16,0
5
Nivel del factor de riesgo
Fi gura 9.6, Comparacion dc una tendcnci a lineal en cI ricsgo rclati vo (RR) utilizando
una cscala aritmctica (A) y una escala logaritmica (8 )
que cuando se utiliza una escala logarftmica, una diferencia dada debe imerpre-
tarse como una diferencia relaliva (raz6n) entre las tasas; en el ejemplo de la
Figura 1,7, el hecho de que la pendiente de cada lfnea tienda a ser mas incl inada
para los gmpos de edad mas viejos que para los masj6venes en los hombres (con
la excepci6n del gmpo de 40-44 anos de edad) significa que el incremento relali-
vo (raz6n de tasas, vease el Capitulo 3) de las cohOl1es de nacimiento mas viejas
a las mas j6venes tiende a ser mayor en los hombres mas viejos que en los mas
jovenes (entre las mujeres parece ser que 10 contrario es cierto),
9A, CONCLUSIONES
Los epidemiologos deben comunicar los resultados de la invest igaci6n empfrica no
solamente a sus colegas sino tambien a olros consumidores de datos epidemiol6gi-
cos, incluyendo los medicos clinicos, el personal de salud publica, abogados y el
publico en generaL Las revistas cientfficas, con lectores tradicionalmente conforma-
dos por clfnicos, tales como el New England Journal of Medicine y el Journal of the
American Medical Association Ie estan dedicando mas y mas paginas a los estudios
epidemiol6gicos, Eluso de datos epidemiol6gicos por las profesiones j urfdicas tam-
bien tiende a incrementarse, Christoffel y Terel(26) . por ejemplo. encontraron que el
numero de veces que se enc uentra una palabra que comience por el'idemiol" , en
las cortes federales 0 estatales aument6 desde ser virtualmente nulo hacia 1970 has-
ta aparecer mas de 80 en 1990, Es un hecho cierto que tal tendencia a crecer ha con-
tinuado desde entonces , Por tanto, los epidemiologos deberian preocuparse no sola-
mente por el hecho de que sus estudios sean cientfficamente validos, sino tambien
372 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
por expresar claramente sus resultados a audiencias cuyos grados de refinamiemo
cientffico varian. Los artkulos epidemio16gicos que utilizan un lenguaje senci llo y
no ambiguo son probablemente mas fkilmente comprendidos por individuos denlro
y fuera de la disciplina, y por tanto, con mayor probabilidad cumpliran SlI cometido
principal: ser milizados.
BlBLiOGRAFIA
I. Friedman GD. Kl atsky AL, Siegelaub AB. The leukocyte count as a predictor of myocar-
dial infarction. N Eng/ J Med 1974: 290: 1275- 1278.
2. Nieto FJ, Szklo M. Folsom AR el al. Leukocyte count correlates in middle.aged adults:
the Atherosclerosis Risk in Communities (ARIC) Study. Am J pidemiol 1992: 36:
525-537.
3. Wartenberg D. Northridge M. Defining exposure in case-control studies: a new appro-
ach. Alii } Epidemiol 1991: 133: 10581071.
4. Pastor R. Guallar E. Use of two-segmented logistic regression to estimate changepoints
in epidemiologic studies. Alii) Epidellliol 1998: 148: 631-642.
5. Oiez-Roux AV, Nieto FL Tyroler HA el al. Social inequalities and atherosclerosis: the
Atherosclerosis Ri sk in Communities Study. Am} Epidellliol 1995: 141: 960-972.
6. Saracci R.lnteraction and synergism. Am) Epidemio/1980: 112: 465-466.
7. Rothman KJ, Greenland S, Walker AM. Concepts of interaction. Am} Epidemiol 1980:
112: 467-470.
8. Thompson WO. Statistical analysis in case-control studies. Epidemiol Rev 1994: 33-50.
9. Friedman GO. Be kind to your reader. Am} Epidemio/ 1990: 132: 591-593.
10. Freimuth VS. Assessing the readability of health education messages. Public Heallh Rep
1979: 94: 568-570.
II. Johnson ME, Mailloux SL. Fisher DG. The readability of HI V/AIDS educational mate-
rials targeted to drug users. Am) Pllblic Heallh 1997: 87: 112-113.
12. McLaughlin GH. SMOG grading: a new readability fomlUla } Reading 1969: 12:
639646.
13. Thomas CV, Coker ML. Zellner JL el al. Increased matrix metalloproteinase activity and
selective upregulation in LV myocardium from patients with end-stage dilated cardiom-
yopathy. Circlilation 1998: 97: 1708-1715.
14. Gordi s L. Epidemiology. Philadelphia, W.B. Saunders, 1996.
15. Armitage p, Berry G. Slatislicalmelhods inmedhal research. 3.' ed. London, England:
Blackwell. 1994.
16. Pettiti DB. Associations are not effects. Alii } Epidemiol 1991: 133: 101-102.
17. Rothman KJ , Lanes S. Robins J . Causal inference. Epidemiology 1993: 4: 555-556.
18. Clayton O. Hills M. Slalislim/lllodeis in epidemiology. New York. NY: Oxford Univer-
sity Press. 1993.
19. Newman TB. Browner WS. In defense of standardized regression coefficients. Epide.
miology 1991: 2: 383-386.
20. Greenland S, Maclure M. Schlesselman JJ el al. Standardized regression coefficients: a
further critique and review of some alternatives. Epidemiology 1991 : 2: 387-392.
21. Criqui MH. On the use of standardized regression coefficients. Epidemiology 1991: 2:
393.
22. Greenland S, Schlesselman JJ. Criqui MH. The fallacy of employing standardized
regression coefficients and correlations as measures of effect. Am) Epidellliol 1986:
123: 203-208.
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA 373
23. Ford ES. DeStefano F. Ri sk factors for mortality from all causes and from coronary heart
disease among persons with diabetes: findings from the National Health and Nutrition
Examination Survey I. Am 1 Epidemiol 1991: 133: 1220-1230.
24. Savitz DA. Tolo KA. Poole C. Statistical significance testing in the AmaiL'an l ournal of
Epidemiology, 1970-1990.Aml Epidemiol1994: 139: 1047-1052.
25. Tufte ER. Tile visual display oj quanlilalive inforll1alion. Cheshire. Graphics Press .
1983.
26. Christoffel T. Teret SP. Epidemiology and the law: courts and confidence intervals. Am 1
Pl/bUcHeall1l 1991: 81: 1662.
APENDICE A
Errores estandar, intervalos de confianza,
y pruebas de hipotesis para medidas
seleccionadas de riesgo y de asociacion
CONTENlDOS
Introd ucci6n .... ... . .... .... ... ... ... .... ... ... ... .... ... ... ... .... ... . .... .... ... ... ... .. .... .... ... ... ... 375
A. 1 Estimaci6n de la supervivencia acumul ada . ..... ... ... ... .. . .... ... ... ... ... 377
A. 2 Tasas de incidencia (por persona tiempo) . ..... ... ... ... .. . .... ... ... ... ... 378
A. 3 Riesgo relativo y raz6n de riesgo ... ... .. ..... ... ... ... ... .. . ... .... ... ... ... 379
A. 4 OR (cmparejada y no emparejada) ... .... ... . ..... ... ... ... .... . . .... ... ... ... ... 383
A . 5 Riesgo atribuible .. ... .... ... ... ... .... ... ... ... .... ... . ..... ... ... ... ... .. . ... .... ... ... ... 386
A. 6 Ojfcrencia entre dos tasas aj ustadas 0 dos prob..1hilidades (metodo directo) .. 388
A. 7 Tasa de monali dad estandarizadas .... .... ... ... . ..... ... ... ... .... ... ... . ..... ... ... ... ... 390
A. 8 OR de Mantel-Haenszel (y rawn de tasas) .... ... ... .... ... ... ... ... .. .... ... ... ... .... 39 1
A. 9 Coeficieme de regresi6n ... ... .... ... ... ... .... ... ... ... .... ... ... ... .... ... . ..... ... ... ... ... 393
A.I O Sensibilidad, especificidad y porcentaje de concordanc ia .. .... ... .... ... 395
A.II ESlaufstku J ut: Yuuut:1l ..... ... ... ... .... . ..... ... ... ... ... .... . ..... ... ... ... 397
A.1 2 Kappa ... ... ... . ..... ... ... ... .... ... ... ... .... ... ... ... .... ... ... ... .... ... ... ... ... .. . ... .... ... ... 397
INTRODUCCION
En este apendice, se describen los mNodos de dlcul o de intervalos de confianza
para vari as medidas seleccionadas, tanto de ri esgo como de asociaci6n, presentadas
en este li bro. Para al gunas de dichas medidas, tambien se exponen metodos comunes
para pruebas de hip6tesis .
Este apendice no pretende abarcar una revision exhaustiva de todos los mewdos
estadfsticos inferenciales empleados en la epidemiologfa. Se presentan tales mew-
dos solo para algunos de los parametros epidemiol6gicos, y en cada caso, unicamen-
Ie se describe un metodo habitualmente empleado para el dlculo de errores estandar
algunas veces elegido de entre varias allernal ivas. Ademas. no es nuestra intenci6n
disclllir las limitaciones metodologicas y concept uales de estos procedimiemos, que
han sido detenidamente discutidos en otro lugari
l1
). Nuestra intenci6n es pragmatica:
ofrecer una breve descripci6n de los melodos eSladfstic.o inferenciales que a juicio
nuestro son los mas usados en relaci6n con los parametros epidemiol6gicos conside-
rados en este !ibro.
Se asume que el lector de este apendice esta familiarizado con conceptos bioesta-
dfsticos basicos, tales como la distribuci6n normal estandar (puntaje z), la pmeba t, la
desviacion estandar, el error estandar, los intervalos de confianza, las pmebas de hip6-
376 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
{esis, y los valores p . (Para una revision de estos conceptos basicos, el lector debe acu-
dir a tex(Os de bioestadfstica, tales como el Armitage y Berry(l) 0 el de Altman(4)).
El prop6sito general del d.lculo de imervalos de confianza y para la reali zaci6n de
pmcbas de hipotesis es el de est imar la incertidumbre estadfstica en lorno a la medida
del riesgo 0 asociaci6n estimada en el estudio (la asf Hamada estimado/l pl/nfllal en
relaci6n al verdadero valor, (desconocido), del p(mimeflv en la poblaci6n de referen-
da). Aunquc se induyen procedimientos cipidos en algunos casos espedficos, la
estruct ura general de la presemaci6n para la mayorfa de estas medidas es como sigue:
1. Para la mayor(a de los ejemplos se presenta el metodo para caicular la estima-
ci6n de la varianza, 0 de su ralz cuadrada, el error esllindar, Sin embargo, cuan-
do el error estandar es mafematicamente mas complicado (por ejemplo, para
coeficientes de regresion), se supone que este habra de ser obtenido mediante
anali sis estadfstico asistido por Ia computadora, de modo que este paso se omite.
2. A part ir de la est imaci6n punt ual del parametro en cuest i6n y de su error
estandar (EE), se expone la formu la para el intervalo de confianza al 95%. La
estructura general de esta f6rmula es como sigue:
Est imaci6n puntual L I ,96 x EE (estimacion)l
Notese que 1,96 es el puntaje z (puntaje nonnal estandar) correspondiente al
nivel del 95% de confianza (es decir, un error alfa de 5 %). Los intervalos de con-
fianza para otros niveles del error alfa pueden ser obtenidos mediante el simple
reemplazo de este valor por el correspondiente puntaje z (por ejemplo, 1,64 para
intervalos de confianza al 90%,2,58 para intervalos de confianza al 99%, etc.).
3. Para algunos de los Indices se presenta la pmeba de la hipotesis nula (depen-
diendo de nuestra valoraci6n acerca de su relevancia en cada caso particular y
dc la frecucncia conque se cmplca cn la litcratura) . La 16gica y la estmctura de
estas pmebas de hi p6tesis son tambien bastante homogeneas para las diferentes
mediciones . La pmeba estandar de hip6tesis se disefia para valorar la hil'6tesis
IIIlla, esto, es la ausencia de una diferencia (absoluta 0 relat iva) 0 una correla-
ci6n. As!, para medidas abso/utas de asociaci6n (por ejemplo, una diferencia
entre dos medias 0 dos tasas) la hip6tesis nula se fonnula como sigue:
Ho: Verdadero parametro = 0
Para medidas relarivas de asociaci6n (por ejemplo, un riesgo relat ivo, una
razon de tasas, 0 un odds ratio) la hi p6tesis nula se fonnula del modo siguiente:
Ho: Verdadero parametro = I
Solo en unos pocos casos se presentan formu laciones especfficas para la
realizaci6n de pmebas estadfsticas . En otros, el recurso general elegido para
una prueba de hiporesis ha sido el de calcular un puntaje z mediante la divi-
sion de la esri macion puntual por su error estandar:
Est imaci6n puntual ,
= puntaJe z
EE (estimacion)
0, equivalentemente, usar el cuadrado del puntaje z, que tiene una dist ri bu-
cion ii-cuadrado con un grado de li bertad.
4. En la mayorfa de los casos se presenta un ejemplo de cada uno de estos dlcu-
los (usual mente basado en uno de los ejemplos dell ibro) .
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 377
Finalmente, consignamos un detalle de da notaci6m) utili zado a 10 largo de este
apendice: el simbolo dog X), se refiere allogant mo natural de x. es decir. ellogaritmo
en base e. EI correspondiente ant ilogaritmo es la funci6n exponencial. la cual se deno-
ta por medio exp (x) u, ocasionalmente, mediante e' .
A.!, ESTIMACION DE SUI'ERVIVENCIA ACUMULADA
Como se describe en el Capitulo 2, Secci6n 2.2.1 , la estimaci6n de la supervivencia
acumul ada es el prod ucto de las probabilidades condicionales de sobrevivir para
todos los intervalos precedentes (en el caso de la tabla de vida chisica actuarial) 0
para {odos los eventos (si se trata del metodo de Kaplan-Meier; vease
Capitulo 2, Tabla 2.3) .
Varianza y error estandar (formula de Greenwood)
En 1926, GreenwcxKi(s) describi6 la siguiente formu la, con la cual se obtiene un valor
aproximado de la vananza del estimado de supervivencia acumulada en el momento i:
V", (5,) (5,)' x ( d
j
)
I II) (II) - (i
j
)
donde j indica todos los eventos previos en el ti empo (0 intervalos) hasta el momen-
to i incl usive, d es el numero de muertes en cada momento (tfpicamente I en el
metodo de Kaplan-Meier, cualquier numero en el metoda de tabla de vida clasica) , y
fI es el denominudor -eslO es, el ndmero de individuos en riesgo en cada momenta
(0 el denominador en la tabla de vida - vease Ecuaci6n 2.1 en el Capi-
tulo 2, Seccion 2.2. 1).
EI error estandar (EE) puede ser obtenido como la raiz cuadrada de la varianza:
EE (5;)-5; x
Intervalo de confianza al 95 %
Este puede ser obtenido a partir de la estimacion puntual (5;) y la EE (5;) como sigue.
5; I I ,96 x EE(5;)]
Ejemplo
Para calcular el error estandar de la estimaci on que se hizo en la Tabla 2.3 de la
supervivencia acumulada a los 9 meses se necesita la estimaci on de registrada en
la tabla (U,675) y el nlimero de eventos e individuos en riesgo en todos los momen-
tos previos al noveno mes (es decir, 1,3 Y 9 meses):
j ( 1 1 1 )
EE 59 ... 0,675 x + + = 0, 155
( ) 10(10 - 1) 8(8 - 1) 7(7 - 1)
378 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
As!, el intervalo de confianza al 95% puede obtenerse como sigue:
0,675 ( 1,96 x 0, 155) = 0,675 0,304
00,371 hasta 0,979.
A.2. TASA DE INCIDENCIA (l'OK PERSONA TlEMPO)
Una tasa de incidencia por persona-tiempo se obtiene dividiendo eI nlimero de eventos
por la suma de las contribuciones en tenninas de personas-t iempo debidas a todos los
individuos en la poblad6n que se est udia a 10 largo del intervalo de tiempo que interesa.
Pucsto que lI sualmente las tasas son calcul adas para eventos raros (es decir: el numera-
dor es por 10 general un numero pequeno comparado con el denominador), puede supo-
nerse que el nlimero de eventos sigue una distribud6n Poisson(3) . Los procedimientos
para calcular la varianza y el error estandar de la tasa se basan en este supuesto.
Intervalo de confianza al 95 %
Una manera simple de calcular los Ifmi tes del intervalo de confianza para una tasa se
basa en la tabla provefda por Haenszel et al . (6) (vease tambi en Breslow y Day (7 1'olg 70) :
Valores t abulados de los ractores a empiear para calcular Ifmit es de confianza a195 %
para una variable que sigue una distribucion de Poisson
NUmero ob.erv.do Foctor Faolor Ninnero ob.e .. """ Fac:tOf FactOf Nilmer<> ab..,r .... da Factor Fa<lor
duventos en los
"
de eventOi en los d,l de eventOi en los d.
cualH se basa limite cuales Ie basa limile limite cuote! de baSI limite limite
II Htmacion intl!fior superior 10 estimaciilrl inferi Of IUperiOf II estimacion interior superior
I 0,0253 5,57 21 0,619
I ,"
,ro 0,833
' ,200
7 0.121 3,61
"
0,627 1,51
'"
0,8 1,184
3 0,206 2,92 23
0,'" ' ,OO 'W
0.854 1,171

0.272 7,
"
0,641 1,49
' 00
0.862 1,1SO
5 0.324
7,"
25 0,647 1,48 200
0,""
1,151

0.367 2, 18 26 0,653 1,47 250 0.882 1,134
7 0.401 7,00 27 0,659 1,46 300 0.892 1,121
8 0.431 1,97
"
0,865 1,45 3. 0,899 1,112
9 0.458
' ,00
0,670
' ,
800 0,,," 1,104
W 0,080
',.
0,675 1,43 ,OO 0,911 1,098
H 0.499
',"
35 0,697 1,39 500 0.915 1,093
"
0,517 1,75 <0 0,714

600 0.922 l .oa4
"
0.532 1,71 05 0,729

700 0.928 1,078
"
0,546
' ,M

0,742 1,32 800 0.932 1,072
"
0,560

W 0,770

900 0.936
' ,068
"
0,572 1,62 70 0,785 1,27
'''''
0.939
' ,06<
"
0,",
' ,W
W O, 7!l8 1,25
"
0.593
',.
00 0,809 1,24
"
0.002
',.
""
0,818 1,22
ro 0,611
',-
FuerHe; W Haenszel, DB Loveland, and MG Sirken, Lung Cancer as Related to Resideoce and Smo
ki ng Histories, I. WMe Males. Journal 01 lhe NariDl121 Cancer Inslilule, Vol 28. !W7 1001. 1962.
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 379
EI proceso involucra dos pasos:
I. Est imar un intervalo de confianza para el numero de eventos (el numerador de
la tasa): mul ti plicar el numero de evemos observados por los Ifmites inferior y
superi or mostrados en la tabla. (N6tese que, para numeros grandes, puede rea-
lizarse una interpolaci6n aproximada por ejemplo, si el numero de evemos es
95, los factores Ifmites serfan, aproximadamente, 0,8 13 y 1,23) .
2. Usar estos Ifmites inferior y superior del numero de eventos para calcul ar
los Ifmites de confi anza de la tasa empleando el numero de unidades perso-
na-tiempo como denominador.
Ejemplo
En el ejemplo hipotetico cit ado en el Capitulo 2, al comienzo de la Secci6n 2.2, dos
eventos fueron observados para un total de 500 dfas de seguimiemo. La tasa de inci-
dencia es 12/500 = 0,024 por personas dfas, 0 2,4 por 100 personas-dfa. Los Ifmites
de confianza al 95% para este comeo, suponiendo una distribuci6n de Poisson, son
inferi or = 12 x 0,517 = 6,2
superior = 12x 1,75=21,0
As!, los Ifmites de confi anza a195% para esta tasa son:
inferi or = 6,2/500 = 0,0 124 por personas-dfa
superior = 21/500 = 0,042 por personas-dfa
Esto es, el intervalo de confianza al 95% para la tasa observada (2,4 por 100 per-
sonas-dfa) va de 1,24 a 4,2 por 100 personas-dfa.
A3. RIESGO RELATIVO Y RAZON DE TASAS
Riesgo relativo (razon de probabilidades)
EI ri esgo relativo es la raz6n de dos probabilidades que representan respect ivas inci-
dencias acumul adas: la raz6n de la proporci6n de individuos expueslOs con el evemo
de interes respeclO del total de expueslOs, dividida por la proporci6n de individuos
no expuestos, con el evento, respecto del numero total de sujetos no expueslOs (vea-
se Capitulo 3, Tabla 3.2, Ec uaci6n 3.1 ). Considerese la siguiente notaci6n:
Expuestos
No expuestos
Total
Enfennos
a
,
a +c
No enfermos
b
d
h+d
Total
a+b
c+d
T
380 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EI riesgo relativo (RR) (a partir de la Ecuaci6n 3.1 ) es:
a
a+b
c
c+d
Error estandar
Puesto que el ri esgo relat ivo es una medida multiplicativa y result a por tanto asime-
tricameme di stribuida , su error estandar (EE) necesita ser calculado en escala loga-
r{tmica. De este modo. el error estandar dellogaritmo del ri esgo relat ivo es ~ ) :
EE(log RR) = j b
a(a + b)
J ntervalo de confianza af 95%
d
+ ---:--=---0-
c(c + (1)
El imervalo de confianza al 95 % debe (ambi en calcularse en escala logarftmica:
95% IC(log RR) = log RR 1,96 x EE(log RR)
= log RR ( ' ,96 x J b
a(a + b)
+ d )
c(c + cD
EI intervalo de confianza para el riesgo relati vo se calcula aplicando el anti loga-
firma (exponenciacion) de estos nlimeros
95% IqRR) = exp { log RR [ 1,96 x J b + d ] }
a(a+b) c(c + cD
Nota: Una manera rapi da de reali zar este calculo es como sigue:
Prueba de /tipotesis
La hi p6tesis nula es:
Ho :RR = 1
LImite inferior
LImite superior
RR x e -i I.%,EE( log RRJI
RR x e jl .%.E( logRR)i
Se emplea ei Ji cuadrado usual 0 ia prueba exacta de Fisher para tabias de contin-
gencia de dos por dos.
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 381
Ejemplo
Con los datos del Capitulo 3, Tabla 3.3, el ri esgo relativo de infarto del miocardio se
estima como:
RR = 0,0 18 =60
0,003 '
el error estandar del logaritmo de esta estimacion es
EE(log RR) =
-:-;cc::
9
", .8::.20 :::-:,c- + 9 .970 = 197
180( 10.000) 30( 10.000) ,
ASI el intervalo de confianza al 95% puede obtenerse como sigue:
95% IqRR) = exp Hog (6,0) (1 ,96 x 0,197)1 = exp LI ,792 0,386J
LImite Inferior =
LImite Superior
exp I I ,406J = 4,08
exp 12,178J = 8,83
Nota: La via ra.pida alternati va es:
LImite Inferior 95% IC (RR) =
LImite Superior 95% IC (RR)
6,0 x e - (I.96,OI97( = 4,08
6,0 x ei1.96x0197) = 8,83
Razon de tasas (razon de densidades de incidencias)
Ederer y Mantel(9) propusieron procedimi entos aproximados para calcular el interva-
10 de confianza de una razon de tasas. Las definiciones para las notaciones que seran
empleadas son:
0 ,
=
0,
=
L,
=
L,
=
R,
=
R,
=
RR =
Eventos observado en el gmpo I
Eventos observado en el gmpo 2
Personas tiempo observadas en el gmpo I
Personas tiempo observadas en el gmpo 2
o !iLl = Tasa del evento en el grupo 1
021L2 = Tasa del evento en el grupo 2
RIIR2
J ntervalo de cOlljianza al 95%
Reali zar los siguientes dos pasos:
I. Fijar Ifmites de la razon de eventos observados en un grupo (por ejemplo, gm-
po I) respecto del nlimero total de eventos observados:
p = --=-0,-,,-::-
0
1
+0
2
382 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Emplcando la f6nn ul a general para el error estandar de una proporci6n p
binomial , el limite inferior (PI) y superior (P,) al 95 % de confianza para esta
raz6n son:
2. Convertir eS(Qs Ifmites en una raz6n de {asas:
RR - x - '
[
P,]L,
, - I - PI L I'
Pruebas de Ilipotesis
Para evaluar Ho: RR= I , puede lI sarse una prucba de ji-cuadrado aproximada con un
grado de li bertad:
donde
Ejemplo
X
l _ (01 - Ed
2
-'. (0 "",: -,.: ",,),-- '
1- + -
EI 2
0
1
= 60, L I = 35.000, Rl = 0,00 171
O
2
= 45, L,. = 30.000, R2 = 0,00 15
RR =0,0017 1/0,00 15 = 1, 14
60
p= --
105
Los Ifmites de confianza al 95% son:

105
60 (
p.=--+ 1,96 x
105
60 45 I )
--x --x -- =0,4768
105 105 105
60 45 I )
--x -- x -- =06661
lOS 105 105 '
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS... 383
0,4768 30.000
= 0,78 RR
1
= x
35 .000
0,666 1 30.000
RR, = x = 1,7 1
0,3339 35.000
La prueba de hip6tesis se !leva adelante del modo siguiente:
35 .000
E\ = (60 + 45) x = 56,54
65 .000
30.000
E2 = (60 + 45) x = 48,46
65 .000
(60 - 56,54)' (45 - 48,46),
+ =0,46; P >O,5
56,54 48,46
A.4, ODDS RATIO (EMPAREJADOS Y NO EMPAREJADOS)
Estudio de casos y controles no emparejados
Basados en la notaci6n del Capft ulo 3, Tabla 3.6 (0 a panir de la tabla en la Secci6n
A.3, suponiendo un esquema de muestreo que opera con casos y controles) en el
cllal los controles (celdas b y d) son una muestra de no casos, el odd.\ ratio puede
cakularse como la razon de productos cruzados:
O
a x d
R = --
bxc
Error estalldar
Como con el riesgo relativo (vease Seccion A .3), en vi nud de su naturaleza multi pi i-
cati va, el error estandar para el OR se cakula en escala antilogarftmica, como descri -
bio WOOlfl lO) :
JI I I 1
EE(log OR) = - + - + - +-
abc d
J ntervalo de cOlljiallZQ al 95%
El intervalo de confianza al 95% tambien se calcula en escala logarftmica:
95% lC(log OR) = log OR LI ,96 x EE(log OR)I
= log OR (,96 x
)
abc d
384 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Los Ifmites de confianza para el odds ratio pueden ser obtenidos tomando el anti-
logaritmo de estos numeros (exponenciando):
95% IC(OR)=eX
P
[IOgOR(1,96X j -' + - ' + ~ + _ ' )]
abc d
Nota: Una manera rapida para estos casas es la siguiente:
Limite Inferior del Ie 95 %
Limite Superior del l e 95%
OR x e-
1L96
,EE(logORJI
OR x e[l.96.EEi log OR))
Prueba de hipotesis
Para valorar Ho: OR = 1, puede lI sarse la pmcba lI sual de Ji-Cuadrado 0 la prucba
exacta de Fisher para tablas de contingencia de 2 x 2.
Ejemplo
Con los datos del Capitulo 3, Tabla 3.6:
OR= 180x997 =609
982 x 30'
EI error estandar dellogaritmo de esta estimaci6n es:
EE(log OR) =
1 1 I 1
--+ --+ - + --=0202
180 982 30 997 '
EI intervalo de confianza al 95% se puede obtener de la siguiente forma:
95%IC(OR) = exp Dog 6,09 ( 1,96 x 0,202)1 = exp L I ,807 0,3961
LImite inferior = exp 11,4 111 = 4, 10
LImite superior = exp 12,203 J = 9,05
Nota: La alternativa mas rapida es:
LImite inferior = 6,09 x e-l
l 96
, 02021 = 4, I
LImite superior = 6,09 x el L96 , 02021 = 9,05
Estudio de casos y cont roles emparejados
En los est udios de casos y controles en los cual es los casos y los controles se empa-
rejan indi vidualmente, el odds ratio, se est ima como el ntlmero de pares en los cua-
les el caso es expuesto y el control no. dividido por el numero de pares en los cual es
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 385
el caso no esta expues(O y el control sf 10 esta. ASI, basandonos en la notaci6n del
Capitulo 7 de la Tabla 7.1 2, tenemQs:
b
OR = -
c
Error estalldar
EI error esrandar del logarirmo de los OR emparej ados es:
JP:
I
EE(log OR) = - + -
b c
J ntervalo de cOllfianza al 95%
EI intervalo de confianza al 95% {ambien se calcula en escala logarltmica:
IC 95 % (log OR) = log OR 11,96 x EE(log OR)!
= IOg OR(1 ,96 X J + :)
Los Ifmites de confianza para el olids ratio pueden obtenerse (Omando los antilo-
garitmos de dichos nlimero (exponenciando):
IC95 %(IOgOR)=P[ IOgOR( 1,96 X J + :. )]
La misma via rapida que para los odds ratio no emparejados puede emplearse aqui
Prueba de hipotesis
Para evaluar la Ho: OR = I, usar la prueba de ii-cuadrado de McNemar (corregida
por continuidad) con 1 grado de libertad.
bJemplo
-, (I::. b -,--:::. cl _-", I ),-- '
X ~ = -
h+c
Con los datos en la Tabla 7. 12, Capitulo 7, tenemos:
65
OR= - = 1,55
42
EI error estandar dellogaritmo de la estimaci6n es:
~
I
EE(log OR) = - + - =0, 198
65 42
386 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Los Ifmites de confianza se obt ienen del modo siguiente:
Ie 95 % (OR) = exp lIog 1,55 ( 1,96 x 0, 198)1 = exp [0,438 0,388[
LImite inferi or = exp 10,0501 = 1,05
LImite superi or = exp 10,826J = 2,28
Nota: La via rapida alternat iva es:
LImite inferi or = 155 x e - 11.%.O.l<nl 1 = 1,05
LImite superi or = 1,55 x e jl.%.OI9ll 1 = 2,28
La prucba de hip6tesis se Jl eva adelantc como sigue:
X
', = -,(::: 16,,: 5 -c;-" 42::-1 -;c-'-' I )_'
- = 4,52, P < 0,05
65 + 42
AS. RIESGO ATRIBUIBLE
Riesgo atribuible en explicstos
Para la fracci6n simple de exceso atribuible - cs(o es, la diferencia en la incidencia
entre expuestos y no expucs(Os (Capitulo 3, Ecuaci6n 4.3) - la varianza puede est i-
marse como la suma de las vari anzas de carla uno de los estimados de incidencias.
Por ejemplo, si los est imados de incidencia se basan en la supervivencia ac umulada,
la varianza del riesgo at ri buible sera la suma de las varianzas individuales obtenidas
con el empleo de la f6nn ul a de Greenwood (vease Secci6n A.I ). El error estandar es
entonces la rafz cuadrada de la vari anza, a part ir del cual se pueden obtener est ima-
ciones de los Ifmites de confianza al 95% aSI como evaluar hip6tesis . Para ello, pue-
de usarse el enfoque general bosquejado en la introducci6n de este apendice.
Ri esgo atribuible porcentual en los expuestos ( % R ~ x p )
Puesto que el % RA",p (Capit ul o 3, Ecuaci6n 3.5) se reduce a la siguiente ecuaci6n
(Ecuaci6n 3.6):
m RA _ q+- q- 100- RR - l
,0 u p _ x_
q+ RR
x 100
esta medida es una funci6n de un solo parametro (el ri esgo relat ivo, RR) . Asf, una
est imaci6n del intervalo de confianza para el % RAexp puede basarse en el intervalo
de confianza para el RR (vease Secci6n A.3) .
Ri esgo atribuible porcentual en la poblaci6n ( O/O RApoII )
La f6nnula de Levin para el d lculo de % RApoII basada en los datos de un eSllldio de
cohorte (Capflll io 3, Ec uaci6n 3.1 0), es:
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 387
% RAPob = po (RR - I) x 100
p. (RR - I)+l
donde RR es el ri esgo relati vo estimado y p. es la proporci6n de indi viduos expues-
{Os en la poblaci6n les decir, basado en la notacion de la tabla de la Secci6n A.3,
p. = (u + b) I TJ. En un estudio de casos controles, suponiendo que la enfermedad es
de baja prevalencia y que los controles son razonablemente representativos del total
de la poblaci6n de referencia, el RR en la formu la de Levin puede ser reemplazado
por eJ odds ratio (vease Capitulo';, Secci6n 3.3.2), y po puede estimarse a partir de
la prevalencia entre los controles.
Error estiilldar
Las sigui entes formulas, expuestas por Walter(ll) se basan en la anotacion de la tabla
de la Seccion A.3. Para el % RAf>OI: calculado con los datos de la cohone:
EE %RApob=
cTlad(T - c)+bc
2
J
--;---'-:-;-:--'----;:-:--"- x I 00
(a + (Y (c + (1) 3
Para %RApob calculado con datos procedentes de un estudio de casos y cont roles:
(
C(b +<D)'( a
(I(a + c) c(a + c)
b )
+ x 100
d(b + d)
EE %RApob =
J IItervalo de cOlljiallZU al 95%
EI intervalo de confianza al 95 % puede calcularse empleando las estimaciones pun-
tuales y los errores estandar arriba cons ignados:
IC 95%(%RAPob) = %RAPob 1,96 x SE(%RApob)
Prueba de hipotesis
Para evaluar Ho: %RAPob = 0, se obti ene el puntaje z del modo sigui ente:
Rjemp/n
De acuerdo con los datos del estudio de cohone hipotCiico del Capitulo 3, Tabla 3.3,
el RR de infarto de miocardio es 6.0, con el cual se comparan hipenensos graves con
no hipert ensos;la prevalencia de exposici6n (hipertension sistolica grave) es 50 %.
As!, el ri esgo atribuible poblacional es:
388 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
--, 0""5.0: (0,, ,6:...- __ 1,,- ) -,- 00
%RA
pob
= -:: x I = 7 1,4%
O ~ ( O , 6 - 1) + 1
EI error estandar de esta estimaci 6n es:
SE(%RApoo) =
0
3
:. -'- , ::: 2::: .:: .00 =-"'-1"1:. 8 -'--'- , ,: 9:. .9,,7.:: ,:.'.,.:- 19,,.:. 97,,'-+:...0
9
::: .
8
::: 2:. 0-,- , :::3,, 0--, 21 x 100
2 10
3
X I 0 J)OOJ
= 4,82 %
EI intervalo de confianza al 95% se obtiene del modo siguieme:
Ie 95%(%RAl'ob) = 7 1,4 (I ,96 x 4,82) = 7 1,4 9,4
LImite inferior = 62,0 %
LImite superi or = 80,8 %
La prucba de hip6tesis se Jl eva adelante como sigue:
7 1,4 8 00
-- = 14, , P <O, I
4,82
A.6. DIFERENCIA ENTRE DOS TASAS AJUSTADAS
o I'ROBABILIDADES (METODO D1RECTO)
$e define d = l' A - r s; esto es, la diferencia de dos probabilidades ajustadas (vease
Capitulo 7, Secci6n 7.3. 1, Tabla 7.3)
Error esttilldar
Un error estandar aproximado para d (d es una diferencia est imada ajustada , por
ejemplo, exceso de incidencia), basada en i = 1 ... k estratos) se obtiene empleando
la f6nnula (2):
EE(d) =
W? Pi ( I _ p,) (_1_ + _1_)
j - I n iA /liB
donde los Pi son las tasas globales espedficas por estratos (ambos grupos de estudi o
combinados):
Pi =
II jA +ni B
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 389
y las 11'; son las ponderaciones de la poblaci6n estandar empleadas para ajustar las
{asas de los grupos de eswdio. N6tese que si se emplea el metodo de minima
varianza (es decir, si estos pesos se calc ulan como sigue; vease; Capitulo 7, Sec-
ci6n 7.3 .1 ):
la f6rmula anterior es sus{ancialmcnte mas simple:

I II'; I'; ( I - Pi)
;_ I
EE(d ,"";anz. minim.) = -'-----------

I Wi
; _ 1
J ntervalo de cOllfianza al 95%
EI intervalo de confianza al 95% puede obrenerse usando el planteamiento general
que se expuso en la introducci6n de este apendice:
d LI ,96 x EE(d)J
Prueba de hipotesis
La evaluaci6n de la hipotesis tambien emplea eI enfoque general (vease arriba):
Ejemplo
d .
-;::c;:-;- - puntaJe Z
EE(lJ)
Los datos para este ejemplo provienen de l esrudio de Pandey ef at.
m
) donde se
compara la mortalidad para diferentes nive les de consumo de vitamina en la dieta
en el estudio de cohorte de la Western El ectric Company. Estos datos fueron
empleados como un ejemplo para ilustrar las tecnicas de evaluaci6n de la confu-
si6n en el Capitulo 5 (Tab las 5.1 )' 5.5) . A los efeclOs del ejemplo actual la catego-
ria se ignora y el prop6sit o es calcular la diferencia ajustada segun
habito de fumar en tasas de mortalidad entre caregorias de consumo vitamfnico
atfo y bajo, asi como el correspondiente intervalo de confianza para la diferencia
ajustada. Sobre la base de los numeros present ados en las {ablas arriba menciona-
das, se constmye la siguiente tabla de trabajo para el dlculo de las diferencias
ajustadas (usando ajuste directo con el metodo de minima varianza) y su error
estandar:
390 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
BaJo Alto Minima varlanza estandar
consumo conSlimo Total
Hiiblto de vltamlnas' de vltamlnas' N." esperado N." esperado

Tasa N de muertes de muertes w,p;
fumar N Tasa N Tasa N (P,) (WI)t (Bajo)! (Alto)1 (1- p ;)t
No 4.260 0,0134 5.143 0,0103 9.403 0,0117 2330,020 31,1763 24,0115 26,9386
Sf 6.447 0,0214 6.233 0,0178 12.680 0,0196 3169.097 67,8355 56,4367 61,0102
Suma 5499,117 99,0118 80,4482 87,9488
- vease latlla 5.4, t.:apilukl 5
Los numeros esperados que aparocen en la labia son exactos y pueden dilen. ligeramente de aquellos oIlle-
nioos usando las lasas mostradas para aHo y bajo consumos pues\o que la "Rima ha sido redondeada.
As!, las tasas ajustadas son:
para el grupo de bajo conslimo vitamfnieo: 99,01 18/5499, 11 7 = 0,0 1080
para el grupo de alt o consumo vitamfnico: 80,4482/54992, 11 7 = 0,0146.
La diferencia ajustada entre los gmpos de alto y bajo consumo vi tamlnico es por
10 tanto: (f = 0,0 146-0,0 18 = -0,0034, 0 -3,4 por 1.000.
EI error estandar de esta estimaci6n puede calcularse como:
87,9488 = 0,0017
5.499,1 17
EI intervalo de confianza al 95% se calcula como sigue:
-0,0034 1,96 x 0,0017
LImite inferior = 0,0034 - 0,0033 = -0,0067
LImite superior = 0,0034 + 0,0033 = -0,000 I
A.7. RAZON ESTANDARIZADA DE MORTALIDAD
La tasa de monali dad estandarizada (REM) y las medidas relacionadas tales como la
raz6n eSlandarizada de incidencia (REI) se definen como el nlimero de evenlos
observados (por ejemplo, muenes, casas incidentes) en una poblaci6n dada (0 ) por
el nlimero esperado de eventos (E) si la poblaci6n que se estudia luviera las mismas
tasas que la de referencia (vease Capitulo 7, Secci6n 7.3 .2) .
REM =!!...
E
J ntervalo de cOllfianza af 95%
Suponiendo que el nlimero de eventos esperados no esla suj eto a variabi lidad alealo-
ria, una manera simple de oblener el inlervalo de confianza al 95% para una REM es
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 391
calcular los Ifmites inferior y superior para el ntlmero observado de eventos, 0 (vea-
se Secci6n A.2), y entonces sustitlli rlos en la f6rmula de la REM. (Para conocer de
metodos alternativos, acudase a Breslow y Day (7).)
Ejemplo
A partir de los datos hipoteticos de la Tabla 7.8, Capitulo 7, se observaron 70 muer-
tes en el grupo, B. EI numero de eventos esperados obtenidos al aplicar las tasas de
una poblaci6n de referencia es 110. As!, la REM est imada para el gmpo B de estudio
es 70/ 110 = 0,64. De acuerdo con la tabla de la Secci6n A.2, los factores para los
Ifmites inferior y superior para una tasa basada en 70 eventos observados (0), res-
pectivamente son: 0,785 y 1;27. As!, los Ifmites de confianza al 95% para 0 son
o =70x7,85=54.95,yO =70x 1,27=88,9. Loslfmit esdeconfianzaal 95%
, ,
resultantes para el REM son entonces:
54,95
REM, = = O ~ O
110
88,9 08
REMs= -- = , I
. 11 0
A.8. ODDS RATIOS DE MANTEL-HAENSZEL (Y RAZON DE TASAS)
Error eslalldar
Para una tabla de contingencia de 2 x 2 estratificada en k estratos (i = I, ... , k), una
f6rmu la aproximada para el error estandar (EE) del estimador de Mantel-Haenszel
para ellog OR ajustado, basado en la notaci6n del Capitulo 7, Tabla 7.9, es debida a
Robins et al (1 4):
~ (P.Ri) L (PiWj + QiR,)
2: (Q,w,)
j. 1 j.1 i.1
EE(log OR
MH
) =
{.l: Ro)'
+
2( Ro) ( wo)
+
2( 1: wo)'
,. , ,. j ,.1 ,. ,
Donde
P
j
=
a, +ti
i
N,
Q,=
h i + Ci
N,
R=
a, x eli
N,
h i X Cj
Wj =
N,
392 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
(Nota: Greenland y Robins (IS) dedujeron lIna eClI aci6n an:lloga para el calculo del
EE del estimador de Mantel-Haenszel de la raz6n de tasas aj ustadas para datos estra-
dficados de una cahone - (vease Capitulo 7, Secci6n 7.3.3) .
J ntervalo de cOllfiam.a af 95%
El mismo recurso descrito para odds ratio no ajustado en la Secci6n A.4 debe ser
empleado aquf; esto es, e l d .l culo de los !fmilcs de confianza en una escala logarft -
mica y la exponenciaci6n de los result ados para obtener el intervalo de confianza
para el O R ~ 1 I l .
Prueba de liipolesis
Nucvamente, siguiendo la notaci6n del Capit ulo 7, Tabla 7.9, puede calcularse lIna
prucba de ii-cuadrado aproximada con un grado de li benad (independieme del
nli mero de estratos involucrados) del modo siguiente(1 6
1
:
xi=
donde Ei es el valor esperado en la celda a en cada estrato, calculada a partir de
los valores de los margenes como en cualquier prueba de Ji Cl/adrado (es decir,
nil x lIl idNi).
Ejemplo
A part ir de los result ados estratificados del CapItulo 7, Tabla 7.1, la estimaci6n de
ORMH fue de I ,0 I. La siguiente tabla de trabajo fue establecida para aplicar la for-
mula del EE:
Sexo Caso Control N OR P 0 R w PR Pw+QR Ow
EstralO 1
H 53 15 81 1,00 0,691 0,309 1,963 1,852 1,357 1,886 0.572
M 10 3
EstralO 2
H 35 53 219 1,00 0,521 0.479 12,626 12.584 6,572
"604
6,034
M 52 79
Suma : 14.589 t4,436 7,929 14.490 6,605
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 393
Como se ve,
J
7,929 14,490 6,605
EE(log ORMH) = , + -:----,-:-e==-,--= + -::--"":'-':=
2 x 14,589- 2 x 14,589 x 14,436 2 x 14,436
2
= 0,262
EI intervalo de confianza al 95% se obtiene del modo siguiente
Ie 95%(OR) = exp I log 1,0 1 ( 1,96 x 0,262)J
Inferior exp L-05041 = 0,60
Superior = exp LO,525] = 1,69
(Nota: puede emplearse el mismo procedimiento rapido para el dJculo de los Ifmites de
confianza del odds ratio que el que ~ e mostro p..1fa el odds ratio cmdo, Secci6n A.4).
La prueba de hip6tesis se desarrolla como sigue:
63x 18x68x l 3
81'(81 - 1)
+
87x 132x88 x 131
219'(219 - 1)
Como se ve, el OR.\IH no es estadisticamente significat ivo en este ejemplo.
A.9. COEFICIENTE DE REGRESION
En el Capitulo 7, Seccion 7.4, se describen varios modelos de regresion para anal isis
multi variado de datos epidemiologicos (lineal, logfstico, de Cox, de Poisson). Estos
analisis de regresion son tfpicament e conducidos con ayuda de computadoras y
paquetes estadisticos, estos penniten computar estimaciones de los coeficientes de
regresion (b) y de sus errores estandar (EE (b)). Sobre la base de estas estimaci ones,
y siguiendo el planteami emo general descri to en la introduccion de este apendice, es
posible obtener Ifmites de confianza y Il evar adelante pruebas de hip6tesis.
J ntervalo de cOlljianza al 95%
EI imervalo de confianza al 95% para un coeficiente de regresion puede obtenerse
con la formula siguieme:
b II ,96 x EE(b)J
Prueba de Ilipotesis
La hipotesis nula se fonnu la como sigue:
H o : ~ = O
394 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
donde ~ denota el verdadero valor del para.metro en la poblaci6n de referenda.
La prucba estadfstica. en este contexto, se conace como estadistico de Wald:
Ej emplos
b
-==c- '" puntaje Z
EE(b)
Regresiotl lineal
A partir del valor del coeficiente de regresi6n y de su error estandar para la tensi6n
arterial sist6lica ( 10 mm Hg de incremento) en eI Capitulo 7, Tabla 7.16, el intervalo
de confianza al 95% puede calcularse del modo siguiente:
O,040 ( 1,96 x O,oI I )
Esto es, el imervalo de confianza estimado al 95% para el incremento en el con-
teo de leucocitos por 10 mm Hg de incremento en la tensi6n arterial sist61ica va de
0,018 hasta 0,62 miles x mm
3

EI estadistico de Wald, se aproxima a (raves de un puntaje z. y se calcul a
como:
z ... 0,040 = 3,64
0,0 11
Este valor se asocia con una P < 0,00 1, 10 cual permite rechazar la hip6tesis nula
con una probabilidad de error alfa inferior que 111 .000.
Regresiolllog{s/ica
En el Capftulo 7, Tabla 7.18 el eoefidente de regresi6n logfstica estimado asociado
con la hipertensi6n es 0,5103, el cual se traduce en estimadones del oddJ ratio de
enfermedad coronaria ascendente a r ! > ~ I O l = 1,67, 10 que pennite comparar a los
hipenensos con los que no 10 son (aj ustado por todas las otras variables contenidas
en la Tabla 7.18). EI error estandar correspondiente al eoefidente de regresi6n est i-
mado es 0,1844 (no mostrado en la Tabla 7.18). Asf, el intervalo al 95% de eonfian-
za para el coefidente de regresion se calcula como sigue:
0,5103 (I ,96 x 0,1844)
00, 1489 (limite inferior) y 0,8717 (lfmite superior) . EI intervalo de eonfianza
correspondiente al odds ratio (OR) est imado puede ser obtenido mediante exponen-
ciaci6n de estos Ifmites de eonfianza, 10 eual se puede concretar en solo un paso del
modo que sigue:
LImite inferior = exp lO,5 103- ( 1,96 x 0,1844)J = 1,16
LImite superior = exp 10,5 103+ (1 ,96 x 0,1844)1 = 2,39
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 395
EI correspondieme estadfstico de Wald para el coeficiente de regresi6n est imado es:
0,5 103 2 6
z'" = ,7 7
0, 1844
EI valor asociado de P para este puntaje Z es 0,006. N6tese que este estadistico
pennite valorar la hi p6tesis nula (Ho: b = 0, 0 equi valentemente Ho: OR = I).
EI mismo enfoque puede emplearse para ob{ener Ifmites de confi anza y apl icar
pruebas de hi p6tesis para coeficientes de regresi6n y medidas de asociacion deriva-
das dc los modclos dc rcgrcsi6n de Cox y Poisson.
Estadistico de Wald para la interacci6n
Si el modelo comiene un tennino de interacci6n (por ejemplo, el producto de dos varia-
bles x; vease Capitulo 7, Seccion 7.4.2, Ecuacion 7.4), la significaci6n estadfstica de la
estimaci6n del coeficiente de regresion, correspondiente (estadfstico de Wald) es una
pmeba fonnal p..1fa la interaccion entre 2 variables. En el ejemplo de la Ecuaci6n 7.4, el
cual es una variacion del modelo 2 de la Tabla 7.1 5, que pennite una interaccion ent re
edad y tension arterial sistolica, el h3 estimado es 0,OCOO503, con un error estandar de
0,OCOO570, al cual corresponde un estadfstico de Wald de 0,0082 (no estadfsticamente
significativo). As!, estos datos no apoyan la hi p6tesis de que hay una interaccion entre
edad y tension arteri al sistolica en relacion con el grosor de la car6tida.
A.IO. SENSlBILlDAD, ESI'ECIFIClDAD Y PORCENTAJE
DE CONCORDANCIA
Los procedimiemos de estadistica inferencial, para estas (res medidas son los mi s-
mos que aquell os que se emplean para cualquier otra proporci6n simple.
Error estti lldar, intervalo de cOllftanza a195%
Puede emplearse la formulacion convencional para calcul ar el error estandar (b) cal-
cul ada en una muestra de N individuos:
EE(P) = J P( I ;P)
Una vez que se calcul a el error estandar, ya se puede emplear la formul a general
para obtener Ifmites de confianza que se expuso en la introducci6n del apendice.
Ejemplos
Los siguiemes ejemplos se basan (odos en los datos de un estudio de vali daci6n del
autoinfonne de la di fi cult ad para ponerse de pie desde una silla(17) (Capitulo 8,
Tabla 8.13) .
396 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Sensibilidad
La sensibilidad estimada es 71/(7 1 + 42) = 0,628.
Para calcular el error estandar, ha de lI sarse como N el numero total de verdade-
ros positivos (N = 11 3, el denominador para la sensibili dad):
EE(sensibi li dad) = J O,628( 1 - 0,628)
11 3
= 0,0455
As!, los !fmilcs de confianza al 95% son:
Limite inferior = 0,628 - ( I ,96 x 0,0455) = 0 ,539
LImite superior = 0 ,628 + ( I ,96 x 0,0455) = 0,717
Especificidad
La especificidad est imada es 455/(455 + 41) = 0,9 17 . Para calcular el error estandar,
debe emplazarse como N el numero total de verdaderos negativos (N = 496, el
denominador para la especificidad):

'n
EE(especl Idad) = - . =0,0 124
496
As!, los !fmilcs de confianza al 95% son:
LImite inferi or = 0,917 + (1,96 x 0,0 124) = 0,893
LImite superior = 0,917 + ( 1,96 x 0,0 124) = 0,94 1
Porcelltaje de cOllcordancia
EI porcemaje de acuerdo est imado es [(7 1 + 455)1/(609) = 8,64. Para calcular el error
estandar, ha de tomarse como N el numero total de sujetos en la tabla (N = 609):
, JO,864( I - O,864)
EE(% concordancla) =
609
= 0 ,0 139
As!, los Ifmites de confianza al 95% (usando valores porcemuales) son:
LImite inferior = 86,4 - (I ,96 x 1,39) = 83,7%
LImite superior = 86,4 + ( I ,96 x 1,39) = 89, I %
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 397
A.H. ESTADiSTlCOJ DE YOUDEN
Error estandar, intervalo de confianza
EI estadist ico J de Youden se basa en la suma de dos proporciones (sensibilidad y
especificidad) (vease Capitulo 8, Seeci6n 8.4.1) Suponiendo que ellos son indepen-
dientes, el error estandar (EE) puede ealcularse del modo siguiente:
EE(1) =
Sens( I - Sens)
N ,erd. N ,erd_
Una vez que se ealcula el error estandar, puede emplearse eI enfoque general para
obtener Ifmites de eonfianza que se bosquejo en la introduecion de este apendice.
Ejemplos
EI ejemplo siguiente se basa en los datos de la Tabla 8.5 del Capitulo 8. EI estadfst i-
co J de Youden estimado es ( 18/ 19) + ( 11 /30) - I = 0,3 14. Usando la f6rmu la ante-
rior, el error estandar es:
18 I II 19
- x - -- x --
EE(1) =
19 19
+ 30 30 = 0, 102
19 30
Los Ifmites de confianza al 95% son:
Limite inferior = 0,3 14 - ( 1,96 x 0, 102) = 0, 114
Ifmite superior = 0,3 14 + ( 1.96 x 0, 102) = 0.5 14
A. 12. KAPPA
EI estadfstico kappa es una medida ut il para la evaluaci6n de la fiabilidad de varia-
bles categ6ricas (vease Capitulo 8. Seeci6n 8.4.1) . La formu la para el dlculo del
error estandar y el intervalo de eonfianza al 95% para kappa 110 pOllderado se estima
como se muest ra a continuaci6n:
Error estandar e intervalo de confianza a195 %
Las fonnu las para el dlculo del error estandar de kappa pueden hall arse en la literatu-
Consideremos una sit uaci6n en la eual se cuenta con dos leeturas replicadas (por
ejemplo, lect uras heehas por dos sujetos , A y B) para un conjunto dado de valores
398 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
correspondientes a pmebas . El resultado de la prucba tiene k valores posibles . La
siguiente tabla define la notaci6n para las proporc iones observadas (p) en carla celda y
en cada marginal de la tabla de contingencia que result a de ambos conjuntos de iecturas.
CLASIFI CADOR B
<C
2 k Total
'"
0
p"
P I! I'lk 1'1"
'"
2
P21 P22 I'll< 1'2"
U
Ii:
Vi
k
<C
pu
I'V!. Pu Pk"
...l
U Total
1'"1 1'"2
p.,
Basado en esta notaci6n, el EE del kappa estimado puede obtenerse como sigue.
, 1 ,
EE (K) = ( I ) x p. +p-.-
- Po x vn
donde poes la concordancia esperada por azar, que se calcula a traves del produc(O
de las proporciones marginales simetricas (vease Capit ul o 8, Secci6n 8 .4 .1 ):
,
p<= I PiP"i
1
Nota: Las f6rmul as para el error estandar del kappa ponderado pueden igualmen-
te hallarse en textos especializados; vease, por ejemplo, Fleiss (1 8 ) .
Ejemplo
EI siguiente ejemplo se basa en los datos de un estudio de autoinforme de dificultad
para ponerse de pie desde una silla,,(17) (Capit ulo 8, Tabla 8. 13) (vease Secci6n A.I O):
Comunlc6 que tenfa dlflcultades
s;
No
Total
Se observ6 que tenfa dlflcultades
s;
71
42
113
No
41
455
496
Total
112
497
609
FU"f)(<!. M F""", "I ifl. , Cornpdriso" of P",fo",anuoBas.,.j arl<l 3t<lf Rat.,.j Fu,"'lio,,,,' C,,!, a<;i ty in S.,anisll
Ametican Joumalof Epidemiology, Vol 149, 228 235, 001999, The Johns Hopkins University School or Hygie
ne & Publ;,: Health.
Di vidiendo los nlimeros de la labia por el tolal (N = 609), la siguienle labIa mues-
(ra las proporciones empleando la nolaci6n de la tabla previamente conformada.
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS.. 399
Comunlc6 que tenia dilicultades
SI
No
Total
Se observ6 que tenia dilicultades
SI
0.1166
0, 1856
No
0,7471
0,81 44
Total
0,1839
0,8161
Nora: las proporciones en las celdas discordantes no se mueSlran pueslO que eli as no se usan en II cak:ulo.
Fuenre: Datos tornaoos de M Ferrer er al., Comparison 01 Performance-Based and SelfRated Fuoctional Capa
city in Spani.h Elderly, Americ<ln Joum<ll of Epidemiology, Vol. 149, 226235. Ct 999, Th" JohM Hopl<in. Univ",""ity
School of Hygiene & Public HeaHh.
La concordancia observada es:
,
Po = I PH = 0, 11 66 + 0,7471 = 0,8637
; ~ I
La concordancia esperada (por azar) es:
,
p. = LP;'IJ-; = (0, 1865 x 0,1839) + (0,8 144 x 0,8 161) = 0,6989
,.
As!, el kappa estimado a partir de estos datos es:
K = po- I',
I - I"
-, 0.:: ,8", 6:.. 37,,-..,0:.: ,6:.: 9.:: 89 :.. = 0,547
1- 0,6989
Usando la f6rmula de arriba, eI error estandar es como sigue:
( I
1 0.6989 + 0.6989' _ (OJ 839 x OJ 856 x (0.1839 + OJ 856)+) '" 0.041
0.6989) \1609 \ 0.8161 x O.8144 x (0.8161 + 0.8144)
As!, los Ifmites del intervalo de confianza al 95% son:
Inferior = 0,547 - (1 ,96 x 0,041) = 0,467
Superior = 0,547 + (1 ,96 x 0,04 1) = 0,627
BlBLlOGRAFiA
I. GOCKi man SN. P values, hypothesis test, and likelihood: implications for epidemiology
of a neglected historical debate. Alii J Epidemiot 1993: 137: 48.'5-496
2. Royal R. Slatislical evidenu: A likelihood primer. London: Chapman and Hall. 1997.
3. Amlitage P, Berry G. Slalis/ical melhods il1l11e(/iml reseanh. 3," ed. London. Blackwell.
1994.
4. Altman DG. PracliL'al slatis/ical for mediml sluden/s. London. Chapman and Hall.
1991.
400 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
5. Greenwood M. A report on the natural duration of cancer. Rep PI/blic Hea/lh Med SlIb
jects 1926: 33: 1-26.
6. Haenszel W. Loveland DB, Sirken MG. Lung cancer mortality as related to residence
and smoking histories.l White Males.} NaIl Callcer "lSI 1962: 28: 947-1001.
7. Breslow NE. Day NE. Slmislimlmnhods ill cancer researdl. Vol 2. The design and
analysis of cohorl sllidies. Lyon, IARC Scientific Publications. 1987,
8. Katz D. Baptista L Azen SP el al. Obtaining confidence intervals for the risk ratio in
cohort studies. Biome/ric 1978: 34: 469-474.
9. Ederer F, Mantel N. Confidence limiB on the ratio of two Poisson variables. Alii J Epide,
m;0/1974: 100: 165,167.
10. Woolf B. On estimating the relation between blood group and disease. Ann Hum Genel
1955: 10: 251-253.
II. Walter SO. Calculation of attributable risks from epidemiological data.lnl J Epidemiol.
1978: 7: 175-182.
12. Kahn HA. Sempos cr. Slalisliwi mt/hods in epidemiology. New York. Oxford Univer-
sity Press. 1989.
13. Pandey OK, Shekelle R, Selwyn BJ , n al. Oieatary vitamin C and l3-carotene and risk of
death in middle-aged men: the Western Electric study. Am J Epidemiol 1995: 142: 1269-
1278.
14. Robins J . Greenland S. Breslow NE. A general estimator for the variance of the Mantel-
Haenszel odds ratio. Am J Epidemio/1986: 124: 719-723
15. Greenland S. Robins 1M. Estimation of a common effect parameter from sparse follow-
up death. Biomelrics 1985: 41: 55-68.
16. Mantel N. Haenszel W. Statistical aspects of the analysis of data from retrospective stu-
dies of disease. J NaIl Cancer Insl 1959: 22: 719-748.
17. Ferrer M. Lamarca R. Orfila E Alfonso J . Comparison of perfommnce-based and self-
rated functional capacity in Spanish elderly. Am J Epidemiol 1999: 149: 228-235.
18. Fleiss JL. Slalislicalmelhodsfor rales and proponiollS. 2." ed. New York. John Wiley
and Sons. l'JgI.
APENDICE B
Pruebas de tendencia (dosis-respuesta)
Cuando la exposici6n es categorizada en mult iples categorfas ordinaleJ", puede ser de
intcres evaluar si la reladan observada entre el incremento (0 disminuci6n) de los
niveles de exposici6n y el riesgo (0 el odtis) de enfennar siguen un patr6n lineal de
dosis respuesta. Un ejemplo aparece en el Capitulo 3 al final de la Secci6n 3.4.1 ,
Tabla 3.11 , en el ellal el odds ratio de craneosinostosis parecfa incrementarse clIando
aumentaba la edad materna atendiendo a una reladan dosis-respucsta(l). Una prucba
para evaluar si la tcndencia observada es estadfsticamente significativa (es decir, si la
hip6tesis nli ia de que no hay tcndcncia li neal puede ser rcchazada) fue desarrollada
por Mantel(2) . La formulaci6n que sigue se basa en la siguiente notaci6n:
Estrato
( ~
,
,
Total
PuntaJe
('I
N.O de casos
(a ,)
"
A
N. O de controtes
(01
..
B
Total
(n,)
'"
",
N
EJ estadfstico sigui ente sigue una distribuci6n iicuadrado con un grado de liber-
tad:
Donde los puntajes (Xi) son vaJores que representan el niveJ de exposici6n en
cada categorfa ordinal subsecuente (vease debajo).
402 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EJEMI'LO
Para ilustrar la aplicacion de la prueba de tcndencia de Mantel, se emplean los datos
del ejemploen el Capit ulo 3, Tabla 3. 11 . Con la finalidad de hacer mas simples estos
dlcuios, los datos se han reorgani zado en la siguiente tabla de trabajo:
Edad
n,x,A
(anos)
" "
b, n,
a,x' - - N-
n,x, n,x,'
<20 12 89 101 --6,748 101 101
20 24 2 2 47 242 289 - 13,290 578 1.156
25 - 29 3 3 56 255 311 - 5,186 933 2.799
>29 4 4 58 173 231 60.485 924 3.696
Total 173 759 932 35,262 2.536 7.752
FuerHe: BW Alderman 61 al., An Epidemiologic Study of Craniosynostosis: Risk Indicators lor the Occurrence 01
Craniosynostosis in Colorado, American Journal of Epidemioiogy, Vol 128,431-438, ClI988, The Johns Hopkins Uni-
v e r s ~ y School 01 Hygiene & Public Health.
As!, aplicando la f6rmul a anterior:
[35,2621'
xi = -------'=='-------,,--- = 9,65
(
173 x 759 x [(932 x 7.752) - 2.536
2J
)
932' (932 - 1)
al que corresponde un valor de P igual a 0,00 19.
NOTAS
La hip6tesis nula correspondiente a esta prueba de tendenda es que no hay aso-
dad6n li neal, 0, en otras palabras, que la I'entiiellfe de la asodadon en la medida
que se incrememan los niveles de exposicion es nul a (plana) . As!, un valor de P sig-
nificati vo de eSla prueba viene a dedr que los datos no apoyan la hi p6tesis que afir-
ma que la pendiente es nula. Tal resullado no deberfa reemplazar el examen de los
verdaderos estimados de los OR con la finali dad de j uzgar si, efecti vamente, existe
una tendenda lineal. Como con cualquier otra prueba estadfstica, el valor P depende
fuertemente del tamano muestral; aSI, si el tamano de muestra es grande, una aso-
dad6n de ti po J 0 de tipo umbral puede condudr a que declaremos la existenda de
una tendenda significativa, incluso aunque la asodad6n no sea lineal. Por ejemplo,
SlJ Pongamos flil e los OR eSfi mafios para cinco categorfas oni ina les rlc incremento rle
una exposicion dada (por ejemplo, qui mil es de una variable cont inua) son 1,0 (refe-
renda), 0,9, 1, 1, 1,0, Y 3,0. Si el tamano muestral es sufidentemente grande, emon-
ces la prueba de tendenda produdrfa un resul tado al tameme significativo, 10 cual
simplemente indica que la hip6tesis nula <pendiente = 0) puede ser rechazada con
derto nivel de confianza, a pesar del hecho de que en este ejemplo, el patr6n de la
PRUEBAS DE lENDENCIA (DOSIS-RESPUESTA) 41)3
asociaci6n es practicamente plano, excepto por el abult ado odd.\" ratio presente en el
ult imo quint il , que produce un incremento en el odds correspondiente a los in-
dividuos de la ul tima quinta parte de la distribuci6n. Este fen6meno es anaJogo al
que se discuti6 en el Capitulo 7 sobre el uso de modelos lineales para anali zar patro-
nes no li neales (Seccion 7.4.7) .
La prueba de tendencia anteriormente considerada es analoga a la prueba de
Wald para un coeficiente de regresi6n li neal (vease Secci6n 7.4.8), salvo por el
hecho de que este se basa en un pequeno numero de datos punt uales (cuatro en el
ejemplo anterior). los cuales son I'0nderados con acuerdo al numero de sujetos
incluidos en las correspondientes categorfas. Asf, las mismas li mitaciones y precau-
ciones que debfan tomarse cuando se usaba la regresion li neal valen cuando se estan
interpretando los result ados de una prueba de tendencia.
Se han propuesto fonn ul aciones alternativas a la prueba de tendencia anteri or-
mente descri ta, las cuales se basan en la eval uaci6n de tendencias lineales en propor-
ciones (vease, por ejemplo, Cochran(l). Dada la equivalencia arit metica entre las
proporciones y los odds, todas estas pruebas alternat ivas cond ucen a result ados simi-
lares: para consult ar referencias adic ionales y una disc usion, veanse 0 Sch-
lesselman(s ).
En el ejemplo que nos ocupa, los puntajes fueron arbitrariamente fijados como I,
2, 3 Y 4. N6tese que se obtendrfa exactamente el mismo valor de ii-cuadrado si se
emplearan los puntajes - 1,0, I Y 2, en cuyo caso los d lculos (si fueran realizados a
mano) serfan considerablemente mas simples . En el caso de categori zaciones ordi-
nales basadas en vari ables cont inlL.1S (tales como la edad en el ejemplo) en lugar de
estos puntajes completamente arbitrarios, puede ser mas adecuado seleccionar como
puntajes los puntos medios de las variables que definen cada categorfa. Por ejemplo,
suponiendo que los recorridos para las categorfas superi or e inferior fueran de 10 a
19 afios y de 30 a 39 anos, respectivamente, los puntajes serfan 15,22.5,27.5 Y 35
con el siguiente resul tado:
Edad
n,x,A
(ai'ios) x,
"
b,
0'
a,x' - - N-
n,x, n,x,'
< 20 15 12 89 101 - 101 ,22 1515 22.725
20 - 24 2 22.5 47 242 289 - 149,51 6502,5 146.306.3
25 - 29 3 27,5 56 255 311 --47,535 8552,5 235.193,8
>29 4 35 58 173 231 529,244 8085 282.975
Totat 173 759 932 230,982 24.655 687.200
Fuenre: BW Alderman er a/ .. An Epidemiologic Study of Craniosynostosis: Risk Indicators for the Occurrence of
Craniosynostosis in COlorado, American Joumr.! of Epidemiology, Vol 128. 431438. 1t11988, The Johns Hopki ns
University School of Hygiene & Pubik: Health.
En este ejempl o, el ii-cuadrado resul tante es 10,08, P = 0,00 15. (Alt ernat iva-
mente, el puntaje para cada categorfa pudiera ser la media 0 la mediana para la
variable en cuesti6n y para todos los individuos incluidos en cada categorfa res-
pectiva) .
404 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
PRUEBA MULTI VARIADA DE TENDENCIA
Como se sefia16 previamente, la prucba estadfstica para tcndencias es la anaJoga a la
prucba de Wald que valora la significacion estadfstica de un coeficiente de regresi6n
lineal (vease Capitulo 7, Secci6n 7.4.8 Y Apendice A.9). En efecto, un enfoque de
regresi6n puede emplearse para evaluar la significaci6n estadfstica de una tcndencia
lineal de dosis respuesta (empleando oddJ' ratio u alra mediada de asociacion,
dependiendo del modelo estadfstico a mana; vease CapItulo 7, Tabla 7.14) corres-
pondieme a una variable ordinal mienfras se ajusrfl par covariableJ' adicionaleJ'
incluidas en el modelo. Por ejemplo, puede ser de interes evaluar si el riesgo de cra-
neosinostosis se incremema li nealmente con la edad (categorizada como se hizo
amerionnente) mientras se aj usta por covariables adicionales (por ejemplo. situaci6n
soc ioeconomica, his(Qria familiar). En aquella sit uacion, para lIevar adelante un pro-
cedimiento multivariado analogo a la prueba de tendencia ameriormente expuesta,
puede emplearse un modelo de regresion logfslica introduciendo la variable AGE-
GROUP como un simple termino ordinal (con valores 1,2, 3 Y 4, 0, c ualq uier otra
alt ernativa que tenga sent ido, tal como se discmi6 amerionnente), jumo con cual-
qui er olra variable en el modelo que deba ser controlada. EI estadfstico de Wald para
eI coeficiente de regresi6n correspondiente a esta variable puede ser interpretado
como una prueba estadistica para evaluar la relaci6n dosis respuesta lineal para datos
aj ustados . AI igual que para la prueba de tendencia para da(Qs no ajuslados, es
import ante examinar si hay una verdadera tendencia dosis respuesta mediante ins-
pecci6n de los est imados especfficos por estra(Qs (por ejempl o, mediante examen de
los estimados basados en un modelo que milice variables Dummy) antes de inter-
pretar esta prueba de tendencia estadlstica sobre la base de la regresi6n (vease CapI-
tulo 7. Seccion 7.4 .7).
BlBLIOGRAFiA
I. Aldennan BW, Lammer EJ. Joshua SC el al. An epidemiologic study of craniosynostosis:
risk indicators for the occurrence of craniosynostosis in Colorado. Alii J Epidemiol 1998:
128: 431-438.
2. Mantel N. Chi-square tests with one degree of freedom: extensions of the Mantel-Haens-
zel procedure. J Alii SIal Auoc 1963: 58: 690-700.
3. Cochran WG. Some methoos for strengthening the common chi-square test. Biomelrics
1954: 10: 417-451.
4. Fleiss JL. Slalisliw/melhods for rales and proponiollS. 2. ed. New York. John Wiley and
Sons. 1981.
5. Schlesselman JJ . Case 'Ol1lro/ stlldies. New York. Oxford University Press. 1982.
APENDICE C
Prueba de homogeneidad de estimados
estratificados (prueba de interaccion)
Como se discmi6 en el Capit ulo 6, la interacci6n 0 la modificaci6n de cfcctos se pre-
scnla cuando la asociaci6n entre una exposici6n dada y un desenlace se modi fica
como resul tado de la presencia (0 la magnitud) de una tercera vari able (ellllodifi-
cador de efecto.\) Los diferentes aspectos que deben ser considerados cuando juzga-
mos si la heterogeneidad observada de la asociaci6n es efectivamente interacci6n 0
es debida a variabi li dad aleatori a de los est imados especfficos por estratos fueron dis-
cutidos en el Capit ulo 6 (Secciones 6.9 y 6.10.1 ). En este Apendice, se describe un
procedimiento general para evaluar la hip6tesis de homogeneidad (es decir, falt a de
interacci6n) . Como con cualquier pmcba de hi p6tesis, el valor P resul tame de esta
prueba de homogeneidad depende fuenememe del tamano muestral. Este problema
es especialmeme imponame cuando se trata de evaluar datos estrat ificados. Los estu-
dios epidemiol6gicos se disefian tfpicamente para optimizar la potencia estadfs{ica
que penni!a detectar asociaciones basadas en datos combinados procedentes de la
muestra total. Sin embargo, la potencia para detectar interacci6n esla frecuentemente
limit ada por lamafios de muestras insuficienles dentro de los estralos(l).
Consideremos una situaci6n en la cual se estima una medida especificada de aso-
ciaci6n R entre exposici6n y desenlace a 10 largo de k eslratos para un presunto
modificador de efecto. La forma general de una pmeba estadlstica para una hi p61esis
de homogeneidad (es decir, Ho: la fuerza de la asociaci6n es homogenea a 10 largo de
(odos los eSlralos) es analoga a un li po familiar de pruebas eSladfsticas para compa-
rar dalos de supervivencia eSlratificados (la pmeba de log rank) y adopla la siguien-
(e forma general( '):
,
x
, ,-
k _ I = !..
i. I
donde Ri es la medida de asociacion espedfica por estratos (para i = I hasta k) Vi es la
correspondienle vari anza, y R es el valor subyacente comLl n estimado de la medida
de asociacion bajo la hip6lesis nul a. t>;la es usualmenle eSlimada empleando uno de
los enfoques para oblener promedios ponderados de esl imaciones de asociaci6n espe-
dficas por estratos descri lOs en la Secci6n 7.3 del CapIt ulo 7 (por ejemplo, aj us!e
direclo. ajusle indireclo. Mantel-Haenszel). Esta pmeba estadfslica liene una distribu-
ci6n ii-Cuadrado con tanlos grados de libenad como el numero de eslralos menos I .
Una imponanle consideracion es que para medidas de asociacion multiplical ivas
(por ejemplo. ri esgo relalivo. odds ratio, razon de lasas), el logaritmo de la razon (no
la raz6n propiamenle dicha) se emplea en la ec uaci6n anterior para Ri y k; conse-
cuentemenle, la correspondiente varianza, Vi, es la varianza dellogaritmo de la rawn.
406 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EJEMI'LO, PRUEBA DE HOMOGENEIDAD DE OR ESTRATlFlCADOS
Esta prucba utiliza la f6rmula siguiente:
x LI = (log OR,- Iog OR) 2
i. I var(log ORi)
EI siguiente ejemplo de la aplicad6n de esla prucba emplea los datos de la Ta-
bla 7.2; este muestra la asociaci6n entre el usa de anticonceptivos orales e infarto de
miocardia estratificada por edad ( 2) . El estimador de Mantel-Haenszel del OR global
para eS(Qs datos es ORMH = 3.97 (Seccion 7.3.3) . La tabla sigui ente se organiza para
facilitar los dlculos de la prucba estadfstica de homogeneidad:
Estrato N.O N." de
N.o de
OR Var( logOA)
(Edad, casos controles
(a dj
anos) .0 la)
I)
log(OR)
I')
Id)
(b c) abc d
1 {25 - 29} Sf 4 62 7,226 1,978 0,771
No 2 224
2 (30 - 34) Sf 9 33 8,864 2,182 0,227
No 12 390
3 (35 39) Sf 4 26 1,538 0,431 0,322
No 33 330
4 (40 44) Sf 6 9 3,713 1,312 0,296
No
"
36'
5 (45 - 49) Sf 6 5 3,884 1,357 0,381
No 93 301
Nora; AO; uso de anHoonceptivos orales
Vease Ap<IndiceA, Secd6n A4
FUfllHe; Oatos tornados de Shapiro fit a/ .. OralContraceptive Use in Relation to Myocardial Infarction, lancet,
Volt , 743 747, 1979.
As\, apli cando la f6rmula anterior:
( 1,978 - log(3,97))2 + (2,182 - log(3,97))2
0,771 0,227
= 0,4655 + 2,8382 + 2,7925 + 0,0151 + 0,00 13
= 6,113
+ ... +
() ,357 - (log (3,97))'
0,381
Este valor de ii-cuadrado con 4 grados de libertad se asocia con una P > 0,10, de
modo que no Il ega a ser significati va a los niveles convencional es.
PRUEBA DE HOMOGENEIDAD DE ESTIMADOS ESTRATlFlCADOS 4D7
BlBLlOGRAFiA
I. Rothman KJ . Greenland S. Modern epidemiology. 2.' ed. Phil adelphia. Li ppincott-Raven.
1998.
2. Shapiro S. Slone D. Rosenberg L el al. Oral -contraceptive use in relation to myocardial
infarction. ulI1Cel 1979: I: 743_74
7
.
APENDICE D
Manual de procedimientos para
el aseguramiento de la ca/idad y control de
la ca/idad de las mediciones de presion
arterial y la recoleccion de orina y sangre
en el estudio ARIC'
Lo que sigue es una transcri pcion textual de dos secciones del manual de operacio-
nes del aseguramiento de la calidad/control de cali dad del Estudio de Ri esgo de
Arteriosclerosis en las comunidades (ARIC). $e transcriben por su valor como ejem-
plos para algunos de los procedimientos incluidos en el Capitulo 8. Para mas deta-
li es sobre el protocolo y el disefio del estudio ARIC (incluyendo el manual completo
del control de cali dad y olros manuales citados en el siguiente tcxto), vease la pagina
WEB del estudio ARIC (http: //www.bios.unc.edu/cscc!ARIC).
TENSION ARTERIAL SENTADO
1. Breve descripcion de los procedimientos para la medici6n de tension arte-
rial sentado y medidas relacionadas para el aseguramiento de la calidad
y control de calidad.
Para medir la tension arterial a un sujeto que se halla sentado, se emplea el siguiente
equipamiento: un estetoscopio estandar Littman con campana; un instrumento
Hawksley con cero aleatorio estandarizado; un man6metro estandar 8aum para
determinar el nivel de innaci6n pico; cuatro manguitos estandarizados (de 8aum).
Despucs de explicar eI procedimiento al partic ipante, el tccnico mide la circunfe-
rencia del brazo y envuel ve el brazo con el manguito correcto; el participante se
sienta y permanece tranquilo durante cinco minutos. Entonces el tecnico reali za dos
lecturas, dejando que transcurran por 10 menos 30 segundos entre la terminaci6n de
la primera lect ura y el comienzo de la siguiente. EI promedio de las dos lecturas se
comunica al part icipante .
Fuente: Atherosclerosis Risk in Communities (ARIC) Study. coordinado por la University of
North Carolina at Chapel Hill para el National Heart. Lung and Blood Institute. National Institutes
of Health.
410 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A pani r del protocolo detallado para la wma de tension arterial sentado que se
halla en el Manual 11 de ARI C, donde se han considerado los varios pumas de trans-
ferenda de datos y otras fuentes posibles de error, se han derivado las medidas nece-
sarias de aseguramiento y control de la calidad. Elementos importantes en el asegu-
ramiento de la cali dad son los programas de entrenamiento y de certificaci6n, la
observaci6n de la recolecci6n de los datos por parte de supervisores, las mediciones
simult aneas bianuales de tens ion arterial reali zadas por dos tecnicos ut ilizando
lubos-Y y los procedimientos estandar de mantenimiento realizados en los equipos,
e introducidos en los registros.
2. Mantenimiento del equipo
I) DiJPonibilidad de manguito.\ de todM los famat/os : EI supervisor del centro
cifnico para la tension arterial asegura que el centro siempre tenga disponible
el espectro completo de manguitos para la medic ion de tension arterial en
cada estaci6n de medic ion. EI equipo de trabajo del centro cifnico comunica
inmediatamente al supervisor de tension arteri al en caso de que no disponga
de todos los tamafios de manguitos en la eSlacion.
2) E.g;.gmoman6metros : En el Manual II de ARIC, Seccion 1.1 3.1 y los Apen-
dices I, II Y V se descri ben las inspecciones regulares que han de hacerse a
los esfigmoman6metros estandar de cero aleatorio. EI supervisor del centro
c1fnico de tension arterial lleva una hoja del registro que recoge el desarroll o
de estos controles y comenta cualquier problema encontrado (vease la copia de
la hoja del regislro en el Manual II ,Apendice IV) . Al final de enero y juli o de
cada ano debe llenarse el formu lario resumen de la !ista de control y enviarse
por correo al centro coordinador.
3) Cada semana, el supervisor de la tension arteri al controla la condicion de la
cinta para la medic ion de la circunferencia del brazo en las eSlaciones de ten-
sion arterial, y repone las que se hayan deteriorado. Los resul tados de este
control se recogen en el registro semanal de antropometrfa. (Vease la Seccion
de antropometrfa para conocer detall es).
3. Control del desempeiio del tecnico por parte del centro clinico
I) E.\teto.\copioJ dobleJ' : Para ayudar a evaluar la exactitud y la precisi6n de las
mediciones de tension arterial, una vez en enero y j ulio de cada ano, cada tec-
nieo que mide tension arteri al loma parte en la medici6n de esta simult anea-
mente con Olro tecnieo, ut ilizando un tubo- Y. Este procClfimiento debe lIevar-
se a cabo utilizando volunfario.\ de otros equipo.\ de trabajo del centro
clinico, que 110 sean participante.\ (Jel estudio ARIC. Los dos tecnicos tambien
reali zan mediciones independientes de la circunferencia del brazo. que se
recogen en los formu larios. Si las mediciones de los dos tecnicos discrepan en
cuanto a que manguito milizar, entonces ambos vuelven a medir el brazo jun-
tos y ut ilizan el tamano del manguito determinado por esa medici6n . Cada
uno recoge esta discrepancia en el formu lario de tensi6n arterial sentado.
Cada tecnieo separadamente recoge todas las medic iones de tension arterial
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD... 411
en un formul ari o estandar de tension arterial sentado. Los dos fonn ul ari os de
papel se entregan al supervisor del centro clfnico para tensi6n arterial, qui en
compara los result ados .
EI supervisor de tensi6n arteri al del centro clfnico revisa los result ados de
estos examenes dupli cados, calcula las discrepancias entre tecnicos en las
mediciones de tension arterial y las registra en el formul ari o. Los dos tecnicos
deberan concordar, tanto para la presion diast61ica como para la sist6li ca, en
no menos de 4 mm y su promedio debe concordar en no menos de 3 mm Hg,
como se requiere por los estandares para la cert ifi caci6n. Si no coinciden. se
toman mas lecturas duplicadas para determinar si unos 0 ambos tecnicos
requieren recert ificacion. Estas mediciones adic ionales deberan ser registra-
das de nuevo como se describe en el parrafo anteri or.
Los nli meros de ident ificacion de cada conj unto de tecnicos emparejados
para las mediciones simult aneas de tension arterial, se recogen en el Infonne
sobre el uso de la li sla de control para la observacion y el equipamiento, esle
se envfa por correo al centro coordinador al final de cada enero y j ulio.
2) Observaci611 biallua/: Una vez en enero y j uli o de cada ano, el supervisor de
tensi6n arterial del centro cI fnico observa a cada tecnico reali zando el proce-
dimiento completo de medici6n de la tension arterial con un partic ipante en el
est udio. EI supervisor del centro cl fnico anota cualqui er problema con la tec-
nica y 10 discute con el tecnico una vez que el examen haya sido completado.
Ademas, otro tecnico observa al supervisor realizar el proceso completo de
medici6n . Despues del examen, ambos discuten cualquier dific ult ad que apa-
rezca en el curso de esta observaci6n . AI reali zar estas observaciones. el
supervisor y los tecnicos utili zan la li sta de control (check liJt) que se incl uye
en el Apendice III del Man ual II de ARI C. Para cada tecnico. se anota la
fecha en que fue observado y el nli mero de identificaci6n del observador y
ambos datos se recogen en el .<l nfonne sobre eluso de la !ista de control para
la observaci6n y el equi pamiento .
4. Recogida de los datos de identificacion del participante
Para evitar errores de ident ificaci6n, al lI enar el modelo de tension arterial senta-
do, el tecnico verifica que el nombre y el nli mero de ident ificaci6n que aparecen
en la pantalla DES que acompafia al partic ipante coincida con el que real mente
corresponde a este ultimo. Si el ordenador esta fuera de servicio y se ut iliza un for-
mulario de papel, el tecnico veri fica el nombre en la hoja que acompana al partic i-
pante antes de ut ilizar las eliquetas de identifi caci6n en la hoja de los formul arios.
5. Medicion de la circunferencia del brazo y seleccion del manguito
de tension arterial
Como ya se describio, una vez cada seis meses se reali zan mediciones dupl icadas de
tension arterial en un voluntari o 0 miembro del equipo del centro clfnico (no partici-
pante del ARI C) . Durante el curso de este procedimiento, ambos tecnicos miden la
circunferencia del brazo y recogen su resul tado. EI supervisor de tension arteri al del
412 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
centro clfnico campara estos resultados, y si difieren en mas de 1 em, la tecnica de
medici6n se revisa con ambos tecnicos.
Tanto la medida del brazo como el tamafio del manguito seleccionado se recogen
en el formu lario (S8P) TAS. EI sistema de entrada de datos controla la consistencia
del tamafto del manguito y de la circunferencia del brazo.
6. Postura del participante y descanso antes de la medici6n de tension arterial
El supervisor de tension arterial del centro clfnico corrobora que la(s) estaci6n(es)
uti li zada(s) para la medici6n de tensi6n arterial continua(n) tcniendo las condiciones
especificadas en el protocolo, por ejemplo, que las mediciones de tension arterial se
haecn en una habitaci6n tranquil a ajena a otras act ividades del centro clfnico. EI
equi po del centro coordinador, cuandQ reali za las visitas, tambien IOma nota acerca
de si se mamiene esta condicion. EI supervisor de tensi6n arterial del centro clfnico
es responsable de vigilar que se siguc el protocolo programando las mediciones de
tension arterial temprano durame la \' isita, antes de la extraccion de sangre u otras
aClividades estresantes. Cada mes el supervisor del centro clfnico revisa una muestra
de los formu larios de itinerario del participante para el mes amerior con el fin de
confinnar que esto efectivamente se cumple.
Para contribuir a juzgar si se permite un descanso de cinco minutos completos
antes de tomar la primera medicion de tensi6n arterial, el tecnico de tension arterial
ut iliza un cronometro de mano u otro medio para comrolar con exactit ud el pericKlo
de descanso. Bianualmeme, el supervisor de tension arterial del centro clfnico obser-
va a cada tecnico reali zar el procedimiento completo de tension arterial y anota si se
esta permitiendo el periodo de descanso correcto.
7. Amilisis del control de calidad del centro coordinador
El cemro coordinador analiza los datos de cada tecnico respecto a la preferenda de
algunos dfgitos al leer la tensi6n arterial sist6lica 0 diastolica. Este control se revisa
anualmeme, a menos que la detecdon de problemas haga necesario un seguimi emo
mas 0 menos imenso. El centro coordinador comuniea estos resultados al cemro clf-
nieo, y el supervisor de tension arterial del cemro clfnico revisa dichos resultados
con cada tecnieo.
EI cemro coordinador comrola que se estan utilizando los procedimiemos correc-
lOS para la entrada y registro de los datos faltames. EI centro coordinador se comuni-
ca con los centros clfnicos de campo cuando se identifican problemas.
RECOLECCION Y I'ROCESAMIENTO DE SANGRE Y ORINA
1. Breve descripci6n de la recolecci6n y procesamiento de sangre y las medidas
relacionadas con el aseguramiento de la calidad y control de la calidad
En el momento en que se produce el contacto telefonico con los part idpames, se les
indica hacer un ayuno de doce horas ames de la visita al centro clfnico, a menos que
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD... 413
sean diabCticos que se inyecten i n . ~ u l i n a 0 tengan otras razones medicas que hagan
no aconsejable el ayuno. Se ha desarroll ado un protocolo detall ado, incluido en el
Manual 7 del ARIC (Recolecci6n J plVcesamiento de la sangre), que describe la pre-
paradon de los tubos para la sangre, los anticoagulantes que van a ser uti li zados para
las muestras de cada laboratorio y los pasos especfficos que deben darse en la
extracdon de sangre y su procesamiento. Despues de la extracci6n de la sangre, los
tubos de muestra redben un procesamiento en el centro clfnico. Las muestras de
sangre utilizadas para el analisis de Ifpidos y hemostasia se congelan a menos 70C
para un embarque semanal hacia los laboratorios centrales del ARIC. Las muestras
para analisis hematologicos se envfan a los laboratorios locales. Todos los embar-
ques hada los laboratorios centrales se hacen mediante servicios de entrega que
demoran un dfa (overnight services). Todos estos pasos son reali zados por tecnicos
ent renados en el protocolo de ARIC y con cert ificado de que conocen bien sus deta-
lies.
EI primer paso en el aseguramiento de la calidad de las extracciones de sangre
consiste en este entrenamiento y proceso de certificaci6n. Otros pasos incluyen el
mantenimiento de registros de los controles de los equipos; la observadon de los
tecnicos (por otros tecnicos y por los monitores en las visitas) a medida que se va
produdendo la secuencia de pasos en la extracci6n de sangre y su procesamiento; la
revisi6n de la condidon de las muestras redbidas en los laboratorios centrales en
reladon con problemas en el embarque; y el analisis peri6dico de los datos del estu-
dio con respecto a la adhesi6n de los participantes al ayuno y a alguna sefial de pro-
blemas en la extracdon 0 procesamiento tales como hemoli sis 0 demoras en el com-
pletamiento del proceso.
2. Mantenimiento del equipo
Cada centro cifnico reali za diariamente controles de temperatura de los refri gera-
dores, los congeladores, la centrffuga refrigerada, y el bloque de calentamiento (vea-
se Manual 7 de ARIC). La veloddad real de la centrffuga se control a y se registra
mensual mente con un tacometro. Los resultados de estos controles se recogen en
una hoja que se mantiene en la estaci6n de procesamiento de sangre y se resume en
el Informe sobre el uso de la lista de control para la observadon y el equipamientm>
al final de los meses de enero y julio. Una copia del informe se envfa al centro coor-
dinador en ese momento.
3. Adhesion de los participantes al protocolo
En contraste con visitas previas, la venipuntura se realiza sobre todos los miembros
de la cohorte, independientemente de su estado en reladon con el ayuno (Manual 2,
Secdon 3.9.2). e incluye la toma de tres muestras de plasma para los laboratorios de
Ifpidos y hemostasia: dos muestras de suero para el laboratorio de hemostasia y el
laboratorio dental; y una muestra opdonal para un laboratorio local de hematologfa.
Ademas, se reali za una segunda venipuntura a los participantes elegibles para la
PTG (Prueba de tolerancia a la glucosa, Oral Glucose Tolerance Test, en ingles). La
extracdon de sangre postbebida de glucosa debe OCLI rrir dos horas despues (mas 0
414 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
menos 10 minutos) de la administraci6n de la bebida de glucosa. EI incumplimiento
de estos criterios puede afectar los valores de vadas medic iones (por ejemplo. Ifpi-
dos, glucemia) y comprometer SlI valor para el est udio. Los participantes del ARIC
deben (ambitn abstenerse de fumar y de reali zar esfucrzos ffsicos vigorosos antes de
la visita al centro clfnico. Ella se debe a que fumar pucde afeclar los eiectrocardio-
gramas 0 la presion arterial y a que la act ividad vigorosa pucde acrivar la fibri n6lisis
y alt erar los niveles sangulneos de IPA y FPB8. Los entrevistadores se entrenan para
expl icar la importancia de la adhesi6n a estas restricciones. Cuando los centros clfni-
cos coniacian con los part id pantes antes de su dla para recordarl es sobre la visita ya
programada, les repiten estas instmcciones .
EI centro coordinador anali za los datos del estudio con reladon a la infonnad6n
sobre el tiempo de ayuno y el tiempo transc urrido desde que fumo y reali z6 ejer-
cicios fuertes, descompart imentados por el centro clfnico, para ob{ener cada mes el
nli mero y porcentaje de panicipantes en cada centro cl fnico que no cumplen con
estas restricdones.
4. Mantenimiento de la suficiencia
Para mantener su suficiencia. se pide a los tecnicos que realicen eXlracciones de sangre
y las procesen por 10 menos una vez cada semana (u ocho veces cada dos meses). EI
centro coordinador analiza los datos del est udio para comunicar sobre el numero de
veces que los tecnicos recolectan y procesan sangre en los centros clfnicos de campo.
5. Observaci6n peri6di ca
Peri cldicamente (al pri ncipio de cada mes) se observa como reali za todo el procedi-
miento cada uno de los tecnicos del centro clfnico que hace estas {areas. La observa-
cion es realizada por otro tecnico entrenado 0 por un supervisor, quien ut ili za una
!isla de control delall ada para verificar que el tecnico cont inua respetando todas las
partes del protocolo de ARIC. AI Il evar a cabo esta observad6n, tambicn se reali za
una revisi6n del protocolo para las personas que hacen la observaci6n. (Vease el
Manual 7 de ARIC para mas detalles, y una copia de la Lista de control para la cer-
dficad6n del procedimiento de venipuntura y su procesamiento). ESla !ista de con-
trol tambien se utiliza por los moni(Qres del centro coordinador al hacer las observa-
ciones de control. La identidad del observador y del observado se registran en la
Lista de control para la certificad6n del procedimiento de venipuntura y su proce-
samiento de ARI C. Tambien se registran en el <<l nfonne sobre el uso de la li sta de
control para la observacion y el equipamiento que se envfa por correo al centro
coordinador al final de los meses enero y j uli o.
6. EI formulario de laboratorio
Para evitar errores de ident ificacion consistentes en que la informacion correspon-
diente a las muestras de un panidpante dado se escriben de manera incorrecta, el
(ecnico debe lIenar cada Fonnulario de labora(Qri o (LAB B) a medida que se
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD... 415
eXlrae la sangre, verifi cando el numero de identi fi caci6n de la hoja que acompafia al
part icipante.
7. Datos replicados de control de calidad
EI sistema de extraer tubos adicionales de sangre para el anal isis de control de cali -
dad (CC) replicado se explica claramente en eI Manual 7 de ARIC. En esre sistema
se obt ienen tubos de sangre adic ionales especificados para cieno numero de part i-
cipantes que se emparejan con un partic ipante fantasma>, por semana. La muestra
de sangre post-bebida de glucosa se designa como el tubo numero 6 en el fonnu lario de
identi fi caci6n del panici pante fantasma y del no part ici pante. Vease lambien en el
Capitulo 2 del Manual 12 para acceder a una expl icaci6n de este sistema fantasma
de control de calidad.
Las personas que no estan en ayunas y soli citan ser reprogramados para olra
eXlraccion de sangre nunca deberfan usarse como fantasmas de sangre para el
control de cali dad .
La estaci6n de extracci6n de sangre del centro cl fnico mantiene un programa
sobre que tubos deberfan extraerse para operar como fantasmas cada dfa (vease el
Manual 7 de ARIC) para ayudar a que encajen los conj untos fantasmas del CC den-
lro del flujo de Irabajo y lograr que sea faci l mantener un seguimiento de 10 que se
requiere. EI centro coordinador revisa cada mes, descompart imentado por el centro
cl fnico, el numero de formu larios de CC fantasmas para los cuales se indica extrac-
cion de sangre. Si los centros cl fnicos de campo fall an en proveer conjuntos sufi-
cientes de sangre fantasma para CC, eI centro coordinador contacta con esos centros
para di scuti r eI problema. Con el fi n de reducir el riesgo de rotular un tubo fantasma
de sangre para CC con el numero de identi ficaci6n incorrecto 0 registrar el parea-
miento incorrecto entre un numero de identi fi caci6n fantasma y el de un panici pante
en los Formul arios del panicipante fantasma para el CC, la sangre para el CC se
obt iene de no mas de un miembro de cada par de part ici pantes para los cuales la san-
gre se procesa en conj unto. Para ayudar a asegurar que se ha registrado el parea-
miento correcto entre el numero de identi ficaci6n del panic ipante real y el numero
de identifi caci6n fantasma para el CC, en cuanto se ha completado una extracci6n de
sangre se Ie afiade una eriquela de ident ificacion para el panici pante real al espacio
apropiado en el formul ario de identi ficacion del panic ipante fantasma y el no part i-
cipante en la hoja fantasma para el Cc.
8. Amllisis de los datos de venipuntura y procesamiento
para control de calidad
EI centro coordinador anali za los datos del esrudio anualmente para determinar las
frecuencias de tiempo de llenado. el numero de intentos de pi nchado y la presencia
comunicada de hem6li sis, y los marcadores seleccionados de falta de adhesion al
protocolo durante la flebotomfa y/o el procesamiento de especfmenes en ellaborato-
rio del centro clfnico. Estos analisis incl uyen tablas del centro cl fnico segun el
numero de identi fi caci6n del tecnico que reali za las exlracciones de sangre 0 su pro-
cesamiento. (Los estandares del tiempo necesario para varios pasos del procesa-
416 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
miento se dan en el Manual 7 de ARIC). La adhesi6n a la ventana de la extracci6n de
sangre de dos horas postbebida de glucosa se eva!li a carla cuatro meses y se comuni-
ca a los centros cifnicos de campo.
9. Muestras de paquetes para el embarque a los laboratorios
Todos los viales de mucstras de sangre, as! como las bolsas de phistico en las que
las muestras de un part icipame dado se empacan para embarquc a los vari os labo-
ratorios, se rOlulan con la ident ificaci6n del participante. Una !isla de embarquc se
adjunta a cada embarque para los laboratorios centrales en la eual se consigna la
identificaci6n para {Odos los conjuntos de muestras que se adj untan. La persona
que desempaca estas muestras en los laboratorios cent rales veri fica que los nllme-
ros de identificaci6n en los viales concuerden con el numero de identificaci6n en
las bolsas de plastico y controla ambas comparando con la li sta de embarque. Si se
detecta cualquier discrepancia, el laboratorio central contacta al centro clfnico
para resolver el problema.
Los viales de sangre embarcados hacia los laboratorios centrales deben ser empa-
cados seguramente para evit ar el calentamiento y la rotura. Instrucciones completas
para el empacamiento de las muest ras se especifican en el Manual 7 de ARIC, sec-
ciones 5.1 -5.3 . Los laboratorios vigi lan la condici6n de arribo de las muestras envia-
das de cada centro clfnieo. Si se encuentran problemas, los laboratorios notifican a
los centros clfnieos de campo involucrados. Si cierto patr6n de dana de las muestras
se hace aparente, 10 que sugiere la necesidad de modificar los materi ales utilizados
para embarcar las muestras 0 para empacarlas (por ejemplo, filtraci6n excesiva de un
cierto tipo de vial) . el subcomite del laboratori o adopta la accion apropiada.
Las muestras de sangre de ARIC se envfan por correo rapidamente a los laborato-
rios centrales al inic io de la semana despues de que son extrafdas. Los laboratori os
Bevan el control de las fechas de la extracci6n de sangre en las muestras que reciben
y not ifican al centro clfnico y al centro coordinador si reciben muestras que fueron
embarcadas en una fecha mas tardfa de la que debfa hacerse en este programa.
(Nora: los tubos fantasma de sangre para el CC se envfan una semana antes del
embarque, pero la fecha de la extracci6n de estas muestras que se comunica al labo-
ratorio se alt era para enmascarar su ident idad como control de caUdad). Los centros
clfnicos de campo deberan telefonear a los labora{Qri os centrales para notificarl es si
hay un embarque en un dfa que no sea ellunes.
Para evitar demoras en el transi{Q hacia los laboratorios que podrfan causar que las
muestras se recalienten 0 deshielen durante el embarque, todas las muestras se embar-
can por un servicio que demora un dfa. Para evitar demoras en los fines de semana 0
los dfas feri ados al entregar las muestras 0 al moverlas al congelador del laboratorio
central, una vez que han sido entregadas al area de recepcion, todas las muestras se
embarcan al pri nci pio de la semana de trabajo, lunes 0 martes. Los laboratori os notifi-
can al centro coordinador y al centro clfnico si un embarque de los que se recibe fue
embarcado un dfa despues en la semana, y eI centro clfnieo comunica al centro coor-
dinador las razones para esta desviaci6n del protocolo. Los labora{Qrios not ifi can a los
centros clfnieos de campo si reciben tardiamente los conjuntos de muestras. Si se
encuentra un patr6n de demoras con eI servicio de entregas ut ilizado por un centro cl f-
nieo, el centro clfnieo debe cambiar a un servicio de entrega alternat ivo.
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD... 417
10. Descripci6n de la recolecci6n y del procesamiento de orina y medidas
relacionadas para el aseguramiento de la calidad y el control de la calidad
Oespues que un part ici pante es recibido en la clfnica, se Ie pide que provea un espe-
cimen de orina a conveniencia del part ici pante (por ejemplo, cuando el partici pante
expresa la necesidad de orinar) . Cuando el part ici pante esta li sto para orinar, se Ie
provee de una taza para especimen (et iquetada con la ident ificaci6n del partici pante
y el tiempo de orinar), y se Ie instruye que ha de lI enar la taza si es posible. Si la
muestra es insuficiente para complerar el procesamiento se Ie pide al panicipante
que orine de nuevo en un contenedor li mpio antes de dejar el centro clfnico. Antes
del procesamiento, eI tecnico recoge, en el formul ario de laboratorio del panic ipan-
te, si se obt uvo una muestra de orina, el tiempo de recolecci6n de la muestra de ori-
na inicial (si hay mas de una), y cU:ln adecuado es el volumen de orina recogido.
11. I'reparaci6n de las muestras para control de calidad
Las instmcciones siguientes descri ben las adic iones espedficas a los protocolos de
recolecci6n y procesamiento de orina para que cumplan con los requerimientos del
control de cali dad . Estas instmcciones suponen que se eslan siguiendo los procedi-
mientos normales para recoger, procesar y embarcar las muestras de creatinina y
albumina (vease Manual 7, Secci6n 6.0-6.3) .
12. I'rograma del control de calidad de la orina
EI programa de visita 4 para las muestras del control de calidad para orina es parale-
10 al protocolo de muestreo para eI control de calidad de sangre: un mfnimo de una
muestra se requiere cada semana. Los especfmenes deberan tomarse del primer par-
tic ipante que provee orina suficiente 0 bien manes 0 bien j ueves. Si ningun panic i-
pante ni el martes ni el j ueves provee una cantidad suficiente, debera seleccionarse el
primer part ici pante que haga esto el miercoles 0 el viernes.
La recolecci6n de muestras de orina para control de calidad ha de anadirse a la li s-
ta de control semanal mantenido por los tecnicos de veni punt ura del centro clfnico.
Tal como con las muestras de sangre para CC, debe revisarse cada muestra de orina a
medida que se prepara. Por la manana, el miercoles 0 el viernes, se consulta la li sta de
control para determinar si todavfa se necesita una muestra adicional de orina.
13. Requerimientos de control de calidad de la muestra
EI especimen de orina de cada panici pante se divide en tres tubos de muestras sepa-
rados y se congela en los centros c1 fnicos de campo hasta el embarque. Las alfcuotas
para creat inina y albumina de cada participante (3,5 mL cada una) se embarcan al
centro clfnico de Minneapolis de ARIC. EI mho c6nico de 50 mL ( I por panic ipan-
418 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Ie) para los metabolitos de la hemostasis, se embarca hacia ellaboratorio de hemos-
tasis de ARI C; este tubo ha de contener un minima de 40 ml. Cuando el programa
avisa para la recolecci6n de muestras de control de cali dad (fantasma) para creatini-
na y albli mina, la taza del especimen del partici pante debe contener por 10 menos 54
ml (14 ml para un total de 4 viales de 3,5 ml y una muestra de hemostasia de 40 ml).
Para un fantasma del laboratorio de hemostasia se necesitan 87 ml (7 ml para dos
viales de 3,5 ml y dos mucstras de 40 ml para hemostasia) .
14. Formularios de lahoratorio y fantasma
Para asegurar que el apareamiento correcto se registra entre la identificaci6n de un
partic ipante real y la ident ificacion del fantasma del CC, tan pronto como pueda eva-
luarse que se ha provefdo de suficiente orina para una muestra del control de calidad,
se Ie aftade una etiqueta de identi fi caci6n a la ident ificacion real del part ici pante en
el espacio apropiado del formul ari o del partic ipante fantasma y del formu lario de
identificaci6n del no panicipante.
Para evitar errores en la identi fi caci6n en los cuales la informaci6n con relacion a
la muestra de orina de un part ici pante se introduce en el formul ari o incorrecto, el
lecnico debera comenzar ll enando la Seccion MUESTRA DE ORINA del formu lari o del
laboratorio para el nli mero de identificaci6n del fantasma en el mismo momenta que
se complela la Secci6n lI.1UESTRA DE ORINA del panicipante en este formul ario.
15. I'reparaci6n de la muestra
Cuando los espedmenes de orina fantasma para creatinina y albli mina se van a prepa-
rar, se requieren un lotal de 4 viales de a](cuotas de 3.5 ml. Dos viales se rot ulan con la
identificaci6n del partici panle y los dos restantes con la identificacion del fantasma.
Los dos viales espedmenes de CREATININA y los dos de ALBOll.llNA se distinguen
por el color de las tapas: AMARILLO para CREAT1N1NA, y AZUL para ALBOMINA. Los crio-
viales de creatinina para el partici pante y el fantasma se llenan primero por el tecnico
de laboralOri o. Entonces se ejecllla el procedimiento para el balanceo del pH de la
muestra para alblimina (Manual 7. Seccion 6.1.2), y se pipelea el especimen de pH
balanceado dentro del criovial del partici pante y del fantasma.
El especimen de orina fanta.>;ma para hemostasia se prepara en el mismo momento
y de la misma manera que la muestra de orina para hemostasia del panici pante.
16. I'rocedimiento para muestras pequefias
Para prop6sitos de control de calidad el par de mueslra.>; de orina para creat inina. albu-
mina y hemosta.>;ia del fanta.>;ma y participante, deben provenir del mismo conjunto de
muestras. Si un solo conj unto es inadecuado para las muestras del participante y del
fantasma, entonces los espedmenes deberan combinarse antes de extraer las muestras.
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD... 419
17. lnstrucciones de almacenamiento
Las instrucciones de almacenamiento (Manual 7, Secci6n 6.2) estipulan que las
muestras deben empacarse en el orden de la fecha de extracci6n, poniendole a cada
participante dos especfmenes (CREATININA Y ALBUMtNA) uno al lado del otro en la
fila . Como los especfmenes del fantasma y el participante se extraen en la misma
fecha, probablemente estara.n en la misma fila , posiblemente al lado uno del otro.
Registre el numero de la casilla y de su posicion en el fonnulario de laboratorio
del participante. y asegurese de hacer 10 mismo para el fantasma .
Finalmente registre los numeros de ident ificacion de todos los participantes y los
fantasmas en cada casilla de un formulario de registro para las casillas.
18. Aseguramiento de la calidad y control de calidad
Ademas de una recertificaci6n anual autorizada por el laboratorio de hemostasis, la
adhesion al protocolo en la reali zaci6n de cada procedimiento se reali za por 10
menos dos veces por ano por el tecnico jefe, y anualmente por los monitores de cen-
tros clfnicos de campo del centro coordinador. Las desviaciones del protocolo y las
posibles acciones rect ificadoras se discuten con los coordinadores del estudio y con
el equipo de trabajo en ese momento. Las grandes desviaciones se Bevan al comite
de operacion de la cohorte.
EI centro coordinador producid reportes basados en datos replicados de los labo-
ratorios. Los resultados de estos reportes se examinaran por el comite de control de
calidad y se implementaran las acdones correctivas recomendadas . EI centro coordi-
nador proveera al comite de control de cali dad y a los centros clfnicos de campo un
infonne basado en los datos del procedimiento recogidos en el formu lario de labora-
IOrio. Este informe evaluara los datos con respecto a su consistencia y para valores
falt antes y fuera de rango.
APENDICE E
Calculo del coeficiente de
correlaci6n intraclase
El coeficiente de correlaci6n intraclase (eel) es la fracci6n de la variabilidad exhi bi-
da por el factor medido que se debe a las diferencias entre individuos (vease Capftu-
108, Secci6n 8.4.2). En este apendice se describen dos alt ernativas para el c6mpulo
del CCI: la pri mera se basa en el analisis de la varianza (ANOVA)(l) y la otra en lIna
f6rmula simpli ficada expucsta por Deyo et ul .(2). Ambas tecnicas se ilustran emple-
ando como ejemplo la fiabilidad entre puntajes procedentes del control de caUdad
del Estudio de la Salud del Coraz6n y el Suefio (Sleep Heart Health Stutiy. SHHS)
(vease Capitulo 8, Tabla 8.20).
ANALlSIS DE LA VARIANZA
Para aplicar un ANOVA a un conjunto de observaciones replicadas (por ejemplo, los
datos correspondientes al estudio de fiabilidad del Indice a Apnea Hi poapnea. IAH.
de la Tabla 8.20) los datos necesarios deben ser organizados de modo que lotios los
valores del iAH (de ambos conj untos de observaciones replicadas) esten contenidos
en una unica variable. Las variables indicadoras adicionales denotan el ident ificador
para el numero del estudio y el evaluador. As!. en este ejemplo, los datos pueden
arreglarse para un wtal de 60 observaciones, como sigue:
Estudlo N."
2
2
3
3
29
29
30
30
Evatuador
A
B
A
B
A
B
A
B
A
B
IAH
1,25
1,38
1,61
2,05
5,64
5,50
2,09
2,35
11,09
9,25
422 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Un enfoque si mil ar se emplea para organizar el Indice de Despertares (10), tam-
bien mostrado en la Tabla 8.20.
Un analisis de la varianza de estos datos puede concretarse empleando cualquier
paquete estadfstico estandar. Cuanda se emplea SAS, Versi6n 6.1 2 (SAS Institute,
Cary, NC), se obtiene la siguiente tabla:
Para IAH:
Cuadrado medlo
Fuente de Suma de Grados de
var laclon cuadrados (Sel libertad (gl)" SC/gi Rot ul o
Observador 2,023 2,023 eMO
ESludio 2.477,991 29 85,448 CMEst
Error 7,169 29 0,247 eME
'Grados de li bertad: Para obs9rvador, h1. donde k as 91 numero de voces que se hace cada observacoo; para
estudio, n- I, doooe n as el numero de ooservadones; Para el error, (k - 1) ~ {n - 1}.
Para 10 :
Cuadrado medlo
Fuente de Sumade Grados de
varlaclon cuadrados (SC) IIbertad (gl)' SC/gi Aotulo
ObseNador 166,010 166.010 eMO
Estudio 4.436.759 29 152.992 CMEst
Error 1.087.749 29 37.509 eME
'Grades de libertad: Para observador. Jr. 1 , donde Jr es el numero de veces que se hace cada observaci6n; para
esrudio. n - 1. donde n es el numero de observaciones; Para el error. (I< - 1) (n - 1).
En estas tab las, observador alude a la variabil idad debida a la persona que
mide en eSle ejemplo (0 al conjunto especffico de lec{uras repetidas en un es{udio de
fiabi lidad del observador) y estudio, se refiere a la variabilidad relacionada con el
partic ipante, estudio, 0 especimen que esta siendo repet idamente estudiado, lefdo, 0
detenninado.
La f6rmula para el dlcul o del CCI es(I ):
CME,,- CME
C C I = ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ = c
CME" + CME (k - 1) + (CMO - CME)/n
donde k es el numero de lecturas repetidas (por ejemplo, 2 en el ejemplo) y /I es el
ntl mero de estudios individuales 0 especfmenes examinados (por ejemplo, 30 en el
ejemplo).
Aplicando esta formula a los datos, se obtienen los siguientes result ados:
CALCULO DEL COERCIENTE DE CORRELACION INTRACLAslCO
Para IAH:
85,448 - 0,247
CCI
1AH
= -,.,--,-,-,----,-c-e"",c..c'---=:':':'-co----c-cc,,---co- = 0,993
85,448 + 0,247(2 - I) + 2(2,023 - 0,247)/30
Para ID:
CCI
w
= ;c---,,:=== = 0,5 80
152,992 + 37,509(2 - I) + 2( 166,0 1 - 37,509)/30
METODO DE DEYO
423
Una f6nn ul a equi valente descrita por Deyo et a1J2) puede ser aplicada f:kil mente
usando una calculadora de boisili o 0 una hoja de dlcul o estandar. El marco de tra-
bajo para este c6mputo requiere la obtenci6n de diferencias entre los valores (por
ejemplo, puntajes) para cada par de observaciones, como se muestra en la siguiente
tabla tanto para IAH como para ID a part ir de la Tabla 8.20.
IAH 10
ESludio N.
O
Evaluador A Evaluador B Dlferencia Evaluador A Evaluador B Diferencla
2
,
29
"
Media
,
"
1.25
1.61
',M
2.09
11.09
5,748
6.702
44,918
s: desviaci6n estaooa,
1,38
2,05
',,,"
2,35
9,25
5,381
6,386
4o,n7
-0,13
-0,44
0,14
-0,26
1,84
0,367
0,703
0,494
7,08
18,60
20,39
18,66
12,50
17,306
7,682
59,017
8,>6
19,91
25,17
18,02
23,25
20,632
11 ,467
131 ,483
- 1,48
- 1.31
--4,78
0.64
- 10,74
-3, 327
8.661
75,017
La formula de Deyo emplea los numeros mostrados en negnt as en la tabla; vale
decir, la diferencia media (x dif), las varianzas (desviaciones estandar al cuadrado) para
las mediciones de cada evaluador ( .1 A2 Y S 8
2
), Y la varianza de las diferencias (S2dif) :
, , ,
CCI =
+ s1 + x 2dif -
donde /I es el nlimero total de sujetos estudiados (observaciones pareadas) .
424 EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Para los datos del ejemplo:
44,918 + 40,777 - 0,494
CCllAlf = --:-::-::-:,,---'-::==--'::-=::;--'::-==::- = 0,993
44,918 + 40,777 + 0,367
2
- 0,494/30
59,0 17 + 131,483 - 75,017
CCi ID = -",-,-,c:..:=-'--'c"'-'..C""==:':":,,,,= = 0,580
59,0 17 + 131,483 + 3,327
2
- 75,0 17/30
Como puede apreciarse, estos resultados son identicos a los obtenidos lI sando el
ANOYA.
BlBLlOGRAFiA
1. Amlitage P. Berry G. SlaliSlimlmelhods in /IIcdkal researrh. 3.' ed. London: Blackwell.
1994.
2. Deyo RA. Diehr P, Patrick DL. Reproducibility and responsiveness of health statistics
measures: statistics and strategies for evaluation. COli/rolled Clin Trials 1991: 12: 142S
158S.
Ajuste
basado en estratificacion, 224-242
confusion residual. 285-287
ffietodos de regresi6n multiple. 244-284
significado de, 223
sobreajuste , 288
Ajuste basado en la estratificaci6n
ejemplos de, 224-228
directo.229-235
indirecto.235-237
limitaciones de, 242-243
ffietodo de Mantel-Haenszel. 238-242
supuestos basicos en. 228-229
y confusion residual. 228. 243
Ajuste directo. 229-235
ejemplos de, 232
poblaci6n estandar en. 233-234
procedimiemos en. 229-231
usos de, 229-235
Ajuste indirecio. 235-237
pobJaci6n estandar en. 236-237
uso de, 235
AmHisis de cohone de nacimientos. 3.4
AmHisis de cohone edad-periodo, 10-15
AmHisis de sensibilidad. 293
AmHisis de supervivencia
tasa de riesgos instantaneos en. 71.
Vease Incidencia aL'wlllI/ada
AmHisis de varianza, 421-423
AmHisis multinivel. pmp6sito de. 16-17
AmHisis multivariante
para estudios de casos cohorte, 274-
275
para estudios de casos y controles
anidados.273-275
regresi6n logfstica condicional. 271,
273274
u ~ o s de. 223
usos deIU\rmino, 229
y ajuste estadfstico, 223
y eSlUdios de casos y controles
emparejados.271-273
y me!(xios de regresi6n multiple. 244-245
INDICE
Aseguramiento de la calidad. 299-303
componentes de investigaci6n. 298-299,
300
definici6n de. 299
entrenamiento del equipo, 30 1-302
estudio piloto, 302303
instrumentos para la recolecci6n de
datos, 301
manuales operativos, 300
pasos en. 303
pmtocolo de estudio. 300
prueba previa. 302
Asociaciones exposici6n/enfemledad en
estudios de casos y controles. 25-33
Vease Medidas de asochlciol1
Asociaciones no causales. Vease
Confusion
Causalidad inversa. significado de, 140
Coeficiente de correlaci6n
de Speannan. 330-341
intraclase.342343
lineal de Pearson. 246. 338-342
Coeficiente de correlaci6n intraclase
calculo de, 421-424
Coeficiente de correlaci6n lineal de
Pearson, 246, 338-342
limitaciones de, 339-341
medida de validezlfiabilidad, 338-341
Coeficiente de regresi6n
estimaci6n del error estandar. 393-395
interpretaci6n de l a ~ unidades de. 256-257
intervalo de confianza. 284, 393
de Cox. 267
de Poi sson. 270
lineal mUltiple. 253-256
lineaL 249-251
logfstica.259-262
Coeficiente de variabilidad. medida de
validezlfiabilidad.344-345
Cohortes abiertas. 60. 63. 64
Cohortes de nacimientos
en eSlUdios de casos y controles, 15
426 fNDICE
significado de, 5
ubicaci6n gn'ifica de datos de las.
5 ~ 7
efectos de cohone. 8- 15
Veanse EfeclOs de col/one: Amilisis de
cohorte edad.periodo
Cohortes dimimicas. 60. 63, 64
Colinealidad. ejemplo de. 164-165
Comparaci6n pareada. 336
Comunicaci6n escrita. Vease Informes
epidemiolJgicos
Concordancia debida at azar. 330
Confusi6n
comparada con el sesgo. 153.
176-178
condicionaL 178
cualitativa.176
definici6n de, 155
efectos parciales de. 173-174
en estudios de cohone. 155. 157
en estudios observacionales. 156
evaluaci6n de efectos de, 166-173
heterogeneidad basada en. 212-213
negativa, 175-177
positiva, 175-177
regia general de causalidad. 157-161
residua1.36.41. 163.174. 193.
285-287
significaci6n cstadfstica y cvuluaci6n dc.
177-178
y emparejamiento. 35
y prevenci6n.180-181
y sesgo de error de clasificaci6n. 132
Confusi6n residual. 36.41. 163. 174. 193.
285-287
causas de. 285-287
exploraci6n de trayectos causales.
163-164
y estratificaci6n. 228. 243
Y heterogeneidad de efectos. 193
Confusores. en informes epidemiol6gicos,
356
Control de calidad
coeficiente de correlaci6n intraclasica.
342-343
coeficiente de variabilidad. 344-345
componentes de investigaci6n.
298-299
diferencia media. 343-344
estadfstico kappa. 324-335
grafico de Bland-Altman, 345-346
regresi6n lineal. 342
significado de. 297
Control de la calidad. manual de
aseguramiento.300
para la medici6n de la tensi6n arterial.
409-412
para la recolecci6n y procesamiento de
sangre y orina, 412-419
Covariables dependientes del tiempo, 69-71
Cuestionario de Rose, 301
Datos emparejados de casos y controles,
metodo de ajuste de Mantel- Haenszel.
240-242
Densidad de incidencia
en base a los individuos. 59-61
muestreo, uso de, 31
significado de, 58
Desarrollo de hip6tesis, en infomles
epidemioI6gicos,353-355
Desenlace categ6rico dicot6mico
variables. definici6n de. 47
Desenlace, definici6n de, 47
Diagrama de Lexis. 68
dos 0 mas escalas de tiempo, 67-69
una escala de tiempo, 66-67
Diagramas de dispersi6n
como medida de validezlfiabilidad. 336
para relaciones no lineales, 281-283
Diferencia media. medida de
validezlfiabilidad,343-344
Diferencias absolutas
interacci6n aditiva. 186-188, 189-192
situaciones en que se usa. 79
Diferencias relativas
interacci6n multiplicativa. 184. 188-189.
192
situaciones en que se usa. 79
Discusi6n en infonnes epidemiol6gicos.
secci6n de, 354
Diseiio cruzado de casos. elementos de, 35
Diseiio mix to. estudios de cohorte. 25
Diseiios bidireccionales. Vease ESllldios
Caso-cohorle
Ecuaci6n de riesgo logfstico multiple de
Framingham. 263
Efecto de periodo, 9-15
ejemplo de. 9
significado de, 9
y tasas de incidencia, 12
y tasas de prevalencia. 9-10
fNDICE 427
Efectos de Cohorte. 8-15
interacci6n edadl tiempo calendario. 10
definici6n de. 9
amHisis de cohorte edad-perfodo. 10- 12
Efectos de la edad. 4-15
definici6n de. 9
importancia de. 4
y tasas de prevalencia. 4-8
Efectos, medici6n de, 184
Emparejamiento individual, uso dc, 36-37
Emparejamiento por grupos. uso de. 37.
271-273
Emparejamiento.35-42
desventajas del. 39-41
estudios de casos y controles. 36
estudios de cohorte. 36
individual. 36-37
metodo de la mfnima distancia
euclideana.37
necesidad de. 35
por grupos, 37
sobremparejamiento.41
ventajas y desventajas de. 39-41
Encuestas de morbilidad. eSlUdios
transversales.34
Enfoque de Kaplan- Meier. 50
analogfa con tasa de riesgos
instantaneos.73
funci6n de supervivencia. 54
incidencia acumulada basada en. 53-54
probabilidades condicionales en. 53-54
procedimiento en. 53-54
Enfoque de probabilidades condicionales
en el metodo de Kaplan-Meier. 53-54
en tablas de vida. 52
Enfoque de tiempos exactos hasta el
evento. Vease Enfoqlle de Kaplan-
Meier
Entrenamiento del equipo. aseguramiento
de la calidad. 301-302
Epidemiologfa
analftica.3
definici6n de, 3
descriptiva.3
observacional. 4
Epidemiologfa analftica. naturaleza de. 3
Epidemiologfa descriptiva. naturaleza de. 3
Epidemiologfa observacional. naturaleza
de.4
Error de clasificaci6n diferencial. 129- 132
causas de. 129
ejemplos de. 129-132
Error de clasificaci6n no diferencial.
123- 128
con dos categorfas. 124-126
con multiples categorfas. 126- 127
Escala aritmetica. 369-371
Escala del eje de orden ad as. 368-371
Escala logarftmica en el eje de ordenadas.
12.368-371
Escalas de tiempo
covariables fijas y dependientes del
tiempo.39-71
Especificidad
definici6n de. 118
fndice de validez. 313-335
Estadfsticas vitales y tasas de incidencia.
34,72
Estadfstico de Wald. 284. 395
Estadfstico J de Youden
estimaci6n del error estandar. 397
medida de validezlfiabilidad. 320
Estadfstico kappa
aplicaciones de, 325-327
estimaci6n del error estandar. 397-399
interpretaci6n de los valores kappa.
326
kappa ponderado. 327-332
medida de validezlfiabilidad. 324-335
para multiples criterios, 327
prevalencia. dependencia de. 332-335
Estimaci6n del error estandar. 375-377
coeficiente de regresi6n. 250. 393-395
estadfstico J de Youden. 397
estadfstico kappa, 397-399
estimaci6n acumulada de supervivencia.
377-378
odds ralio de Mantel- Haenszel.
391-393
probabilidades ajustadas. 388-390
raz6n de mortalidad estandarizada.
390-391
raz6n de odds. 393-385
riesgo atribuible, 386-388
relativo.379-381
tasas de incidencia. 378-379
Estimaci6n del tiempo de anticipaci6n.
145- 149
Estimacion puntual. 362-363. 376
Estratificaci6n. utilidad de la. 173.223
Estudio piloto, aseguramiento de la
calidad.302-303
Estudios Concurrentes. estudios de
cohorte.25
428 fNDICE
Estudios de casos y controles anidados.
29-33. Vease ESllldios mso-L"ollOrle
amHisis multivariante. 274-275
muestreo basado en densidad de
incidencias, 101-102
Estudios de casos y controles bas ado en los
casos,26-29
amHisis multivariante, 274-275
controles. selecci6n de, 30-31. 100-101
estrategia de casos y no casos, 99- 100
estudios de casos-cohone. 29-33
odds ratio. 97-102
rasgos de, 26-27
selecci6n de 1a poblaci6n, 27-28
sesgo de selecci6n, 28
situaciones para el uso, 32-33
transversalidad de, 26-27
ventajas de, 9899
Estudios de casos y controles emparejados,
anal isis multivariante. 271-273
Estudios de casos y controies, 25-33
comparaci6n de efectos conjuntos
observados.198-203
comparado con los estudios de cohone.
25-26
disefio de casos y controles anidado.
101
emparejamiento.36
estudios de caso-cohorte. 29-33
estudios de casos y controles basado en
los casos. 26-29
f6mlUla del riesgo atribuible de Levin,
91
homogeneidad de efectos. 196-197
interacci6n. evaluaci6n de. 195-203
odd .. ratio. 25. 26. 92-102
rasgos de. 25-26
regresi6n logistica multiple. 264-265
riesgo atribuible. 102-103
sesgo de recuerdo. 119-120
de selecci6n, 112-117
de vigilancia medica. 110, 134-136
del entrevistador. 120- 122
del observador. 122
Estudios de cohorte, 2 1-25
comparado con los estudios de casos y
o,;ulLlrult:s.25-26
disefio mixto. 25
emparejamiento.36
eSlUdios concurrentes, 25
estudios no concurrentes, 25
interacci6n. evaluaci6n de. 193-194
medidas de asociaci6n en. 79-92
regresi6n logfstica multiple, 259-263
selecci6n de la poblaci6n. 79-82
sesgo de selecci6n, 112-117
de vigilancia medica, 134-136
del observador, 122
del que responde. 123
tabulaci6n cruzada de la exposici6n. 80-81
Estudios de fiabilidad, 307-313
limitaciones de, 312
para actividades de recolecci6n de datos,
311
para determinaciones de laboratorio.
312
y fuentes de variabilidad. 310-311
Estudios de validez. 304-309
auto-informes de, 307
como estudios previos, 307
imponancia de. 307-309
limitaciones de, 308-309
mezclas estandarizadas para mediciones
de laboratorio, 303
procedimientos que son estandar de oro.
305,306,307.309
solo para respuestas positivas, 306
Estudios ecol6gicos, 4, 15-20
analisis multiniveL 17
como estudios preliminares, 18
ejemplos de, 17- 18
inferencia a traves de niveles, 18-19
medidas agregadas. 15
ambientales,16
globales,16
procedimientos en. 15-20
regresi6n lineal. 251
Estudios no concurrentes, estudios de
cohorte,25
Estudios observacionales. confusi6n en.
155-156
Estudios transversales, 33-34
asociaciones medidas en. 92
encuestas de morbilidad. 34
rasgos de los, 33-34
raz6n de tasas de prevalencias punlllales.
92
sesgo de incidencia - prevalencia,
136-139
temporal. 139- 141
y asociaciones con la edad. 4
Evaluaci6n de la interacci6n
comparaci6n de efectos conjuntos
observados. 189-192
fNDICE 429
en eSludios de caws y contmles. 195-
203
decohone.193-194
homogeneidlld dc efeclos. 184- 189
interacci6n adili va. 184. 186. 189- 192.
198-200
interacci6n multipl icativa. 184. 188. 192.
20 1-202
sc lecci6n de modelos para. 204-206
E" cnlo
definici6n de. 48
e incidencia. 48
ejcmplos dc. 49
probabihdad de. oosado en intervalo.
51-52
y preva lencia. 48
Exposici6n. y confusi6n. 160- 166
Faclores de riesgo
exploraci6n con interacci6n. 216-2 18
enfoque reduccioni sta . 19
Faclores de ricsgo emerge nles. interacci6n
y busqueda de. 216-218
Faclorcs del hucspcd. e interprclaci6n de la
interacci6n,2 15-2 16
Falacia ccol6gica. dcfinici6n de. 17
Falsos positivoslfal sos ncgalivos. 315
Fen6mcno de umbral . 277
Fiabilidad
definici6n de . 118
signi ficado de. 297
vari abi lidad. de. 309-311
F6mlUia de Greenwood. 377.386
Fracci6n de exceso. como riesgo atribuible,
85
Fracci 6n eliol6gica. como riesgo
alribuibl e.85
Frecucncia de desenlace. Vease
OClirrellcia de enjerlll e(/ad
Fuer.la de morbilid,ld y de mortalidad.
Yease rasa de riesgos
Funci6n de supervi vencia . yea.'iC
SlIlJefvi \'encia (lellllllllada
enfoque de Kaplan-Meier. 54
Funci6n lineal. elementos de. 246
Gr:i.fico de Bhmd-Ahman. Medida de
valide71fi nbi lidad.345-346
Gr:i.fico de correlaci6n, Vease Diagramas
lie llislJersitm
Grupo control
estudios de caso-cohorte, 30-32,
97-99
selecci6n de control es basada en los
casos. 115-1 16
Heterogeneidad de efeclos
interacci6n basada en, 183- 184
significado de, 183- 184
Hip6tesis nu la, prueba de. 376
Homogeneidad de estimados
estrmificados. pmeba de. 406
Incidencia
definici6n de. 47
y odds. 82-83
y prevalencia. 73-75
Incidencia acumulada. 49-58
ausencia de lendencia secular. 57
censura y supervivencia. supuesto de
indepcndencia.55-58
para el enfoque Kaplan- Meier. 53-54
pard tabl as de vida. 5 1-53
probabi li dad acumul ada de
supcrvivencia.52-54
probabilidad acumulada del evento.
5 1-52,54
probabi lidad conjunla de supcrvivcncia.
52
unifonnidad de cvcntos y en. 55
Independencia enlre ccnsura y
supeTYivencia.55-57
Indi viduos en riesgo, incidencia basada en.
49-58
Indi viduos,esludios de.
bas ado en densidad de incidencia. 60-61
di seiio de caso cruzado. 35
emparejamienlo, 35-42
esludios de casos y conlrol es. 25-33
esludios de cohortc . 21-25
estudios transversalcs . 33-34
Inferencias. en informcs epidemiol6gicos.
360-364
Inronnes epidemiol6gicos
categorizaci6n de vari ables
continuasiordinales.357
confusorcs. razones para elecci6n dc.
356
datos no modeladosJparsimoniosamcntc
modcladosltolalmcnlc modclados.
357-358
430 fNDI CE
estudios objetivos, 353355
evaluaci6n de interacci6n. 358
hip6tesis. desarrollo de, 353-355
inferencias presentadas en. 360-364
introducci6n.354
legihilidad de, 359-360
presentaci6n concisa en. 358-359
procedimientos de recolecci6n y validez
de datos. 355-356
secci6n de discusi6n. 354
secci6n de resultados. 354
tablas.364-366
Interacci6n
antagonista, 183
cualitativa.207
cuantitativa, 207
condiciones para la ocurrencia de,
183
definiciones de, 183-184
falacia de interacci6n. 196
homogeneidad de efectos. 184
intercambiabilidad de las definiciones.
203-204
medici6n de efecto. 184
para hallar nuevos factores de riesgo,
216-218
prueba estadfstica para, 211
pruebas de homogeneidad. 405406
reciprocidad de, 208-209
si nergica.183
y confusi6n. 209-210
y representatividad de las asociaciones.
218
Interacci6n aditiva, 184. 186.190,192
detecci6n de. 186. 190-192. 198-200
presencia de, 186
y emparejamiento. 39-40
Interacci6n antag6nica. significado de,
183
Interacci6n cualitativa207
Interacci6n cuantitativa. 207
asociaciones aleatorias. variabilidad
aleatoria y confusi6n. 161
y heterogeneidad. 211-2 12
Int eracci6n multiplicativa. 184. 188.
192
ut:lt:(;d(m ut:.l88-189. 192. 20 1-202
Int eracci6n negativa y asociaci6n debil,
216-2 t 7 Vease II1 /eracciol1
af1lagonista
Interacci6n sinergica. significado de.
183
Intercepto
regresi6n lineal. 247-249
logistica,262
utilidad del, 249
Interpretaci6n de la interacci6n, 211-216
heterogeneidad procedente de intensidad
diferencial de la exposici6n. 214,215
heterogeneidad procedente de la
confusi6n. 212-213
heterogeneidad procedenle de la
variabilidad aleatoria. 212
heterogeneidad procedente de sesgo.
214
y factores del huesped. 213-214
Intervalo de confianza, estimaciones de.
284.375-377
Introducci6n. informes epidemiol6gicos.
354
Kappa ponderado. 327-332
Legibilidad. de informes epidemiol6gicos.
359-360
Log odds, 259, 265
Logit.259
Medidas agregadas. estudios ecol6gicos. 15
Medidas ambientales. estudios ecol6gicos.
16
Medidas de asociaci6n
diferencias absolUlas, 79
relativas,79
en eSlUdios de casos y controles. 92-103.
102,103
en eSlUdios de cohorte. 79,92
en eSlUdios transversales. 92
fuerza de las asociaciones. evaluaci6n
de. 103,105
odds ratio. 81,85. 92- 102
raz6n de riesgos. 80,81
riesgo atribuible, 85-92
relativo.81
Medidas globales. eSlUdios ecol6gicos. 16
Metodo de ajuste de Mantel, Haenszel.
204.238-242
dikulu dod odd.\' ((1I;u.238-239
odds ratio. estimaci6n del error estandar.
391-393
para datos emparejados en estudios de
casos y contmles. 240-242
raz6n de tasas ajustadas. 240
fNDICE 431
Metodo de Deyo, 423-424
Metodo de la mfnima distancia euclideana,
uso de. 37
Metodo de maxima verosimilitud. 284
Metodo de mfnimos cuadrados. 247
Metodo ordinario de mfnimos cuadrados.
284 Vease Metodo de mil1imos
cuadrados
Metodos de regresi6n multiple
metodo ordinario de mfnimos cuadmdos,
284
regresi6n de Poisson, 269-270
lineal, 244-257
logfstica multiple, 258-265
usos de. 244, 263, 292-293
Mezclas estandarizadas. estudio de validez.
305
Modelo de riesgos proporcionales de Cox.
265-269
raz6n de riesgos instantaneos. 268
supueslOs basicos en, 265-266
usos de. 265, 268-269
Modelo lineal general, 244
Modelo log-lineal, 269
Modelos estadfsticos
conceplO.288-291
selecci6n del modelo. 292-293
tipos de. 228-229
Modelos Jer:\rqulcos, 2U Vease Antilisis
Mli/linive/
Modelos. Vease Mode/os eSladislicOJ
Modificaci6n de efeclOs, uso del tennino.
183.184,185. Vease Inleracion
Modificador de efectos. 183. 184, 185
razones para usarlo. 184-186
Muestreo a !raves de conjuntos de riesgo,
usode.31.273
Muestreo basado en densidad de
incidencia, diseiio de casos y
comroles anidado. 101
Niveles de exposici6n, heterogeneidad
basada en, 214-215
Observaci6n. vigilancia del control de
calidad.3303,304
Observaciones
multiples observadores. 122. 327
observaciones censuradas. 49,53
Observaciones censuradas
en incidencia acumulada. 49-53. 55
razones para la censura. 55-57
Ocurrencia de enfennedad
odds. 75,76
tasas de incidencia. 49-73
tasas de prevalencia, 73-76
Odds. 75-76
definici6n de. 75
odds basados en prevalencias, 75_76
represemaciones numericas para, 76
y calculo de probabilidad. 75
y odds ratio. 93
Odds absolutos. 93
Odds basados en prevalencias. 75
Odds ralio de probabilidades. Vease Odds
ralio
Odds ralio emparejados. 96. 240-242,
271-273
Odds ralio. 81-85. 92-102
como aproximaci6n del relativo riesgo.
83-85
e incidencia. 82
en estudios emparejados de casos y
controles, 96. 236,242. 271-273
estimaci6n del error estandar.
383-386
estimaci6n del riesgo relativo, 83-85.
'}6-IUU
estimaciones con regresi6n logfstica.
259,261
estudios de casos y controles, 25, 26.
92-102
exposici6n multiple. 102
odds absolutos, 93
odds ralio ajustado de Mantel-Haenszel.
238,242
probabilidades y. 81-82
sesgo inherente, 84
ventajas de. 84
y raz6n de produclOs cruzados. 81 . 93
Patr6n dosis respuesta. prueba para.
401-403
Pendiente. coeficieme de regresi6n.
247-251
Perdidas administrativas. 57
Perdidas del seguimiento
supuestos relacionados con. 55,57
tipos de. 55,57
y sesgo de selecci6n. 57, 117
432 fNDI CE
Perdidas diferenciales en el seguimiento,
117
Poblaci6n
estandar. 233-234. 236-237
se lecci6n en estudios de cohorte.
79-80
Poblaci6n estandar de minima varianza.
234
Poblaci6n estandar
de minima varianza. 234
y ajllste directo, 233-234
indirecto.236-237
Porcentaje de concordancia
limitaciones de, 322-323
medida de validez lfiabilidad.
320-324
posit iva. 324
positiva de Chamberlain. 324
procedimiemos de estadfstica
inferencial.395-396
Predicci6n, y metodos de regresi6n
multiple, 244. 262-263
Prevalencia.48
definici6n de, 48
efectos sobre kappa, 332335
evento en. 48
Prevalencia acumulada a 10 largo de la
vida . si);:nificado de, 74
Prevalencia de perfodo
prevalencia acumulada a 10 largo de la
vida.74
significado de, 73-74
Prevalencia puntual. 73-75
significado de. 73
Prevenci6n
necesidad de evidencias. 180-181
primaria. 181
secundaria. 181
Prevenci6n primaria
necesidad de evidencias. 180, 181
significado de. 181
Prevenci6n secundaria
necesidad de evidencias. 180-181
significado de. 181
Probabilidad de evento basado en
intervalo. 51-52
Probabilidad. V ~ a n s e Odds: Odds rwio;
Incidencia ael/lIIl1lada; 511pervi vencia
aL'unllllada
diferencia ajustada. estimaci6n del error
estandar.388-390
yodds,81-82
Procedimientos de recolecci6n de datos
aseguramiento de la calidad. 301
validez y fiabilidad. 355-356
Procedimientos que son estandar de oro,
estudios de validez. 305. 306, 307,
309
Protocolo del estudio, aseguramiento de la
calidad.300
Prueba de raz6n de verosimilitudes. 284
Prueba de tendencias multivariante, 404
Prueba previa, aseguramiento de la calidad,
302
Prueba t pareada. 343-344
Publicaciones, supuestos de validez de.
149
Raz6n de densidades de incidencia. Vease
R{Jz()n de /{fsas
Raz6n de prevalencia estandarizada. 235
Raz6n de probabilidades. Vease Riesgo
re/alivo
Raz6n de productos cruzados y odds ralio.
8!, 92
Raz6n de riesgos, 81. Vease Riesgo
re/alivo
Raz6n de riesgos instantaneos, modelo de
riesgos proporcionales de Cox, 268
Raz6n de tasas
estimaci6n del error estandar. 381-383
regresi6n de Poisson, 270
Raz6n de tasas puntuales de prevalencia,
estudios transversales, 92
Raz6n estandarizada de incidencia, calculo
de,236
Raz6n estandarizada de mortalidad
calculo de, 236-237
estimaci6n del error estandar. 390-391
Reduccionismo, 19
Regresi6n a la media, efectos de,
346-347
Regresi6n de Poisson, 269-270
coeficientes de regresi6n, 270
ecuaci6n para, 269-270
modelo log-lineal, 269
raz6n de tasas. 270
usos de. 269
Regresi6n lineal binaria, 257
Regresi6n lineal multiple, 252-257
coeficiente de regresi6n. 253-256
usos de. 252
Regresi6n lineal. 245-257
coeficiente de correlaci6n lineal de
Pearson. 246
coeficiente de regresion, 249-251
conceptos basicos, 245-248
intercepto, 247-249
medidas de validez lfiabilidad, 342
metodo de maxima verosimilitud, 234
metodo de mfnimos cuadrados.
247.284
para relaciones no lineales. 275-281
prueba estadfstica, 284
regresi6n lineal multiple, 252-257
Regresion logfstica condicional, usos de.
271.274
Regresion logfstica multiple. 258-265
estudios emparejados por grupos. 273
para estudios de casos y controles,
264-265
para estudios de cohone. 259-264
usos de. 258, 264
Y predicci6n de probabilidades,
262-264
Regresion Logfstica. Vease Regresion
log(slica I1lIilliple
Relaciones no lineales
diagramas de dispersi6n para, 281-283
regresion lineal para. 275-281
relaci6n en fonna de L 275-276
variables dummy, uso de, 277-281
Representatividad de asociaciones. e
interaccion.218
Riesgo atribuible. 85-92
como fracci6n etiol6gica. 85
definici6n de, 85
en individuos expuestos, 86-88
estimaci6n del error estandar,
386-388
estudios de casos y comroles. 102-103
expresado en porcemaje. 86-88
interacci6n aditiva. 184, 186
riesgo atribuible poblacional de Levin,
88-92
Riesgo atribuible poblacional. Vease
Cdlclilo del riesgo atribuible
pobladonal de Lel,in
Riesgos instamaneos. Vease Tasa de
Riesgos Inslantdm'os
Riesgo relativo, 80-85
aproximacion a traves del odds ratio,
82-85
estimaci6n del error estandar. 379-381
odds ratio para estimaci6n. 96-100
fNDICE
Secci6n de resultados. informes
epidemiol6gicos, 354
Seguimiento por observaci6n, 303-304
Sensibilidad y especificidad
definicion de. 118
fndice de validez, 313-320
Iimitaciones de, 317-320
pmcedimientos de estadfstica
inferenciaL 395-396
Sesgo
comparado con confusion. 155- 156.
178- 181
compensatorio, 116
de amicipaci6n en el diagnostico,
144- 149
definicion de. 109-110
heterogeneidad debida a. 214
prevencion de. 110
de diluci6n de la regresion. 347
de informaci6n, 111-112, 117- 134
de longitud, 142-144
de publicaci6n. 149-151
433
de razon de complemento de prevalencia
puntual. 137
de recuerdo, 119-120
de seleccion. 110, 112-117
de vigilancia medica. 110. 134- 136
del entrevistador. 120-122
del observador. 122
del que responde. 137
de la raz6n de la duraci6n. 139-141
temporal,159-161
Sesgo Compensatorio, significado de. 116
Sesgo de agregacion. Vease Falada
ecolOgica
Sesgo de anticipacion en el diagn6stico.
144- 149
causa de. 144- 145
Sesgo de Berkson. Vease Sesgo de
seiElxion
Sesgo de detecci6n. Vease Sesgo de
vigi/aflda midiL'a
Sesgo de error de clasificaci6n, 123-134
error de clasificacion diferenciaL
129-131
error de clasificacion no diferenciaL
123- 127
prevencion de. 133-134
y variables de confusion. 132
Sesgo de identificaci6n de la exposicion
de recuerdo, 111,119-120
del entrevistador. 120-122
434 fNDI CE
Sesgo de identificaci6n del desenlace.
Vease Se.tgo de vigilaflcia medica
Sesgode idioma.151
Sesgo de incidencia.prevalencia. 136-139
causas de. 136
de [ongitud.l142. 144
de la raz6n de la duraci6n. 137
ejemplos de, 137-138
para la evaluaci6n de tamizaje.
142-144
prevenci6n de, 139
de la rawn complemento de la
prevalencia puntuaL 137
Sesgode informaci6n.117-134
de error de clasificaci6n. 123-134
derecuerdo.l11.119- 120
temporal. 139- 141
significado de, 110
Sesgo de la raz6n de los complementos de
las prevalencias.l37
Sesgode longitud,142-144
causa de 142-143
prevenci6n de, 142- 143
Sesgo de puhlicaci6n. 149-151
causasde.150-ISI
de idioma. lSI
prevenci6n de, 151
Scsgo de ruz6n de durnci6n, 137
Sesgo de recuerdo. 111. 119-120
causa de, 119
prevenci6n de, 119-120
Sesgo de selecci6n. 112-137
causa de, 112
compensatorio. 116
de incidencia-prevalencia, 136,139
de vigilancia medica. 110. 134-136
ejemplosde.112-115
en evaluaci6n de tamizajes. 141
estudios de casos y controles basados en
los casos, 28
igualamiento de, 115
prevenci6n de. 110
significado de. 137
Sesgo de supervivencia, 156
Sesgo de vigilancia medica. 110.
134_136
causasde.134- 135
prevenci6n de, 135-136
Sesgo del entrevistador. 120-122
causa de, 120-121
prevenci6n de. 121-122
Sesgo del observador .122
causa de, 122
prevenci6n de. 122
Sesgo del que responde, 123
causa de, 123
prevenci6n de. 123
Sesgo inherente. odds ralio. 84
Sesgo temporal. 139-141
callsade,139-140
ejemplos de. 140
prevenci6n de. 140-141
Significaci6n estadfstica
de los coeficientes de regresi6n. 284
e interacci6n. 211
errores comllnes relacionados con.
360-363
evaluaci6n de la confusi6n. 177-178
evaluaci6n del coeficiente de
correlaci6n,339-341
Sobreajuste,288
ejemplo de. 288
significado de. 165-166.288
Sobremparejamiento, 41,288
Sllbcohones,274
Supervivencia acumulada. 49-50, 52-54
estimaci6n del error estandar. 377-378
Tabla de vida actuarial. Vease Tabla de
vida
Tabla de vida. 49-53
duraci6n de intervalos. 52,53
incidencia acumulada basada en. 51,53
tenninos relacionados con. 49-50
Tabla de vida clasica. Vease Tabla de vida.
Tabla dos por dos. 80
Tablas.364-366
altemar denominadores. 366
comparabilidad con otros infonnes. 364
comparaci6n de datos estadfsticos entre
grupos,365
evitar redundancias. 365-366
presentaci6n de datos. 366
r6tulos/encabezamientos.364
unidades.364
Tabulacion cruzada de exposici6n y
enfennedad. Vease Tabla dos por dos
Tasa de riesgos instantaneos. 73
analogfa con enfCKJ.ue de Kaplan-Meier, 73
definici6n de. 73
fNDICE 435
en amHisis de supervivencia, 73
funci6n de riesgos instantaneos,
estimaci6n de la, 73
Tasa, uso del tennino, 4
Tasas anuales promedio, 72
Tasas de incidencia, 47,49-73 Vease
Incidencia aeu/lllliada
comparaci6n de medidas, 71-73
estimaci6n del error estandar. 378-379
cvento en Ins, 48
para individuos en riesgo. 49-58
para unidades personas-tiempo. 58-71
tasa de riesgos instantaneos. 73
tasas anuales promedio. 72
y efectos de periodo. 12
Tasas de prevalencia, 73-75
e incidencia, 74-75
prevalencia de periodo. 73-74
prevalencia puntual, 73-74
y efectos de la edad. 4-8
y efectos de periodo. 9-10
Tendencias
patr6n dosis respuesta, 401-404
prueba multivariante de, 404
Tendencias seculares, ausencia en estudios,
57-58
Una escala de tiempo. 66-67
Unidades personas-tiempo, tasas de
incidencia, 58-71
covariables dependientes del tiempo.
69-71
datos agregados. 59-60
datos individuales. 59-60
densidad de incidencia, 59
ejemplo de eSlUdios. 59
escalas multiples de tiempo. 67-69
estratificaci6n de personas-tiempo)
tasas .65-71
razones para su uso, 58-59
relaci6n densidad/tasa. 63-65
supuestos basicos en, 62-63
Uniformidad de eventos/perdidas. 55
Validez
definici6n de. 118,297
estudios de validez, elementos de. 118
sensibilidadlespecificidad, como fndices
de 313-320
validez de constructo. 286
Validez de constructo. significado de.
286
Valor predictivo negativo. 316
Valor predictivo positivo. 316
Valores predictivos. positivos y negativos,
316
Variabilidad
coeficiente de, 344-345
fuentes de, 310-311
Variabilidad inter-observador. 310
Variabilidad intra-observadores, 310
Variable binaria. Veanse Variables
dholomicas. Variables dllmmy
Variable Dicot6mica. 47
Variables
confusoras,37
continuas.47
de desenlace dicot6mico. 47
Variables categ6ricas ordinales, 281
Variables cominuas
usos de. 47
y emparejamiemo. 41
y estratillcaclon, 242
y regresi6n lineal. 245, 261,267
Variables confusoras
e interacci6n. 209-210
efectos de, 35,155-157
error de clasificaci6n de. 286-287
excesiva correlaci6n con exposici6n,
164-166
y asociaciones aleatorias. 161
y asociaciones exposici6n-desenlace,
159-161. 166-172
Y confusi6n residuaL 285-286. 286-287
Y emparejamiemo. 35
y trayecto causal de
exposici6n/desenlace. 162-164
Variables Dummy. para relaciones no
lineales,277-281
Epidemiologfa interme<iia: conceptos y aplicaciones es un texto ciertamente tras
cendental. EI modo en que decursa su version original en el exigente y vigo
roso ambiente academico de Estados Unidos es expresion elocuente tanto de
la maestrfa como del singular sentido de la oportunidad de sus autores. Creado
con la intencian de cubrir el vacio que exhibia a fines del siglo pasado la fite
ratura especia/izada, que no contaba con un texto situado entre el nivef bilsi
co de la epidemiologia y los tratados de mas alto cafado matematico, /a obra
de Szk/O (Rio de Janeiro -Brasil, 1938) y Nieto (Ponferrada -Espana-, 1955)
concita rapidamente un enorme interes y cosecho inmediato exito de ventas
en aquef pais, donde ambos ocupan prominentes posiciones academicas.
Ahora se presenta la obra en idioma castellano, resultado de la traducci6n
reafizada par dos destacados especialistas en el area tecnica que el libro abor-
da. EI dominio que tanto los autores como los traductores tienen de ambos idio
mas, asi como el hecho de que unos y otros co/aboraron estrechamente en el
arduo proceso de producir una version pufida y precisa de una obra compfeja
como la que nos ocupa, garantizan fa cafidad de este empeno, algo que /os lec
tores en lengua casteffana sin duda alguna agradeceran especialmente.
Por anadidura, /os autores aprovecharon la ocasion para reconsiderar pausa
damente las diversas partes del libra, y pudieron introducir algunas modificacio-
nes respecto de la version original en idioma ingles, circunstancia que nos permite
ofrecer una obra aun mas acabada en el plano conceptual y expositivo.
Epidemiofogia interme<iia: conceptos y aplicaciones, en suma, es un fibro fla
mado a satisfacer las expectativas de un amplio espectro de profesionafes no
necesariamente versados en las partes mas intrincadas de las matematicas,
pero poseedores de conocimientos basicos de /a disciplina epidemio/6gica, y
a fa vez avidos de disponer de obras en que se conjuguen equifibradamente
fa obfigacion de ser respetuosos con el texto original y la posibilidad de des-
plegar los notables recursos expresivos de nuestro idioma.
ISBN 8 4 7978 595 0
E-mail : ediciones@diazdesantos.es
www.diazdesantos.es/ediciones

Das könnte Ihnen auch gefallen