You are on page 1of 247

Metodologa de la investigacin

epidemiolgica
Juan Luis Londoo Fernndez
Editorial Universidad de Antioqma
Introduccin
E l libro que ofrezco .a los lectores interesados en la metodologa de la
investigacin epictemjglgica es el fruto de mis aos de labor como inves
tigador y como dooetfte en las ctedras de epidemiologa y metodologa de
la investigacin en la Facultad Nacional de Salud Pblica de la Universi
dad de Antioquia y de varas facultades de medicina.
La obra tiene como motivacin y como objetivo principal contribuir
a la formacin de investigadores para que, con una slida fundp&hiacin
cientfica, puedan aproximarse al estudio de la realidad epidemiolgica de
los pases de habla hispana. st dirigido en particular a profesionales del
rea de la salud que deseen profundizar en la metodologa bsica de la
investigacin epidemiolgica; no obstante, los mtodos que en l se descri
ben pueden ser utilizados productivamente por profesionales que desarro*
lian su labor investigativa en otros campos del saber.
La metodologa que se presenta en el texto es, en buena parte, aque*
lia que ha surgido como fruto del proceso de desarrollo de la epidernsolo
ga como disciplina cientfica en el trascurso de los aos y que todo
docente o investigador en epidemiologa debe conocer. Sin embargo, ella
no cubre todos los aspectos relacionados con U investigacin epidemiol
gica; en particular, no incluye mtodos propios de las ciencias sociales ta
les como la sociologa, la antropologa o la comunicacin, disciplinas
importantes en el estudio de muchas situaciones en salud pblica.
. Debido a la naturaleza misma de la investigacin epidemiolgica y
a la clara dependencia de sta del lenguaje estadstico, para la comprensin
del texto se hace imprescindible una capacitacin previa en estadstica b
sica; la obra se desarrolla desde un nivel general hacto uno ms especfico que
demanda el dominio de algunos conceptos de mayor complejidad.
Los captulos 1 y 2 presentan una visin general de la investigacin
epidemiolgica tradicional y de los conceptos fundamentales en los que
ella se sustenta; en los captulos 3 , 4 y 5 se describen las priacipales estra
tegias o diseos que han caracterizado la investigacin epidemiolgica es
tudios experimentales, de seguimiento y de casos y controles y para cuya
cabal comprensin se requiere un nivel bsico de estadstica coi nfasis en l
manejo de las distribuciones mustrales de medias y de proporciones.
En el captulo 6 se sealan los errores ms importantes que pueden
afectar la investigacin epidemiolgica, y en los captulos 7, 8 y 9 se de
tallan importantes estrategias para el control de los errores debidos a fac
tores extraos: el ajuste de tasas, el anlisis estratificado y el
equiparamiento. Estos captulos suponen un buen conocimiento de la esta*
dstica inferendal por parte del lector.
Para la total comprensin del captulo 10, que se refiere al anlisis
mut(variado se requieren conocimientos previos de los fundamentos del
anlisis multivariado clsico y del anlisis de la varianza; al igual que para
los modelos multivariados aplicados a los estudios de supervivencia, que
se presentan en el captulo 12.
El captulo 11, en el que se discuten los estudios ecolgicos, supone
una buena comprensin de los conceptos de regresin y correlacin, y el
ltimo captulo, que se refiere al problema del tamao muestra!, supone un
buen conocimiento de las principales distribuciones probabilsticas, tema
comn en los cursos bsicos de estadstica.
Quiero agradecer a las istituciones y a las personas que contribuye-
ron a mi formacin en el campo de la epidemiologa y a las que me ayu
daron y animaron para la publicacin de esta obra. En particular, al doctor
Luis Femando Duque Ramrez quien nidalmente me invit a formar parte
del cuerpo de profesores de la Facultad y me ofreci la posibilidad de
realizar investigacin epidemiolgica; a la Universidad de Antioquia y a la
Organizacin Panamericana de la Salud que hicieron posibles mis estudios
de posgrado en salud pblica en la Universidad de Carolina del'Norte
(Chapel Hill) y al doctor Luciano Vlez Anoyave quien desde la decana-
tura de la Facultad respald tal iniciativa; a la doctora Helena Espinosa de
Restrepo quien contribuy a mi capacitacin como asistente de investiga
cin en la Universidad de Lousiana en New Orleans y a los doctores Her
nando Molina Saldamaga y Francisco Yepes Lujn quienes, junto con la
Organizacin Panamericana de la Salud apoyaron un programa de trabajo
en investigacin que realic en la Universidad de Cambridge, Inglaterra.
De manera especial deseo agradecer al doctor Kahl Martfn Colimn
por su amable y permanente estmulo y por el trabajo que se tom al re
visar el borrador del libro, al cual hi2o valiosas sugerencias. A la licenciada
Gabriela Ospina de Arboleda por su noble y desinteresado apoyo, a la li
cenciada Mara Eugenia Mazuera del Hierro y al profesor Alvaro Muoz
de la Universidad de Johns Hopkins quienes revisaron el borrador y tam
bin aportaron valiosos y estimulantes comentarios.
Agradezco tambin a los profesores y estudiantes que a travs de mi
carrera han contribuido con su labor al desarrollo de muchas de las ideas
que forman parle de la obra. Deseo tambin agradecer a mi secretaria, se
ora Doris Cardona Arango, por la esmerada trascripcin de algunos cap
tulos.
Es mi mayor deseo que e! libro que aqu presento sea una ayuda
para todos los que desde la investigacin epidemiolgica pretenden contri
buir ai bienestar de nuestras poblaciones.
V
Medelln; diciembre de 1994
V
I
Juan Luis jondoo F.
L a investigacin epidemiolgica
En el presente captulo se describe el campo de accin de la epidemio
loga y, en particular, el de la investigacin epidemiolgica; se propo
ne una clasificacin de los factores que son objeto de esta ltima; se
sealan las propiedades de la investigacin etiotgica y, finalmente, se
presenta una tipologa de los estudios epidemiolgicos.
L a epidemiologa es una rama aplicada de la ciencia que estudia la salud
y la enfermedad de la poblacin humana. Su objetivo es mejorar la salud
de la poblacin.
El objeto de inters de la epidemiologa es la salud colectiva a di
ferencia de la medicina clnica que tiene como inters inmediato la salud
del individuo; por tal razn puede afirmarse que la poblacin es para la
pnmera lo que el paciente es para la segunda. H inters colectivo sita a
la epidemiologa en un contexto raultidimeasiomd e interdisciplinario
8 /Maodobgta t investigacin...
No resulta extrao entonces que en el trascurso de su desarrollo la
epidemiologa haya incorporado teoras, mtodos y conceptos pertenecien
tes a diferentes campos del saber dentro de los cuales es importante desta
car los aportes de las ciencias biomdicas como la medicina* la patologa,
la fisiologa, la microbiologa y la inmunologa; de las disciplinas matem
ticas como la estadstica y la investigacin de operaciones y de las ciencias
sociales como la psicologa, la sociologa, la antropologa, la socioderao-
grafia y las ciencias polticas.
El logro del propsito de la epidemiologa es consecuencia de un
proceso en el cual conviene distinguir tres etapas secuenciales:
1. Descripcin del estado de salud de la poblacin de inters
2. Identificacin de tos factores relacionados con la {esencia de la enfer
medad.
3. Prevencin de la presentacin de nuevos casos mediante la disminucin
en la exposicin a tales factores, curacin de los ya existentes y prolonga
cin de la vida de aquellos incurables.
Factores de riesgo
El propsito ltimo de la epidemiologa es la identificacin de los factores que
contribuyen al desarrollo de la enfermedad con d fin de prevenir la aparicin
de sta; ellos se conocen como factores de riesgo porque a mayor exposicin
de la poblacin corresponde una mayor incidencia de la enfermedad, lo cual
implica un mayor riesgo de enfermar. De acuerdo con este ccocepto el taba
quismo es entonces un factor de riesgo para el cncer de pulmn, el cncer
oral, e) cncer de la vejiga, la enfermedad coronaria, la arterieesclerosis y el
bajo peso a3 nacer (The Health Consequences of Smoking, 1984).
La epidemiologa estudia, en ocasiones, aquellos factores que previe
nen la aparicin de la enfermedad y que contribuyen de manera positiva a
un mejor estado de salud de la poblacin, por ejemplo las vacunas, a los
cuales se les conoce como protectores.
Algunos factores de riesgo son intrnsecos o propios del individuo y
otros son extrnsecos o propios del ambiente. Entre los primeros se encuen
tran los factores genticos y los inmunolgicos; por ejemplo, las personas
que poseen el tipo sanguneo A tienen un mayor riesgo de desarrollar cn
cer de estmago, en tanto que quienes poseen el tipo 0 estn ms propensas
al desarrollo de lcera pptica (Aird y colaboradores 1953). La personali
dad tambin es un factor de riesgo intrnseco importante para ciertas enfer~
medades; por ejemplo el patrn de conducta tipo A, caracterizado por la
4 hwjzigaeift eptdemiogicG/ i 9
competitividad, la agresividad, la intolerancia y la urgencia del tiempo, se
ha identificado como un factor de riesgo para la enfermedad coronaria (Ro-
senman y colaboradores, 1964; The Review Panel on Coronary-prone Be-
haviour and Coronary Heart Disease, 1981).
Entre los factores de riesgo extrnsecos cabe distinguir los facto
res biolgicos tales como los viras circulantes en el ambiente y los ani
males portadores de microorganismos patgenos; los factores sociales
dentro de los cuales estn los econmicos, los culturales y los polticos
y los factores fsicos como el agua, el aire, la radiacin y los agentes
qumicos. Aunque esta clasificacin es til para identificar la naturaleza
de los factores de riesgo, muchos de estos resultan a su vez de la inte
raccin de varios de ellos; por ejemplo, las caractersticas inmunolgi-
cas son el resultado de la exposicin a mltiples factores biolgicos
soraales y fsicos; de igual fonna el estilo de vida que ltimamente
na recibido gran atencin en el enfoque preventivo de la salud pblica
es el resultado de la interaccin de una gran diversidad de factores in
trnsecos y extrnsecos.
Asociacin y causalidad
Una de las tareas fundamentales de la investigacin epidemiolgica consis
te en esclarecer la funcin de los distintos factores en el desarrollo de la
enfermedad. Esta tarea es el objetivo de la investigacin etiolgica la cual
estudia la asociacin causal que presentan los factores de riesgo con la
enfermedad. 0
Aunque el problema de la causalidad de la enfermedad se puede ana
lizar desde una concepcin filosfica, con lo cual se pretende identificar la
causa ultima de los efectos, por limitaciones de espacio una discusin en
tal sentido se omite en el presente texto. El lector puede encontrar va
liosos aigumentos en los escritos de Hill (1953, 1965). Corafield (1954)
? amy y/ ,^Lmet (1959)' Sartwe11 (I. MacMahon y Pugh
(1970), Susser (1973) y Buck (1975), entre otros.
Para el enfoque epidemiolgico y preventivo es ms dt identificar
aquellos factores cuya modificacin trae como consecuencia una disminu-
ctn en la morbimortalidad de la poblacin: un factor de riesgo es causal
en ddesarroUo de una enfermedad si ana variacin en la frecuencia o en
7 t^ Stt^ C0D quc 6-8 se produce un cambio en la frecuencia
dMrtfa* eT ^ a . BJUe,ia parte * 5a investigacin epidemiolgica est
dingida a la deteccin de asociaciones causales.
20/ki*soitok>gta de la investigacin.-
Para identificar asociaciones causales el epidemilogo debe conside
rar que un mismo factor de riesgo puede actuar como tal para varias en
fermedades y que una de stas puede ser causada por mltiples de ellos;
as, el consumo excesivo de alcohol se ha identificado como factor de ries
go para el cncer de la laringe, la cirrosis heptica y el ddirium tremens
(U.S. Department of Health and Human Service, 1990) y la enfermedad
coronaria se ha asociado causalmente con la hipertensin arterial* el taba
quismo y la bipercolesterolemia, entre otros (Kannel y Gordon, 1974;
American Heart Association* 1980).
En las relaciones causales conviene distinguir las causas suficientes,
cuya presencia garantiza la aparicin de la enfermedad, de aqullas sin las
cuales no es posible que sta se presente, o causas necesarias. As el pas-
modium es un factor causal necesario para la malaria pero su sola presen*
ca no garantiza la aparicin de la enfermedad, o sea, no es una causa
suficiente (Covell, 1961).
Desde una posicin ms realista es mejor hablar de complejos cau
sales conformados por varios factores cuya concurrencia los convierte en
suficientes (Rothman, 1976); as, en el ejemplo propuesto anteriormente el
plasroodium sera un factor que, junto con condiciones inmunitarias defi
cientes y quizs con otras condiciones conformara un complejo causal su
ficiente. Es posible tambin que para una enfermedad existan varios
complejos causales suficientes; la malaria, por ejemplo, puede presentarse
siempre que se d la concurrencia de los factores a%b y c, pero puede
hacerlo tambin cuando se presente el complejo a, y r, en este caso el
plasmodium como factor causal necesario sera la causa a.
No todas las asociaciones que logra establecer d epidemilogo sealan
la existencia de factores causales; algunos de estos ltimos estn relacionados
con determinadas enfermedades en las que la modificacin de la exposicin
no implica una variacin en la frecuencia con que se presenta, lo cual se
conoce como asociacin meramente estadstica en ccntraposicin a aqulla
que es causal. As la asociacin observada entre el consumo de caf y el
cncer de pulmn es meramente estadstica, porque si se suprime d consumo
del primero no disminuye la incidencia dd segundo; por el contrario, la aso
ciacin entre la concentracin sangunea de colesterol y la enfermedad coro
naria es <^*1 porque d descenso en las concentraciones de ste disminuye
d nmero de casos de dicha enfermedad. \
Por otra parte, conviene distinguir las asociaciones directas y las
indirectas, Es claro que entre la variable independiente altura sobre d nivel
La litigacin tpidemioMgtca 2]
del mar y la dependiente, frecuencia de casos de malaria, existe una aso
ciacin claramente definida; sta es consecuencia de la relacin que pre
senta con el clima la presencia deJ vector que trasmite Ja enfermedad, el
cual slo se encuentra en climas clidos; se dice entonces que tal asocia
cin es indirecta y que la asociacin con la presencia del mosquito es di
recta. Aunque el hecho de que una asociacin se clasifique de esta manera
es una cuestin de grado, para la epidemiologa la identificacin de las
directas es ms importante para la prevencin de la enfermedad que Ja
identificacin de las indirectas. Existen tambin las denominadas asocia
ciones espurias que se obtienen o bien debido al azar o a la presencia de
sesgos.
Una situacin para considerar es que el establecimiento de una pre
sunta asociacin entre un factor de riesgo y una enfermedad suele hacerse
sobre los resultados obtenidos en muestras seleccionadas aleatoriamente,
por tanto es posible que en algunos casos se obtenga, por simple azar, una
asociacin que en realidad no existe;1 sta tambin se puede presentar por
errores en la informacin, en la seleccin de las unidades observadas o por
falta de control en otras variables extraas al fenmeno que se estudia pero
que de alguna manera se relacionan con l.2
Como resultado de la bsqueda de factores de riesgo se han identi-
ficado muchos cuya modificacin es virtualmente imposible denominados
no modificabies y su conocimiento slo ofrece posibilidades limitadas para
la prevencifL por ejemplo los genticos; por su parte, la identificacin de
factores modificabies, tales como el tabaquismo, la obesidad y la hiperten
sin en el caso de la enfermedad coronaria, ha aportado los mayores bene
ficios sociales. Es importante notar que e! establecimiento definitivo de una
asociacin como causal exige la realizacin de estudios experimentales,
que difcilmente se pueden hacer en seres humanos debido a consideracio
nes ticas.
Por tal n^otivo, la mayora de las investigaciones epidemiolgicas se
realizan en condiciones que distan mucho de ser las ptimas del laborato-
1 En estos casos se concfaye equivocadamente a favor de I exlsrocia <k la asociacin. lo cual
e rt0c* e estadstica orna enor tipo L La fiecueoca con que ocurreo tos multados es la
wespondiento al nivel de gwfioctn fijado por el investgate pnt la proel de hiptesis.
2 VT e l , , relack"Bd0 d pailo 6. Fuente de e r o en la nvestfgKUSn
eptdeiuowgica, y con la dewmuectfl del taado muestral en k estudios analticos en el
capitulo 13. TamaAo de la nuestni,
22/Metafcioga t la rvesiigacUiL..
rio, por lo cual se hace difcil establecer claramente la naturaleza cauaal
de muchas de las asociaciones as detectadas. No obstante, el cumpli
miento de algunos requisitos por estas ltimas es un argumento a favor
de la naturaleza causal de dicha asociacin (Hill, 1965: Breslow y Day,
1980); tales requisitos estn relacionados con los conceptos que s t ana
lizan a continuacin.
Secuencia temporal causa antecedente-efecto consecuente. Segn el
principio de que la causa antecede al efecto, para que un factor sea consi
derado como causa de una enfermedad la exposicin a ste debe darse
necesariamente antes del inicio de ella. El ausento inusitado en la inciden
cia de anomalas congnitas observado en los descendientes de quienes re
sidan en Hiroshima y Nagasaki can posterioridad a las explosiones
atmicas de 1945 ha fortalecido la naturaleza causal de la asociacin en
contrada entre la exposicin a radiaciones in tero y la incidencia de estas
anomalas.
Consistencia de la asociacin. El establecimiento de una misma aso
ciacin en diferentes lugares, consistencia espacial, y en diferentes momen
tos, consistencia temporal, tiende a fortalecer la naturaleza causal de sta.
En este sentido, la observacin de un aumento o una disminucin consis
tente del riesgo de enfermar a medida qt) vara la dosis de exposicin a
un o efecto dosis respuesta tiende a fortalecer la naturaleza cau
sal de la asociacin observada, o sea la consistencia interna.
Fuerza de la asociacin. Aquellas asociaciones fuertes, en las cuales
se observan grandes diferencias en la frecuencia con que se presenta una
enfermedad entre los expuestos y los no expuestos a un factor de riesgo,
tienen un mayor sustento causal que aqullas numricamente dbiles.
Especificidad de la asociacin Las asociaciones entre factores de
riesgo especficos y enfermedades especficas tienen un mayor peso causal
que aqullas entre factores genricos y grupos de enfermedades. La natu-
raleza causal de la asociacin establecida entre hipercolesterolemia e inci
dencia de enfermedad coronaria es ms firme que la asociacin observada
entre consumo per cpita de grasas saturadas y mortalidad por enfermeda
des cardiovasculares.
A este respecto es importante recordar que la especificidad de mu
chos factores de riesgo no es absoluta debido a que muchos de estos lo son
para mltiples enfermedades, por ejemplo, el tabaquismo como factor de
riesgo para el cncer de pulmn, el cncer de la vejiga la enfermedad
coronaria y el bajo peso al nacer; al tiempo que una misma enfermedad
Ux investigacin tptdemlttJgica/23
puede ser causada por diferentes de elfos, tal como se observa en ia enfer
medad coronaria como consecuencia de la hipercolesteroJemia, la hiperten
sin y el tabaquismo, entre otros.
Coherencia de los hallazgos. La coherencia de ios resultados obte
nidos eo la bsqueda de una asociacin con el conocimiento existente es
otro argumento a favor de la naturaJeza causal de sta. La asociacin ob
servada entre el consumo de estrgenos en la posmenopausia y la aparicin
de cncer de eodometrio est acorde con los conocimientos ya existentes
sobre la fisiologa y la patologa relacionados con dicho evento; esta con
cordancia permite presumir que la asociacin es causal.
En la bsqueda del conocimiento epidemiolgico se pueden identifi
car dos objetos de atencin complementarios:
1. El conocimiento de aquellos factores relacionados con el estado de salud
de la poblacin, o sea el conocimiento etiolgico.
2. La intervencin dirigida a la modificacin de la exposicin a tales fac
tores por medio del diseo y la ejecucin de programas para modificar los
conocimientos, las actitudes y las prcticas de la poblacin.
En el conocimiento etiolgico se sitan todas aquellas investigacio
nes realizadas para conocer la historia natural y social de la enfermedad,
mientras que en la intervencin se agrupan todas las realizadas para evaluar
el impacto pobiacional logrado por la disminucin de la exposicin a di
versos factores o por Ja ejecucin de programas preventivos.
Tipologa de la investigacin epidemiolgica
De acuerdo con las diferentes estrategias metodolgicas empleadas en la
bsqueda del conocimiento, los estudios epidemiolgicos pueden agruparse
en dos grandes tipos: los experimentales y los observacionales.
' Los estudios- experimentales son aquellos en los cuales es posible
manipular la variabJe independiente exposicin y asignar aleatoriamente los
participantes a los gmpos definidos por ella, categora a la cual pertenecen
la mayora de los. ensayos de laboratorio en ios cuales las unidades de
observacin se asignan aleatoriamente a tratamientos definidos o manipu
lados por el investigador de acuerdo con el inters del estudio. Por ejem
plo, un investigador puede asignar al azar ratones a dos grupos de
tratamiento con el fin de probar el poder oncognico de un virus, hiptesis
que podr demostrar si Ja incidencia de tumores resulta ser significativa
mente mayor en el gmpo que recibe el virus cuando se compara con la
observada en el grupo que no to recibe.
24/MttMoga de la wvtsrigadn...
Los ensayos clnicos son tambin estudios experimentales realizados
en pacifwfr* con el fin de evaluar la respuesta de los mismos a diferentes
exposiciones; por ejemplo, en una unidad de salud mental un investigador
puede asignar aleatoriamente los pacientes esquizofrnicos a dos grupos de
tratamiento, hospitalario y ambulatorio, con el Fin de conocer cul de los
dos beneficia ms a tales pacientes.
Una derivacin de ios estudios experimentales son los estudios cua-
siexperimentales en los que la asignacin no es aleatoria aunque el factor
de exposicin es manipulado por el investigador, a este tipo pertenecen las
investigaciones que se hacen en ciertas comunidades para evaluar la dismi
nucin de la incidencia de determinada enfermedad despus de realizar
programas educativos, Las condiciones naturales de algunas localidades
pueden proporcionar cierta ventaja lo cual permite prescindir de la asigna
cin aleatoria, tal como sucede en el estudio del efecto preventivo que con
fiere el consumo de aguas naturalmente fluoradas sobre la caries dental.
Los observacionales son aquellos en los cuales no existe
manipulacin del factor de exposicin por el investigador: ellos costituyen
una buena parte de la investigacin epidemiolgica. Aunque los subtipos
principales de los estudios observacionales son presentados con detalle en
posteriores es importante indicar aqu una clasificacin de ellos
de acuerdo con su objetivo y con la estrategia metodolgica empleada para
su ejecucin; de esta forma, segn el propsito se pueden clasificar como
descriptivos o como analticos.
Los estudios descriptivos se realizan cuando el conocimiento exis
tente acerca de la etiologa o de las caractersticas de una enfermedad
es escaso por tanto, son la primera aproximacin al conocimiento de
sta; en muchas ocasiones son diagnsticos de morbimorulidad, encues
tas de frecuencia o series de tiempo que muestran la evolucin cronol
gica de la morbimortalidad. Estos estudios suelen generar hiptesis
ecolgicas que deben ser probadas mediante estudios analticos, como
lo es la prevencin ofrecida por el agua fluorada la cual fue formulada
ante el hallazgo de una baja frecuencia de Caries dental en un estudio
descriptivo de la morbilidad oral que presentaban varias comunidades
que se abastecan con aguas ricas en flor, en este caso, se trata de un
estudio descriptivo ecolgico, cuyo tratamiento se expone de manera de
tallada en el captulo 11.
Un estadio analtico se realiza para probar hiptesis especficas re
lacionadas con los factores que presumiblemente estn asociados causal-
La mvemgacta epianiatgica/25
mente con la presencia de una enfermedad, caso en el cual slo un cono
cimiento ya existente con respecto al problema estudiado permite formular
dichas hiptesis.
La hiptesis sobre la asociacin existente erare tabaquismo y cncer
pulmonar se formul a pair de los hallazgos informados por varios estudios
descriptivos que sealaban la alta frecuencia de fumadores entre los pacientes
con cncer pulmonar, lo cuai, junio con los conocimientos referentes a la pa
tologa y a la fisiologa del sistema respiratorio, permiti formular la hiptesis
mencionada, confirmada ms taide por mltiples estudios analticos (U.S. Pu
blic Service, 1964). Los subtipos ms importantes de estos estudios son los de
seguimiento o de cohorte y los de casos y controles, con estrategias que se
revisan detalladamente en captulos posteriores.
Aunque las estrategias de los estudios descriptivos y analticos son
diferentes, con frecuencia se combinan ambas en una misma investigacin
lo cual subraya la continuidad y la dinmica del conocimiento cientfico.
Los estudios epidemiolgicos tambin se suelen clasificar como re
trospectivos, prospectivos o de corte, de acuerdo con la presentacin de los
eventos en el tiempo. Un estudio retrospectivo se basa en eventos ya acae
cidos relacionados con la enfermedad o con la exposicin; con frecuencia
estos toman la informacin necesaria de registros rutinarios de mortalidad
o de morbilidad o renen informacin por medio de encuestas, tal como
ocurri con los estudios realizados sobre el sida con los primeros pacientes
que presentaron la enfermedad. Los estudios prospectivos, en cambio, ob
servan la presentacin de eventos futuros, como es el estudio del impacto
que tiene en la poblacin un programa de inmunizacin que se inicia en el
momento.
Los estudios retrospectivos y los prospectivos reciben la denomina
cin comn de longitudinales debido a que los eventos de inters se obser
van en el trascurso del tiempo. En contraposicin a estos existen los
estudios de corte o trasversales que miran eventos presentes como son las
encuestas de prevalenda que muestran la frecuencia y las caractersticas
con las que se presenta una enfermedad en el momento.
Referencias bibliogrficas
1. And L, Bernall HH, a al. Relationshipbecweeo cncer of storaach and ABO blood groups.
British Journal o f Medicin. 1953; (1): 799.
2. Amen can Heart Assoaaon. Risk factor? and corouaiy heart distase. Circulation 1980*
(62): 449A-455A.
26/hieudciogtade b twvestigaridn.-
3. Breslow NE, Day NE. Statistical Methods a Cancer Re swc h. Vol. L The Analysis of
Case-Conirol Study. Lyon, international Agency for Research oo Cancer, 1980.
4. Buck C. Popper*# philosophy for eptenuologisu. International J o u r n a l a t Bpidanhtogr.
1975; (4): 159-168.
5. Cornfield J. Statistical relationships and proof in medicine. American Statistician. 1954;
(8): 19-21.
6. Cove a ReiBaones eotre la parasitemia malfrica y ios &lmoraas de la ofermedsd.
tofeflto * to Oficma Sanitaria Panamericana. 1961; L (3): 223-240.
7. Hill AB. Observation and experiment New England Journal o f Medicine. 1953; (246):
995-1001.
8. Hill AB. Hie environment and disease: association or causation? Proceedings c f the Royal
Society o f Medicine. 1965; (SO): 295-300.
9. Kannel WB, Gordon T. The Framingham Study: an epidam oiogkal investigation (tf car
diovascular disease. Department o f Health, Education and Welfare, Fablic Health Ser
vice, National Institute o f Health, DHEW Publication, 1974; 574>599.
10. MacMahon B , Pugh IT. Epidemiology. Principles and Methods. Boston. Little, Brown,
end Co., 1970.
11. Rosenman RH, Friedman M, Straus R, a a t A predictive study of coronary h a r t disease:
the Western Collaborative Group Study. Jama. 1964; (189): 15-21
12. Rothman KJ. Causes. American Journal o f Epidemiology. 1976; (104); 587-592.
13. Sanwell PE. "On the methodology of investigations of etiologjc factors in chronic dis
ease"- Amber com menu. Journal o f chronic diseases. I960; (11): 61-63.
14. Susser M. Causal Thinking in the Health Sdeneies: Concepts end Strategies qf
Epidemiology. New York, Oxford University Press, 1973.
15. Susser M. Judgment and causal inference: criteria in epidemiologic studies. American
Journal o f Epidemiology. 1977; (105): 1-15.
16. The Health Consecuences q f Smoking: a report o f the Surgeon General Washington,
D.Cn Government Printing Office. 1984.
17. The Review Panel on Coronary-prone Behaviour a i d Coronary Heart Disease. Coronary-
prone behaviour and coronary heart disease. Circulation. 1981; (63); 1199-1215.
18. U.S. Department o f Health and Human Service. Pubiic Health Service. Seventh Special
Report to the U S Congress on Alcohol and Health from the Secretary o f Health and
Human Services. January, 1990..
19. U & Public Health Service. Smoking and Health. Report o f the Advisory Comittee to the
Surgeon General o f the Public Health Service. U.S. Department o f Health, Education
and Welfare, Public Health Service, Center for Disease Control, PHS Poblication No.
1103,1964.
20. Yerushalmy J, Palmer C. On the methodology o f investigations o f otiologic factors in
chronic diseases. Journal c f Chronic Diseases. 1959; (10); 27-40.
L a medicin en epidemiologa
II
II
En este captulo se presentan algunos conceptos importantes relaciona
dos con las variables; se describen las medidas principales utilizadas
por la epidemiologa para mostrar la morbilidad y la mortalidad obser
vadas eQ tusa poblacin; se diferencian los conceptos de incidencia y
de prevalenda y las mediciones realizadas por medio de proporciones,
de razones y de tasas y, pcr ltimo, se eouncan las principales medi
das de asociacin utilizadas en la investigacin epidemiolgica.
n la tarea de conocer la realidad para trasfoimarla de una manera efi
ciente el cientfico observa los fenmenos que se presentan, identifica sos
componentes principales y las relaciones entre estos y formula, finalmente,
una explicacin de la misma. La observacin de ella debe hacerse de
acuerdo con criterios claramente definidos, de tal modo que la interpreta
cin de los hallazgos sea inequvoca y universal; por tal razn el\ invest-
2 8 /Metodologa de la investigacin.,,
gador, obligado a medir de una manera sistemtica aquellas propiedades o
variables que son objeto de su estudio, debe acercarse en algn momento
al problema de la medicin, tema del presente captulo.
Variable
La epidemiologa estudia el comportamiento de aquellas propiedades re
lacionadas con la salud y con la enfermedad tales como el diagnstico,
la edad, el sexo, la procedencia, las condiciones socioeconmicas y el
nivel educativo, entre otras; stas se conocen con el nombre de varia
bles porque cambian de un individuo a otro o en el mismo individuo de
acuerdo con el momento. El estudio cientfico del comportamiento de
una variable exige su observacin, su medicin y el anlisis de la infor
macin recopilada.
Las variables que estudia el epidemilogo presentan diferentes esta
dos o valores; por ejemplo, el sexo presenta dos valores, masculino y fe
menino, mientras que la presin arterial se expresa en milmetros de
mercurio; es evidente que la naturaleza de los valores masculino y feme
nino es diferente de la de aquellos que indican la cantidad de milmetros
de mercurio. Esta diferencia en la naturaleza de la informacin obtenida
permite identificar cuatro niveles bsicos de medicin: nominal, ordinal,
intervalo y de razn (Stevens, 1946; Kerlinger, 1973; Loether y McTavish,
1974).
Niveles de medicin de as variables
Nivel nominal
Cuando los valores con los cuales se mide una variable son cdigos de
identificacin que denotan la presencia o ausencia de una cualidad, la me
dicin se efecta a nivel nominal, entonces se dice que dicha variable es
de tipo categrico. Si para estudiar el comportamiento de la variable sexo
en una poblacin se adoptan los cdigos masculino y femenino, sta se
mide a nivel nominal, o sea que cada individuo se clasifica de acuerdo con
la presencia de un atributo; a este nivel pertenecen todas las mediciones de
tipo cualitativo tales como la causa diagnstica, el estado civil, la proce*
dencia, la ocupacin y el grupo sanguneo.
Para facilitar el manejo de la informacin obtenida es posible asignar
valores numricos a cdigos nominales, tal como sucede cuando el inves
tigador identifica al sexo masculino con el nmero l y al femenino con el
2 MAfiriAt en epidemiologa / 2 9
2; no obstante, dichos valores no representan cantidades sino que determi
nan la presencia de un atributo; por tal motivo se comete un error lgico
cuando se trata de obtener un promedio de los valores que identifican el
sexo en un grupo de personas: en este caso 2 no es mayor que 1 ni 2 es
el doble de 1, Con valores nominales slo se puede observar la frecuencia
absoluta o relativa con la cual se presenta cada cdigo y afiimar, por ejem
plo, que el 30% de la personas afectadas por un brote son de sexo mascu
lino o que el 20% de las mujeres afectadas son solteras. As, el tratamiento
numrico propio de las mediciones nominales es el de contar bien sea por
medio de frecuencias absolutas, o nmero de casos, o por frecuencias re
lativas, o porcentajes.
En epidemiologa es frecuente tratar la enfermedad como una varia
ble nominal que slo presenta dos valores: su ausencia o su presencia; tam
bin es comn medir la exposicin a factores de riesgo en dos categoras
excluyentes, s o no. tal como sucede con la exposicin a un medicamento
en un determinado periodo. A este tipo de variables se les conoce como
dicotmicas, o tambin, de respuesta todo o nada.
Nivel ordinal
Cuando los valores que presenta una variable informan acerca de un orden
o jerarqua, la medicin se realiza a nivel ordinal; ejemplos de esto son los
valores 1, 2 y 3 para determinar el grado de una quemadura, los nmeros
1* 2, 3, 4, 5 que informan el resultado de una citologa y los del l al 10
del ndice de Apgar con el cual se evala el estado de! recin nacido. La
informacin suministrada por una medicin ordinal es ms completa que
la de una nominal porque en la primera el 3 es mayor que el 2 y el 2 es
mayor que el 1, lo cual no sucede en la segunda; por este motivo, con
mediciones ordinales* no slo es posible conocer la frecuencia absoluta o
relativa que presentan los diferentes valores de la variable, tal como se
hace con las mediciones de un nivel nominal, sino que, adems, se pueden
analizar aspectos relacionados con la secuencia o jerarqua de los valores
observados.
Las medidas estadsticas conocidas como coeficientes de relacin
de rango utilizan la posicin relativa de las observaciones para establecer
asociaciones entre variables medidas ordinalmente; un ejemplo de esta si
tuacin se encuentra en un estudio que trata de establecer la relacin exis
tente entre el nivel educativo de la madre bajo, medio y alto y el
estado del recin nacido valorado mediante el ndice de Apgar.
30/Metodoiogfo de la investigacin...
Nivel de intervalo
A este nivel pertenecen todas las mediciones de naturaleza cuantitativa que
se hacen con escalas que tienen como base un valor cero, el cual no es
absoluto sino arbitrario. Por ejemplo, las mediciones que se hacen con base
en la escala centgrada de temperatura son mediciones de nivel de intervalo
poique 0 C do indica l a ausencia total de sta y a que un cuerpo que se
encuentra en estas condiciones tiene una temperatura absoluta de 273 K;
por este motivo un cuerpo que tiene 40 C no tiene el doble de temperatura
que uno que se encuentra a 20 *C aunque la cantidad que hay entre 0 y
20 C es la misma que existe entre 20 y 40. Es esta ltima posibilidad de
establecer relaciones entre intervalos de la escala es la que le da el nombre
a este nivel de medicin.
Nivel de razn
Las mediciones de nivel de razn son aquellas que se realizan con base en
una escala que tiene como punto de panida un cero absoluto; un ejemplo
de stas es la medicin de variables tales como la longitud, el tiempo, el
peso y la presin. Dado que en stas los valores observados tienen como
referencia un cero absoluto es posible establecer comparaciones en trmi
nos de razones: 10 horas es el doble de 5 horas y 60 mmHg indican una
presin que es la tercera parte de 180 mmHg.
Con respecto a los niveles de medicin conviene considerar las si-
guientes observaciones:
1. A medida que la medicin de una variable se hace a un nivel ms alto
_ c s decir desde el nominal, ms imperfecto, hasta el de razn, ms per
fccto la informacin acerca de la variable es ms completa y permite
enriquecer el anlisis; por ejemplo, si la hipertensin arterial se mide sola
mente a nivel nominal como s o no slo se puede establecer el nmero de
hipertensos, pero si dicha variable se mide en milmetros de mercurio, o
sea a nivel de razn, es posible conocer tambin el promedio, la mediana,
los valores mximos y mnimos y la desviacin estndar, medidas que
muestran de una manera ms completa su comportamiento, Es importante
notar que hay variables que por su naturaleza slo admiten mediciones de
nivel nominal como el sexo, la ocupacin y el estado civil.
2. La agrupacin de valores en intervalos ms o menos amplios con el
propsito de resumir la informacin no est relacionada con el nivel de
medicin de la variable. As, la decisin de establecer intervalos para agru~
La medicin en epidemiologa/3 J
par mediciones relativas a la edad en categoras de 0, 1 a 4 y 5 a 14 aos
est relacionada con el problema de la categorizacin, pero no modifica la
naturaleza o el nivel de medicin de los valores; en cualquier caso la va
riable est medida a nivel de razn y no de intervalo.
Categorizacin de as variables . w
Con el fin de estudiar el comportamiento de una variable el epidemilogo
debe definir las categoras o intervalos que ha de utilizar para agrupar la
informacin obtenida (Kerlinger, 1973; Kleinbaum y Kupper, 1978). Este
problema no se presenta usualmente en variables discretas^ que presentan
pocos valores, como el sexo y el grupo sanguneo porque las categoras
para su tratamiento ya estn definidas por los valores individuales de la
variable: masculino y femenino; A, B, AB y 0. Por el contrario, con varia
bles como la edad en aos o la presin arterial medida en milmetros de
mercurio, el investigador debe definir los intervalos en los cuales ha de
agrupar la informacin obtenida.
Aunque para tomar tal decisin no hay reglas definidas se deben
considerar las siguientes normas generales:
1. La categorizacin debe incluir todos los valores que puede presentar la
variable, lo cual corresponde a una clasificacin exhaustiva; en tal caso, si
para tratar la informacin relacionada con el grupo sanguneo no se incluye
como posible valor el grupo AB, la categorizacin no es de este tipo.
2. La categorizacin debe posibilitar la clasificacin de cafa uno de los
valores observados en uno y slo uno de los grupos establecidos con el fin
de conformar categoras mutuamente excluyentes. Si para clasificar la edad
se establecen intervalos de 0 a 4, 5 a lOy 10a 14 aos, la categorizacin
que se hace n es excluyeme por cuanto no se sabe a qu intervalo perte
nece un individuo con diez aos.
3. La categorizacin debe permitir la identificacin de diferencias impor
tantes en el anlisis segn el fenmeno que se estudia, lo cual se conoce
como clasificacin discriminante. Por ejemplo, si se estudia un. fenmeno
relacionado con el tiempo de lactancia materna y se establece una primera
categora entre cero y tres meses, la informacin correspondiente a madres
que no han amamantado a sus hijos, o sea un valor cero, se confunde con
I Una vahabte disocia u aquella que slo poema valore enteras, a difeeocta de ana comn
que admite valore* fraccionario*.
32 /Metodologa de lo invevigacidn...
aquellas que lo han hecho por un periodo entre cero y tres meses, hecho
que imposibilita la identificacin de diferencias importantes con respecto a
esta variable.
Funciones de fas variables
En un estudio de la relacin existente entre una causa y un efecto la va
riable que supuestamente acta como causa cumple la funcin de variable
independiente ^ el efecto producido la de variable dependiente. Por ejem
plo, en un estudio de la relacin existente entre la concentracin sangunea
de colesterol y la enfermedad coronaria la primera se comporta como la
variable independiente y la segunda como dependiente. El que una variable
se considere como una u o t o se relaciona con el problema particular que
se estudia; el colesterol, que en el ejemplo anterior se desempea como
variable independiente, en un estudio de la relacin entre su concentracin
como producto de la dieta acta como una variable dependiente.
Medicin de la morbimortalidad
La epidemiologa, como disciplina cientfica, observa los fenmenos rela
cionados con la morbimortalidad que se presenta en grupos humanos y los
describe por medio de medidas, las cuales tienen diferentes connotaciones y
adoptan formas particulares de acuerdo con el propsito de cada situacin. En
una primera aproximacin al problema de la medicin de los fenmenos epi
demiolgicos se perciben dos maneras distintas y complementarias que
muestran su magnitud desde dos dimensiones temporales diferentes: lapr*-
volenci y la incidencia,*la primera de ellas estudia la frecuencia con que
determinados eventos se presentan o prevalecen en un cierto momento y la
segunda, la frecuencia con que estos .se presentan o inciden en un periodo
de tiempo.
Prevalencia
U.na medida de prevalencia de un evento de salud o enfermedad intenta
mostrar la frecuencia con que ste existe en el momento, inde
pendientemente de cundo se haya originado. Por ejemplo, si la prevalen
cia de tuberculosis en una cierta poblacin es del 0,3% se entiende que de
cada mil personas tres padecen actualmente la enfermedad; sin embargo la
medida no informa sobre cundo se hizo el diagnstico ni sobre el nmero
de casos nuevos que se han presentado en la poblacin durante ese arto,
pero s lo hace con respecto a la cantidad de casos existentes o prevalentes
4 mencin m epidemiobgta/33
de tuberculosis en el momento actual, razn por la cual a esta medida se
le conoce como previdencia de punto.
Otra medida utili2ada es la previdencia de periodo o Ipsica, la cual
muestra el nmero de casos existentes durante un periodo determinado; por
tanto, incluye a las personas enfermas al principio de ste y a las que se
enferman en su trascurso (Colimn, 1990). Sin embargo debido a los fac
tores que pueden modificar la morbilidad a io largo de un periodo, esta
medida es menos utilizada en la investigacin epidemiolgica que la pre-
valencia de punto,
La informacin suministrada por la prevalencia acerca de la frecuen
cia con la cual existen ciertas enfermedades o, tambin, ciertos factores de
nesgo es til para el establecimiento de programas preventivos, asistencia-
Ies y de control y es en muchas ocasiones un pumo de partida para la
investigacin causal en epidemiologa; por ejemplo, una alta prevalencia de
tuberculosis en una poblacin puede alertar a las autoridades sanitarias
acerca de un deficiente funcionamiento de los programas establecidos para
el control y el tratamiento de esta enfermedad.
^Del mismo modo, el conocimiento de una alta prevalencia de hiper
tensin arterial en grupos especficos de poblacin puede ser un argumento
importante para el establecimiento de un programa de prevencin y de con
trol de dicha enfermedad dirigido a tales grupos de la poblacin y una alta
prevalencia de! hbito de firniar en los adolescentes puede ser el punto de
partida para el establecimiento de un programa preventivo dirigido a la
poblacin escolar de la localidad.
Para medir la prevalencia de cierto evento hay que determinar el
nmero de sujetos en quienes se presenta el evento estudiado y relacionar
dicho numero con el total de individuos que forman el grupo observado-
por tal motivo, la prevalencia se suele expresar por medio de proporciones
o porcentajes. As, si en una cierta poblacin de 10.000 habitantes 1500
personas sufren de hipertensin arterial, se dice que la prevalencia de tal
enfermedad es del 15%.
Incidencia
u segunda dimensin desde la cual se pueden estudiar los fenmenos epi
demiolgicos es la relacionada con la frecuencia con que se presentan o
inciden los eventos en el tiempo, la cual corresponde a una medida de
incidencia. Supngase, a manera de ejemplo, que en un grupo de 300 mu
jeres wicialmente con presin arterial normal que utilizan anticonceptivos
34 / Metodologa de t a investigacin...
orales con alto contenido de estrgenog se diagnostican 60 casos de hiper
tensin arterial en el trascurso de un ano; la frecuencia con la cual iocidi
la enfermedad durante ese ao fue de 60/300, o sea del 20%, cifra que
muestra la incidencia anual de la hipertensin en tal grupo.
Como se puede observar, la medicin de la incidencia de un evento
en un cierto periodo se logra por medio de una proporcin en la cual el
numerador es el nmero de eventos observados durante ese tiempo y l
denominador es el nmero total de sujetos estudiados. Cuando se utiliza
una proporcin para medir lancideitcia de un evento en un cieno periodo
se quiere indicar con ella la incidencia acumulada* a partir del denomina
d a inicial en el trascurso de ese tiempo, lo cual corresponde a una medida
de incidencia acumulada.
Por ejemplo, si se estudia un grupo de 200 gestantes para conocer
la incidencia de hipertensin inducida por el embarazo y si durante el pe
riodo de la gestacin se diagnostican 30 casos de esta enfermedad, su in
cidencia se obtiene por medio de la proporcin 30/200 y se dice finalmente
que el 15% de las gestantes presentaron la enfermedad. Ntese que el de
nominador est costituido por un grupo estable cuyas unidades se observan
por un periodo de nueve meses.
A diferencia de la situacin anteor, cuando el grupo observado es
inestable en el tiempo la incidencia se mide por medio de una tasa de
incidencia, cuyo denominador es el tiempo durante el cual los individuos
han estado expuestos a la ocurrencia del evento observado. Por ejemplo,
supngase que un epidemilogo est interesado en estudiar la incidencia de
una enfermedad en los trabajadores de una empresa los cuales se compor
tan como un grupo mvil que cambia durante el perodo de observacin
debido al ingreso y egreso .de individuos; entonces, la contribucin que
cada uno hace al denominador es diferente porque la que aporta un empleado
que permanece en la empresa por un periodo de seis meses es diferente a la
de oo que permanece durante dos aos; por tal razn tales contribuciones no
deben contabilizarse como si fueran iguales en d denominador.
Por tal drcustancia, cuando se mide la incidencia de un evento en
un grupo o cohorte mvil se debe observar el nmero de casos que se
presentan en el periodo estudiado y el tiempo durante el cual han estado
expuestos los sujetos observados; el primer dato corresponde al numerador
y el segundo al denominador, con base en ellos se calcula una tasa de
incidencia en vez de una proporcin (ElantJohnson, 1975; Kleinbaum y
colaboradores, 1982; Rothman, 1986). As, si en un tiempo-exposicin de
4 .
La mtdfcdn m epidemiiagto/35
trescientos aos se presentan treinta casos se dice que la de incidencia
es de diez casos por cada cien aos-persona-exposicin.
Incidencia, prepotencia y duracin
La incidencia cuantifca eventos que se presentan o suceden por primera
vez durante un determinado perodo, a diferencia de la prev alenda que
ignora el momento inicial de la ocurrencia del evento y slo se ocupa del
nmero de eventos existentes en un determinado momento. La incidencia
es una medida dinmica de la ocurrencia de los hechos, en tanto que la
prevalencia es una medida esttica de los mismos.
Aunque son medidas de naturaleza distinta* existe una reladn im
portante entre ellas determinada por la duracin del evento que se mide.
Por ejemplo, si se trata de una enfermedad que tiene a la vez una elevada
incidencia y una larga duracin la prevalencia de ella en un determinado
momento ser elevada por el efecto acumulativo de la frecuenda de casos
en el tiempo; por el contrario, si se trata de otra enfermedad que tiene
la misma incidencia que la primera pero que es de muy corta duracin,
su prevalencia en un determinado momento ser ms baja que la de la
primera.
Cuando se interpretan medidas de prevalencia se deben considerar
los factores que afectan no slo la inddencia sino tambin la duradn de
la enfermedad; as, la prevalencia de una enfermedad puede ser elevada,
bien porque la incidencia es alta o porque los sujetos permanecen enfermos
durante mucho tiempo por falta de atencin mdica, porque se evita la
mortalidad o por otras causas. Por ejemplo, la prevalenda de sida en una
pobladn puede aumentar por el descubrimiento de un buen tratamiento
que prolonga la vida; de igual manera, la prevalencia de malaria en una
regin puede aumentar porque los enfermos no son tratados oportunamente
o, tambin, por un aumento en la incidencia.
Naturaleza de las medidas epidemiolgicas
El propsito ltimo de la epidemiologa es el de aportar conocimientos
cientficos que permitan la prevencin de la morbimortalidad y el logro de
un mejor estado de salud para la poblacin. De este modo, la epidemiolo
ga observa y mide tanto la frecuencia como las caractersticas de la enfer
medad, adems de los factores reiadonados con su presentacin. La
medidn que se hace con este propsito se expresa casi siempre por medio
de tres formas bsicas: razones, proporciones y tasas.
36/Mttodoloi<adet*intttittKfdn.,.
Razones
En un sentido amplio, toda razn es una medida que compara una cantidad
con otra por medio de una divisin y en un sentido restringido, es una
operacin mediante la nial se comparan por medio de una divisin dos
cantidades de naturaleza diferente con el propsito de expresar una relacin
existente entre ellas. Si la razn por sexo, hombre/mujer, de personas in
fectadas por el virus de inmunodeciencia humana en una determinada po
blacin es de 10/1 en que en una segunda poblacin es de 10/5 se
dispone de una informacin que puede reflejar la existencia de distintas
conductas sexuales en las poblaciones comparadas yvpor este motivo di
ferentes vas de trasmisin del virus del sida; de esta forma pueden propo
nerse diferentes estrategias de atencin y de prevencin para ambas
comunidades.
Proporciones
Una proporcin es una medida que expresa la frecuencia con la cual se
presenta cierto hecho o evento con respecto al total de unidades observa
das; en otras palabras es una medida que expresa la relacin de una parte
con el todo. Por ejemplo, si en una poblacin de 500 trabajadores de una
fbrica se presentan en el trascurso de un mes 25 casos de intoxicacin por
inhalacin de un gas, la proporcin de incidencia durante el tiempo obser
vado es de 25/500, o sea de 0,05. Del mismo modo, si en 200 mujeres
obesas se encuentran en l momento 40 hipeitensas, la prevalencia de la
hipertensin en este grupo se puede expresar claramente por la proporcin
40/200, o sea 0,20.
Una proporcin es, con toda propiedad, una medida de frecuencia
porque para hallar su valor es necesario contar, a diferencia de otras me
didas como el promedio que se utiliza para describir el comportamiento de
variables continuas tales como el peso, la presin y la temperatura, entre
otras; por otra parte, conviene advertir que siempre toma valores compren
didos entre 0 y 1, Es usual y conveniente expresar el resultado de una
proporcin como un porcentaje, o sea el resultado que se obtendra si el
nmero total de observaciones hubiera sido cien, para la cual basta mul
tiplicar el resultado obtenido por este nmero; as, si de un grupo de 80
adolescentes observados durante un periodo 20 desarrollan adiccin a
las drogas en un ao, la incidencia anual de sta es del 25%, o sea,
(20/80)xl00.
mhUAi *ftepid*miootia/37
^ son medidas muy tiles para el anlisis de la infor
macin epidemiolgica porque tienen como base comn el nmero cien lo
cual permite hacer comparaciones de la frecuencia con que se presenta un
cierto hecho en grupos o poblaciones de diferente tamao; por ejemplo si
t u n a poblacin de 400 personas se encuentran 40 hipertensas y otrade
600 se encuentran 60 se puede afirmar que la prevalence de
es gualcn ambos grupos, 10%, o lo que es igual, que en ambos grupos
10 de cada 100 personas sufren hipertensin. De modo similar, si la inci
dencia de linfomas en un grupo de 200 personas expuestas durante cierto
empo a las nugaciones ionizantes es de 10 casos y en un grupo de 300
personas no expuestas es de 9 casos, la incidencia habr sido mayor en el
grupo expuesto que en el grupo no expuesto la cual corresponde al 5% y
al 3%, respectivamente.
Las proporciones o los porcentajes son medidas que se utilizan fre
cuentemente en epidemiologa porque permiten expresar la frecuencia de
la enfermedad en trminos de incidencia o prevaleca; tambin mostrar en
qu medida una poblacin est expuesta a un determinado factor de 'riesgo
y comparar los riesgos de enfermar o de morir de diferentes grupos, enire
otros usos. La proporcin de incidencia de una enfermedad en un cieno
penodo mide el nesgo de enfermar, nocin supremamente til en la inves
tigacin epidemiolgica; supngase que en un grupo de 300 profesionales
expuestos durante un periodo de 10 aos a las radiaciones ionizantes se
observa una incidencia de 15 casos de linfoma, se dice entonces que en tal
poblacin el nesgo de desarrollar un tumor de esta naturaleza, en un pe-
nodo de 10 aos, es de 15/300, o sea del 5%.
La comparacin de los riesgos de enfermar que tienen las personas
expuestas y las no expuestas a un factor de riesgo tiene especial importan-
ca en j o s estudios epidemiolgicos de tipo etiolgico, tal como se presenta
ms adelante.
Tasas
Aunque el trmino tasa se ha utilizado frecuentemente en el rea de la
salud para denominar a cualquier medida relativa, incluso las proporciones
H i l a terminologa moderna se reserva para una medida que expresa
frecuencia con la cual se presenta determinado evento en el tiempo H
numerador de una tasa es l nmero de eventos y el denominador es el
tiempo hbil durante el cual estos han ocurrido; por ejemplo, en una em-
presa en la cual se utiliza un colorante que causa lesiones en la piel se*
3 8 /U e w t fta t h lafatigaru.
desea estimar la incidencia anual de casos por medio de una tasa, entonces,
el numerador de sta ser el nmero de obreros afectados en un ao y el
denominador d tiempo total durante el cual se presentaron las lesiones o
tiempo total de exposicin, d cual resulta de la suma de los tiempos en
que los obraos pudieron sufrir las lesiones.
As, si un obrero no present la enfermedad durante todo el ao su
contribucin al denominador de la tasa s a i de un ao, s ovo se enferma
a los seis meses y permanece como tal contribuye con medio ao-exposi
cin y si uno se retira de la empresa al tercer mes a partir de su ingreso
contribuye con un cuarto de ao-exposicin al denominador de la tasa de
incidencia; de modo similar se calcula la contribucin que cada persona
expuesta hace al tiempo total de exposicin para determinar finalmente el
denominador de ella en trminos del nmero de aos durante los cuales las
personas permanecieron expuestas o simplemente d nmero de aos-persona-
exposicin. Por tanto, una tasa expresa 1 nmero de casos que ocurren por
de tiempo y, de modo similar a como lo hace una proporcin, tambin
expresa d riesgo que tienen las personas de enfermar o de morir.
Cuando se trata de grupos numerosos, por ejemplo una ciudad, es
prcticamente imposible medir con exactitud el tiempo total de exposicin
de las personas al evento estudiado; no obstante d nmero de personas
vivas, si se trata de mortalidad, o sanas, si se trata de morbilidad, que se
encuentran a mitad del periodo estudiado es til como una aproximacin
al tiempo total durante d cual ellas han estado expuestas al riesgo de morir
o de enfermar; por esta razn, con el fin de estimar d tiempo de exposi
cin se uss con frecuencia como denominador de las tasas a la poblacin
existente a mitad de periodo.
Muchas veces d valor de una usa es una cifra muy pequea com
puesta por un nmero fraccionario que tiene varias cifras decimdes debido
a que la incidencia de ciertos eventos es rdativamente baja y los grupos
en los que se presentan son numerosos; as, si en diez mil aos-exposicin
se presentan 20 casos de una enfermedad, la tasa anual de incidencia es de
0,0020. Con el fin de facilitar la interpretacin se suele expresar el valor
de las tasas en mltiplos de diez de acuerdo con d evento por ellas refe
rido; por ejemplo, las de natalidad y de mortalidad convencionalmcai'
te se expresan por mil, en tanto que las tasas de incidencia de cncer se
expresan por den mil. Se debe notar adems que una tasa, a diferencia de
una proporcin, puede tomar valores superiores a 1#0 si se utilizan unida
des amplias de tiempo en d denominador.
l a mekkk a t epidemiologa / 3 9
a s s r r - ~ ^ q" s z s r s
ssl^ssss
Medicin de la asociacin con factores de riesgo
- p i - j s s j M ; s : s s ; - t i -
t o f o refaA'w
^dTiTt ~ z ? tar " s""
4 0 /Metodologa de Jo arvarigocifa-.
Ri PI, R TI,
R R s ~r = 1 % ' otamidn: R R m j Q B l f
Por ejemplo, s se conoce que el riesgo R# que tienen las mujeres no
expuestas &los anticonceptivos orales con alto contenido de estrgenos de
sufrir hipertensin durante su periodo reproductivo es de 0,15 y que el
riesgo R que tienen las expuestas a dicho factor es de 0,23, la asociacin
entre el uso de anticonceptivos orales e hipertensin se puede expresar por
medio de la relacin R/Rq o riesgo relativo Jf:
. i W . M ,
Ro 0 ,1 5
Tal resultado expresa la idea de que por cada caso de hipertensin
que ocurre entre las mujeres no expuestas a los anticonceptivos orales se
presentan 1.53 casos entre las expuestas. En general, si el riesgo de enfer
mar de los expuestos es mayor que el de los no expuestos, es decir si el
riesgo relativo es mayor que 1,0, se puede afirmar que existe una asocia
cin positiva entre la exposicin al factor y la iocidencia de la enfermedad..
Por su pane, un resultado de tal divisin igual a 1,0 indicara inexistencia
de asociacin y un resultado menor de 1,0 que la posicin al factor es
tudiado confiere un efecto protector,
El riesgo relativo expresa el grad de asociacin existente entre la
exposicin a un factor de riesgo y la incidencia de la enfermedad, razn
por la cual es una medida muy importante par los estudios epidemiolgi
cos que pretenden identificar factores causales o ecolgicos. Sin embargo,
es una medida que no considera la frecuencia con la cual la poblacin est
expuesta a un factor de riesgo y, por tanto, no es til para la cuantificacin
del impacto que la exposicin a un determinado factor tiene sobre la mor-
bimortalidad de una poblacin; para tal propsito la epidemiologa recurre
a la medicin del riesgo aribuible, concepto que se expone a continuacin
(Wate, 1978).
Riesgo atribmbk
La comparacin de la incidencia de la enfermedad que se presenta en los
expuestos a un determinado factor de riesgo con la que se presenta en los
no expuestos a dicho factor se puede establecer mediante la diferencia de
las proporciones de incidencia o entre las tasas de incidencia. En el primer
La medicin n p&miobgta/4]
* k p roporei * i " tdi- d * < * - -
os expuestos al factor de nesgo y como P0 a la observada en el gmpo de
Z n cajcular P/' ' P!o * tendr una medida de !a d i e n -
cw en la mcidencia entre expuestos y no expuestos al factor de riesgo, es
^ K d a * ' Posicin al factor - c o n el su-
P que los grupos comparados se encuentran en igualdad de condi
ciones con respecto a los dems factores causales; a esta medida se le
conoce como riesgo atribuible en expuestos RAE.
sin J Z S * ? 0 5 *! COOCe que Ia W i n de incidencia de hiperten-
S e s T n i * U t a . anticonceptivos
S ^ 1 C0ntenld0 * ^ 8 es del 20% y entre quienes no los
utilizandelI 12, entonces, la diferencia absoluta 0.20 - 0,12 = 0,08 muestra
KZT,* 188p " 8%T
S k s ^ t c o L r C ad entre las 8e8undas- Tal diferencia seflala a
COrD W f m 0 r de ^ 6 0 para la hipertensin e indica
^ eStaS un " cs * desarrollar la enfermedad
S e a L ? Ue qUiene5 D0 ,0S UIiza* el de riesgo se
debe a la exposicin al factor o sea es atribuible a ste
exnMmc md T I,Br k ^ferencia en la incidencia entre expuestos y no
m t a ^ c l T ^ med ^ Una 8ustraccin las r e s p L -
la d i a r i a 9f H * * COm medidas * incidencia; en tal caso.
^ , absoluta entre 185 t adopta la forma 77, - 77* la cual es
atnbwble a la exposicin a] factor de riesgo.
eUas 0 f e c 2 ^ te smPcidad de estas diferencias absolutas,
ellas ofrecen alguna dificultad en su interpretacin por cuanto no se refie
p ^ o T i t d t r r 3^ e j c n ,p i u n a d i f e r e n c a M t r e ,a s
d e 0 2 0 ^ S e t ^ l de.eXpues,os > de no P * cM un valor
Z a ? ^ O S s T Z ' M? ' n*S T dfCTen S COm las correspondien-
diferenciad * S " *** motlvo * P * * * 1 establecer estas
S n Z T ^ lo cual
peroite expresarlas con respecto a ia incidencia propia del grupo no ex
puesto o con respecto a la incidencia propia del grupo expuesto.
Exceso del riesgo relativo
Para tal fin se tiene entonces la medida relativa:
W P h
4 2 /Uteolo$ia de fa ftneefjaokta..
o tambin, cuando ce utilizan tasas como medida de frecuencia:
T l -
n o
Al efectuar ia divisin de cada uno de los tnninos del numerador
por el denominador se obtienen, respectivamente, las medidas:
J Z L . i y L . !
? h T*o
que se conocen como medidas del exceso del riesgo relativo pesque
indican la diferencia que existe en dicha medida entre los expuestos y los
no expuestos quienes por definicin presentan un riesgo relativo igual a
1,0. Si en un estudio de la asociacin entre un factor de riesgo y una en
fermedad se obtiene una estimacin del riesgo relativo i goal a 3,0 se puede
conocer que la estimacin del exceso del riesgo correspondiente al factor
es de 2,0; o sea, los expuestos tienen un riesgo que cede en 2 unidades
al que tienen de enfermar quienes no lo estn.
Riesgo atribuible en el grupo expuesto
Esta expresin se obtiene al dividir el resultado de la diferencia entre las
proporciones o tasas de incidencia de expuestos y no expuestos entre la
incidencia propia del grupo expuesto, medida a la cual se le conoce como
proporcin del riesgo atribuible en expuestos PRAE o fraccin etiolgica
del grupo expuesto. A maneta de ejemplo, supngase que la proporcin de
incidencia anual de bronquitis en personas expuestas al tabaquismo es de
030 y que dicho valar en no expuestos es de 0,10; si se quiere conocer la
proporcin de la incidencia de bronquitis debida al tabaquismo entre los
fumadores se divide la diferencia Plj - Po entre la proporcin de inciden
cia del grupo expuesto: r
lo cnal muestra que el 67% de la incidencia de bronquitis que se
presenta entre quienes estn expuestos al tabaquismo se debe a dicho factor
y que el 33% se debe a otros.
La mtdkiH o tpidmWogl /4 3
En algunas situaciones particulares conviene expresar la proporcin
del riesgo atribuible mediante la siguiente trasformacin, la cual se obtiene
al dividir cada uno de sus trminos entre la incidencia relativa de] grupo
no expuesto sin que se altere el valor de la relacin:
PRAE P! ' PI - P, m * ' P * * 1
Pl, PJ, /Pl0 = RR
Si se estudia, en cambio, el efecto de la exposicin a un factor pro
tector, por ejemplo una vacuna, la magnitud relativa de ste se expresa
como la diferencia entre la proporcin de la incidencia que ocurre en los
no expuestos al factor PI$ y la proporcin de incidencia propia de los ex
puestos al factor PI con respecto a la incidencia propia de los no expues
tos, Esta medida recibe el nombre de fraccin prevenible FP, la cual refleja
la magnitud de la disminucin en la incidencia de la enfermedad que se
lograra en los sujetos no expuestos al factor protector si-tal grupo recibiera
el beneficio de la exposicin:
F P = ^ I i
P o
Riesgo atribuible en la poblacin
Adems de las diferencias antes mencionadas, existe una importante en
epidemiologa que muestra la parte de la incidencia de una enfermedad que
en la poblacin total ocurre como consecuencia de la exposicin a un fac
tor de riesgo, la^ca se denomina riesgo atribuible poblacional RAP que
en tmnos abslts es simplemente la diferencia Pit PI0, en donde Plt
es la proporcin de incidencia de la enfermedad en la poblacin total!
expuestos y no expuestos, y P0 es la proporcin de incidencia entre los
no expuestos. .
En trminos relativos, el riesgo atribuible poblacional se expresa co
mo la proporcin de la incidencia total que se atribuye al factor de riesgo
o proporcin del nesgo atribuible poblacional PRAP, medida que se co
noce tambin como la fraccin etiolgjca poblacional:
p r a p = p l 3 l
44/Mtodoiogio de le iavttHgoein...
As, si la proporcin de incidencia anual de infarto del miocardio en
la poblacin adulta de cierta localidad es de 0*06 y en los no fumadores
adultos es de 0,03 la proporcin de la incidencia total de tal evento atri
btale al tabaquismo es:
0,06 - 003 _ _
^ = f t 5
lo cual muestra que e] 50% de la incidencia de infarto del miocardio
que se presenta en la poblacin adulta se debe al tabaquismo o, lo que es
igual, que si se suprimiera este factor en dicha poblacin se reducira la
incidencia de la enfennedad en un 50%. Ntese que el 50% restante de la
incidencia se debe a otros factores.
En algunas situaciones conviene expresar la proporcin del riesgo
atribuible poblacional en funcin de la proporcin de la poblacin que se
encuentra expuesta al factor de riesgo pE y del riesgo relativo que caracte
riza la asociacin mediante la siguiente expresin, en la cual se advierte
que el impacto preventivo que se lograra en la poblacin al suprimir la
exposicin a un determinado factor de riesgo depende tanto de la magnitud
del riesgo relativo como de la exposicin a dicho factor:2
pe (RR -
PRAP * y *
Pb (RR . 1) + /
Como se puede advertir, el conjunto de las diferencias que muestran
el riesgo atribuible miden el impacto que tendra la prevencin de la expo
sicin a los factores de riesgo y son, por tanto, medidas de gran importan
2 La tmfoRDBCite se logra modn te la tigmentes w ahucien:
Ph *P b (pe PU * O Pt W - Ph
PRAP
Ph pi Pti + 0 pe) Ph
Pe (Ph RR) * (/ pe) Ph Ph
m
ps(PhRR)* U pe) Ph
pe (RR */)
La mdkit n epidemictog/45
cia como a t e r i o s orientadores en la toma de decisiones en el sistema de
la salud publica.
Adems de las medidas que se discuten en las pginas precedentes,
en el captulo 12 se presenta la medicin de la mortalidad en trminos de
anos de vida potencialmente perdidos y la de la prdida de aos de vida
saludable por mortalidad prematura y por discapacidad, conceptos que de
algn modo estn relacionados con la supervivencia.
References bibliogrficas
1. Colira6n KM. Fundaments da epuUmioiogfa. Madrid, Diaz de Sanies, 1990.
2' m^WrL D<f ? ili0n.V * SOme retnark8 " lWr U5e d ** Americw,
Journal <rf Epukmiology. 1975; (102): 267-271.
3' ^ w " n f T i m ndD,'0nJ 0/ M 'avi0tal *StarCk New Yort- Holt- and
> * , KUPP^ m,1" A f p 0 td t * * ^ * * # r M u lto c r iM ,
Methods. Belmont, California, Wadswwth Publishing Co., 1978.
5. K M * D O . Kuppcr LL. M o r t e m H. Epidemiologic Research. Belmont. CsJifor-
ma, Lifetime Learning Publications, 1982.
6' ^ ^ ^ ^ 974. ^ DeSCriPVt S,a,i* ic* f r S o c i o l o g y Boston, Allyn and
7. Rothraan KJ. Modem Epidemiology. Bosran, Unle. Brown, and Co., 1986.
8. Stevens SS. On the theory o f scales of measurement. Science. 1946: (103): 677-680
, Sj ^ CUk? n ^ bu,lble risk fr0m *PMwSoloBil da. t e M W Jour-
nol o f Epidemiology. 1978; (7): 157-182.
experimentales
En este captulo se presentan los principios de la investigacin expe
rimenta], los cules son a su vez el punto de partida de la investigacin
observacional^ en epidemiologa; se precisan sus posibilidades y sus
limitaciones y se exponen algunas consideraciones ticas importantes.
J - i a adopcin de la estrategia propia de los estudios experimentales por la
investigacin epidemiolgica y su progresivo perfeccionamiento se ban da
do en forma paralela con el desarrollo de la metodologa cientfica que
caracteriza a los ltimos cuatro siglos.
A este respecto es importante mencionar, entre otros, los trabajos
comparativos de Graunt en Inglaterra con base en los registros de mortali
dad (Graunt, 1662); los de Lind en el siglo XVM sobre la ingesta de c
nicos como tratamiento para el escorbuto (Lind, 1753); los de Josepb
Lister en el siglo XIX sobre el efecto de los antispticos en la mortalidad
4 8 /Metodologa de h irvtsiigocin.-
debida a las amputaciones (Lister, 1870); los aportes metodolgicos de
Claude Bernard y de John Stuart Mili a finales del siglo XIX (Bernarda
1865; Boring, 1954); los de Goldberger y colaboradores a principios del
siglo XX acerca de la prevencin de la pelagra y los importantes traba*
jos de Ronald Fisher que en el decenio de los veinte fijaron definitiva
mente las bases metodolgicas de )a investigacin experimental (Fisher,
1926).
Estrategia
La estrategia que caracteriza a la investigacin experimental consiste en
la asignacin aleatoria de unidades de observacin como semillas, per
sonas o comunidades a diferentes grupos o tratamientos definidos por el
investigador con el propsito de evaluar diferencias en un efecto de in
ters. Un investigador, por ejemplo, puede repartir aleatoriamente un
grupo de pacientes con diagnstico de hipertensin moderada en dos o
ms grupos definidos por diferentes esquemas de tratamiento, con el fin
de comparar la disminucin en la presin arterial producida por estos
despus de un tiempo prudencial. De este modo, la estrategia fundamen
tal de los estudios experimentales se puede esquematizar como se mues
tra en la figura 3.1.
Asignacin aleatoria
Tratamiento ffecto
____ A ____________ Yi
Y2
Ya
Figura 3.1 Estrategia bsica de los estudios experimentales
Los dos elementos fundamentales de la estrategia de los estudios ex*
perimentales son:
Estudia e^erimentaks / 4 9
1. La asignacin aleatoria de las unidades de observacin a los tra
tamientos, con io cual se busca conformar grupos que estn en igualdad de
coadiciones con respecto a las dems variables relacionadas con el efecto.
En el ejemplo citado, la asignacin aleatoria de acuerdo con el compor
tamiento usual del azar debera formar grupos de pacientes hipertensos
similares con respecto a ia edad, al sexo, a la obesidad y a las dems
variables asociadas con la enfermedad.
AI conjunto de variables asociadas con el efecto estudiado se les
denomina caractersticas de base, los valores que ellas toman al momento
de conformar los grupos se suelen presentar como pane importante de la
ejecucin y del informe de cada trabajo experimental.
2. La definicin de los grupos o tratamientos por parte del investi
gador, lo cual le permite ejercer un control sobre la variable inde
pendiente. En el ejemplo citado, el investigador puede definir los
tratamientos que han de ser evaluados y aplicarlos a los grupos observados,
por ejemplo dieta sola y sta ms actividad fsica.
En muchos estudios experimentales de carcter epidemiolgico los
grupos o tratamientos estn definidos por la exposicin de inters; mientras
que en los estudios observacionales, tal como se ver ms adelante, el in
vestigador est limitado a observar la exposicin o el tratamiento en el
cual, por uno u otro motivo, se coloca a cada sujeto participante. Adems
en los primeros la comparacin del efecto estudiado se hace usualmente
entre dos grupos: el que recibe un tratamiento de inters, el cual se deno
mina grupo experimentalt y el que recibe un tratamiento diferente o un
placebo* con el fin de tener un punto de comparacin o de referencia, el
cual se conoce como grupo control.
Debido ^ las consideraciones ticas que se imponen a la experi
mentacin con seres humanos que exigen el consentimiento de las
personas y ciertas condiciones favorables para su participacin en deter
minado estudio la poblacin de sujetos en la cual se realiza el expe
rimento suele reducirse como consecuencia del rechazo voluntario de
algunos y a la exclusin de otros a criterio del investigador; por ejem
plo, debido a la inconveniencia de someterlos a tratamientos que pueden
producir los efectos negativos o porque ya no son susceptibles de recibir
el beneficio buscado.
El conjunto de sujetos que finalmente participan en el estudio, vo
luntarios y elegibles, conforman la poblacin de estudio. La figura 3.2
ilustra el proceso de seleccin de ios participantes desde la identifica-
5O/M0oiag* e la meififaddtt-
cin e la poblacin de referencia, aqulla a la cual se pueden genera
lizar los resultados del experimento, hasta la conformacin de los gru
pos o tratamientos.
Figura 3.2 Proceso secuencial para la seleccin d e los participantes y defini
cin d e los grupos comparados e n la investigacin experimenta)
Conviene advertir que no siempre es fcil definir con precisin la
poblacin de referencia ya que el proceso de generalizacin de resultados
implica la abstraccin de caractersticas y condiciones que son propias de
Estudios experimentla/5J
la poblacin experimental. Los resultados de un estudio experimenta] rea
lizado con personas de raza blanca con miras a establecer la superioridad
de un esquema de tratamiento para la hipertensin moderada posiblemente
no pueden ser aplicados a personas de otras razas; sin embargo, lo resul
tados de un estudio experimental realizado en personas de un cierto grupo
racial para demostrar la efectividad de una vacuna como medio para pre
venir una enfermedad, posiblemente puede generalizarse a personas de di
ferentes grupos tnicos.
En el estudio experimental conocido como Programa para la de
teccin y el seguimiento de la hipertensin realizado en Estados Unidos
(Hipertensin Detection and Follow-up Program Cooperative Group,
1979), se identificaron 14 comunidades de diversas caractersticas con
una poblacin de 178.009 personas de ambos sexos, con edades com
prendidas entre los 30 y los 69 aos, que fueron consideradas como
poblacin experimental. Mediante un proceso secuencial de tamizacin
se detectaron finalmente 10.940 hiperteasos, con un promedio-de pre
sin arterial diastlica igual o superior a 90 mmHg, los cuales confor
maron la poblacin de estudio y fueron asignados aleatoriamente a dos
grupos de tratamiento: el grupo experimental, terapia antihipertensiva
escalonada, y ei grupo control, terapia antihipertensiva tradicional. La
observacin de estos durante un periodo de cinco aos mostr una me
nor mortalidad en el grupo sometido a una terapia escalonada que aqul
que recibi la terapia usual.
A manera de ilustracin, en ]a tabla 3.1 se presentan los valores ini
ciales de las caractersticas de base de los participantes en el estudio men
cionado, los cules permiten apreciar la similitud de los dos grupos
comparados.
Como resultado dei proceso de seleccin de los sujetos que deciden
cooperar as como de aquellos que son elegibles para participar en el estu
dio, es posible que la poblacin de estudio difiera notablemente de la po
blacin experimental con lo cual se dificulta la aplicacin de lo* resultados
a esta ldma (Wilhelsmem y colaboradores, 1976).
En un estudio de intervencin de carcter preventivo para la enfer
medad coronaria realizado en Suecia se demostr que los participantes en
el grupo experimental n 7455 diferan en factores pronsticos asociados
a la enfermedad con respecto a quienes fueron seleccionados inicial mente
para participar en l pero que por diferentes motivos se negaron a hacerlo
n = 250J. En condiciones como sta la generalizacin de los resultados
52/Mttodolotto & b iimigoeitu..
Taba 3 . 1 Caractersticas d e los participantes e n el P rogram a p a r e la d e t e c
c i n y e l se g u im ie n to d e le h ip e rte n si n , Estados Unidos, 1 9 7 9
C an a erlstica sd eb se Grt^Do experiment! G ru p o p la o b o
Nmero 5485 5455
Promedio de edad en aos s o 50,8
Hombres blancos 54,5% 34,1%
Mucres blancas 21,6% 21,2%
Hombres negros . 19.4% 19,9%
, Mujeres negras 24.5% 24,8%
'Promedio de presin sistlica 159,0 mmHg 158,5 mmHg
Promedio de presin diastfca 101.1 mnrflg 101,1 mmHg
Pubo 81,7 pul/min 82,2 pul/min
Promedio de coleste rol 235.0 mg/dl 235,4 mg/dl
Fumadores > 10 cigarrillos diarios 25,6% 26,2%
Promedio de peso deseable 124,4 Ib 125,01b
Promedio de creatinina srica 1,1 mg/dl 1,1 m g / d
Promedio de glucosa plasmtica 178,5 mg/dl 178,9 mg/dt
Hipertrofia ventricular izquierda por l CG 4,8% 5,1%
Historia de accidente cerebrovascular 2,5% 2,5%
Hinoria de infarto del miocardio 5,1% 5,2%
Historia de diabetes 6,6% 7.5%
Medicacin antihipertensiva 26,3% 25,7%
Puente; Hipertensin Detection and Foliosv-up Program Cooperative Group. Five-year
findings of the hipertensin detection and follow-up program: 1. Reduction in
mortality of persons with high blood pressure, including mild hipertensin.
JAMA 1979; (242): 2564.
obtenidos a la poblacin experimental es cuestionable, no obstante si se
comprueba que las caractersticas de base de los sujetos que se niegan a
participar y de aquellos que no son elegibles son similares a las de la po
blacin de estudio es posible la aplicacin de los resultados obtenidos a la
poblacin experimental.
ClasificadD
Los estudios experimentales en epidemiologa pueden clasificarse segn su
propsito en dos grandes grupos: teraputicos y preventivos.
Los estudios teraputicos tienen como finalidad evaluar tratamientos
para enfermedades ya diagnosticadas y reciben comnmente el nombre de
ensayos clnicos aunque estos no pretenden aportar un conocimiento que
54 fMmdologfa e la tovatifflcidk..
No. e n A : . 5 6 5 484 308 ISA 104 62
Riesgo A : 556 496 340 214 134 76
Figura 3 . 3 Anlisis d e la tabla d e supervivencia qu e muestra el porcentaje
e pacientes libre d e un tumor d e mama c on posterioridad a la
mastectomia parcial MP, o a la mastectomia pardal c o n irradia-
cin MP * RX
fuente; Fssher et al. five-years results of a rarvdomized dincal trial comparing total mas
tectomy and segmentai mastectomy with or without radiation in the treatment
of breast cancer. New Engfend Journal o f Medicine. 1985; (312): 669.
con la adopcin formal e esta vacuna por el sistema de salud pblica de
Estados Unidos (Francis y colaboradores, 1955).
En el estudio conocido como Programa de clnicas de investigacin
en Upidos (Lipid Research Clinics Program, 1984), con el fin de contar con
un nmero de eventos que permitiera establecer resultados concluyentes, se
asignaron aleatoriamente 3806 personas consideradas como de alto riesgo,
las cuales eran hombres de edad con hipercolesterolemia, a dos
grupos que fueron observados durante 7,4 aos*, el grupo experimental re
cibi un tratamiento con colestii&mina coa el fin de reducir los niveles
56/Hetedoiogta e U towftigadu.
Tamao muestrai
Uno de los aspectos metodolgicos de mayor importancia en la realizacin
de un estudio fxr^nental es relacionado con el tamao muestrai Mu
chos estudios experimentales no logran demostrar las hiptesis que preten
den debido al insuficiente tamao de la poblacin de estudio; a este
respecto es de "* importancia advenir que los estudios realizados con
un muestrai insuficiente implican, adems de los inconvenientes
mwpA-w a los participantes, un despilfarro intil y casi siempre cuantioso
de r*#*Ttlpn y de recursos materiales y humanos (Fteman, 1978; Alonan,
1980).
El ""fin mnwHal depende de la frecuencia con que ocurre el even
to observado por ejemplo el infarto del miocardio en nn estudio para
prevenir la enfermedad coronaria y de la magnitud de la diferencia an
ticipada en el efecto entre los grupos de tratamiento; es claro, que la de
teccin de diferencias pequeas exige muestras numerosas. As, un estudio
ejtpfriTnm*i realizado para analizar el efecto del consumo diario de aspi
rina en la prevencin del infarto del miocardio realizado en sujetos con
comprendidas a me los veinte y los cuarenta aBos requiere un ta
mao muestrai mayor que si se realiza en sujetos con edades entre los
cuarenta y los sesenta aos, debido a que tal evento ocurre con menos
frecuencia en el grupo de sujetos ms jvenes. Este hecho es un argumento
a favor de los estudios de campo que se realizan en poblaciones de alto
riesgo.
La imposibilidad de contar con un nmero suficiente de participantes
en una sola localidad sugiere la conveniencia de realizar el estudio con la
participacin de varias poblaciones, estrategia que da lugar a los denomi
nados estudios muitieentro (Lilienfeld, 1981). En el estudio conocido como
Ensayo de intervencin sobre mltiples factores de riesgo para la morta
lidad por enfermedad coronara participaron 22 centros clnicos para el
seguimiento durante 7 aos de 12.866 hombres entre 45 y 57 aos de edad
considerados como de alto riesgo por tener hipertensin, niveles altos de
colesterol y ser fumadores, quienes se asignaron aleatoriamente a dos gru
pos de tratamiento: atencin mdica usual y medidas preventivas para el
control de los factores de riesgo (Mltiple Risk Factor Intervention. Trial
Research Group, 1982).
Los condicionantes del tamann muestrai se reflejan en la frmula
que gua la estimacin del tamao requerido para la realizacin de la ma
4 .
Estudios txpemtntlt/57
yora de los estudios experimentales, en los que se pretende probar la hi
ptesis de la existencia de una diferencia entre dos proporciones o hiptesis
alternativa contra la hiptesis de la inexistencia de dicha diferencia o hip
tesis nula (Donner, 1984):
. _ Za V/2P (1 P)\+ Z 'i(PE (1 - P J + Pc II - Pc)lj>
s 2
en donde:
n es el tamao de cada grupo
y son ios valores de la variable normal estndar correspon
dientes a las probabilidades de errores tipo I y tipo n , respectivamente, y
que son definidas por el investigador (Vase el captulo 13 para una defi
nicin de los errores tipo 1 y II)
Pc *s la proporcin anticipada en el grupo control de acuerdo con
conocimientos previos
PE es la proporcin anticipada en el grupo experimental
P es igual a (PE + Pcy i
8 es igual a PE P^ la diferencia mnima en las proporciones que
se considera importante detectar desde una mirada clnica o cientfica y que
tambin es definida por el investigador.
Para la correcta aplicacin de tal frmula es importante considerar
las siguientes observaciones:
1. En la prctica slo se conoce ei valor de Pc con el cual se puede estimar
?e Pc + 8 CSIa ltima definida por el investigador.
2. La expresin permite, obtener el tamao muestral n de manera aproxi-
mada.
3. Si el diseo del experimento contempla Ja asignacin de los sujetos a
los grupos de tratamiento de manera equiparada, la frmula anterior pro
duce un tamao muestral algo mayor que el requerido.2 Ante las dificulta
des prcticas que surgen para estimar por anticipado el efecto del
1 Si se desea incorporar la eomccia de continuidad a las pruebas estadsticas correspondientes
ae pcee bercera ar el vakir o t ea ido mediante la iplicido de dicho tomla ea el valor
resultante de
Z/IPe - P cI
2 Vase en al enrulo 9 lo relacionado con el equipanaiiento.
58/M tM *tta*bBn**FXtn"
equiparamiento sobre el tamao muestral, algunos autores recomiendan ig
norar este efecto y calcularlo mediante la frmula citada (Scfalesselman,
1974) La siguiente situacin ilustra la aplicacin de la determinacin del
tamao maestral en un ensayo clnico en el cual se trataba de p r o t o l a
hiptesis de la superioridad de un tratamiento alternativo para los pacientes
con diagnstico de sida frente a una terapia ya conocida que produca una
mejora de los sntomas en el 40% de los tratados. Los investigadores con
siderarn que el estudio se justificaba si el tratamiento altemanvo incre
mentaba la mejora de los pacientes en un 20% o ms; adems, aceptaron
exponerse al riesgo de equivocarse en las conclusiones d d estudio segn
un error de tipo I el 5% y de tipo n , del 20%.3
De acuerdo con la frecuencia de la mejora observada en los pacien
tes tratados con la terapia ya conocida y con los criterios fijados por los
investgadom* se tiene que:
0>40 + 0,60 s
4 = 1,64; Zp = 0,84; P ------- ^
1,64 '[2(0,S0)1) * OM <0.60(0.40) + 0,40(0.60))}*
s: ( 0 , 2 0 ?
= 75,85 sujetos en cada grupo
Con respecto a ros aspectos relacionados con el clculo del tamao
muesca) en los estudios experimentales el lector puede consultar obras ms
especializadas sobie el tema (Feinstein, 1977; Fleiss, 1981; Fnedman y co
laboradores, 1981; Dotrner, 1984; Meinert, 1986).
AgrupamitUo r
En situaciones en las cuales se desea asegurar que la distribucin de los
pupos de tratamiento sea homognea con respecto a un factor o grupo de
factores - e n vez de suponer que la autorizacin produzca tal e f c t ^ - o
rm it* se quiere aumentar la eficiencia de la informacin lo cual per-
3 VH. en el coludo 13 lo ! *
epMemioigMC*.
oudto ejp erin m a U j/5 9
nuna reducir el tamao muestral requerido bajo otras modalidades del
diseo es posible equiparar los sujetos asignados a los grupos de trata
miento de acuerdo con los valores observados en Ules factores. Asi, si se
quiere asegurar que la composicin por sexo de dos grupos comparados
sea homognea se puede aleatorizar un grupo de hombres y otro de muje
res con una asignacin alterna de los participantes a los tratamientos, es
trategia a la cual se conoce como agrupamiento.
Estratificacin de ios resultados
En algunas ocasiones es aconsejable realizar el anlisis de los resultados
por estratos de uno o ms factores, tal como ocurre con los estudios mul-
Ucentro en los cuales el anlisis debe realizarse de acuerdo con los estratos
correspondientes a los centros participantes; con este procedimiento no slo
se pueden detectar diferencias en los resultados obtenidos entre estos lti
mos. sino que puede contribuirse a la explicacin de tales diferencias en
trminos del problema analizado con lo cual se aporta un mayor conoci-
miento aJ respecto.
Suspensin del estudio
Cuando en un periodo menor que el inicialmente previsto para la duracin
del estudio experimental un tratamiento demuestre ser notablemente supe-
nor a los dems, o cuando la administracin de un tratamiento resulte ser
claramente lesiva para los que lo reciben, sce debe terminarse. Un ejemplo
de esto es el esrudio denominado Ensayo del betabloqueador para el atu-
61 cual 86 observaba eI efecro del propanolol sobre la
mortalidad subsecuente a un primer infarto del miocardio que fue suspen
dido nueve meses antes de la fecha prevista debido a ios claros beneficios
de su administracin (DeMets y colaboradores, 1984).
Adherencia
Otro aspecto metodolgico de primordial inters es el referente a la adhe-
renca de los pacientes al tratamiento. Es previsible que por diversas razo
nes algunos de los participantes no se adhieran al rgimen del grupo al cual
han sido asignados como el rechazo a los medicamentos o a la aparicin
oe erectos secndanos.
La falta de adherencia de un participante al tratamiento que le co
rresponde tiende a disminuir las diferencias observadas entre los grupos y
por ello, disminuye la capacidad del experimento para detectar las diferea-
60/MttMQgfti a tmettigaeito-
cus existentes, circustancia que implica una disminucin del poder de las
probas estadsticas utilizadas.4 ____ ferw_ _
En l estudio <te intervmcin ya mencionado sobre mltiples faaoa*
^ nesgo para la nMtfldad por mfennokd coronaria la
t e i a significativa en la r t a l i d a d p o r ~
el grupo tratado 19J / I 000- y el grupo no tnttado i ^ 9/ ; o a > - s e a t o
buy a la modificacin de la exposicin a los factores de nesgo como el
cdesraoL el tabaquismo y la hipertensin durante el penodo de estudio.
^ T a pSar de tos medidas tomadas por los investigadores para ase-
eurar la adherencia de los participantes al rgimen de tratamiento presento
esinevitable que algunos sujetos se aparten de l, en el
lisis tales individuos deben incluirse en su respectivo grupo de
<te otra manera se asumira el riesgo de intiodunr un sesgo en los r e a t a
dos por cuanto la no adherencia al tratamiento puede estar ^ o c i a d a o . n d
efecto evaluado; en estos casos conviene obrar segn el
vez aleatorizado, siempre analizado, el cual se conoce como la mtencun
de tratar.
Prdidas
Durante el periodo de realizacin del experimento es
mamenio se deje de recibir informacin de algunos
porque emigran a otra dudad, hecho que se noce como prdida al segu
S o . Dado que estas prdklas puedenestar a s o c i a f a m e s l e o n a
dos d efecto estudiado por tanto tienden a invalidar los resultados
obtenidos s e debe tratar por todos los medios posibles de " * u n r d segui
miento * todos los participantes basta la finalizacin del penmentt*
Para lograr este propsito no slo es indispensable contar con bue
nos mecanismos para la localizacin y evaluacin de los p a l p a n t e s , sino
adems establecer incentivos que mantengan en e s c u n a buena m o n
dn De lo chcbo anteriormente con respecto a las prdidas al seguimiento
f u no adherencia a i rgimen del tratamiento prescrito se deduceque*
deben reducir ambas al mnimo so pena de incurrir en sesgos apreciables
que puedan invalidar las conclusiones del estudio.
Ftmdios c v m t M e s / 6 ]
Exclusiones
En casi rodos los estudios experimentales que se realizan con seres
se deben excluir aquellos sujetos que per sus caractersticas personales u otras
razones no garanticen una continuidad o una buena adherencia a los tratamien
tos considerados. Motivos tales como contraindicaciones mdicas, la presen
tacin previa de eventos que puedan invalidar las conclusiones o l a ------^
de recibir determinado tratamiento son argumentos a favor de la exclusin de
determinados sujetos de participar en un estudio experimental.
Con respecto a tales exclusiones es importante advertir que si bien
deben ser hechas con base en criterios claramente expresados en el proto
colo que gua al estudio y con anterioridad a la asignacin de los pacientes
a los grupos de tratamiento, no amenazan la validez de la investigacin
aunque pueden limitar la generalizacin de sus resultados, por ejemplo si
las exclusiones son numerosas y difieren apreciablemente en sus caracte
rsticas de base de las de la poblacin de estudio.
Estudios doble ciego
Con el fin de evitar los posibles sesgos que puede originar el conocimiento
dei grupo al cual pertenecen los participantes se debe buscar, en lo posible
que tanto estos como quienes evalan el efecto desconozcan el tratamiento
recibido, estrategia a la cual se denomina doble ciego. Es posible que el
conocimiento por parte del investigador del grupo de tratamiento al cual ha
sido asignado un participante induzca conductas, conciernes o Inconcientes
cuyo efecto final se refleje en sesgos que afecten los resultados del estudio!
lo cual se observa cuando un investigador que pretende demostrar el bene
ficio de un tratamiento hipotensor puede inadvertidamente favorecer el re
sultado deseado al recomendar medidas teraputicas adicionales a quienes
pertenecen al grupo experimental.
Aunque en muchos estudios no es posible asegurar el desconoci
miento por parte de los investigadores -debido, entre otras razones, a con
sideraciones de carcter t i c o - en ocasiones es posible delegar el
seguimiento de los participantes - y particularmente la evaluacin del
erecto a personas que ignoren el tratamiento al cual estn sometidos.
Placebos
H cortamiento del tratamiento por los participantes puede alterar las res
puestas de estos, lo cual introduce sesgos en los resultados obtenidos de-
62 / U a M o f i a e te
bldo a mecanismos psicolgicos, de resistencia al traamientt, 0 de o m
ndole. Para solucionar esta dificultad se recurre a la administracin de
tratamientos con una apariencia idntica de tal modo que los P ^ P *
tes no puedan identificar lo que reciben, conducta que es comn en tos
ensayos clnicos. Es importante advertir que la utilizacin de un pUceto
tiende a eliminar lo que se conoce como efecto placebo e cual con
siste en la respuesta favorable debida al conocimiento real o supues
to de que se recibe cierto tratamiento, independientemente de los
efeCtEifte f esmto denominado Aspirina e infarto del miocardio el
14,9% de quienes reciban placebo presentan sntomas relacionados
con erosin de la mucosa gstrica, gastritis o l c e r a p p t i c a l o c u a i
representa un efecto placebo. La comparacin de t r i P nuye con
el correspondiente al observado en el grupo control del 23 7% perni
estimar la frecuencia de efectos colaterales gstricos atnbuibles a ladr-
ga en el 8.8% (Aspirin Myocardial lnfarction Study Research Group,
1980).
Consideraciones ticas
Aunque no es la intencin detallar aqu los aspectos ticos relacionad
con la investigacin experimental en la que participan
pueden destacar algunos principios fundamentales que deben orientar todo
lIlba' " u u f e o i e f i aleatoria de un posible participante a uno de los
grupos de tratamiento no es tica si entre quienes se
el estudio existe el convencimiento de que uno de ellos es mejor que
o t r o ! este caso al sujeto se le debe ofrecer el tratamiento que se con-
sidere mejor. Por otra parte, si quienes se proponen realizar un expen-
men" con seres humanos creen conocer de antemano la respuestaal
estudio deben abstenerse de realizarlo; de igual forma los investigadores
que dirigen la realizacin de un estudio experimental deben suspender
su ejecucin en el momento en el que un tratamiento se evidencie como
SUPCnNoaoteSnte, es importante advertir que cuando existe la duda con
respecto al beneficio que puede aportar determinado
co suspender el estudio experimental porque stete produce resultados f
vorables el no realizarlo implicara el que muchas p e a n a s pnvet.de
sus beneficios y si, por el contrario, no produce resultados favorables o
Estudios erprnuntaUs/63
estos son nocivos, quienes se someten a l seguirn recibiendo sus efectos
negativos; casos en los cuales existe la obligacin tica de aclarar la duda
existente.
Las consideraciones ticas que deben orientar la realizacin de un
estudio experimental estn relacionadas con la naturaleza del problema es
tudiado, con los riesgos inherentes al tratamiento evaluado y con las cir-
custancias en las cuales se realiza. Es claro, por ejemplo, que las
implicaciones ticas de un experimento que trata de evaluar las ventajas
relativas de la irradiacin frente a la quimioterapia para el tratamiento de
la leucemia son mayores que las relacionadas con la comparacin de dos
tratamientos para el resfriado comn.
Otras consideraciones exigen la exclusin de cienos estudios experi
mnteles de personas cuyas condiciones puedan implicar un riesgo para su
salud, por ejemplo, pacientes con determinados antecedentes, extremada
mente frgiles, ancianos o mujeres embarazadas. Por razones metodolgi
cas ya mencionadas dichas exclusiones se deben hacer antes de la
asignacin de los sujetos a los grupos- de tratamiento.
Con el fin de resolver estas situaciones es recomendable la forma
cin de un comit de tica con personas de reconocido prestigio. Algunas
ismuciones en las que se suelen realizar estudios experimentales han defi
nido y adoptado un conjunto de normas ticas que guan la ejecucin de
estos. Para la definicin de tales cdigos estas organizaciones pueden
guiase, entre otras, por las recomendaciones adoptadas por la Asociacin
Mdica Mundial en su Declaracin de Helsinki en 1964 y revisadas pos
teriormente en 1975 y en 1983.
Consideraciones finis
De lo expuesto anteriormente se pude deducir que la correcta realizacin
de un estudio experimental exige la adhesin a rigurosos principios que
guian la investigacin cientfica y que implican, usualmente, una inversin
de cuantiosos recursos. No obstante tales exigencias, la historia de la in
vestigacin epidemiolgica es rica en situaciones en las que la investiga
cin experimental ha aportado conocimientos de inmenso valor cientfico
tal como se puede entrever en los ejemplos citados en el nato.
^ tro>do, es importante considerar que el paradigma de la inves
tigacin experimental es la base fundamental sobre la cual se han desairo-
Uado los dems diseos que son comunes en epidemiologa; por este
motivo, el intento de abordar terica o prcticamente estos diseSos sin una
6 4 /M tM o ? o 4 e teinwffifacMn...
cabal comprensin de los principios subyacentes en la estrategia de la in
vestigacin experimental es una tarea intil y enganosa.
Referencias bibliogrficas
1 iv. S t o r t a and cthka in medial iwewcfa. 111: How large a sample? Brituh
Medicai Journal. 1980; <281): 1336-1338.
1 Aspiiin MyocardUl b t e t e
aspirili in penons recovered from myocanal mtamoft. JAMA. 1980, 7 (243). t*
669
3. B e n i n ) C. An Imrotbtctitm to the Said} ofEipenmm utl Medicine. Transl: Henry Copley
G. New Y a k , Dover Publications, 1957.
4. Boeing BG. Tbe nature and t o w r y of experimental control. American Journal qf
Psyckiaoy. 1954; (67): 573-89.
5 . Bradford Hill A, A short textboot q f medical sm u tics, London, Hodder and Staugbion,
1983
6 D e u HT, Arnold FA. Btvooe & Domestic watrr and dental cuie*. V.* * * * * * " "
of ft* relation o f fluoride domett* water* to dental "J?
ged 12 to 14 years, o f 13 cities i s 4 a u s . Public Health Reports. 1942,
(57): 1155-1179. ^ , . . . .
7 T W e u n r Hardv JL Friedman LM aL Statistical aspects of early termination in me
Beta-Bloeker Heart Attack Trial. Controlled Clinical TriaU. 1984; (S): 362.
8. Donner A. Approaches to sample size estimation in the design o f clinical trials - A review,
Stahmcs in Medicine. 1984; (3): 199*214.
9 Fernste in AR. Clinical Biestatisilci. Saint Louis. C.V. Mosley, 1977.
10.KslB.BauM,Marg^eseRalHve^eariesuliBOf*tindoniteBdiliniraintal0OTp-
tag toial masectomy and segmental mastectomy ^ ^
of breast cancec. Nex> England JounuiqfMabcme. 1985; (312): 665-673,
1 1. Fisher RA. Tbe airangements of field experiments. Journal o f the Ministry o f Agriculture.
Greai Britain. 1926; (33): 503*513-
12. Firiss JL. Statistical Methods f o r Rates and Proportion!, 2nd, Ed. New York, John Wiley
and Sons, 1981.
13. Francis TF. Korns RF, Voighl RB e l a l An evaiua, of f e 1954 polyorneims v * c . n e
trials. American Journal q f Public Heath. 1955, (45). 1*63.
14. Freiman JA. Chalmers TC, Smith H e. al. V * * * *
sample size in the design and huetpretstion o f the * d o n ^ t t o l n u l . survey of
negative** trials. New England Journal o f Medicine. 1978; (299). 690-694.
15. Friedman LM. Furtwg CD, DeMett DL. Fundamentals <f Clinical Trials. Boston, John
Wright, 1981. . i
16. Goldberger J, Waring CH, Tbuwt WF. Pellagra prevention by diet among ntttswcional
inmates. Public Health Reports. 1923; (35): 2361-2368.
17 Gratmt J. Natural and political obaervadoos meatiooed in a following index, and made
upon tbe Bills o f Mortality, London, 1662.
Eaudfos txperimtaiQUs/65
18. Hipertension Detection and Follow-up Program Cooperative Group. Five-year find
ings o f the hipeiteosioo detection and follow-up program: I Reduction in ur-
u n i . WiA U , h b,00d Ppessure M i n i miJd hipcrtcnaon. JAMA.
1779; (242): 2562-2571,
19. Littenfeki AM. Cderis plribus: the evolmioD o f the clinical trial. Presented as the 54th
annual meeting o f the American sedation f o r the History o f Medicine Tonmta
Canada, May 1981.
20. Lind J. Treatise o f the Scurvy. Edimburgh. Sands. Munay id Cochran, 1753.
21. Lipid Research Clinks Program. The Lipid Research Clinics Coconary Primary Preven
tion IMal results: 1. Redaction o f incidence o f CHD.XWA, 1984; (251): 351-364.
22. Lister J. On the effects o f the antiseptic system o f treatmeat upon the salubrity o f a surei-
cal hospital Lancet. 1870; I (4-6); 40-42.
23. Melnot CL. CUnkai Trials. New York, Oxford University Press, 1986.
24. Mejia R, Espinal F, Vdea H. Fluoruracidn de U sal en cuatro comunidades colomhianas
i m T J S ? ~ %lC * * * * * * dcDaJ- dg ia Sanitaria Panamericana.
1*72; (73): 561-571.
25. Multiple Risk Factor Intervention Tril Research Group. Multiple Risk Factor Interven-
tion Trial: risk fact-changes and morbidity results. JAMA. 1982; (248): 1465*1477.
26. Pew R, Pike MC, Aruutage P et al. Design and analysis o f randomized clinical trials re-
quinng prolonged observation o f each patient. I: Introduction and design. British Jour-
nal i f Cancer. 1976; (34): 585-612.
27. Peto R, Pike MC, A m i a g e P et al. Design and analysis o f randomized cliiucaJ trials re
quiring prolonged observation o f each patient. II: Analysis and examples. British Jour
nal o f Cancer. 1977; (35): 1-38.
28. Rothman KJ. Modem Epidemiology. Boston, Little, Browo and Co., 1986.
29. SchJesselman SJ. Sample size nsqoiremenis in cohort and case-control studies of disease
American Journal o f Epidemiology, 1974; (99): 381-384.
30. Wiiheismera L, Ljungberg S, Wedd H et al. A comparison between participants and non-
participants in a primary jfrevention trial. Journal o f Chronic Disease. 1976; (29); 331.
los de seguimiento
o de cohorte
En el presente cptalo se exponen los principios metodolgicos que
caracterizan los estudios de seguimiento, la manera como se estiman
las medidas de asociacin, los mtodos que permiten evaluar el efecto
del azar en las estimaciones obtenidas y, por ltimo, se muestran las
ventajas y las limitaciones de ellos.
L o s ludios de seguimiento o de cohorte son una estrategia importante
utilizada por la epidemiologa para el anlisis de asociaciones etiolgicas.
Aunque su realizacin suele demandar cuantiosos recursos, la con.rm.n^^n
de la estrategia que los caracteriza y de las exigencias metodolgicas que
les son propias son requisitos importantes para el investigador en epide
miologa, no slo porque es la opcin indicada en algunas situaciones, sino
68/Mtodtogfa de a tortUfeodAi.
porque es el punto de partida para las dems estrategias de la investigacin
no experimental en epidemiologa.
Estrategia
Bsicamente, un estudio de seguimiento se realiza
cin en el tiempo de dos o ms grupos de poras imcialmente a u u
v m u a n i de una manera diferente a un factor euolgico, con el fin
de timar las diferencias en la incidencia de la enfennedadentreJes
grupos, o sea para estimar la asociacin ewsiente e n t r e y
h factor etiolgico. Esta estrategia difiere del tipteo modelo de _
tisacin experimental - e n el cual los participantes se asignan aleatna
, n t e a los grupos de estudio o tratamientos porque el investigador
lo, sujetoa; por este av". 10,
guimiento, a los de casos y controles y a los descriptivos se les llama
estudios obstvcionols. , , . .
En les estudios de seguimiento se observa la exposicin a laque <stfn
sometidos los participantes y el efecto resultante despus de un
eiemok) el consumo de alcohol y la aparicin postenor de cncer de la laruv-
Ucotnparacin de las medidas del efecto que se manifiesta en los grupos
e
de la existencia d e u n a asoriaridn entre la exposicin a d i c t e pernadas y la
t h Z Z Z L , anomalas. En la figura 4.1 se muestra un es,uema srcipli-
ficado de la estrategia de un estudio de seguimiento.
Causa
S&uestos y sanes
Efecto
t aca o proporcin d inodencia
Tiempo
> e W C r W T --------------------------------- - Tasa o proporcin de incidencia
Figura 4 . 1 Esquema simplificado de la estrategia de un estudio de s e su e
miento
EnmEosdiufmminuoodtmhone/69
Los grupos observados en las diferentes categoras de exposicin
pueden ser cohortes fijas no entran ni salea sujetos del estudio a medida
que ste se realiza o, por el contrario, cohortes dinmicas. Si los grupos
expuestos y no expuestos se definen como cohortes fijas o sea durante
. !iempo de md0 86,0 s*1 sujetos de los grupos conformados ini-
cialmente por muerte o por prdida en el seguimiento- y cn un total
de a + c sujetos expuestos ocurren a casos durante el periodo de segui
miento. mientras que en un total de b + d sujetos no expuestos ocu
r r e n b casos, a! final del estudio se comparan las proporciones de
incidencia acumulada en expuestos p , = a/(a + c) y en no expuestos
Po - + d), para evaluar la asociacin observada entre la exposicin
y la enfermedad. La informacin as obtenida se resume en una tabla de
2. x 2 tai como la que se presenta en ia tabla 4, 1.
Tabla 4.1 Esquema prctico d e los resultados d e un estudio d e seguimiento
realizado con cohortes fijes
Enfermedad "
Exposicin
n 1
no
mi mo n
El estudio de una asociacin etiolgica por medio de la observacin
de cohortes fijas es adecuado en las situaciones en que el seguimiento de
los participantes se hace durante periodos cortos y definidos, como por
ejemplo, si se trata de estimar el efecto que el consumo de cierto medica-
ment por las madres gestantes tiene sobre el neonato.
S los P* de P a s t o s y no expuestos se definen como cohor-
tesdinmicas - o sea entran y salen sujetos durante el tiempo de estu-
* 7 1 I Z tiemP 8 MpOSCn y o sc r e n t a n respectivamente
l J * 5 " CValuar 108 resultados obtenidos en trminos de
las tasas de incidencia observadas en expuestos (t, = o/m.) 'ven no
J E T / * * = ED 6516 CaS la infonnacin de un ludio de
seguimiento se resume como se muestra en ja tabla 4.2
70/towdokfit* 4* o wtvtsi****-
TaWa 4 . 2 Esquema prctico d e los resultados d e un e stud io d e seguimiento
realizado c on c o h o r te s dinmicas
Los estudios de seguimiento realizados a partir de la observacin^de
e ^ d S c a s T S i - h " T S S i i 1
ftMuenta. los grupos expuestos a un determinado tactor de nesgo estn
S T p o r t * S S i o ? q u e t o <* M a m Cl nemp * * '
S S retiran de ella en diferentes os, en
quienes el tiempo de exposicin vara ampliamente de unos a otros.
Estimacin d la asociacin
Los estudios de seguimiento, a diferencia de los de casos y consoles, prcn
ducen estimaciones del efecto de la exposicin en trminos de los riesgos
que caracterizan a los distintos grupos expuestos o cohortes, lo^ e^ _
evalan por medio de tasas o de proporciones de incidencia. Per este roo-
S posiWc estimar i . fue de la asodaci. qt o t n
detenninada exposicin dicotmica por medio del riesgo u ;
liza las proporciones de incidencia P, J Pe estimadas en las cohortes
puesta y do expuesta, respectivamente:
PJ,
m - 7 t .
o tambin, cuando se utilizan tasas de incidencia acumulada segn
la forma:
77,
m ' - r t 0
1 Con I . W
de la presi ita arteiil en Un*. * " " 0. te Wilii. promed.
2 Vtte d captulo 2, La medicin en epdeowHot^
Estudios de stfuimiauo o deohrt/7]
Una estimacin de intervalo bastante aproximada y satisfactoria para
la mayora de las situaciones se obtiene mediante la expresin propuesta
por Miettinen (Miettinen, 1976):
A
eo donde: RR corresponde a la estimacin puntual observada
Z/-cv2> ^ peicenti] 7-0/2 de la distribucin normal estndar donde
i - a es el grado de confianza deseado en la estimacin.
X2 al valor de la variable chi cuadrado obtenido en la prueba de
significacin estadstica correspondiente. Esta ltima se realiza de manera
aproximada de. acuerdo con la informacin reunidasegn se trate de
proporciones o tasas de incidencia de la manera siguiente, con la no
menclatura antes descrita:
1. Proporciones de incidencia: una prueba de significacin para la diferen
cia entre dos proporciones de incidencia una correspondiente al grupo
expuesto y ofra al no expuesto utiliza la distribucin de la variable pro-
babilstica chi cuadrado de un grado de libertad con un valor que se obtiene
mediante las diferencias entre los valores observados O y ios esperados ,
de la forma siguiente:
2 V (O - E? (ad - be)2 (n
E n0 Q
2. Tasas de incidencia: en la mayora de las situaciones en las que se com
paran tasas* con el fin de realizar una prueba de significacin estadstica
se puede udli2ar la aproximacin de la distribucin de chi cuadrado a la
distribucin binomial exacta, as:
v 2 _ *7* t e - n p p
* t * ------Z2 = -------------
& npq
donde a representa el nmero de casos o xitos observados en la
cohorte expuesta.
Para obtener el nmero esperado de xitos np se recurre a la proba
bilidad de xito con la hiptesis nula p %estimada por la distribucin del
tiempo de seguimiento m /M. As, del total de n * a + b casos observados
se espera que se presenten (a + b)(m M) casos, con el supuesto de que
7 2 /M ttM o fb d ek ttw a O ia n ."
no existe asociacin3; el valor de q corresponde a la probabilidad de fra
caso v es por amo el complemento de p, o sea mrfM-
De este modo se obtiene al emplazar en la expresin antes indicada:
% [ a - ( a * b )(m , M ) f
% 1 ~ ( a + b ) ( m M X m 0 M )
Si se quiere obtener una estimacin de la asociacin por medio de
una diferencia entre las tasas de incidencia o proporciones de incidencia
acumulada se pueden estimar las proporciones del n e s g o atnbuible en ex
puestos PRAE y del riesgo atnbuible poblaonal PRAP, tal como sigue.
PRAP =
P U - P h
Pl.
En el ejemplo 1 se ilustra el procedimiento mediante el cual se es
tima la asociacin con base en las proporciones de incidencia acumulada
v en el 2, con base en las tasas de incidencia.
Ejemplo 1. En un estudio de seguimiento acerca del consumo de
alcohol A durante la gestacin y el aborto espontneo B realizado en 5M
gestantes expuestas y en 500 no expuestas en una poblacin en la cual la
incidencia total del aborto espontneo es del 11%, se obtuvieron los resul
tados que se muestran en la tabla 4.3.
Tabla 4 . 3 Estudio del seguimiento sobre consumo d e alcohol A e ' ^ " a a
d e aborto es p o n t n e o B e n 5 0 0 ge s t a n t e s e x p u e s t a s y e n 5 0 0 no
expuestas
B
+
6 0
4 4 0 5 0 0
-
4 0
4 6 0 5 0 0
1 0 0
9 0 0 1 0 0 0
4 V a e l e v p t n o X L m e d t n e n q a i t e m o t o s t a
* Eitudis de acguknitnto o 4* Cohorte/ 7 3
R = A = m m = l 5 0
PI0 (40/300)
La prueba de significacin estadstica se realiza mediante la distribu
cin de chi cuadrado con ud valor que se obtiene como sigue:
..2 _ V ( ' & M - be)2 (n 1)
X t d ------= ------
t nf n0 mf
_ 1(60 x 460) - (40 x 440)]2 (999)
500 x 500 x 100 x 900 = 4,44
valor que implica una probabilidad menor de 0,025 prueba de una
cola la cual es estadsticamente significativa para un nivel de significa
cin del 5%.
Para obtener los lmites aproximados de un intervalo del 90% de
confianza para el riesgo relativo se utiliza la expresin propuesta por Miet-
tinen (Miettinen, 1976) que permite calcular el intervalo a partir del valor
de chi cuadrado obtenido en la prueba de significacin:
X <! 2 i . a ^ x b _ } 5Q (1.64 / <4.44)
= i , 09 ; 2,06
Por su parte, las estimaciones de las proporciones del riesgo atribui-
bte en expuestos PRAE y del riesgo atribuidle poblacional PRAP se obiie-
nen como sigue:
uua r - o w - 40000
r K A b ----------------------------------------- s 0,33
Pl, 60/500
PJT 0 . n
74 /Mnodotegte dt la brvesigaeiR^.
De acuerdo con tales resultados, cecea del 33% de la incideuca de
aborto espontneo que ocuire eo las expuestas al alcohol y del 27% de la
incidencia del mismo evento en la poblacin total se debe al sumo de
alcohol.
Ejemplo 2. En una empresa roetalmecnica se observaron durante un
neriodo de 10 aos 2 cohortes de trabajadores con el fin de estudiar el dao
acstico como consecuencia de la exposicin al ruido. La cohorte expiasta
estuvo formada por 500 operarios inicialmente sanos que haban laborado
por un mnimo de 5 aos en salas (te alto ruido a ms de 85 db; la cohorte
no expuesta estuvo integrada por 400 trabajadores con caracterstica* nnu-
lares a los anteriores pe que haban laborado durante 5 aos en salas con
bajo mido; los resultados se muestran en la tabla 4.4.
Tahia l a Resultados d e un estudio d e seguimiento sobre e l d a o acstico
Se realiz una prueba de significacin estadstica aproximada con
base en la distribucin de chi cuadrado:
[ a - ( a + b ) fro, / M ) ] 1
[83 - (117) (3950V240))2 _ f7(i7
' (117) (3950/7240) (3290/7240)
valor que referido a la distribucin de chi cuadrado de un grade de
libertad revela resultados estadsticamente significativos, P< 0,001, pnieba
3950
3290
7240
83
34
117
21,01
10.33
*16,16
No
Total
(a + b) ( n^/ M)
de una cola.
Estudios de uguimienio o de cohorte / 7 5
Un intervalo del 90% de confianza se obtiene, de manera aproxi
mada, de la siguiente manera:
fe _ 2 03 III6^ IZ<S7)
* 1, 46; 2,81
Adems, la evaluacin del impacto que en la poblacin trabajado
ra produce el raido sobre el daflo acstico se estima por medio de las
diferencias observadas en la incidencia en trminos de las proporciones
del riesgo alribuible en expuestos y del riesgo atribuible poblacional:
PRAE = f 1/ \L> = -02101 - 0.01033 _ 0 5f)8
TIi 0,02101
P R A P = * ' & 0,01616 - 0.01033 _ . . . .
a CwOi
T!t 0,01616
Estos resultados indican que cerca del 50,8% de la incidencia de
dao acstico que ocurre en la poblacin expuesta al ruido se debe a la
exposicin a ste, al igual que cerca del 36,1% de la incidencia en la po-
blacin 10 tai.
Consideraciones metodolgicas
La estrategia propia de los estudios de seguimiento la cual refleja la
estrategia propia de los estudios experimentales ofrece poca dificultad
metodolgica; no obstante, es preciso considerar algunas exigencias parti
culares.
4
La definicin de las cohortes y del tiempo de observacin de stas
debe hacerse de acuerdo con el conocimiento existente acerca del proceso
biolgico subyacente o, en su defecto, con supuestos razonables acerca de
este. Sobre tal respecto es importante considerar que el periodo mnimo de
seguimiento debe ser igual a la suma del periodo mnimo de induccin ms
el periodo de latencia, el primero de los cuales corresponde al tiempo re
querido para que la exposicin inicie el proceso causal y el segundo, el que
trascurre entre el comienzo de la enfermedad y el momento en que se ma
nifiesta clnicamente (Rothman, 1981).
76/Uesodoiogia de a mvettisocito,.
Tericamente, un estudio de seguimiento en el cual el periodo de
observacin es menor que la suma de los periodos de induccin y de
latericia tiende a producir estimaciones iguales de la incidencia en ex
puestos y en no expuestos debido a que los casos que se deben a la
exposicin no alcanzan a manifestarse; no obstante, en algunos estudios
de seguimiento particularmente en aquellos relacionados con factores
ocupacionales es comn la prctica de considerar el periodo de indue-
cin a partir del momento en que se inicia la exposicin. De acuerdo
con este principio, si para cierta enfermedad se considera un decenio
como el periodo mnimo de induccin del tabaquismo, el tiempo de se
guimiento de los fumadores que no han completado diez aos de obser
vacin en el momento del anlisis no debe considerarse como tiempo de
exposicin.
Una vez los sujetos se clasifican como expuestos o no expuestos
debe mantenerse dicha clasificacin, lo cual tiene como objetivo evitar
que se introduzcan sesgos puesto que es frecuente que los individuos
modifiquen la exposicin por motivos relacionados con el efecto estu
diado, As, una persona puede abandonar la utilizacin de un medica
mento nocivo cuando sospecha que ste se relaciona con sntomas
recientemente percibidos y que, efectivamente, corresponden a la enfer
medad estudiada: en el momento del anlisis, su clasificacin en el gru
po de los no expuestos tiende a disminuir equivocadamente la
estimacin de la asociacin existente.
Las prdidas durante el seguimiento por muerte, desercin o migra
cin pueden ocasionar sesgos en la estimacin de la asociacin en la me
dida en que estn relacionadas con el efecto estudiado; por ejemplo, e-
posible que durante el seguimiento de una cohorte expuesta a una alta con
taminacin atmosfrica para evaluar el efecto de sta sobre la bronquitis
crnica, algunas personas afectadas emigren a lugares ms saludables; la
omisin de tal informacin produce un sesgo que tiende a disminuir la
asociacin si realmente existe.
En los estudios de seguimiento es posible utilizar como grupo de
comparacin para la cohorte expuesta un grupo interno o uno externo. El
primer caso se presenta cuando se selecciona una muestra de la poblacin
cuyos sujetos se clasifican en expuestos y no expuestos; en estas condicio
nes es posible comparar la incidencia observada entre ambos grupos o la
incidencia entre s de aquellos expuestos en grado diferente, tal como se
hizo en el estudio de Framingham en el cual se compararon las tasas de
78/Ufodiogadt la w t i f R k . .
Con el fin de controlar los posibles sesgos de. confusin en d mo
mento del anlisis se dbt registrar durante el seguimiento el valor obser
vado ea las potenciales variables de confusin puesto que la obtencin de
esta informacin, una vez realizada la observacin, es casi siempre una
tarea imposible. El equiparamiento realizado en el momento en que se se
leccionan los participantes rara vez se utiliza como estrategia para controlar
los sesgos de confusin en estos estudios puesto que la obtencin de la
informacin necesaria con respecto a las variables que se qnieren controlar,
__en grupos que son usuahnente numerosos hacen que sta sea una al
ternativa costosa e ineficiente/La estratificacin en el anlisis y el anlisis
multivariado, estrategias que se exponen en captulos individuales de esta
obra, son las mejores alternativas para controlar la confusin e variables
y para ftffluliflr la interaccin de los factores en este tipo de estudios.
Ventajas y limitaciones
Los estudios de seguimiento demandan, por lo general, una cuantiosa in
versin de recursos. Por una parte, la mayora de las enfermedades presen
tan una baja incidencia relativa y por tanto la deteccin de algunos casos
durante un seguimiento en el tiempo exige que inicialmente se disponga de
grupos muy numerosos; por ejemplo, si la tasa de incidencia de una deter
minada enfermedad es de diez casos por diez mil personas-ao-exposicin,
pm contar en el anlisis con 50 casos despus de un periodo de segui
miento de 5 aos es necesario empezar la observacin con una cohorte
compuesta aproximadamente por 10.000 personas, motivo por el cual a
medida que la incidencia se hace ms baja la factibilidad de realizar un
estudio de seguimiento es menor.
Por otra parte, si los periodos de induccin y de latencia de la en
fermedad estudiada son prolongados, la observacin de las cohortes debe
comprender un periodo suficientemente largo para permitir tanto la inicia
cin como la manifestacin ulterior de la enfermedad (Rothman, 1986). A
las anteriores exigencias se suman las derivadas de la necesidad de esta
blecer un sistema de raonitorizacin casi permanente para recolectar y re
gistrar la informacin pertinente a las diferentes variables observadas y,
en particular, para detectar la incidencia del efecto por medio de ex
menes clnicos, de laboratorio o con la ayuda de otros procedimientos
diagnsticos.
Sin embargo, es posible disminuir el costo de un estudio cuando se
utiliza informacin ya existente en registros de buena calidad, tal como la
que suelen tener los registros poblacionales de cncer; no obstante, se debe
que mantienen una infarmadn actualizada de sus afiliados facilita la Mea
de la recoleccin y registro de la informacin pertinente; los estudios
realizados por Dol y colaboradores en Inglaterra con respecto altabaqnis-
mo son un buen ejemplo de esta estrategia (Dol y Hill, 1964; Dol y co-
laboradorea, 1980). . . .
Tambin debe considerar que con la estrategia propia de los estu-
dios de cohorte, a partir de la exposicin hada elrfecto, se puede obten
una informacin bastante completa acerca del fenmeno estudiado pues es
posible observar durante el seguimiento las variacin en la P 0* ^
en las variables que confunden y en otras de inters; adems, dios ofrecen
la posibilidad de estudiar mltiples efectos relacionados con una sola ex
posicin, incluso los efectos benficos, sin que ello implique un aumento
significativo de los costos.
Adems cnanto se observan grupos numerosos de la poblacin es
posible estudiar el efecto de la exposicin a mltiples factoiwcomo aleo
h o l t a b a c o y c o l e s i e r o l t a l c o m o s e realiz e n l o s e s t u d i o s d e F m u i h a m
(Dawber y colaboradores. 1951) y de Tecumseh (Epata n y colaboradores,
1970). Ed estos casos, sin embargo, la namraleza de los factores estudiados
exige usualmente la entrevista personal como la nica fuente de la trfor-
marin requerida.
Por ltimo, es importante mencionar la alternativa que ofrecen los
estudios coloborativos en los que la participadn de mltiples istrtucio-
nes para el desarrollo de un proyecto costoso hace factible su realiza
cin mediante aportes parciales; un ejemplo de eUo se J 1
Collaborative Perinatai Project en el cual se estudi la relacin de mlti
ples exposiciones perinatales con diferentes resultados observados^ el re
cin nacido en catorce hospitales universitarios (Heinonen y colaboradores,
1977) En estos casos, se debe considerar cuidadosamente la estrecha ad
herencia a un protocolo comn de todas las entidades participantes con
nfasis en la estandarizadn de las condiciones en las cuijes se miden^las
diferentes variables y de los criterios y procedimientos diagnsticos em-
picados.
Referencias bibliogrficas
1. Dawber TR. M otors GF, Moer* FE. Epktemicdopcal ! * * *
Fratmngham Study. American Joumel o f Public Health. 1951, 2 8 6 ( )
2 Dawber TR. The Fromitglum Sludy: The EpUkmioiogy e f Atensele** Dista*.
Cambridge, MA. Harvard Umvereity Preis, 1980-
Ejtudios de aegumunto o de cohone/SI
3. Doll R, Hiil AB. Mortality in relation to smoking: 10 years' observations o f British doc-
ton. British Medical Journal, 1964; 1399-1410.
4. Doll R, Gray R, Halter B i t al. Mortality in relation to smoking: 22 years observations on
female British doctor*. British Medical Journal. 1980: (280); 967-971.
5. Epstein FH, Napier JA, Block WD et a!. The l^cumseh Study. Archives o f Environmental
Health, 1970; ( 2 1): 402-407.
6. Hdperin W. Beaumont J. Reeve G el al. The Cohort Srudy, En: Epidemiology o f Occupy
nonai HealsK Karvonen M. Mikheev M (eds). World Health Ox*anization, Copen-
hagen, 1986.
7. Heinonen OP, Stone D, Shapiro S. Birth Defects and Drugs in Pregnancy. Littleton. Mas-
sachuseu. Publishing Sources Group. 1977.
8. Miettinen OS. EsiimabUity and estimation in case-referent studies. American Journal o f
Epidemiology. 1976; (103): 226-235.
9. Moms JN. Kagan A, Parason DC et al, Incidence and prediction o f ischaemic heart disease
in London busmen. Lancet. 1966; (2); 553-559.
10. Rosenman RH, Brand RJ. Jenkins CD et al. Coronary heart disease in the Western Col-
Uborative Study. Final follow-up experience of 8,5 years. JAMA. 1975; (233): 872-
B77...
11. Rothman KJ. Induction and latent periods. American Journal o f Epidemiology. 1981;
( I 253-259.
12. Rothman KJ. Modem Epidemiology. Boston, Little, Brown and Co.. 1986.
13. Schilling RS. Sources o i Data. En: Epidemiology o f Occupational Health. Karvonen M.
Mikheev M (eds). World Health Organization. Copenhagen, 1986.
de casos y controles
En e l presente captulo se expone la estrategia utilizada por l o s estu
di os de casos y controles, se describe la m a n e n d e estimar las medidas
d e riesgo que c on Uos s e obtienen y, por ltimo, s e exponen las con
sideraciones metodolgicas que son importantes para su adecuada eje
cucin.
S i bien el modelo propuesto por los estudios de seguimiento para la bs
queda de asociaciones causales replica el mtodo experimental, al estimar
en un contexto observadonal la incidencia de los eventos de morbilidad o
de mortalidad a partir de grupos caracterizados por una cierta exposicin,
tambin es posible estudiar la existencia de estas asociaciones a partir de
grupos definidos per tales eventos para relacionar dicho fenmeno con una
exposicin previa, estudios a los cuales se les conoce como de casos y
controles; su desarrollo en el decenio del cincuenta a partir de los trabajos
8 4 /bietoologfc t la investigacin..
de Comeld (1951), Dom (1955* 1959), Mantel y Haenszel (1959) y su
progresiva adopcin como estrategia formal p a n el estudio de asociaciones
causales se consideran como un logro importante de la epidemiologa (Co
l. 1979; Breslow y Day, 1980).
Estrategia
La estrategia de los estudios de casos y controles consiste en comparar la
exposicin de un grupo de personas que presenta el evento de inters,
usualmente la enfermedad o la muerte, con la exposicin de otro grupo
comparable que no presenta tal evento: si la exposicin propia del primer
grupo, ios casos, es diferente de la del segundo grupo, los controles se
tiene un indicio de la existencia de la asociacin buscada.
A diferencia de los estudios de seguimiento en los cuales se mide la
presentacin del evento de inters en grupos definidos por la exposicin
previa, en los estudios de casos y controles se mide la exposicin de gru
pos definidos per la presentacin del evento. As, la observacin de que un
grupo de pacientes con diagnstico de cirrosis heptica ha estado ms ex
puesto al consumo de alcohol que quienes no sufren de tal enfermedad
sustenta la hiptesis de que el consumo de alcohol es un factor de riesgo
para el desarrollo de ella; la estrategia de estos estudios se muestra en la
figura 5.1.
Figura 5.1 Esquema simplificado d e la estrategia d e los estudios d e c a s o s y
controles
femdioj de cates y controUs 135
Si bien este esquema presenta la estrategia de los estudios de casos
y controles de una manera simple y atrayente, la debida comprensin del
contexto espacial y temporal en el cual se genera la informacin propia de
tales estudios es un requisito indispensable para su correcta ejecucin e
interpretacin.
Si se supone que se desea estudiar la asociacin que caracteriza la
exposicin a un cierto factor de riesgo y la incidencia de una enfermedad
en una poblacin definida en la que en un perodo i, - 12 se presentan A + B
casos y el resto de la poblacin, C + D personas, permanece sana y si para
estimar la asociacin se tomara una fraccin f , de todos los casos que se
presentan en la poblacin durante el periodo i, - 12 independientemente de
la exposicin, se tendran//A + B) casos, o sea, un total de a + b casos.
De manera similar, si independientemente de la exposicin se tomara una
fraccin /2 de todas las personas que se encuentran sanas al terminar el
periodo, se tendran f(C + D) personas sanas, o sa un total de c + d
personas sanas. De esta manera, el total de personas incluidas en el estudio
se clasifican de acuerdo con la enfeimedad y con la exposicin como se
muestra en la tabla 5.1.
Tabla 5.1 Clasificacin d e una poblacin de acuerdo c on la enfermedad y
c o n la exposicin
Exposicin
Enfermedad
n i no
Con la informacin obtenida, al final del periodo t, - u puede esta
blecerse la relacin:
86/fetdohglo de a rtvetH$acin.-
f,(Ay[f,(A + U Q ] _ aJ(a + c)
f / B y t f / B ) + f D ) ] ~ W b + d)
la cual pgrmite estimar el riesgo relativo como la relacin de dos
proporciones de incidencia en individuos expuestos y no expuestos, o sea
A/(A + C)
R R =
BKB + D )
nicamente s i / , y f 2 tienen igual valor, caso en el cual estas frac
ciones se cancelaran en el numerador y en el denominador.
No obstante, cualquiera que sean las fracciones f y h ? con la
consideracin de que la incidencia de la enfermedad sude ser relativamen
te pequea cuando se compara con la poblacin sana lo cual implica que
en los denominadores se pueden omitir los trminos f,(A) y f(B) sui que
se altere sensiblemente el valor de la relacin la expresin anterior se
aproxima a:
f f i m * m ) *
relacin conocida como la razn de disparidades RD, la cual estima
de manera aproximada el valor del nesgo relativo.1
Este razonamiento refleja la estrategia implcita en los estudios de
casos y controles en los cuales se selecciona, independientemente de la
exposicin, una fraccin/,, usualmente desconocida, de todos los casos
presentados durante el periodo tr i7 y una fraccin / 2, usualmente des
conocida, de todas las personas que se encuentran sanas al terminar este
periodo con lo cual se cuenta con un grupo de n, casos y un grupo de
controles. La clasificacin de los j casos y de los n0 controles asi
seleccionados con respecto a una exposicin dicotmica da lugar a una
tabla de 2 x 2 (Vase tabla 5.2).
V J E S t i W E - 2 5 S S SET- P p.
S S S w i S * Su = U d i s p a r a s urnbin 6 eoaoce con el
nombre t desigualdad nktiva.
Esttdias de casos y controlas 1 3 7
Tabla 5 . 2 Clasificacin d e los c a s o s y Jos controles c on respecto a una e x p o
sicin dicotmica
Enfermedad
+
Exposicin
m
mi
mo
n
Estimacin de io asociacin
Una vez seleccionados lo n, casos y los q controles se puede estimar la
razn de disparidades con respecto a la exposicin que caracteriza a ambos
gnipos mediante la frmula:
^ _ (aM/Mb/nj) _ fa/b) ad
(c/n^d/tio) (c/d) 'be
relacin que, segn se mencion antes, estima de manera aproxi
mada el valor del riesgo relativo.2
Esta estrategia no suministra por s misma estimaciones de riesgos
absolutos como tasas o proporciones de incidencia en expuestos y no ex
puestos; no obstante, ella provee una estimacin de la presentacin relativa
del fenmeno nesg relativo de los expuestos con respecto a los no ex
puestos por medio de la razn de disparidades.
Para obtener un intervalo de 100(1 - a)% de confianza para la razn
de disparidades y por tanto de manera aproximada para el riesgo relati
vo se puede utilizar la expresin propuesta por Miettinen (Mieinen,
1976) que penxute obtener los lmites del intervalo de manera aproximada,
los cuales son satisfactorios en la mayora de las situaciones:
R D
2 Ntese que la ratn de diquridftde con reqxcto a la expoiiclda (a/tJ/fM) es iguaJ a la
observada coa respecto e la enfermedad ( a W t f f l , ai untes caso* el resultado es udAc.
88/Mmdolagta de te wegtigecin...
expresin en la que J) corresponde a la estimacin puntual de la
razn de disparidades obtenida en el estudio, al percenul / - a /2 de
distribucin normal estndar y al valor de la variable aleatoria chi cua
drado obtenido a partir de los resultados observados, la cual se utiliza con
frecuencia para realizar una prueba de significacin estadstica.
Por ejemplo, si se supone que en un estudio sobre la asociacin entre
la obesidad y el infarto del miocardio se encuentra que 32 de los 80 casos
y 20 de los 80 controles seleccionados han estado expuestos, la informa
cin obtenida se presenta en una tabla de 2 x 2 (Vase tabla 5.3).
Tabla 5 . 3 Resultados d e un estudio d e c a s o s y controles sobre la obesidad
c o m o fact or d e riesgo para el infarto del miocardio________________
Obesidad
Inferi del miocardio

32
20
48
60
80
80
Con esta infnnacin se puede estimar la asociacin existente entre
la obesidad y el infarto del miocardio en trminos del nesgo relativo por
medio de la razn de disparidades:
od 3 2 x 6 0
* * RD = T e ' - T T o
2,00
Con el fin de calcular un intervalo del 90% de confianza para la
razn de disparidades se obtiene primero el valor de la vanable chi cua
drado por medio de la siguiente expresin:
vj
X i
( a d - b e ? ( n - 1 )
rti flp tn niQ
Faudioi dtb u a s j cfmrroJes / 8 9
_ ( 3 2 x 6 0 - 4 8 x 2 0 ? (160 - 1 )
80 x 80 x 52 x JOS = 4,08
y luego se calculan los lmites del intervalo:
RD<IZi<w/ V> _ 2 0 (lt.64/4,08)
= 1,14 ; J J 7
Con base en estos resultados se afirma con un 90% de confianza que
el riesgo relativo qoe caracteriza la asociacin existente entre la obesidad
y el infarto del miocardio en la poblacin se encuentra aproximadamente
entre 1,14 y 3,51. Adems, a partir del valor obtenido en la variable chi
cuadrado de 4,08 se puede afirmar el hallazgo de una asociacin con un
nivel de significacin del 5%, prueba de una cola entre la obesidad y el
infarto del miocardio puesto que P < 0,05.
Una estimacin de la misma asociacin por medio de la proporcin
del riesgo airibuible en expuestoP se calcula de manera aproximada por
medio de la expresin:
PRAE = * * ' 1 - RD ~ 1
RR RD
2 ,0 0 - 1
= ~ w r - w
De modo mila^ se puede estimar la asociacin en trminos de la pro
porcin del riesgo-aribuibie pobtacional por medio de la siguiente
PRAP s - PfiRR - 1) m PARD - 1)
pJRR l ) + 1 pRD - 1) + I
_ (20/80X2,00 - 1)
<2<V80H2,00 0,20
3 Vtaae d capftuk) 2, La medie uto en epiMotopo
90/ketedoaga de la bivettgoetu.
en la cual p es la proporcin de expuestos en la poblacin y que en
un estudio de casos y controles se estima por la proporcin de expuestos
observada en el grupo de controles, la cual refleja aproximadamente la ex
posicin propia de toda la poblacin puesto que est compuesta, en su gran
mayora, por personas sanas (Breslow, 1980; Schlesselman, 1982).
Seleccin de los casos y de los controles
Como principio general es importante considerar que las muestras de casos
y de controles deben ser representativas de la exposicin de las personas
enfermas y de las sanas de la poblacin definida por el inters del estudio,
de acuerdo con el esquema descrito anteriormente. La violacin de este
principio introduce sesgos de seleccin en la informacin obtenida que
afectan la validez de las conclusiones del estudio; por ejemplo, si el diag
nstico de la enfermedad ha sido favorecido por el conocimiento previo de
la exposicin se introduce un sesgo que tiende a sobrestimar el valor de la
asociacin estudiada, el cual se conoce como sesgo de deteccin y se pre
senta, por ejemplo, cuando se hace una supervisin mdica muy estricta de
las personas expuestas por los posibles efectos secundarios relacionados
con la exposicin o por el conocimiento previo de la existencia de la aso
ciacin por quienes realizan el diagnstico.
A este respecto, vale la pena citar la polmica suscitada por estudios
que han informado la existencia de una fuerte asociacin positiva entre la
utilizacin de estrgenos despus de la menopausia y la incidencia de cn
cer de eadomelrio (Smith y colaboradores, 1975; Ziel y Finkle, 1975; An-
tunes y colaboradores, 1979). Algunos epidemilogos han cuestionado tales
resultados con el argumento de que el sangrado que se presenta en algunas
mujeres expuestas a los estrgenos induce a una mayor supervisin mdica
que, a su vez, favorece el diagnstico del cncer en las expuestas frente a
las no expuestas, por lo cual se exagera la asociacin observada (Horwitz
y Feinstein, 1978). Para controlar la posibilidad de este sesgo se recomien
da seleccionar tanto los casos como los controles del grupo de pacientes
que han sido sometidas a dilatacin, curetaje o histerectoma.
De manera similar, cuando para evaluar el efecto de la exposicin a
los rayos X sobre la incidencia de cncer se selecciona un grupo de casos
que se diagnostican en la poblacin de ailados a un sistema de seguridad
social y un grupo de controles elegidos entre la poblacin general, se puede
introducir un sesgo que tiende a sobrestimar la asociacin por cuanto los
Estudios <Ucas&s y comrvics / 9J
casos, ms expuestos a los rayos X como consecuencia de una mayor su
pervisin mdica, tienen una mayor probabilidad de ser diagnosticados. Si
el investigador anticipa un sesgo de este tipo puede controlarlo al seleccio
nar los controles entre la misma poblacin de afiliados.
Por la facilidad de identificacin y obtencin de la informacin, los
casos se suelen seleccionar en istituciones de atencin mdica* casos hos
pitalarios, y rara vez se seleccionan entre toda la poblacin, casos pobla-
dnales, como puede hacerse si se cuenta con un registro poblacional de
la incidencia de la enfermedad, Los controles, a su vez, se seleccionan con
frecuencia entre los pacientes que consultan en las mismas istituciones,
controles hospitalarios, y slo algunas veces entre toda la poblacin de
sujetos sanos, controles poblacionales. En ocasiones, la seleccin de estos
ltimos se hace mediaste la eleccin de personas residentes en el mismo
barrio con el fin de igualar la informacin de los casos y de los controles
por factores tales como el estado socioeconmico. Tambin, es comn la
estrategia de comparar el grupo de casos con dos o ms seres de controles
seleccionadas de manera diferente, por ejemplo, una serie de controles hos
pitalarios y otra de controles poblacionales. La obtencin de diferentes re
sultados en la asociacin observada con una y otra serie puede suministrar
claves importantes para la deteccin de posibles sesgos y para la identifi
cacin de factores relacionados con la incidencia de la enfermedad.
S existen patrones de referencia de pacientes a las istituciones* de
atencin mdica que impliquen que los casos hospitalarios diagnosticados
en determinada istitucin no representen la exposicin de la poblacin de
casos, los resultados as obtenidos estarn afectados por un sesgo de selec
cin conocido como sesgo de referencia. Por ejemplo, es posible que en
un estudio sobre la enfermedad oclusiva perifrica se seleccionen tos casos
entre el conjunto de pacientes que acuden a una citica altamente especia
lizada y que slo admite a determinados pacientes que han sido expuestos
de una manera particular, no representativa, al factor estudiado. De manera
similar, es posible que los centros de aicncin mdica slo acudan los pa
cientes ms graves como suele suceder en los pases menos desarrollados,
caso en el cual la seleccin de controles hospitalarios puede introducir ses
gos de seleccin.
Cuando se seleccionan controles hospitalarios se debe tener especial
cuidado en hacerlo entre pacientes cuya enfermedad no est asociada con
la exposicin que se estudia; as, si para estudiar la asociacin existente
entre el infarto del miocardio y el consumo de cigarrillos se eligen los
9 2 /Metodolcgta A Ja invesiigana,.
controles entre aquellos pacientes que sufren oclusin perifrica vascular,
la asociacin observada en el estudio tiende a ser menor que la que real*
mente existe debido a la asociacin que se presenta entre la oclusin vas-
cular y el consumo de cigarrillos. Con el fin de evitar los sesgos de
seleccin se recomienda excluir como posibles controles a aquellos pacien
tes que presentan enfermedades cuya asociacin con el factor estudiado se
sospecha o se conoce y, adems, ampliar la diversidad diagnstica al elegir
a los controles hospitalarios.
Con respecto a la seleccin de ios casos y de los controles en el
empo se debe distinguir entre aquellos estudios realizados con casos in
cidentes y con casos prevalentes. Los primeros son los diagnosticados (fes-
de eJ momento de iniciacin del estudio con controles elegidos a medida
que esto ocurre, los segundos son los que se diagnostican con anterioridad
a la investigacin y los cuales pueden generar sesgos de seleccin cuando
no son representativos de la exposicin analizada debido a factores selec
tivos, como la muerte de los casos que han sufrido una mayor exposicin.
Por ejemplo, si se realiza un estudio de casos y controles con el fin de
estimar la asociacin existente entre el uso de cierto medicamento durante
el primer trimestre del embarazo y la incidencia de anomalas congmtas
y se seleccionan los casos a partir de las anomalas diagnosticadas en el
momento del parto es posible que, aJ existir la asociacin, algunos casos
expuestos hallan terminado en abortos los cuales finalmente no forman par
te de) estudio; si estos se hubieran incluido como casos la asociacin de
tectada habra sido an ms fuerte que la observada.
Cuando se seleccionan caBos incidentes se debe considerar que la
informacin obtenida con respecto a la exposicin previa suele ser ms
fidedigna que la de los casos cuyo diagnstico se ha producido en una
fecha anterior, con lo cual se demuestra la veataja de aquellos para dismi
nuir los sesgos de memoria.
Ventajas y limitaciones
La estrategia de los estudios de casos y controles tiene algunas ventajas
importantes con respecto a los de seguimiento:
La primera de ellas es su aplicacin ms rpida puesto que, en prin
cipio,'no hay que esperar a que la enfermedad se manifieste despus de
periodos de exposicin que pueden ser ms o menos prolongados porque
en estos estudios los casos son personas que o bien ya han presentado la
Estudies de casos y controles / 93
enfermedad de inters o sta se diagnostica en periodos cortos de tiempo
y en los cuales se determina la exposicin al factor de riesgo en forma
retrospectiva.
, segunda, es que el estudio de una determinada asociacin exige
un numero relativamente menor de participantes, o sea requiereun menor
tamao muestral. Un estudio de cohorte propuesto para evaluar una asocia
cin entre una exposicin y la incidencia de determinada enfermedad con
una presentacin relativamente infrecuente, categora a la cual pertenecen
la mayora de las enfermedades crnicas, exige el seguimiento de numero
sos sujetos con el fin de detectar durante el periodo de observacin la in
cidencia de un nmero suficiente de casos que permita estimar
adecuadamente la asociacin de inters; en estas situaciones los estudios de
casos y controles son especialmente ventajosos para el estudio de enferme
dades de baja frecuencia.
La tercera se refiere a la considerable economa de recursos, determi
nada por las dos ventajas anteriores, porque estos estudios tienen una-menor
duracin y un menor nmero de participantes con el consecuente ahorro de
Qempo, exmenes clnicos y recursos administrativos, entre otros.
Por ltimo, los estudios de casos y controles permiten analizar si
multneamente el efecto de varios factores, a diferencia de los de segui
miento que slo permiten estudiar el efecto de una determinada exposicin.
A este respecto cabe sealar la importancia de los estudios exploratorios
en los cuales se estudia la asociacin de mltiples factores con una deter-
minada enfermedad.
Aunque la relativa simplicidad de la estrategia de los estudios de
casos y controles hace de ellos un eficiente mtodo de investigacin, estos
tienen a su vez limitaciones que se deben considerar en todo momento
algunas de las cuales s mencionan a continuacin.
La medicin conecta de la exposicin se hace difcil cuando de
pende de la memoria de los participantes en el estudio; por tal razn, la
exposicin informada por un participante sobre el consumo de tabaco o
determinado tipo de alimentos en periodos remotos puede ser poco con-
fiable. r
. . . . . . ^ Seneral, el control de los errores sistemticos o sesgos es ms
OUfcil en un estudio de casos y controles que en un estudio de seguimiento.
En particular, se dificulta el control de los sesgos de seleccin que pueden
onginarse durante la eleccin de los casos y de los controles; adems es
difcil garantizar la calidad de la informacin relacionada con posibles va
9 4 /Metodologa de la ImeMtigatfn...
riables de confusin que han caracterizado el fenmeno en el pasado, lo
cual hacf difcil el control de estos sesgos.
El conocimiento de los participantes con reBpecto a la presencia o au
sencia cb la enfermedad puede originar sesgos en la informacin con respecto
a la exposicin: un caso con infarto del miocardio bien puede exagerar su
exposicin a la dieta rica en grasas como resultado de un nnyanfomo culpa-
bilizante, en tanto qi un control puede informar una exposicin menor que
la que realmente ha tenido debido a un mecanismo opuesto.
Un estudio de casos y controles slo permite analizar asociaciones
relacionadas con una determinada enfermedad, a diferencia de los estudios
de seguimiento que permiten estudiar la asociacin de la exposicin 4e
inters con la presencia de mltiples enfermedades.
Los estudios de casos y controles usualmente no son recomendables
para analizar asociaciones de enfermedades con exposiciones que se pre
sentan raramente porque la informacin reunida es ineficiente; no obstante,
el estudio es til si la exposicin es infrecuente pero es responsable de una
fraccin apreciable de la incidencia, como sucede con la exposicin m me
ro a dietilestilbestrol y la incidencia de cncer vaginal.
Adems estos estudios no aportan informacin con respecto a los
riesgos absolutos, esto es sobre tasas o proporciones de incidencia, a dife
rencia de los estudios de seguimiento.
Aunque no es una desventaja de estos estudios per se es importante
sealar que la aparente simplicidad de su estrategia junto con la relativa
rapidez de su ejecucin son un atractivo que trae como consecuencia la rea
lizacin de numerosos estudios de este tipo por personas que no comprenden
adecuadamente la estrategia y cuya calidad cientfica es cuestionable.
Referencias bibliogrficas
1. Antunes CM, StoUey PDr Roseastem NB el al. Endomctal cncer and estrogen use.
Repon of a large casc-comrol study. New England Journal c f Medicine. 1979: 900
913.
2. Brwlow NE, Day NE. Stadstical Methods m Cncer Research.- Vol I: The Anaiysis o f
Case^ Control Siudy. Lyon, International Agency for Research ou Cncer, 1980.
3. Col P. TheevoWing case-control s w d y Journal ofChronk D istases, 1979; (32): 15-27.
4. Comfeld J. A metbod o f estiroatng comparatve m es frora diuca! dala. Application to
cncer of tbe hrag, brean and cerviK. Journal c f the Nm'tonol Cncer Instituto. 1951;
(11): 1269-1275.
5. Doro HF. Some applicaiions of btametry b tbe coUectkm and evaluation o f medical daca.
Journal cfC h ron k Distases, 1955; (1): 63S*669.
*. EuudiosdecafOfyconmlts/95
6. Dorn HF. Some problems arising in prospective and retrospective studies o f the etiology of
disease. Afew England Journal c f Medicine. 1959; (261): 371-579.
7. Horwitz RI, FeinsteiQ AR. Alternative analytic methods for case-control studies of
estrogen* and endometrial cancer. New England Journal o f Medicine. 1978: (299):
1089*1094.
8. Mantel N, Haenszel W. Statistical aspects a f data from retrospective studies o f disease.
Journal o f the National Cancer institute. 1959; (22): 719*748.
9. Miettinen OS. Eaa inability and estimation in case-referem studies. American Journal o f
fyidem iology. 1976; (103): 226-235.
10. Schlesselman JJ, Case-Control Studies. New York, Oxford University Press, 1982.
11. Smith DC, Prentice R et ai. Association o f exogenous estrogen and endometrial car
cinoma. New England Journal o f Medicine. 1975; (293): 1164-1167.
12. Ziel HK. Pinkie WD. Increased risk of endometrial carcinoma among users o f conjugated
estrogens. New England Journal o f Medicine. 1975; (293): 1167-1170.
.F uentes de error
en la investigacin eoidemiolpira
En e n e captulo s e mencionan las fnentes principales d e los errores
que afectan los resultados de la investigacin epidemiolgica: los erro
res aleatorios y l o s sesgos; s e muestran formas que permiten expresar
el e f e c t o d e la variabilidad aleatoria para diferentes estudios pruebas
de significacin e intervalos de confianza y se define el x
indican algunas fuentes potenciales de este tipo de error y , por ltimo
s e enuncian las alternativas existentes para su control.
L a conecta estimacin de Jas medidas de inters en todo estudio de ca
rcter cientfico es, sin duda, una condicin esencial de la labor investiga-
ova. Por este motivo, el conocimiento de las principales fuentes de error
de los estudios epidemiolgicos es un requisito fundamental para el inves-
98/*todoU>fee l* mvesigcM*-
tigador que se desempea en esta rea, ya que en la medida en que ste
conozca con anticipacin los errores que pueden presentarse en un deter
minado estudio estar en capacidad de controlar su efecto y de garantizar
la calidad de sus resultados.
Los errores que se pueden presentar en la investigacin epidemiol*
gica se clasifican en dos grupos de acuerdo con su origen (Kleinbaum y
colaboradores, 1982):
1. Aquellos que se originan en la variabilidad aleatoria fluctuante y capri
chosa propia de los resultados obtenidos en muestras elegidas al azar, ios
cuales afectan la precisin de los resultados.
2. Aquellos que se producen de manera sistemtica, en el mismo sentido y
con la misma magnitud y que no se deben a la variabilidad aleatoria; stos
afectan la validez de los resultados.
En los prrafos siguientes se precisa la naturaleza de estos enores y
se indica la manera general de tratar los problemas que ellos presentan al
investigador.
Error aleatorio
La variabilidad que presentan los resultados obtenidos en muestras to
madas aleatoriamente es la expresin del comportamiento impredecible
y caprichoso del azar. Los resultados de una investigacin son ms o
menos precisos de acuerdo con la mayor o menor variabilidad aleatoria
que presenten, la cual est condicionada fundamentalmente por dos fac
tores: t . .
1 El tamao muestral: las muestras numerosas producen resultados bastan
te precisos porque el error estndar de la distribucin de estimaciones
mustrales, el cual mide la dispersin de tales estimaciones, es inversamen*
te proporcional al tamao muestral.
2. La variabilidad de las variables observadas: l error estndar de la dis
tribucin de resultados mustrales es directamente proporcional a dicha va
riabilidad, la cual se mide por medio de la varianza.
1 El error estndar de U dhtrtbuo* de a s m e m e ' onieswkes de los promedio o d e l w
preporeones de una cierta variable X cuando was estiman c a base muestmrelauvameme
grandes es igual a O^fl. o donde o t s la deviacin estndar da X y n es el lameflo muestral.
2 Es* principio snpkneoK afirma que la dispersin de los l i a d o s ouestralet as mayor a
medida qoe la variable que se mide presenta une m y t * vanecta.
Fuemt de error ente wvesbgaci../99
a ulVent" * 108 resultados se obtienen
i r S j t * eXpfCSa itativamente por medio de
AnnnT * M y de Jos iwrwz/af * c n i c a
Maque no es pertinente presentar detalladamente en esta obra lo relacio
nado con tales procedimientos estadsticos (Vase, por ejemplo, Daniel
S imp0f anle dm& 18 aEeftcin t a d a algunos aspectos que tienen
un inters particular para quien realiza una investigacin en epidemiologa.
Pruebas d significacin estadstica
Las pruebas de significacin estadstica, utilizadas de rutina para probar
E f S; aPUcaa M# en estudios analticos que pretenden esta-
S h 8 CaU8a,es la exPsici6n a ^ t o r e s T riesgo y la
w2 S rttl eVentoS rbdS- Se * be * * * clar^ n * e que el esta-
S S T S S T T a80ClaC,n en la deteccin de una dife-
factord T r i Mtr? 18 inc,dencia * expuestos y no expuestos a un
< S i i y qUC 0btencin * Mta diferencia entre los grupos
comparados puede, en pnncipio, ser el resultado del simple azar - p o r la
r ' y no r r ,a p r a "i" * *
tente entre los grupos comparados.
, i r J * C?Ce h frecucnda con que se presentan por simple azar los
? btes *" determinada situacin se tiene una idea precisa
ace/ca de si el resultado observado en el estudio, por ejemplo una diferencia
e r n los grupos comparados, con alta probabilidad es producto dd azar o si
K r W * * * * * * * un resuhado <Jue N a p r o
dife r e nc ia entre l o s grupos comp arad os sospechada d e antemano. Por e s t e m o-
ProbBbdad ^ ^ r s L p u Z
001110 Observado el estudio o uno an ms extremo- esta
probabilidad se presoita en la literatura cientfica como el valor de P
se obten J a ^ d re su lta * > observado o uno ms extremo
se obtenga por simple azar es considerable, o sea si el valor de P es alto.
se debe aceptar que la diferencia observada pudo ser producto del azar
caso _en ei cual no se confirma la existencia de sta entre los grupos com-
parados; en esta situacin el investigador debe informar la obtencin de
T a S0D estadsdcan,ente significativos. Por el contrario si la
^ b * d a d de que el resultado obsemdo o uno ms extremo se obtenga
por ampie ^ a r e s m u y pequea, esto es si el valor de P es bajo, se puede
pensar que la diferencia de inters entre grupos comparados existe real-
100/Ueiooioga de a investigacin^
, r caso en el cual el investigador est en presencia de resultados que
son estadsticamente significativos.
El razonamiento anterior implica la fijacin de un lmite por fuera
del cual se considera la presentacin de cierto resultado como improbable;
con esta inteppin el investigad, de acurado con su criterio de exigencia,
fija ffflr1"1- lo que se denomina como el nivel de significacin estadstica
de la prueba que va a realizar, el cual se denota por la letra griega o y no
suele exceder el 10%. Por ejemplo, si para verificar la hiptesis de que la
exposicin a un determinado factor est asociada con la incidencia de una
el investigador fija como criterio de decisin para realizar la prue
ba de eignifit-arirtn un nivel o igual a 0,05, la obtencin de cualquier diferen
cia en la incidencia enre expuestos y no expuestos y o valor de P sea menor
de 0,05 sugiere la existencia de la asociacin estudiada; en este caso el inves
tigador informar la obtencin de resultados estadsticamente significativos.
H Mnnrimiento de la probabilidad P de que se presente por azar un
resultado o uno ms extremo se obtiene al consultar la distribu
cin de probabilidades que corresponde a la situacin analizada. As, si se
comparan las proporciones de incidencia de una enfermedad observada en
grupos numerosos con exposicin diferente a un factor de riesgo, dicha pro
f u n d a d se conoce al consultar la distribucin normal; no obstante si tal com
paracin se hace entre los promedios observados en una variable continua
por ejemplo nivel de glucemia entre grupos de moderado tamao, tal
probabilidad se conoce al consultar la distribucin de probabilidades conocida
como t de Studeni. Por ltimo, la comparacin de las frecuencias observadas
con mn)1 que se esperan por azar en ausencia de asociacin, en grupos
relativamente grandes, se realiza por medio de la distribucin de chi cuadrado.
Por ejemplo, supngase que un investigador desea probar la hipte
sis de que un cierto medicamento ofrecido como terapia para el sida es
mejor que otro ya conocido que slo produce una mejora en una propor
cin reducida de los pacientes; para tal propsito fija un nivel de signifi
cacin a del 5% y distribuye aleatoriamente los participantes en los dos
grupos comparados. Al mirar los resultados observa que, efectivamente, la
mayor proporcin de pacientes que han mejorado corresponde al grupo tra
tado con el nuevo medicamento; sin embargo piensa que la diferencia ob
tenida puede ser fruto del azar y, para salir de esta duda, realiza una prueba
de significacin estadstica. Al consultar U distribucin de probabilidades
correspondiente advierte que la presentacin por simple azar de una due-
rencia igual o mayor que la observada slo se presenta con una probabili
Fuentes * error en lo investigacin.../1 0 /
dad igual al 2%, esto es P - 0,02. Ante este hallazgo el investigador in
forma la obtencin de resultados estadsticamente significativos P < 0 05
y concluye a favor de la nueva terapia.
Con lo dicho anteriormente se plantea que la verificacin de una
hiptesis por medio de una prueba de significacin estadstica se apoya
sobre el conocimiento de lo que suele suceder por a2ar y, por tanto, la
conclusin a que de este modo se llega no es infalible. Por ejemplo, ante
la presencia de un resultado estadsticamente significativo el investigador
se inclina a favor de la hiptesis que pretende confirmar porque el resulta
do observado no suele ocurrir por azar; no obstante el resultado puede ha
ber ocurrido por simple azar eventualidad que ocurre rara vez pero no
hay manera de descartarla totalmente- situacin en la cual la conclusin
indicada por la prueba de significacin es equivocada.
De estas consideraciones se deduce que el resultado de na prueba
de significacin ha de tomarse como criterio orientador en el proceso de
prueba de hiptesis que se realiza con base en la informacin obtenida en
muestras aleatorias; adems debe considerarse que los resultados de estas
pruebas estn condicionados por ei tamao muestra! de los grupos compa
rados. Por lo anterior, no es difcil advertir que cualquier diferencia, por
mnima que sea, se puede mostrar fcilmente como significativa si se in
crementa el tamao muestral; pero un resultado significativo en estas con
diciones slo indica la existencia de una diferencia que no tiene
importancia desde una mirada clnica, cientfica o estratgica.
Quizs m** an es la consideracin relacionada con la
insuficiencia de la muestra utilizada para demostrar como significativa una
cierta diferencia existente. En estas situaciones frecuentes cuando se tra~
ta de economizar recursos escasos los resultados obtenidos en la prueba
de significacin tienden a producir diferencias que no son estadsticamente
significativas debido al reducido tamao muestral; en este caso se habrn
desperdiciado ios escasos recursos existentes y se habr negado equivoca
damente la existencia de una asociacin.
A pesar de la prctica difundida en la literatura cientfica de mostrar
la posible participacin del azar en los resultados de investigaciones reali
zadas con muestras aleatorias por medio del valor de P, se ha hecho notar
que un resultado referido nicamente en trminos de ste no muestra ei
rango de variacin o precisin de la medida que se estima, el cual se ori
gina en la variabilidad propia de las estimaciones que se obtienen por azar,
por este motivo es conveniente acompaar las medidas que se obtienen
J 0 2 /Metothiofia d t te Mmtlgac&L..
procesos de seleccin aleatorios o estimaciones con los intervalos
de confianza correspondientes (Rothman, 1986).
Intervalos de confianza
Una alternativa para la expresin de los resultados obtenidos en muestras alea-
lonas consiste en presentar las estimaciones obtenidas una proporcin de
prevalencia, una proporcin de incidencia o una medida de asociacin en
trminos de un inrvalo de 100(1 - <*)% de confianza, con una amplitud que
refleja la precisin de la estimacin lograda. La divulgacin de resultados por
mwti de estos intervalos se suele hacer, de manera aproximada, mediante el
supuesto de que las estimaciones mustrales obtenidas a partir de muestras
grandes se comportan como una distribucin normal
En una de prevalencia realizada con una muestra aleatoria
de a sujetos en la cual se obtiene una estimacin puntual p de la propor
cin de prevalencia de inters n, la variabilidad propia de los resultados
obtenidos se expresa en un intervalo de 100(1 a)% de confianza con unos
que se obtienen mediante la expresin:
P * Zwtf*
en la que Z 1<t denota el valor que toma la variable normal es
tndar Z en el percentil 1 - OJ2 y o al valor del error estndar de la
distribucin de las estimaciones mustrales de n, valor que se estima
como ' i l pf l py*]- . . . . . .
As, si en una encuesta de prevalencia sobre desnutricin realizada
en cierta poblacin con una muestra aleatoria de 300 personas se obtiene
una estimacin puntual de la proporcin de personas desnutridas p = 0,14,
se puede afirmar con un 95% de confianza que la prevalencia de desnutri
cin en tal poblacin Jt se encuentra entre el 10 y el 18%, lmites que se
obtienen al reemplazar en la expresin anterior
<
p Z,.t = 0,14 1,96^1(0,14X0,86)^00]
De modo similar, si en un estudio realizado para estimar la asociacin
entre la exposicin al polvo de algodn y la bisinosis se encuentra un intervalo
e 95% de confian con unos lmites de 1,5 y 3,2 para el riesgo relanvo* se
puede afirmar con tal confianza que este ltimo no es inferior a 1,5 ni superior
a 3.2, informacin ms completa que la que pudiera suministrar el simple
valor e P obtenido en la prueba de significacin correspondiente.
Fuentes de error en Lamveaigcan./J03
Cuando se pretende expresar la asociacin buscada por medio de la
estimacin de una diferencia de proporciones, el intervalo de 100(1 - a)%
de confianza para la diferencia buscada tc; - jc toma la forma al-
A
X Zhaa = ( p , - p 0l + lMgj]
en donde p y p son las estimaciones obtenidas de las proporciones
de inters en los dos grupos de comparacin, Z , . ^ es el valor que toma
la variable normal estndar Z en el percentil / a/2, n, y n0 son los tama
os mustrales de los grupos comparados, p = (n,p1 + n ^ ^ f n , + n j y S
- - p-
Otando se pretende estimar la asociacin de inters por medio de
una razn R riesgo relativo o razn de disparidades se puede conside
rar como alternativa a la expresin ya citada en los dos captulos preceden
tes que permite calcular de una manera aproximada un intervalo de
confianza para R con base en la prueba de significacin que la variable
X que se distribuye normalmente es su logaritmo, de tal modo que s puede
obtener un inteivalo de 100(1 - a)% de confianza para ln R mediante la
expresin (Rothman, 1986):
A
X Z , ^ <3 = l R z M 'Vardn R)
A
en donde R corresponde a la estimacin lograda en el estudio y la
varianza estimada de su logaritmo adopta una forma de acuerdo con el tipo
de estudio a s : .
1. Estudios de seguimiento con base en tasas de incidencia:
'1 I
Varfln R) = +
a b
en donde a y b son los casos observados en los grupos de expuestos
y de no expuestos, respectivamente.
2. Estudios de seguimiento con base en proporciones acumuladas:
Vr(ln R) = J L + J _
an, bn0
en donde a y b corresponden al nmero de casos observados en los
grupos de n expuestos y de n0 no expuestos, respectivamente, y c y d
i04/UeSo>Q$iaeUtx*atitccU*-.>
al nmero de personas ***** observado en cada uno de los grupos compa
rados.
3. Estudios de casos y controles o estudios con base en datos de preva-
lenda:
l i l i
Var<U , R ) = - + - + - ^ d
en a y c corresponden al nmero de expuestos observados en
los grupos de sanos y de entornos y b y d a sus respectivos complementos.
Una vez se han calculado los lmites del intervalo de confianza para el
logaritmo natural de la razn R es posible encontrar los limites para la
razn de inters al calcular los correspondientes antilogaritmos.
Por ejemplo, en un estudio realizado en la ciudad de Medelln sobre
factores relacionados con el consumo de cigarrillos en escolares adolescen
tes (Londoo, 1992) se encontraron los siguientes resultados con relacin
a) consumo del adolescente y al consumo en el grupo preferido de amigos
(Vase tabla 6.1).
Tabla 6 . 1 Consumo d e cigarrillos e n escolares a d o l e sc e n t e s y e n el grupo de
amigos, Medellin 1 9 9 2 ________
Grupo de amigos
Total
* 58
90 14S
consumo
44 295
339
Total 102
385
487
Fuente' Londoo JL Factores relacionados con el consumo de cigarrillos en escolares
adolescentes de la ciudad de Medellln. flotetfo de la Oficina Sanitaria Paname
ricana. 1992; (112): 131-137.
Fumiti de e m r en fa MV*Stigaclti. /1 0 5
t e = d = W x 2 9 S )
be ( 4 4 x 9 0 ) ~
la ^ n tlf nS rValO, T 0XraadO " 95% dc canfianza * logaritmo de
la razn de disparidades se obtiene as:
& RD Z-a/2 Vtifh DJ = In RD 7o.m Muto) + f/AJ + (1A) + ,7/rfj;
= In 4,32 1,96 ^(1/58) + (1/44) + (]/90) + (1/295))
= 1, 01; 1,92
de hJ T " S Pemtite obtcner los ** del intervalo para la razn
6,82 SUS corresPondieincs antilogaritmos: 2,75 y
Sesgos
t o v S S J ? 7 0reS qUC SC ltroducen e n o r e s u l t a d o s d e ]a
L u nr l r ComPortamien fluttuante del azar y que afec-
? 3os mismos exis,en ^
t , mI Sma magnitud y en ei mismo sentido y afectan la
o S s f hn ri* ' 108 CUde8 reciben cl ombre de Aun-
^ - - c s
X r r ^ - , 1982l: los -
< f e informacin
Le* sesgos de informacin se originan en lai mediciones o datos indivi-
v S l ^ d S SStoDtC * * ^ las
e l e f r l T eJempl S 61,(111 e s t u d i 0 ^ 8 ^ e n t o r e a l i z a d o para e valu ar
d r f e o o p r e v e n f v d e l a a s p i r i n a e n l a apari ci n d e l infar t o d e m i o S
IO S f T de la fcnnedd ocurridos en el grupo expues-
n el ,eVeS ^ Se iIKla*eB todos 105 episodios pr e s e n t e *
m y w ^ e l l ^ a ^ btenida valor
S r Z h ^ men!f eX,StCTte debido a *> de informacin;
M * mValidar las o d w i o n del estudio. En
s? 8 diferenciai pues, ^ *> * ^
metido en la medicin del efecto que ocurre en uno de los grupos compa-
Fuen**4e trror en la brmtifacUn,,. / JO7
una disminucin en la estimacin de la medida de la asociacin- si a
E S S t0J m T aCn ^ SgnflCativa la ^ * t ecla & un
r i tal naturalez invallda la conclusin del estudio. No obstan-
de' S c T T ! , 8m,nCtn i n t r o d u c i d a p o r e l s e s g o e n l a m e d i d a
d i s o c i a c i n h a l l a d a s e a t an a p r e c ia b l e q u e o b l i g u e a n e g a r e q u i v o c a d a -
^ 13 KStenC,a "" 8ta BarTOn. 1977: Copeland y colaboradores.
Sesgos de seleccin
OC^lm:,, CDm c0nsecuenca * P*edimiemos de
E mS E que g cran muestras Presentativas .de
^ f 0 t m a l a s t i m a c i o n L a s o b t e n id a s
S e qU!, nveStigador P' * obtener. Por ejemplo, es
pos ble que en un estudio sobre la dieta como factor coadyuvante en el
i T e S c n d tUpC DS" ancrial realizado o Pegona* voluntarias, la au-
weleccin de un buen nmero de participantes obesos introduzca un seseo
en los resultados obtenidos finalmente. w
L0SHSeSg0S f selecd6n se presentan siempre que una variable co-
^ l na?a con f efec, tudiado afecta la inclusin o exclusin de los
partiapances en alguno de los grupos comparados; por ejemplo, varios es
tafaos relacionados con la ocupacin como factor de exposicin han incu-
a que los " * " i -
r i d t t T t a , trabajadores a c t i v o s , o s e a , p e r s o n a s q u e s l o s o n admi-
tidas a l a e m p r e s a s i t ie n e n b u e n a s c o n d i c i o n e s d e s a l u d , c a s o e n e l c u a l
T " "^ c
jarjos n l ^ md S ^ ^ y Cn,r0lCS 13 seleccln de casos hospita-
S o r 2 L X Y e , g 0 S SCleCCtD d e b i d 0 a l a s P t i c a s d i a g S s t i -
o adimsiI " * P u e n t e s pr op i as d e l a i s t i t u c i n . V a r i o s d e eUos
S r i T C0!L establecer la asociacin existente entre ]a adminis-
S e S o e m p0smeaoP ^ V * incidencia de cncer
hall sld0 cuesQ0ados con el argumento de que la identfi-
PaCieteS ho* taHa^ * do hecha a partir de un
u n e n ordenado por un sangrado intensivo, causa de la hospitalizacin
2 t a e n 5^ ^ en 0CaS0eS * Presenta 001110 efec> <W consumo
de esttgenos, una mayor proporcin de los casos as detectados, pacientes
c o r n o s ^ t tDd0m&tr} ' r e su lt a P r e s t a a l a h o n n o n a c u a n d o s e
c o m p a ra c o n l a p r op or c in d e c o n t ro l e s a q u i e n e s , por n o haber s angrado
Fiesiie error tn Ja w ***Hgaci6fL..f 1 0 9
A sodadn
X v
d e inters
Exposicin
Enfermedad
Variaba d e confusin
Figura .1
Representacin esquemtica de la situacin e n la q u e s e produce
un s e s g o potencial d e confusin
a q u d l S vanaw t ? ***** C0m0 faCt0rCS de confusin a
c S V l n 7b Zy qT SOn un eslabn intermedio en la secuencia
U , artenoesclerosis, relacionada csuulmente con
la hipenensin y con la enfennedad coronaria, no debe considerarse co
mo una potencial variable de confusin cuando se estudia la asociacin
S T / S L * ! r nS4n* y13enfCrmedad
S e J f m ma aSociacin k obesidad s debe conside
r a r e como una potencial variable, de confusin puesto que est
coroadl teinente C n ^ hipenensi6n y con la enfermedad
De lo dicho anteriormente se concluye que el control de la confu-
e a eTtim^-I^H Z * * Cn '* exPosicin * P * introducir
en la esQmac.n de una medida de asociacin entre X y Y se logra me-
sobS Z. ^ ' l0S cfectos ^ la posicin X tiene sobre Y y
c e e l d e 11118 v a i i a b l e c o m o P o t e n c ia l d e c o n f u s i n l a ha-
c e d i n v e s t i g a d o r d e a c u e r d o c o n e l c o n o c i m i e n t o q u e t e n g a d e s u c o m -
d DVesdeador 5610 alcaD2a a sospechar que una
v i a b l e puede introdwar un sesgo de confusin en sus resultados y debe
entonces controlarla. En cualquier caso, la apreciacin del efecto de con-
^ i ^ JerCe Una; aliablc sel0graal C0 P la medida de asociacin
cuand0 controla 8 efecto con la medida encontrada
S f i T COn,tr la Mt0 es' b niparacin de la medida ajustada con
la medida bruta; la magnitud de esta diferencia refleja el sesgo que intro
duce la variable de confusin si su efecto no se concia.
Furnas terror tn ta iaveirigacion..Vj ] J
7. LondoAo JL. Ficiores relarionados eon el coosumo de dgarrillos en escolares adolesccses
13I I 37*^*^ ** Medellin. BoUtin de ta Oftc'uta Sanitaria Fanamericorui, 1992; (112):
8. Miraiwn OS, Cook HP. Confounding e s s c r e and detection. American Journal o f
Eptdemiobgy. 1981; (104); 609-620.
9. Rothman KJ. Modem Eptdemioiogy. Botton, Utile, Brown, and Co. 1936.
10. Sacked DL. Bias in analytic research. Journal o f Chronic Diseases. 1979; (32): 51-63.
11. ScUeaselinan JJ. Awesiag effects o f confounding variables. American Journal o f
Epidemiology. 1978; (108); 3-8,
7
de tasas
En e s te captulo s e presenta la estrategia utilizada en la investigacin
epidemiolgica para ajustar ndices, usualmente tasas o proporciones,
con el fin de comparar las medidas observadas en vanos grupos en
igualdad d e condiciones c on respecto a variables ajenas al inters del
estudio. En particular, s e presentan e l mtodo directo y e l indirecto
c on sus ventajas y limitaciones.
.Ein muchas ocasiones, el epidemilogo debe comparar ios ndices que
reflejan la mortalidad o la morbilidad de diversas poblaciones; las diferen
cias que se presentan en tales medidas son, con frecuencia, el punto de
partida para la bsqueda de los factores de riesgo asociados con las distin
tas enfermedades y para la adopcin de medidas preventivas. No obstante,
sucede con frecuencia, que las poblaciones comparadas no se encuentran en
igualdad de condiciones con respecto a determinados factores que,
U 4 /U a c c k o ? ta fb U tiatgodt-
no son de inters en las comparaciones realizadas, e s t n ^ o n a t o c o n
una mayor o menor motbimortalidad; entre ellos estn la edad y el sexo.
Por ejemplo, on epidemilogo puede estar interesado en comparar
la incidencia de cncer gstrico en dos poblaciones que n n e t t r n un
consumo notablemente diferente de cierto alimento, con el objeto de co
nocer si ste es un factor de riesgo para la enfermedad; sin
dicho investigador advierte que una de las poblaciones est
en su mayora, por personas jvenes en tanto que la otra lcosonuda
principalmente por personas de edad avanzada. Ante este hecho^perobe
que. para su propsito, no sera adecuado realizar la comparacin sobre
?as tasas brutas de incidencia de cncer gstrico, o sea las tasas reales
de las dos poblaciones, y que tal comparacin debe realizarse con el
supuesto de que las dos poblaciones tienen igual estructura **r
decir, con base en tasas ajustadas por edad o sea en igualdad de condi-
ciones respecto a esta ltima.1
En esencia, el problema se resuelve si la morbilidad observada en
ambas poblaciones se refiere a una poblacin nica o poblacin estndar
de tal modo que la estructura etrea nica de ella pcmitacakular te mor
bidad que se presenta en las poblaciones comparadas. Tradic.onalmente,
para resolver estas situaciones se han propuesto dos estrategias mtodo -
gicas conocidas como el mtodo directo y el mtodo indirecto, laB cuales
se exponen detalladamente a continuacin.
Mtodo de ajuste directo
Quizs la manera ms prctica para comprender este mtodo sea la solu
cin de una situacin concreta como la que se muestra en el siguiente
ejemplo.
Un investigador, en busca de factores de riesgo para e cncer de
cuello uterino, desea comparar las tasas de incidencia de l ^ ^ d ^ d e s d e
Cali, Colombia y S8o Paulo, Brasil las cuales tienen una poblacin y unas
tasas especficas p o r edad que se muestran en la tabla 7.1.
1 P M . que exin. m * i n m 1 M y U m e t o d de ctocet gtaricc, b pcMad*
vqb t t eneiWDtn en dejvenujs coa rapecto * l t joven.
Ajaste d t M / 1 1 5
Tabla 7.1
Poblador, nmero d e c a s o s y tasas anuales d e i n d d e r w a d e cn
cer d e cueHo uterino e n Cali, Colombia 1977- 1981 y S l o Pauto
Brasil 1 9 7 8
C a l
Edad
Poblacin
No. d e
Tasa
en aos
n
ca s se
x JO5
0 a 14
217.645 0
0.0
15 a 24
145.409
2 1,4
25 a 34
86.644
16
18,5
35 a 44
63.454
34
53,6
4 5 a 54
41.180 44
106.8
55 a 64
24.551
36
146,6
65 y ms
19.042 37
194,3
Toral
597.925
169 28,3
So Pdub
Poblacin
n
No.de
casos c
992.534
746.750
6 3 9 2 1 4
423.847
328.074
208.108
173.968
3.512.495
Tasa
fO5
0
0,0
14
1.9
76
11,9
195
46,0
266
81,1
228
109,6
186
106,9
965
27,5
fu en te: International Agency for Research on Cancer. Cancer Incidence in f w t Conti
nents. Lyon, 1987, Vol. 5. La informacin original se agrup en categoras et-
ras mas amplias.
Con esta informacin se calculan las tasas brutas de ambas ciudades
Tc y 7>, as:
T = No. total de casos _ ^ + C/2< + ... + c
Poblacin total
6S y n t
Poblacin total
B X n )oa4 + U * n)5&4 + ... + ( t X n ) t ?
Poblacin total
- 0+2+16+34+44+36+37 169
mdj
dn
597.925 597.925
5 28,26 casos por ]00,000 personas-ao
De modo similar se procede para obtener la tasa bruta de la pobla-
de Sao Paulo:
Tp = ^ .* * * ^ casos cM4 + cISa24 + ... + c
Poblacin total Poblacin total
IJ/Oaodologi 4* lo tavtidforidn...
(t x n)oej4 + ( t x + ... + (t x n) y ^
~ Poblacin total
0 + J4+76+I95+266+228+186 965
9 3.512.495 3.512.495
= 27,47 casos por 100.000 personas-ao
No obstante, el investigador observa que existen algunas diferencias
en la estructura rea de las dos poblaciones y por tal motivo, no sera
adecuado para su propsito realizar la comparacin de las tasas Imitas as
obtenidas. En la tabla 7.2 se aprecia que la poblacin de Cali es ms joven
que la de Sao Paulo.
Tabla 7.2 Distribucin por e d a d d e la poblacin d e Cali y de 53o Paulo
edad
enanos
Cali
S i 0 fai/fo
Poblacin %
Poblacin %
Oa 14
217.645 36,4
992.534 28,2
15 a 24
145.409 24,3
746.750 21,3
25 a 34 86.644 14,5
639.214 18,2
35 6 44 63.454 10,6
423.847 12.1
45 a 54 41.180 6,9
328.074 9,3
55 a 64 24.551 4,1
208.108 5,9
65 y ms
19.042 3,2
173.968 5.0
Total 597.925
100,0
3.512.495 100,0
Fuente: International Agency for Research on Cncer. Cncer /ndente in Five Cont
nents. Lyon, 1987, vol. 5. U informacin original se agrup en categoras et
reas ms amplias.
Con el fin de solucionar el problema planteado, el investigador decide
adoptar una poblacin nk o estndar 5 con la cual se puedan calcular las
tasas ajustadas de ambas poblaciones. Para este propsito adopta como tal
a la poblacin femenina de Amrica Latina (Celade, 1991) y con sta cal
cula el nmero esperado E de casos que se presentaran en ambas pobla
ciones bajo las propias tasas especficas de incidencia (Vase tabla 7.3).
Ajatn dt tesas / 17
Tabla 7 . 3 Tasas especficas d e inddencia anual de cncer d e cuello uterino en
______________Cali C y Sao Pauto P y pobbdn e s t ndar ( e n miles)
* * * * t c x W 5 to b b n estndar t x 1(P
en aos v
N,
0 a 14
0,0
15 a 24
1,4
25 a 34
18,5
35 a 44
53,6
4 5 a 54
106,8
55 a 64
146.6
65 y ms
194,3
Totdl
28,3
77.500 o 0
43.291 1|9
34.589 11.9
24.275 46,0
1 6 3 5 5 81.1
11.693 109,5
11-220 '106.9
218.923 27,5
FU*nte: ** Research Canwf- C* * * * * fve
^ u i.nf? rmaci6n ori8 nal se u p en categoras
S 2 S J T L ! P ^ F!obiaoon estandar: Cetade. Amn'ca Utha. prbyecdones de
poblacin arios calndanos 1950-2000. Boletn Demogrfico. 1991; (48) :31.
As, el nmero esperado de casos en Cali Ec se obtiene de la si-
gueme forma:
E c = f r * + <l x + - + ( r x y ^
= 0,0 x 10-s x 77.500 + 1,4 x 0 x 43.291 + ... + 194.3 x 10* x 11.220
*= 76*43 casos esperados
Paulo fi6 m0d Similar' se obticne d nmero esperado de casos en Sao
e f = x rtjJaiM, + ( i x ns)l}a4 + ... + ( t x ns!t j
= 0,0 x 10s x 77.500 + 1,9 x O5 x 43.291 + ... + 106,9 x 10s x 11.220
= 54*18 casos esperados
Finalmente, las tasas ajustadas TA de ambas poblaciones esto es,
aquellas que se presentaran si ellas tuvieran la estructura etrea de la po
y ms
]8/Metodoiog(a de la mvestigeei*-.
blacin estndar se obtienen al dividir el nmero esperado de casos en
una y otra por el total de la poblacin estndar Nr
t a - j E l . - 76,43 m 34 91 casos por 100.000 personas-ao
1 Ac ~ Ns 218.923
t a - = 5 4 , 8 - 24 75 casos por 100.000 personas-ao
1 f N, 218.923
De acuerdo con los resultados obtenidos se puede afirmar que si Cali
y Slo Paulo tuvieran poblaciones en igualdad de condiciones de edad la
tasa de incidencia de cncer de cuello uterino en la primera ciudad safa
noiahlfTTVMte superior a la que se presentara en la segunda 34.91 x 10*
y 24,75 x 10' 5, respectivamente resultado bastante diferente al que se
fthtiwi pwtitmte la comparacin de las tasas brutas 28,26 x 10- y 27,47
x 10"5, respectivamente.2
Otra ro"* de interpretar el resultado as obtenido es afirmar que
otros factores diferentes a la edad estn relacionados con la diferencia exis
tente en la incidencia de cncer de cuello uterino entre Cali y Sto Paulo,
puesto que despus de ajustar las tasas por edad persiste una diferencia.
Pruebas de significacin estadstica
La comparacin de la tasas ajustadas por el mtodo directo de dos pobla
ciones suele hacerse en trminos de la diferencia TA - TA2.
lina prueba de significacin para tal diferencia se realiza con el su-
puesto de que las estimaciones mustrales de las tasas se distribuyen nor
malmente; de este modo, para probar la hiptesis nula de que no existen
diferencias entre las tasas ajustadas se puede recurrir a la variable normal
estndar de la siguiente manera:3
X - H * ( T A , - TA2) . 0
Z * g 0 ^ IV arlT A j - T J
2 Ntese que I tasas ajustadas too medidas hipotticas que se darfii en 1 cc n d w i o i w de la
poblacin estndar y que sirven p a n reatoar c o m p a a * en jualdad de cortnones.
3 Estrictamente, se treta de una prueba de s i p u f i o d e para la dii* to de do proporciones
ponderadas. No o a n l e , dado que el valor numrico de las tasas y las proporciones suele m
similar, se aaome que las tasas u se pueden tratar como proporcin*/*
Ajuste de m as / i 19
En donde: VarfTA, - T A J - I * , , f l . ttflto ,, + l Ma)
Cm: w. -^2- y t = x + ta x n a
' JU * *
"fr + 2
As, para el ejemplo propuesto acerca de la comparacin de las la
sas de incidencia de cncer de cuello uterino de Cali C y SSo Paulo P se
tiene que:
9 _ (TAC - TAp) - 0
~ ^fVar[TAc TAJ
s ________ 34,91 x I&3 - 24,75 x 10S
^1(0,0+0.58+4.15+10,45+12,83+14,95+17,49) xl(T =
resultado que indica la existencia de una diferencia altamente signi
ficativa entre las tasas ajustadas de ambas poblaciones.
Con respecto al mtodo de ajuste directo conviene considerar lo si
guiente:
1. En principio, la mejor comparacin es la de ias tasas especficas, por
ejemplo dentro del mismo grupo etreo; sin embargo con frecuencia el n
mero de observaciones en cada categora es reducido, por tanto es necesa
rio recurrir a comparaciones globales con el fin de estabilizar las
fluctuaciones de las tasas especficas debidas al azar.
Adems, la comparacin de las tasas especficas de un nmero
apreciabie de regiones se presenta a menudo como una tarea inalcanza
ble, condiciones en las cuales es necesario comparar tasas globales ajus
tadas. Eyi la figura 7.1 se presentan las tasas anuales brutas y ajustadas
de incidencia de cncer de estmago en hombres de diferentes zonas
geogrficas.
2. La eleccin de la poblacin estndar es, en cierto modo, una decisin
en la escoge ocia de una po
blacin nica; no obstante coa el fin de evitar distoisiones en los resultados
- ^ u e raramente se presentan- conviene elegir una poblacin similar a las
confrontadas. Cuando la comparacin se hace entre dos poblaciones es co
mn elegir como estndar a la combinacin o suma de las dos.
120/Mtoc^ga de i d Unwti$aein~.
Regin
Qma, Shanpa)
fctael, judio
iepn, Hiroshima
Alemania. Hamburgo
Finlandia
Irianda
Italia. Lombarda
Noruega
Sueda
Espaa, Navarra
Suiza. Ginebra
l^lMErTsyGales
Brtsll, So Pauto
Colombia, Cal
Costa Rio
t a r t o Rico
Canad
Estados Unidos. N.Y.
Francia, Do ufes
Periodo 7B TA
x 05 JCTO5
Tasa frut Tfcaaajuswcto
x x t f
SO 25 0 2S 50 75
Figura 7.1 Tasas brutas TB y ajustadas TA de incidencia de cncer de est-
mago en hombres de regiones selectas
ft*rwe: International Agency for Research on Cncer. Cncer In d en cejn A Con*
nents. lyon, 1987, vol. 5. Las tasas han sido ajustadas con respecto a la pobla
cin mundial.
3. Si la obtencin de una tasa ajustada TA por el mtodo directo se logra
al dividir el nmero esperado B por el nmero total de la poblacin estn
dar Ns se tiene que:
E t, x f l i . + U x n* + ... + f* x n*
TA = * ------- - -----2 ---------------------
N,
i, x nlt t , x n
u
N. N.
N.
Uxrti
N,
De este modo, si se denota por wis a la proporcin de personas
de la poblacin estndar que se encuentra en cada categora , esto
AJujxt de u s o s / 21
es wis a nts /Ns, la tasa ajustada se obtiene, segn la expresin ante
rior, como TA ^ ' tfX wu.
En esta expresin se advierte que una tasa ajustada por el mtodo
directo se obtiene al ponderar las tasas especficas de la poblacin de inte
rs i por factores w que estn dados por la distribucin proporcional de la
poblacin estndar de acuerdo con la variable por la cual se realiza el ajus
te. Por este motivo, para obtener una tasa ajustada por este mtodo bas
ta conocer la distribucin proporcional de la poblacin estndar, por
ejemplo con respecto a cen mil personas, con lo cual se tienen los
valores w.
Para una comparacin de pases de diferentes continentes es conve
niente elegir como estndar a la poblacin del mundo con base en 100.000
propuesta por Segi la cual se presenta en la tabla 7,4 junto con la poblacin
de Amrica Latina proyectada para 1990.
Tabla 7.4 Distribucin de la poblacin mundial y de Amrica Latina proyec
tada para 1990 por grupos etreos con base en 100.000
dad
en aos
Pobbn
mundial
P obkdn d e
Amrica Latina
0 a 4
12.000
12.830
5 * 1 4
19.000 23.124
1 5 a 2 4 17.000
19.964
2 5 a 34
14.000
15.811
35 a 44
12.000 11.014
4 5 a 54
11.000 7.364
55 a 64
8.000 ' 5.174
5 a 74
5 . 0 X 3. 113
75 y ms .
2.000
1.606
Total 100.000
100.000
Fuente:, tobtadn mundial: Segi M. Agead/usted Death Rates for Selected Sites in 51
Countries in 1974. Nagoya, Japan, Segi Institute of Cancer Epidemiology. 1979;
Poblacin de Amria Latina: Celade. Amrica Latina, proyecciones de poblacin
aftos calendarios 1950-2000. Boletn Demogrfico. 1991; (48): 31.
4. Hay que considerar que una tasa ajustada es una medida global, o sea
el resumen de lo que sucede en una cierta poblacin, y puede a su vez
encubrir aspectos importantes relacionados con la variabilidad y la magni
tud de las tasas especficas. Por ejemplo puede ocurrir que aunque existan
diferencias entre las tasas especficas de dos poblaciones para unas ca
tegoras en un sentido y para otras en sentido inverso $e obtuvieran tasas
ajustadas de igual valor porque se anulan las diferencias positivas con las
negativas. En cualquier caso, la correcta aplicacin del mtodo exige una
ciara comprensin de la estrategia subyacente.
Mtodo de ajuste indirecto
El mtodo de ajuste indirecto es una estrategia que logra el mimo propsito
del mtodo directo, el de hecer comparaciones en igualdad de condiciones, en
la cual la comparacin de una poblacin expuesta a un factor de riesgo con
otra como f fitrufar o de referencia se realiza mediante una razn cuyo
numerador es el nmero observado O de casos que se presentan en la pobla
cin expuesta y el es el nmero de casos esperados en tal
poblacin si tuviera las tasas especficas de la estndar. La confrontacin an
teriormente propuesta de la incidencia de cncer de cuello uterino entre las
ciudades de CaH y Sfio Paulo sirve para ilustrar el mtodo.
De acuerdo con los datos presentados el nmero de casos observados
en Cali, la poblacin expuesta, se obtiene al sumar los casos observados
en las distintas edades: .
O 1 0, * tj x n, + t2 x j + ... + x nk
(t x + (t x n)/S24 + ... + ( t x n )
= (0.Q x W>){217.645) + (1 4 x 10^(145.409) + ...
+ (194,3 x 1(^X9.042)
m 169 casos
Si la ciudad de Cali tuviera las tasas especficas por edad de in*
cidencia de cncer de cuello uterino propias de SSo Paulo, la poblacin
estndar, el nmero de casos esperados en ella E se obtiene al aplicar
las laME especficas de Sio Paulo a las poblaciones especficas de Cali,
as:
2 2 /Metodologa d t la tuveagactn.,.
E * X E * tu x + tu x n2 + ...
Ajane * ratas f 1 2 3
- (>. * n)o*j4 + (t, x n)la24 + ... + (is x n ) M}mix
= (0.0 x 10^X217.645) + (1.9 x 1 ^ 1 4 5 .4 0 9 ) + ...
+ (106,9 x 10^X19.042)
= 122,87 casos
La comparacin del nmero de casos observados en Cali O con el
numero de casos que all se presentaran si tuviera las tasas de incidencia
especficas de SSo Paulo por medio de una divisin, da origen a lo que
se conoce como razn estandarizada de morbilidad o de mortalidad REM
o tambin razn normalizada. *
d a . . O 169,00
REM s ------------ M
E 122,87 J,J6
Puesto que dicha razn es, en este caso, mayor que 1,0 se concluye
que en igualdad de condiciones de edad la incidencia observada de cncer
e cuello uterino ea Cali supera a Ja que se presentara en Sao Paulo.
De una manera ms general la razn estandarizada se obtiene segn la
expresin:
t
O 1 i, x n ,
REM a . a 1**
E
Ntese que el valor de la razn estandarizada est alrededor de 1 0
segn el nmero de casos observados sea mayor, igual, o menor que o
esperado.
La realizacin de una prueba de significacin para demostrar la hi
ptesis de que la razn estandarizada difiere de 1,0 - o su equivalente, el
clculo 1de un imen-alo de confianza presenta alguna dificultad por
cuanto la distribucin de las estimaciones mustrales de dicha razn no
es normal.
124 /Mtl*lolog(*e le investigacin-
De una manera exacta, tales pruebas pueden realizarse mediante
la distribucin de Poisson que permite calcular el nmero mnimo y el
mYmv. de casos que con determinada confianza se pueden presentar
dmf r el nmero observado de casos.5 Al dividir tales valores por el n
mero esperado de casos E se encuentran los limites respectivos para la
REM.
p yanfVi el nmero espetado E de casos es relativamente alto, o sea
mayor de treinta, se puede recurrir a la distribucin normal aproximada que
p l a n t a n las estimaciones de la REM, lacual tiene un error estndar esti
mado igual a '[RM/E}. As, los lmites aproximados de un intervalo de
]00(J a)% de confianza se obtienen mediante la expresin:
X Z j^ J s = REM Z ^ t R E W E ]
En el ejemplo propuesto puede utilizarse tal aproximacin porque el
nmero esperado de casos es bastante alto, con lo cual se obtiene un inter
valo del 95% de confianza del modo siguiente:
REM Z ,^ [ R E M /E } = 138 ,96^[1,38/122,80]
= 1. 17; 1,59
Alternativamente, una manera aproximada de obtener los lmites del
95% de o prueba de significacin de una cola con un nivel a
de 0,025 se puede realizar por medio de la figura 7.2 en la cual la in
terseccin de las lneas conepondienies al valor de la estimacin obtenida
para la REM x 100, que corresponde al eje horizontal, y el nmero de
casos observados, eje vertical, permite concluir si la estimacin difiere sig
nificativamente de 1,0. De acuerdo con la figura la razn estandarizada
correspondiente al ejemplo citado, REM = 1,38 con 169 casos observados,
es significativamente superior a 1,0.
5 Baos valeres extremos puedes encornarse en labias eaadfwic; \ * s e por ejemplo: abe-Gei.
Documenta Gtigy: u&es cientficas, 7i. td. Basilo Suiza, 1975. p. 107.
N

m
e
r
o

d
e

c
a
s
o
s

o
b
s
e
r
v
a
d
o
s
-
e
s
c
a
l
a

l
o
g
-
Ajuste de Usas / J 25
0 20 4 0 60 80 100 120 140 160 180 200 220 240 260 280 300
10.000 -] 11 *11 1111 1 n . *i
5.000-
'v* \V*V,S',VV
10.000
L5.000
80 100 120 140 160 180 200 220 240
REM x 100
i i ( i i | i i p | r r i ' j 'i V i y 1
260 280 300
figura 7.2 Estimacin de la razn estandarizada: limites del 95% de confian
za alrededor de 100 con respecto al nmero de casos observados
fuente; Office o f Population Censuses and Sunreys: Occufatonal Monality Series DS
No. 1, Umdon, 1970, p. 15.
Consideraciones finalw
Aunque tradiaonalmente se han distinguido Jos dos mtodos como dife
rentes, ambos utilizan la misma estrategia bsica. La comparacin O/E
segn el mtodo indirecto en el cual se adopto como estndar la poblacin
no expuesta, es idntica a la comparacin Ej/Ei resultante de comparar
los valores esperados que se obtendran segn el mtodo directo en las
dos poblaciones comparadas si se eligiera como estndar a Ja poblacin
expuesta.
N

m
e
r
o

d
e

c
a
s
o
s

o
b
s
e
r
v
a
d
o
s

-
e
s
c
a
l
a

l
o
g
-
1 2 6 /Metodologa de a investigacin...
As, la diferencia existente entre los dos mtodos consiste ms en la
forma de realizar la comparacin de inters: mientras en el mtodo directo
la comparacin se suele plantear como una diferencia, en el indirecto tal
comparacin adopta la forma de una razn. Sin embargo ambos se apoyan
en valores esperados que se obtienen con 1a misma estrategia.
La eleccin de la poblacin estndar, salvo casos extremos, es un
asento relativamente arbitrario puesto que la esencia de) mtodo de ajuste
radica en que permite hacer comparaciones sobre el mismo modelo, inde
pendientemente de cul sea; no obstante es una buena prctica elegir como
poblacin estndar a una combinacin de las poblaciones comparadas. En
cualquier caso es preferible elegir como estndar a una poblacin relacio
nada de alguna manera con las comparadas.
La decisin de realizar un ajuste por uno u otro mtodo se basa,
como primera istancia, en la disponibilidad de la informacin. Por ejemplo
es frecuente que en estudios de epidemiologa ocupacionaJ se conozca el
nmero de casos de cierta enfermedad ocurridos en una poblacin trabaja
dora expuesta a determinado factor de riesgo pero que se ignoren las tasas
especficas por edad; en este caso no se puede obtener la tasa de esta po
blacin ajustada por edad segn el mtodo directo, el cual requiere el co
nocimiento de las tasas especficas de la poblacin. En casos como ste es
bastante comn realizar el ajuste por el mtodo indirecto al tomar como
estndar a la poblacin general o no expuesta cuyas tasas especficas se
suden conocer.
En principio, los mtodos descritos anteriormente pueden ser utiliza
dos para obtener una tasa ajustada simultneamente para mltiples varia
bles lo cual permitira realizar comparaciones en igualdad de condiciones
con respecto a mltiples factores; sin embargo, a medida que se incrementa
el nmero de aquellos por los cuales se desea realizar el ajuste no slo se
incrementa la informacin necesaria, por ejemplo tasas especficas por
edad y sexo, sino que, existe el peligro de utilizar tasas poco confiables
debido a la reduccin que as se opera en los denominadores de ellas. Por
este motivo raramente se recurre a estos mtodos para producir tasas ajus
tadas por ms de dos variables.
Referencias bibliogrficas
1. Breslow NE, Day NE. Stotistical Methods in Cncer Research. Vol. D: The D egn and
AnaJysis o f Cohort Smdies. Lyoo, International Agency for Research on Cncer, 1987.
Ajuste de ta ta s /1 2 7
2. I r n e r o ^ ^ A g e n c y for Research od Caacer. C W Incidence i Five Contwem ,. Lyon
3. Celarle, Amrica Latina, proyecciones de poblacin, altos calendarios 1950-2000. Boletn
Demogrfico. 1991; (4S):31.
4 S t o t a f a l Methods in Epidemiology. New Yori:, Oxford Uivef-
7 rre$$* J9o9.
5. f f i o f Papflkiion Censuses and Snrveyj: Ocupa,mnal Mortality, Series DS No 1, Lon-
pon, i y/ u, ppo-16,
6. Segi M. Agtadjusied Death R a u f o r Selected Sites in 51 Countries in 974. Nagoya.
Japan, Segi Institute o f Cancer Epidemiology, 1979.
lisis estratificado
En t presente captulo se describen los fundamentos del anlisis es
tratificado, proced miento mediante eJ cual es posible obtener medidas
de asociacin librea del efecto que puedeo introducir variable de con
fusin y estudiar Ja interaccin entre diferentes variables cuando ac
tan simultneamente sobre un efecto observado.
1 anlisis estratificado es una estrategia que el epidemilogo utiliza con
frecuencia en el anlisis de la informacin de estudios analticos1 con el
fin de controlar posibles sesgos de confusin introducidos por variables
extraas a la asociacin estudiada o para identificar el efecto que sobre ella
producen dichas variables.
E
130/letodelogla de h mmtgacn~.
En esencia, y con una mirada prctica, el anlisis estratificado
consiste en la clasificacin de la informacin obtenida y referente a la
asociacin estudiada por categoras o estratos de una variable o com
binacin de ellas qne presumiblemente confunde los resultados si no
se controla,2 o que interacta tanto con la exposicin como con el efecto
estudiado al modificar el valen* de )a asociacin de inters a medida que
cambia tal variable.
En principio, tanto si se desea controlar el efecto de una variable
potencial de confusin como si se desea estudiar la interaccin, el objetivo
se logia al fraccionar la asociacin observada en estratos de la variable
que, supuestamente, produce confusin o que interacta; al proceder de
esta mansa el investigador tiene oportunidad de observar la asociacin es
timada en cada uno de los estratos, independientemente del valor que ella
tome en ios dems.
Por ejemplo, si al estudiar la asociacin entre consumo de licor y
cncer de esfago se estratifica la informacin por tabaquismo, con la in
tencin de controlar el efecto de esta variable que supuestamente produce
confusin* se time as la posibilidad de estudiar la asociacin consumo de
licor y cncer de esfago en cada estrato de consumo de tabaco, libre de
la confusin que pueda introducir esta variable y adems observar el com
portamiento de la asociacin estudiada para diferentes valores del consumo
de tabaco, es decir, observar si l interacta con la ingestin de alcohol en
la incidencia de cncer de esfago.
Una vez estratificada la informacin, el anlisis se centra en la ob
tencin de una medida de asociacin nica entre la exposicin y la inci
dencia, de la enfermedad libre de confusin si la variacin del efecto
observada entre los diferentes estratos no es apreciable o alternativamen
te en la descripcin de la interaccin si el efecto vara entre los estratos
ms de lo esperado por simple azar.
Aunque la estrategia genera) del anlisis estratificado es nica y sir
ve tanto para el control de la confusin como para el estudio de la interac
cin, su correcta aplicacin y la adecuada interpretacin de los resultados
presentan diferencias importantes que deben considerarse, tal como se ex
pone a continuacin.
2 Va* lo referente a aogoi de c o n fu ta en el capitulo- 6, Fue otee t e m r eo 1* invefttgacift
epidemiolgica.
Anlisis tsrrutifrcade/131
Control de la confusin
Una variable produce confusin en los resultados si cumple tres requisitos
importantes: 1) si es un factor de riesgo para la enfermedad, 2) si presenta
asociacin con la exposicin y 3) si no acta como un factor causal inter
medio en la secuencia exposicin
As, en el estudio de la asociacin entre ingesta de alcohol y cncer
de esfago el consumo de tabaco debe ser considerado como una potencial
vanable de confusin porque, aunque est asociado tanto con la enferme
dad como con la exposicin, no es un factor causal intermedio entre la
ingesta de alcohol y el cncer de esfago; mientras que cuando se estudia
asociacin entre anticonceptivos orales y enfermedad coronaria la hiper
tensin anenal no es una variable de confusin porque.aunque est aso
ciada canto con la enfermedad como con la exposicin, es consecuencia de
n3 *dr M m aCt0r CaUSal Dtcm,edio CT eI desarrollo de la enfer-
? CTIer0 PrtCtC0 imPmnte *Jue indica la presencia o ausencia de
confusin en una cierta medida de asociacin es la existencia de una dife
rencia entre la medida ajustada y la medida cruda.
. E*ls,f " ,re esCralegias generales para la obtencin de una medida de
asoaacin libre de confusin o ajustada (Rothman, 1986):
1. Mediante la ponderacin de las medidas especficas de asociacin por
factores o pesos con un valor inversamente proporcional a la varianza de
la medida estimada en cada estrato.
2. Por medio del mtodo de mxima verosimilitud el cual obtiene como
w l 7 St! S qUe Se estima con los valores 1 ue maximizan la
funcin de probabilidades correspondiente cuando se evala a partir de la
informacin obtenida.
3. Por medio del mtodo propuesto por Mantel y Haenszel segn el cual
los factores de ponderacin de las medidas de asociacin especficas son
inversamente proporcionales a la varianza del logaritmo de la razn de dis
paridades en ausencia de asociacin, o sea RD = 1. Este mtodo tiene alsu-
nas ventajas importantes como su aplicabilidad en aquellos casos en los cuales
se producen estratos con bajas frecuencias; tambin, el hecho de que el valor
dl a vanabie chi cuadrado, propuesto como prueba de significacin para la
medida de asociacin ajustada, es igual a 0 si tal medida es igual a 1 con-
^ c i a que es deseable entre ambos resultados; por ltimo presenta una
relativa simplicidad cuando se compara con los otros mtodos.
]32/MtodobglatM9effi$acia~'
Por las razones anteriores y porque produce resultados bastante pa
recidos a los que se obtienes con otros mtodos, el de Mantel y Haenszel
es ampliamente utilizado. .
Estrategia general
De aerado con el mtodo propuesto por Mantel y Haenszel en 1959, el
control de la confusin existente en una medida de asociacin causada .por
una variable Z se logra al ponderar las medidas de asociacin A, obtenidas
en los k estratos o categoras de Z, por factores de ponderacin w de
acuerdo con la expresin general:
2 *>,4
a = 4 m '
&*'
en la que los factores wf son inversamente proporcionales a la va*
rianza del logaritmo de la iazn de disparidades en la ausencia de aso*
dacin.3 Al ponderar Las medidas especficas A por tales factores se
obtiene una medida nica de la asociacin existente entre la exposicin
y el efecto estudiado A libre del efecto de confusin producido por Z,
o sea una medida ajustadiL
La medida de asociacin A puede ser una diferencia o una razn de
riesgos, el riesgo atribuible o el riesgo relativo, segn el inters del estudio;
con el fin de analizar la injerencia del azar en la asociacin estudiada, la
medida as obtenida debe acompaarse del intervalo de confianza corres
pondiente y, como complemento, de la prueba de significacin estadstica
que evala la probabilidad de que tal medida haya sido obtenida por simple
azar. A continuacin se expone la aplicacin del mtodo a cada uno de los
diseos ms importantes utilizados por la epidemiologa analtica.
Estudios de casos y controles
Eq un estudio de este tipo la informacin obtenida con respecto a la expo-
sicin y a la enfermedad en el estrato i de la variable que se pretende
controlar se puede denotar como se muestra en la tabla 8. 1.
3 Ntese qoe el mtodo *e reduce a ponderar medidos de aaodadn qot se encuentran libres de
afusin bd cada estrato por feoens * que reflejen U precisin de tales medidas.
Anlisis efnujfim)/]$3
Tabla 8.1 Informacin obtenida en ei estrato i en un estudio de casos v
Expcsdn
Enfermos
Senas
Total
Expuestos
No expuestos
Totat
b,
m1i
c
di
mo
Oi
ni
Para este tipo de estudio, en el cual el riesgo relativo que caracteriza
a la asociacin se suele estimar de manera aproximada por la razn de
disparidades RD, los factores de ponderacin propuestos por Mantel y
Haenszel adoptan en el estrato i la forma w{ = b f i At con lo cual se tiene
segn la expresin fl):
k
w m I fbpt JhJfaA /hfi 2 Atj
RD s
1. w
b f A t , t b f i t o ,
-1
La razn de disparidades as ajustada RD es una medida de asocia
cin que est libre del sesgo de confusin que en la infonnacin global,
presumiblemente, introduca la variable de confusin por la cual se estra-
tinc la informacin.
L* Prueba de significacin estadstica que se realiza para probar la
hiptesis de la existencia de una asociacin se basa en el comportamiento
nmero * observaciones coirespondientes a la casilla a, enfermos ex
puestos, sui olvidar que: 1) el nmero observado en cada estrato es a2)
el atolero esperado en cada estrato con la hiptesis de que no existe aso
ciacin es m,n, l /n . r, frecuencia que refleja la distribucin proporcional del
numero total de casos en el estrato, mu y 3) la variauza del nmero de
casos esperado en tal casilla es n , ^ , ^ / ( ( . . \)n ?].
J ? as0d i4l * ptvalocia, I d id . *
- * prevalereis*
J 3 4 /f4tiadobfiade krrtrgadJi.^
De este modo se obtiene un valor de la variable chi cuadrado de la
ripitomr- manera:
k k A k
/ZOtej - J j B s p f f X Qi X /? t o *
M H*1 M
expresin que toma la forma equivalente:
/j (a/i, - b p j t n f
= 1 - J : ---------------------- -
Z W a P i / " * # * ! - W
La obtencin del riesgo relativo ajustado, aproximado por ibedio de
la razn de disparidades, y el clculo de la prueba de significacin corres
pondiente se muestran en el siguiente ejemplo adaptado de un estudio de
cepoe y controles con relacin a la diabetes como factor de riesgo para la
enfermedad carotdea obstructiva realizado por Cadavid y colaboradores
(1992). Al clasificar los casos y los controles de acuerdo con los antece
dentes de diabetes exposicin de inters se observaron los resultados
consignados en la tabla 8.2.
El valor aproximado del riesgo relativo se calcul por medio del
valor estimado de la razn de disparidades, asi:
Anlisis estratificado / J35
Tabla 8.2 A e s u t a d o s d e un e stud io d e casos y controles sobre fa diabetes
c o m o factor d e riesgo para la enfermedad carotidea obstructiva
Medelllh, 1993
Enfermedad carotidea
S No
SI
81
26
Diabetes
No
419 474
Total 500
500
Total
107
693
1000
Fuente: CaavW G, Londoo JL. Zapata AM. Algunos factores de riesgo para la enferme-
dad caratidea obstrucfcva: estudio de casos y controles en ejecucin. Centro de
investigaciones mdicas de Artloquia, CIMA, Medelln, 1993.
No obstante, dadas l a s asociaciones existentes entre la obesidad y la
enfermedad vascular obstructiva y de l a primera con la diabetes, los inves
tigadores decidieron ajustar el valor de la razn de disparidades por obesi
dad para controlar un posible sesgo de confusin introducido en tal medida
por esta variable. Con este propsito se conformaron dos estratos por obe-
sidad y se obtuvo la informacin que muestra te tabla 8.3.
El valor de la razn de disparidades ajustada por obesidad se
obtuvo as:
_ (37 x 298/631 + (44 x 176)/369
~ (288 x 8y631 + (31 j 8V369 = 3,83
| *
Para la correspondiente prueba de significacin estadstica, con la
a a l se pnieba la hiptesis alternativa RR > 1,0 frente a la hiptesis nula
RR = 1,0 se calcul el valor de la variable chi cuadrado como sigue:
3 6 /Metodologa de ta /mvajfoddih..
Tabla 8.3 Resultados de la estratificacin por obesidad de un estudio de ca
sos y controles de la diabetes como factor de riesgo para la enfer*
medad carotidea obstructiva. Medellin, 1993
Obestad: Mo
B n ftrm idd carotidee
5/
Enfermedad carotide*
Total Tota/
'vDiabetes
+
37 8 45
4
44 16 62
-
288 298 586
-
131 176 307
roza; 325 306 631 175 194 36 9
fuente; Cada vi G, Londoo JU Zapata AM. Algunos factores de riesgo para la enferme
dad carotidea obstructiva! estudio de casos y controles en ejecucin. Centro de
Investigaciones mdicas de Antioquta, GMA, Medeflln, 1993.
t h o A - H W
X B H ____________________
BifltP iP a f a - 1?
1(37 x 298 288 x 8)/631 * (44 x 76 - 31 x 8)/369}*
45x586x325x306/(630)632+62x307x]75x94/(368)3692
= 34,59; P < 0,00]
Entonces se concluy que, eliminado el efecto distorsionante de la
obesidad, se observa una fuerte asociacin entre diabetes y enfermedad ca-
rotfdea con una estimacin puntual aproximada del riesgo relativo de 3,83.
La diferencia que se adviene entre la razn de disparidades cruda
32 y la razn de disparidades ajustada 3,83 muestra ]a confusin intro
ducida por la obesidad en los datos la cual suprime ligeramente la asocia*
dn estimada entre la diabetes y la enfermedad carotfdea. Adicionalmente,
se obtuvo un intervalo de confianza para el valor de la asociacin tal como
se describe ms adelante.
A t t f t r f f m w if i c & o / 3 7
Estudios de seguimiento o de cohortes
n t - S T * POT mCd de h CUal 36 V cl controi ^ variables en los
D ^ t r X T medl ,e 61 mh estradflcad0 similar a la
expuesta ja r a los de casos y controles, con algunas particularidades que
dependen ctel disefto del estudio tal como se indica a contnuactT
1 da SegUmen de tPProporcional. La informacin obte-
>a T ' J " l tpC de 65,4 Ckse * Pued* representar
y / ub con la consideracin que los tales nr
y n a representan t i nmero de sujetos expuestos y no expuestos observa
dos en el estudio (Vase tabla 8.4).
Tabb 8.4 t o s t a d de un estudio de seguimiento de tipo proporcional en
~expasion ' enfermos --------------fat----------------
Expuestos .
No expuestos b- h n'
Ttot 2 d rv
m , r r u , r v
tel v 2 . ? ? iOS factores * Ponderacin propuestos por Man-
, PZ , S * " * h - U - c c a d a
estrato toman la forma:
w, = b , - ! ^
m. _ ; / n ,10 0121 ne, de acuerdo con la expresin [ 1], que una esi-
al ^ medi t o -
g (Jtkj g (bfi,, Mjia, M ^ b . ' /nK) ^ /
m \ as i ^
i-1 W' X /n,
La prueba de significacin estadstica para demostrar la hiptesis
adopta la fama descrita para los estudios de casos y controles.
" de *e8umient0 co* base en el tiempo de exposicin
Cuando en un estudio de seguimiento se observa el nmero de casos que
138/Metadobg de Ja onvfllfdaAb..
ocurre durante un cierto periodo de exposicin, para calcular la tasa los
resultados correspondientes al estrato i pueden resumirse como se muestra
en la tabla 8.5.
Tabla 8 3 Resultados de un estudio de seguimiento con base en el tiempo
de exposicin
xpostn Enfenpos
Tftmpodeexposron
Expuestos
i
M,
No expuestos
M0k
Jetai
M
Mf
De modo a la estrategia descrita para los estudios de segui
miento de tipo proporcional los factores de ponderacin w adoptan la for
ma b Mn M l con lo cual se obtiene una expresin equivalente a la de la
situacin anterior para el clculo de la razn gustada de las tasas o riesgo
relativo ajustado:
R R = --------------------
b, Mif /M,
La prueba de significacin correspondiente a tal medida se apoya en
el valor de la variable chi cuadrado de un grado de libertad, as:
, l a - m P
* --------V f 5 T
prueba que se refiere a la casilla a de la tabla global y que se basa
en los resultados correspondientes a una distribucin binomial [n,pj en la
que n = c + f>y/> = M /M con las siguientes consideraciones:
q: nmero total de enfermos expuestos o nmero observado de xi
tos el cual se obtiene al sumar el nmero de casos a de todos los estratos.
B(a): nmero total esperado de enfermos expuestos bajo la hiptesis
nula o de no asociacin, con un valor que se obtiene al sumar los valores
esperados para los diferentes estratos.
Axtiiis estratificado/?39
e C8trat0 *bj ** hiptesis nula, se esperaran (Mlt M nn en
fermos expuestos al aplicar la distribucin proporcional del tiempo de ex
posicin al total de estos, o sea:
4 . n i
V(a): es la varianza del nmero de enfermos expuestos bajo la hip-
teas nula, valor que se obtiene como la suma de las varianzas de las esti
maciones propias de los diferentes estratos, de la siguiente manera:
M Ma
" M M, '
^ e xpr e s i n que muestra la varianza de una distribucin binomial para
JAforma conocida n(p)(q) en donde n corresponde al nmero total de casos
en cada estrato n,, p corresponde a la probabilidad de xito bajo la hip
tesis nula de acuerdo con la distribucin proporcional del tiempo de segui
miento M,f /M y ? al complemento de p. o sea Mm /M.
De este modo:
v(a)= x nl^ i ^ k = Y - M"-x M<*
11M, U, S i " "
El siguiente ejemplo citado por Rothman (1986) ilustra el proced-
nuento:
Al estudiar la asociacin que la mortalidad observada en pacientes
con neuralgia trigeminal puede tener con la variable sexo se obtuvieron los
siguientes datos (Vase tabla 8.6).
40/Maoohgia t h mvttgacin...
Tabla 8 4 Resultados de un estudio de seguimiento de la asociacin existente
entre el sexo como factor de.riesgo y la neuralgia trigmina! por
edad
Bded: < 6 5
5 o m is
Sexo Muertes AOS
Muertes Aos
exposicin
exposicin
Miscutino 14 1516 76 949
Femenino 10
1701 121 2245
Total 24 3217
197 3194
Fuente: Rothman KJ. Modem S pkh rn oh gy. Boston, Little, Brown and C., 1986, p. 186.
La medida de asociacin cruda RK, calculada con base en las tasas
de mortalidad sin considerar la edad, parece indicar que no existe una aso
ciacin de la mortalidad por esta enfermedad con el sexo:
TH 90/2465
RR = ----- -------------------- 1,10
T* 131/3946
No obstante, ante la sospecha de que la edad puede ejercer un efecto
de confusin en la asociacin observada se obtuvo el valor del riesgo re
lativo ajustado por edad, de la siguiente manera:
k
X a, M ,
RS
b, M /M
Fl
(14)(1701)/3217 + <76)(224S)/3194 M
(]0X1516)/3217 + (121X949V3194 ~ 1
Este valor muestra un importante efecto de confusin supresor de la
asociacin por parte de la edad puesto que el valor del riesgo relativo cru
do 1 JO es bastante menor que el ajustado LSO. La informacin necesaria
Anlisis 4itrm$eao / ] 4 1
para realizar la prueba de significacin con base en el valor de la variable
cbx aladrado se obtuvo de la guente manera:.
* a * 14 + 75 = 90
i-1
2
- V 1516 949
v/| - Y - Mu Ma 24(1516 x 170}) 197(949 x 2245)
- * - - fJ2/7^ + - 7 5 7 w p --------
2 _ a - Efa)}2 (90 69,84J2
X / - ^ - = - 5- = * ;
El alto valor de chi cuadrado obtenido permite concluir, con base en
el valor de P, que los hombres con neuralgia trigeminal experimentan una
mayor mortalidad que las mujeres.
Intervalo de confianza para una medida
de asociacin ^justada
Con el fin de conocer el intervalo en el cual se puede afumar con determinada
confianza que se encuentra el valor de la medida de la asociacin estudiada
se calculan sus lmites de la manera como se expone a continuvin.
El clculo aproximado de un intervalo de 100(1 - a)% de confianza
para el riesgo relativo cuando ste toma valores cercanos a la unidad se
puede hacer mediante la expresin propuesta por Miettinen (1976):
en donde RR representa el riesgo relativo ajustado o su aproxi
macin, la razn de disparidades. ZAw2 el valor de la variable normal es
tndar y x el valor obtenido en la variable chi cuadrado en la prueba de
significacin para la medida ajustada. Esta foima se conoce como la esti
macin de intervalo basada en la prueba de significacin puesto que para
su clculo slo se precisa obtener la informacin del riesgo relativo ajus
tado y el valor que toma la variable chi cuadrado en dicha prueba.
1 4 2 /Metodologa de io Mvesrigocitu.
De este moda, un intervalo aproximado del 95% de confianza para
el riesgo relativo astado como medida de asociacin entre antecedente de
diabetes e incidencia de enfermedad carotdea segn el ejemplo citado se
obtiene de la manera siguiente:
^ (l Z , ^ z 2) = 3 g j *
con lo cual se obtienen los lmites 2,45 y 5,99 que revelan la exis
tencia de una asociacin significativa entre antecedentes de diabetes y en
fermedad carotdea.
Cuando la de asociacin ajustada difiere apreciablemente de la
imHfld ^ utiliza un mtodo general d cual se apoya en la distribucin normal
que presentan las estimaciones mustrales del logaritmo del riesgo relativo o
de la razn de disparidades puesto que los lmites aproximados del inter
valo de 100(1 aj% de confianza se obtienen mediante la expresin:
* 2 ^ VVarX
en donde X representa la variable In RR o In RD.S
La varianza del logaritmo de la razn de inters se puede estimar
de la manera siguiente segn se trate de obtener un intervalo de con
fianza para el riesgo relativo ajustado, como en los estudios de segui
miento con base en proporciones, o para la razn de disparidades
ajustada como en los estudios de casos y controles o de asociacin con
base en medidas de prevalencia.
La varianza del logaritmo del riesgo relativo ajustado se puede esti
mar de modo aproximado mediante el uso de la informacin correspon
diente a los k estratos, tal como sigue:
- M # *
Var[ln RR] = -------------- j--------------
( apa /t) (X bp Mt )
3 l estimacin mustrales del riesfo relativo ao m distribuyen Dorm meate, en cambio be
carimackau muesmles de w tagarinio sL
Ans estratificado f 143
La vaanza del logaritmo de la razn de disparidades ajustada se
puede estimar de manera aproximada por medio de la expresin propuesta
por Robins y colaboradores (1986):
t p &
Varfln RD] ------------- +
2 ( p f 2 ( p , ) f y S f g /
en donde,
f , , A A ; Q = h U L _ ; ^ . * . S
, nt n ' *,
Despus de calcular los lmites A y B del intervalo de confianza para
el logaritmo natural de la medida de asociacin de inters se obtienen [os
respectivos lmites para la medida de asociacin ajustada al exponenciar la
base de los logaritmos naturales con las potencias A y B. As, si se trata
de obtener un intervalo de confianza para la razn de disparidades ajustada,
una vez que se han obtenido los lmites inferior y superior del intervalo
para ln(RD) de acuerdo con las anteriores expresiones se obtienen los l
mites para la razn de disparidades ajustada al calcular:
I ' e r r \* ^m inf N* &&}
lim mf [RD} = -e
\ ' . - , Hm sup (In RDJ
hm sup [RD] s e y '
En el ejemplo propuesto sobre el anlisis de la asociacin entre la
diabetes y la enfermedad carotdea por medio de un estudio de casos y
controles se estim una razn de disparidades ajustada por obesidad igual
a 3,83 y se obtuvo el valor estimado de 0,05788 para )a varianza de in
(RD), As, los lmites de un intervalo de 95% de confianza para el logarit
mo de la razn de disparidades para la diabetes, ajustada por obesidad, se
calcularon como sigue:
. I n R D t x>= in 3,83 1,96 V0,05788
= 0,8713 ; 1,8132
i'jfrTrtnrfnirt (ir frr fmmtfjivfiiii
Luego 6e obtuvieron los lmites de) intervalo de confianza para la
Tazn de disparidades ajustada al exponenciar dichos valores:
0J7J3
I t mi nf / RD) = 2,39
Um sup 1&)] a =
%
El intervalo obtenido mediante este procedimiento debe preferirse
a aquel ligeramente ms estrecho obtenido por el mtodo descrito basa-
do en la prueba de significacin dado el alto valor de la asociacin obser
vada b = 3,83.
Interaccin
Cuando se realiza un estudio analtico con miras a identificar una aso*
dacin existente entre una exposicin X y un efecto Y, se dice que un
tercer factor Z interacta con X si la exposicin simultnea de las per
sonas a X y a Z produce un efecto Y que es mayor que el que corres
pondera a la simple combinacin de los efectos individuales de X y de
Z (Kupper y Hogan, 1978; Rothman y colaboradores, 1980; Koopman,
1981).
La existencia de interaccin entre X*y Z indica entonces que la ex
posicin al factor Z modifica el efecto de la exposicin X sobre y al po
tenciar su accin, sinergismo, o al atenuarla, antagonismo. La modificacin
que ejerce una variable Z sobre una exposicin X puede adoptar dos formas
diferentes: si el efecto de la exposicin a arabos factores es diferente de la
suma de ios efectos que ejercen por separado, se presenta una interaccin
bajo un modelo aditivo; pero si el efecto de la exposicin a ellos es dife
rente del producto de los efectos individuales se presenta una interaccin
bajo un modelo multiplicativo (Walter, 1978; Kleinbaum y colaboradores,
1982).
La diferencia entre estos tipos de interaccin se aprecia bien cuando
se desea estudiar la interaccin que existe entre dos factores de exposicin
X y Z, ambos dicotmicos. En esta situacin, los riesgos de enfermar bajo
las diferentes categoras de exposicin se presentan en la tabla 8.7.
En un modelo aditivo la inexistencia de interaccin se efleja en que
la diferencia entre el riesgo de enfermar bajo ambas exposiciones y el exis-
Antiiuii tfrarj/M/ 145
Tabla 8.7 Riesgos d e enfermar para las diferentes categoras d e exposicin a
* d o s f actores dicotmcos; X y 2
z
0 1
0
Roo
Ro
1
Ato
Rn
tente en ausencia de stas RR . RR^ se obdeae como la suma de las
diferencias en el nesgo para cada una de las exposiciones consideradas
aisladamente y el que se presenta en ausencia de ellas, (RR,0 R R ^ +
(Ro - RRoo). Un ejemplo en el cual se evidencia la inexistencia de
interaccin bajo un modelq. aditivo lo proporciona la situacin en la que
se obtienen los datos que se muestran en la tabla 8.8.
Tabla 8.8 Riesgos d e enfermar para las diferentes categoras d e exposicin
d e d o s variables dicotmcas en una situacin n la qu e no existe
interaccin bajo el modelo aditivo
2

0 10
20
X
1
30
40
En este caso, el valor del riesgo atribuible a la exposicin conjunta de
las dos variables X y 2 , 4 0 - 1 0 , es igual a la suma de los riesgos atribuibles
a las dos exposiciones consideradas individualmente (30 - 10) + (20 - 10)
hecho que refleja la inexistencia de interaccin bajo el modelo aditivo
Una prueba para detectar interaccin bajo el modelo aditivo en la
situacin descrita, en la que las exposiciones de inters s? miden dicotmi-
camente, se puede realizar por medio de un modelo lineal en el cual la
probabilidad de enfermar en presencia de ambos factores se expresa como:
2 4 6 /MSdologia de a investigacin.,
P(Y=1/X,Z) * a + JT + yZ + 5X2
Si do existe interecd n bajo este modelo la probabilidad de enfer
mar como la sumo del trmino iodcpendieiitc ot y de los riesgos
individuales de enfermar bajo ambas exposiciones f> y y, pero si existe
interaccin, la contribucin a la probabilidad de enfermar por parte del
riesgo que supone la exposicin conjunta X-Z es significativamente dife
rente de 0. Asi, la existencia de interaccin bajo el modelo adidvo se de
muestra si en el modelo de regresin lineal indicado el coeficiente 8 difiere
Significativamente de 0.
Bajo nn modelo multiplicativo, en cambio, la interaccin no existe
si el riesgo relativo propio de la exposicin conjunta X-Z es igual al pro
ducto de los riesgos relativos que caracterizan la exposicin individual a
los dos factores; as, la inexistencia de interaccin bajo este modelo se
detecta si RRJf = RR,0 x RR0t. Esta condicin se cumple si las estimaciones
de los riesgos relativos obtenidas en tos diferentes estratos de una tercera
variable Z por medio del anlisis estratificado son similares.*
En la siguiente situacin hipottica en la cual se presentan los ries
gos de enfermar para todas las combinaciones posibles en la exposicin
simultnea a X y a Z, se evidencia la ausencia de interaccin bajo un mo
delo multiplicativo (Vase tabla 8.9).
Tabla Riesgos de enfermar para las diferentes categoras de exposion
de dos variables dicotmicas en una situacin en la que no existe
interaccin bajo el modelo multiplicativo
z
0
1
0 10 20
1 30 60
6 U nUrtcrio bjyp et modelo altipativc se puede evaluir ttftfbfti por medio de un nwWo
tnofclvariBdo f e regresin logstica eo el cuj se pneba si el coeficiente del lnno que expresa
.......... .............j . r t i . . . 1 14*t i i t i l i r i c H u i l t i v a n i r t n .
Anlisis tmitftcad / J47
Ntese que RR, - 6 y que ste, a su vez, es igual al producto de
los dos riesgos relativos considerados independientemente: RR,0 - j y
RR0I = 2. Esta misma relacin se aprecia en la igualdad que presentan los
nesgos relativos que caracterizan Ja exposicin a X en Jos dos estratos del
factor Z, RR = 3.
En el estudio citado sobre antecedentes de diabetes como factor de
nesgo para la enfermedad carotdea obstructiva, al evaluar tal asociacin
de acuerdo con la edad, se encontraron los resultados que se muestran en
la tabla 8. 10.
Tabla 8.10 Resultados d e un estudio d e casos y controles sobre la diabetes
c o m o factor d e riesgo para la enfermedad carotdea obstructiva
por e dad. Medellin, 1993
Edad: < = 64 ~ ^ 4 -------------------------------------------
Enfermedad carotidea Enfermedad carotidea
+ -'
Diabetes
*
30 3
S1 17

?44 325 -
275
149
0 - 7 , 5 2 f l b - 7 , 6 J
Fuente: Cadavid'G Lortfono JL, Zapata AM. Algunos factores de riesgo para la enferme-
dad carotidea obstructiva; estudio de casos y controles en ejecucin Centro de
investigaciones mdicas de Antioquia, QMA, Medellin, 1993.
La notable diferencia que presentan las estimaciones de la asociacin
observada en los dos estratos de la variable edad RD = 7.52; 1.63, sugiere
la existencia de una interaccin entre la diabetes y esta ltima bajo un
modelo multiplicativo, o sea que la edad ejerce un efecto sinrgico sobre
la diabetes como factor de riesgo para la enfermedad carotidea .de tal modo
que el nesgo relativo que presento la existencia de ambos factores de ex
posicin es mayor que el producto de los riesgos relativos de estos consi-
aerados independientemente.
Con elfin de establecer si la variacin observada entre las medidas
de asociacin estimadas en los diferentes estratos de una tercera variable
se debe ahazar. o si por el contrario tal variacin debe atribuirse a una
]48/Metodoi*gfo de te investigacin.-
interaccin, se puede realizar una prueba de significacin estadstica de
homogeneidad cod base en la distribucin de chi cuadrado de un nmero
de grados de libertad igual al nmero de estratos k menos uno, en la cual
se nnmpmw las medidas especficas por estrato con la medida nica ajustada
y que, para el caso en el que se estima la asociacin por medio del riesgo
relativo, toma la fonna siguiente:
4, (ln fo, tn R R f
* *' " h Vr (ln RR
En el r ^ i n citado, acerca de la diabetes como factor de riesgo para
la enfermedad carotidea, se obtuvo primero una medida nica ajustada de
asociacin RD y luego se realiz la prueba estadstica de homogeneidad
para detectar interaccin de la diabetes con la edad, de la manera siguiente:
t o4, fin, (30 x 325V508 + (51 x 14W 92
j f c - -------------- ---------------------------------- - 2 . 5 7
%b p , M, ( 144x9yS08 + ( 275xl 7y492
- t
fin RD; - l n RD?
**'* V\ VtihRDi)
[ln (7,52) - In (2,87)f t (ln ( 1,63) - ln (2,87) f
* (1/30+1/144+1/9+1/325) + (1/51+1/275+1/17+1/149)
= 9,61 ; P < 0,01
Este resultado confirma la existencia de uoa interaccin entre la
diabetes y Ja edad de acuerdo con un modelo multiplicativo, segn la
cual el efecto de la primera en la incidencia de la enfermedad carotdea
entre las personas menores de sesenta y cinco aos es mayor que el
correspondiente a una simple multiplicacin de los riesgos relativos de
ambos factores.
AxUss matifieao / i 4 9
Cuando se detecta la presencia de interaccin no es conveniente uti
lizar una medida nica ajustada para describir la asociacin estudiada, pues
de este modo se oculta la variacin importante que presenta la asociacin
para diferentes valores de la variable que interacta con el factor de riesgo.
Por ejemplo, si algunas de tales estimaciones presentan valores negativos
y otras valores positivos, al ponderar unos y otros para obtener una medida
umca ajustada pueden cancelarse dichos valores entre s con lo cual se
obtendra una medida que equivocadamente reflejara la inexistencia de
asociacin.
As, antes de decidir presentar la asociacin existente entre la expo
sicin estudiada y la enfermedad de inters como el resultado de la ponde
racin de las medidas de asociacin estimadas en diferentes estratos de una
tercera variable que presumiblemente confunde la medida de asociacin, el
investigador debe cerciorarse de que las estimaciones de la asociacin ob
servadas en los diferentes estratos sean relativamente uniformes; con este
propsito puede utilizarse la prueba de homogeneidad de chi cuadrado ius-
tamente descrita.
Cuando se detecta la interaccin existente entre dos factores se hace
necesario precisar el tipo de la interaccin estudiada esto es, si la modi
ficacin del efecto se presenta en trminos de riesgos relativos o de dife
rencias - y hacer constar en el infoime de los hallazgos tamo el sentido
como la magnitud de la misma.
De acuerdo con el sentido de las medidas de asociacin utilizadas en
el anlisis epidemiolgico, la bsqueda de interaccin bajo un modelo adi
tivo o uno multiplicativo debe responder a los intereses de la investigacin-
la deteccin de interacciones bajo el modelo aditivo tiene mayor importan
cia para orientar decisiones de carcter preventivo en el rea de la salud
publica, en tanto que el estudio de interacciones bajo el modelo multipli
cativo reviste mayor importancia en la bsqueda del conocimiento etiol-
gico {BJot y Day, 1979; Rothman y colaboradores, 1980; Saracci, 1980).
Consideraciones nales
La estratificacin de la informacin en categoras de una o mltiples va
nabas es un importante recurso metodolgico para controlar el efecto de
confusin que ellas pueden introducir en la estimacin de la asociacin
existente entre una exposicin y un efecto de inters o para retniHi^r la
interaccin entre varios factores de exposicin. No obstante, el mtodo tie
ne sus propias limitaciones entre las cuales cabe destacar las siguientes:
150/M ea M o g de fa favesfcn..
Cuando el tamao muestral es reducido* las frecuencias correspon
dientes a los diferentes estratos tienden a ser muy bajas, caso en el cual
las estimaciones de la asociacin estudiada son* imprecisas y la aplicacin
del anlisis estratificado presenta limitaciones importantes; por ejemplo
celdas con valores iguales a cero que originan indeterminaciones matem
ticas.
Cuando se quiere controlar simultneamente el efecto de mltiples
variables o cuando se desea estudiar la interaccin simultnea de varios
factores con la exposicin de inters se reduce sustancialmente la informa
cin correspondiente a cada estrato o combinacin de variables, lo cual
hace desaconsejable la utilizacin del mtodo.
Si los estratos han sido conformados por equiparamiento , desde el
momento de la recoleccin de la informacin, usualmente no es posible
controlar por estratificacin el efecto de variables diferentes a aqullas por
los cuales se ha equiparado al tiempo que se mantiene el equiparamiento
inicial porque la estratificacin por las nuevas variables de confusin exige
que se destruya el equiparamiento inicialmente logrado.
Cuando en una sicuadn particular el anlisis estratificado presenta
algunas de las limitaciones descritas se debe pensar en la posibilidad de
hacer uso del modelo multivariado que permite superarlas en buena me
dida.
Referencias bibliogrficas
I Bloc WJ Day NE. Synergi&m and interacton: Are they equival!? American Journal o f
Epidemiofosy. 1979; ( 110): 99-100.
2. Cadavid O. Londofio JL, Zapsu AM. Algunos factores de nesgo para ka enfermedad
earotdea obstructiva: estudio de casos y controles en ejecucin. Centro de inves
tigaciones de AniioquU, CIMA, MedeUin, 1993.
3. Klembaum DG, Kupper LL, Morgenstem H. Epidemiotogic Researth. Belmont, Califor
nia, UfetirneLeflTMngPuWicaiions, 1982.
4. Koopman JS. Imeraction between discrete causes. American Journal <4 Epiemioiogy.
1981; (113): 716-724.
5. Kupper LL> Hogan MD. Inieracton in epidemiologic studies. American Journal 0}
Bpidemiology, 1978; (108): 447-453.
6. Mantel N, Haeoszd W. Staiiracal aspecis o f the anaJys of data from rcroapectve studies
of di ase. Journal ofth e National Cncer Insatut. 1959; (22); 719-74S.
7 Vase e l captado 9. Equiparme oto.
Aiidtiiis tstrmifieado/51
7 . M i e u i n e n OS EstimaWlity and estimat ion i n case-refercnt s t u d i e s . MfWrart . / a * / o /
t y i r f t m o t o j ) ' , 1976; ( 1 0 3 ): 2 2 6 - 2 3 5 .
8 . Robi ns J M, B r e i l o w N , Greenland S . Estimators o f t h e Man t ei- Haens zel variance c o n s i s
tent m b o t h sparse data and l a f * e strata limit in g m o d e l s . B io m e tr ic s . 1986; ( 4 2 ) : 3 1 1 -
JaJ.
9 . R w ^ n a n KJ, Greenland S , Walker A M . C onc ep ts o f interaction. A m e r ic a n J o u r n a l o f
E p t d e m o l o g y . 1980; ( 1 1 2 ) : 4 6 7 - 4 7 0 .
10. Rot hman KJ. M o d e m E p id e m io lo g y , Boston, UtXie, Br own and C o . , 1986.
U . S a r a c a R . Interaction and S in e rg is m. A m e r ic a n J o u r n a l o f E p id e m io lo g y . 1980; ( 1 12);
**03n6o.
12. Walt er S D , Holfbrd TR. A d d i t i v e , multiplicative and other m o d e l s f o r d i s e a s e risks.
A m e r ic a n J o u r n a l o f E p id e m io lo g y . 1978; ( 1 0 8 ): 3 4 1 - 3 4 6 .
Equiparamiento
En este captulo se presenta la estrategia del equiparamiento, con la
cual se intenta producir una infamacin ms eficiente al tiempo que
controlar efectos de confusin: se describe el anlisis estadstico pro-
po de la informacin reunida mediante este mtodo y finalmente se
presentan algunos aspectos importantes que se deben considerar cuan-
do se piensa elegir esta estrategia entre otras alternativas.
U n a de las estrategias que puede utilizar el epidemilogo para contro-
lar el efecto de variables de confusin es la conocida como equipara-
mienio. Aunque aparentemente puede ofrecer una opcin cmoda y
eficiente para controlar el efecto de variables potenciales de confusin,
su empleo debe hacerse con cautela y slo cuando haya sido compren
dida claramente.
J54/Metodologa t la \Bvtsgocifa~,
Estrategia
B T i i parawiiwitft consiste en seleccionar el grupo de comparacin o refe
ren __grupo de controles si es un estudio de casos y controles o grupo
de no expuestos si es uno de seguimiento de tal manera que sea similar
al grupo ndice grupo de casos o de puestos con respecto a una o
ms variables a las cuales se desea controlar (Worcester, 1964; Mietdnen,
1968; MacMahon y Pugh, 1970).
Por ejemplo, supngase que se trata de un estudio de seguimiento
sobre el tBbaquifm de la madre como factor de riesgo para el bajo peso
al nacer y que se selecciona aleatoriamente un grupo de mujeres expuestas
en el cual el 20% es menor de veinte aos, el 50% tiene entre veinte y
ventmueve aos y el 30% tiene treinta aos o ms. Si se quiere controlar
el efecto de la edad porque se piensa que puede confundir los resultados,
debido a que est asociada con el bajo peso al nacer y posiblemente con
el tabaquismo de la madre, se selecciona un nmero de mujeres no expues
tas cuya distribucin por edad sea la misma del grupo de expuestas.
En estas drcustancias se dice que la informacin se encuentra equi
parada por edad de modo tal que si en los resultados se observan diferen
cias en el peso al nacer entre el grupo expuesto y el no expuesto, ellas no
son atribuibles a la edad sino, posiblemente, al tabaquismo de la madre,
hiptesis que el investigador quiere demostrar.
En esencia, el equiparamiento consiste a i conformar, en el momento
de l a seleccin de los sujetos, grupos o estratos por l a variable que con
funde con el fin de asegurar que la distribucin de los sujetos por la va
riable o variables por las cuales se ha equiparado sea igual en los grupos
que se comparan ya sean de casos y controles o de expuestos y no expues
tos (Kleinbaum, 1982). La idea subyacente a esta estrategia es l a misma
del agrupamiento, estrategia utilizada con frecuencia en la investigacin
experimental.
En el caso particular en que cada estrato se conforma con un sujeto
del grupo ndice y uno o ms del grupo referente los cuales presentan
un valor igual o semejante en la variable que confunde se realiza un
equiparamiento individual o pareo, pero cuando ste se logra mediante la
conformacin de estratos de varios sujetos en cada grupo de comparacin
se habla de equiparamiento por frecuencias o por categonas.
A primera vista, el equiparamiento se presenta como un mtodo sim
ple y dicaz para controlar el efecto de variables que confunden puesto que
Equiparatwnto / / 5J
< eve?tu r mte observen entre grupos comparados
k u S T i 8 S BS COfltrolados' P * to s estaran en
igualdad de condiciones con respecto a tales factores.
Si bien es cierto que el equiparamiento se presenta, en principio
m o u n a estratega atrayente para controlar el efecto de confusin - p o ^
razones de validez, investigaciones metodolgicas recientes han permit-
do establ^er con claridad que dicha estrategia debe elegirse ms p Z -
T i qUC ^ VaUdCZ <Ronnan 986) * Por ejemplo, un
investigador adelanta un estudio de casos y controles sobre factores de ries-
go asoctados con el condiloma viral y decide extraer la infonnacin nece
saria de los registros existentes en un servicio de citologas; los casos se
entcs n Agnstico confirmado de condiloma
? i m p 0 es negativo con base en
d l 4 Primera altema,iva- el investigador consi-
t0mar UM muestra alea,oria * controles y controlar
la e d a i en el momento del anlisis, por medio de la estratificacin
s o l i c i t ? de r U may0rta de los raencs mitolgicos son
s o b a d o s por mujeres ................... tomara una muestra aleatoria muy
grande de controles con el fin de obtener un nmero suficiente en los es-
T L l i v ^ f T aVanZada ^ 181 <3 * P ^ a n lograr estimacio-
nes ilativamente precisas que permitan realizar, de una manera adecuada,
un anlisis estratificado. Con esta alternativa de seleccin de los casos y
S c S v ? T mf0rmacin ob,enida en ><* tos ms jvenes sera
excesiva a la vez que los costos implicados en la obtencin de una muestra
tan numerosa pueden ser injustificados.
Una estrategia ms eficiente menos costosa y a la vez nermite
obtener estimaciones ms precisas en los estratos por edad es la de equi
parar por esta variable en el momento de seleccionar los controles; de esia
S E . " ST ' 12l la 0btC Cn de Una infomaci6" eficiente al p<>
rcall2^ ,n * un anlisi8 ^ i f i c a d o con los mismos e s t r a S
t c S S k i S - M m0me!'t0hdel ^ ipammiento, el cual habra sido prc-
c S f f M i 6' 6 recunid0 a una sel* aleatoria de los
controles y hecho la estratificacin nicamente en el momento del anlisis.
J 56/Mctodobi(aelin*ft*$oci*-.
En la situacin anterior, la eleccin del equiparamiento como estra
tegia por parte del investigador est motivada ms por razones de efiaen-
da qne por razones de validez. Dicho de otra forma, el investigador puede
haba controlado e l e f e c t o de la edad con una seleccin aleatoria delos
controles y la estratificacin posterior de la informacin en el anlisis, pero
para poder hacer esto habra tenido que tomar una muestra aleatoria exce
sivamente grande y, por tanto, costo&a e ineficiente.
Se debe tener presente que el factor que se quiere controlar era
el equiparamiento produce realmente un efecto de confusin, est asociado
con la exposicin que se estudia y que al exigir con esta estrategia que la
distribucin de los controles sea similar a la de los casos con respecto a
aqul, la exposicin de los primeros se hace forzadamente sraular a la de
los segundos con lo cual se puede introducir un sesgo en la me^da de
asociacin que se busca. Este errorque estara presente en la medida de
asociacin resultante de una tabla de 2 x 2 en la que simplemente se ca-
sifican los participantes de acuerdo con la enfermedad y con la exposi
cin se debe remover mediante un anlisis estratificado en el cual los
estratos estn definidos por el equiparamienio inicial-, dicho de otra forma,
en los estudios de casos y controles el equiparamiento introduce un sesgo,
el cual se debe .eliminar por medio del anlisis estratificado.
De igual manera sucede si se equipara por un factor que est aso
ciado con la exposicin pero no con la enfermedad: en este caso se
introduce un sesgo innecesario por cuanto la variable por la cua se
equipara no es de confusin; para su control se debe realizar un anlisis
estratificado con los mismos estratos definidos en el momento del equi-
' T t s estudios de seguimiento el equiparamiento produce me a
das globales libres de confusin - e n la tabla de 2 x 2 que resulta de
clasificar a los expuestos y a los no expuestos de acuerdo con la enfer
medad porque el efecto que se busca, o sea una diferencia en la inci
dencia de la enfermedad entre expuestos y no expuestos, se produce a
posteriori en igualdad de condiciones con respecto a la variable que se
desea controlar. .
En los estudios de casos y controles, a diferencia de los de segui
miento, tanto la enfermedad como la exposicin estn presentes en el mo-
ment en que se hace el equiparamiento, razn por la cual se introduce un
sesgo al equiparar por una variable que produce confusin. El control se
logra ai ponderar por medio de la estratificacin las medidas propias de los
distintos estratos de la manera como se describe en el captulo dedicado al
anlisis estratificado.
El sesgo que as se introduce en los estudios de casos y controles, si
no se controla mediante la estratificacin en el momento del anlisis, tiende
a disminuir la diferencia del efecto bascado entre los grupos comparados,
o sea tiende a producir estimaciones menores de la asnriar^n que x es_
tudia. A este respecto es bastante ilustrativa la situacin en la cual el factor
que se pretende controlar por el equiparamiento est perfectamente corre
lacionado con la exposicin estudiada: puesto que, debido a esta estrategia
los casos y los controles se hacen similares con respecto al factor que se
pretende controlar, la diferencia con respecto a la exposicin entre estos se
hace nula lo cual encubre la asociacin realmente existente entre la expo
sicin y la enfermedad.
Sobre equipara miento
El equiparamiento por un factor asociado con la exposicin pero no con
la enfermedad, adems de introducir un sesgo en los estudios de casos
y controles, tiende a producir estratos en los que tanto el caso como el
control presentan la misma exposicin y, por tanto, no aportan informa
cin para el anlisis. En estos casos el equiparamiento es ms ineficiente
que un muestreo aleatorio porque produce una informacin que se des-
?07n.C1r f ,tUaCl6n que se conocc crao sobreequiparamiento (Miettinen,
- ' ' 0 , Col, 1980),
Una situacin que ilustra este caso se presenta en un estudio del
tabaquismo de la madre como factor de riesgo para el bajo peso al nacer
si el investigador equipara por consumo de caf: si ei anlisis de la asocia
cin se hace sobre la tabla nica de 2 x 2 resultante de cruzar el consumo
de tabaco con el bajo peso al nacer, la medida de asociacin obtenida ten
da un sesgo que se debe remover por medio de un anlisis estratificado,
ada la asociacin que de hecho existe entre consumo de tabaco y de caf
y debido al equiparamiento por esta ltima variable, la exposicin resulte
ser igual en muchos de los estratos con lo cual se desperdicia buena parte
de la informacin obtenida para el anlisis; tambin se presenta en este
caso un sobreequiparamiento.
Si el factor por ei cual se equipara la informacin no est asociado
con la exposicin que se estudia, ste no produce confusin y* por tanto
es mul equiparar por l; sin embargo si se equipara por dicho feccor esta
estrategia frente a la seleccin aleatoria es ms ineficiente puesto que au
15 8 /M eto d o b f^d ela a vejgat^.
menta los costos de la recoleccin de la informacin sin producir ninguna
ganancia adicional. Tambin en etto* casos se presenta un sobreequipara-
miento.
Igualmente en un equiparamiento individual y en la situacin en la
que el factor por l nv^ se equipara produce confusin pero est dbilmen
te con la exposicin, algunos de los estratos conformados presen
tan una concordancia en la exposicin entre el caso y su control lo cual
hace que parte de la informacin no aporte nada al anlisis. Esta ineficicD-
cia frente a la posibilidad de estratificar en el anlisis sin equiparamiento
previo se considera tambin como sobreeqirparamietito.
Equiparamiento individual
El equiparamiento individual o pareo consiste en conformar, en el momen
to de la obtencin de los atn*, estratos costtuidos por un sujeto del grupo
ndice y uno o ms del grupo de referencia con valores iguales o semejan
tes en la variable por la cual se equipara, de tal manera que se formen
estratos'con un valor con respecto al factor de confusin igual o semejante.
Aunque, como se puede advertir, este mtodo no es ms que una forma
particular de equiparamiento por frecuencias en la cual cada categora est
conformada por un sujeto del grupo ndice y uno o ms del grupo de re
ferencia, merece particular atencin por cuanto l anlisis estadstico de la
informacin resultante adopta una forma especial de fcil manejo numrico
que conserva el equiparamiento impuesto desde el momento de la selec*
cin de los sujetos, con lo cual se controlan los posibles sesgos intro
ducidos por l.
Por ejemplo, supngase que un investigador realiza un estudio de
casos y controles y obtiene informacin con respecto a la existencia de un
factor de riesgo dicotmico en N parejas seleccionadas de tal modo que
cada una presenta un valor igual o parecido en la variable que pretende
controlar o sea se ha recurrido a) equiparamiento individual 1 a 1. Al dis
poner tal informacin para un anlisis estratificado cada pareja sera un
estrato en el que se puede presentar uno de cuatro posibles resultados: tan*
to el caso como el control han estado expuestos, ninguno de los dos ha
estado expuesto, el caso ha estado expuesto pero su respectivo control no
y el caso no ha estado expuesto pero su control s. La informacin obtenida
se resume en la tabla 9.1.
fy p e n m k tu o /1 5 9
Tabla 9.1 Resultados de un estudio de
individua!
casos y controles con equiparamento
Contrd
*
Caso
Segn tales resultados, en s parejas la exposicin se identific tanto
Slntif T 7 en SU respectivo CODtrol- ' parejas la exposicin se
el caso peio no en su control, en Hparejas la exposicin se
^enufic en el control pero no en el caso y en y parejas la exposicin no
se identific ni en el caso m en el control correspondiente.
En esta situacin, la mejor estimacin de la razn de disparidades
RD se obtiene al dividir t/u; las casillas r y v no aportan informacin para
la estimacin de la medida de asociacin poique tanto el caso como su
control presentan iguales condiciones con respecto al factor de riesgo,2 La
med.da deasociacin obtenida est Ubre del sesgo que, en principio, pudo
haba- introducido el equiparanuento puesto que en el anlisis se ha man
tenido la estratificacin impuesta por esta estrategia en estratos constituidos
por parejas el caso y su respectivo control.3
Un intervalo aproximado de 100(1 - a)% de confianza para la razn
7 dlsPandacles se obtiene a partir de dicha estimacin puntual al aplicar
la siguiente expresin, tal como se muestra en el captulo 8.
J60/MtOibbgia e h invttigad.,.
Una prueba de significacin estadstica exacta para esta situacin se
basa n i la distribucin bmomial con n = t + u realizaciones, con la hip
tesis nula de que la probabilidad de xito p es 0,50 y con un nmero ob
servado de xitos igual a . As, el valor de P correspondiente a la prueba
se obtiene al consultar la tabla de la distribucin binomial con los valores
B + n y j s OJO.
De una manera aproximada se utiliza tambin la distribucin normal
estndar al calcular el valor de la variable Z como;
c
en donde X correspondera al nmero t de xitos observados; | bajo
la hiptesis nula correspondera a (1/2X* + u) y c , i y[(t + u)(l/2)(lf2f\
expresin que corresponde al error estndar de los resultados de una situa
cin binomial y que se suele presentar como 'i(npq).
As:
X - l i t (l/2Xt + u) t u
2 'itt + uXl/2Xl/2)J " Vf + )
y puesto q u e # = X2, tiene que
resultado que se refiere a la distribucin de chi cuadrado de un grado
de libertad y se conoce como pruebo de McNemar (Rothroan, 1979; Fleiss,
1981).
Por ejemplo, supngase que se decide realizar un estudio de casos y
controles con el fin de analizar la posible asociacin entre tabaquismo de
la madre y bajo peso al nacer; por razones de eficiencia se decide utilizar
el equiparamiento individual por edad. El estudio se realiza con 50 madres
de nios con bajo peso al nacer y como controles se seleccionan madres
de nios con peso normal al nacer cuyas edades son similares a la de los
casos, como mximo un ao mayor o uno menor, y se obtienen los resul-
tados expuestos en la tabla 9.2.
Equiparammo/161
Tabla 9.2
Resultados^ d e un estudio* de c a s o s y controles pareado por edad
para estudiar Ja a s o d a d n existente entre tabaquismo d e Ja madre
y bajo p e s o al nacer
Control
Caso
+
8 26
-
11 S
De acuerdo con lo expuesto anteriormente, una estimacin de Ja aso
ciacin existente entre el tabaquismo de la madre y el bajo peso a] nacer,
Ubre de la confusin que puede causar la edad, se obtiene al calcular la
razn de disparidades:
Una prueba de significacin aproximada con base en la distribucin
de chi cuadrado se obtiene de la siguiente manera:
v 2 ( t - u f ( 2 6 - l f
x> = 7 n = ^ 6 7 i r = 6 M ; p < 0 -01
Ls lmites de un intervalo de 95% de confianza aproximado se cal
culan al utilizar la expresin antes citada:
i * _ 2 ( I L 9 6 t i 6 . 0 8 )
- 1,19; 4,67
En vez de seleccionar un solo sujeto de comparacin en cada estrato
es posible elegir R sujetos de comparacin R = 2, 3, ... y as, en vez de
equiparanuento 1 a l f se realiza un equiparamiento 1 a para R > 1
(KJembaum, 1982; Colimn, 1990).
62/bittodoPg^ d t ie mvaHgael*-.
Aunque el w< de los resultados obtenidos con tal modalidad es
ms complejo y no se expoce eo d peseme texto (Vase por ejemplo,
Miettmen (1969), Fletas (1981), Kahn y Sempos (1989)) es importante in
dicar que tos principios generales que se han expuesto hasta el momento
son igualmente aplicables a dicha situacin.
Consideraciones finales
Cuando se estudia el equiparamiento como una opcin metodolgica se
debe considerar lo siguiente:
1 En algunas situaciones es aconsejable recurrir al equiparamiento p m
lograr una informacin ms eficiente, tal como ocurre cuando la obtencin
de la informacin relativa a cada control es mny costosa porque requiere
de laboratorio para detectar la exposicin previa a un virus, por
ejemplo. La estrategia, en este caso, evita que tales exmenes se practi
quen a todos los controles seleccionados en forma aleatoria, con el nes
go de que buena parte de la informacin resultante aporte muy poco o
nada al anlisis. . . . ,
2 En aquellos casos en los cuales la variable de confusin que se desea
controlar es nominal con numerosas categoras, por ejemplo lugar deresi-
denda u ocupacin entre otras, la alternativa de estratificar en el anlisis
sin previo equiparamiento puede originar mltiples estratos con escasa in
formacin; para evitar que esto ocurra el investigador puede recumr al
equiparamiento. En el caso de variables continuas, por ejemplo edad o in
greso, el investigador puede conformar estratos con categoras ms o me
nos amplias y equiparar en el momento de la seleccin de los sujetos.
3 Un aspecto que debe considerarse es que cuando se ha utilizado el equi-
paramiemo en el momento de la obtencin de los daros no es posib e es
tudiar el efecto que sobre la enfermedad puede tener el factor por el cual
se ha equiparado porque los dos grupos comparados se encuentran en
igualdad de condiciones con respecto a aqul.
4 Una vez que se tienen los datos equiparados por un cierto factor, usual
mente no es factible controlar simultneamente el efecto de otras variables
por medio del anlisis estratificado porque la estratificacin por stas tien
de a destruir el equiparamiento logrado inicialmente por la primera vana
ble. En estos casos el anlisis multivariado se presenta como la estrategia
Aunque! tal como se ha indicado, el equiparamiento presenta ventajas
cuando se trata de lograr maya eficiencia en la informacin que se ha
Eqwpartvnieruo / 6 3
obtener, su eleccin como estrategia para controlar el efecto de una varia
ble que confunde debe ponderarse detenidamente frente a otras alternativas
que pueden ser ms ventajosas.
El investigador no debe olvidar que el equipamiento exige esfuer
zos que pueden ser costosos en trminos de tiempo y dinero; esfuerzos que
a la postre, pueden hacer de ste una estrategia an ms ineficiente que
otras alternativas. En muchas circustancias en las que se piensa en e! equi-
paranuento como primera opcin es mejor tomar mayor ndmero de obser
vaciones en forma aleatoria y recurrir a la estratificacin en el anlisis.
Referencias bibliogrficas
1. Cok*P. En: Br esl ow NE. D. y NE. S ta tix ic a l U e.hods n Cncer M V ol I: The
I98f nITOl Sn,d>- " niMloiMl Ageocy for Research n Cncer. Lyon,
2. C n l i r a i a KM. F u n d a m e n u d e E p id e m io lo g a . Madrid, D a z d e S a n t o s . 1990
1 M t , h 0 d S f r R m t S r o p o r tio n ,. 2 a e d . N e * York. John W ile y
4 ' KahNe w Y 0S mi T 8 9 CT' StariSICa! Epdemo,0V - Universily Pr e a,
5' KUPP^ . ' ' More csIen R BpU hm U ogtX am H d,. Belrm.nL Califcm.a,
Ufenme Leanung Publicaions, J982.
6 . MacMahon B . P u g h T. Epidemiology. B o s t o n . Licile, Brown. and Co.. 197(1.
M* S S S : M 9 . 3 M hed ,Wr ** " " * * f all-OT-one W * . Bumri,s.
9- M1 S n *
10' * Epidem * ic W h P ro tn m m a b U Calcutoor.
H e ^ h m ? m - DepQI? e m o f H e a l t h Edueation and W e l fe re . NaiU.njl I n s t i t u i d o f
Hewth. NIH Publicaron 79-J 6 4 9 . 1979.
H ' W^ 'W - MaKhed sa m pl es e p i d e m i o l o g i c srudles. B io m e m a . 1964: ( 2 0 ) : 840-
\
lisis multivariado
10
El presente captulo describe las posibilidades de aplicacin del mto
do multivariado en las investigaciones del rea de la salud en general
y en la investigacin epidemiolgica en particular; ilustra la utilizacin
de loa principales mtodos multivariados con algunos ejemplos y hace
nfasis en la costruccin de un modelo predictivo por medio de la
regresin logstica mutvariada.
U n la medida en que se avanza en la bsqueda del conocimiento sobre
los factores que afectan la salud de los individuos y de los pueblos se hace
necesario plantear relaciones multifactcriales en las cuales la enfermedad,
como variable dependiente, se explique o se predice por mltiples factores
o variables independientes.
Los fundamentos tericos del anlisis multivariado se desarrollaron
de manera particular durante los tres primeros decenios del presente siglo
6 6 /ifioelotie de b iimstigdn*.
bajo el influjo decisivo de los aportes hechos a la estadstica por Ronald
Hsher y Kari Pcarson. En un principio, los modelos tnultivariados se apli
caron predominantemente a trabajos experimentales propios de la invest-
gan agrcola, slo en la segunda gea mundial se inicia su aplicacin
a estudios epidemiolgicos analticos.
Como trabajos pioneros en la epidemiologa cabe citar aquellos
realizados por Comfield en 1962 sobre factores de riesgo para la enferme
dad coronaria (Comfield, 1962), por Truett y colaboradores en 1967 sobre
la enfermedad coronaria en la cohorte de Framngham (Truett y colabwa-
dores, 1967) y por inrinhaum y colaboradores en 1971 acerca de mltiples
factores de riesgo p a n la misma enfermedad en el estudio de Evans
Coumy (Kleinbaum y colaboradores, 1971).
La mayora de los estudios multivariados realizados basta principios
del decenio de los wMw utilizaron la estrategia conocida como anlisis
discriminante, hasta h' PP**0 Cox llama la atencin sotare las ventajas de la
funcin logstica sotar este ltimo (Cox, 1970) y se sllala su utilidad en
muchas situaciones propias de la investigacin epidemiolgica analtica
(Halperin y colaboradores, 1971; Press y Wilson, 1978). Ya en 1975 la
publicacin de trabajos de investigacin a base en el modelo logfstico
multivariado es un hecho relativamente frecuente y en la actualidad la uti
lizacin de este modelo en trabajos sobre las relaciones de mltiples fac
tores de riesgo con la incidencia de una determinada enfermedad es una
estrategia casi rutinaria.
El desarrollo de la tecnologa de los computadores que se ha dado
en forma paralela al metodolgico ha hecho posible la aplicacin de plan
teamientos tericos a problemas de naturaleza multivariada, lo cual es un
impulso tanto para la innovacin terica como para la investigacin apli
cada. A este respecto es importante mencionar, entre otros, algunos progra
mas de computador que han hecho un significativo aporte en este sentido:
SAS. Statistical Analysis System (SAS Institute Inc.); SPSS, Statistical
Package for the Social Sciences (SPSS Inc.) y BMDP, Biomedical Pro-
grams (University of California). Los progamas Epi Info (Dean y colabo
radores, 1994) y Trae Epistat (Epistat Services) ofrecen algunas
posibilidades para el anlisis multivariado; el programa EGRET, Epidemio
lgica! Graphics Estimation Testing (Statistics and Epidemiology Research
Corporation) permite realizar anlisis multivariados de comn aplicacin
en epidemiologa y el STATXACT (Cytel Software Corporation) permite
realizar pruebas no paiamtricas exactas.
Anlisis muiiivorimfo / 1 6 7
Los mtodos estadsticos mediante los cuales se pueden estudiar los
fenmenos desde una perspectiva multivariada son muchos; cabe destacar
aquellos que ofrecen posibilidades ms interesantes para la investigacin
epidemiolgica como el anlisis de regresin mltiple, el anlisis de la va-
nanza,el anlisis discriminante y el anlisis de regresin logstica multiva-
nada. Si bien cada uno de tales procedimientos tiene usos y caractersticas
que le son propios, la esencia comn se encuentra en la regresin mltiple
y en el anlisis de la varianza.
Aunque un tratamiento detallado de estos temas no es el propsito
de esta obra, la referencia de algunas publicaciones orienta al lector hacia
ftientes mis especializadas tales como las de Dixon y Massey (1963), Sne-
001 y 5 2 ^ ? (1967) Armi,aSe <1971). Keriinger (1973), Kleinbaum y
Kupper(1978), Breslow y Day (1980), Drapery Smith (1981), Kleinbaum
y ^colaboradores (1982), Schlesselman (1982), Daniel (1983) y Kahn y
Anlisis de regresin mltiple
5 n esta estrategia se evala el poder predictivo de un conjunto de varia
bles usualmente continuas X,. X2. .... Xp sobre una variable dependiente
continua Y de acuerdo con un modelo lineal de la forma:
r = a + + ... + + t
en donde a representa el efecto n explicado por las variables in
cluidas en el modelo o sea el trmino independiente; fi, representa a los
coeficientes de regresin o pendiente de las variables independientes inclui
das en el modelo y e, el enor aleatorio.
La estrategia central de este mtodo consiste en descomponer la va
riacin observada en la variable dependiente Y en:
1. La variacin explicada por cada uno de los factores considerados como
vanables independientes X, XZ .... Xp o variacin debida a la regresin.
2. La variacin residual no explicada por tales factores o debida al error
(Vease figura 10.1).
La descomposicin de la variabilidad observada en la variable de
pendiente y en los dos componentes mencionados se apoya en la ecuacin
fundamental del anlisis de regresin, segn la cual la variacin total de
tas n observaciones Y alrededor del promedio total Y es igual a lu variacin
de los valores estimados por la lnea de regresin Y con respecto al mismo
168/Metcdofagia de h BMstigocie-.
Figura 1 0 . 1 Descomposicin d e la variacin d e los d a t o s alrededor d e Id me
dia e n 1) la variacin explicada por la regresin y 2 ) la variacin
residual
promedio, o variacin explicada, ms la variacin de los valores observa
dos con respecto a la lnea de regresin, o variacin residual.
Dicha ecuacin se expresa en trminos de jumtt de cuadrados de la
forma:
- i m - Y ? +i ( Y , - Y f
f - l M p '
la cual expresa el hecho fundamenta) de que la suma de cuadrados
total SST es igual a la suma de cuadrados debida a la regresin SSB ms la
suma de cuadrados residual o debida al error SS.
S S j 8 SS/ t + iSSg
La razn resultante entre las medias de cuadrados* de las dos fuen
tes de variabilidad total media de cuadrados debida a la regresin AfS*
) Una media de cuadrado se totiaoe a) dividir la suma de esa are el nmero de grados de
Ubefttfl corresponfiema. El nmero da sradoc de libertad da la urna de adrados debida a la
-mpetin est dado por el nmero de variables independien* X bduidaa e el modeku el
nfrnoo de grados ecnespondente a Ib soma de tuadndm total igual al nmero de
dservacioftet meooa 1, uemra <joe d ntimeco de grados corrpoodemt a la tuina de
Nffftrifyinr residual se enesettca por dHerenda entre k do emerioct*.
Anfisis Butliivanado /171
En este tipo de anlisis se compare la variacin observada en una variable
dependiente continua dentro de cada categora de las variables inde
pendientes que suelen ser nominales o discretas con la variacin de la
misma variable dependiente entre las distintas categoras de las inde
pendientes. Esta comparacin, en trminos de medias de cuadrados, da co
mo resultado un valor de la variable probabstica F de Snedecor que
referido a la distribucin que lleva dicho nombre permite probar lu hipte
sis nula de la igualdad del efecto estudiado bajo las distintas categoras o
grupos por medio de una prueba de significacin estadstica.
En el estudio ya citado con respecto al tabaquismo en escolares se
encontr que tanto el nivel socioeconmico de los estudiantes como el sexo
de los mismos se encontraban asociados con el grado de impulsividad, tal
como se puede apreciar en los siguientes resultados (Vanse tablas 10 3 v
10.4).
Anlisis de varianza
Tabla 10.3 Resultados descriptivos d e la impulsividad de los escolares por nivel
s o c ioe c on m ic o NSE y s exo, Medellin, 1992
va na o/e
Categora
Promedio Desviacin estndar
(V
NSE
8ajo 4.1080 2,5407
213
Sexo
Masculino 4,3246 2,4*71
114
Sexo
Femenino 3,8566 2,5912
99
NSE
Medio 3,9021
2,1550
235
Sexo
Masculino 4,1405
2,3569
121
Sexo
Femenino 3,6491 1,8954
} 14
NSE
Alto
4,5066 2,3216
152
Sexo
Masculino 4,6800
2,2966 75
5exo
Femenino 4,337?
2,3486 77
Total

4,1283 2,3483
600
fuente: Lordoo Jl. Factores relacionados c or el consumo de cigarrillos en escotares
adolescentes de ka dudad de Medelln. Boletn d e la Ofidna Sanitaria Paname
ricana. 1992; ( 112): 131-137.
72/Mcwdologio e ta in a d |M A u
Tabla 1 0 4 Resultados d e un anlisis d e la varianza ANOVA para el e stud io de
la relacin d e la impulsividad c on el nivel s o c ioe c on m ic o NSE y
c on e l sexo
fuente
de variadn
Suma de
cuadra (fos
Grados de
libertad
M ad de
cuadrados
f P
Efectos principales 63,440 3 21,147 3,078 0,009
NSS 35,053 2 17,527 5,214
0,041
Sexo 29,580 1 29,580 5,424 0,020
Interaccin NSi-Sexo 0,550 2 0,275 0,050 0,951
Explicada 63.990 5 12,798 2,347 0,040
Residual 3239,129 594 5,453
Total 3303,118 599 5,514
fuente; Lcrdoo JL Factores retactonados con el consumo de dgarrittos en escolares
adolescentes de la dudad de MedeHin. Boletn d e la Ofidna Sanitaria Paname
ricana. 1d92; (112): 131-137.
Como se puede observar en tales resultados, este mismo anlisis
permiti descartar la interaccin entre el nivel socioeconmico y el sexo
con relacin a la impulsividad de los adolescentes F = 0,050, P =
0,951.
De modo similar, el estudio de las relaciones existentes entre la va*
rable dependiente continua consumo de alcohol y las variables inde
pendientes categricas nivel socioeconmico y sexo puede realizarse
tambin con la ayuda del anlisis de varianza, el cual permite identificar
no slo si el consumo de alcohol depende del sexo y de) nivel socio-
econmico sino si existe alguna interaccin entre estas dos variables.
Un anlisis de varianza puede ser utilizado para evaluar la hiptesis
estudiada por Patrick y colaboradores en la isla de Ponape (Patrick y co
laboradores, 1974) segn la cual la discrepancia entre el grado de partici
pacin de sus habitantes en la vida moderna, su actitud hacia la misma X
y su preparacin para este tipo de vida X2 estaban relacionadas con los
valores de presin arterial observados en dicha poblacin Y.
Anlisis discriminante
En esencia, el mtodo conocido como anlisis discriminante evala la ca
pacidad que tiene un conjunto de variables independientes para predecir un
resultado, l cual es siempre una variable dependiente de tipo nominal. La
Anlisis muhiva&uto l 73
mejor prediccin se logra al estimar los coeficientes de regresin de una
fundn lineal de la siguiente forma:
Y = a + + ... +
. 0 finron discriminante que maximiza las diferencias observadas en
toninos de las variables Xh X% Xp incluidas en el modelo. La utiliza-
cin del mtodo exige que la distribucin de las variables independientes
incluidas sea normal muhivariada, condicin que no se satisface en aque
les problemas que incluyen variables independientes de tipo nominal co
munes en la investigacin epidemiolgica.
, Pfe?s y ^ilson (1978) proponen una aplicacin interesante del an
lisis discriminante en una situacin en la cual se trata de predecir el cam
bio poblacional, alto o bajo, de diversas regiones de Estados Unidos con
base en el ingreso per cpita X la tasa de mortalidad X2, la tasa de na
talidad Xj, el grado de urbanizacin X4 y la localizacin con respecto al
mar X, propios de tales regiones. A partir de la informacin as reunida
se obtuvo la funcin discriminante*
Y = -11.84 + 2,11 X, - 2.55 X2 + 3,22 Xs - 0,36 X4 + ,16 X,
Cuando se aplic dicho modelo a una muestra de diez regiones con
el propsito de validarlo se logr predecir correctamente el cambio pobla-
cional observado en aos anteriores en el 68% de los casos. Sin embargo
es importante anotar que, debido principalmente a la distribucin no or-
mal de las variables continuas y a la inclusin de dos variables nominales
dicotmicas como son el grado de urbanizacin y ia situacin con respecto
al mar, la aplicacin de un modelo lineal logstico logr predecir un resul
tado correcto en la muestra de validacin en un 12% de los casos, lo cual
indica una moderada superioridad para esta situacin del anlisis de regre
sin logstica sobre el anlisis discriminante.
Anlisis multivariado de regresin lineal con base
en la funcin logstica
En esta estrategia la probabilidad de que se presente la enfermedad Y = 01
bajo un conjunto X de factores X, X z .... XP se define como:
P ( - I * p X .... X = ------- 1 -----
] + e i * | k x i >
17 4 /igtcdotcgfa t h Je MMUfeacta...
expresin que, en forma equivalente, se puede escribir como:
P(Y=1/X) --------------- ------ p 1J
] +exp [- ( a+ J. $&)]
Dicba frmula expresa la probabilidad de enfermar bajo un con
junto de mltiples factores en trminos de la que se conoce como fun
dn logstica. .
Definida as la probabilidad de enfermar P(Y*1/X), o simplemente
pfX), al tomar logaritmos naturales de la medida conocida como disparidad
en ingls: o d d se obtiene la relacin que se conoce con d nombre
de logit:
ln j ^ o b g d e P f X )
Cuando se estudia una exposicin mltiple, la expresin anterior es
equivalente a:
P(Y=I/X X .... X
loga Pf X) = ln p(Y=0/x Xp)
medida que expresa el logaritmo natural de la relacin existente en
tre la probabilidad de enfermar bajo factores X,, Xr .... Xf y la probabilidad
de no enfermar con los mismos.
Dicba medida al ser expresada en trminos de la probabilidad de
enfermar segn la expresin [1] adopta la forma:
p
logit P(X) = a + P; X, 12}
3 La medid muestra Ladparidad a t i c o e i resultado de bm variable dicoidiwc*, t t l como
la enfermedad a n d o *U *e mide como presente o Bsenle, la r u f e entre la p r e p a r o flt
obeiwwoe postvas, o sea preporciee de x l l o p y t a p r o j w c i d o d e c t a e s v a c o n e e o e g v .
pro porcin de fracasos q = I p.
Anlisis muilhorido/175
ln RR * n RD = ln ^ X' M ' W ) i
P<Xi/[I - P(X)1
i - p x ' ) 7 . P(X>)
una C' " ! " d0 0 t o ' d I2)' * " * -
i f , * , w m
Segn este resultado,
ln RD = 2 P/A-/ - *>
vale J L T t T ^ re
v . ^ f ^ con respecto a otros valoras X y
,CStiraar ft propios de u T 2 i
2 "M
que expresa ei logit de P(X) s e g n * ] / ' " ^ * regrBS, n
-P nwJio * h
el C l los c o d ^ T t e r c ^ r i f l T p " ^ r n " * * ' * r;Ma w m h tti ^ --gii"
prediccin deJ modelo de acuerdo con tu infwmSiA r * ^ L ,w Potabilidad de
1 76/Mttodotogo de io m stigada-.
Una vez estimados tales coeficientes de regresin se calcula fcil
mente el valor de) riesgo relativo, puesto que:
R R * R D = e x p [ I , - X>)]
Segn esta expresin, una vez el coeficiente de regresin (3, de una
cierta exposicin dicotmica 0-1 ba sido calculado, la estimacin aproxi
mada del riesgo relativo correspondiente ajustado por las dems varia
bles incluidas en el modelo se obtiene al calcular el valor de exp(p)\ la
diferencia X1 Xo correspondiente al factor Xt toma el valor 1 y las dems
diferencias tomas el valor 0.
Si junto con las estimaciones puntuales de los coeficientes de regre
sin se obtienen estimaciones de los correspondientes errores estndar
c, se pueden calcular los lmites de los intervalos de 100(1 * &)% de con
fianza para los P* con el supuesto de que estos se distribuyen normalmen
te, al utilizar la expresin:
P; * Z'iQfiPV
Una vez obtenidos los lmites de tales intervalos se pueden calcular,
de manera aproximada, los lmites inferior y superior de los intervalos de
100(1 fx)% de confianza para los riesgos relativos propios de cada una
de las variables de exposicin X por cuanto:
ttm iqf(RR) exp[lm irtf
lim sup (RR) txpllm sup ($t)l
Cuando se trata de variables X, categricas con ms de dos niveles,
como en el caso en que se utilizan ms de dos categoras para identificar
e) estado civil, es necesario incluir en el modelo un nmero de variables
X, igual al nmero de categoras menos 1 6 Ast si el estado civil se iden
tifica por medio de tres categoras es necesario incluir en el modelo dos
variables la categora que no figura expresamente en el modelo hace
las veces de punto de referencia o exposicin cero, de tal modo que las
estimaciones de la asociacin correspondientes a las dems categoras del
6 A cuas vatiibles se les conoce cono vniafaks t i f i c U t e o mmy>
Anlisis Muhrvaroo / 7 7
mismo factor son estimaciones relativas a la exposicin de referencia (Hos-
mer y Lemeshow, 1989).
Cuando se trata de una variable continua, caJ como el nmero de
en aos, el riesgo relativo calculado
como exp($) indica ei riesgo asociado con el incremento de una unidad en
tal variable y, por tanto, implica el supuesto de que el riesgo aumenta en
forma exponencial de acuerdo con la exposicin. En aquellas situaciones
en las que este supuesto no parezca razonable es mejor categorizar la va
riable (Rothman, 1986) y tratarla consecuentemente, tal como se ha descri
to anteriormente.
Adicionalmente, con un modelo logstico es posible detectar la inter
accin que puede existir entre una exposicin estudiada y otros factores
segn un modelo multiplicativo al definir algunos de los X en trminos de
la interaccin estudiada. Por ejemplo, si la exposicin en estudio se denota
con la letra E y un cieno factor se denota con la letra W> la interaccin EW
se puede estudiar si en el modelo uno de los factores Xt representa el
producto E x W.
Con ligeras modificaciones, el modelo antes descrito que estricta
mente se aplica al anlisis de observaciones obtenidas con un diseo no
equiparado, o sea regresin logstica incondicional se puede aplicar a
observaciones obtenidas por medio del equiparamiento mediante el uso de
la regresin logstica condicional.
La tabla 10.5 presenta algunos de los resultados obtenidos al utilizar
un modelo logstico multivariado con el fin de predecir el consumo de
cigarrillo por parte de escolares adolescentes (Londoo, 1992). Tales resul-
tados permiten apreciar las relaciones ms importantes que caracterizan a
la regresin logstica multivariada las cuales han sido expuestas.
El modelo resultante se costruy con la ayuda de un computador a
partir de las variables que en un anlisis estratificado se identificaron como
las ms asociadas al tabaquismo de los escolares y de las interacciones
detectadas por medio del mismo anlisis. En la costruccin del modelo
multivariado slo se incluyeron aquellas variables que en el modelo lineal
logit P(X) fueron significativas P < 0,05.
En la misma tabla se puede advenir que las diferentes estimaciones
de la razn de disparidades ajustada se obtienen al exponenciar los coefi
cientes de regresin |5 o sea RD = expft) y que los lmites de los inter
valos de confianza para las mismas razones se obtienen al exponenciar
los lmites inferior y superior de los mismos coeficientes j$, tai como se
1 78/Hetodobfe de fa mvtsii&eMn...
T a b l a 10*5 Factores relacionados c on el c o n s u m o d e cigarrillo e n escolares;
resultados d e un anlisis d e regresin logstica muttrvariada, Mede
llin, 1 9 9 2
Variable independiente (X)
r
HDb Li(KD> L S.(RDf
Tabaquismo en amigos 1,3879 0.2367 4,01 2,51 6.43
Impulsividad 0,1793 : 0.4193 1.20 0,53 2,72
Tabaquismo en amigos preferidos 0,9137 0,2175 2,49 1,61 3,82
Sexo 0,6777 0.2035 1/97 1 33
2,92
Rendimiento acadmico 0,5198 0,2027 1.68 1.14 2,49
9 Error estndar.
b Razn d e disparidades.
c LI. y LS.: Bmites inferiory superior d e un h te r v a b d e 95% d e confianza.
Fuente: Londofto JL Factor relaconados con el consumo de dgarrittos en escalares
adolescentes de la oudad de Medellin. Boletin de 1$ Ofina Sanitaria Paname-
r/cane. 1992: (112): 13M37.
i n d i c a a n t e s . E l m o d e l o e n s u c o n j u n t o r e s u l t s e r a l t a m e n t e s i g n i f i
c a t i v o x 2j * 9 8 , 7 7 ; P * 7 , 0 7 x J O 11 y a l v a l i d a r e l m o d e l o l o g r a d o
p o r l a c o m p a r a c i n d e l a p r e d i c c i n d e l t a b a q u i s m o d e l o s e s c o l a r e s
c o n l a o b s e r v a d a s e o b t u v o u n a s e n s i b i l i d a d d e l 6 3 , 2 % y u n a e s p e c i f i
c i d a d d e l 7 2 , 3 % .
Consideraciones finales
En l o e x p u e s t o a n t e r i o r m e n t e s e p u e d e n apreciar l a s g r a n d e s p o s i b i l i d a d e s
q u e p r e s e n t a e l a n l i s i s m u l t i v a r i a d o para e s tu d ia r l o s f e n m e n o s e n l o s
q u e i n t e r v i e n e n m l t i p l e s f a c t o r e s . E n particular, s e p o n e n d e m a n i f i e s t o
> l a s v e n t a j a s q u e o f r e c e l a r e g r e s i n l o g s t i c a m u lt i v a ri a d a p a r a e l e s t u d i o
d e a s o c i a c i o n e s e c o l g i c a s c o n m l t i p l e s f act or e s.
A l c o m p a r a r e l a n l i s i s d e r e g r e s i n l o g s t i c a m u l t i v a r i a d a c o n el
a n l i s i s e s t r a t i f i c a d o s e a d v i e r t e q u e a u n q u e e l p r i m e r o e s u n m t o d o m s
c o m p l e j o y p u e d e p r e s e n t a r m a y o r e s d i f i c u l t a d e s p a r a l a i n t e r p r e t a c i n de
l o s r e s u l t a d o s o b t e n i d o s o f r e c e v e n t a j a s import ant es t a l e s c o m o l a p o s i b i
l id a d d e c o n t r o l a r s i m u l t n e a m e n t e e l e f e c t o d e m l t i p l e s v a r i a b l e s l o
c u a l s e d i f i c u l t a e n e l a n l i s i s e s t r a t i f i c a d o c u a n d o e l n m e r o d e o b s e r v a
c i o n e s e s r e l a t i v a m e n t e e s c a s o , m a y o r f a c i l i d a d para e l e s t u d i o d e l a
AnJisiimuilivariado / 179
interaccin y, en el caso de informacin equiparada, la posibilidad de con
trolar el efecto de factores distintos a aqul por el cual se ha equiparado la
informacin.
No obstante, se debe considerar que el empleo de los mtodos mu*
ti variados exige no slo la debida comprensin de los principios sobre los
cuales han sido desarrollados, sino tambin una posicin cautelosa por par
te del investigador. Con frecuencia, la improvisada costruccin de un mo
delo inultivariado sin una previa identificacin de las variables relevantes
hecha mediante el empleo del anlisis estratificado produce serios errores
en la interpretacin de los resultados obtenidos.
Ms an, en ocasiones, el anlisis estratificado puede ser la estrate
gia ms recomendable cuando permite identificar de una manera ms sim
ple y ms clara relaciones multivariadas que aquellas que pueden lograrse
con un anlisis de regresin multivariado. En cualquier caso, debe consi
derarse siempre que el modelo multivariado, el cual se apoya sobre una
rigurosa metodologa cientfica, es tambin un arte cuyo dominio se ad
quiere con una slida experiencia.
Referencias bibliogrficas
1. Amtage P. Siatutica! Methods w Medical Research. Oxford, Blockwell Seumific
Publicacin;, 1971.
2. BMDP, Univcreity o f California, Health Sciences Computing Facilities, Los Angeles
California, 90024, USA.
3. Breslow NE, Day NE. Statistica! Methods l/t Cncer Research. Vol. I: The m u iivm o f
case-control studies. International Agency for Research on Cunccr. Lyon. 1980.
4. Dean AG et al. Epi J r t f , verti* 6 . 0 : a word processing, (alabase, and statistics program
f o r epidem tokgy on microcomputers. USD. Inc., Srone Mountain. Georgia. 1994.'
3. EPISTAT, E p s t a i Services, 2011 Cap Rock Circle, Richard son. Texas, USA.
6. Corafield J. Joint dependence o f riak o f coronar? heart diseose on serani cholcs'erol and
syslolic blood pressure: a discriminan! functoa anahnis. Federal Proceediitus I961-
(21):58-6I. *
7 Cox DR. The Analysis o fB iitary Data. Loneta, Methuen, 1970.
8. Dame] W. B io sta tsicst A Foundation f o r Amysis m the Health Sciences. New York
John Wiley and Sons, 1983.
9. Dixoo Wl, Massey FJ. Introduction toStatsticoi Analysis. Tokyo, McGraw-Hill, 1963.
10. Draper NR. Smith R AppiUd R eg resi n Analysis. 2nd ed. New Yoriu John Wilcy and
Sons, 1981.
11. EGRET, Statistics and Epidemiology Research Corporation. 909 Nonheasi 41 ni. Sriwu
Suite 202, Seattft, WA 98105. USA.
J 80/M*teok>gta de ta bnetOgacidn...
12. Haipein M, Blackwelder W. Vefter J Estimatioo o f the Multivariate Logistic Risk Func
tion and Maximus Likelihood Approaches. Journal o f Chronic D iseases 1971; (24):
125-158.
13. Hoamer D , Lemesbow S. Applied Logistic Regression. New York, John Wiley and Sons,
1989.
14. Kahn HA, Sempos CT. Statistical Methods in Epidemiology. OxfcatJ University Press.
New York, 1989.
15. Kffiing f f FN. Foundations o f Behavioral Research. New Yak Holu Rinehart and
Winston, 1973.
16. Kleinfeauro DG, Kopper LL. A pplied Regression Analysis an d Other Multivariable
Methods. Belmont, California, Wadsworth Publishing Co.. 1976.
17. Kkiobaum DO, Kpper LL, Morgenstern H. Epidemiologic Research. Belmont, Califor
nia, Lifetime Learning Publications, 1982.
18. Kkeiobaum DG. KupperLL, Cassel J, Tyroler H. Multivariate analysis o f risk o f coronary
heart disease in Evans County, Georgia. Archives o f Internal Medicine* 1971; (128):
943-948.
19. LondoAo JL Factores relacionados con el consumo de dgamDos &n escoives adolescen-
tes de la ciudad de Medellin. B oktbi de ia Oficina Sanitaria Paitamericana. 1992;
(112): 131-137.
20. Patrick R, Cassel JC. Tyroler HA et al. Hie Ponape Study o f the Health Effect* o f Cul
tural Change. Annua) Meeting, Society for Epidemiologic Research, Berkeley. Califor
nia, 1974.
21. Press J, Wilson S. Choosing between Logistic Regression and Discriminant Analysis.
Journal o f the American Statistical Association. 1978; (73): 699-705.
22. Rothman KJ. Modem Epidemiology. Boston, Link, Brown, and Co.. 1986.
23. SAS Institute Inc.. SAS Circle, Po. Box 6000. Cary, North Carolina, USA.
24. Sehlesselman JJ. Case-Controi Studies. New York, Oxford University Press, 1982.
25. Smdecor GW, Cochran WG. Statistical Methods. Iowa, The Iowa State University Press,
1967.
26. SPSS, SPSS inc., 444 N. Michigan Avenue, Chicago, Illinois, USA.
27. STATXACT, Cytel Software Corporation, 137 Erie Street, Cambridge, MA 02139, USA.
28. True J, Cornfield J, Kanne) W. A multivariate analysis o f the risk of coronary heart dis*
ease in Framingham. Journal o f Chronic Diseases. 1967; (20): 511-524.
11
En e s te p i r u l o se presenta la estrategia propia de los diversos estu
dios e colgicos, su utilidad en la investigacin epidemiolgica y, por
ltimo, sus alcances y limitaciones.
x ara e l e s t u d i o d e l a d i s tr i b u c i n d e l a e n f er m e d a d y d e s u s f actores
c o n d i c i o n a n t e s l o s e p i d e m i l o g o s recurren, e n o c a s i o n e s , a l o s e s t u d i o s
e c o l g i c o s e n l o s c u a l e s , a d i f e r e n c i a d e l o s e s t u d i o s o b s e r v a c i o n a l e s ___de
s e g u i m i e n t o o d e c a s o s y c o n t ro l e s l a unidad d e a n l i s i s e s un g m p o
g e o g r f i c o o cultural y n o u n i n d i v id u o ( K l e i n b a u m y c o la b o ra d o re s ,
1 9 8 2 ) . P or ejemplo e s c o m n t omar c o m o unidad d e a n l i s i s a un barrio!
u n a c i u d a d o u n p a s ; c o m o u ni dad d e m ed id a d e l a e x p o s i c i n al fact or
d e r i e s g o , e l c o n s u m o p e r c p i t a d e d et ermin ado p r o d u c t o e n tal unidad
g e o g r f i c a , y c o m o m e d i d a d e l e f e c t o , a l a t a sa anual d e i n c i d e n c i a o d e
m ort al id ad p o r d et ermin ada c a u s a .
I 8 2 /Utloiologla de lo imeftigaeUn..
Los estudios ecolgicos son fuente de hiptesis etiolgicas y per
miten tambin, el estudio del impacto logrado por programas de inter
vencin comunitaria; adems han sido utilizados para probar
asociaciones etiolgicas. aunque para tal propsito presentan importan
tes limitaciones metodolgicas que el investigador debe considerar con
el fin de evitar serios errores en la interpretacin de sus resultados y en
la inferencia derivada de ellos.
Estrategia \
La estrategia metodolgica utilizada en un estudio ecolgico depende de su
propsito. De acuerdo con este concepto Morgenstern en 1982 los clasifico
en exploratorios, comparativos, de series cronolgicas y mixtos, cada uno
de los cuales se desarrolla a continuacin.
Estudios exploratorios
Con los estudios explratenos se pretende identificar un patrn a i la dis
tribucin geogrfica o cultural de la incidencia o de la mortalidad por de
terminada enfermedad, con el fin de reunir elementos que permitan sugerir
una asociacin etiolgica o formular una hiptesis de igual naturaleza Con
ello no *e mide la exposicin a algn factor de riesgo por cuanto slo se
trata de observar la distribucin espacial de la mortmortalidad.
En 1971 Urbach hace notar la variacin geogrfica del cncer de
piel diferente al melanoma (Urbach, 1971) y en 1981, una encuesto del
Instituto Nacional de Cncer de Estados Unidos revela una notable diferen
cia en la incidencia de aqul entre las poblaciones blanca y negra de ese
pas Tales estudios fueron, en su momento, un punto de partida importante
para la identificacin de la radiacin ultravioleta no ionizante como el pnn-
cjpal factor de riesgo para la enfermedad (Scotio y colaboradores, 1982;
Fears y Scotto 1982).
t*
Estudios comparativos
El propsito de estos estudios es el de establecer la asociacin entre el
nivel de exposicin promedio X y la tasa de la enfermedad Y para
varios grupos, lo cual se logra por medio de un modelo de regresin
lineal Y = a + PX, en donde Y representa la tasa estimada de incidencia
o de mortalidad, a estima dicha tasa en ausencia de exposicin a X, o sea
el intercepto y p estima la pendiente, la cual da a conocer la variacin en
la tasa por cada unidad de incremento en la exposicin X.
Estudias seotfieos/J 8 3
El modelo de regresin puede incluir otras variables independientes
Xt de tal modo que se logre estudiar el efecto d mltiples factores de
exposicin o identificar interacciones existentes entre ellos y controlar el
efecto de potenciales variables de confusin. Adems de los coeficientes
de regresin se pueden estimar los coeficientes de coirelacin X - Y) Es
tudios realizados por Amstrong y Dol en 1975 y por Carroll durante eJ
mismo ao, con los cuales se pretenda estimar el efecto de diversos fac
tores ambientales y, en particular, de algunos relacionados con la dieta, han
sealado la estrecha correlacin positiva y lineal entre el consumo de carne
y la incidencia de cncer de colon y entre el aporte total de grasa y la
mortalidad por cncer de mama en mujeres de varios pases, tal como se
aprecia en la figura 11.1.
De modo similar, Pelayo Correa en 1981 inform acerca de las aso
ciaciones lineales estadsticamente significativas observadas entre las tasas
de mortalidad ajustadas por edad de varios pases y diversos indicadores
poblacionaies por medio de coeficientes de correlacin (Vase tabla 11.1),
Segn el mismo autor, dichas estimaciones, permiten confirmar que
las enfermedades que tienen una mejor correlacin con indicado
res dietticos son los cnceres del intestino, mama y prstata y la en
fermedad arterioesclertica del corazn. Las mismas enfermedades se
correlacionan bien con el ndice fsico de calidad de vida y con ei
producto bruto, indicando que ellas son erfermedades de la afluencia.
Nuestra tabla resalta las correlaciones negativas de las enfermedades
bajo estudio con el consumo de arroz, maz y granos, que pudieran
sugerir un papel protector de estos alimentos (Correa, 1981).
Series cronolgicas
Con este tipo de estudio ecolgico se analiza la relacin existente en una
poblacin entre el promedio de exposicin a uno o varios factores en el
tiempo con la tasa de la enfermedad observada en un momento posierior;
por ejemplo, el estudio del impacto que sobre una poblacin ha tenido un
programa de vacunacin, al comparar el comportamiento de la incidencia
de la enfermedad antes y despus de la ejecucin del programa.
1 Para denafir la uocian i aeme entre variables continuas te ufe utilizar el cufeteme de
CMdiCMJn d i Petiaoa. Cea*. t r a a de ettim* la correlacin rae variable* medid a nivel
OTnaJ le mtazan lot coeficientes de rango y pva asociaciones cbcotmicaa cstegdrinu k utiliza
el coofieieote ph f+).
&4/Ht*edoiog(o*kiwt*igelm--
50-
s
8
2. -
,
10-
M v M Z r i n d i
*
m n una
Ommm
t t o M A
"*** i b S S f t
9
RnM* Mari Mpwna atlM
VugeHwBa ! P*>
* oteiM
" * * " CckvrtM
I
40
1
80
I--------\------- 1------- \------- 1 I
1 1 J00 240 M0 0
Consumo itoflo p v c ip a n prnoi
2S-i
Mi
I
15-
10
enfiMWW
Cmdft*
I r A *
t e *
MUil I
lhA **
Oi<eMai
I M
Hwftpb
HoM
# M w m
UriM
---- v wWii
V E S
Wbiii Oalig
F*
CtUnM
M i GnM
r m ke
Trividft*
BpOV
lri~UftU
El SaMcr
Mfrjfce
20
i -------- 1-------- i-------- 1-------- r
40 (0 80 100 120
Acore H U I * pas fl * * (gwmos tfa)
140 160 U0
Figura 1 1 . 1 A) Correlacin entre la in o d e n d a d e cncer d e colon e n varios
pases y el consumo e carne (Armstrong y Dol, 1 9 7 5 . B) Corre
lacin entre mortalidad por cncer d e mama e n vanos pases y
c o n s u m o d e grasa (Carroll, 1975).
fenre; Dol R, Peto R. l a s Causas ote/ Cncer. Barcelona, Salvat Editores, 1969, p - 16.
Estudies ecoigteos /1 8 5
Tabla 11.1 Coef icien tes d e correlacin d e Pearson significativos P < 0 ,0 5 : tasas
d e mortalidad ajustadas por edad por causas selectas y d e la talla y
frent e al producto brnto, el consumo per cpita d e productos diet
ticos y la talla d e las mujeres
Y
P f d u c r o T t g o A / r o i M a f e d a n o s C 'n e
b r u t o ele r e s
C erd o H u + L s d * A c e i te
v ca / g r e s
i n i m s i
c * .
v e
C&b* P r o
r i a i t e t
a s
G n s e T i t o
Cbfen 0 * 7
-0 , 3 4 >0 , 6 7 4 6 6 0 . 9 4 0 D M I ( U S 0 6 4 0 0 4 4 0 9 0 , 7 4 0 5 5
At o n a

( m & m ) 0 6 6 0 , 3 4 -0,50 0 . 6 6 0 . 7 0 0 4 6 0.62 0,75


0 . 0 4 0 . 5 6 0 6 4 0 . 4 6 f t 75 M
P r sttta
0.64
0 . -0 . 6 6 0 . 4 ?
0. 4 6 0,46 0.63 0 t 0 4 4 0.76 0.52 0 7 2 0 .S6
c r o u r f a
0,52
-0 . 4 0 . 0 4 6 . .
0.59 0 . 4 6
.
0.74 o , s i 0.73
TiJts 0. 7 0
4 4 2 0 . 6 6 a n 0,64
6 . 4 9 0,56 0 . 4 ? 0 6 9 a. 6 i
.
fuente: Correa P. Epidemiologic correlations between diet and career frequency Ca/xer
Research, 1981; (41): 3685-3690.
T a m b i n p u e d e e s tu d ia r s e , por m e d i o d e un a n l i s i s d e s e r i e s c r o n o
l g i c a s , l a a s o c i a c i n e x i s t e n t e entre u n a e x p o s i c i n p r e v i a y l a i n c i d e n c i a
o i a m o r t a l i d a d q u e s e p r e s en ta e n un p e r iod o p os t er i or , c o n u n a d i f e r e n c i a
m n i m a e n e l t i e m p o q u e s e a i g u a l a l p e r i o d o d e i a t e n c i a d e l a e x p o s i c i n
e s tu d ia d a .
Estudios mixtos
En e s t e t i p o d e e s t u d i o s e c omp aran entre s l o s c a m b i o s o b s e r v a d o s e n la
t asa d e l a e n f e r m e d a d c o n r e s p e c t o a l a e v o l u c i n d e l a e x p o s i c i n e n v a
n a s p o b l a c i o n e s e n u n p e r i o d o determin ado. P or m e d i o d e e s t a estrat egi a
e s p o s i b l e m o st r a r e l i m p a c t o d e l o s programas d e c o n t r o l d e l a hiperten
s i n arterial a l c o m p a r a r e l c o m p o rt a m ie n t o d e )a m ort al id ad por e n f e r m e
d ad c o r o n a r i a e n e l t i e m p o e n varias p o b l a c i o n e s , u n a s e n l a s c u a l e s s e ha
p u e s t o e n m a r c h a e l progr ama y otras e n l a s qu e n o .
Usos y limitaciones
L a r e l a t i v a f a c i l i d a d y rap i d e z c o n q u e s e p u e d e r e a l i z a r un e s t u d i o e c o l
g i c o c u a n d o s e d i s p o n e d e r e g i s t r o s p o b l a c i o n a l e s d e rutina p u e d e ser
at ract iva para l a i n v e s t i g a c i n e p i d e m i o l g i c a ; n o o b s t a n t e , e s p r e c i s o q u e
] 8 6 /Metodologa de k mvexigaela...
el investigador en epidemiologa tenga-una clara idea acerca de sus posi
bilidades, de sus alcances y de sus limitaciones.
De acuerdo con Piantadosi y colaboradores (1988), la conveniencia
de realizar un estudio ecolgico se presenta en cuatro situaciones:
1. la recoleccin de la informacin a partir de individuos es exce
sivamente costosa o demorada.
2 Cuando se desea una mayor variabilidad en la exposicin de tal modo
que se pueda estimar mejor la asociacin de inters, requisito que suelen
satisfacer los indicadores de diversas regiones, tal como sucede con los
inHif de consumo de diversos alimentos.
3. P imiv^ Be tienen dudas razonables acerca de los datos que pueden ob
tenerse de los individuos, tal como sucede con la medicin de comporta
mientos relacionados con temas tab, por ejemplo, el consumo de
^'cuando el inters central del estudio est relacionado con fenmenos
colectivos, tal como ocurre con aquellos que evalan la respuesta poblaao-
nal ante programas preventivos de intervencin en la comunidad.
No obstante, en la interpretacin de los resultados obtenidos se debe
considerar que las relaciones observadas con base en indicadores colectivos
no suelen ser las mismas que se presentan individualmente y que, al igno
rar tal hecho, se comete con frecuencia el error conocido como la falacia
ecolgica (Robinson, 1950). _____________
Como un ejemplo de este error es bien conocida la interpretacin
ofrecida por el socilogo francs Emile Duricheim quien relacion el sui
cidio con la religin que profesaban los habitantes de la antigua Prusia, al
encontrar mayores tasas de ste en aquellas provincias mayontanamente
protestantes (Durkheim, 1951); pero se ha objetado, con razn, que los
suicidas podan ser sujetos que profesaban otras religiones menos predonu-
ames. , _ . _ . _
Es posible demostrar ms formalmente que los coeficientes de re-
erosin y de correlacin obtenidos con base en medidas colectivas sue
len diferir de los mismos coeficientes cuando se estiman con base en
mediciones individuales (Morgenstem. 1982; Piantadosi y colaborado
res, 1988), lo cual se presen como consecuencia de dos efectos (Mo
T x i M d o o i la agrupacin porque excluye la posibilidad de. incluir
mrdicionfts individuales acerca de variables que pueden estar relacin
con la enfermedad, bien sean explicativas o de confusin.
Sandios ecolgicos/ J87
2 . 0(ro efecto que se presenta por la falta de control de variables de confusin
no incluidas en el modelo de asociacin definido por el investigado- con base
en mediciones colectivas o modelo ecolgico. A manera de ejemplo, diferen
cias en la composicin rea de los grupos comparados en el modelo eco
lgico pudieran explicar parcialmente la asociacin observada entre una
determinada exposicin y la mortalidad por determinada causa.
Aunque, en principio, estas potenciales variables de confusin en los
estucos ecologi* pueden ser identificadas por el investigador, la infor
macin correspondiente suele ser difcil de obtener. Un ejemplo que ilustra
la distorsin que sufren las medidas de asociacin como consecuencia de
los efectos de agrupacin y de confusin antes mencionados ha sido pro
posto por Piantadosi y colaboradores en 1988. quienes hacen notar las
diferencias que presentan los coeficientes de correlacin rho y los de re
gresin lineal p los cuales estiman la asociacin existente entre diversos
factores cuando se analiza la misma informacin en cuatro formas de agru
pacin diferentes: individual, condado, estado o regin. Los datos fueron
S S i i S r ? ' 'rimvS k l egl,nda enCUes,a nacional * salud ynutri-
cin MANES II realizada en Estados Unidos entre 1976 y 1980 (Vase
taoifl l i . 2).
Tabla 1 1 . 2 Coeficientes d e correlacin y d e regresin para asociaciones selec-
TAC n&ra al* J ^ _ _ .
Variables
individua!
(n - 13620)
rho beta
Condado
( n - 6 4 )
rho b e ts
Estado
(n - 34)
rho beta .
Regin
( n - 6 )
fho beta
Peso-tafta
Edacknasa
0,502 0,821
0,320
0,384
0,272
0,345 0,442
0,318
corpora/
Proteina
0,329
0,084
0,532 0,091
0,637
0,105
0,853
0,108
-grasa
Ingreso
0,785
0.886 0,711
0,776
0,658
0,620
-0,140
0,072
-educacin
Raza
0,291
0,361
0,603 0,705
0,669 0,801
0,992
1,354
'ingreso
Raza
0.179
1,403
0,076 -0,346
0,040
<0,202
*0,656
-6,768
-educacin *0,131
1,277
0,054
*0,291 0,01 S
0,091
0,596.
-8,390
fUenfe; H! atth *** ^ * of the Secn* N e t w ,
' ,9 7 & ,9 B - WaShn9tQn' D-C ; US
18 8 /M m d p b iio de la bnatigac*-
- te a n a s s :
& T & e z z z t s s z
X i s i - - **ii'> r i s r s s :
= i r r r S C = %
SSSisSS
m m m m
s z x s z * - " r ^ i r r s
X - r ?
- ^ S S L
S t C i - . 08f ul eait S ^
S s 3 s 3 ^ = 3 &
d a t o causado por el ( a v o " n o de carne (Correa, 1981).
EsnttCoffcolgieo3/r] 8 9
D e m o l o s im i la r , e n e l e s t u d i o e c o l g i c o s o b r e d i e t a y c n c e r d e
c o l o n a t e a d o por Dr asar e I rving ( 1 9 7 3 ) n o f u e p o s i b l e separar l o s e f e c
t o s d e l c o n s u m o d e g r a s a t o t a l y d e p r o t e n a ani mal d e b i d o a l a e s t r e c h a
d ? 2 t o S St*0te ' T m b VariablCS- T8mbn en u n realiza-
T el H T M T . ? aUt reS cncuentran l s e r o p r e v a l e n c i a
e l H T L V - I c o n m e d i d a s e c o l g i c a s t a l e s c o m o l a altura s o b r e e l n i v e l del
nal y d S S 1 k Pr0dUCC6n a8rfcola- 13 poblada
^ y diversas medidas del grado de urbanizacin, ellos anotan que las
e T independ,exn t e s s e r s u s t i t u a s d e otras v a r ia b le s t a l e s c o m o
s u 2 S T 18 ! CtaDda matema' las h w a . o los hbitos
S , J T 86 b m , d e n t l f i c a d 0 d e t e r m in a n t e s d e l a p r e v a -
Jencia del virus (Maloney y colaboradores, 1991).
. Con f l u e n c i a ocurre que, si bien se encuentra informacin con resocc
l e ' T " P0!bl' *> S S 5 ,
c o n e c o m p o r t a m i e n t o d e v a r i a b l e s d e c o n f u s i n im p o r t a n t es En e l m i s m o
r r ? ^ C, IrVng ( 1 9 ? 3 ) n fUC * * * * * e U f t o d e la S
d e o t r o s f a c t o r e s r e l a c i o n a d o s c o n l a s c o n d i c i o n e s d e v i d a , c o m o l a c o m a
s z r z , yi & r d"*ba Ia^ta*
Consideraciones finales
D e l a s c o n s i d e r a c i o n e s a n t e s e x p u e s t a s s e derivan import ant es c o n c l u s i o n e s
p r a " " - ~ -
srs^. " * * n,"y -* * wSs r
s s i M s s r * ~
L, K S S S E S X K S
a u n a r e s d e l a c o n f o r m a c i n d e h i p t e s i s e t i o l g i c a s , p a r t i c u l a r m ^ '
190/kietoaio^A de b invttige&L..
Esas sorprendentes correlaciones gustadas por edad n o r t e c r e m a m ^
s u que la caite o algn tipo de grasa s e detenmnacttt mayores
del cncer de cok o de mama, pero a sugieren que existen detenrnnaih
tes m.nip.ihMen de estos cnceres (Armstrong y Ddl. 1975).
P or l t i m o , e s i m p o r t a n t e s e a l a r l a p o s i b i l i d a d q u e o f r e c e n l o s e s -
m d i o s e c o l g i c o s p a r a e v a l u a r e l e f e c t o d e programas d e m t ^ c . -
m unitaria, t a l e s c o m o a q u e l l o s q u e pr e te nd en
l a s p o b l a c i o n e s c o n r e s p e c t o a l a d i e t a y a l a a c t i v i d a d f s w a , o * ,
y para i d e n t i f i c a r g r u p o s h u m a n o s q u e p u e d a n estar e x p u e s t o s a f e c t e s
d e r i e s g o c o l e c t i v o s . A e s t e l t i m o t i p o p e r t e n e c e u n a e n c u e s t a ^ S *
r e c i e n t e m e n t e r e a l i z a d a e n M x i c o q u e . p o r m e d w d e l a c o m p a r a c i n d e
l a s t a s a s d e i n f e c c i n p o r d e n g u e c o n i n d i c a d o r e s p o b l a c i o n a l e s t a l e s
c o m o l a t e m p e r a t u r a m e d i a n a e n l a e s t a c i n d e l l u v i a s
d e v i v i e n d a s c o n d e f i c i e n t e s c o n d i c i o n e s d e p r o t e c c i n , P^ " 6
c ar l a s c o m u n i d a d e s c o m o d e a l t o , m o d e r a d o o b a j o n e s g o ( K o o p m a n y
c o l a b o r a d o r e s , 1 9 9 1 ).
Referencias bibliogrficas

Cncer. 1975; (15): 617-631.


i M KK. Experiment evidence o f d ie ta* f a c and hormonedependem cancera.
CancerReieorch. 1975: (33): 3374-3383.
3 Correa P. E p i* m io lo |ic correUtons berreen diet and c e e r frequeacy. Cncer Re-
search. 1981; (4 1 ): 3685-3690.
4 DoU R. P e R- La* cataos del cncer. Barcelona, Salvat Editor, 19B9.
5. Etasar BS. Irving D. EnviwntnenBl factors and cncer o f the I o n ad brea. Bnsh
Journal o f Cncer. \ 973; (27): 167*172.
6. Dorkheim E. Suelde: A Study in Scciology. New York.
1. Fears TR, Scono J. Change* in sldn cncer 1971,72 y 1977 ^ J
n a lo f te Nationol Cncer Institute. 1982; (69). 365-370.
8. Kleinbaum DO, upper LU Morgewlert, H. Eplemologic R w r c h . Belmont. Cal.for-
a . Lifetime Leaming Publicatons, 1982.
** - s x i ,
nal o f Epidetmology.1991; (133). 1125-1134.
11 Morgenstem H. Use* of ecologic analysis in epidemiologic m earch. American
Public HtaUh. 1982; (72): 1336-1344.
studto$cot6gia>s/J9}
12. National Center tor Health Statistics. Plan and operation o f the Second National Health
and Nutrition Examination Survey 1976-1980. Washington D.C: US Government
Printing Office, 1981. DHHS publication No. PHS SI - 131?.
13. Piantadosi S, Byar D, Green S. The ecological fallacy. American Journal o f Epidemio-
logy. 1988; (127): 893-904.
14. Robinson WS. Ecological correlations u^d the behaviour o f individuals. American Socio-
fogy Review. 1950; (15): 351-357.
15. Scotto J, Fears TR, Frau me ni JF. Solar Radiation. 2d: Scfaottenfeld D, Fraumeni JF Jr. eds.
Cancer Epidemiology m d Prevention. Philadelphia, W. B. Saunders Co.. 1982.
16. Stnvraky KM. The role of ecologic analysis in studies o f the etiology o f disease: a
discussion with reference to large bowel cancer. Journal o f Chronic Diseases 1976*
(29): 435-444.
17. Uibach F. Geographic Distribution o f Skin Cancer, Journal o f Surgical Oncology 1971
(3): 219-234.
de supervivencia
1 2
En el presente captulo se describe la manera como se estudia la su
pervivencia de un grupo de sujetos a partir de un momento de inters
como el diagnstico de una enfermedad por medio de la tabla de
supervivencia, estrategia fundamental de lo que de modo ms general
se conoce como anlisis de supervivencia; se presenta, adems, el m
todo de Kaplan Meier el oial permite estimar la supervivencia con un
nmero reducido de pacientes, se describe el mtodo de Mantel y
Haenszel para comparar la supervivencia de dos grupos de personas y
se muestra el modelo de Cox para describir y comparar la superviven
cia de acuerdo con mltiples variables; por ltimo, se discute la me
dicin de la mortalidad en trminos de aos de vida potencialmente
perdidos y se presenta la medida de la carga de la enfermedad por
medio de los aos de vida saludable perdidos.
294/Mtooiogte e Ut im*uigacfa.~
*Jomo parte del quehacer de la investigacin epidemiolgica surge en
ocasiones la necesidad de estudiar la supervivencia de ciertos grupos-de
personas en el tiempo a partir de algn evento inicial, que suele ser el
fomento en que se diagnostica una enfermedad. Por ejemplo un epide
milogo puede estar interesado en estudiar la supervivencia de los pacien
tes con diagnstico de cncer de estmago y. an ms. comparar U
supervivencia de aquellos sometidos a un determinado tratamiento con k
de otro grupo con el mismo diagnstico pero con un tratamiento difereme.
A continuacin se describe l mtodo central de un conjunto de tc
nicas relacionadas con el estudio de la supervivencia, el mtodo actuanal.
Mtodo actuarial
Las diferentes tcnicas asociadas con el estudio de la supervivencia estn
relacionadas de una u otra manera con el mtodo actuanal el cual hasido
utilizado tradicionalmente en la investigacin demogrfica para i cttriK-
cio de tablas de vida (Berkson y Gage, 1950; Cutler y Ederer, 1958. Ej
veback 1958). Por medio de dicho mtodo se costruye en epidemiologa
la tabla de supervivencia que tiene como objetivo central la estimacin de
f l T ^ t e b i l i d a d que tiene un paciente de sobrevivir un cierto tiempo a
partir del momento del diagnstico, conocida como probabilidad acumula-
da de supervivencia, Sr . . .
2. La probabilidad que tiene un paciente de morir en algn momento, dado
ue ha sobrevivido hasta entonces, qr .
El conjunto de valores de Sx define Iq funcin de supervivencia S(t)
y el conjunto de valores de qx o probabilidad de monr a lo largo del tiem
po, la denominada funcin de peligro h(t) (Gehan, 1969).
Tabla de supervivencia
Con el fin de ilustrar la estrategia que se utiliza para costruir una tabla de
s u p e r v i v e n c i a se p r o p o n e el siguiente ejemplo; . . . . . . r
Para estudiar la supervivencia de pacientes con diagnstico de cncer
de cuello uterino sometidas a ciruga radical durante los quince das si-
recupmctfn de ) p a o i metido a determinado traHnusoto. entre oros.
Ejndio t supervivencia / i 95
gui3Qt$s al diagnstico se observ en una clnica de tumores a un grupo
de 300 pacientes durante cinco aos; el estudio se inici en 1989 y se
termin* en 1993. En la tabla 12.1 se presentan las observaciones obtenidas
en dicho estudio.
Tabla 12.1 Informacin nidal para la costruccn da una tabla d e superviven
cia c on b a s e en la observacin de 300 pacien tes c on diagnstico
d e cncer del cuello uterino
Ao de ingreso Ao Vivas
Muertes Prdidas Muertes
po r otra
causa
Vivas ai
terminar
e i estudio
1989
1969 60 21 4 1
1990 34
6 1 0
1991 27
4 0 1
1992
22 2 1 0
1993 19 1 0 0 18
1990
1990 67 23 3 2
1991 39 a 2 1
1992 26 3 1
c
1993 24 3 0 1 20
1991
1991
53 18 3 0
1992 32
5 1
0
1993 26 2 0 1 23
1992
1992 64 22 5 2
1993
35 7 2 1 .
25
1993
1993 56 19
2 1 34
Para interpretar la informacin es necesario considerar que la tabla
presenta la evolucin anual de las pacientes que fueron admitidas a3 estudio
como sujetos de observacin en cada uno de los cinco aos: durante 1989
ingresaron 60 pacientes con dignostico de cncer de cuello uterino de las
cuales se murieron 21 durante el mismo ao, se perdieron 4 porque se
ignora si sobreviven o han fallecido *debido a que se interrumpi el con
tacto por cambio de residencia o emigracin y 1 muri a causa de un
infarto del miocardio. As, de las pacientes que ingresaron al estudio en
196/ktodobgade fe favcitgAcfcfc-.
1989 quedaron 34 vivas al principio de 1990 e iniciaron su segundo perio
do de vida a partir del momento del diagnstico, tiempo durante el cual
murieron 6 y se perdi 1.
De esta forma se procede ao por ao hasta advertir que de las 60
pa r i m que entraron al estudio en 1989 slo diecinueve aportaron infor
macin en 1993, ao durante el cual muri una paciente de cncer de cue
llo uterino y, al momento dpi cierre del estudio, quedaban dieciocho
quienes con esteza se encontraban vivas. Debe advertirse que estas ltimas
no han sobrevivido los cinco aos completos sino que, por haber ingresado
al estudio en algn momento durante 1989, su supervivencia a partir del
HiagnAttim es de dico aos incompletos. De manera similar se interpreta
la informacin correspondiente a las pacientes que ingresaron al estudio en
cada uno de los cuatro aos siguientes a 1989.
Para efectos del tiempo de supervivencia, e independientemente del
ao en el que se admiten al estudio, todas las pacientes que
ingresaron durante cada uno de los cinco aos contribuyen con informacin
a lo que sucede en el primer ao de supervivencia a partir del momento
del diagnstico. Se tiene as un total de 300 pacientes que ingresaron
vivas al primer periodo 50 + 67 + 53 + 64 + 56).2 Del mismo modo,
se observa que durante el primer ao de seguimiento murieron 103 pa
cientes (21 + 23 + 18 + 22 + 19), se perdieron 17 ( 4 + 3 + 3 + 5 +
2), murieron por una causa distinta a la estudiada 6 pacientes ( 1 + 2 + 0
+ 2 + 1} y 34 pacientes que ingresaron durante 1993 y que continan
vivas al momento del cierre del estudio contribuyeron cada una con un
ao incompleto de supervivencia.
De manera similar se obtiene la informacin correspondiente a lo
que sucede durante el segundo periodo: ingresaron vivas a ste 140 pacien
tes (34 + 39 + 32 + 35), quienes eran las mismas que restaban de las 300
pacientes iniciales despus de descontar las muertes por cncer de cuello
uterino, las prdidas, las muertes por otra causa y las que permanecan
vivas al terminar el estudio pero que no alcanzaron a aportar un ao com
pleto al seguimiento. Durante el segundo periodo de observacin 26 pa
cientes murieron de cncer de cuello uterina (6 + 8 + 5 + 7), 6 se
perdieron del seguimiento ( + 2 + 1 + 2) y 2 murieron por otra causa
2 En ei ejemplo d u d o se estudio I t supervivencia en aftas, pero de manen m genere] el periodo
de supaviveoeis pxtien e w definido por cinkpier unidad de tiempo, sega lo odsqe Ib
BHuralesa dtl fenmeno estudiado.
Estudios de supervivencia / J 9 7
fi + + O + / ) ; durante 1992 ingresaron 25 pacientes las cuales conti
nuaron vivas al final del estudio y contribuyeron de una manera incompleta
a la supervivencia del segundo perodo.
Para obtener la informacin propia del tercero, cuarto y quinto pe
riodos a partir del momento del diagnstico se procede de igual forma y
se obtiene la informacin correspondiente a las cinco primeras columnas
de la tabla 12.2.a
Tabla 1 2 . 2 Tabla d e supervivencia correspondiente a la observacin d e 3 0 0
pacientes con cncer d e cuello uterino
Periodo Vivas Muer Pr Muer* Vivas Deno fl'Db- Proba Proba
a / i n tes didas 5 por a l r -
minador brlidad bilidad
bilidad
greso
ofre mfof efectivo d e morir sondh a cu m u
caUsa e le stu -
donada lada de
.
dio
d e super super-
vivencia vivenoa
x . lx dx ux x wx l'x
3* P* Sx
1
300 105 17 6 34 27?,S 0.379 0.621 0,621
2 140 26 6 2 25 123,S 0.211 0.789 0.490
3
81 9 1 2 23 68.0 0,132 0,866 0,425
4 46 5 1 1 20 35,0 0,143 0,857 0,364
5 19 1 0 0 18 10,0 0,100 0.900 0,328
Las restantes columnas de la tabla de supervivencia. r r qx, px, y $x
se obtienen de Ja manera siguiente:
l 'x: indica el denominador efectivo de la probabilidad de morir en
cada periodo. No todos los pacientes que figuran como vivos al principo
de cada ao lx estn expuestos al riesgo de morir durante el trascurso del
periodo por cuanto algunos de ellos se pierden u# otros mueren por una
causa distinta ix y otros slo aportan una observacin parcial wx: por tal
motivo, el denominador efectivo de la probabilidad de morir se obtiene u!
restar del total de sujetos vivos al inicio de cada periodo lx la mitad de la
suma de las prdidas u# las muertes por otra causa x y ios que terminan
vivos al final del estudio y que aportan informacin parcial wr Con esta
consideracin se puede suponer que cada paciente perteneciente a una de
3 s* utiliza la ootactfn coavendonak lomadi del iogJs: I: olive viven, d: deoihs muerte,
u: unknown desconocidos, 'jntocurraw concomtame*. w: wthdrawn sustrados.
98/M euM o$ie de kx brvemgaMu..
estas tres categoras contribuye a) denominador no con una unidad sino con
la mitad; de este modo, l'x = lz - M{ux + , + wr). Para el primer periodo,
por qemplo, l = 300 - 1/2(17 + 6 + 34) = 27.5.
9l; indica la probabilidad de morir en cada periodo y se obtiene al
dividir el nmero e muertes dx por el denominador efectivo / r As, en el
primer periodo t 103/271,5 = 0,379.
p muestra la probabilidad de sobrevivir a un determinado periodo
dado que se ba ingresado vivo al mismo y se conoce, por tanto, como la
probabilidad condicionada de supervivencia. Su valor se obtiene como el
complemento de la probabilidad de morir, o sea, px = 1 Qr
Segn el ejemplo ilustrado, una paciente con cncer de cuello ute
rino presenta una probabilidad estimada de sobrevivir al primer ao a
partir del diagnstico p , = 1 - 0,379 = 0,621 y una probabilidad de
sobrevivir al tercer afio dado que ha sobrevivido al segundo ao,
= 1 0,132 = 0,868.
Sx: muestra la probabilidad acumulada de supervivencia es decir, la
probabilidad que tiene una persona de sobrevivir un cierto numero de pe
riodos a partir del momento del diagnstico, la cual se obtiene como el
producto de las probabilidades condicionadas de supervivencia correspon
dientes a los periodos 1 hasta x, o sea el producto p x ... x px, que corres
ponde al producto de las fracciones sucesivas del nmero de personas que
sobreviven al terminar cada periodo. As, la probabilidad estimada que tie
ne una paciente de sobrevivir al tercer ao a partir del momento del diag
nstico de cncer de cuello uterino es Sj = 0,627 x 0,789 x 0,868 = 0.425,
o sea el 42,5%.
Una vez estimados los valores sucesivos de j, y de 5, se costruyen
con ellos, respectivamente, la funcin de peligro h(t) que expresa la pro
babilidad que tiene una persona de morir en determinado momento dado
que ha sobrevivido hasta entonces4 y la funcin de supervivencia S(t) que
indica la probabilidad de sobrevivir en el tiempo a partir del momento del
diagnstico. Las figuras 12.1 y 12.2 muestran tales funciones, estimadas de
acuerdo con los valores obtenidos en el ejemplo.
Sobre el grfico de la funcin estimada de supervivencia o curva de
supervivencia se ubican los cuartiles y, en particular, la mediana que indica
el momento a partir del cual sobreviven la mitad de las pacientes desde el
i A la funcin de peligro tambin te le cobo como f u r o <te la monalwtod.
Bmdhs de supervivencia / 9 9
A
Figura 12.1 Fundn d e peligro qu e estima el riesgo d e morir con b a s e e n la
observacin d e 3 0 0 pacientes con cncer d e cuello uterino
Figura 1 2 . 2 Fundn d e supervivencia que estima la supervivencia al diagnstico
d e cncer d e cuello uterino con base en la observacin d e 3 0 0 pa
cientes
momento del diagnstico. En general, la mediana del tiempo de supervi
vencia es una medida preferible a la media puesto que la distribucin del
tiempo de supervivencia en muchas situaciones es notablemente sesgada
hacia uno de los exiremos, tal como sucede en la supervivencia a un infarto
de miocardio que es menor en las primeras horas que siguen al evento.
Con el fin de calcular intervalos de JOOfJ - a)% de confianza para
los valores de Sx se recurre a la expresin usual Sx en la que 5,
denota la estimacin puntual de la supervivencia acumulada obtenida en
2 0 0 /MGaohgtfk te
cada periodo ZJmf/ el valer que toma la variable nonnal estndar Z en el
pCTcentl 1 - ct/2 y o el valor del error estndar de Sr Una estimacin de
este ltimo se obtiene as:
a 5 4- Qi
e 5* . d,
en donde la sumaioria cubre los valores comprendidos entre el pri
mer periodo y aqul de inters.5
De acuerdo con el ejemplo se tiene que el error estndar de Sx para
el tercer periodo se estima as:
0 4 5 5 f 0 , 3 7 9 + 0 , 2 1 1 - + 1 2 2 ] = O.OW7
_ 0,425 t 27J S_103 23 ,5-26 68,0-9
De este modo, los lmites de un intervalo de 90% de confianza para
la probabilidad acumulada de supervivencia en el tercer periodo S3 se ob
tienen al calcular la expresin:
0,425 1 6 4 (0 ,0 3 4 7 )
con la cual se tienen finalmente los valores 0,3681 y 0,4 19.
H mtodo aprovecha toda la informacin disponible con miras al
incremento de la precisin de las estimaciones de qx y de Sx incluso la de
aquellos pacientes que se pierden, se mueren por otras causas o tienen un
seguimiento incompleto. No obstante ser relativamente simple, la correcta
costiuccin de una tabla de supervivencia exige el cumplimiento de los
siguientes requisitos: , .
1. La supervivencia de los pacientes perdidos durante el seguimiento debe
ser igual a la de aquellos observados durante todo el tiempo del estudio lo
cual es difcil de garantizar porque, debido a la prdida en el seguimiento
Par, facilitar *u ccuk, a la prtfli. qulzta * * coowrtaw col,!iala Ubi.
de supervivencia t aj a el wabeurmcnlo / ^ - y <**n as el tool d U sumaiona al fin
de dicha colonutB.
Emdhs de Btp9mwtrviaj20
de los mismos, se desconoce su evolucin en el tiempo; adems dicha pr-
p puede estar asociada con un detenrnado resultlo como la muerte
Es importante entonces que la fraccin de prdidas se reduzca al mnimo
tanto que algunos autores sugieren qu no debe exceder del 10% del total
de pacientes incluidos en el estudio.
2. La supervivencia de los pacientes que ingresan al estudio en un momen
to relativamente prximo a su terminacin debe ser igual a la de aquellos
que ingresan en un momento prximo a su iniciacin, lo cual no se cumple
en aquellos casos en los cuales la supervivencia se modifica aprecia-
blemente durante el periodo de la realizacin del estudio como consecuen
cia de avances en el tratamiento o cambios en el nivel socioeconmico de
ios pacientes, entre otras causas,
3. Las estimaciones de Sx y de qx obtenidas a partir de un reducido nmero
de Pacientes estn sujetas, como es de esperar, a una variabilidad aleatoria
considerable, o sea a un elevado error estndar. Estimaciones obtenidas con
case en un numero de pacientes comprendido entre 10 y 50 se deben in-
teipretar con cautela y aquellas obtenidas a partir de un nmero inferior a
oiez se deben ignorar.
Mtodo de K a p l a n M e i e r
Cuando se cuenta con un reducido nmero de observaciones es aconsejable
T mlf r ,a lnforraactn de mio que se puedan obtener estimaciones
aun ms precisas que las logradas con el mtodo actuara) antes descrito
Con este propsito se presenta el mtodo de Kaplan Meier que. aunque
esencialmente udliza la misma estrategia del mtodo actuarial, permite es
tudiar la presentacin de fenmenos que suceden en periodos coitos y toma
la informacin de cada sujeto de observacin en vez de agruparla por pe-
nodos (Kaplan y Meier, 1958). m P ^
Se tiene as una serie de n observaciones acerca del tiempo de se-
Semiento a partir del diagnstico de cada uno de los n pacientes; cada una
corresponde a un paciente que puede morir o presenta un tiempo de segu-
cendente de acuerdo con el tiempo de observacin de tal modo que se
r m i * 1 estudio I . vi v .1
202/M enM ogto 4* Jo mtaigacin*..
pueda asignar el valor r a cada una de ellas segn el orden que le corres
ponda en la sene (r = , 2, 5,
Adems, si en la serie ordenada se denota por n el nmero de indi
viduos que se eocuentnm en riesgo de morir al principio de cada intervalo de
empo y se registre la cooddQ de censura de cada observacin d = 0 para
aquellas observaciones censuradas y J * i para las no censuradas se
dispone entonces la informacin de la manera siguiente:
H t2
ts ttt
ni n2
3 n&
di d2
d3 ...
da
De este modo, la probabilidad q de que ocurra una muerte en el
intervalo i en el cual al momento de su iniciacin hay sujetos en
riesgo de morir y se presenta una muerte si la observacin es no censurada
o no ocurre ninguna si es censurada se estima como d/n. As, la proba
bilidad de morir toma l valor JMt si la observacin es no censurada, o
toma el valor 0 si es censurada.
La probabilidad de sobrevivir al intervalo i, dado que se ha sobrevi
vido hasta el momento de su iniciacin, adopta entonces la forma i - /n
con lo cual se tiene que la probabilidad acumulada de supervivencia en el
momento t se puede calcular como el producto de las probabilidades con
dicionadas de supervivencia de la manera descrita para el mtodo aduanal:
S, = ()-d, M,) (1-dj /n2) ... ()-d \ ) = (1-d, f n)
En esta expresin, las observaciones censuradas no modifican el pro
ducto puesto que en tales casos d = 0 y el factor correspondiente asume
entonces el valor i.
Hasta el momento se ha supuesto que los tiempos de observacin
son diferentes, es decir, que no hay empates; cuando se presentan varios
tiempos de observacin iguales se procede como sigue:
1. Si el empate se presenta entre algunas observaciones censuradas y
otras no censuradas se asume que stas ocurren inmediatamente antes
que aqullas.
2. Si el empate ocurre entre observaciones no censuradas se puede con
siderar que las muertes que suceden en el mismo tiempo t se pre
sentan con una diferencia mnima en el tiempo, con lo cual cada una
Estutaefe supervtncia/203
de las observaciones contribuye a la funcin de supervivencia con el factor
. -/.correspondiente; no obstan, como estimacin de la superviven
cia acumulada S, se suele lomar la menor de tas estimaciones resultantes
para el mismo tiempo t como criterio conservador.
3. Si el empate se presenta entre observaciones censuradas, no existe difi
cultad para el clculo de la funcin de supervivencia puesto que para ellas
la fraccin d/n adopt una valor igual a 0 y, consecuentemente, el respec-
factor en la funcin de supervivencia toma el valor L
Se tiene as que para las situaciones en las cuales se presentan em
pates se puede incluir un trmino 5 con valor 1 si la observacin corres
pondiente al tiempo i es no censurada y con valor 0 si es censurada. De
esta manera se tiene en forma general que:
v = n ^ - W '
Con el fin de calcular un intervalo de 100(1 . a)% de confianza C
para el valor de la probabilidad acumulada de supervivencia S, se puede
utilizar la distribucin normal que. de manera aproximada, presentan las
estimaciones del logaritmo natural de S, con una varianza estimada igual a
que- ' l>1 (Mllier y coalradores. 1981). De este modo, se tiene
/C*m = l n S,
= ln S, Z , ^ V{I d, /nfn d,)])
con lo cual se pueden obtener los lmites del intervalo de confianza
para la probabilidad acumulada de supervivencia S. al exponendar los va
lores resultantes de calcular tal expresin.
El ejemplo hipottico propuesto a continuacin ilustra la aplicacin del
mtodo de Kaplan Meter para estimar la funcin de supervivencia propia de
unaMnittpma congnia con base en observaciones correspondientes a la
moralidad observada en 10 nios a partir del nacimiento. De ellos, 2 mueren
por otra causa a los 6 y a los 15 meses observaciones censuradas y los
restantes mueren como consecuencia de la cardiopata en un lapso compren
dido entre los 2 y los 34 meses observaciones no ceiwirHflS
204/M*lDdQk>gQdelavn*stigoct-
La informacin obtenida se presenta en la tabla 12.3, junto con la
probabilidad de morir q, la probabilidad condicionada de sobrevivir p y la
probabilidad acumulada de supervivencia S.
Tabla 12.3 Informacin para ka estimacin de la supervivencia por el mtodo
de Kaplan Meter con base en la sobrevida de die2 nios con car
diopatia congnita, a partir de su nadmiento
ti m *ii q> A
S
\
0
10
1.000
2 10 1 v i o 9/10 0,900
5 9
1 1/9 8/9 0,800
6* 0
9 7 1 1/7
6/7 0,686
11 6 1 1/6 5/6 0,571
15* 0
16 4 1 1/4 3/4
0,429
20 3
1 1/3
2/3 0,286
27 2 1 1/2
1/2
0,143
34 1 1 1 0 0,000
Con los valores estimados para S se obtiene entonces la funcin de
supervivencia estimada que se presenta en la figura 12.3.
Figura 123 Funcin de supervivencia que estima la supervivencia al momento
del diagnostico de una cardiopatia congnita con base en la ob
servacin de diez neonatos
206/Metodiogia de ia knmtiiocln...
misma hiptesis nula, la varianza del nmero de defuirones p r a s del
ampo / en el estrato i se obtiene como
Finalmente, la prueba de significacin se t o a 60 obtiene
la variable chi cuadrado a partir de la infonnaan parcial que se obtiene
en
en los k estratos:
X2; =
[Obs A - Esp A f f g p b s a - a f
Var A Var A '
k k
Jg**9 W ?
2f*fliPdni - mV (" 1)*?
Dicho procedimiento se conoce como prueba de Mantel Haenszel
{Mantel y Haenszel, 1959) y su aplicacin se ilustra con el sigwent
probar la hiptesis de que un cierto tratamiento
la leucemia en nios T2 es mejor que otro M e n t T se
la supervivencia a partir del momento del diagnstico de dos grupos'm
^ el primero uno de los mitos m u n p o r o t ^
los 50 meses a partir del d i a g n s t i c o e = do grupo, el
estado de uno de ellos se desconoci a partir de los 77. es^
La informacin correspondiente a la n p e m w a c u de tos moob
servados y aqulla necesaria para la prueba de hipjMW por me.o de la
prueba de Mantel Haenszel se presenta en la tabla 12.5.
Entonces se tiene as que:
f o b s a, - e s p a f f i f i , ~
' Var A
^ (9 7,029f _ q qj p > Qj s f prueba de una cola,
~ 3,919 ~ 9
resultado que no permite confirmar la hiptesis de la superioridad
del segundo tratamiento frente al primero.
2 0 8 /y ^ o b g lo de le m/e*tacin~.
F.tnrfii moltvariados: el modelo de Cor
Algunas investigaciones tienen como objetivo estudiar el efecto de mlti
ples variables sobre la supervivencia o el pronstico de ciertos grupos de
En 1972 Cox propuso un modelo mnltivariado para estudiar la
supervivencia, r n t ocidn tambin como el modelo de riesgos proporciona
les, el cual es ampliamente utili^adn en estudios epidemolgicos de este
tipo (Cox, 1972).
El modelo define la funcin peligro que muestra el nesgo instant
neo de falla muerte, recurrencia, reactivacin u ono evento similar de
una persona i en el tiempo [hit)} como el producto de la funcin de peli
gro de una persona de la poblacin general fhj(t)] por una funcin expo
nencial del tipo:
M j + ~ + W
H presenta entonces la funcin de peligro del individuo i de
la forma
H t ) ppe, * ... PpX,
- T* e
ht)
la cual expresa los riesgos correspondientes a diferentes variables X
como igualmente proporcional a hrft).
De esta manera, es evidente que el riesgo propio de una persona es
una funcin exponencial de los valores que ella presenta en las variables
Xt o variables explicativas, que pueden 9er factores de riesgo, variables de
confusin o interacciones entre factores como la edad, el sexo, el estrato
socioeconmico, el nmero de infartos previos o el nmero de lesiones
precancerosas.
Dicho modelo permite expresar el riesgo relativo de una persona
i que presenta determinados valores en las variables explicativas X co
mo:
h/t) li/Xjj + 2 + +
expresin que permite apreciar que d riesgo relativo de una persona
i con una exposicin nula 0 para todas las variables X es 1, puesto que en
EstodC9 de tvptrvrvencia/209
tal caso RR tyr>V*> resultado que seala la conveniencia de
este modelo para estimar el riesgo relativo.
En trminos de logaritmos se ciee que:
I n R R ^ l n [hftVhJt)) * ^ X ti + + ... + p ^
de tal forma que la estimacin del riesgo relativo correspondiente
a diferentes variables de exposicin X con base en un conjunto de ob
servaciones se reduce a estimar los coeficientes de regresin P de una
funcin lineal, lo cual se suele hacer por el mtodo conocido como de
mxima verosimilitud que se describe en algunos textos de estadstica
(Armitage, 1971; Freund, 1971) y para Jo cual se requiere el uso de un
computador.
A manera de ilustracin, supngase que se quiere estudiar el efec
to de dos tratamientos Xf :J, 0 y de la edad X2:aos en la supervivencia
con un control del efecto del estrato socioeconmico X3:l,0 con base en
un conjunto de observaciones realizadas en un grupo de pacientes que,
de modo aleatorio, se asignaron a dos grupos de tratamiento: medica
mento 1 y placebo 0.
En tal caso, el riesgo relativo con respecto a la poblacin general de
una persona que recibe el medicamento, con 50 aos de edad y que perte
nece a cualquier estrato socioeconmico es:
Py> - h <*> . m + m s o ) +
h t) ~
De modo similar, el riesgo relativo de una persona que recibe el
placebo, con 20 afios de edad y que pertenece a cualquier estrato socio
econmico es:
r r _ + y x + M
~ Kit) ~ e
El riesgo relativo de la primera persona con respecto a la gmHfl es,
entonces, la razn resultante de los dos riesgos relativos as imhiH 0 sea:
A , PiW + M#
RR - ------------------------------
P/OJ +
210/Mmodoiogta d a wtesrifoein...
lo cual indica que, en igualdad de condiciones con respecto al estrato
socioeconmico, el riesgo relativo del primer individuo frente al segundo
es igual a:
f , t( i - 0 ! + p ( 5 0 - 2 0 ) _ P 3 0 )
. * *
Este ltimo resultado permite apreciar que el modelo de Cox supone
que los riesgos relativos correspondientes a exposiciones mltiples resultan
de la multiplicacin de los riesgos relativos individuales:
p , ( 1 - 0 ) . f y ( 5 0 - 2 0 )
RRXI = e ' ; RRja = e
RRxl!a=l e 1 1 l = e
En la interpretacin de este resultado se debe considerar que el
coeficiente de una variable de tipo continuo cono la edad, indica la
variacin en el riesgo relativo correspondiente a una unidad de cambio en
la variable, por ejemplo un ao.
Como ilustracin, considrense los siguientes resultados obtenidos
en un estudio de la asociacin entre algunas variables y la mortalidad ob
servada con posterioridad al diagnstico de cncer de endometrio, realizado
por Schwartzbaum y colaboradores (1987) y citado por Kahn y Sempos
(1989) (Vase tabla 12.6).
De acuario con tales hallazgos, el uso de estrgenos es un factor pro
tector puesto que RR * e'7182 = 0,4876, el riesgo relativo de una paciente
de 65 aos con respecto a otra de 55 aos se estima como e0on6(65'55i =
1,3854 y de una paciente con cncer grado m con respecto a otra con
cncer grado 1 como e0,7059 - 2,0257.
De la misma forma, el riesgo relativo de una pacien de 65 aos y
con cncer grado l con respecto a otra de 55 aos y con cncer grado 1,
ajustado por las dems variables, se estima como:
^ ^ ^ + M-O)
0 , 0 3 2 6 ( 1 0 ) + 0 , 7 0 5 9
= e
Est9btdtstper>HwfKt/2
Tabla 12.6 Resultados de ur> estudio multivariado acerca de la supervivencia
de un grupo de pedentes con cncer de endometrio
Variable
P Cdigos
Uso de estrnenos
*0,7182
1 si; 0 no
Edad
0,0326
aos
Cncer grado II
0.617B*
\ - s; 0 no
Cncer grado III
0,7059*
1 s; 0 - n
Con respecto a cncer grado I.
Fuente: Kahn HA. Sempos CT. Statistical Methods in Epidemiology. New York, Oxford
University Press. 1989. p. 197.
Este mismo resultado se obtiene al multiplicar los dos riesgos rela
tivos estimados individualmente,
. v
R , x R 1 = 1,3854 x 2,0257 = 2,81
lo cual refleja el supuesto implcito en el modelo de Cox ya mencio
nado, segiin el cual los riesgos relativos correspondientes al efecto de ml
tiples variables se obtienen como el producto de los riesgos relativos
individuales o modelo multiplicativo.
Otras aplicaciones ms particulares del modelo de Cox junto con
otros modelos multivariados para el estudio de la supervivencia pueden
encontrarse en obras especializadas, tales como las de Annitage y Gehan
(1974), Bukley (1979), Cox y Oakes (1984), Kalbfleisch y Prentice (1980),
Lee (1980) y Miller y colaboradores (1981).
Aos de vida potencialmente perdidos
Una medida complementaria de las tasas de mortalidad que muestran el
riesgo de morir y de algn modo relacionada con la esperanza de vida
es la que indica el nmero de aos de vida potencialmente perdidos en una
poblacin como consecuencia de las defunciones ocurridas por
causas.
La medicin de la moralidad en trminos de aos de vida potencial-
mente perdidos fue propuesta inicialmente por Dubiin y Lotka en 1936 y
posteriormente utilizada por Dempsey en un andida de la mortalidad por
2 2 2 /Hetodotogia de a
uiberculosis en 1947. En el himo decenio ha recibido particular aleacin
par cuanto ella permite establecer el impacto que tienen las distintas causas
de muerte sobre la poblacin y evaluar, as, el efecto de las acciones en
salud que tienden a disminuir la mortalidad por diferentes causas (Romeder
y McWhinnie, 1977; Cava20S y colaboradores, 1989; Gardner y Sanbom,
1990; Wigle y colaboradores 1990).
Aunque existen varios mtodos para calcular el nmero de aos de
vida potencialmente podidos, todos ellos tienen como base comn la edad
a la cual ocurre la muerte y el nmero de ellas en una edad determinada
(Gardner y Sanbonu 1990). Uno de los mtodos ms utilizados para cal
cular aquellos en una poblacin por una determinada causa consiste en su
mar los aos perdidos por todas las personas fallecidas con respecto al
promedio de vida de la poblacin o esperanza de vida al nacer.
As, si una persona muere debido a una enfermedad infecciosa a los
5 aos cuando la esperanza de vida de la poblacin es de 65 aos, ella
habr perdido 60 aos potenciales de vida por tal causa* El total acumulado
de aos para trnla* las personas que mueren por determinada causa se ob
tiene al sumar los datos individuales y el promedio, al dividir dicho total
por el nmero de personas de la poblacin.
De este modo, el nmero total de aos de vida potencialmente per
didos AVPP en una poblacin por determinada causa de muerte se obtiene
al calcular la expresin:
AVPP * - x,)
w
en donde P ctenota la esperanza de vida de la poblacin al momento
de nacer, la edad a la que ocurre cada muerte y la sumatoria se obtiene
para todas las muertes presentadas por tal causa.
Cuando las muertes han sido agrupadas en k intervalos de edad con
n muertes ocurridas en cada uno y con valores centrales x%el total de aos
de vida potencialmente perdidos se obtiene entonces como:
AVPP = 2 - x)
La utilidad de esta medida se puede apreciar en la tabla 12.7, la cual
presenta los resultados de un estudio de la mortalidad observada en el Dis
trito Federal de Mxico en 1985 por lesiones accidentales e intencionales
- Estadios d t fpervrvene/2}3
Tabla 12.7 ^ d e v i d a p o t e n d a l m e n t e perdidos AVPP por las drico pri^dpa-
ral % 8 5 y P r 9nJP d6 edad" Mxko' CH'stri, Fede-
ftta
ckKutatorio
Mutrtss AVPP
Muerte* AVPP
turfes AVPP
McwtH: <4VA
digestivo
Muertes AVPP
0
1 4
95
6128 78
5031
20
1290
348 86946
99
6386
17
1054
140
8660
45 2790
324
20088
18 1116
5 a 14
40
2200 214
11770
122 6710
137 7535
34
1870
15 a 24
100
4500
. 908
40860 147
6815
121
. 5445 75 3375
25 a 34
203
7105 749
26215
196
6860 195
6825
376
13160
35 a 44
373
9325
512
12800
333 8325
219
5475
792 19800
4S a 54
773
11595
370
5550 627
9405
356
5340 1055
15825
55 a 64
1420 7100
325
1625
1096 5480
548
2740 1088
5440
f oaf
_ ^
3021 .
49007
3296 112531
2586 47475
3248
140394 3537 66977
f est x JO5
30,21
32,96
25.86
32,84
35.37
paron en o s de edad ms
acer de 65 anos y se * m la poblacin en diez millones de habitantes.
S r r ' f 2 ' * * i - ** ' * m,-
P?r enfnnedades infecciosas es similar a las de otras causas el
mayor nmero de aos de vida potendalmente perdidos se debe a ellas v
S S S S 5131 d * * PCrdd S * * las t a d o o debi-
t a d o s l d e T a m a t o r i o y a los tumores. Este resul-
t PanC 81 eleVad nmCT0 d e ^ o n e s por dicha
T S i r ^ 3dferend11* 135men
AsTIl m y r P ^ ^ 0"- ades ms avanzadas.
f o l i e s Lfr , ^ ^ Ptenci^ t e Perdidos :
fermedades mfecc.osas se debe a las defunciones ocunidaTeo menores de
Z T i ^tqSLpTcmaje60Ia Pr o
V 2 % - Sl 56 aiende * >> de la mortalidad en trminos de aos
214/Metcdoiogfo ck b investigacin..'
de vida perdidos en vez del nmero de muertes ocurridas, los resultados
sealan al grupo de enfermedades infecciosas como una prioridad para los
programas de prevencin.
Cuando se realizan comparaciones entre diversas poblaciones con
base en esta medida se debe considerar que el lmite mximo de edad o
esperanza de vida de las poblaciones comparadas debe ser igual; por otra
parte, las comparaciones realizadas entre poblaciones con un nmero de
habitantes diferente se deben realizar sobre indicadores relativos tales como
el promedio de aos de vida perdidos por habitante o por cada cien mil.
Aos de vida saludable perdidos
Desde h?1*** algunos aos se han propuesto indicadores que dan a conocer
los afios de vida saludable perdidos no slo por la mortalidad prematura,
sino tambin por la discapacidad (Sullivan, 1966, 1981); la primera aplica
cin de estos ndices en una poblacin se realiz en Ghana en 1981 (Ghana
Health Assessment Proyect Team) pero slo en los ltimos tres aos el
Banco Mundial ha aplicado tal indicador para medir la carga de U enfer
medad en las diferentes regiones del mundo (Banco Mundial, 1993).
Murray (1994) y Murray y Lpez (1994) presentan una descripcin
/Hilaria de la metodologa que consiste, en esencia, en el clculo de los
aos de vida saludable AVISA perdidos por mortalidad prematura y por
discapacidad. Los primeros se obtienen al calcular los aos de vida poten
cialmente perdidos de acuerdo con la esperanza de vida para cada edad
segn una tabla de vida nica y los aos de vida saludable perdidos por
se obtienen al ponderar los afios durante los cuales las perso
nas permanecen enfermas por la severidad de la enfermedad; tanto stos
como aquellos se ajustan por el valor relativo de la edad en la cual se
presenta el evento con un peso mayor para los eventos ocurridos alrede
dor de los 25 afios y por una tasa de actualizacin predefinida que re
fleja la preferencia social por los beneficios en el presente. Se anticipa que
esta ha de ser un istrumento importante para la evaluacin de la
carga que imponen sobre una regin las diferentes causas de mortalidad y
de morbilidad, para el establecimiento de polticas de prevencin y de
atencin en salud y para la asignacin de recursos.
Referencias bibliogrficas
t . Aimltage P. Siatistical Methods n Medical Resierch. Landon, Blickwell Scientific
Publications, 3971.
Estudios de atperrtveacia/ 2 J 5
2. Annilage P, Gehui EA. Statistical methods fwttektertificaiion and use o f prognostic fee-
tors. International Journal o f Cancer, 1974; (13): 16-36.
3- Banco Mundial, Informe obre e l Desarrollo Mundial 1993: Invenir en Salud. Banco
Mundial. Washington, D.C., 1993.
4. B a t a M J , Gage RP. Calculation o f survival rates for cancer. Proceedings o f the Staff
Meetings o f the Mayo Clinic. 1950; (25): 270-286.
5. Buckley J, James I, Linear regression with censored data. Biometrika. 1979; (66): 429-436.
6. CftvaaosN, del Rfo A. Izazola JA ct t i ARosde vida potenafamiue perdidos: su utiUdad en d
anhas de la mortalidad en Mxico. SaludPtbtcade Mxico. 1989;<3]): 6)0-624.
7. Cox DR. Tho analysis of exponentially distributed life-times with two types of failures
Journal o f de Royat Statistical Society, Series B. 1959; {21): 411-421.
8. Cox DR. Some applications of exponentially ordered scores. Journal o f the R o w l Statisti
c a l Society, Series B. 1964; (26): 103-110.
9' >"d We Jm rn al 'he * * * Siatisticat Sociery, S erin
*s, i v11, (34): 187-202.
10. Cox DR. Oakes D. Analysis o f Survive! Data. New York, Cnpman and Hall. Co.. 1984.
11. Cotier SJ. Ederer F. Maximum utilization o f the life labie method in dualizing survival
Journal o f Chronic Diseases. 1958; {8): 699-712.
12. Dempsey Decline in tuberculosis: the death rate fails to lell the entire story. America*
Review o f Tuberculosis. 1947; (86): 2.
13. Dublin LI, Lotka AJ. length o f Life. New York, Roonld Press, 1936.
14. ElvebackU Estimation o f survivorship in chronic disease: the actuarial method. Journal
of the American Statistical Association, 1958; (53): 420-440.
J5. Reiss JL. Statistical Methods f o r Rates and Proportions. 2nd ed. New Yort., John Wiley
ana Sons. (981.* 9
16. Freund JE. Mathematical Statistics. 2nd ed. London. Prentice Hall 1971
1?G*r,S 3L Yti!% f p e m M m l0SI- does? Epldemio-
/< l i j . Ja*329.
18. Oehan EA. A generalized Wilcoxon test for comparing arbitrarily singlv-cejisored
samples. Biometrika. 1965: (52): 203-223.
19. Gehan EA. Estimating survival functions from the life table. Journal o f Chronic Dis
eases. 1969; (21): 629-644.
20. Ghana Heal* Assessment Project Team. A jmntitative method o f asscsing the health im
p e l o f different diseases in less developed countries. Inltmatimtal Journal o f
Epidemiology. 1981; (10): 73-80. J
21 G' u n e r i ^ ( 198<?W Q " MedI E ^ m i o i o g i a . Mxico. Addison-Wesley Ibero-
22. HljarlVIC M a r i d a d por lesiones accidentales e intencionales en el Distrito Federal de
jy7 * 1986. Salud Publico de Mxico. 1990; (32): 395-404.
^ K^ * P r e j 3 ^ CT' M rth o i* Epidemiology. New Yori, Oxford Univer.
2)6/MeUMog(a e ta imxstigatin-.
24. Kalbfleisch JD, Prentice RL. The Statistical Analysis o f F ailu rt-T m e Dam. New York,
John Wiley and Sons, 1980.
25. Kaplan EL, Meier P. Non-panmetric estimation from incomplete observations. Journal o f
the American Statistical Association. 1958; (53): 457481.
26. Lee ET. Statistical Methods f o r Survival Dota Analysis. Belmont, California, Lifetime
Learning Publications, 1980.
27. Mantel N. Evaluation o f survival data and two new rank o r i e t statistics ansing in its con
siderations. Cancer CHemoterapy Report*. 1966; (50): 163-170.
28. Mantel N, Haenszel W. Statistical aspects o f the analysis o f data from retrospective
studies o f diseat t . Journal o f the National Cancer Institute. 1959; (21)'. 719-748.
29. Murray C. Quantifying the bunfen o f disease: the technical basis for disability adjusted
life years. Bulletin o f the World Health Organization. 1994; (72); 429-445. .
30. Murray C, Lopez A. Quantifying disability: data, methods, and results. Bulletin c f the
World Health Organization. 1994; (72): 481-494.
31. Milter RG, Gong G. MuflozA. Survival Analysis. New York, John Wiley and Sons, 1981.
32. Peto R, Peto J. Asymptotically efficient rank invariant procedures. Journal o f the Royal
Statistical Society. Scries A. 1972; (135): 185*207.
33. Romeder JM, McWhinnie JR. Potential years o f life lost between ages \ and 70: an in
dicator o f premature mortality for health planning. International Journal o f epidemics
logy. 1977; (6): 143-151.
34. Schwartbaum )A, Hulka BS, Fowler WC et al. The influence of exogenons e s t r o g a use
oo survival after diagnosis o f endometrial cancer. American Journal o f Epidemiology.
1987: (126): 851'859.
35. Wigle DT, Mao Y, Semenciw R et at. Premature deaths in Canada: impact, trends and op
portunities o f prevention. Canadian Journal c f Public Health. 1990; (81): 376-381.
38 Sullivan DF. Conceptual problems in developing an index o f health. US Public Health
Service, Publication Series No. 1000. Vital and Health Statistics Series 2, No. 17. Na
tional Center for Health Statistics, 1966.
37. Sullivan DF. A single index o f mortality and morbidity Health Reports. 1971; (86):
347*354.
Tamao de la muestra
13
Este captulo presenta, en una primera parte, los procedimientos que
penmten calcular el tamao muestra! para aquellos estudios epidemio
lgicos de carcter descriptivo en ios que se desea estimar una propor
cin o un promedio poblacional y. en una segunda parte, los
procedimientos utilizados para calcular el tamao muestral para los es
tudios analticos que estiman la asociacin existente entre una exposi
cin y un efecto; luego se discuten las implicaciones que sobre la
determinacin del tamao muestra] tienen ios diferentes condiciona
mientos y se ilustran las diversas situaciones con ejemplos.
Determinacin del tamao muestral en los estudios
descriptivos
n los estudios epidemiolgicos de tipo descriptivo el investigador desea
tomar una muestra aleatoria que produzca una estimacin con un valor
218/Mto&togtaelaimatiaaeldiu.
aproximado a] parmetro que caracteriza a la poblacin de inters;1 oo obs
tante una aproximacin que puede, ser razonable para determinado prop
sito puede no serio para otro o la que puede ser razonable para un
investigador puede no satisfacer a otro. Por ejemplo, con el propsito de
proponer un plan general de salud para una regin, puede parecer suficien
te estimar la proporcin de preval enca de malaria con un error mximo
tolerable del 5% alrededor del verdadero valor, sin embargo con el prop
sito de calcular los servicios de atencin mdica que en la misma regin
se deben dedicar a la atencin de este problema puede ser necesario que
tal estimacin sea ms precisa y que, como mximo se pueda tolerar un
error del 2% en la estimacin muestral obtenida. Para satisfacer las condi
ciones ms exigentes de la segunda situacin el tamao de la muestra debe
ser mayor.
Esta argumentacin implica que el investigador debe tener una
idea previa de la precisin deseada en la estimacin en trminos del
error mximo tolerable t yo sea de la diferencia mxima admisible entre el
parmetro estimado y la estimacin obtenida en la muestra, diferencia que
se debe al azar; adems deben considerarse otros elementos como son:
1. La variabilidad de la variable observada, que a su vez determina la
dispersin de los resultados mustrales alrededor del parmetro de inters
y que se mide por la varianza. Esta es una caracterstica propia de la va
riable y se acepta como condicin.
2. La confianza que el investigador desea tener en los resultados que ha de
obtener.
Para lograr un determinado grado de precisin en la estimacin sobre
una variable que presenta una diversidad de valores se debe tomar una
muestra ms numerosa que aqulla que se requiere para hacer una estima
cin acerca de una variable con valores muy homgeneos. Por ejemplo, si
todos los individuos de una comunidad tienen el mismo valor en la con
centracin de hemoglobina, con el fin de estimar el promedio de tal varia
ble basta con tomar al azar una sola persona; pero si los valores en la
concentracin de hemoglobina son muy hetrogeneos para hacer tal esti
macin con cierta precisin se requiere una muestra ms numerosa.
I En tos ludios descriptivos, a diferencia de k esffidkw analticos, no ib prueba una hiptoeis de
notAi se la ta * describir le nagnfaid coa le t u l ee peseme as enfermedad o u i factor
Tamao datanuuma/219
No obstante, puesto que en la mayora de las situaciones se desconoce
el val de la varianza de la variable estudiada, el investgate debe tnprru
con base en infamaciones adicionales cano encuestas realizadas en poblacio
nes similares; en ausencia de stas debe hacer varios fiemos Hpntfticoa y
decidir entre las distintas alternativas la que mejor.
El segundo de los elementos mencionados est relacionado con la
confianza que el investigador desea depositar en la estimacin lograda con
respecto a lo cual es claro que, si l, para una precisin deseada y bajo
cierta varianza de la variable conocida o supuesta, desea tener una gran
confianza en que la estimacin lograda sea cierta debe tomar una muestra
relativamente numerosa. En trminos estadsticos, la confianza que se de
posita en una estimacin est relacionada con la amplitud del intervalo ob
tenido para ella, es decir con la precisin de que goza; por ejemplo un
investigador puede tener una alta confianza en que el valor que trata de
estimar est contenido en un cierto intervalo si se es muy amplio o im
preciso, pero tendr menos confianza en que ste contenga la medida que
se trata de estimar si el intervalo es pequeo o ms preciso.
De esta manera, los intervalos amplios, aunque suelen ser de alta
confianza, son muy imprecisos porque indican que el valor de la medida
que se trata de estimar se encuentra entre dos lmites muy distantes, mien
tras que los intervalos estrechos son ms precisos pero la confianza de que
la medida que se trata de estimar se encuentre en ellos es menor; o sea que
para lograr una mayor precisin en la estimacin el investigador debe sa
crificar confianza. Por ejemplo, con determinado tamao muestral se puede
obtener un intervalo con unos lmites de 12 y 25%, en el cual el investi
gador puede afirmar con un 99% de confianza que se encuentra la preva-
lencia de hipertensin propia de cierta poblacin; pero si se calcula un
intervalo del 80% de confianza con lmites del 15 y del 22%, se obtiene
asf un intervalo ms preciso aunque se tiene menos confianza en que con
tenga el valor de la prevalencia de hipertensin de la poblacin de nteres.
La confianza deseada la define el investigador, con lo cual se deter
minan implcitamente los valores y Zl<a que limitan el intervalo de
la distribucin normal en el cual se producen el 100(1 - a)% de las esti
maciones mustrales que se obtienen por azar.2 De lo dicho hasta aqu se
2 Sef f i . l> adBica- > MHmaeionM m u eu n J de m u proporrio o de un promedio
" M 1 a * I * grandes, - c o m o regla general: n > 3 0 -
88 nbayen aproximadamente de acoento coa ana stbucio nonml
2 2 0 /Metodologa de la mvestgecin...
deduce que cuando se trata de hacer una estimacin, un tamao muestral
suficiente es aquel necesario para lograr una precisin y una confianza de
finidas por l investigador, con una varianza que es caracterstica de la
variable tratada.
Las relaciones existentes entre la precisin y la confianza deseadas
por el investigador, la variabilidad propia de la variable y el tamao mus-
tral requerido en tales condiciones se expresan por medio de relaciones
matemticas que permiten, por ejemplo, calcular el tamao muestra] sufi
ciente dados determinados requerimientos de precisin y de confianza por
paite del investigador y con una determinada varianza, supuesta o conoci
da, tal como se expone a continuacin.
Proporciones
Cuando se trata de calcular el tamao muestra! n suficiente para estimar
una caracterstica que se presenta en una poblacin de tamao N con una
proporcin t por medio de un intervalo de 100(1 - ct)% de confianza, con
un mximo error tolerable e y con una proporcin aproximada o supuesta
p, se utiliza la frmula:
( N - D + Z ^ p O - p)
Puesto que el valor de n se desconoce, el valor de p suele tomarse
de una informacin ya conocida, tal como la aportada por estudios re*
lacionados con el tema o por encuestas piloto hecbas con este propsito;
en ausencia de ella es aconsejable sustituir e] valor de p por 0,50 valor
que, segn determinados valores de W, y da lugar al mayor
tamao muestral requerido para la estimacin de n. Cuando se trata de
poblaciones infinitas3 la frmula antes citada se puede aproximar a la
expresin;
n . ^ p d - p )
Aqulla en l*s que la bcJiain de un elemento en le RUKKn prcticamente no alten el mareo
mueva} restante; lai poblaciones oumerasas m puedes considerar por Lanu> como poblaciones
infinita*.
Tomate d* la tmussm 122 J
Por ejemplo, los tamaos mustrales requeridos para estimar una
proporcin en una poblacin de 20.000 sujetos segn la primera expresin,
con una confianza del 95%, p - 0,50 y errores mximos tolerables de! 10,
5 y 2% seran respectivamente de 96, 380 y 2262 unidades; al utilizar la
segunda expresin, se obtienen tamaos mustrales de 96, 384 y 2401 uni
dades, valores similares a los calculados con la primera.
Si la expresin indicada para el clculo del tamao maestral en una
poblacin infinita se utiliza para calcular los tamaos mustrales requeridos
bajo una confianza del 95% segn diferentes valores del mximo error to
lerable y p se obtienen los resultados de la tabla 13.1.
Tabla 13.1 Tamao muestral requerido para estimar una proporcin poblado*
nal c o n el 95% d e confianza con diferentes valores para la propor
cin asumida p y del mximo error tolerable
p
OJO
Mximo error toferabe
0,05 0,02
0,5 96
364 2400
0,6 o 0,4 92
368 2300
0,7 o 0,3 81
324 2025
0,8 o 0,2 62
244 1525
Fuente: Mueller j , Schuesser K, Costne r H. Statistical fteasonmg in Sociology. Boston
Ho u g h t o n Miffim Co., 197?. p. 391.
En dicha tabla se advierte cmo aumenta el tamao muestral a me
dida que se quiere obtener una estimacin ms precisa dado un determina
do valor de p, o sea para una determinada varianza, o a medida que el valor
de p se aproxima a 0,5 dado un determinado error mximo permisible.
Por ejemplo, un investigador est interesado en estimar la proporcin
de hipertensos existentes en una poblacin de 2000 empleados de una em
presa con una confianza del 95% y con un mximo error tolerable del 4%;
por encuestas previas se sabe que cerca del 18% de la poblacin adulta de
la regin es hipertensa. El tamao muestral necesario para satisfacer tales
especificaciones se obtiene al calcular la expresin que se debe utilizar en
e! caso de poblaciones finitas:
n = N P O P)
<N- D + Z ^ p f l . p)
2 2 2 /Metodologa de ia mwpeddn...
2000(1,96f(0,I8)(0,82)
*" (0.04f(1999) + (l,96f(0,18)(0,82) ~
con lo cual se obtiene que, para satisfacer las exigencias impuestas
por el investigador, se deben seleccionar aleatoriamente 302 empleados.
Promedias
Cuando el investigador desea estimar el promedio de una variable que tiene
una desviacin estndar o en una poblacin de tamao N, con una confian
za de 100(1 - a)%, y con un eftor mximo tolerable e, el tamao muestral
se obtiene al calcular la expresin:
V i N - D + f f M *
En la mayora de las situadooes el valor de o se desconoce y el
investigador debe recurrir a estimaciones hechas en estudios previos o en
un pequeo estudio piloto realizado con el fin de estimar su valor, de tal
modo que se pueda determinar el tamao muestral requerido. Por ejemplo,
un investigador desea estimar el promedio de la presin arterial diastlica
de los 500 trabajadores de una empresa y quiere obtener un resultado con
una confianza del 95% y que como mximo, se desve del verdadero valor
en 2 xnmHg; en estudios anteriores se haba encontrado una desviacin
estndar de 8 mmHg. Se calcul entonces el tamao muestral requerido
para satisfacer tales exigencias al aplicar la frmula:
o2 500(1,96^(8? _ c, p
" - 1) + Z2;* C* ~ 22(500 - 1) 4 f J , W W ~ '
con lo cual se determina que para que los resultados gocen de las
especificaciones deseadas por el investigador se debe tomar entonces una
muestra aleatoria de 55 empleados.
Observaciones
En la prctica epidemiolgica sucede con frecuencia que el investigador no
est libre de tomar una muestra tan grande como quisiera para satisfacer
sus exigencias y se debe contentar con un limitado nmero de sujetos,
por ejemplo 37 casos de infarto del miocardio que se encuentran al re*
visar las historias clnicas de una istitucin, situacin en la cual dicho
Tamao de la muestra/2%3
tamao determina la precisin de ios resultados obtenidos, de tal forma que
si es elevado estos son bastante precisos y, consecuentemente, el intervalo
de confianza obtenido para el parmetro poblaciooal ser pequeo; por el
contrario si es reducido los resultados sern imprecisos y el mteivalo de
confianza para dicho parmetro ser relativamente amplio. En este cipo
de situaciones es el tamao muestra! el que determina la precisin lo
grada.
Por ejemplo, un investigador desea estimar con un 90% de confianza
la proporcin de mujeres que han usado escgenos entre aqullas que tie-
nen cncer de endometno pero slo cuenta con 47 pacientes con dicho
diagnstico, en las cuales encuentra 16 que han utilizado estigenos, es
decir, una proporcin p = 0,34. De acuerdo con la teora estadstica, un
intervalo aproximado del 90% de confianza para la proporcin buscada se
obtiene al utilizar la expresin:
^ 90%= PZ/.* ^[pfl p)/n),
en donde Zma/2 refleja la conanza deseada por el investigador,
valor que se toma de la tabla de la distribucin normal estndar y p es
el valor de la proporcin obtenido en.la muestra. As, el intervalo bus
cado es:
0,34 1,64 ^[0,34(0,66X47] = 0,22; 0,45
El investigador puede afirmar, con una confianza del 90%, que la
proporcin de mujeres con cncer de endometno que han utilizado estro-
genos se encuentra entre el 22 y el 45%, intervalo que es bastante amplio
y, por tanto, impreciso.
En cambio, si el investigador hubiera contado con una muestra de
94 pacientes habra obtenido con la misma confianza y con el supuesto
de que la proporcin observada p hubiera sido igual a 0,34:
0,34 1,64 *1 [0,34(0,66)/94] = 0,26; 0,42,
intervalo ms preciso que el obtenido anteriormente con una muestra
de menor tamao.
2 2 4 /Mucdobga de b bniBigaci*...
Determinacin del tamao muestral en los estudios
analticos
En e) estudio de las relaciones existentes entre la exposicin a diferentes
factores y la incidencia de las enfermedades, el epidemilogo debe basar
su conocimiento en resultados observados en muestras aleatorias que, su-
puestamente, representan lo que sucede en la poblacin de donde ellas pro
vienen; por este motivo en la fase de planeacin de un estudio
epidemiolgico analtico el investigador debe decidir acerca del nmero de
sujetos participantes en cada uno de los grupos que se comparan. Esta de
cisin es el resultado de una serie de consideraciones importantes que se
detallan a continuacin.
Consideraciones generales
A medida que se incrementa el tamao muestisl los resultados obtenidos
son ms precisos y, al mismo tiempo, aumentan los recursos necesarios
para obtener y procesar una mayor informacin. De esta manera la solu
cin al problema de la determinacin del tamao muestral se presenta, en
primera istancia, como una solucin de equilibrio entre los costos y la im
precisin de las estimaciones que se trata de obtener: una muestra nume
rosa suele ser bastante precisa pero tambin bastante costosa.
De una manera intuitiva se percibe que los resultados obtenidos
con muestras pequeas no son confiables; esta apreciacin implica un
conocimiento del comportamiento entico que tienen los resultados
aleatorios que se basan en un nmero escaso de observaciones. As(, si
en 2 lanzamientos de una moneda se obtienen 4 caras, la decisin acerca
de si se trata de una moneda equilibrada o de una falsa tiene un funda*
ment mucho ms dbil que aquel que se tiene si en 50 lanzamientos se
obtienen 40 caras.
Con los resultados observados en una muestra pequea el riesgo de
tomar una decisin equivocada acerca de la hiptesis que se intenta demos
trar es relativamente alto, o sea que a medida que aumenta el tamao
muestral la probabilidad de tomar una decisin acertada acerca de la hip
tesis que se prueba es mayor. De este modo es fcil advertir que el tamao
de una muestra depende, en parte, del riesgo que el investigador asume de
obtener un resultado que lleve a una conclusin equivocada.
El riesgo de concluir equivocadamente con respecto a la hiptesis
que se intenta demostrar presenta dos posibilidades;
Tamao de ta muestra/2 2 5
1. Ed ausencia de la diferencia 8 que se intenta detectar, es posible obtener
por azar un resultado que permita concluir equivocadamente a favor de la
existencia de la asociacin. Se dice entonces que se acepta equivocadamen
te la hiptesis alternativa y se rechaza la hiptesis nula.
Obviamente, la frecuencia con que se presentan estos resultados es
escasa y coincide con el nivel de significacin estadstica que el investiga
dor fija de antemano para las pruebas de significacin del estudio que se
suele denotar con la letra a (Vase la figura 13.1). Puesto que el investi
gador acepta correr un riesgo reducido de que el azar lo lleve a concluir
equivocadamente, el nivel de significacin suele ser pequeo, casi siempre
10, 5, o 1%, segn el criterio de aqul.
Figura 13.1 Distribucin d e los resultados muestrates cuando n o existe asoria
cin, o sea bajo la hiptesis nula
Por ejemplo, en un estudio de seguimiento en el que, con base en
los resultados de dos muestras aleatorias, se evala la diferencia 5 en la
incidencia entre expuestos y no expuestos a un determinado factor de ries
go, es posible que en ausencia de asociacin se obtenga por simple azar
una diferencia estadsticamente significativa, lo cual llevara al investigador
a concluir equivocadamente a favor de la existencia de la asociacin. As.
el nivel de significacin o fijado para una prueba estadstica es una medida
del nesgo que asume aqul de concluir equivocadamente a favor de la exis
tencia de la asociacin cuando sta en realidad no existe, enor que se
conoce en estadstica como tipo I.
2 2 6 / Mitwioi&gia J r fe i*v$ttigact*.
2. Al existir la asociacin que se intenta detectar, es posible obtener por el
azar un resultado que permita concluir de manera equivocada a favor de la
inexistencia de la asociacin* esto es, a favor de la hiptesis nula. De
acuerdo con la figura 13.2, si la asociacin existe con un valor igual a 6,,
las estimaciones de tal valor se distribuyen alrededor de 5/ de acuerdo con
la distribucin que aparece a la derecha.
Figura 13.2 Distribucin de las estimaciones maestrales que se obtienen en
muestras grandes cuando la asociacin buscada existe
No obstante, es posible qoe por azar se obtenga una estimacin con un
valor inferior al que delimita el nivel de significacin estadstica en la distri
bucin que se presentara bajo la hiptesis nula; la frecuencia con que ocurre
uno de tai** resultados est inriirfrfl por el valer p. De este modo, el riesgo
de obtener un resultado que Heve a la conclusin equivocada a favor de la
inexistencia de la asociacin cuando sta existe es fi y el error se conoce en
estadstica como tipo II; su complementa i - jJ, es la probabilidad de detec
tar correctamente la existencia de una asociacin lo cual se conoce como po
der de la prueba estadstica.
En el intento de demostrar la existencia de una asociacin, el inves*
tigador desea tener una alta probabilidad de detectarla con sus resultados
aleatorios, es decir, un alto poder de la prueba estadstica lo cual suele ser
igual o superior al 80%, o sea que 3 casi nunca excede el 209b. Es fcil
vertir que a medida que se desea reducir los riesgos a y (5 de que el azar
produzca resultados que lleven a una conclusin falsa se debe incrementar
el tamao muestral requerido.
De otro lado, la magnitud de las diferencias existentes tambin con
diciona el tamafio muestral requerido en un cierto estudio comparativo. In
tuitivamente es fcil advertir que para detectar diferencias grandes basta un
Tamao de ic m uestro/227
reducido tamao muestral en tanto que para detectar diferencias pequeas
es necesario contar con muestras numerosas; planteamiento que se mani
fiesta en la prctica en el hecho de que para calcular el tamao muestral
requerido en un cierto estudio es necesario especificar de antemano la di
ferencia mnima o el riesgo relativo mnimo que se considera importante
detectar desde una mirada clnica, etiolgica o preventiva. As, en igualdad
de otras condiciones, la deteccin de un riesgo relativo de 2,0 exige un
tamao muestral mayor que la deteccin de uno de 5,0.
Finalmente, d tamao muestral requerido en un cierto estudio tambin
est condicionado pea- la frecuencia con que ocurren los eventos observados,
o sea que la deteccin de una asociacin entre una exposicin y la incidencia
de una enfermedad frecuente exige un menor tamao muestra! que el reque
rido si se trata de una enfermedad rara. Este hecho implica que para la deter
minacin del tamao muestral requerido en un estudio de seguimiento es
necesario especificar la incidencia propia de la poblacin no expuesta y que
para calcular dicho tamao en un estudio de casos y controles es necesario
especificar la proporcin de exposicin propia de los controles, tal como se
expone detalladamente a continuacin (Schlesselman, 1974).4
Estudios de casos y controles
De acuerdo con los planteamientos antes descritos, para calcular el tamao
muestral requerido en un estudio de casos y controles es necesario especi
ficar las siguientes condiciones (Schlesselman, 1982):
1. El nivel de significacin a o probabilidad de que los resultados obteni
dos lleven a aceptar equivocadamente la existencia de la asociacin
2. El poder deseado en las pruebas estadsticas 1 - p, o la probabilidad de
obtener resultados que confirmen acertadamente la asociacin estudiada
3. El nesgo relativo mnimo que, con una probabilidad / - p, se detectara
como significativo.
4. La frecuencia de exposicin entre la poblacin sana. Dado el hecho de
que la mayora de la poblacin total suele estar conformada por sujetos
sanos, aquella puede estimarse adecuadamente por la frecuencia de expo
sicin de la poblacin total; se conoce, por ejemplo, la proporcin de per
sonas que en la poblacin total fuman, consumen alcohol o usan
anticonceptivos orales.
228/Metodologa de kt investigacin...
En las tablas 13.2 a 13.7 se muestra el nmero de casos requerido
en un estudio de casos y controles do equipando* para diferentes especifi
caciones y cuando se decide tomar 1, 2 o 4 controles por cada caso.
En la tabla 13.3 se observa, por ejemplo, que si se desea detectar un
riesgo relativo de 2,0 con una probabilidad de 0,90 y un nivel de signifi
cacin de 0,05 con nna proporcin de exposicin de la poblacin sana de
0,10 se necesitaran 332 casos y 332 controles; si se acepta disminuir el
poder a 0,80 y se mantienen las otras especificaciones se requeriran en
tonces, segn la tabla 13.2 246 casos y 246 controles.
Algunos autores han confeccionado grficos que determinan el tama
o muestral p a n diferentes especificaciones y que permiten apreciar de una
manera visual las relaciones existentes entre ellas y el tamao muestral tal
como puede advertirse en la figura 133.
Para especificaciones de a y de / P diferentes a las de la figura
13.3 se puede obtener el tamao requerido n al multiplicar el valor hallado
en el grfico por los factores que se presentan en la tabla 13.8.
En general, la seleccin de igual nmero de casos y de controles es
aconsejable si la obtencin de la informacin de unos y de otros es igual
mente factible y costosa. No obstante, en ocasiones, la seleccin de los
casos se hace difcil o excesivamente costosa, por tanto se puede reducir
el nmero de casos y aumentar el de controles con el fin de conservar el
mismo poder que se obtendra al seleccionar un nmero de casos igual al
de controles. As, si se incluyen r controles por cada caso r = J, 2, 3, ...,
el nmero de casos n se reduce de acuerdo con el factor (r + l ) f l r ; segn
esto, si en vista'de que el nmero de casos elegibles es escaso se decide
tomar 2 controles por cada caso, el nmero n de casos requerido para
determinadas especificaciones se puede reducir en un 75% o sea (2 +
J t f 2 x 2) * 0,75.
De este modo, si se piensa desarrollar un estudio de casos y contro
les para detectar un riesgo relativo de 2,0 con un poder de 0,80 y un nivel
de significacin de 0,05 bajo una proporcin de exposicin en la poblacin
sana del 10% se requeriran 246 casos y 246 controles, tal como se puede
apreciar en la tabla 13.2. Si ante la dificultad de contar con un nmero
abundante de casos se decide disminuir su nmero y tomar en cambio dos
controles por cada caso se pueden seleccionar 185 casos (246 x 0,75) y
492 controles (246 x 2) y aun contar con el mismo poder estadstico. El
beneficio de aumentar el nmero de controles, sin embargo, es despreciable
a partir de cinco controles por caso.
Tamaficdrla muestra/229
** Propomn d e exposan en te poblacin sana
' 0 1 - 0 5 * 1 0 0 . 1 5 0 , 2 0 0 , 2 5 0 , 3 0 0 , 4 0 0 , 5 0
Tabla 13.2 Nmero de casos requeridos en un estudio de casos y controles
no equiparado cuando se toman 1r 2 y 4 controles por caso, a
______________* Q<05; 1 - fr (poder) - 0, 80; prueba de una cola
1.5 6672 1415 763
550 448 390
3S6 325 325
4901
1041 563
407 332 290 265 243 244
4009
854 462 335
274 240 219 202 203
2,0
20$7 449
246 iai 150 133 ?23 115 119
1512
327
180 . 133 110
98 91 86 89
1220 264
146 108 90
81 75 72
75
2,5
1114
243 135
101 84
76 71 69 72
799
175 93 74
62 56 53 51 S4
638 140
79 60 51
46 43 42 45
3,0
732 161
91 69 58 53 50 49
53
521
116 66 50
43 39 37' 37 40
412
92 53 40 35
32 31
31 33
4,0
420 94
55 42 37
34 33 33 37
296 67
39 31 27
25 24 25 26
231
53 31
25 22 20
20 21 23
5,0
290
66 39 31
. 27 26 25 26
29
203
47 28
22 20 19 19 20
22
157
37 22
18 16
15 15 16
19
7.5
161
39 24 20 18 17
17 19
22
112 27 17 14
13
13 13 14
17
85
21 13 11
10 10
10 12 14
10,0
111
28
18 15 14
14 14 16
19
77
20
13 11
10
10 11 12 14
58
15
10
10
12
fuente: SmfthP Curso d e E ptem bbgia <fe Cncer (Notas), IARC, Heildefter9. Alema-
\
2 3 0 /Metodologa de a mvettigadn.^
Rff ftopordrt d e exposicin en apobtecn sena
0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,40 0,50
T a Mbi 1 3 3 Nmero de casos requeridos en un estudio de casos y controles
no equiparado, cuando se toman 1, 2 o 4 controles pof caso,
a - 0,05; 7 P (poder) - 0.9Q-, prueba de una cola_____________
1,5
2,0
2,5
3,0
4,0
5,0
7,5
10,0
9090
1927 1039 749 610 531 485 442 442
$758
1434 774 559 455 397 362 331 331
5585 1186 641 463
377 329 301
275 276
2815 605 332 243 201 178 165 155 160
207& 448 246 181
150 133 123 116
120
1704 368 202 149
124 110 102 96
100
1493
325 181
134 113 101 95 91 96
1097 239 134 100
84 75 71 68 72
893
195 109
82 69 62 58
57 60
977 215 121
91 77 70 66 65 .70
715 158 89 67
57 52 50 49 53
578 128 73 55 47 43
41 40 44
5S6 125 72 55
48 44 43 43 48
405 91 53
41 35 33 32 32 36
325
73 43 33
29 27 26
27 30
382 87 51 40 35 33 32 34 38
277 64 38 30 26 25
24 25 29
221 51 30
24 21 20 20 21 23
211
50 31 25 23 22 22 24 28
152 36 23 18
17 16 16 18 21
120 29 18 15
14 13 13 15 17
145 36 23 19 18 18 18 20
24
105 26 17
14 13 13 13 15 18
82 21 13 11 11 10 11 12 15
Fuente: Srrwth ?. Curso de Epiemotogl de Cncer (Notas), IARC, Helldelberg, Aten>a*
nia, 1987.
Tamao detama*Ora/23
Tabla 13.4 Nmero de casos requeridos en un estudio de casos y controles
no equiparado, cuando se toman 1, 2 o 4 controles por caso;
* 9' 9S ? 1 P (poder) 0 ,9 5 ; prueba de una una cola
Propordn de exposdn en la pobfedn sana
0,01 0,05 0,10 0,15 0,20 0,25 0.30 0,40 0.50
1.5 11381 2413 1301 938 763 665 606 553 S53
8527 1808 975 703 572 498 454 414 414
7089
1503 811 S8S 476 415 378 345
345
2,0 3505 753 413 302 250 221 205 193 199
2622 564
309 226 187 166 154 144 149
217.1 467
256 188 155 138 128 120 123
2,5 1852 403 224
166 139 12S 117 113 119
1363 301 167 124 104 93 88 84 89
1140 248 138 103 86 77 73 70 74
3.0
1208 265 149 112 95 86 82 80 86
900 198 111 84 71 64 61 60 64
739 163
92 69 59 53 SO 50
53
4.0 685
155 88 68 S8 54 52 53 58
509
114 66 50 44 40 39 39 44
416 93 54 41 36 33 32 32 36
5,0 469 107 63 49 43 40 39 41 46
348 79 47 36 32 30 29 31 34
283 65 38 30 26 25 24 25 28
7,5 258
61 37 30 27 26 27 29 34
191 45
28 22 20 20 20 21 2S
154 37 22 18 17
16 16 !7 20
10,0
177 43 27 23 2t 21 21 24 29
131
32 20 17 16 15 16 18 21
105 26 16 14 13 12 13 14 17
Fuente: Smith P. Curco de Spidemiebgla de Cncer (Notas), IARC, Haldelberg. Alema-
ra, 198?.
2 3 2 / M M & o * lo imwtigfldd*-.
Tabla 13.5 Nmero de casos requeridos en un estudio de casos y controtes
no equiparado, cuando se toman 1, 2 o 4 controles por caso,
a - 0,01; 7 - p (poder) - 0,80, prueba de una cola_____________
PrDpordnte&podnefldpobladfsond
0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,40 0,50
1 5 10583 2245 1211 873 711 620 565 515 515
7698 1638 887 642 524 458 419 385 387
6247 1332 724 525 430 377 346 319 323
2.0 3266 703
2328
504
1851
403
2,5
1728 377
.1214 267
950
210
3,0
1128 249
784 175
606
136
4,0
641
144
439 100
333
77
5.0
440 101
298
70
223 S3
7,5
243 58
162 40
119 30
10,0 167 42
111 28
386 283
234 207
278
206 171 153
224 166 139 125
210 156 131
118
150 113
95 86
119
90
77 70
140 106
90 82
100 76
65 60
79 61
52 48
84
64 56 52
59 46
40 38
46
36 32 31
60
47 41 39
42 33
30 28
32
26 24 23
36
29 27 26
25
21 19 19
19 0 6
15 15
27 23 21 21
19 16
15 15
14 13 12 12
192 181
186
142 135
140
117 112
117
110 106 112
82
80 85
67
66 71
78 76 82
57 57
62
47
47 52
50 51
56
37 38 43
30
31 36
38 40
45
28 30
34
23 25
29
26 28 33
19
21 25
16
18 21
21
24
28
16 18
22
13 15
18
80
21
ft/ente: Smith P. Curso de Epidemioiogl de Cncer (Notas), IARC, Heilelberg, Alema
nia, 1987.
Tamao de lo maestro /2 3 3
Tabla 13.6 Nmero de casos requeridos en un estudio de casos y controles
no equiparado, cuando se toman 1. 2 o 4 controles por caso;
______________a ~ 0.01: 1 - p (poder) - 0,90; prueba de una cola
RR
0,01
Proporcin de exposicin en id poblacin
sana
0,05
0,10 0,15 0.20 0,25
0,30 0,40
0,50
1.5
13606
2886
1556 1122 913 796
726 662 662
10010 2127 1149
831
676 592 541 495 497
8198 1745
945 664 559
489 446
411 414
2,0
4177
898 493
361 299
265 245 230
237
3031
654 360
265 220
196 182 172 179
2448 530
293 217
181 161
750 143
149
2,5
2202 479
267 198
*66 149
140 135 142
1562 346
194
145 122 110 104 101
107
1263 278
156 118
100 90 85 84
89
3,0
1433 315
178 134 114
103
98 96 103
1022 226
129 98
83 76 73
72 78
809
180 103
79 68
62 59 59 65
4,0
611
182
105 81
70 65 62 63
70
572
130 76
59 51
48 46 48
53
446
102
G0 47 41
39 38 39 44
5,0
555
127 75
58 52
48 47 49
56
389
90 54
42 38
36 35 37
42
300
70 42
34 30
29 29 30 35
7,5
305
73
45 36 33
32 32 35 41
212 51
32
26 24 24
24 26 31
161 39
25 21
19 19
19 21
26
10,0
210 52
33 28 26
25 26 29
35
145
36 24
20
19 19 19 22
26
109
28 18
16 15
15
16 18
22
Puente: nTj987CUrSO * epAfe'niofo*fe * Cncer.(Notas), IARC, Heildelberg, Alema-
2 3 4 /Metodologa de ia tnveBigedn..
Tabla 13.7 Nmero de casos requeridos en un estudio de casos y controles
no equiparado, cuando se toman 1, 2 o 4 controles por caso;
a - 0,.01; 1 p (poder) - 0,95; prueba de una cola
Rf Propordn de exposiofl en la pobtedn\ s m
0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,40 0,50
1,5 16402 3478 1875 1352 1100 959 874 797 797
12155 2580 1393 1006 820 715 653 597 598
10016 2128 1151 832 679 593 542 496 498
2.0 5018 1078 591 433 359 317 294 276 285
3686 794 437 321 266 236 219 207 214
3007 649 358 264 219 195 181 172 178
2,5 2639 E74 319 237 199 178 167 161 170
1926 420 235 175 147 132 125 121 128
1557 341 191 143 121 109 103 100 106
3.0 1715 377 212 160 135 123 116 114 123
1245 275 156 118 100 91 87 86 92
.
1000 222 126 96 82 75 71 71 77
4,0 968 217 125 96 83 77 74 75 83
698 157 91 70 61 57 55 56 62
S54 126 73 57 50 46 45 46 52
5,0 662 151 8B 69 61 57 56 58 66
474 109 64 51 45 42 41 43 49
373 86 51 41 36 34 34 36 41
7,5 362 86 52 43 39 37 38 41 48
258 62 38 31 28 28 28 30 36
200 48 30 25 23 22 23 25 29
10,0 248 61 38 32 30 30 30 34 41
176 44 28 24 22 22 22 25 30
136 34 22 19 18 18 18 20 25
Fuente: Snvth P. Curco d Spidemiologid de Cncer (Noras), lAftC, Helldelberg, Alema
nia, 1987.
7mow <k Jo muestro/235
b *
a f t 0.05
R Bes oo f l a w .
PrcenUfe cspuaitD e n t r e n t r lM p O
Figura 1 3 . 3 Tamao de la muestra requerido para estudios de casos y con
troles no equiparados, 1 caso 1 contro, bajo a * 0t 0 S (una cola),
7 - 0 - 0 , 9 5 , diferentes valores del riesgo relativo mnimo que se
desea detectar como significativo R y diferentes grados de expo
sicin de la poblacin al factor de nesgo
Puente: Chase 6 , Klauber MR. A graph o sample saes for retrospective suidies. Ameri
can Journal o f Public Health. 1965; (55>, p. 1993.
Tabla 13.B Factores que permiten calcular el tamao muestra! requerido para
diferentes valores de a y de 7 - 0 a partir de los tamaos mus
trales requeridos para a - 0,05 y i p - 0,95 que se presentan
en la figura 13.3
Poder
Nivel d e significacin a
>-p 0,050 0.025 0,010
0,80 0,571 0,725 0,927
0,90 0,791 0,971 1,203
0,95
1,000 1,201 1,457
Fuente: Chase G. Klauber MR. A graph of sample e s for retrospective studies. Amen-
can Journal o f Pubtk Health. 1965; (55), p. 1994.
236/Maafefcvfa e a btvaligod n*.
df f f g g l f / f f t f r f f I f t
Aunque las consideraciones generales con respecto a los condicionantes
que determinan el tamao maestral que han ido expuestas a] principio de
este captulo son igualmente aplicables al diseo de un estudio de segui
miento, conviene distinguir dos situaciones en las cuales se suele realizar
este tipo de estudio:
1. OflmV* se elige la poblacin general como grupo de comparacin
2. Cuando se elige a propsito un grupo no expuesto como grupo de com-
paracin
Cuando se elige la primera alternativa se sude conocer la incidencia
del evento estudiado en la poblacin general, con base en la cual es posible
calcular el nmero esperado de casos en el grupo expuesto con el supuesto
de que no existe asociacin al aplicar a ste la tasa de incidencia propia de
la poblacin general As, si se contempla el seguimiento de 1000 personas
expuestas durante 4 aos y la tasa anual de incidencia de la enfermedad
estudiada en la poblacin general es de 3 por mil cabra esperar que en el
grupo expuesto, bajo la hiptesis nula* se presenten cerca de doce casos de
la enfermedad, o sea 1000(3/1000)4 = 12.
La determinacin del tamao muestral en estas condiciones se pre
senta como la respuesta a dos preguntas:
1. Cul es el nmero de casos de la enfermedad que, con un determinado
nivel de significacin, habra que detectar en el grupo expuesto con el n
de confirmar la existencia de la asociacin estudiada?
2. Con qu probabilidad o poder se puede llegar a establecer la asociacin
estudiada?
Las tablas 13.9 y 13.10 responden a tales preguntas y muestran, para
niveles de significacin de 0,05 y 0,01 respectivamente, el nmero mnimo
de casos que sera necesario detectar para diferentes valores del nmero
esperado de casos y el poder correspondiente de la prueba para diferentes
valores del riesgo relativo.
7 0 w w de la muestra/237
Tabla 1 3 . 9 Tamao muestra! d e un estudio d e seguimien to cu an d o s e e l i g e la
poblacin general c o m o grupo d e comparacin, a - 0 , 0 5 , prueba
, d e una cola. La tabla muestra el poder(x100) c on el cual s e d e t e c
tara un determinado riesgo relativo cuando s e esperan m c a s o s
Nmero
de casco
esperadas
m
Nmero
crtico
de casos
c*
1,0 1.5 2,0
Riesgo retorno
3.0 4,0 5,0
7,5 10,0 15.0 20,0
1,0 4 1,90 7 14 35 57 74 94 99 100 100
2.0 6 1,66 8 21 55 81 93 100
3,0 7 3,35 17 39 79 9S 99
4,0 9 2,14 15 41 84 98 100
5,0 10
3,18 22 54 93 100
6.0 11 4.26 29 65 97 100
7,0 13 2,70 26 64 96 100
8.0 14 3,42 32 73 99* 100
9.0 15 4,15 38 79 100
10,0 16 4.87 43 84 100
11.0 t 8 3,22 39 83 100

12.0 19 3,74 44 87 100


13.0 20 4,27 48 90 100
14.0 21 4,79 53 93 100
T5,0 23 3,27 49 92 100
20,0
29 3,43 60 97 100
Riesgo relativo
m
c
1,0 1,1
1.2 1,3 1,4 1,5 1.6 1.7
1,8 1,9
20,0 29 3,43 9 18 30 45 60 73 83 90 94
25.0 34
4,98 13 26 42 59 74 8S 92 96 98
30,0 40 4,63 13 27 46 64 79 89 95 98 99
35,0 48 4,25 13 29 49 69 83 92 97 99 100
40,0 52 3,B7 13 30 S2 72 86 94 98 99 100
45,0 57 4,73 16 36 60 79 91 97 99 100
so.o 63 4,24 16 37 61 81 93 98 99 100
60,0 74 4,42 18 42 69 86 96 99 100
70,0 85 4,48 19 47 75 92 96 100
60.0 96 4,46 21 S1 30 94 99 100
90.0 107
4.39 22 55 83 96 99 100
100,0 118.
4,28 23 58 86 97 100
c es el nmero ms pequeo tal qoe ls probabilidad de obtener un afanen de casos mayor o igual
a d es d oot <pe 0,05. Los clculos han sido mafizados medanle la datribodn de Poimoh
cuando se asuene que b proporcifa da batideras es baja o sea " k t * * de] 2 % .
Fuente: Smith P. Curso de Epkhmtoiogb de Cncer (Motas), IARC, Heitielbera, Alema-
\ nis, 1987.
238/MttoMog(o de lo m*eUfee&L,.
Tabla 13.l OT a m a o muestral d e un e stud io d e seguimien to cu an d o s e e l i g e la
poblacin general c o m o grupo d e comparacin, a - 0 , 0 1 , prueba
d e i r a cola. La tabla muestra el poder(x100) c on el cual s e d e t e o
tara un determinado riesgo relativo cuando s e e s p e ra n m casos
Nmero Nmero ftgo mistnc
decasos crtico
esperados d i casos 1,0 1,5 2,0 3,0 4,0 5,0 7,5 10,0 15,0 20,0
m c*
1,0
*
S 0,37 2 5 16 37 56 87 97 100 100
2,0 7 0,45 3 11 39 69 87 99 100
3.0 9 0,36 4 15 54 84 96 100
4,0 10 0,81 8 28 76 96 99 100
5,0 12 0.55 8 30 62 98 100
6,0 13 0,88 12 42 91 99 100
7,0 15 0,57
11 43 93 100
8,0 16 0,82 16 53 97 100
9,0 18 0,53 14 53 97 100
10,0 19 0,72 18 62 99 100
11,0 20 0,93 22 69 99 100
12,0 22 0,61 20 69 100
13.0 23 0.76 24 75 100
14,0 24 0,93 28 80 100
15,0 26 0,62 26 79 100
20.0 32 0.81 38 91 100
tiesgo relativo
m c 1.0
,1 1.2
13
1.4 1.5 1,6 1,7 1 3 1,9
20,0 32 0,61 3 7 14 25 38 62 66 77 66
25.0 38 0,92 3 9 19 33 49 65 78 87 93
30.0 44 0r97 4 11 23 40 58 74 85 93 97
as,o 50 0,98 4 12 27 46 65 81 91 96 98
40,0 56 0,97 5 14 31 52 71 86 94 96 100
45,0 62 0,93 5 15 34 57 76 89 96 99 100
50,0 68 0,89 5 17 37 61 81 92 97 99 100
60.0 B0 0.78 5 19 43 68 67 96 99 100
70,0 91 0.91 6 24 51 77 92 9B 100
80,0 103 0.76 6 25 55 81 95 99 100
90,0 114 0,83 7 29 62 87 97 100
100,0 125 0,86 9 34 68 91 96 100
* c es el ufanero ms pequeflo la) que l i probabilidad de obtener un nmero de c jk k mayor o igkla)
i l es meaor que EUH- Los cflcalo b u do realizaos la diMribuctfo de Pcaax
cuando se asume que la pio^jat de ipdeari* t i baja o sea meoor del 2%
fuente: Srwth P. Curso de Epidemiologa de Cncer (Notas), IARC Heildftlberg, Alema-
na. 1987.
Tamao de fe muestra/239
En la tabla 13.9, por ejemplo, se adviene que si el nmero esperado
de casos en ausencia de asociacin es de 12. slo a partir de un nmero
observado de ellos igual a 19 se pudiera confirmar la asociacin estudiada
con un nivel de significacin de 0,05 y que, en las mismas condiciones, la
probabilidad de detectar un riesgo relativo de 2,0 es de 0,87. En las mismas
condiciones la deteccin de un riesgo relativo de 3,0 sera un suceso casi
seguro.
Las tablas 13.11 y 13.12 presentan la misma situacin de un modo
diferente, ya que ellas permiten calcular el tamao muestral a partir del
riesgo relativo que se desea detectar con determinado poder, con niveles
de significacin de 0,05 y 0,01, respectivamente. En la tabla 13.11 se
conoce, por ejemplo, que si se desea detectar como significativo un ries
go relativo de 2,0 con un nivel de significacin de 0,05 y un poder de
0,80 el nmero esperado de casos en ausencia de exposicin es de 9;
as, si se conoce que la tasa anua2 de incidencia en la poblacin general
es de tres por mil, se deben observar 1000 personas por un periodo de
3 aos, o sea 1000 (3/1000) 3 = 9, o alternativamente. 2000 personas
durante 1.5 aos.
Cuando se escoge a propsito un grupo no expuesto como grupo de
comparacin de igual tamao al grupo expuesto se debe considerar que
adems del costo y del esfuerzo que implica el seguimiento de dicho gru-
po, es necesario recurrir a tamaos mustrales relativamente mayores que
los exigidos por la situacin si se utilizara la poblacin general como grupo
de comparacin.
Las tablas 13.13 y 13.14 presentan la informacin necesaria para ob
tener el tamao muestra] en esta ltima alternativa y con la misma forma
de las tablas 13.1] y 13.12, para niveles de significacin de 0,05 y 0,01,
respectivamente.
En la tabla 13.13 se conoce, por ejemplo, que para detectar un riesgo
relativo de 2,0 con un poder de 0,80 y con un nivel de significacin de
0,05 es necesario contar aproximadamente con 15 casos esperados. Para
ello, si la incidencia anual en ausencia de exposicin es de 3 por mil al
ao, habra que seguir a 1000 personas por 5 aos, o sea 1000 (3/1000) 5
= 15 o, alternativamente* a cerca de 1660 personas durante 3 aos y. ade
ms, a 1660 personas expuestas. Este tamao muestra] excede notablemen
te al que se requiere para la misma hiptesis cuaudo se elige la poblacin
general como grupo de comparacin tal como ba sido indicado, o sea 1000
personas expuestas observadas durante 3 aos.
240/htaadotogk de te titvestigacln...
Tabla 13.11 Tamao muestral para un e stud io d e seguimiento cuando el grupo
e x p u e s to s e compara con ia poblacin general, a - 0,05, prueba
d e una cola. La taWa muestra tos valores del riesgo relativo q u e se
detectaran c on determinado poder y un nmero m esperad o de
casos
Nmero
d e e asos
espertos
m
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9,0
10,0
11.0
12,0
13.0
14.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
50.0
60 r0
70.0
80.0
90,0
100,0
Nmero
crtico
e casce
c
4
6
7
9
10
11
13
14
ts
16
18
19
20
21
23
29
34
40
46
52
57
63
74
as
96
107
11$
0,50
3,67
2,84
2,22
2,17
1,93
1.78
1,81
1,71
1,63
1,57
1.61
1,56
1.51
1.48
1.51
1,43
1,35
1,32
1.30
1,29
1,26
1.25
1,23
1.21
1,20
1,19
1.18
0,80
5,52
3.95
3,03
2,84
2,50
2,28
2,27
2,13
2,01
1,92
1.95
1,88
1,82
1.77
1.79
1.67
1,55
1,51
1.47
1.45
1,41
1,39
1,35
1.32
1,30
1.28
1.27
Poder
0,90
6,68
4,64
3.51
3,25
2,84
2,57
2,54
2.37
2,24
2.13
2,15
2,06
1,99
1,93
1,95
1,80
1.67
1.61
1,57
1.54
1,49
1,47
1,42
1,39
1.36
1,34
1,32
0,95
7,75
5,26
3,95
3,61
3.14
2,B3
2,78
2,58
2.43
2.31
2.32
2.22
2.14
2,08
2.09
1,92
1.77
1,70
1,65
1,61
1,55
1,53
1.48
1,44
1.41
1,38
1,36
0,99
10,05
6.55
4,86
4.35
3,76
3.36
3,26
3,02
2,83
2,67
2,66
2.55
2,45
2.36
2.37
2.15
1,96
1,B7
1,81
1,76
1.69
1,66
1,59
1,54
1.50
1,47
1,45
- e es el atoao mis pequeo tal que. la piobabilidad cte que se presente un nmero de ca I gual
o mayor que e menor de 0,05. Los dwlw han sido reatados baje una t e m b l e
Prisin cuando se asume que la jMOpOfcln de incidenda es b^ja o "****
fuente. Smrth P. Curso de ffwdemWosrs efe Cncer (Notas), IARC, Heilelberg, Atema-
na, 1987.
TamaMo d i la /nuestra/241
Tabla 1 3 . 1 2 Tamao muestral para un estudio d e seguimiento cuando el grupo
e x p u e s to s e compara c on la poblacin general, a - 0 , 0 1 , prueba
d e una cola. La tabla muestra los valores del riesgo relativo qu e s e
detectaran c on determinado poder y un nmero m esperad o de
casos
Nmero
d e casos
esperados
m
Nmero
critico
d e casos

c
0,50 0,80
Poder
0,90 0,95 0,99
1,0 5 4,67 6,72 7,99 9,15 11.60
2,0 7
3,33 4.54 5.27 5.92 7,29
3,0 9 2.89 3,79 4,33 4.81 5,80
4,0 10 2.42 3,13 3,55 3,93 4 f70
5,0 12 2,33 2.96 3,32 3.64 4,30
6,0 13 2,11 2.6S 2,96 3.24 3,80
7,0 15 2,10 2.S9 2,88 3.13 3,64
8,0 16 1,96 2,40 2,66 2,89 3,34
9.0 18 1.96 2.38 2,62 2,83 3,26
10,0 19 1.87 2.25 2,48 2,67 3,06
11.0 20 1.79 2,15 2,35 2.53 2,90
12.0 22 1.81 2.15 2,35 2.52 2,86
13.0 23 1.74 2,07 2,26 2,42 2,74
14.0 24 1.69 2,00 2.18 2,33 2,63
15,0 26
1,71 2.01 2.18 2,33 2,62
20,0 32 1.58 1.83 1.97 2 f09 2,33
25.0 38 1.51 1,72 1,84
1,95 2.15
30.0 44
1,46 1,65 1.76 1.85 2,03
35.0 50 1,42 1.60 1,69 1,78 1,94
40,0 56
1,39 1.55 1,64 1,72 1,87
4S,0 62 1,37 1,52 1,61 1.68 1.82
50,0 68 1,35 1,50
1.58 1,64 1.77
60,0 80 1.33 1,46 1,53 1,59 1.70
70,0 91
1,30 1,41 1,48 1.53 1.64
80,0 103
1,28 1,39 7,45 1,50 1,60
90,0 114
1,26 1.37 1,42 1,47
1,56
100,0
125 1,25 1,34
1,40 1,44 1.52
* c es el rmero mis pequeo tal que la probabilidad de c|ue se presen un anen) t casos igual
o mayor que m es menor de 0 ) . Los clculos han sido realizados mediante la distribucin de
Poitson cuando se asume que la proporcin de incidencia es b^Ja o sea menor del 2%.
fuente: Smith P. Curso de Epidemiologa de Cncer (Notas), IARC, Heildelberg, Alemania,
1987.
242 / Mtooioga de a m stifecin...
Tabla 1 3 . 1 3 T a m a o muestral para un estudio d e seguimiento cu an d o el grupo
e x p u e s to s e compara c on un grupo n o expuesto d e igual tamao,
a - 0 , 0 5 , una cola. La tabla c o n t ie n e k s valores del r i e s ^ relativo
q u e s e detectaran c on determinado poder y un nmero m espera
d o d e casos
Nmero
de casos
esperados
m
1,0
2,0
3.0
4.0
5/0
6.0
7.0
6.0
9.0
10.0
11.0
12.0
13.0
14.0
15.0
20.0
25.0
30.0
35,0.
40.0
45.0
50.0
60.0
70.0
60.0
90.0
100,0
0,50
5,04
3,45
2.87
2,55
2,35
2,20
2,09
2.01
1,94
1.88
1,84
1,79
1,76
1,73
1,70
1,59
1,52
1,47
1,43
1,40
1,38
1,36
1,32
1,30
1,28
1,26
1,25
0,80
8,77
5,47
4.31
3.69
3.31
3.04
2,84
2.69
2,56
2,46
2.38
2,30
2,24
2,19
2.14
1,96
1,84
1,75
1,69
1,64
1,60
1,56
1.51
1,47
1,43
1,41
1,38
Poder
0,90
11,24
6,77
5,21
4/40
3,90
3,55
3,29
.3,09
2,94
2,81
2,70
2,60
2,52
2,45
2,39
2,16
2,02
1,91
1 * 3
1,77
1,72
1,68
1.61
1,56
1,52
1,49
1,46
0,95
13,55
7,96
6.04
5.04
4,43
4,00
3.69
3.45
3,26
3,11
2,98
2.87
2.77
2.69
2,61
2,35
2.17
2,05
1,96
1.88
1,82
1.78
1.70
1,64
1,59
1.55
1,52
0,99
18,57
10,54
7,80
6.40
5,54
4,96
4.53
4.20
3,94
3,73
3,56
3.41
3,28
3,17
3.07
2,71
2,48
2,32
2,20
2,11
2.03
1,97
1,87
1,79
1,73
1,69
1,65
* B valor del riesgo reltfivo JW t t oba* como sohictn de la s c o a t t o + Q) + /
Q .m Qr en donde Q * (Za *
Fuente: Smith P. Curso de EpfttonWogfe * Cncer (Notas), IARC, HeUdelberg. Alemania,
1987.
Tamao de la matara/2 4 3
Tabia 1 3 . 1 4 Tamao muestral para un estudio d e seguimien to cu an d o e l grupo
e x p u e s t o s e compara c on un grupo n o e x p u e s to d e igual tamao,
a 0 , 0 1 , una cola. La tabla contiene los valores del riesgo relativo
q u e s e detectaran c on determinado poder y un nmero m espera
d o d e casos
Nmero
d e c asos
esperados
m
0,50
0,80
Poder
0,90 0,95 0,99
1.0 7,97
12,75 15,78 18,57 24,49
2,0 5,04 7,55
9,11 10,54 13,55
3,0 4,00 5,57 6,83 7,80 9,85
4,0
3,46 4,82 5,65 6,40 7,97
5.0
3,11 4,24 4,93 S,54
6,82
6,0
2,87 3,85
4,43 4,96 6,04
7,0
2,69 3,56 4.07 4,53 5,47
8.0 2,S5
3,33 3,79 4,20 5,04
9,0 2,44
3,15 3,57 3,94 4,70
10,0 2,35 3,00 3,39
3,73 4,43
11,0 2,27 2,88 3,24 3,56 4,20
12,0
2,20 2.78
3,11 3,41 4,00
13.0 2,14
2,69 3.00 3,28 3.84
14,0
2,09 2,61 2,91 3,17 3,69
15,0
2,05 2,54
2,82 3,07 3.57
20,0
1,88 2,28 2,51 2,71
3,11
25,0
1.78 2,12 2.31 2,48 2,82
30,0
1,70
2,00 2,17 2,32 2,62
35,0
1,64
1,91 2,07 2,20
2,46
40,0
1,59 1,84 1,99
2, 11 2.35
45,0
1.55 1,79 1,92
2,03 2,25
50,0
1,52 1,74
1,86 1,97 2,17
60,0 1,47
1.67 1.78 1.87 2,05
70,0
1,43
1.61
1.71 1.79 1,96
80,0
1,40
1,57 1,66 1.73 1 8
90,0
1,38 1.53
1,61 1,69 1,82
100,0
1,36 1,50
1,58 1,65 1.78
* El valor del nesgo iclativo RR se obtiene como soiicin de la ecuacin jm2 . RJU2 + o j + / .
Q 0. en donde Q = (Z. + 2 ^ / m . W
Fuente: Smith P. Curso de epjdembkrgid de cncer (Notas), IARC, Heildelberg, Alemania,
1937.
244/Metodobgta de b
i
Cuando se decide seleccionar a propsito uti grupo no puesto
como grupo de comparacin tambin es posible seleccionar grupos de ex
puestos y no expuestos de diferente tamao. Si con un conjunto de deter
minadas especificaciones se requieren n personas expuestas y n no
expuestas de igual tamao y se considera una razn del nmero de perso
nas no expuestas al nmero de personas no expuestas igual a r, el nmero
requerido de stas es igual a n(r + V2 r y el de las no expuestas es igual
a nfr + l ) l .
As, si segn el ejemplo citado se calcula que de acuerdo con las
especificaciones deseadas se debe observar un grupo de 1660 personas ex*
puestas y otro no expuesto de igual tamao, pero por razones de factibili
dad se contempla la posibilidad de aumentar el nmero de los no expuestos
al doble de los expuestos, el nmero de estos sera de 1245, o sea 1660(2
+ jy(2 x 2) * 1245 y el de los no expuestos de 2490 o sea 660(2 + l ) f
* 2490.
Eqidparamiento y control dt t e confusin
El razonamiento que se ha expuesto en los prrafos precedentes se refiere
a la situacin que contempla un diseo no equiparado. Tal como se ha
indicado en el captulo correspondiente, el equipararaiento de los sujetos
observados con respecto a una variable que produce confusin tiende a
aumentar la eficiencia de un estudio y permite seleccionar as un menor
nmero de casos con respecto a un estudio no equiparado en las mismas
condiciones. Tambin, en un diseo equiparado es posible aumentar el n
mero de controles por cada caso si se hace difcil o costoso obtener la
informacin de estos, con lo cual se incrementa el poder de las pruebas
estadsticas.
En la tabla 13,15 se muestra el nmero de casos requerido en un
estudio de casos y controles equiparado, para algunas especificaciones
selectas y cuando se utilizan 1 y 2 controles por cada caso. Advirtase,
por ejemplo que si con un diseo equiparado 1 caso 1 control se desea
detectar un riesgo relativo de 2,0 con un nivel de significacin de 0,05
y un poder de 0,80, y se asume una proporcin de exposicin en la
poblacin sana de 0,10 se necesitaran 241 casos y 241 controles, o sea,
10 sujetos menos que los necesarios para un diseo simple, segn la
tabla 13.2.
Adems, se debe considerar que si de acuerdo con el diseo de la
investigacin se pretende controlar por medio del anlisis estratificado el
Temeo de Ja rmmtrtt/245
Tabla 1 3 . 1 5 Nmero d e c a s o s requerido e n un estudio d e c a s o s y controles
equiparado para algunas condiciones s e le c tas y cuando s e utilizan
1 y 2 controles por cada caso
1.5 2,0 2,5 *
Riesgo refativo
3.0 3,5 4,0 4,5 5,0
Proporcin de exposidn 0, 1; Significacin - 5%\ Poder - 80%
.
757 241 131
87 65 52 43 37
559 176 95
63 46 37 30 26
Proporcin de exposidn - 0,7; Significacin - 5%; Podar 9S%
1.283 398 211
138 101 79
65 55
963 299 158
103 76 59 48 49
Proporcin de exposicin 0, 1; Significacin
- 1%; Poder - 60%
1.204 380 206
137
102 81 67 58
881 274 146
96 71 56
46 40
Propordn de exposidn = 0,1; Significacin
- 1%; Poder - 95%
1.855 575 305
200 147 115 95 81
1-380 425 224
147 107 84
69
58
Proporcin d e exposicin - 0,3;
Significacin
- 5%; Poder - 80%
355 122 71
50 39 32
28 25
264 90 52
37 29 24
20 18
Proporcin d e exposicin o,S;
Significacin
- 5%; Poder - 80%
324 118 72
52 42 36
31 28
243 89 54
39 32 27
24 21
Fuente: Breslow NE, Day NE. Statistical Methods in Cancer Research. Vot it; The Design
an d Analysis o f Cohort Studies, Lyon, IA8 C, 1987, p. 297.
efecto de una variable de confusin se debe incrementar el tamao mus-
tral requerido en un diseo bsico para las mismas especificaciones. Debi
do a la cantidad de informacin necesaria para el clculo de este
incremento y a la relativa complejidad de ste quizs sea un criterio til
saber que raramente se requiere un incremento en el tamao muescral b
sico mayor del 10%.
246/M euM og* de la i/ntaigatin.
Por cada variable adicional que se desea controlar por medio de la
estratificacin se piiete adoptar, tambin como criterio prctico, el incre
mento del amafio muestra] previamente calculado en un 10% (Breslow y
Day, 1987).
Deduccin del tamao maestral para demostrar
la diferencia entre dos proporciones
Los factores enunciados al principio de este captulo como condicionantes
del tamao muestral se relacionan entre t de 1 modo que su interdepen
dencia puede describirse por medio de una ecuacin que permite, finalmen
te, calcular el tamao muestral n necesario para satisfacer tales condiciones
(Hays, 1963; Fleiss, 1981; Breslow y Day, 1987).
Cuando se estudia la asociacin entre la exposicin a un factor de
riesgo y una enfermedad, ambos medidos en forma dicotmica, el proble
ma se plantea como la determinacin del tamao muestral requerido para
detectar como significativa la diferencia existente entre dos proporciones
cuya deduccin formal es como sigue:
Si fa y p2 son las estimaciones mustrales de las proporciones de
inters que se obtienen en dos muestras de igual tamao n en dos pobla
ciones caracterizadas por parmetros Ti y II* y se toma el valor p -
(Pj + Pfi> q = - p, mediante la aproximacin de la distribucin normal
se tiene que:
A *
1 - 6 Prob ' > Z- poder de la prueba, una cola
K ^<2pqM)
* Prob Ufo p) - Tty} > Z j V p q M ) - (Xl2 - I t y
_ . ( h p,> - (^2 - n, > z j q p g / n ) (n 2- r y
= + n & y n ) >//fn,G, + n&jw
Adems, se tiene por definicin que - P = Prob(Z > ZpJ, de tal
modo que el valor Zp, coincide con el segundo trmino de la desigualdad
anterior:
z j t t p q / n ) - m , - r y
^ " < m , Q , + TlQ2yn}
Tamao e a m utsira/247
Esta ltima expresin es funcin de y de n * valores que pueden
ser supuestos de antemano por el investigador y tambin de p , valor que
slo puede conocerse despus de realizado el estudio. No obstante, en
muestras relativamente grandes p se puede estimar de modo aproximado
por n a (TI, + n2>2, y pq se puede aproximar al valor UQ en donde, Q
1 - n.
De esta manera, al reemplazar el valor de pq por el de DQ y despe
jar el valor de n, se tiene que:
^ _ (Z^(2UQ) Zg'JfTl/Q, + n 2Q,)!
<n2 - n , ?
expresin que permite calcular el tamao muestral n requerido en
cada uno de los grupos comparados con valores especificados de (X 0. ;
> n 2.
Esta ecuacin que es la misma que se propone para calcular el
tamao muestral en estudios experimentales cuando se comparan dos gru
pos y se busca detectar una diferencia entre dos proporciones en los
estudios epidemiolgicos de tipo analtico se puede expresar en funcin del
nesgo relativo RR que se pretende demostrar como significativo y de la
proporcin JTlj que caracteriza el grupo de comparacin: en los estudios
de seguimiento ; fAAjTlj y en los estudios de casos y controles, de
acuerdo con la aproximacin del riesgo relativo por medio de la razn de
disparidades RD> se tiene que
n, a i - n j
= - RD >RR, de tal modo que
l l 2 /(J
n j - - M n
1 r r n2 - n, + i
Consideraciones finales
Aunque la determinacin del tamao muestral requerido en un estudio
epidemiolgico obedece tambin a consideraciones econmicas, ticas,
biolgicas, sociales y polticas, entre otras, la especificacin de los condi
cionantes estadsticos con ios cuales se obtiene una determinada muestra se
presenta como un requisito ineludible. Por ejemplo, un investigador puede
determinar que el tamao muestra] requerido en un estudio de casos y con-
2 4 8 /U tu M o g lo d e la m w riK d*u
TOles, con una proporcin de exposicin asumida del 10%. para detectar
un riesgo relativo mnimo de 2,0 y con probabilidades de llegar a una con
clusin equivocada a = 0,05 y p = 0,20 e s de 246 casos y 246 controles.
No obstante, los recursos con que cuenta solo alcanzan para 91 casos y 91
controles con lo cual podra detectar como significativo con el mismo po
der y con la misma proporcin de exposicin un riesgo relativo de 3.0,
segn la tabla 13-2. . . . . .
Ante esta situacin, si lo considera prudente, puede decidir aceptar
mayares probabilidades de equivocarse con lo cual se disminuye el tamao
muestral inicialmente calculado o, si por el contrario, considera que no
debe 'Wtir mayores probabilidades de error y que no puede conseguir
recursos adicionales, puede decidir que en tales condiciones no es impor
tante realizar el estudio porque asume un riesgo elevado de no obtener
resultados significativos si el riesgo relativo es en efecto menor de 3,0.
Si por el contrario, considera que no debe admitir mayores probabi
lidades de error pero que puede obtener recursos adicionales para incluir
135 casos y 135 controles puede realizar el estudio con el conocimiento de
que si el riesgo relativo es al menos de 2,5 y con la suposicin de que la
proporcin de exposicin al factor de riesgo en la poblacin es realmente
del 10%, las probabilidades de llegar a una conclusin equivocada con re
lacin a la existencia de la asociacin de inters son de a = 0,05 y p -
0,20, segn la tabla 13.2.
En numerosos estudios analticos realizados con tamaos mustrales
insuficientes se suele concluir ante resultados no significativos que no exis
te asociacin con la exposicin estudiada. Es importante preguntarse si ta
les resultados se deben al reducido tamao muestral utilizado, caso en el
cual los recursos se han malgastado intilmente.
En otras ocasiones, no del todo infrecuentes, los estudios de este upo
se emprenden sin considerar los aspectos que orientan la adecuada deter
minacin del tamao muestral; los resultados obtenidos en estas circustan-
cias son de dudoso valor cientfico porque carecen de un punto de
referencia con respecto al cual pueden evaluarse. Tampoco son raras las
ocasiones en las que el investigador, con desconocimiento de las especifi
caciones con las cuales se determin el tamao muestral, acoge los resul
tados observados a i subgrupos reducidos de la muestra total, porejemplo,
categoras de sexo o regin; en estas circustancias la disminucin del ta
mao muestral como consecuencia del fraccionamiento de la muestra ini
cial produce una disminucin del poder requerido imcialmenle para la
Ternario de a muestra/2 4 9
muestra total y, por tanto, ua incremento en la probabilidad de obtener
resultados que nieguen la asociacin estudiada cuando ella existe.
En aquellos estudios que pretenden establecer la existencia de ml
tiples asociaciones, por ejemplo una enfermedad con mltiples factores de
riesgo, la opcin ms indicada es la de obtener los diferentes tamaos
mustrales correspondientes a las diferentes asociaciones de inters y elegir
finalmente el mayor tamao muestral. Alternativamente, puede identificarse
la asociacin de mayor inters y calcular con base en sta el tamao mues
tra! requerido, caso en el cual los resultados correspondientes a algunas de
las dems asociaciones pueden ser negativos debido simplemente al insu
ficiente tamao muestral para detectarlas.
Referencias bibliogrficas
1. BresJow NE, Day NE. Staiistical , V c M in Cncer Research. Vol. II: The Design and
AnsJysxs o f Cohon Studies. Lyon, Internacional Agencv for Researeb on Caneet,
1987.
2. Cha. C. Klauber MR. A grach o f sample sit* for retrospective Studies. American Jour
nal v f Public Health. 1965; (55): 1993*1996.
3. Fletes JL. Statistical Methods f o r Rotes and Proponions. 2nd ed. New York, John Wiley
and Sons, 1961.
4. Haya WL. Statistics. New York, Holt, Rinehan and V/iston, 1963.
5. Mueller J, Schuessler K, Costoer H. Statisncai Reasontng in Sociobgy. Boston, HougKton
MtfflmCo., 1971.
6. SchlesseJman JJ. Sample Size Requireraenn in Cohon and Case-Control Studies o f Dis-
ease. American Journal o f Epidtmioiogy. 1974; (99): 381*384.
7. Schleisdman JJ. Cose-Control Studies. New York, Oxford University Press, 1982.
8. Smith P. Curso de epidemiologa de cncer (Nocas). International Agency for Research on
Cncer, 1ARC. Heelberg, Alemania, 1987.
Anexo
Distribuciones probabilsticas:
Distribucin normal estndar
Distribucin t de Student
Distribucin de chi cuadrado
Armo/253-
Distribucin normal estndar
Probabflidades acumuladas
2 OM 001 a n 9,03 0)04 9,05 a u W 0,09 0,09
0,0 0,5000 0,S040 0,5080 0,5120 0,5160 0,5199 O.S239 0.5279 0,5319 0.5359
0,1 0,539 0,5436 0.5476 0.5517 0.5557 0.5596 0.5636 0,5675 0.5714 0,5753
OJ 0 ,5 ? 0.5632 0.5871 0.5910 0.5946 0.5967 0,6026 0,6064 0.6103 0,6141
OJ 05179 0,6217 0.6255 0.6293 0,6331 0.6366 0.6406 0.6443 0.6480 0,6517
OA 0.6S54 0.6591 0.6628 0.6664 0,6700 0.6736 0,6772 0.66C8 0.6644 0.6879
OJ 0,691$ 0,6950 0.6965 0.7D19 0.7054 0.7068 0,7123 0.71S7 0.7190 0.7224
0,6 0,7357 0,7291 0,7324 0.7357 0,7369 0,7422 0,7454 0,7486 0.7517 0,7549
0,7 0.7580 0.7611 0.7642 0,7673 0,7703 0,7734 0.7764 0,7794 0.7823 0,7852
0,8 0.7831 0.7910 0.7939 0.7967 0.7995 0.6023 0,6051 0,8078 0.8106 0,6133
0,9 0,6159 0,8166 0,9212 0.6236 0,6264 0.8269 0*315 0.8340 0.8365 0,6369
1,0 0.6413 0.843* 0.6461 0.6465 0.8508 0.6531 0.8554 0,8577 0.BS99 0.8621
1,1 0.6643 0.8665 0,6696 0.6708 0,8729 0.8749 0,6770 0,8790 0.8610 0,6830
u 0,8849 0.8869 0,6686 0.6907 0,8925 0.8943 0,6962 0,8960 0.8997 0,9015
1J
0,9092 0.9049 0,9066 0.9082 0,9099 0,9115 0,9131 0,9147 0.9162 0,9177
U 0,9192 0.9207 0.9222 0,9236 0,9251 0.9265 0,9279 0,9292 0.9306 0.9319
1,3 0.9332 0,9*45 0,9357 0.9370 0,9362 0,9394 0,9406 0,9418 0.9429 0.9441
U 0,9452 0.9463 0,9474 0,9464 0,9495 0.9505 0,9515 0.9525 0.9535 0.9545
1,7 0,9554 0.9564 0,9573 0.9582 0,9591 0.9599 0,9606 0,9616 0.9635 0.9633
U 0.9641 0,9649 0,9656 0.9664 0,9671 0.9678 0.9666 0,9693 0.9699 0,9706
1.9 0.9713 C.971 0,9726 0.9732 0,9736 0.9744 0.9750 0,9756 0.9761 0.9767
2.0 0.9772 0.9776 0,9733 0.9788 09793 0.9798 0.9603 0,9606 0.9812 0.9617
2,1 0,9*21 0,9626 0,9630 0,9634 0,9636 0.9642 0.9846 0,9650 0.9854 0.9857
3 J 0.9861 0,9664 0,9666 0.9871 0,9675 0.9876 0.9881 0,9864 0.9887 0.9990
2 J 0.9693 0.9696 0.9696 0.9901 0,9904 0.9906 0.9909 0.9911 0.9913 0.9916
2A 0.9916 0.9920 0,9922 0.9924 0,9927 0.9929 0,9931 0,9932 0.9934 0.9936
2 J 0.9998 0.9940 0.9941 0.9943 0,9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0,9953 0.9955 0.99S6 0,99S7 0.9959 0.9960 0.9961 0,9962 0.9963 0,9964
2.7 0,9965 0,9966 0,9967 0,9966 0.9969 0,9970 0.9971 0.9972 0.9973 0,9974
2. 0,9974 0,9975 0.9976 0,9977 0.9977 0.9978 0,9979 0,9979 0,9980 0.9981
2f 9 0961 0,9962 0,9962 0,9963 0.9964 0,9964 0.9995 0.9985 0.9986 0.9986
XO 0,9966 0.9967 0.9987 0,9968 0,9986 0.9969 0.9909 0,9969 0.9990 0.9990
X1 0.9990 0,9991 0.9991 0,9991 0.9992 0.9992 0,9992 0,9992 0.9993 0,9993
1 2 0,9993 0.9993 0,9994 0,9994 0,9994 0.9994 0.9994 0.9995 0.9995 0,9995
3 J 0,9995 0,9995 0.999S 0,9996 0,9996 0.9996 0.9996 0,9996 0,9996 0,9997
3,4 0.9997 0,9997 0.9997 0,9997 0,9997 0.9997 0.9997 0.9997 0.9997 0,9998
l i 0.9996 0,9996 0,9996' 0,9998 0,9996 0,9996 0.9996 0.9998 0,9996 0.9996
I S 0.9998 0,9996 0,9999 05999 0.9999 0.9999 0,9999 0,9999 0.9999 0.9999
1 7 0,9999 *0.9999 0.9999 0-9999 0.9999 0.9999 0,9999 0.9999 0,9999 0.9999
3,9
1 9
0,9999
1,0000
0.9999 0.9999 0,9999 0.9999 0,9999 0.9999 0.9999 0.9999 0.9999
2 5 4 / Mapdoogia e Ut fofeftifddAt..
(Mstribudn t de Stuent
f in d o i fle
t f r a t f 55 SS 75 9$ 90 95 9 7 J 89 9&5 9**5
f 0,158 0,510 1,000 1,963 3378 6,314 12.706 31321 63,65? 636,619
2 0,142 0,445 0,8)6 1386 1386 2,920 4303 6,965 9.925 31,599
j 0.13? 0,424 0,765 USO 1,638 2353 3,182 4,541 5341 12.924
4 0.134 0414 0,741 1,190 1,533 2,132 2,776 3.747 4,604 8,610
S 0.132 0.406 0,727 1.156 1,476 2,015 2,571 3,365 4,032 6369
5 0.131 0.404 0,718 1,134 1.440 1,943 * 2347 3,143 3,70? 5,959
7 0,190 0/402 0,711 1.119
1,415 1,895 2,365 2398 3399 S308
8 0,130 0.399 0,706 1.108 1,397 1380 2306 2,896 3,355 5.041
j 0.12 0.398 0.703 1,100 1,383 1,839 2362 2321 3.250 4,761
19 0,129 0,397 0,700 1,093 1.372 1312 2,228 2,764 3,169 4,58?
11 0,129 0,396 0,69? 13B8 1,363 1,796 2301 2,718 3,106 4337
12 0,126 0,395 o.es 1.083 1356 1,782 2,179 2,681 3,055 4318
13 0,t28 0394 0,694 1,079 1,350 1,771 2.160 2,650 3,012 4321
14 0,128 0,393 0692 1,076 1345 1,761 2,145 2324 237?
4,140
15 0.128 0,393 0,691 1,074 1,341 1.753 2,131 2302 2,94? 4.073
16 0,128 0,392 0,690 1,071 1,337 1,746 2,120 2,563 2.921 4,015
17 0,128 0,992 0,689 1,069 1,333 1,740 2,110 2,567 2398 3.965
tt 0.12? 0,392 0,698 1,067 1330 1,734 2,101 2,552 23?8
3.922
19 0,127 0,391 0.688 1,066 1328 1,729 2393 2,539 2,861 3,883
20 0,127 0,391 0,687 1364 1,325 1,725 2 m
2,528 2,845 3,850
21 0,127 0391 0,688 1.063 1,323 1,721 1,030 2,518 2,831 3319
22 0,12? 0.390 0.696 1,061 1321 1,71? 2374 2,508 2319 3.792
23 0,127 0390 0,685 1,060 1,319 1,714 2389 2,500 2307 3,768
24 0,127 0390 0,685 1,099 1,318 1,711 2364 2,492 2.79? 3,745
25 0,127 0J9D 0,684 1,058 1,316 1.708 2,060 2,485 2,787 3,725
2 0.127 0,390 0,684 1,058 1.315 1,706 2356 2,479 2,779 3,707
27 0,127 03B9 0,684 1,05? 1.314 1,703 2,052 2373 2,771 3,690
2 0,127 0,389 0,683 1,056 1,313 1,701 2.04B 2/467 2,763
3,674
29 0,127 0,389 0.683 1,055 1311
1399 2,045 2362 2.756 3.659
SO 0.12? 0,399 0,683 1,055 1310 1,697 2,042 2357 2,750 3,646
ss 0.127 0.389 0,682 1.052 1,306 1.690 2X30 2,438 2.724 3,591
4$ 0,126 0,388 0,681 1,050 1,303
1384 2,021 2,423 2,704 3,551
45 0.126 0.388 0,680 1,049 1,301 1,679 2.014 2.412 2,690 3.520
0.126 0388 0,679 1,04? 1.299 1.676 2309 2303 2,678 3,496
60 0,126 0,387 04?9 1,045 1,296 1.671 2300 2,390 2,660 3,460
70 0.126 03B7 0.678 1,044 1394 1367 1,994 2361 2349 3.435
00 0.126 0,387 0.678 1,043 1392 1.664 1,990 2374 2,639 ' 3,416
90 0,126 0.387 0,677 1.042 1.291 1.662 138? 2,368 2332 3,402
m 0,126 0,386 0,677 1,042 1,290 1,660 1.964 2364 2326 3.390
120 0,126 0,386 0.677 1.041 1,289 1358 1,980 235B 2,617
3,373
140 0.126 0.386 0,676 1,040 U 88 1,656 1377
2353 2,611 3361
1 0,126 0,386 0.676 1.040 1,287 1.654 1,975 2350 2,60? 3352
180 0,126 0,386 0,676 1J39 1,286 1,653 1.973
2.34? 2,603 3345
200 0.126 0386 0.676 1,039 1386 1,653 1.972 2,345 2,601 3,340
m 0.126 0,365 0,674 1.036 1,282
1,645 1,960 2,326 2.576 3391
A nu o/2 55
Distribucin de chi cuadrado
Gnot Perca*;
i l b t n a t f 5 JO 5 0
ce 70 88 9 8 95 * r j M 0 9 4 t% a s
t 0,004 0,148 0.455 0.708 1.07* ' . 6 4 2 2.706 3,841 5,024 6,635 7 4 7 9 12.116
2 0,103 0.213 1.388 1.633 2,406 3.219 4 4 0 5 5,991 7,378 9.210 *0,957 15,202
i Q J 3 2 M 2 4 2 .368 2,948 3 4 6 5 4,642 &251 7,815 9,348 11.345 12.838 1 7 , 7
4 0,711 2.195 3,357 4,fr*5 4 4 7 6 5,989 7,779 9 4 6 8 11.143 13.227 14.860 19.997
5 1,145 3.000 4,351 5,132 6 f l 6 4 7,269 9 ^ 3 6 11,070 12,633 15.066 16.750 22,105
s 1 4 3 5 3.028 5,346 6,211 7 J 3 : 8,558 10.545 12,592 '449 16.812 >6.548 24,103
7 2,167 4,671 6 , 3 4 6 7 J 8 3 6 J 6 3 9,603 12,017 14.067 16.013 16.476 20.276 26,018
9 2 . ? : 3 5.527 7,344 8 4 5 1 9,524 11,030 13.362 15,507 17,535 20,090 21,955 27.866
9 3.325 6.393 8,343 9,414 10.656 12.242 14.684 *6.919 19,023 21,666 23,589 29.666
tO 7.267 9,342 10^473 11,761 13,442 15.967 18,307 20,463 23,209 25.186 31.420
t , J7S 8.148 10.341 11.530 1 2 4 9 9 14,631 17.275 19,675 2 1 . 920 24.725 26.757 33.137
12 S.226 9.034 11,340 12.58* 14,011 1 5 4 1 2 19.549 21.026 2 3 3 3 7 26.217 ZB.300 34,821
t i 5 4 8 ? 9.928 12,340 13.636 15,119 16,98S 19.812 22,362 2 4 . 736 27.668 29.819 16,476
i .571 10.821 1 3 , 339 16-222 18.151 21.064 23.685 2 6 , 119 29.<41 31,319 36.109
fS 7.261 1 J.71 14.339 15,733 17.322 19,311 22.302 2 4 9 9 6 2 7 , 488 30,576 32,801 39.71
t s 7.962 12.824 1S.238 >6.780 18,418 20.465 23,542 36.296 2 8 . 645 32.000 34.26* 41,308
77 13.131 18,338 12.824 19.511 21.61 i 24.769 27.587 30.191 33,409 35.716 4 2 4 7 9
19 9 .390 14.4413 1 7 , 3 16,668 20401 22, 60 25 989 25.669 31.526 34,805 7,156 44.434
19 10,117 15,352 1 8 J 3 6 19,910 2 1 4 6 9 23.900 2 7 . 2 30.144 3 2 4 5 2 36,191 38.582 45,973
26 10,65 16,286 19,337 20.951 22.775 25.036 28,412 31,410 34,170 3 7 , 566 39,997 47.49B
21 11,591 17,182 20,337 21,991 2 3 I S S 26,171 29.616 32.671 38.479 38.932 4 M 0 1 49.011
22 1 2 J 3 6 18,101 21.337 23,031 24,939 27,301 3 0 4 * 3 33.924 36.781 4 0 . 289 4 2 . 796 $0,6)1
23 13,001 19,021 22,337 24.069 2 6 J 1 6 28.429 32.007 35.172 36.076 4 1 , 638 44.181 52.000
2 4 1 3 4 4 8 19,943 23,337 25.106 27,096 29.553 33.196 36.415 39.364 42.980 4 5 . 5 53.479
29 1 4 4 1 1 2 0 J 8 7 24,337 26.143 28,172 30,675 34,382 37.652 4 0 , 646 44.314 4 6 . 928 54.947
26 1 5 J 7 9 11.792 25,338 27,17 29,246 31,795 35.563 36,865 41,923 45,642 4 6 . 290 56,407
27 16.151 2 2 . 719 26,336 26.214 30.319 3 2 5 1 2 36.741 4Q113 43,195 46,963 4 9 . 64b 57.858
29 16.928 2 3 . 647 27,338 29,249 31.391 34J327 3 7 . 916 41.337 44.461 48.278 50.993 59.300
29 17,708 2 4 , 577 28,336 30,263 32,461 35.139 38.087 <2.557 45.722 49.566 52.336 60,735
M WA93 25.508 29,338 31,316 33, s a o 36.250 4 0 . 256 43.773 46 , 979 50,892 53,672 62.162
J J 22,465 30.178 34 , 336 36,475 36,859 4 1 , 776 46.0S9 494D2 53.203 57,342 60,275 69,199
4 0 26.509 34,872 39,335 4 1 , 522 44,165 4 7 , 269 51,905 55.758 59.342 63,691 66,766 76,095
5 8 1 2 39.565 4 4 J 3 5 46,761 49,452 52.729 57,505 61.666 65,410 69,957 73.166 52,876
50 34.764 4 4 , 313 4 9 . 335 61,692 54.723 58.164 83.167 87,505 71.420 76,154 79,490 89,561
60 4 3 . 188 5 3 4 0 9 5 9 J 3 5 62.135 6 S J 2 7 6 6 4 7 3 74.397 79.082 6 3 . 298 66.379 91.952 102.695
79 5 1 . 739 8 3 3 4 6 69.334 72.358 7 5 5 8 9 79.715 65.527 90.S31 9 5 , 023 100.425 104.215 115.576
90 6 4 9 1 7 2 . 915 79.334 82.566 6 6 , 120 9 0 4 0 5 96.578 101,879 106,629 112.329 115.321 128.261
90 6 9 . 126 82.511 69.334 92,761 9 6 . 524 101.054 107.565 113,145 118.136 124,116 128.299 140.782
100 77 , 929 9 2 . 129 9 9 , 334 102.946 106,906 1 1 1 4 6 7 118,498 124,342 I29,S61 135,807 140.169 153.167
120 . 7 0 $ 111.419 119.334 123.269 137.616 1 3 2 4 0 6 140.233 1 4 6 ^ 6 7 152,211 156,950 163,648 177.603
740 113,659 130,768 139,334 143,804 146.269 1 5 3 4 5 4 161.627 166,613 174.648 1 8 1 4 4 0 166,647 201.683
?8P 1 3 1 , 7 1S0.156 159,334 163,898 1 6 6 4 7 6 1 7 4 4 2 8 183.311 1 9 0 4 1 6 196,915 2 0 4 J 3 0 209,624 225.481
109 149 6 9 189,886 179.334 184,173 1 6 9 4 4 6 195,743 204,704 212,304 219,044
227,056 2 3 2 . 6 2 0 249.046
20 0 1 6 8 2 7 9 189,049 199,334 204,434 2 0 8 4 6 5 2 1 6 4 0 9 226,021 2 3 3 4 9 4 241.058 249.44S 255,264 2 7 2 4 2 3
Bibliografia
Aird L, Bentall HH ec al. Relationship between cancer o f stomach and ABO blood groups.
British Journal o f Medicine, 1953; (1): 799.
AJQnan DG. Statistics and ethics in medical research. III: How large a sample? British Medi
cal Journal. 1980; (28: 1336-1336.
American Heart Association. Risk factors and coronary heart disease. Circulation. 1980;
(62): 449A-455A.
Antunes CM, Stolley PD, Rosens te in NB et aL Endometrial cancer and estrogen use. Report
o f a large case-controi study. New England Journal o f Medicine. 1979; 900-913.
Armitage P. Statistical Methods in Medical Research. London, Blackwell Scientific Publica
tions, 1973.
Anniiage P, Gehan EA. Statistical methods for Ibe identification and use o f prognostic fac
tors.//rtenwtfKtnal Journal o f Cancer. 1974; (13): 16-36.
Armstrong B, Doll R. Environmental factors and cancer incidence and mortality in different
countries, with special reference to dietary practices. International Journal o f Cancer.
1975: (15): 617-631.
258/MtvMogl e la iimttigodu.
* , p * * * * * W Racmcb Group. A - g ^
riD in person* recovered from royocanfcal mfircnon- JAMA. 1WU /
Bailey NT. M W . Btoy. Loodon. H * English Umvermes Pr. Ltd.,
1972
Banco I t a A L * 1 * * ' ' * * W > "* B,D" MUD
B m o n ^ ' S ^ on the estimation o f . e M v e risk. Siometrics.
M M i G - * *
B e t e s t Gage RP. Calculation o f survival rates for cancer. <>f SmffM-
tingi o f ike Mayo Clime. 1950; {255:270-286. ___
Bernard C. An Introduction tc the Study o f Experimental Medicine. Trwsl: Henry Copley G.
New York, Dover Publications, 1957.
Blllewi WZ. T i e efficiency o f matched ampies: an empirical investigation. Biometrics.
1965; (21*623-644. . . .
Bio. WJ, Day NE. Synergism and wncon: Are t o y equivale? M m '"' f * -
demfofesy. 1979;( l i t - W O 100- * 0*1 Cali*
BMDP, Univeffiity o f California Health Sciences Compunng Facitoes, Los Angel. Cab
B o r i n g ^ S ^ ^ hiaory o f perimental controL t o J ~ n * o f P ^ l c t r y .
Bradftrf R a ! A ^ L t o o t o f medical s u t i n t e . U - *.'Hodder f t S ^ l t o n . 197.
Bieslow NE, Day NE. Swrisrical J M W in VoLJ - ^ r f
Control Study. Lyon, International Agency for Research on Caneer, 1980-
Bresto* NE. Day NE. Suaistica! Methods in Cancer * * Vol.
lysb o f Cohort Studies. Lyon, totenadonal Agency for Research on Cancer, 5 987.
Bross ID Misclassification in 2 * 2 tables. Biometrics. 1954; (10): 478^86.
Bock C. Popper's philosophy for epidemiologists. M n I A - n r f f t * * -
I L i ^ r i e g r e s s i o n with censored data. B t o v t r i k * . ig791} 6^ ^ '
nes mdicas de Antksquia, CIMA, Medellin, 1992.
CuraU KX. E*perimeettl evidence o f dietary factors end hormone dependent cancers. Can-
t * r t o e r c h . 1975; (35): 3374-3383. Archives of
Cassel JC. S u of major findmgs o f the Evans Cocnty b r . d .s e e study. A t t /u v of
Internal Medicine. 1971,(128): B87-889. . . . . ,
CBlade Boletn Demogrfico de Amrica U * . prcyeccones de poblacin, t os c a n a
rios 1950-2000.1991; (48): 31.
BMidgnfla/259
Cole P. The evolving case-control study. Journal o f Chronic Diseases. 1979; (32); 15-27.
Cole P. h: Brestow NE, Day WE. Statistical Methods in Cancer Research. V o l 1:17 Analysis
o f Case-Cootrol Study. Lyon. International Agency for Raanch in Caicer, 1980.
Colimdn KM. Fundamentos de epidemiologia. Madrid, D t t t de Santos, 1990
Copeland ICT, Checkoway H, Holbrook RH, McMichae) AJ. Bias due to nrisclassificaiioii in
the estimate o f relative risk. American Journal cfEpidemiology. 1977; (105); 488-495.
Cornfield J. A method o f estimating comparative rales from clinical data. Application to can
cer o f the lung* breast and cervix. Journal o f the National Cancer Institute. 1951; (11):
1269-1275.
Cornfield J. Statistical relationships and proof in medicine. American Statistician. 1954; (8):
19-21.
Cornfield J. Joint dependence o f risk o f coronary bean disease on serum cholesterol and sys
tolic blood pressure: a discriminant function analysis. Federal Proceedings. 1962;
(21): 58-61.
Cornfield J, Haenszei W. Some aspects o f retrospective studies. Journal o f Chronic Diseases.
1960; (11): 523-534,
Correa P. Epidemiologic correlations between diet and cancer frequency. Cancer Research.
1981; (41): 3685-3690.
Covell G. Relaciones entre la parasitemia malirica y los sfntomos de la enfermedad. Boletin
de la Oficina Sanitaria Panamericana, L 1961; (3): 223-240.
Cox DR. 'Hie analysis o f exponentially distributed life-times with two types o f failures. Jour
nal o f de Royal Statistical Society. Series B. 1959; (21); 411 -421.
Cox DR. Some applications of exponentially ordered scores. Journal o f the Howl Statistical
Society, Series B. 1964; (26): 103-t 10.
Cox DR, 7he Analysis o f Binary Data. London, Methuen, 1970.
Cox DR. Regression models and life tables. Journal o f the Royal Statistical Society, Series B.
1972; (34): 187-201
Cox DR, Oakes D. Analysis t f Survival Data. New York, Caproan and Hall, Co., 1984.
Cutler SJ, Ederer P. Maximum utilization of the li/e table method in analizing survival. Jour
nal o f Chronic Diseases. 1958; (8); 699-712.
Chase G. Klauber MR. A graph o f sample sizes for retrospective studies. American Journal
o f Public Health. 1965; (55): 1993-1996.
Daniel W. Biostaiistics: A Foundation f o r Analysis in the Health Sciences. New York, John
Wiley and Sons, 1983.
Dawber TR. The Framingham Study: The Epidemiology o f Atherosclerotic Disease,
Cambridge, MA. Harvard University Press, 1980.
Dawber TR, Meadors GF. Moore PE. Epidemiological apratthes to heart disease; The
Framingham Study. American Journal o f Public Health. 1951; 286 (41): 279-286.
Dean AG ec al. Epi Info, Version 6,0: a Word processing, database, and statistics program
f o r epidemiology on microcomputers. USD, Inc., Stone Mountain, Georgia 1994.
Dean H T , Arnold FA, Elvone E. Domestic water and caries, V. Additional studies of
the relation of fluoride domestic waters to dental caries experience in 4425 white
2 60/Metcdobgio dt la msiigocifa...
children, aged 1 2 10 14 years, o f 13 cities in 4 sates. Public Health Reports. 1942;
(57): 1155-1179.
DeMets DL, Hardy R, Friedman I M et 1. Statistical aspects o f eariy termination in the Beta-
Blocker Heart Attack Trial- Controlled Clinical Trials. 1984; (5): 362.
Dempsey M. Decline in tuberculosis: the death rate fail 10 tell the entire story. America.
Review (Tuberculosis. 1947; (86): 2.
Dixon WJ, Massey FJ. Introduction to Statistical Analysis. Tokyo, McGraw-Hill, 1963.
Doll R, Gray R, HafnerB e t a l . Mortality in relation to smoking: 22 years* observations on
female British doctors. British Medical Journal 1980; (280); 967-971.
Doll R, Hill AB. Mortality in relation to smoking: 10 years' observations o f British doctors.
British Medical Journal. 1964; 13990410.
Dot) R, Peto R, l a s causas del cdnctr. Barcelona, Salval Bdttore, 1989.
Donner A. Approach to sarnie size estimation in the design o f clinical trials - A review.
Statistics in Medicine. 1984; (3): 199*214.
Dorn HF. Some applications o f biometry in the collection and evaluation o f medical data-
Joumal o f Chronic Diseases. 1955; (I): 638-669.
Dorn HF. Some problems arising in peospective and rdrospective studies o f the etiology of
disease. New England Journal Medicine. 1959 (261): 571-579.
Draper NR, Smiih H. Applied Regression Anatysis. 2nd ed. New York, John Wiley and Sons,
1981.
Drasar BS, Irving D. Environmental factors and cancer o f the colon and breast. Brtttsh Jour
nal o f Cancer. 1973; (27): 167-172.
Dublin LI, LotkaAJ. Length r f U f e . New York. Ronald Press, 1936.
Durkheii E S u c i t e A Study in Sociology. New York. Free Press, 1951.
EGRET, Statistics and Epidemiology Research Corporation, 909 Northeast 43 rd. Street,
Suite 202. Seattle, WA 98105, USA.
Handt-Johnson R- Definition o f rates: some remarks oit their use and misuse. American Jour
nal o f Epidemiology. 1975; <102): 267*271.
Elveback U Estimation of survivorship in chronic disease: the actuarial method. Journal o f
the American Statistical Association. 1958; (53): 420-440.
EP1STAT, Epistat Services, 2011 Cep Rock Circle, Richardson, Texas, USA.
Epstein FH, Napier JA, Block W D e t a L T h e Tecumseh Study. Archives o f Environmental
Health. 1970; (21): 402-407.
Fears TR, Scotto J. Oianges in jkin cancer morbidity betweeen 1971-72 y 1977-78. Journal
o f the National Cancer institute. 1982; (69): 365-370.
Feinstfiin AR. Clinical Biosuaistics. Saint Louis, C.V. Mosley, 1977.
Fisher B, Bauer M, Margolese R et al. Five-year results o f a randomiied clinical <nalMmpa-
ring total mastectomy and segmental mastectomy w t h or w t h o u t i tre '
ment o f breast cancer. New England Journal ojMedicine. 1985; (312). 665-6 3.
Fisher RA. The arrangements o f field experiments. Journal o f the Ministry o f Agriculture.
Great Britain. 1926; (33): 503-513.
Bibliografa / 2 6 !
Fleiss JL. Statistical Methods f o r Rates and Proportions, 2nd cd. New York, John Wiley and
Sons, 1981.
Francis TF. Korns RF, Voight RB e t a l . An evaluation o f the 1954 polyometitis vaccine trials.
American Journal ofP ubiic Heahh, 1955; (45): 1-63.
Freiman JA Chal m e n TC, Smith H et al. The importance o f beta, the type n error and
sample size in the design and interpretation o f the raodwmzed control trial: survey of
"negative" trials. New England Journal o f Medicine. 1978; (299): 690-494.
Freund JB. Mathematical Statistics. 2nd ed. London, Prentice Hall, 1971.
Fnedman LM, Furberg CD, DeMets DL. Fundamentals o f Clinical Trials. Boston, John
Wright, 1981.
Gardner JW, Sanborn JS. Yeats o f potential life l o s t What does it measure? Epidemiology
1990; (1); 322-329.
Gehan EA. A generalized WDcoxoa test for comparing arbitrarily singly-censored samples.
Biometrika. 1965; (52): 203-223.
Gehan EA. Estimating survival functions from the life table. Journal c f Chronic Diseases.
1969; (21): 629-644.
Ghana Health Assesosent Project Team. A quantitative method of assesing (he health impzn of
different diseases in less developed countries. International Journal o f Epidemiology. 1981;
(10): 73-80.
Goldberger J, Waring CH, Tanner WF. Pellagra prevention by diet among institucionul in-
mates. Public Health Reports. 1923; (38); 2361-2368.
Graunt J. Natural and political observations mentioned in a fallow ing index, and made upon
the Bills c f Mortality. London. 1662.
Guerrero R, Gonzlez CL, Medina E. Epidemiologa. Mxico, Addison-Wesley Ibero
americana, 1986.
Halperin M, Blackwelder W, Verter J. Estimation c f the Multivariate Logstic Risk Function and
Maximum Likel ihood Approaches. Journal c f Chrome Diseases. 1971; (24): 125-158.
Halperio W, Beaumont J, Reeve G et si. Hi e Cohort Study. En: Epidemiology q f Occupation
al Health, Karvonen M, Mikheev M (eds). World Health Organization. Conenhacen
1986.
Hay WL. Statistics, New York, H o l t Rinehart and Wistoo, 1963.
Heiftonen OP, Stone D Shapiro S. Birth Defects nd Drugs in Pregnancy. Littleton. Mas*
sachttsets, Publishing Sources Group, 1977.
Hmoekens CH, Buring J E Epidemiology in Medicine. Boston, Little Brown and Co., 1987.
HijarMC. Mortalidad por lesiones accidentales e intencionales en el Distrito Federal de 1970
a 1986. Salud Pblica de Mxico. 1990; (32): 395*404.
A&Observation and experiment. New England Journal o f Medicine. 1953; (248): 995-
HUI AB. The environment and disease: association o r causation? Proceedings o f the Roval
Society o fM e d k in e . 1965; (58): 295*300.
Hill B. Principles o f Medical Statistics. London, H Lnce* Limited, 1971.
262/MetodoUfg(ade la inveeHgaddn^.
Hipenoision Detection and Follow-up Program Cooperative Group. Five-year findings o f the
bipertension detection and fbUow-up program; I. Reduction in mortality o f persons
with bigh Wood pressure, including mild hipeiteoaoiu JAMA. 1979; (242): 2562-2571.
Horwiti R1. Fanflcdn MD. Alternative analytic methods for case-control awfies o f estrogens
and endometrial cancer. New England Journal o f Medicine. 1978; (299): 1089-1094.
Bosnier D, Leraeshow S. Applied Logistic Regression New York, Jolm Wiley and Sons,
1989.
International Agency for Reaeaich on Cancer. Vol. V. Concur Incidence in Five Continents.
Lyon 1987. ,
Kahn HA, Sempos CT. Statistical Methods in Epidemiology. New York. Oxford University
Press. 1989.
Kalbfleisch JD. Prentice RL. The Statistical Analysis rfFailure-Time Data. New York, John
Wiley and Sons, 1980.
K-1 WB, Gordon T. The Framingham Study: flit epidemiological investigation o f car
diovascular disease. Department o f Health, Eduction and Welfare. Public Health
Service. National Institute o f Health, DHEW Publication, 1974; 574-599.
g . pin E t , Meier P. Non-parametrie estimation from incomplete observation. Journal o f the
American Statistical Association. 1958; (53): 457-481.
Kelsey j . Thompson WD, Evans AS. Methods in Observational Epidemiology. New York,
Oxford University Press 1986.
KeriingerFN. Foundations q f Behavioral Research. New York, Holt, Rinehart and Winston,
1973.
Kleiobaum DG. Kpper LL. Applied Regression Analysis and Other Multivanable Methods.
Belmont California. Wadswocth Publishing Co., 1978.
Kleinbaum DG. Kpper LL, Cassel J, Tyroier H. Multivariate analysis o f risk * r a n g
heart diffiawf in Evans County, Georgia. Archives o f Internal Medicine. 1971, (128).
943-948.
KH~h..m, DG, Kupper LL, Morgenstern H. Epidemiologic Research. Belmont, California.
Lifetime Learning Publications, 1982.
jCoopman JS. Interaction between discrete cause. American Journal o f Epidemiology. 1981;
(113): 716-724.
Koopman JS, Prevott DR- Vaca-Marin MA et a]. Determinants and * 'W* ,fl
f GaMmMe xi co. American Journal<>fEpidemiology. 1995: (133); 1168-1178.
Kupper LL, Hogan MD. Interaction in epidemiologic audies. American Journal of
Epidemiology. 1978; (108); 447-453.
Kupper LL. Karoo JM, Kleinbaum D et aL Matching in epidemiologic studies; validity and
efficiency considerations. Biometrics. 1981; (37): 271-291.
Lee ET. Statistical Methods f o r Survival Data Analysis. Belmont, California. Lifetime Leam-
ing Publications, I960.
Lilienfeid AM. Ceris pfcibw: the evolution o f he clinical trial. P r e s s e d a, the t h a n -
m a t meeting <4 the American Association f o r the History q f Mediane. Toronto,
Canada, May 1981.
Anexo
Distribuciones probabilsticas:
Distribucin normal estndar
Distribucin t de Student
Distribucin de chi cuadrado
Armo/253-
Distribucin normal estndar
Probabflidades acumuladas
2 o w 001 a n 9,03 0)04 0 .K AW 0,00 0,99
0,0 0,5000
0,S040 0,5080 0,5120 0,5160 0,5199 O.S239 0,5279 0,5319 0.5359
0,1 0,539 0,5436 0.5478 0.5517 0.5557 0.5596 0.5636 0,5675 0.5714 0,5753
OJ 0 ,5 ? 0.5632 0.5871 0.5910 0.5946 0.5967 0,6026 0,6064 0.6103 0,6141
OJ 05179 0,6217 0.6255 0.6293 0,6331 0.6366 0.6406 0,6443 0,6480 0,6517
OA 0.6S54 0.6591 0.6828 0.6664 0,6700 0.6736 0,6772 0.68C8 0.6644 0.6879
OJ 0,691$ 0,6950 0.6965 0.7D19 0.7054 0.7088 0,7123 0,71S7 0.7190 0.7224
0,6 0,7357 0,7291 0,7324 0.7357 0,7389 0,7422 0.7454 0,7486 0.7517 0,7549
0,7 0.7580 0.7611 0,7642 0,7673 0,7703 0,7734 0.7764 0,7794 0.7823 0,7852
0,8 0.7831 0.7910 0.7939 0.7967 0.7995 0.6023 0,8051 0,8078 0.8106 0,8133
0,9 0,6159 0,8186 0,9212 0.6238 0,6264 0.8289 0*315 0,8340 0.8365 0,8389
1,0 0.6413 0.843* 0.8461 0.6485 0.8508 0.6531 0.8554 0,8577 0.BS99 0.8621
1,1 0.6643 0.8665 0,8696 0.6708 0,8729 0.8749 0,8770 0,8790 0.8610 0,8830
u 0,8849 0.8869 0,8888 0.6907 0,8925 0.8943 0,8962 0,8960 0.8997 0,9015
1J
0,9092 0.9049 0,9066 0.9082 0,9099 0,9? 15 0,9131 0,9147 0.9162 0,9177
U 0,9192 0.9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0.9306 0.9319
1,3 0.9332 0,9*45 0,9357 0.9370 0,9362 0,9394 0,9406 0,9418 0.9429 0.9441
U 0,9452 0.9463 0,9474 0,9464 0,9495 0.9505 0,9515 0.9525 0.9535 0.9545
1,7 0,9554 0.9564 0,9573 0.9582 0,9591 0.9599 0,9606 0,9616 0.9625 0.9633
U 0.9641 0,9649 0,9656 0.9664 0,9671 0.9678 0.9686 0,9693 0.9699 0,9706
1.9 0.9713 C.971 0,9726 0.9732 0,9738 0.9744 0.9750 0,9756 0.9761 0.9767
2.0 0.9772 0.9778 0,9733 0.9788 09793 0.9798 0.9803 0,9806 0.9812 0.9817
2,1 0,9*21 0,9826 0,9630 0,9634 0,9838 0.9842 0.9846 0,9650 0.9854 0.9857
3 J 0.9861 0,9864 0,9666 0,9871 0,9875 0.9878 0.9881 0,9864 0.9887 0.9390
2 J 0.9893 0.9896 0.9696 0.9901 0,9904 0.9906 0.9909 0.9911 0.9913 0.9916
2A 0.9918 0.9920 0,9922 0.9924 0,9927 0.9929 0,9931 0,9932 0.9934 0.9936
2 J 0.9998 0.9940 0.9941 0.9943 0,9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0,9953 0.9955 0.99S6 0,99S7 0.9959 0.9960 0.9961 0,9962 0.9963 0,9964
2.7 0,9965 0,9966 0,9967 0,9966 0.9969 0,9970 0.9971 0.9972 0,9973 0,9974
U 0,9974 0,9975 0.9976 0,9977 0,9977 0.9978 0,9979 0,9979 0,9980 0,9981
2f 9 09981 0,9982 0,992 0,9983 0.9964 0,9984 0,9985 0.9985 0,9986 0.9986
XO 0,9986 0.9987 0.9987 0,9988 0,9988 0,9969 0.9989 0,9989 0.9990 0.9990
X1 0.9990 0,9991 0.9991 0,9991 0.9992 0,9992 0,9992 0,9992 0,9993 0,9993
1 2 0,9993 0.9993 0,9994 0,9994 0,9994 0,9994 0.9994 0.9995 0,9995 0,9995
3 J 0,9995 0,9995 0,999$ 0,9996 0,9996 0.9996 0.9996 0,9996 0,9996 0,9997
3,4 0.9997 0,9997 0.9997 0,9997 0,9997 0.9997 0.9997 0.9997 0.9997 0,999B
i s 0.9998 0,9996 0,9998' 0,9998 0,9998 0,9998 0.9996 0.9998 0,9996 0.9998
1 6 0.9998 0,9998 0,9999 05999 0.9999 0.9999 0,9999 0,9999 0.9999 0.9999
1 7 0,9999 *0.9999 0,9999 0-9999 03999 0.9999 0,9999 0,9999 0,9999 0.9999
3,9
1 9
0,9999
1,0000
0.9999 0.9999
0,9999 0.9999 0,9999 0,9999 0.9999 0,9999 0.9999
2 5 4 / Mapdoogia e Ut fofeftifddAt..
Mrtribucin t de Stuent
f in d o i fle
t f r a t f SS S S 75 S S 90 95 9 7 J 89 9&5 9**5
f 0,158 0,510 1,000 1,963 3,078 6,314 12.706 31321 63.65? 636,619
2 0,142 0,445 0,8)6 1*386
1386 2,920 4303 6.96S 9.925 31,599
j 0.13? 0,424 0,765 uso 1,636 2353 3,182 4,541 5341 12,924
4 0.134 0414 0,741 1,190 1,533 2,132 2,776 3.747 4.604 8,610
S 0.132 0,406 0,727 1,156 1,476 2,015 2,571 3.365 4,032 6369
6 0.131 0,404 0,718 1,134 1.440 1,943 * 2347 3,143 3,70? 5,959
7 0,190 0/402 0.711 1.119 1.415 1395 2,365 2,998 3399 S308
8 0,130 0,399 0,706 i;i0 8 1,397 1360 2306 2,896 3,355 5.041
j 0.12 0,398 0,703 1,100 1,383 1,839 2362 2321 3,250 4,761
19 0,129 039? 0,700 1,093 1.372 1312 2,228 2,764 3,169 4,58?
11 0,129 0,396 0.69? 1,086 1,363 1,796 2301 2,718 3,106 4337
1 2 0,126 0,395 o.es 1,083 1356 1,782 2,179 2.681 3,055 4318
1 3 0,t28 0,394 0,694 1,079 1,350 1,771 2.160 2,650 3,012 4321
U 0,128 0,393 0692 1,076 1345 1,761 2,145 2324 237?
4,140
1 5 0.128 0,393 0,691 1,074 1,341 1.753 2,131 2302 2,94? 4,073
16 0.128 0,392 0,690 1,071 1,337 1.746 2,120 2,563 2.921 4,01 S
1 ? 0.128 0,992 0,689 1,069 1,333 1.740 2,110 2,567 2398 3.965
n 0.12? 0,392 0688 1,067 1330 1.734 2,101 2,552 23?&
3.922
1 9 0,127 0,391 0686 1,066 1328 1,729 2393 2,539 2,661 3,883
2 0 0,127 0,391 0,687 1,064 1,325 1,725 2,086 2,528 2,845 3,850
2 1 0,127 0391 0,686 1.063 1,323 1,721 1,090 2,518 2,831 3319
2 2 0.127 0,390 0,666 1,061 1321 1,71? 23?<
2,508 2319 3.792
2 3 0,127 0390 0,685 1,060 1,319 1,714 i m
2,500 2307 3,768
2 4 0,127 0390 0,685 1,099 1,318 1,711 2(064 2,492 2.79? 3,745
2 5 0,127 0390 0,684 1,058 1,316 1.708 2,060 2,485 2,787 3,725
2 0.127 0,390
0,684 1,058 1315 1,706 2356 2,479 2,779 3,707
2 7 0,127 03B9 0,684 1,05? 1.314 1,703 2,052 23?3 2,771 3,690
2 0 0,127 0,389 0,683 1,056 1,313 1,701 2.0*8 2367 2,763
3,674
2 9 0,127 0,389 0.683 1,055 1311
1399 2,045 2362 2.756 3.659
SO 0.12? 0,399 0,663 1,055 1310 1,697 2,042 2357 2,750 3.646
ss 0,127 0.386 0682 1.052 1,306 1,690 2X30 2,438 2.724 3.591
4 $ 0,126 0 , 3 8 8 0,681 1,050 1,303
1364 2,021 2,423 2,704 3,551
4 5 0.126 0.388 0,680 1,049 1,301 1,679 2.014 2.412
2,690 3.520
0.126 0386 0,679 1,04? 1.299 1,676 2,009 2303 2,678 3.496
6 0,126 0,38? 0,679 1,045 1,296 1 , 6 7 1 2300 2,390 2,660 3,460
7 0 0.126 03B7 0,676 1,044 1394 1367 1,994 2361 2348 3.435
80 0.126 0,387 0,678 1,043
1392 1.664 1,990 2374 2,639 ' 3,416
90 0,126 0.387 0,677 1.042 1.291 1.662 136?
2,368 2332 3,402
m 0,126 0.386 0,677 1,042 1,290 1,660 1.984 2364 2326 3.390
120 0,126 0,386 0.677 1.041 1,289 1358 1.980 235B 2,617
3,3?3
140 0.126 0.386 OG76
1,040 1388 1,656 1377
2353 2,611 3361
1 0,126 0,386 0676 1.040 1,287 1.654 1,975 2350 2,60? 3352
180 0,126 0,366 0676 1J39 1,286 1,653 1.973
2.34? 2,603 3345
200 0.126 0366 0.676 1,039 1386 1,653 1.972 2.345 2,601 3,340
m 0.126 0,385 0,674 1.036 1,282
1,645 1,960 2.326 2.576 3391
A nu o/2 55
Distribucin de chi cuadrado
G n o t P erca * ;
i l b t n a t f 5 JO 5 9
c e 70 m 9 0 95 * r j M M i 9 $ J S
t 0,004 0,148 0 / 5 5 0,708 1,074 ' . 6 4 2 2.706 3,841 5,024 6,635 7,879 12.116
2 0,103 0.713 1.366 >,833 2,408 3.219 4,605 5,991 7,3*8 9,210 *0,957 15,202
i Q J 5 2 M 2 4 2 .366 2,946 3,665 4,642 6^251 7,815 9,348 11.345 12.838 1 7 , 7
4 0,711 2,195 3,357 4,fr*5 4 * 7 8 5,989 7,779 9 4 8 8 11.143 13,227 14.860 19.997
5 1,145 3.000 4,391 5,132 6 f l 6 4 7,289 9.236 11,070 12,833 15.086 16.750 22,105
s 1.635 3.028 5,348 6 J 1 1 7 J 3 : 8,558 10.645 12,592 ' 4 449 16,812 >6.548 24,103
7 2.167 4,671 6 , 3 4 6 7 J 8 3 6 J 8 3 9,803 12,017 14.067 16.013 16.475 20.276 26,018
9 2. 7:3 5.527 7,344 8 4 5 1 9,524 11,030 13,362 15,507 17,535 20,090 21,955 27.088
9 3.325 6.393 8,343 9,414 10.656 12.242 14.684 *6.919 19,023 21,666 23,589 29.666
tO 3.940 7,267 9,342 10473 11,761 13,442 15,987 18,307 20,483 23,209 25.188 31.420
t 4,575 8.148 10.341 11,530 1 I B 9 9 14,631 17,275 19,675 2 1 . 920 24.725 26.757 33.137
12 5.226 9,034 11,340 12.58* 14,011 15,812 19,549 21.026 23.337 26.217 2B.300 3 f 8 2 l
t i 5 S ? 9.928 12,340 13,636 15,119 16,98S 19,612 22,362 2 4 . 736 27.668 29,819 36,47
i .571 10,821 1 3 , 339 16-222 18.151 21.064 23,685 2 6 , 119 29.<41 31,319 38.109
fS 7.261 11.721 14.339 15,733 17.322 19,311 22.307 2 4 9 9 6 2 7 , 488 30,576 32,801 39.71
t s 7,962 12,624 15,338 15.780 18,418 20.485 23,542 36.296 2 8 . 845 32.000 3 4 . 2 F 41,308
77 8 .672 U 5 3 1 16,338 17.824 19.611 21.61 i 24.769 27,587 30.191 33,409 35.718 12,879
19 9 .390 14.4413 17,398 16,668 20,801 22, 60 25 989 25.669 31,526 34,805 37,156 44.434
19 10,117 15,352 1 8 J 3 8 19,910 21.689 23.900 2 7 . 2 30,144 32,652 36,191 38.582 45,973
2 6 1 0.65 16,266 19.337 20.951 22,775 25.038 28,412 31,410 34,170 3 7 , 566 39,997 47,498
21 11,591 17,182 26,337 21,991 23,856 26,171 29.615 32.671 38.47 38,932 4 1 ^401 49.011
2 2 1 2 J 3 8 18.101 21.337 23,031 2 4 , 9 27,301 3 0 J 3 33.924 36,791 4 0 . 289 4 2 , 796 50.5M
2 3 13,091 19,021 22,337 24.069 2 6 J 1 6 28.429 32.007 35.172 38.076 4 1 , 638 44.181 52.000
2 4 13,848 19,943 23,337 25.106 27,096 29.553 33.196 36.415 39.364 42.980 4 5 . 5*9 53.479
2 9 14,611 2 0 , 667 24,337 26.143 28,172 30,675 34,382 37.652 4 0 , 846 44.314 4 6 . 928 W.94?
26 1 5 J 7 9 11,792 25,336 27,17 29,246 31,795 35,563 3 8 8 8 5 41,923 45.642 4 8 , 290 56,40?
27 16.151 2 2 , 719 26,336 28.214 30.319 3 2 J 1 2 36.741
4Q113 43,195 46,963 4 9 . 64b 57.858
29 1 6 M 2 3 , 647 27,338 29,249 31.391 34J327 3 7 . 916 41.337 44. 46! 48.278 50.993 59.300
29 17,708 2 4 , 577 28,336 30,285 32,461 35.139 39,087 42,557 45.722 4 9 . 5 52.336 60,735
M W A 9 3 25.508 29,338 31,316 33,S30 36.250 4 0 . 256 43,773 46 , 979 50,992 53,6*2 62.162
J J 22,465 30.170 3 4 . 336 36,475 38,859 4 1 , 778 4 6 . 059 4 9JD2 53.203 57,342 60,275 69,199
4 0 26.509 34,872 39,335 4 1 , 622 44,165 4 7 , 269 51,805 55.7*8 59.342 63,691 6 6 7 6 6 76,095
5 3 0 . 6 12 39.S&S 4 4 J 3 5 46,761 49,452 52,729 57,505 61.856 65,410 69,957 73.166 62,876
50 34.764 4 4 , 313 4 9 . 336 51.892 54.723 58.164 63.167 67.S05 71.420 76,1*4 79,490 89,561
60 4 3 . 196 5 3 . 809 5 9 J 3 5 62,135 6 S J 2 7 6 8 4 7 3 74.397 79,082 6 3 . 298 86.379 91.952 102.695
79 5 1 , 739 6 3 J 4 6 , 1 3 4 72,358 7 5 5 8 9 79.715 85.527 9 a S 3 l 9 5 , 023 100.425 104.215 115.578
90 6 4 9 1 7 2 , 915 79,334 82,566 6 6 , 120 9 0 4 0 1 96.578 101,879 ( 0 6 , 6 2 9 112.329 116.321 128,261
90 6 9 . 126 62,511 89,334 92,761 9 6 . 524 101.054 107.565 113,145 118.136 124,116 128.299 140,782
100 77 , 929 9 2 , 129 9 9 , 334 102,946 106,906 111,667 118,498 124,342 129.S61 135,807 140.169 153.167
120 95 . 70$ 111.419 119.334 123.289 137.616 1 3 2 J 0 6 140.233 1 4 8 6 7 152,211 158,950 163,648 177,603
740 113,659 130,768 139,334 143,804 146.269 153,854 161.827 168,613 174.648 1 8 1 J 4 0 186,847 201,683
788 131,756 1S0.158 159,334 1 6 3 J 9 8 166,876 174,826 183.311 1 9 0 J I 6 196,915 2 0 4 J 3 0 209,824 225,481
109 149,969 189,566 179,334 184,173 189,446 195,743 204,704 212,304 219,044
227,056 2 3 2 . 6 2 0 29.046
2 0 0 1 6 8 2 7 9 189,049 199,334 204,434 209,965 216,609 226,02) 233,994
241,058 249,445 255,264
272,423
Bibliografia
Aird L, Bentall HH ec al. Relationship between cancer o f stomach and ABO blood groups.
British Journal o f Medicine, 1953; (1): 799.
AJQnan DG. Statistics and ethics in medical research. III: How large a sample? British Medi
cal Journal. 1980; (28: 1336-1336.
American Heart Association. Risk factors and coronary heart disease. Circulation. 1980;
(62): 449A-455A.
Antunes CM, Stolley PD, Rosens te in NB et aL Endometrial cancer and estrogen use. Report
o f a large case-control study. New England Journal o f Medicine. 1979; 900-913.
Armitage P. Statistical Methods in Medical Research. London, Blackwell Scientific Publica
tions, 1973.
Anniiage P, Gehan EA. Statistical methods for the identification and use o f prognostic fac-
tors. International Journal o f Cancer. 1974; (13): 16-36.
Armstrong B, Doll R. Environmental factors and cancer incidence and mortality in different
countries, with special reference to dietary practices. International Journal o f Cancer.
1975: (15): 617-631.
258/MtvMogl e la matigadk..
* , p * * * * * W Racmcb Group. A - g ^
riD in person* recovered from royocanfcal mfircnon- JAMA. 1WU /
Bailey NT. Statistical M W . Btoy. Loodon. H * English Umvermes Pr. Ltd.,
1972
Banco I t a A L * 1 * * ' ' * * W > "* B,D" MUD
B m o n ^ ' S ^ on the estimation o f . d r i v e risk. Siometrlcs.
M G - * *
B e t e s t Gage RP. O t o l a o a o f survival rates for cancer. <>f SmffM-
tings o f ike Mayo Clime. 1950; {255:270-286. ___
Bernard C. An Introduction t c the Study o f Experimental Medicine. Trwsl: Henry Copley G.
New York, Dover Publications, 1957.
Blllewi WZ. T i e efficiency o f matched ampies: an empirical investigation. Biometrics.
1965; (21*623-644. . . .
Bio. WJ, Day NE. Synergism and i w n o i o n : Are toy equivale? Ammern Journal ofEpt-
d e n t i o i w . 1979;( l i t - W O 100- m od Cali.
BMDP, Univcffiity o f California, Health Sciences Computing Faatoes, Los Angel. Cab
B o r i n g ^ S ^ ^ ^ f perimental comroL t o Journal o f Psychiatry.
Bradftrf R a ! A ^ L t o o t o f medical statistics. Loctai.Hodder f t S ^ l t o n . 197.
Bresiow NE, Day NE. Swrisrical Methods in VcL f c T t e A j j J * <* Cas'
Control Study. Lyon, International Agency for Research on Caneer, 1980-
Biesknv NE. Day NE. Statistical Methods in Cancer K e s e a r c i V o l ^ P ^ 1
lysb o f Cohort Studies. Lyon. Internacional Agency for Research on Cancer, 5 987.
Bross ID Misclassification in 2 * 2 tables. Biometrics. 1954; (10): 478^86.
Bock C. Popper's philosophy for epidemiologists. M n I Journal c f M
-egression with censored data. Bt ov tr i k*.
nes mdicas de Antksquia, CIMA, Medellin, 1992.
CuraU KK. Ejiperimeottl evidence o f dietary factors md hormone depeodent cancers. Can-
t s r t o e a r c h . 1975; (35): 3374-3383. Archives of
Cassel JC. S i m m s * of major findmgs o f the Evans Cocnty b r . d .s e e study. Archives of
Internal Medicine. 1971,(128): B87-889.
CBlade Boletn Demogrfico de Amrica U * . pwyeccones de pobbctn, t os caJenda-
rios 1950-2000.1991; (48): 31.
BMidgnfla/259
Cole P. The evolving case-control study. Journal o f Chronic Diseases. 1979; (32); 15-27.
Cole P. h: Brestow NE, Day WE. Statistical Methods in Cancer Research. V o l 1:17 Analysis
o f Case-Cootrol Study. Lyon, International Agency for Raanch in Caicer, 1980.
Colimdo KM. Fundamentos de epidemiologia. Madrid, D t t t de Santos, 1990
Copeland ICT, Checkoway H, Holbrook RH, McMichae) AJ. Bias due to nrisclassificaiioii in
the estimate o f relative risk. American Journal efEpldemiology. 1977; (105); 488-495.
Cornfield J. A method o f estimating comparative rales from clinical data. Application to can
cer o f the lung* breast and cervix. Journal cfthe National Cancer Institute. 1951; (11):
1269-1275.
Cornfield J. Statistical relationships and proof m medicine. American Statistician. 1954; (8):
19-2!,
Cornfield J. Joint dependence o f risk o f coronary bean disease on serum cholesterol and sys
tolic blood pressure: a discriminant function analysis. Federal Proceedings. 1962;
(21): 58-61.
Cornfield J, Haenszei W. Some aspects o f retrospective studies. Journal o f Chronic Diseases.
1960; (11): 523-534,
Correa P. Epidemiologic correlations between diet and cancer frequency. Cancer Research.
1981; (41): 3685-3690.
Covell G. Relaciones entre la parasitemia malirica y ios sfntomos de la enfermedad. Boletin
de la Oficina Sanitaria Panamericana, L 1961; (3): 223-240.
Cox DR. 'Hie analysis o f exponentially distributed life-times with two types o f failures. Jour
nal o f de Royal Statistical Society, Series B. 1959; (21): 411 -421.
Cox DR. Some applications of exponentially ordered scores. Journal o f the R<rtal Statistical
Society, Series B. 1964; (26): 103-t 10.
Cox DR, 77k Analysis o f Binary Data. London, Methuen, 1970.
Cox DR. Regression models and life tables. Journal o f the Royal Statistical Society, Series B.
1972; (34): 187-201
Cox DR, Oakes D. Analysis t f Survival Data. New York, Caproan and Hall, Co., 1984.
Cutler SJ, Ederer P. Maximum utilization of the li/e table method in analizing survival. Jour
nal o f Chronic Diseases. 1958; (8); 699-712.
Chase G. Kiauber MR. A graph o f sample sizes for retrospective studies. American Journal
o f Public Health. 1965; (55): 1993-1996.
Daniel W. Biostatistics: A Foundation f o r Analysis in the Health Sciences. New York, John
Wiley and Sons, 1983.
Dawber TR. The Framingham Study: The Epidemiology o f Atherosclerotic Disease,
Cambridge, MA. Harvard University Press, 1980.
Dawber TR, Meadors GF. Moore PE. Epidemiological apratthes to heart disease; The
Framingham Study. American Journal o f Public Health. 1951; 286 (41): 279-286.
Dcac AG et al. Epi info. Version 6,0: a Word processing, database, and statistics program
f o r epidemiology on microcomputers. USD, Inc., Stone Mountain, Georgia 1994.
Dean H T , Arnold FA, Blvone E. Domestic water and caries, V. Additional studies of
the relation of fluoride domestic waters to dental caries experience in 4425 white
2 60/Metcdobgio dt la mstigocifa...
children, aged 1 2 10 14 years, o f 13 cities in 4 sates. Public Health Reports. 1942;
(57): 1155-1179.
DeMets DL, Hardy R, Friedman I M et 1. Statistical aspects o f eariy termination in the Beta-
Blocker Heart Attack Trial- Controlled Clinical Trials. 1984; (5): 362.
Dempsey M. Decline in tuberculosis: the death rate fail 10 tell the entire story. America.
Review ofTubercuktsis. 1947; (86): 2.
Dixon WJ, Massey FJ. Introduction to Statistical Analysis. Tokyo, McGraw-Hill, 1963.
Doll R, Gray R, HafnerB e t a l . Mortality in relation to smoking: 22 years* observations on
female British doctors. British Medical Journal 1980; (280); 967-971.
Doll R, Hill AB. Mortality in relation to smoking: 10 years' observations o f British doctor*.
British Medical Journal. 1964; 13990410.
Dot) R, Peto R, l a s causas del cdnctr. Barcelona Salvas Bdito*, 1989.
Donner A. Approach to sample size estimation in the design o f clinical trials - A review.
Statistics in Medicine. 1984; (3): 199*214.
Dorn HF. Some applications o f biometry in the collection and evaluation o f medical data-
Joumal o f Chronic Diseases. 1955; (I): 638-669.
Dorn HF. Some problems arising in peospective and rdrospective studies o f the etiology of
disease. New England Journal Medicine. 1959 (261): 571-579.
Draper NR, Smith H. Applied Regression Analysis. 2nd ed. New York, John Wiley and Sons,
1981.
Drasar BS, Irving D. Environmental factors and cancer o f the colon and breast. Brtttsh Jour
nal o f Cancer. 1973; (27): 167-172.
Dublin LI, Lotka AJ. Length of Life. New York. Ronald Press, 1936.
Durkheim E Sucide: A Study in Sociology. New York. Free Press, 1951.
EGRET, Statistics and Epidemiology Research Corporation, 909 Northeast 43 rd. Street,
Suite 202. Seattle, WA 98105, USA.
Elandt-Johnson R- Definition o f rates: some remarks oit their use and misuse. American Jour
nal o f Epidemiology. 1975; <102): 267*271.
Elveback U Estimation of survivorship in chronic disease: the actuarial method Journal o f
the American Statistical Association. 1958; (53): 420-440.
EPISTAT, Epistat Services, 2011 Cap Rock Circle, Richardson, Texas, USA.
Epnein FH, Napier JA, Block WD e t a l The Tecumseh Study. Archives o f Environmental
Health. 1970; (21): 402-407.
Fears TR, Scotto J. Changes in jkin cancer morbidity betweeen 1971-72 y 1977-78. Journal
o f the National Cancer Institute. 1982; (69): 365-370.
Feinstfiin AR. Clinical Biosuaistics. Saint Louis, C.V. Mosley, 1977.
Fisher B, Bauer M, Margolese R et al. Five-year results o f a randomiied clinical <nalMmpa-
ring total mastectomy and segmental mastectomy w t h or w t h o u t i tre '
ment o f breast cancer. New England Journal a f Medicine. 1985; (312). 665-6 3.
Fisher RA. The arrangements o f field experiments. Journal o f the Ministry o f Agriculture.
Great Britain. 1926; (33): 503-513.
Bibliografa / 2 6 !
Fleiss JL. Statistical Methods f o r Rates and Proportions, 2nd cd. New York, John Wiley and
Sons, 1981.
Francis TF. Korns RF, Voight RB etal. An evaluation o f the 1954 polyometitis vaccine trials.
American Journal q f Public Health, 1955; (45): 1-63.
Freiman JA Chalmers TC, Smith H et al. The importance o f beta, the type n error and
sample size in the design and interpretation o f the raodwmzed control trial: survey of
"negative" trials. New England Journal o f Medicine. 1978; (299): 690-494.
Freund JB. Mathematical Statistics. 2nd ed. London, Premice Hall, 1971.
Fnedmao LM, Furberg CD, DeMets DL. Fundamentals o f Clinical Trials. Boston, John
Wright, 1961.
Gardner JW, Sanborn JS. Yeats o f potential life l ost What does it measure? Epidemiology
1990; (1); 322-329.
Gehan EA. A generalized WDcoxon test for comparing arbitrarily singly-censored samples.
Blometrika. 1965; (52): 203-223.
Gehan EA. Estimating survival functions from the life table. Journal c f Chronic Diseases.
1969; (21): 629-644.
Ghana Health Assesosent Project Team. A quantitative method of assesing (he health impzn of
different diseases in less developed countries. International Journal o f Epidemiology. 1981;
(10): 73-80.
Goldberger J, Waring CH, Tanner WF. Pellagra prevention by diet among institucionul in-
mates. Public Health Reports. 1923; (38); 2361-2368.
Graunt J. Natural and political observations mentioned in a fallowing index, and made upon
the Bills o f Mortality. London. 1662.
Guerrero R, Gonzlez CL, Medina E. Epidemiologa. Mxico, Addison-Wesley Ibero
americana, 1986.
Halperin M, Blackwelder W, Verter J. Estimation c f the Multivariate Logstic Risk Function and
Maximum Likel ihood Approaches. Journal c f Chrome Diseases. 1971; (24): 125-158.
HaJperio W, Beaumont J, Reeve G et si. Hie Cohort Study. En: Epidemiology q f Occupation
al Health, Karvonen M, Mikheev M (eds). World Health Organization. Copenhacen
1986.
Hay WL. Statistics, New York. Holt Rinehart and Wiston, 1963.
Hanonen OP, Stone D Shapiro S. Birth Defects and Drugs in Pregnancy. Littleton. Mas*
sachttsets, Publishing Sources Group, 1977.
Hmnekens CH, Buring JE Epidemiology in Medicine. Boston, Little Brown and Co., 1987.
HijarMC. Mortalidad por lesiones accidentales e intencionales en el Distrito Federal de 1970
a 1986. Salud Pblica de Mxico. 1990; (32): 395*404.
A&Observation and experiment. New England Journal o f Medicine. 1953; (248): 995*
HUI AB. The environment and disease: association or causatioo? Proceedings o f the Roval
Society ofMedktne. 1965; (58): 295*300.
Hill B. Principles o f Medical Statistics. London, The Lnce* Limited, 1971.
262/Metodtriogb de la inveeHgaddn^.
Hipenoision Detection and PoUow-up Program Cooperative Group. Five-year findings o f the
bipenension detection and fbllow-up program; I. Reduction in mortality o f persons
with bigh Wood pressure, including mild hipeitensioiu JAMA. 1979; (242): 2562-2571.
Horwiti R1. Feinstem MD. Alternative analytic methods for case-control stwfies o f estrogens
and endometrial cancer. New England Journal o f Medicine. 1978; (299): 1089-1094.
Bosnier D, Leraeahow S. Applied Logistic Regression New York, John Wiley and Sons,
1989.
International Agency for Rcaeaich on Cancer. Vol. V. Concur Incidence in Five Continents.
Lyon 1987. ,
Kahn HA, Sexnpos CT. Statistical Methods in Epidemiology. New York. Oxford University
Press. 1989.
Kalbfleisch JD. Prentice RL. The Statistical Analysts rfFaiiure-Tlme Data. New York, John
Wiley and Sons, 1980.
K-1 WB, Gordon T. The Framingham Study: flit epidemiological investigation o f car
diovascular disease. Department o f Health, Eduction and Welfare. Public Health
Service. National Institute o f Health, DHEW Publication, 1974; 574-599.
K . pian E t , Meier P. Non-parametrie estimation from incomplete observation. Journal o f the
American Statistical Association. 1958; (53): 457-481.
Kelsey j . Thompson WD, Evans AS. Methods in Observational Epidemiology. New York,
Oxford University Press, 1986.
KeriingerFN. Foundations q f Behavioral Research. New York, Holt, Rinehart and Winston,
1973.
Kleinbaum DG, Kupper LL. Applied Regression Analysis and Other Multivariable Methods.
Belmont California. Wadsworth Publishing Co., 1978.
Kleinbamn DG. Kupper LL, Cassel J, Tyroier H. Multivariate analysis o f risk * r a n g
heart diffiawf in Evans County, Georgia. Archives o f Internal Medicine. 1971, (128).
943-948.
KH~h..m, DG, Kupper LL, Morgenstern H. Epidemiologic Research. Belmont, California.
Lifetime Learning Publications, 1982.
Koopman JS. Interaction between discrete causes. American Journal o f Epidemiology. 1981;
(113): 716-724.
Koopman JS, Prevots DR- Vaca-Marin MA et a]. Determinants and * 'W* ,fl
fection in Mexico. American Journal o f Epidemiology. 1995: (133); 1168-1178.
Kupper LL, Hogan MD. Interaction in epidemiologic audios. American Journal of
Epidemiology. 1978; (108); 447-453.
Kupper LL. Karoo JM, Kleinbaum D et aL Matching in epidemiologic studies; validity and
efficiency considerations. Biometrics. 1981; (37): 271-291.
Lee ET. Statistical Methods f o r Survival Data Analysis. Belmont, California, Lifetime Leam-
tag Publications, I960.
Lilienfeid AM. Ceris pfcibw: the evolution o f he clinical trial. P r e s s e d a, the 5 4 t h * r.-
m a t meeting <4 the American Association f o r the H u m y Of Mediane. Toronto,
Canada, May 1981.
BiWograffe /263
Ulienfi ^ S S fS D& FUndamen,os * * * * * * > # . Bopxd, Fondo Educative ta-
Und J. r o r t qftiut Scurvy. Edimborgh, Sands, Murray and Cochran. ] 753.
Lipid Research Clinics Program. The Lipid Rescrch Clinics Coronary Primary Pievcttion
"Mute; I. Raduciioo o f incidence o f CHD. JAMA. 1984: (251): 351-364.
^ S n S i ^ cm of upon lhe ioW* *f a *
LOethT n ' l S raViSfl DC' DtSCrip,iVe Swilslics f o r Sociologists. Boston. Ally and Bacon
61 C nSUmo * * " G l a r e s loiescen.es
131-137 Bole,in d e l e Ojicma Sanitaria Pancmerttana. 1992: (112):
" * 1 E I 2 ? MC,/ 5 2 T ' and entl0mfi,riil1 csmKr in a retiremeat ccmmuni.y. New
England Journal ofMeJtcme. 1976; (294): 1622-1667.
MucMtthon B. Pugh T. Epidemiology. Boston, Liule. Brown, and Co.. 1970.
Maloney EM. Murphy EL, Rgueroa J p e t al. Human T-lymphotropic vims type IIHTLV I)
aine in ilS eon'
M e w 0H^ T l - W' ^ ' iSHCal f* C f d8,a fr m I t t l h e a w t e - of disease. W -
not o f {he National Cancer Institute, 1959; (22): 719-748
" 5 . a S T ^ Epidemi0losy: Att
Meineit CL. Clinical Trials. New York, Oxford University Press 1986
Mejfe F1UraCi5n de la C0 " id f colnmbianas II.
Ca5 BUle'in * 0J!ci" Sa",a" a '"""rkmm.
MietIi"6 8 a i * S F * * * * * * * * ase f " * * * . Biometrics.
s in 'he Mse r f - l~ resp -
^ ^ *
' Z E S ^ A ' S S ? in - ? * - *
*
w l!L RL G7 n M? Z A- S univalA na,y ^ New York, John Wiliey and Sons. 1981.
, s f . s s , 1' - * *
2 6 4 /Metodologia de to rmwigacjdn...
Morris JN, Kagan A. Pathson DCetaL Incidence and prediction o f ischaemic heart disease in
London busmen. Lmcet. 1966; (2): 553-359.
Mueller J, Schuessler K, Costner H. Statistical Reasoning in Sociology*. Boston. Houghton
Mifflin C o . 1971.
Multiple Risk Factor Intervention Trial Research Group. Multiple Risk Factor Intervention
Trial: risk factor duuiges and morbidity results. JAMA. 19B2; <248): 1465*1477.
Murray C. Quantifying the burden of disease: the technical basis for disability adjusted life
years. Bulletin o f the World Health Organization. 1994; (72): 429-445.
Murray C l i f f i A. Quantifying disability: data, methods, and results. Bulletin o f the Worid
Heal A Organization* 1994; (72): 481-494.
Office o f Population Censuses and Surveys: Ocupational Mortality, Series DSNo J. London,
1970:5-16.
Patrick R, Cassel JC, Tyrol HA et al. The P o m p t Study o f the Health Effects o f Cultural
Change. Annual Meeting, Society for Epidemiologic Research, Berkeley, California,
1974,
Peto R, Peto J. Asymptotically efficient rank invariant procedures. Journal o f the Royal
Statistical Society, Series A. 1972; (135): 385-207.
Peio R. Pike MC, Armitage P et al. Design and analysis of randomized clinical trials re
quiring prolonged observation o f each paiient, 1: Introduction and design. British Jour-
nai o f Cancer. 1976; (34): 5S5-612.
Peto R, Pike MC, Armitage P et aL Design and analysis o f randomized clinical trials requir
ing prolonged observation erf each patient, U: Analysis and examples. British Journal
f Cancer. 1977; (35): 1-38.
Pianudosi S, Byar D, Green S. The ecological fallacy. American Journal o f Epidemiology.
198ft; (127): 893-904.
Press J, Wilson S. Choosing between Logistic Regression and Discriminant Analysis. Jour*
nal i f the American Statistical Association. 1978; (73): 699*705.
Robins JM, Breslow N. Greenland S. Estimators of the Mantel-Haensael variance consistent
in bod) sparse data and large straia limiting models. Biometrics. 1986: (42): 3 11-323.
Robinson WS. Ecological correlations and the behaviour o f individuals. American Sociology
Review. 1950; (15): 351-357.
Rotneder JM, McWhinnie JR. Potential years o f life lost between ages 1 and 70: an indicator
of premature mortality for health planning. International Journal o f Epidemiology.
1977; (6): 143-151.
Rosenman RH, Brand RJ, Jenkins CD et al. Coronary heart disease in-tfie Western Col
laborative Study. Final folkw-up experience o f 8,5 years. JAMA. 1975; (233): 872-
877.
Rosenman RH, Friedman M, Straus R, et al. A predictive study o f coronary heart disease: the
Weaem Collaborative Group Study. JAMA. 1964; (189): 15-22.
Rothman KJ. Causes. American Journal o f Epidemiology. 1976; (104): 587-592.
Rothman KJ. Induction and latent periods. American Journal o f Epidemiology. 1981; (114):
253-259.
Rothman KJ. Modem Epidemiology. Boston, Little, Brown and Co., 1986.
BibHo$rof\a/265
R0lt' n w J ^ n ' ^ n M Wrt 0 Programmable Calculator.
h i Dd weifare- f
^ * *
SKkett DL. Bias i . anaiy.ic research. Joumat o f chronic Diseaset. 1979; (32)- SI -63
i a r a c c ^ I n t e r a c t s and sinetgism. American Journal o f Epidemiology. 1980; (M2); 465-
San"ef U L U ti KxW' ' o f e l i o l o g i c facton in chromic disease-
nmher comments. Journal o f Chronic Diseases. I960; (11): 61-63.
SAS Institute Inc, SAS Circle, Po. Box 8000, Cary, North Carolina, USA
5 ,2 7 " * T S01" RadiiUi ' ln: Scholtefc'd D, Freumeni JF Jr. eds
Prfven,i ' Philadelphia. W. B. Saunders Co 1982
M & i EPidtmi l g y o f Occupational Health. Karvonen
M, Mikheev M (eds). World Health Organization, Copenhagen, 1986
" * * Journal o f EpiemU,
Schlesselman JJ. Case-Comrot Studies. New Yort. Onford University Press, 1982
Schles^manJJ Sample * t e requirements in cohort and - c o n t r o l studies or disease
American Journal o f Epidemiology, ) 974; (99): 3 I -384
S c h w a JA. Hulka BS. Fowler WC e. ul. n , influence o f exogenons estrogen use on
! 9 8 7 ; ! i l 5i r end0me,rijl ranCer- Jou!
Segl ML Af ^ { T * ? ? * * T f n r S ' ,M e<,5ileSi* 51 * >9- Nagoya Japan
g i Institute o f Cancer Epidemiology, 1979.
^ f A on and endometrial carcinoma
New England Journal o f Medn ine. 1975* (293)-1164-1167
Snede^rGW. Cochran WG. S t a t i c , Methods. Iowa. The .owa State University f t * * .
SPSS, SPSS Inc., 444 N. Michigan Avenue, Chicago, Illinois. USA
f AT^ - C,tel ^^war* Corporation. 137 Erie Street. Cambridge. MA 02139. USA
w ' i 1! T 0i r lyii! !n ,tUdi ^ lhe Of < dtscuuion
w j reference to large bowel cancer. Journal o f Chnmic Diseases. 1976: (29): 435.
Sl'iv^ DF. ConcejDtual problem, in developing an index o f health. US Public Health Ser
Sullivan DF. A single de, o f mortality and nwttdky. Health Reports. 1971 (86)- 347-354
s^ x . r i ^ o tsszxzsr-
- i r ,n -
2 6 6 / MetodobgtQ de lo mveffigacin...
The Health Ccnsecuences q f Smoking: a report o f the Surgeon General. Washington. DC.
Government Printing Office. 1984.
The Review Panel on Coronary-prone Behaviour and Coronary Heart Disease. Coronary-
prone behaviour and coronary heart disease. Circulation. 1981; (63): 1199-1215.
Trufifl J, Cornfield J, Kannel W. A multivariate analysis o f Ihe risk o f coronary heart disease
in Framingham. Journal o f Chronic Diseases. 1967; (20): S11-524.
Urbach F. Geographic Distribution o f Skin Cancer. Journal o f Surgical Oncology. 1971; (3):
219-234.
U.S. Department o f Heaftb and Human Service. Rjblk Health Service. Seventh Special
Repon to the U.S. Congress on Alcohol and Health from the Secretary o f Health and
Human Services. January, 1990.
U.S. Public Health Service. Smoking and Health. Report of the Advisory Cominee to the Sur
geon General o f the Public Health Service. U.S. Department o f Health, Education and
Welfare, Public Health Service, Center for Disease Contro), PHS Publication No.
0 3 ,1964.
Walter SD. Determination o f significant relative risks and optimal sampling procedures in
prospective and retrospective comparative studies of various sizes. American Journal
Epidemiology. 1977; (105,4): 387-397.
Walter SD. Calculation o f attributable risk from epidemiological data. International Journal
Epidemiology. 1978; (7): 157-182.
Waher SD, Hoiford TL Additive, multiplicative and other models for disease risks.
American Journal o f Epidemiology, 1978; (108): 341-346.
Wigle DT, Mao Y, Semenciw R et al. Premature deaths in Canada: impact, trends and
opportunities o f prevention. Canadian Journal o f Public Health. 1990; (81): 376-
381.
Wilhelsmem L, Ljungberg S. Wedei H et al. A comparison bei ween participants and non-par-
cicipaats in a primary prevention trial. Journal o f Chronic Disease. 1976; (29); 331-
339.
Worscester J. Matched samples in epidemiologic studies. Biometria. 1964; (20): 840-846.
Yerushalmy J, Palmer CE. On che methodology of investigations o f etiologic factors in
phronic diseases. Journal o f Chronic Diseases. 1959; <10): 27-40.
Ziei HK, Finkle WD. Increased risk o f endometrial carcinoma among users o f conjugated
estrogens. New England Journal o f Medicine. 1975; (293): 1167-1170.
w
Indice
analtico
A
adherencia 59-6], 80
ajuste
de tasa* 1)3
anlisis
de asociaciones etolgicas 67
de te informacin 28, 37, 129
de te mortalidad 2 1 1
de la varianza 167
de los resultados 59
de observaciones 177
de regresin 167, 170, 173, 178, 179
de supervivencia 193
de varianza 167, 171, 172
discriminante 166, 167, 172, 173
epidemiolgico 149
estadstico 153, 158
estratificado l i a 129, 130, 137, 146,
150, 155-158, 162, 177,
178, 179, 244
multivaado 78, 110, 162, 165, 166,
173, 178
regresin 167
aos de vida
potencialmente perdidos 45, 193,
211-213, 215
saludable 45. 193, 213
asignacin
aleatoria 24, 48, 49, 55, 62
causal 19, 23
etioigica 69. 182
indirecta 21
meramente estadstica 20
observada 22. 23
positiva 40
C
caractertstcas de base 49. 51. 52, 55, 61
casos
y controles
Vase estudio de casos y controles
hospitolarios 91, 107
incidentes 92
poblacionoles 91
prev&lentes 92
categorizacin
Vase clasificacin
causalidad 19
necesarias 20
suficientes 20
clasificacin
2 6 8 i Metooagia tfr a invtuigacin
discriminaste 31
exhaustiva 31
coeficiente
de determinacin 169 170
de regresin 169,176
coherencia de los haDazga 23
cohortes
dinmicas 69. 70
fijas 69
colineadad 188
complejo causal 20
confusin
Vase sesgos de confusin
conocimiento etiogtco 23, 149
controles
Vase estudio de casos y controles
hospitalarios 91, 92
poblackmaJcs 91
corva de supervivencia 198
D
diagnsticos de raorbinuvtatidad 24
disparidades 86-88, 303, 105, 131-136,
141-144, 159. 161, 377
duracin de la enfermedad 35
E
efecto placebo 62
eficiencia 56, 155, 156, 158, 160, 162,
244
encuestas de prevaleocia 25
ensayos
clnicos 24, 52. 62
comunitarios 55
de laboratorio 23
entrevista personal 80
epidemiologa ocupackmal 79, 126
eqpanmiento 58, 78, 110, 150, 155,
156-159. 163-163
177, 244
1 R 161
individual 154. 158. 159. 160
enor
aleatorio 98,167
de clasificacin 106
mximo tolerable 218. 222
tipo I 57
tipo 11 57
estilo de vida 19. 190
estimacin de intervalo 71. 141
estrategias metodolgicas 23. 110. 114
estratificacin en el anlisis
Vase anlisis estratificado
estructura etrea 114.116, 117
estudios '
ana Uticos 24. 25.99. 129. 217. 224.248
ciegos 106
colaboravos 80
comparativos 182, 205
cuastexperimeDiales 24
de campo 53, 56
de casos y controle* 83-86 92 93, 94,
104, 106, 107, 132. 137, 142. 156,
157, 227, 247
de corte 25
de seguimiento 67, 6 8 , 7 0 . 75, 76,
78-80. 83, 84, 94, 103. 137. 138,
142, 156, 236, 247
descriptivos 24* 25, 217
doble ciego 61
ecolgicos 181,182, 187-190
experimentales 21, 23. 24. 47-49,
52, 53, 55-58, 61, 63, 75. 247
exploratorios 9 3 ,1 8 2
mixtos 185
multicentro 56, 59
observaonales 24, 49. 68, 181
preventivos 55
prospectivos 25
retrospectivos 25
estudios de cohorte
Vase estudios de seguimiento
etiologa 24
evaluacin ciega 106
F
factor
causal 20. 131
Indice/269
de riesgo 18.-22. 31. 37. 39-44, 7 a 84,
8 5 . 8 8 , 9 3 , 9 9 , 100, 108. 114, 122.
126. 131. 134. 135. J40. 147*149,
154, 157-159. 181. 182, 223, 246,
248
factores
biolgicos 19
causales 20, 40 41
fsicos 19
gnetic 1S
modificables 21
sociales 19
fajada ecolgica 186
fraccin
prevenible 43
fraccin etiolgca
Vase riesgo atribuible
funcin
de peligro 194, 198, 208
de supervivencia 194, 198, 203, 204
discriminante 173
logstica 16, 174
de la mortalidad 213
preventivo 44
incidencia acumulada 34. 69, 70, 72
indicadores poblacfonales 183. 190
interaccin
de los modelos 78
intervalo de confiares 103, 10, 123,132
136 141-144 203, 223
intervencin 23 51. 53, 55, 56, 60, 182,
186 190
investigacin
epidemiolgica 17, 19, 23, 24, 27, 33,
37, 47, 63, 97. 98. 113, 165-167
173. 181, 185, 189, 194
investigacin etlolgica
Vase estudios analticos
investigacin experimental
Vase estudios experimentales
logit 174, 175 177
grupo
control 49. 51, 53, 55, 57 62
de comparacin 76, 77, 154,236-239
244, 247
experimental 49. 51, 53-55, 57, 61,
106
ex temo 77
interno 76
H
hiptesis
alternativa 57. 135, 225
etiotgica 24, 182, 188, 189
nula 57, 71, 118. 135. 138, 139, 160.
171, 205, 20 6 ,2 2 5 , 226 236
historia natural y social 23
impacto
M
mcdkb
ajustada 109, 131. 141
brota 109
cruda 131
de asociacin 102 105. 107. 109, 110,
130-133, 140, 142. 143. 149. 156,
157. 159
dej electo 181
medidas peveativas 56, 113
mtodo
actuara! 194, 20J, 202
de mxima verosimilitud 131
directo 113, 114, 118. 120-122.
125, 126
experimental 83
induecto 114, 125 126
modelo
aditivo 144 146 149
deCox 193, 208,210.211
de regreskbi 146, 181 183
de riesgos proporcionales 208
27Q/kttodoiofia d r i m i i i f w M R .
ecolgico 187
lineal 1 4 5 , 1 6 7 , 1 7 3 , 177
logbtico 166,177
multiplicativo 144, 146-149, 177,211
multivariado ISO, 177,179, 206
mcrtmnonalidad 1 9 , 2 4 , 32, 3 5 , 4 0 , 1 8 2
muestre aleatoria 102, 155,156, 217,222
mltiples
efectos 80
exposiciones 80
N
nivel
de intervalo 30
de medicin 30, 31
de razn 30
de significacin 73, 89,100,225*228.
236, 239, 244
nomina] 28-30
ordinal 29, 183
O
observaciones
censurada 202, 203
no censuradas 202, 203, 205
P
pareo 154, 158
periodo 197
periodo de induccin 76, 78
periodo de latencia 7 5 , 1 8 5 , 1 8 8
placebo 49, 53, 55, 61, 62, 209
poblacin
de estudio 49-53, 56, 61
de referencia 50
estndar 114, 117-122, 126
experiiDBital 50, 51, 52
infinita 221
poder
de la prueba 226, 246
estadstico 207, 228
precisin 5 a 98, 101,102, 105,200,
218-220, 223
prediccin 1 6 9 , 1 7 0 , 1 7 3 , 1 7 8
prevstencia *
de p s i o d o o lpsfca 33
de punto 33
prevencin 18, 21.24, 33, 35, 3 6 , 4 4 , 4 8 ,
53. 56, 213, 214
probabilidad
acumulada f e supervivencia 194,198,
200,202-205
condicionada de supervivencia 198
programa* de intervencin 182,190
programas preventivos 23, 3 3 .1 8 6
proporcin
de incidencia 36, 37,41-44,
68, 102. 237. 238
de prevalends 102, 218
del riesgo atribuible 4 3 , 4 4 , 89
protocolo 55, 61, 80
prueba
de hiptesis 101, 189,206
de homogeneidad 149
de Bignicado 71, 7 3 , 7 4 , 88,100,
101-103,118,123, 124, 131-135,
137, 138, 141, 144, 148, 160, 161,
169, 171,206
R
razn
ajustada 138
de disparidades 86*88, 103, 105,
131-136,141-144,159,161,177
de riesgos 39, 132
regresin
logstica 165. 167, 177.178
mltiple 167
restriccin 110
riesgo
atribuible 40-44, 72, 7 3 , 7 5 , 89, 132,
145
de enfermar 22, 37, 40, 144
relativo 39, 4 a 42, 44, 70, 73, 86-89,
102, 103,108, 132-134,136-138,
140-142, 146-148, 175-177,
208-210, 227, 22B, 236-239, 244.
247, 248
lnd\ct/27l
s
salud ocupad onaJ 70
secuencia temporal 22
eleccin
de los casos 49. 5 a 90* 92, 107. 155,
228
sees de tiempo 24
sesgos
de confusin 78* IOS, l i a 129
de informacin 77, 105. 106
de memoria 92
de seleccin 77. 90-93, 107, 108
sofafeequiparamienio 157,158
T
tabla de
2 x 2 86, 88, 156
supervivencia ,193-195. 197, 200
vida 213
tamao muestra! 56-59, 93, 98, 101,
15a 217, 219-224, 226-228, 236-239,
245-249
tasa ajustada 120, 121. 126
tasa bruta 115
lasa de incidencia 34, 35, 38, 39. 7 a 74,
78,118.236
M s e s p e c f f i c 114, 116, 117, 119, 121*
122, 126
tecnologa de k computadores {66
U
unidad de
anlisis 181
medida 181
V
validas 61, 79* 9 a 98, 105, 155, 156
valor de P 99, 101. 102, 141. 160
variable
de confusin 109. 131* 133, (62, 245
dependiente 32, 165, 167, 171, 172
discreta 31
independiente 20. 23. 32. 49. 169
nominal 29
potencial de confusin 130
variable continua 10a 177