Sie sind auf Seite 1von 30

Universidad de Navarra Dpto. M.

Preventiva y Salud Pblica


1
REPASO DE EPIDEMIOLOGA Y BIOESTADSTICA


1. PRUEBAS DIAGNSTICAS
(adaptado de captulo 8 del compendio de salud pblica)

INTRODUCCIN
Aunque habitualmente se hace de forma no consciente, el mdico clnico procura
orientar su interrogatorio y las pruebas diagnsticas de forma que aporten informacin
sobre la probabilidad de que el paciente tenga o no cierta enfermedad; si al aplicar la
prueba, la probabilidad de tener la enfermedad es muy elevada, se produce el
diagnstico; si la probabilidad resulta muy baja, se descarta el diagnstico. Si el
resultado de una prueba no modifica la probabilidad de enfermedad, entonces la
prueba era innecesaria.
En la evaluacin de pruebas diagnsticas hay que considerar dos pasos: (a)
reproducibilidad y (b) validez.


REPRODUCIBILIDAD
Una prueba es reproducible si al repetirla por el mismo observador
(reproducibilidad intra-observador) o por distinto (reproducibilidad entre observadores)
se obtiene el mismo resultado. Aunque se suele dar menos importancia a la
reproducibilidad, lo cierto es que una prueba no puede ser vlida si no es reproducible.
Para estudiar la reproducibilidad de una prueba dicotmica, se organizan los
datos como en la tabla siguiente. El ndice ms utilizado es el kappa (1):
















Reproducibilidad en una prueba dicotmica
Observador 2
+ - Total
Observador 1 + n11 n12 n1+
- n21 n22 n2+
Total n+1 n+2 n

En el ejemplo del clculo de kappa, puede comprobar que, a partir de la tabla
observada se calcula Po
A continuacin, se construye la tabla esperada al azar: cada casilla se obtiene
multiplicando el total de la fila por el total de la columna y dividiendo ese producto
entre el total de los totales participantes (por ejemplo, los esperados para n11 seran
60x70/300=14). A partir de esta nueva tabla de esperados se calcula Pe:
1
o e
e
P P
P
!
"
=
"

Donde Po es el grado de acuerdo
observado:
11 22
o
n n
P
n
+
=
Y Pe el grado de acuerdo esperado al
azar:
1 1 2 2
/ /
e
n n n n n n
P
n
+ + + +
! + !
=
Ejemplo: 2 observadores (Obs1 y Obs2) valoran a 300 pacientes.
en negrita Po
(observada)
Obs2
Total + -
Obs1
+ 40 30 70
- 20 210 230
Total 60 240 300
Po= (40+210)/300 =0,83 Pe= (14+184)/300 =0,66
en negrita Pe
(esperada)
Obs2
Total + -
Obs1
+ 14 56 70
- 46 184 230
Total 60 240 300
kappa = (0,83-0,66)/(1-0,66) = 0,5
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
2
Finalmente, se calcula kappa:






ndice kappa de reproducibilidad de una prueba dicotmica.













La interpretacin de kappa es sencilla: valores prximos a 1 indican alta
reproducibilidad; valores prximos a 0 indican baja reproducibilidad.
En la aplicacin prctica de kappa pueden surgir dos inconvenientes (2,3): (a)
paradoja del sesgo: si uno de los observadores tiene mayor tendencia a diagnosticar
la enfermedad que el otro, entonces kappa tiende a ser bajo. (b) Paradoja de la
prevalencia: kappa es ms elevado en las poblaciones en que el porcentaje de
resultados positivos es ms alto. Por ejemplo, la reproducibilidad entre especialistas
suele ser mayor que entre mdicos generales, porque en la consulta general la
frecuencia de la enfermedad es menor.
Otros ndices de reproducibilidad de pruebas dicotmicas son los grados de
acuerdo positivo, negativo y total (Po), aunque se recomienda utilizarlos siempre
acompaados del kappa (4,5).
Cuando la prueba diagnstica tiene ms de dos niveles, es posible calcular el
ndice kappa ponderado (6,7).
Para la reproducibilidad de pruebas continuas (determinacin de glucemia, por
ejemplo), es incorrecto utilizar el coeficiente de correlacin lineal o la prueba t de
Student; lo adecuado es emplear
el mtodo de Bland y Altman (8)
el coeficiente de correlacin intraclase (9,10)
o el grfico de acuerdo mediante supervivencia (survival agreement plot)
(11,12).


5 0
66 0 1
66 0 83 0
1
,
,
, ,
=
!
!
=
!
!
=
e
e o
P
P P
"
NO EXPLICADO POR EL AZAR
obseivauo
EXPLICADO POR EL AZAR
S4
S4
17,S
66



34
3 17,
= kappa
}
5 0
34
3 17
66 100
66 3 83
azar por esperada - mxima ia concordanc
azar por esperada - observada ia concordanc
,
, ,
= =
!
!
= = kappa
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S
VALIDEZ INTERNA: SENSIBILIDAD Y ESPECIFICIDAD
Una prueba perfecta permitira diferenciar siempre entre los enfermos y los sanos;
su resultado sera positivo en todos los enfermos y negativo en todos los sanos.
Para validar una prueba, lo que se hace es compararla con una prueba perfecta,
a la que denominamos "criterio de verdad" o "gold standard" (en la prctica, la prueba
perfecta no existe y es necesario utilizar criterios de verdad imperfectos; la forma de
hacerlo est ms all de los objetivos de este libro).

Validez de una prueba dicotmica
Criterio de verdad
Enfermo (
)
No enfermo
(nD)
Prueba + a1=VP b1=FP
- a0=FN b0=VN
VP: verdaderos positivos; FP: falsos positivos;
FN: falsos negativos; VN: verdaderos negativos

En la tabla anterior se presenta la forma de organizar los datos para medir la
validez de una prueba diagnstica (13,14). Sobre esta tabla se definen dos ndices:
! La sensibilidad es la capacidad de la prueba para clasificar correctamente
(resultado +) a los enfermos. Observe que en el clculo de la sensibilidad slo se
tienen en cuenta los enfermos.

! La especificidad es la capacidad de la prueba para clasificar correctamente
(resultado -) a los no enfermos. Observe que en el clculo de la especificidad slo
se tienen en cuenta los no enfermos.
Especificidad (E ) = P (!| nD) =
VN
VN + FP


Validez de una prueba dicotmica. Ejemplo
Hipocalcemia
S No
PTH <10 ng/L 180 32
!10 ng/L 20 168

Ejemplo: Sywak (15) estudi si la determinacin de la PTH 4 horas despus de la
tiroidectoma permita identificar los pacientes que desarrollaran hipocalcemia; en la
tabla anterior se presentan los datos (modificados) de pacientes con y sin
hipocalcemia que presentaron resultado positivo (PTH<10 ng/L) o negativo.
Con estos datos, y .


VALIDEZ EXTERNA: VALORES PREDICTIVOS
La sensibilidad sirve para responder a la pregunta: si un paciente tiene
hipocalcemia, qu probabilidad hay de que previamente tuviera PTH baja?
Anlogamente, la especificidad permite responder a: si un paciente no tiene
hipocalcemia, qu probabilidad hay de que tuviera PTH normal? Ambas preguntas
son intiles en la clnica, donde lo importante es predecir la hipocalcemia utilizando los
valores de PTH.
Por eso, se desarrollan dos nuevos indicadores: los valores predictivos (7,10,16).
El valor predictivo positivo (VPP) indica la probabilidad de que un paciente con un
D
( ) ( | )
VP
Sensibilidad S P D
VP FN
= + =
+
180
0, 9
180 20
S = =
+
168
0, 84
168 32
E = =
+
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
4
resultado positivo tenga la enfermedad. Para su clculo se empleas las frmulas
siguientes:

VP= verdaderos positivos
T+ =total de tests positivos


En la tabla, bastara dividir 180 (VP) entre 180+32 (total T+).
VP = 180/(180+32) = 0,849.
Lo ms sencillo es hacer una tabla y calcularlo desde la tabla.

De forma anloga, se define el valor predictivo negativo (VPN) como la
probabilidad de que un paciente con resultado negativo no tenga la enfermedad:

VN = verdaderos negativos
T- =total de tests negativos


VPP = 168 / (168+20) = 0,894

Ejemplo: basndose en su historia previa, el mdico estima que un paciente tiene
una probabilidad de 0,3 de desarrollar hipocalcemia. Realiza la determinacin de PTH
y encuentra 8 ng/L (un resultado positivo). Cul es ahora la probabilidad de
hipocalcemia?
Lo ms sencillo es inventar un total redondeado a una cifra alta y aplicar las
probabilidades para crear una tabla. Primero se aplica la prevalencia (0,3):

S No Total
PTH <10 ng/L
!10 ng/L
3000 7000 10000

Despes se aplican sensibilidad y especificidad (0,9x3000) y (0,84x7000):

S No Total
PTH <10 ng/L 2700 1120
!10 ng/L 300 5880
3000 7000 10000

El VPP = 2700 / (2700+1120) = 0,71

El VPN = 5880 / (5880+300) = 0,95

Los modos de calcular VPP y VPN muestran que los valores predictivos
dependen de la probabilidad a priori de tener la enfermedad; cuando aumenta esta
probabilidad, aumenta el VPP y disminuye el VPN. Esto da lugar a que la misma
prueba diagnstica tenga distinta validez al aplicarla en diferentes poblaciones (17).
Por ejemplo, un resultado positivo ser ms creble:
! En poblaciones con alta prevalencia de la enfermedad. Por ejemplo, el uso de
mamografa para diagnstico precoz del cncer de mama tendr mayor VPP en
EE. UU. (donde esta enfermedad es ms frecuente) que en Espaa.
! Las pruebas diagnsticas tienen distinta validez a unas edades que a otras.
Siguiendo con el ejemplo de la mamografa, como el cncer de mama es ms
frecuente entre 50 y 59 aos que entre 40 y 49, el VPP ser tambin ms alto.
+
=
T
VP
VPP
!
=
T
VN
VPP
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S
Ejemplos parecidos se pueden poner para mostrar la diferencia de VPP si la
prevalencia de enfermedad vara entre sexos, razas, profesiones,...
! Una prueba diagnstica tiene mayor VPP en la consulta / planta del especialista
correspondiente que en la del mdico de Atencin Primaria. Por ejemplo, si a la
consulta oncologa se derivan los pacientes con mayor probabilidad de tener un
cncer de colon, la prueba diagnstica que se utilice encontrar mayor prevalencia
de esta enfermedad y, por lo tanto, tendr mayor VPP.
! La misma prueba diagnstica tiene mayor VPP cuando se aplica para el
diagnstico clnico (en pacientes en los que se sospecha que pueden tener la
enfermedad) que cuando se usa para el diagnstico precoz (en pacientes
aparentemente sanos).
! En pacientes en los que el diagnstico se ha orientado mediante una buena
historia y exploracin que en pacientes en los que la prueba se hace "por si
acaso".
! Una situacin tpica en la clnica: durante el proceso de atencin a un paciente, el
MIR-2 de Familia encuentra un resultado de laboratorio alarmante que parece
contradecir el buen estado y la historia del paciente. Cuando consulta con el
adjunto, ste le dice: Si la clnica dice una cosa y el laboratorio otra, lo que manda
es la clnica. Qu subyace detrs de esta regla emprica? La situacin del
paciente indica baja probabilidad de tener la enfermedad; por lo tanto, el VPP del
resultado de laboratorio ser bajo.

En las mismas situaciones indicadas antes, el VPN ser menos fiable porque,
como ya se ha dicho, disminuye al aumentar la probabilidad a priori.


RAZONES DE VEROSIMILITUD (RV)
Las razones de verosimilitud
1
positiva (RV+) y negativa (RV-) son dos ndices muy
tiles sobre la validez de una prueba diagnstica que permiten relacionar la
probabilidad a priori de enfermedad ( ) con la probabilidad a posteriori (valores
predictivos).
La RV+ es la ms utilizada y expresa cuntas veces es ms probable que la
prueba diagnstica sea positiva en los enfermos que en los sanos.

RV+ =
p(T+| D)
p(T+| nD)


Por ejemplo, si una prueba diagnstica resulta positiva en el 95% de los enfermos
y slo da errneamente un falso positivo en el 5% de los no enfermos, su RV+ =
0,95/0,05 = 19 y se interpreta que es 19 veces ms probable que el test sea positivo
en enfermos que que lo sea en sanos.
Por tanto, la RV+ se obtiene tambin dividiendo la sensibilidad entre el
complementario de la especificidad (observe que se utilizan slo las casillas con
resultados positivos). Para disponer de una buena prueba diagnstica, lo que interesa
es que la RV+ sea mayor que 1, y cuanto mayor, mejor prueba. Aplicado al ejemplo
de la PTH e hipocalcemia, se obtiene:

La RV- se obtiene dividiendo el complementario de la sensibilidad entre la
especificidad (observe que se utilizan slo las casillas con resultados negativos). Para

1
Likelihood ratio en ingles.
( ) P D
0, 9
5, 625
1 0,16
S
RV
E
+ = = =
!
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
6
disponer de una buena prueba diagnstica, interesa que RV- sea menor que 1, y
cuanto menor, mejor prueba. Aplicado al ejemplo de la PTH:


RELACIN ENTRE RAZONES DE VEROSIMILITUD Y VALORES PREDICTIVOS
Si 80 de cada 100 enfermos dan un resultado positivo, entonces la sesnsibilidad
es del 80%. Los 80 (verdaderos positivos) aparecern tanto en el numerador como en
el denominador. Esto sucede porque la sensibilidad es una proporcin y todas las
proporciones y probabilidades (S, E, VPP, VPN) incluyen el numerador en su
denominador.
En cambio las odds dividen los que tienen una caracterstica entre quienes no la
tienen y as excluyen el numerador del denominador. Decir que la odds de
mujeres:varones es 1, es lo mismo que decir que el 50% son mujeres. En el ejemplo
anterior de la sensibilidad del 80%, podra decirse que su odds es 4 (80/20).
Tambin puede decirse que una odds es una probabilidad dividida por su
complementario:
odds =
p
1! p

Por ejemplo, si la prevalencia de una enfermedad fuese del 30%, la odds de esa
prevalencia (que luego llamaremos oddspretest) sera 0,3/0,7 = 0,43
A partir de una odds, se vuelve a obtener la probabilidad con la siguiente
frmula:
p =
odds
1!odds


Si sabemos que la odds de prevalencia de una enfermedad es 0,43, su
prevalencia ser 0,43/1,43 = 0,3.
Son dos modos de expresar lo mismo. Cuando la probabilidad es muy pequea la
odds casi coincide con la probabilidad.
Usando odds en vez de probabilidades hay una frmula simple y muy interesante
para relacionar la razn de verosimilitud positiva con la prevalencia (que dar la odds
previa) y el valores predictivo positivo (que dar la odds posterior). Se denomina odds
previa a la odds de la prevalencia y odds posterior a la del VPP. Se cumple que



Esta frmula es importante pues transmite de algn modo el planteamiento
bayesiano. El planteamiento bayesiano, de modo general, exige matizar un hallazgo a
la luz de unos supuestos o creencias previas, en este caso la creencia previa es la
estimacin de la prevalencia de la enfermedad en la poblacin. Ver el apartado sobre
Factor Bayes en pg. 34-35 que repite de algn modo estas ideas.
La odds previa es la informacin basal de tipo general que se tiene antes de
recoger ningn dato especfico del caso que se est estudiando. La odds posterior, en
cambio, es la que se obtiene despes de que la prueba diagnstica ya haya dado un
resultado positivo e integra el conocimiento nuevo (cociente entre sensibilidad y 1-
especificidad) con la odds previa para proporcionar una nueva odds.
Volviendo al ejemplo inicial: basndose en su historia previa, el mdico estima
que un paciente tiene una probabilidad de 0,3 de desarrollar hipocalcemia. Realiza la
determinacin de PTH y encuentra 8 ng/L (un resultado positivo). Cul es ahora la
probabilidad de hipocalcemia?
Creencia previa sobre la prevalencia: 0,3 ! odds previa = 0,3/0,7 = 0,43
RV+ = p(T+ | D) / p(T+ | nD) = S / (1-E) = 0,9 / 0,16 = 5,625
1 0,1
0,119
0, 84
S
RV
E
!
! = = =
+ ! = RV ODDS ODDS
pre post
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
7
Frmula: oddspost = oddspre x RV+ = 0,43 x 5,625 = 2,42
Transformacin de oddspost en VPP = 2,42 / (1+2,42) = 0,71
El lector puede contestar por su cuenta a la siguiente pregunta
Una prueba de laboratorio aparece alterada en 8 de cada 10 individuos que
padecen una determinada enfermedad crnica mientras se obtienen valores
normales en 8 de cada 10 individuos que no sufren dicha enfermedad. Si se
aplica la prueba a una poblacin de 100 individuos de los cuales 20 sufren la
enfermedad cul ser el valor predictivo positivo de la prueba?
La respuesta correcta debe ser VPP= 50%.
Cuanto mayor sea la RV+, mayor ser el VPP. Si la RV+ es 1, la prueba no
aporta ninguna ganancia, pues el VPP ser igual a la prevalencia. Una RV+=1 es
nula. Si la RV+ fuese inferior a 1, habra que intepretar la prueba al revs.
Tambin si RV-=1 se obtiene que la probabilidad tras el resultado negativo es la
misma que sin realizar la prueba: la prueba es intil.
Se ha propuesto (hasta ahora sin xito) cambiar la expresin de la RV- (18,19).

VALIDEZ DE PRUEBAS CON MS DE DOS CATEGORAS
En ocasiones, se dispone de pruebas que clasifican a los pacientes en ms de
dos categoras. La tabla inferior muestra el ejemplo de PTH e hipocalcemia,
clasificando el resultado de la PTH en cuatro categoras. Las columnas de
hipocalcemia = S/No presentan la distribucin de los pacientes con hipocalcemia en
porcentaje (es decir, el 71% de los pacientes hipocalcmicos y el 6% de los pacientes
normocalcmicos tuvieron PTH < 3 ng/L).

Validez de una prueba con ms de dos categoras.
Se presentan porcentajes sobre el total de enfermos y total de sanos.
Hipocalcemia RV+
S No
PTH (ng/L) <3 71 6 11,8
3-10 19 10 1,9
10-20 5 16 0,313
>20 5 68 0,074
Total 100% 100%
En estas pruebas con ms de dos categoras, es muy sencillo generalizar el
concepto de razn de verosimilitud. Por ejemplo, para conocer la razn de
verosimilitud de un resultado con PTH<3, basta con dividir los porcentajes de
pacientes con y sin hipocalcemia que tienen ese nivel de PTH:

Las razones de verosimilitud aparecen calculadas en la ltima columna de la
tabla. Con esos valores, puede calcularse la probabilidad de hipocalcemia de
cualquier paciente, en funcin del nivel de la PTH, utilizando una frmula similar a la
que se acaba de ver para los valores predictivos.

VALIDEZ DE PRUEBAS CONTINUAS: CURVA ROC
En los apartados anteriores se ha considerado el diagnstico basado en tests que
dan una respuesta dicotmica (positivo o negativo). Sin embargo, muchas pruebas
diagnsticas son cuantitativas (por ejemplo, glucemia, hemoglobinemia, tensin
arterial sistlica, fraccin de eyeccin ventricular,!). Para convertir estas pruebas en
dicotmicas es necesario determinar un punto de corte a partir del cual se considerar
que los resultados son positivos; la decisin sobre el punto de corte adecuado no es
automtica y uno de los instrumentos tiles para tomarla es la curva ROC, aunque se
deben tener en cuenta otros aspectos (20-23). Las curvas ROC se desarrollaron en la
dcada de los 50 del siglo pasado para evaluar la seal de radar. El nombre original
3
71
11, 8
6
PTH
RV
<
= =
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
8
de la curva es Receiver Operating Characteristic; es un trmino procedente del radar y
no tiene aplicacin a la medicina, por lo que no tiene sentido traducirla.
La curva ROC se construye situando el complementario de la especificidad (1-E)
en abscisas (eje horizontal) y la sensibilidad en ordenadas (eje vertical). A
continuacin, se representan los diferentes puntos de corte y se unen por una lnea.
La figura siguiente presenta la curva ROC del ejemplo sobre hipocalcemia y PTH,
tomando la PTH como variable continua.

Curva ROC sobre la validez del valor de PTH a las 4 horas de la tiroidectoma
para detectar hipocalcemia (15).











ELECCIN DEL PUNTO DE CORTE
El punto de corte ideal es S = 1, 1-E = 0, que coincide con el ngulo superior
izquierdo de la figura; por lo tanto, una buena aproximacin a la eleccin de punto de
corte es elegir el ms prximo a dicho ngulo.
Otra idea interesante para elegir el punto de corte es encontrar el punto de
mxima curvatura de la curva ROC. En la figura, la mxima curvatura se alcanza en el
punto marcado con un 1; puede observarse que desde ese punto, aumentar
ligeramente la sensibilidad (desplazndose hacia el punto marcado con un 3) produce
un gran descenso en la especificidad, y -al contrario- aumentar ligeramente la
especificidad (desplazndose hacia el punto marcado con un 2) produce un gran
descenso en la sensibilidad.
La eleccin del punto de corte no depende slo de su cercana al ngulo superior
izquierdo: segn la enfermedad y el uso que se pretenda dar a la prueba, se puede
preferir una prueba ms sensible y menos especfica (o al revs), o puede ser
necesario tener en cuenta el coste de la prueba y los tratamientos.

REA BAJO LA CURVA
El rea bajo la curva ROC es una buena medida de la validez general de una
prueba diagnstica. Una prueba que discrimine perfectamente entre los dos grupos
(enfermos y sanos) dar una curva que coincide con los lados izquierdo y superior de
la figura. La figura completa es un cuadrado de lado 1, por lo que el rea mxima bajo
la curva ser 1, que se alcanzar cuando la curva ROC recorra el eje de ordenadas
hasta el punto (1, 0) y, a continuacin, el eje horizontal superior hasta el punto (1, 1).
Cuanto mayor sea el rea bajo la curva, mejor es la prueba diagnstica. Una prueba
completamente intil ser una lnea recta que vaya desde el ngulo inferior izquierdo
al ngulo superior derecho. Esta prueba (la peor prueba posible) es la que tiene rea
bajo la curva = 0,5. Qu ocurre si una curva tiene rea menor de 0.5? Simplemente,
que se estn interpretando mal los valores de la prueba y lo que hay que hacer es
invertir la terminologa: lo que se ha llamado positivo pasa a ser negativo y viceversa;
con eso el rea bajo la curva pasar a ser mayor de 0,5.
El rea bajo la curva tiene una interpretacin probabilista: si se escogen al azar
un paciente hipocalcmico y uno normocalcmico, el rea bajo la curva indica la
probabilidad de que el hipocalcmico presente una PTH menor que el
normocalcmico. Si la PTH fuera una prueba perfecta (rea bajo la curva = 1), todos
los hipocalcmicos tendran valores ms bajos que los normocalcmicos (por lo tanto,
1
2
S
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
9
la prueba discriminara perfectamente entre ambos grupos). Si la PTH fuera una
prueba intil (rea bajo la curva = 0,5), la probabilidad de que un hipocalcmico
tuviera PTH ms baja que un normocalcmico sera igual a 0,5; esto dara a la prueba
diagnstica la misma validez que arrojar una moneda al aire.

CALIBRACIN Y DISCRIMINACIN
Los conceptos de calibracin y discriminacin en pruebas diagnsticas son diferentes.
! La calibracin se refiere a la capacidad de predecir correctamente la proporcin de personas dentro
de cada subgrupo que padecern la enfermedad (ej. habr ms eventos en un grupo de pacientes de
mayor riesgo). Por ejemplo, si una prueba diagnstica o un modelo multivariable clasifica a los
pacientes en 3 grupos con riesgos predichos del 5%, 10% y 15%, se considerar que la calibracin
es buena si al aplicar la clasificacin a un grupo externo al que gener estas predicciones, las
incidencias reales de eventos observados estn prximas al 5%, 10% y 15%. La calibracin se
demuestra presentando las tasas de eventos observados versus esperados para cada grupo de
riesgo predicho.
! La discriminacin se refiere en cambio a la probabilidad que tiene una prueba diagnstica o
instrumento de prediccin para distinguir entre dos pacientes, uno con alto y otro con bajo riesgo. P.
ej., al atender a 2 pacientes al azar, en los que 1 de ellos posteriormente desarrollar un evento
clnico, la prueba discriminar bien si predice correctamente cul de los dos tiene mayor riesgo de
padecer el evento. Matematicamente esto se describe mediante el rea bajo la curva ROC (tambin
se le llama ndice C o estadstico C y se puede calcular mediante la U de Mann Whitney dividiendo la
U mayor de las dos que se obtengan entre el total de comparaciones (n1 x n2)). El rea bajo la curva
ROC dene la probabilidad de que una persona seleccionada al azar del grupo de pacientes tenga un
valor ms alto en la prueba que una persona tomada al azar del grupo no afectado.

REFERENCIAS
(1) Cohen J. A coefficient of agreement for nominal scales. Educ Psychol Meas 1960;20:37-46.
(2) Feinstein AR, Cicchetti DV. High agreement but low kappa: The problems of two paradoxes. J Clin Epidemiol
1990;43:543-9.
(3) Cicchetti DV, Feinstein AR. High agreement but low kappa: Resolving the paradoxes. J Clin Epidemiol 1990;43:551-8.
(4) Kraemer HC, Bloch DA. Kappa coefficients in epidemiology: an appraisal of a reappraisal. J Clin Epidemiol 1988;41:959-
68.
(5) Maclure M, Willett WC. Misinterpretation and misuse of the kappa statistic. Am J Epidemiol 1987;126:161-9.
(6) Cohen J. Weighted kappa: nominal scale agreement with provision for scaled disagreement or partial credit. Psychol Bull
1968;70:213-20.
(7) Delgado-Rodrguez M, et al. Estudio de las pruebas diagnsticas. En: Sierra-Lpez A et al: Pidrola Gil - Medicina
Preventiva y Salud Pblica. 11 ed, Barcelona: Elsevier; 2008;173-84.
(8) Bland JM,Altman DG. Statistical methods for assessing agreement between two methods of clinical measurement.
Lancet 1986;1(8476):307-10.
(9) Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el coeficiente de correlacin
intraclase. Med Clin (Barc.) 1998;110:142-5.
(10) Snchez-Villegas A, Martnez-Gonzlez MA, Palma S. Anlisis de la concordancia. En: Martnez-Gonzlez MA,
Snchez-Villegas A, Fauln Fajardo FJ (eds.). Bioestadstica amigable. 2 ed. Madrid: Daz de Santos, 2006;821-50.
(11) Luiz RR, Costa AJ, Kale PL, Werneck GL. Assessment of agreement of a quantitative variable: a new graphical
approach. J Clin Epidemiol 2003;53:963-7.
(12) Llorca J, Delgado-Rodrguez M. Survival analytical techniques were used to assess agreement of a quantitative variable.
J Clin Epidemiol 2005;58:314-5.
(13) Altman DG, Bland JM. Diagnostic test 1: sensitivity and specificity. BMJ 1994;308:1552.
(14) Gilbert R et al. Assessing diagnostic and screening tests: Part 1. Concepts. West J Med 2001;174:405-9.
(15) Sywak MS, Palazzo FF, Yeh M, et al. Parathyroid hormone predicts hypocalcaemia after total thyroidectomy. ANZ J
Surg 2007;77:667-70.
(16) Altman DG, Bland JM. Diagnostic tests 2: Predictive values. BMJ. 1994;309:102.
(17) Brenner H, Gefeller O. Variation of sensitivity, specificity, likelihood ratios and predictive values with disease prevalence.
Stat Med 1997;16:981-91.
(18) Delgado-Rodrguez M, Almaraz A, Farias-Alvarez C. Should the definition for the negative likelihood ratio be changed?
J Clin Epidemiol. 1997;50:641-2; discussion 643-4.
(19) Delgado-Rodrguez M, Almaraz A, Farias-Alvarez C. Should the definition for the negative likelihood ratio be changed?
J Clin Epidemiol. 1997;50:639-40.
(20) Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic curve. Radiology
1982;143:29-36.
(21) Hanley JA, McNeil BJ. A method of comparing the area under two ROC curves derived from the same cases. Radiology
1983;148:839-43.
(22) Zweig MH , Campbell G. Receiver-Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical
Medicine. Clin Chem 1993;39:561-577.
(23) Altman DG, Bland JM. Diagnostic tests 3: receiver operating characteristic plots. BMJ 1994;309:188.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
1u
2. CAUSALIDAD EN EPIDEMIOLOGA

MODELO CAUSAL DE ROTHMAN (MODELO DETERMINISTA MODIFICADO)
La creencia de que una enfermedad tiene una sola causa, y que cada posible causa origina una sola
enfermedad es falsa, pero consciente o inconscientemente est arraigada en nuestra mente. Aun cuando
se admita la multicausalidad, tambin est arraigada la creencia de que al sumar el porcentaje de casos
de enfermedad atribuibles a cada factor, al final se llegar a una suma del 100%. Esto no es as.
Obsrvese la siguiente tabla (tasas de un cncer por 100.000 habitantes-ao)
No fuma Fuma
Abstemios 10 40
Beben alcohol 30 120
Podra decirse que el tabaco multiplica por 4 las tasas y en cambio, el alcohol lo multiplica por 3.
Esto es cierto segn la tabla. No habra ni sinergia ni antagonismo, sino simplemente una multiplicacin
de efectos en los expuestos a ambos factores. Se puede afirmar que de los 120 casos por 100.000
observados en bebedores y fumadores:
se habran evitado 90 si nadie en esa poblacin fumase (120-30=90).
se habran evitado 80 si todos en esa poblacin fuesen abstemios (120-40=80).
Por lo tanto, de esos 120 casos, el 75% (90/120) se deben al tabaco y el 67% (80/120) se deben al
alcohol. La suma de ambos porcentajes es superior al 100%.
Cmo puede ser esto?
El modelo determinista modificado de Rothman resuelve sta y otras perplejidades al incorporar
conceptos deterministas y multicausales
2
. Se define:
! Causa suficiente: mecanismo multicausal compuesto por el conjunto mnimo de componentes
que actuando conjuntamente, invariablemente producen la enfermedad. Ver figura 2.1 donde
aparecen 2 causas suficientes (I y II).
! Causa componente (o contribuyente): cada uno de los elementos de la causa suficiente. Ver
figura 2.1 donde aparecen 4 causas componentes de cada una de las 2 causas suficientes.
! Causa necesaria: causa componente presente en todas las causas suficientes.
La mayora de las enfermedades tienen distintos mecanismos causales suficientes y cada uno de
ellos incluye varias causas componentes. Para producir la enfermedad, cada uno de los mecanismos
requiere que todos y cada uno de sus componentes acten conjuntamente. Cundo todos estn presentes
inevitablemente se produce la enfermedad. De ah el carcter determinista. No hay lugar para el azar o la
probabilidad. Si falta un slo componente de una causa suficiente, la enfermedad no se producir por este
mecanismo. Por eso, aunque se ignore la mayora de los componentes del mecanismo suficiente,
eliminar un solo componente prevendr la enfermedad por ese mecanismo.
Hay componentes que pueden participar en distintos mecanismos multicausales. Esto explica que la
suma de las proporciones atribuibles a cada componente pueda ser >100%.

Figura 2.1. Causa suficiente

Causa suficiente I Causa suficiente II
(60%) (40%)








2
El modelo determinista (Koch-Henle) postula la relacin nica, constante y recproca entre causa y efecto. No est vigente
porque las enfermedades tienen varias causas. El modelo multicausal se basa en que todo suceso est producido por una
multiplicidad de factores que actan de forma conjunta o independiente para provocar el suceso.

C
B A
D
A E
G H
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
11
La causa componente A es responsable del 100% de la enfermedad, B del 60%, H del 40%. La
causa componente A sera necesaria y por tanto las intervenciones preventivas sobre ella, sern las
prioritarias para evitar la enfermedad.


MODELO CONTRAFCTICO (COUNTERFACTUAL) DE CAUSALIDAD
Supongamos que deseamos comparar el riesgo de infarto de miocardio dependiendo del consumo
de aceite de oliva. La intuicin nos llevar a comparar el riesgo de infarto entre los consumidores y los no
consumidores. Sin embargo, esto no ofrece una informacin fidedigna del efecto del aceite de oliva
porque los consumidores de aceite suelen tener un estilo de vida ms saludable incluyendo mayor
consumo de verduras y ensaladas, menor consumo de carnes y otros factores asociados a menor riesgo
de infarto. En definitiva, habra que admitir que los grupos comparados son distintos no solo en el
consumo de aceite de oliva. Por lo tanto, la pregunta realmente interesante es: cmo se modifica el
riesgo de infarto de una persona que no consume aceite de oliva si pasa a hacerlo, pero sigue igual en
todo lo dems? Lo interesante conceptualmente es plantear una comparacin de cada sujeto consumidor
de aceite con otro sujeto exactamente igual a l en todo, pero que no probase nunca el aceite. Tales
sujetos exactamente iguales no existen en la realidad. Se tratara de un grupo ficticio de sujetos (un grupo
que fuese el de los realmente expuestos pero situndolos en el hipottico caso de que no estuviesen
expuestos). A este tipo de comparacin, que va en contra de los hechos, se le llama contrafctica. Pensar
as puede parecer absurdo, pero resulta til para llegar a inferencias causales y realizar buenos diseos
de investigacin.
Buenas aproximaciones al modelo contrafctico son el ajuste multivariable, los diseos
aleatorizados y especialmente los ensayos cross-over (ver ms adelante).
Se habla de mera asociacin estadstica entre dos variables cuando se encuentra que existe una
relacin entre ellas, mayor que la que cabra esperar por el azar y entonces se dice que hay una
asociacin estadsticamente significativa. Esto no implica necesariamente causalidad. Las asociaciones
pueden ser causales o no causales. Es mejor reservar la palabra efecto para cuando hay elementos de
juicio suficientes como para hablar de causalidad, siempre teniendo en mente el modelo contrafctico.
Mientras no se dispone de tales elementos es ms prudente hablar de meras asociaciones.
Las asociaciones pueden ser positivas (directas), cuando la probabilidad de aparicin de un
fenmeno aumenta con la presencia de la otra variable, o cuando crece la variable y al crecer la variable
x; o negativas (inversas), cuando la probabilidad de aparicin de un fenmeno disminuye con la
presencia de la otra variable (haya causalidad o no).
Las asociaciones no causales o espurias (o por error, artificiales), son las que aparecen como
consecuencia de sesgos de seleccin de la muestra, por errores de informacin o por sesgos de
confusin. Un ejemplo tpico es el de las manchas amarillas en los dedos de los fumadores y su
asociacin no causal con el cncer broncopulmonar. Las asociaciones no causales fortuitas son las
debidas al azar, a sesgos (o a razones desconocidas por nosotros).

PERIODO DE INDUCCIN
Si en la causa suficiente I de la figura 2.1, la secuencia temporal con la que actu!an los
componentes causales es que acta primero A, luego B, C, y por u!ltimo D; esto hace que si se
investiga la causalidad del factor B, no se podr observar la ocurrencia de enfermedad
inmediatamente despus de intervenir B, puesto que se requiere esperar a que tambin ocurran C y D.
La enfermedad no aparecer hasta que se complete la secuencia y transcurrir un tiempo mientras
que ocurre C y hasta que finalice de intervenir D. Solo entonces aparecer la enfermedad. El intervalo
de tiempo entre la actividad de B y la enfermedad, ser el tiempo o periodo de induccin para la causa
componente B. Este periodo de induccin de B ser mayor que el periodo de induccin del ltimo
componente de la cadena (D).
Las causas contribuyentes que actan al inicio de la secuencia causal tendrn periodos de
induccin ms largos. El periodo de induccin de la u!ltima causa componente en la secuencia ser
casi igual a cero.
Es incorrecto hablar de un periodo de induccio!n para una enfermedad determinada, ya que el
periodo de induccio!n siempre se asocia a la relacio!n especi!fica entre cada una sola de las causas
contribuyentes y la enfermedad que esta causa componente produce. Es decir, para una sola
enfermedad, habr tantos periodos de induccin como causas contribuyentes o componentes tenga en
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
12
sus mecanismos causales suficientes. En el ejemplo de la Figura 2.1, habr 8 periodos de induccin,
ya que el periodo de induccin de A en el mecanismo suficiente I puede ser distinto del de ese mismo
componente A en el mecanismo causal II.
En carcinoge!nesis se habla de iniciadores o promotores, segn sean causas que actu!en ms
temprano o ms tarde, respectivamente. Por ejemplo, los anticonceptivos orales son ms promotores
que iniciadores de cncer de mama, el efecto de estrgenos/progestgenos es hacer crecer las
clulas neoplsicas que ya se han vuelto malignas o invasivas. Cuando se estudian factores de riesgo
de cncer en epidemiologa los factores iniciadores siempre tendra!n mayores periodos de induccio!n
que los promotores. Lo mismo puede decirse de la terminologi!a de factores predisponentes o
precipitantes utilizados en enfermedades cro!nicas, la ruptura o desestabilizacin de la placa de
aterosclerosis y los factores que la desestabilizan son desencadenantes, con periodos de induccin
cortos. Si un estudio epidemiolgico encuentra un corto periodo de induccin para la exposicin a
cocana respecto al infarto de miocardio, se tratar de un desencadenante.
En conclusio!n, puede decirse que el modelo determinista absoluto esta! desechado por la
ciencia actual, y que el modelo determinista modificado de Rothman, basado en conceptos de
multicausalidad y probabilsticos, se adapta mejor a la realidad.

CRITERIOS DE CAUSALIDAD EN EPIDEMIOLOGA
No toda asociacin verificable con el mtodo epidemiolgico corresponder a una verdadera
relacin causa-efecto. Los criterios de causalidad ms conocidos son los de Bradford Hill. Todos
pueden tener excepciones y son criticables. El nico requisito sine qua non es la secuencia temporal.
La causa siempre preceder al efecto. Estos criterios son:
1. Secuencia temporal: la supuesta causa debe preceder al efecto.
2. Fuerza de la asociacin: cuanto mayor RR, ms verosmil ser la causalidad.
3. Gradualidad; tendencia dosis-respuesta en las asociaciones causales.
4. Consistencia: si la asociacin es causal muchos estudios la evidenciarn.
5. Especificidad: al ser causal slo existir para un efecto o una exposicin concreta.
6. Plausibilidad biolgica: podemos explicar el mecanismo causal.
7. Coherencia: no contradice las tendencias temporales o su historia natural.
8. Evidencia experimental: hay estudios experimental que lo confirman.
9. Analoga: existen asociaciones similares ya demostradas.
Los tres primeros criterios pueden comprobarse en el estudio concreto que se ha realizado,
segn sus hallazgos y segn su diseo (ver ms adelante). Los estudios trasversales (cross-sectional)
no suelen permitir verificar la secuencia temporal. Los otros criterios proceden habitualmente de la
bibliografa.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
1S
odds =
s
no
proporcin =
s
s +no
tasa =
a
(a +b) !t
3. MEDIDAS DE FRECUENCIA

MEDIDAS DE FRECUENCIA

PROPORCIN: Cociente cuyo numerador est incluido en el denominador. Carece de unidades. Tiene
valores entre 0-1 (o bien entre 0% y 100% si se expresa en porcentajes, como suele ser frecuente).

Proporcin (p) =a / a+b

RAZN: Cociente cuyo numerador no est incluido en el denominador. No tiene unidades. Sus lmites
son 0 e infinito.

Razn=a/b

ODDS: Es un caso particular de razn en la que el numerador es la probabilidad de que ocurra un suceso
(p) y el denominador la probabilidad de que no ocurra (1-p). La odds (o ventaja), como todas las razones,
carece de unidades y sus valores oscilan entre cero e infinito. Evala lo mismo que la proporcin pero en
una escala distinta.
Desde el punto de vista prctico se calcula dividiendo el nmero de sujetos que s tienen una
caracterstica entre el nmero de sujetos que no la tienen.



Por ejemplo: si de 100 pacientes, 80 se curan con tratamiento, la odds de curacin ser
odds = 80/20 =4
Interpretacin: se curan 4 por cada uno que no se cura. Es 4 veces ms probable curarse que no curarse.

Pero la proporcin (p) sera



p = 80 / (80+20) = 0,8.

Como la odds es la probabilidad (p) de que ocurra algo, dividido por su complementario (1-p), se puede
obtener la odds sabiendo las proporciones (p)

odds = p/1-p

odds = 0,8 / 0,2 = 4

Tambin se puede hacer al revs: obtener la proporcin (p) a partir de una odds

p=odds/1+odds
p = 4 / (1+4) = 0,8

En definitiva, la odds evala lo mismo que la proporcin, pero en una escala distinta.


TASA: Cociente que lleva incorporado en el denominador una variable de naturaleza diferente al
fenmeno estudiado y que generalmente es el tiempo (t):



Donde a son los casos y b los no casos.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
14
Por ejemplo, si de 100 personas, 4 enferman durante el seguimiento y el tiempo de seguimiento medio
fue de 0,5 aos, la tasa de enfermedad ser

tasa = 4 / (4+96)x0,5 = 0,08 aos
-1


Su unidad es el recproco del tiempo (p.ej. aos
-1
). Un aspecto importante de la tasa es que tiene
interpretacin slo poblacional, pero no individual. As, si la tasa de infarto en un grupo de alto riesgo
fuese de 0,08 aos
-1
significa que se producen 8 infartos por cada 100 habitantes y ao en esa poblacin.
Esto se aplica a la poblacin, pero no al sujeto. Mide la velocidad de ocurrencia o fuerza de morbilidad de
una enfermedad. Sus valores oscilan entre cero e infinito.


MEDIDAS DE FRECUENCIA DE LA ENFERMEDAD

PREVALENCIA: Proporcin de sujetos que padecen un fenmeno en un momento determinado. El
numerador es el total de casos y el denominador toda la poblacin.
Casos existentes en tiempo t
P = --------------------------------------------
Poblacin total en tiempo t
La prevalencia puntual o de punto mide la proporcin de enfermos en un solo momento (t). El momento t
se puede referir a un momento concreto del calendario o un momento determinado dentro de la evolucin
de un proceso que vara, en tiempo de calendario, de una persona a otra. Por ejemplo: puede hablarse de
proporcin de prevalencia de punto de infecciones en heridas quirrgicas en las primeras 48 horas
postquirrgicas. El momento que sigue a las primeras 48 horas postquirrgicas no ocurre en el mismo
momento del calendario para cada paciente pero sigue tratndose de una prevalencia de punto.

Alternativamente, se puede medir la frecuencia de enfermedad en una poblacin durante un periodo de
tiempo predefinido y entonces se llama prevalencia de periodo. El numerador son todos los que han
estado enfermos en algn momento de ese periodo y el denominador todos los que han estado presentes
en esa poblacin en algn momento de ese periodo. Si ese tiempo fuese toda la vida, se hablara de
lifetime prevalence o prevalencia a lo largo de la vida, en ese caso el numerador lo constituyen todos
aquellos que hayan sufrido la enfermedad en algn momento de sus vidas. Pero a veces se usa como
denominador el tamao poblacional de la mitad del periodo de tiempo considerado o la poblacin media
durante dicho periodo de observacin.

Los factores que aumentan o reducen la prevalencia son:

Aumentan la prevalencia Reducen la prevalencia
Por aumento de numerador
Aumento de casos nuevos (incidencia)
Mayor duracin: enfermedades cro!nicas
Mayor supervivencia de los pacientes (sin
curarse)
Mejora de procedimientos diagno!sticos
Inmigracio!n de casos
Inmigracin de susceptibles (si acaban
enfermando)

Por reduccin de denominador
Emigracin de los sanos o poco
susceptibles
Muerte de los poco susceptibles
Por reduccin de numerador
Disminucio!n de casos nuevos (menor incidencia)
Menor duracin: enfermedades agudas
Alta mortalidad de casos (mayor letalidad=menor
prevalencia).
Ms curaciones por mejora de tratamientos
Emigracio!n de casos


Por aumento de denominador
Inmigracio!n de personas sanas.
Inmigracio!n de personas no susceptibles (p.ej.
vacunados).

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
1S
Es importante que quede claro que cuanto ms duracin tiene una enfermedad, mayor tender a ser su
prevalencia.
La prevalencia es como un depsito con una entrada (incidencia de casos nuevos) y dos salidas (muerte
y curacin).
La utilizacio!n de la prevalencia es especialmente u!til en:
Situaciones donde no es posible medir la incidencia (ver ms abajo). Por ejemplo, para estudiar
malformaciones conge!nitas se habla de prevalencia porque no es posible medir el nu!mero de
fetos anormales que se han destruido mediante abortos esponta!neos y precoces. Las
malformaciones observables en el momento del nacimiento son proporciones de prevalencia de
punto (en el nacimiento). Es incorrecto hablar de incidencia de malformaciones congnitas
porque los casos observables son solamente los que han sobrevivido hasta el momento del
nacimiento.
Planificacio!n sanitaria: p. ej, para saber cua!ntas camas se necesitan, cada di!a del ao, en
Unidades de Cuidados Intensivos, ser til contar con el dato de la prevalencia diaria observada
de enfermos que precisen este tipo de cuidados en la poblacin de referencia del hospital.
Enfermedades degenerativas no letales (p.ej. artrosis), o ciertas enfermedades mentales (p.ej.
depresin) cuyo comienzo en el tiempo es difcil de precisar. Para estimar la incidencia es
preciso conocer el momento de comienzo de la enfermedad con exactitud; sin embargo, para la
prevalencia es suficiente saber quie!nes tienen una enfermedad en un periodo determinado (sin
conocer su momento exacto de comienzo). En el caso de enfermedades con sintomas o brotes
intermitentes se hablar de pacientes que hayan tenido dichos sntomas, al menos una vez
durante el periodo de observacio!n.

INCIDENCIA ACUMULADA (IA) O RIESGO ABSOLUTO: Proporcin de individuos susceptibles que
desarrollan un fenmeno (casos nuevos) en un tiempo determinado (perodo de seguimiento t0-t1). La
incidencia acumulada tambin se llama riesgo y s tiene una clara interpretacin individual: riesgo de
enfermar en dicho periodo. En enfermedades infecciosas, se denomina tasa de ataque.
N casos nuevos durante t0-t1
IA = ------------------------------------------
N sujetos susceptibles en t0
Lo importante es que el numerador slo incluye a los casos nuevos. Para calcular la incidencia hay que
olvidarse de los casos que existan al comienzo del estudio y contar slo los que empiezan a producirse a
partir de entonces. El denominador son slo los que estn a riesgo de convertirse en casos nuevos
durante el periodo de seguimiento. A los casos nuevos a veces se les llama casos incidentes.
Si la prevalencia es una foto esttica que refleja la proporcin de enfermos en un momento determinado,
la incidencia es como un vdeo que va contando como avanza la enfermedad a lo largo de un periodo
seguimiento. Sin seguimiento, no hay incidencia.
La IA es sensible al abandono de personas del estudio (muertes por otras causas competitivas, traslado
de residencia, falta de colaboracio!n o defectos de observacio!n y seguimiento por parte del investigador).
Las causas competitivas son otras enfermedades que pueden competir con la enfermedad de intere!s. Por
ejemplo si en un estudio sobre cncer de mama, hubiese muchas muertes prematuras por accidentes de
trfico en un grupo, esas mujeres que mueren por accidente tendran menos probabilidad de convertirse a
la larga en casos de cncer de mama.
La especificacin de cunto dura el seguimiento es imprescindible para poder interpretar una proporcin
de incidencia acumulada. No es lo mismo decir que han muerto un 20% de personas en un estudio que
ha durado 6 aos, que en un estudio con 20 aos de duracin. Al final, si el tiempo de observacin es
muy largo, la incidencia acumulada de mortalidad ser siempre del 100%, por eso, muchas veces es
preferible usar las tasas que tienen el tiempo en cuenta ya desde su denominador, como se explica a
continuacin.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
16
DENSIDAD DE INCIDENCIA (DI) O TASA DE INCIDENCIA: Tasa que mide la velocidad con la que se
pasa de sano a enfermo (por unidad de tiempo) en una poblacin. Estima la fuerza de morbilidad o
velocidad de enfermar.
Casos nuevos en t0-t1
DI = -------------------------------- = (unidades tiempo
-1
)
Personas*tiempo
Para obtener el denominador es necesario medir para cada sujeto su tiempo total en riesgo. El
denominador es la suma de los tiempos de observacin de cada persona.
Si se han producido dos casos nuevos de enfermedad aguda en 10 personas y su seguimiento fue:
5 de ellas fueron seguidas 3 das cada una
3 de ellas fueron seguidas 6 das cada una
los dos que enfermaron lo hicieron a los 2 y a los 5 das
El numerador ser: 2
El denominador: (5x3 das) + (3x6 das) + 2 dias + 5 das = 40 personas-das
La DI = 2 / 40 = 0.05 das
-1

Interpretacin:
Por cada persona-da la velocidad de ocurrencia de enfermedad es 0.05.
Por trmino medio, por cada 20 personas-das enfermar una persona.
El denominador de la DI se expresa en unidades de personas-tiempo. La DI es una tasa (sus
dimensiones son 1/tiempo o tiempo
1
y toma valores entre 0 e infinito). La DI tiende a infinito cuando
observamos muchos desenlaces en un instante pequeo, por ejemplo si contabiliza!ramos las muertes
producidas por una bomba ato!mica. A diferencia de la IA, la DI carece de interpretacio!n a nivel individual,
so!lo se entiende en grupos de personas. Expresa una caracterstica de una enfermedad, expresa la
fuerza que tiene un feno!meno para producir un cambio de estado (por ejemplo de estar sano a
enfermo).
Por ejemplo, una DI de 27 por 1.000 para fracturas de cadera entre mujeres de raza blanca y 65 o
ma!s aos de edad con ciertos factores de riesgo podri! interpretarse como que esa fractura de cadera
ocurre a los 37 an!os de seguimiento como media (ya que 1/0,027 = 37). Otro ejemplo sera el de una DI
de mortalidad de 0,04 an!os1 que indica una supervivencia media de 25 aos (1/0,04 = 25). Sin embargo,
si se mide la incidencia de una enfermedad o la mortalidad por una causa especfica (no la mortalidad en
general), entonces esta estimacio!n de la supervivencia solamente sera! correcta cuando la persona no
este! a riesgo de otras causas de enfermedad o muerte, es decir, cuando no existan causas competitivas.
Esta interpretacio!n alternativa es conocida como el tiempo de espera.
Por ejemplo, se plantea la siguiente pregunta (MIR 2010):
Se ha realizado un estudio de cohortes en pacientes expuestos a diferentes anti-inflamatorios no
esteroideos. El evento de inters fue la ocurrencia de hemorragia digestiva alta. En la cohorte de
pacientes expuestos a ibuprofeno, se ha obtenido una densidad de incidencia de 2 por 1000 personas-
ao. Cmo debe interpretarse este resultado?
Las opciones de respuesta son:
1) Ocurren de media 2 casos de hemorragia digestiva alta por cada 1000 aos de exposicin a
ibuprofeno, sumados los tiempos de observacin de todos los individuos de la cohorte.
2) El riesgo de desarrollar una hemorragia digestiva alta estando expuesto a ibuprofeno es 2 veces
mayor que con el resto de antiinflamatorios no esteroideos, en personas tratadas al menos durante
1 ao.
3) Por cada 1000 personas que estn expuestas durante al menos un ao a ibuprofeno, se producen 2
casos de hemorragia digestiva alta.
4) Dos de cada 1000 personas que inician tratamiento con ibuprofeno desarrollan una hemorragia
digestiva alta despus de un ao.
5) Cada 2 aos de media, ocurre un nuevo caso de hemorragia digestiva en la cohorte de 1000 personas
expuestas a ibuprofeno

Cul es la respuesta correcta? El enunciado plantea que la DI = 0.002 aos
-1
.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
17
La DI es una medida de frecuencia absoluta, no de asociacin ni de comparacin alguna, por lo que la
opcin 2) no es vlida.
La opcin 3) se aproxima a la realidad, pero se estropea al decir al menos, pues significa que la unidad
de medida no es aos
-1
sino algo que es mayor de un ao, puesto que al menos significa que como
mnimo un ao, pero no se sabe el mximo tiempo. Si se suprimiesen esas dos palabras (al menos) la
opcin 3) sera correcta.
La DI no tiene interpretacin individual, ya que no es una proporcin, sino una tasa, por lo que la opcin 4)
es incorrecta. Puede ser por ejemplo que de cada 1000 personas sea slo 1 la que desarrolle la
hemorragia, pero que la suma de los tiempos de seguimiento individuales sea 500 personas-aos (porque
haya abandonos, causas competitivas, etc.), y 1 caso /500 personas-aos sera una DI = 0.002 aos
-1
.
La opcin 5) est mal calculada, ya que para ver cuntas personas-aos se necesitan para observar un
caso se debera hacer 1/0.002 = 500 personas-aos. Se necesita observar 500 personas un ao, 250
durante dos aos, o mil durante medio ao para observar un caso. Es decir, cada medio ao /y no cada 2)
de media por cada 1000 personas se produce un caso. La respuesta correcta es la primera.



Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
18
4. MEDIDAS DE ASOCIACIN E IMPACTO

MEDIDAS DE ASOCIACIN
Estiman la magnitud de relacin entre un factor y un efecto. Comparan una medida de frecuencia de
enfermedad (incidencia o prevalencia) en expuestos respecto a no expuestos, con el fin de estimar la
magnitud de la relacio!n entre la exposicio!n y el efecto (desenlace, resultado, enfermedad o lesio!n,
outcome en ingle!s). En principio, y como se ha visto en los criterios de Bradford Hill, cuanto mayor sea la
magnitud de la asociacio!n ma!s probable es que se trate de una relacio!n causal; aunque como ha descrito
Rothman en su modelo determinista modificado es posible que esto no se cumpla siempre.
! Riesgo relativo RR: Es la razn entre la incidencia acumulada en expuestos (IA1) y la incidencia
acumulada en no expuestos (IA0).

RR=IA1 / IA0.

Informa sobre cuntas veces es mayor el riesgo de que se produzca desenlace en expuestos en
comparacin con no expuestos. Expresa por cua!nto se multiplica el riesgo o probabilidad del
desenlace en personas expuestas en comparacio!n con las que no lo esta!n. Las razones de
prevalencias se estiman de manera parecida, con la diferencia de que se trabajan con prevalencias
en vez de con incidencias acumuladas y expresan cua!ntas veces mayor es la prevalencia en
personas expuestas en comparacio!n con personas no expuestas.
El RR carece de unidades de medida. Sus valores oscilan entre cero e infinito y su valor nulo es 1.
Cuando RR<1 la exposicin es protectora
si RR>1 la exposicin ser factor de riesgo
Si RR=1 se dice que el efecto (o asociacin) es nulo
Si el intervalo de confianza para el RR incluye el valor 1 se dir que los resultados son
compatibles con un efecto nulo (no son estadsticamente significativos)
El ejemplo siguiente es de un estudio sobre trastornos de conducta alimentaria (TCA).

Tabla 4.1. Relacin entre el estado civil de los padres y TCA en Navarra.
Estado civil SI TCA NO TCA TOTAL
Casados 74 2199 2273
Divorciados/Separados 16 220 236
TOTAL 90 2419 2509

IA1=16/236=0,0678

IA0=74/2273=0,0326

RR=IA1/IA0=2,08

El riesgo de TCA se multiplica por 2,08 en hijas de divorciados/separados comparadas con hijas de
padres casados. A este RR se le debe calcular su intervalo de confianza.

! Odds Ratio (OR): Es la razn de odds. Compara la frecuencia de exposicin en sujetos con o sin
desenlace. Carece de unidades. Sus valores oscilan entre el cero e infinito. Su valor nulo es 1. Una
OR = 1 implica que las dos categoras comparadas son iguales.
Al igual que para el riesgo relativo, OR>1 implica exposicin perjudicial. OR<1 exposicin protectora.
Lo mismo que para el RR puede decirse tambin de la OR respecto a cuando sus intervalos de
confianza comprenden o no el valor 1. Si incluyen el valor 1, no habr diferencias significativas entre
las categoras comparadas.
La OR se suele estimar en estudios epidemiolo!gicos de casos y controles (que se vern ma!s
adelante), aunque en realidad se puede estimar con cualquier diseo de estudio. Si se cumplen
ciertas condiciones (enfermedades poco frecuentes) la OR es un buen estimador del Riesgo
Relativo. La razo!n por la cual tiene intere!s la OR es, en primer lugar, porque es la u!nica medida de
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
19
asociacio!n que se puede estimar en ciertos tipos de estudios epidemiolo!gicos como los estudios de
casos y controles y, en segundo lugar, porque es la medida de asociacio!n que estiman los
programas estadsticos cuando se utilizan ana!lisis multivariantes de Regresio!n Logi!stica.
En el ejemplo anterior:

Odds1=16/220=0,07272;

Odds0=74/2199=0,033651

OR=2,16

La OR es un buen estimador del RR pero tiende a sobreestimarlo especialmente cuando el
suceso es frecuente y las diferencias entre grupos son grandes.
Es posible corregir esta sobreestimacin cuando el suceso es frecuente:

OR
RR= ----------------------------
(1-IA0) + (IA0 x OR)

La OR tiene una ventaja sobre el RR consiste en que la OR es simtrica.
OR y RR de TCA para las hijas de divorciados/separados:
OR= 2,16 (RR=2,08)
OR y RR de ser hijas de divorciados/separados si tienen TCA:
OR=2,16 (RR=1,95)
(16/74) 16x2199
OR=--------------- = ------------- = 2,16
(220/2199) 220x74

(16/90) 0,1778
RR=---------------- =-------------= 1,95
(220/2419) 0,0909

A diferencia del RR, la OR es igual en un sentido que en otro (simtrica).
La Odds Ratio se puede calcular directamente de los valores de la tabla tetraco!rica hallando la razo!n de
los productos cruzados (de all que la OR se llame tambie!n as), siempre que la casilla correspondiente a
la presencia tanto del desenlace de intere!s y de la exposicio!n o bien de la ausencia simulta!nea de ambas
se encuentre en la casilla superior izquierda de la tabla 2x2, como puede verse en el ejemplo siguiente:



En los estudios de casos y controles emparejados, uno o ms controles se equiparan con el caso en
sexo, edad y otras caractersticas de inters. Aqu se expone la opcin ms sencilla: un control por caso.
Para calcular la OR se construye una tabla 2 x 2 en la que cada celda represente parejas de caso-control.
La OR es el cociente entre parejas discordantes.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
2u
Tabla 4.2. Ejemplo de estudio de Casos y Controles emparejados.
Parejas Control con migraa Control sin migraa
Ictus con migraa 34 60
Ictus sin migraa 32 74

OR=60/32=1,8.
Las personas que padecen migraa tienen una odds 1,8 veces mayor de padecer ictus que
quienes no tienen migraa. A esta OR se le debe calcular su intervalo de confianza.

MEDIDAS DE IMPACTO
Una vez que se puede asumir la causalidad, las medidas impacto permiten estimar la carga de
enfermedad atribuible a ese factor y el beneficio de las acciones preventivas dirigidas a eliminarlo.

Tabla 4.3. Cohorte prospectiva.
Desarrollan enfermedad No desarrollan enfermedad Total
Expuestos 40 60 100
No expuestos 20 80 100
Total 60 140 200
Nota: Se asume causalidad y validez externa.

Incidencia acumulada en expuestos =IA1 = 40/100=0,4
Incidencia acumulada en no expuestos =IA0 = 20/100=0,2
Incidencia acumulada en poblacin total =IAtotal = 60/200=0,3

Tabla 4.4. Anlisis de la cohorte prospectiva de la tabla 4.3.
1
pce: proporcin de casos expuestos
RIESGO RELATIVO (RR)
RR RR = IA1/ IA0 = 2
La enfermedad es dos veces ms frecuente en los expuestos
INCREMENTO RELATIVO DE RIESGO (IRR) EN EXPUESTOS
IRR IRR=(RR-1)x100=(2-1) x 100=100%
La exposicin incrementa relativamente el riesgo en un 100%
RIESGO ATRIBUIBLE EN EXPUESTOS (RAE) -INCREMENTO ABSOLUTO DEL RIESGO (IAR)
RAE =IAR= IA1-IA0 = 0,4-0,2= 0,2
Un 20% de los expuestos padecern la enfermedad precisamente por haber estado expuestos. Si se
evitase la exposicin, se prevendra la enfermedad en el 20% de los expuestos.
NMERO NECESARIO PARA INTERVENIR (NNI)
NNI= 1/ RAE = 1/0,2=5
Hay que intervenir sobre 5 personas expuestas para prevenir un caso.
FRACCIN ETIOLGICA EN EXPUESTOS (FEE)
FEE = RAE / I1= RR-1 / RR=0,5 (50%)
El 50% de los casos que se producen en expuestos se deben a la exposicin.
Evitando la exposicin, se prevendra la mitad de los casos que ocurren en expuestos
RIESGO ATRIBUIBLE POBLACIONAL (RAP)
RAP= IAtotal - IA0=0,3-0,2=0,1
El 10% de la poblacin adquirir la enfermedad debido a la exposicin.
Se prevendra la enfermedad en el 10% de toda la poblacin si se evitase la exposicin.
FRACCIN ETIOLGICA POBLACIONAL (FEP)
PROPORCIN DE RIESGO ATRIBUIBLE POBLACIONAL (RAP%)
FEP
RAP%
FEP=pce
1
FEE= (40/60)x0,5=0,33
RAP%= (IAt- IA0/ Itotal)x100=33%
La tercera parte de los casos que se producen en la poblacin se deben a la exposicin.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
21

Tabla 4.5. Cohorte prospectiva (medida protectora)
Un ensayo aleatorizado de prevencin de cncer de mama con mamografas (MM).
Muertes Muertes-aos Tasa de mortalidad
Mamografa 70 20000 0,0035 aos
-1
No mamografa 120 30000 0,0040 aos
-1

Total 190 50000 0,0038 aos
-1

Se asume causalidad y validez externa.


Tabla 4.6. Anlisis de la cohorte prospectiva (medida protectora) de la tabla 4.5.

RAZN DE DENSIDADES DE INCIDENCIA (RDI)
RDI= DI1 / DI0 = 0,875
La tasa de mortalidad en las expuestas es del 87,5% de la tasa en no expuestas.

REDUCCIN RELATIVA DEL RIESGO o FRACCIN PREVENTIVA (FP)
FP = 1-RDI=1-0.875=0,125
El programa de mamografas reduce en 12.5% la tasa de mortalidad

DIFERENCIA DE DENSIDADES DE INCIDENCIA (DDI)
o REDUCCIN ABSOLUTA DE LA TASA
DDI = DI0-DI1= 0,0005 aos
-1
El programa de mamografas evita 5 muertes al ao por cada 10000 mujeres sometidas a mamografa

NMERO NECESARIO PARA INTERVENIR O TRATAR (NNT)
NNT=1/DDI=2000
Para evitar una muerte al ao es necesario que 2000 mujeres se sometan a mamografa.

DIFERENCIA DE DENSIDADES DE INCIDENCIA POBLACIONAL (DDIP)
DDIP DDIP=DItotal DI1=0,0003 aos
-1

Si todas las mujeres se sometiesen a mamografas se evitaran 3 muertes/ao por
cada 10000 mujeres.

FRACCIN PREVENIBLE POBLACIONAL (FPP)
FPP=pcne
1
x FP= (120/190) x 0,125= 0,0789=7,9%
Si todas las mujeres de esa poblacin se sometiesen a mamografas, se podran prevenir potencialmente
el 7,9% de las muertes por cncer de mama que actualmente ocurren en esa poblacin
1
pcne: proporcin de casos No expuestos

En los estudios de casos y controles, se calcula habitualmente slo la odds ratio (OR). Si se asume que la
enfermedad sea rara (<10%) y se conoce la incidencia total por fuentes externas (no se pueden calcular
directamente ni la incidencia ni el riesgo atribuible), se podra aplicar las siguientes frmulas (poco
usadas) para derivar fracciones etiolgicas y riesgos atribuibles.
FEP = FEE ! pce
RAP = RAE ! pe

En general, casi nunca se llega al RAP en estudios de casos y controles.

OR
OR
FEE
1 !
=
1 1
1
+ !
!
=
) (
) (
OR pe
OR I
RAE
total
OR = odds ratio
FEE = fraccin etiolgica en expuestos
FEP = fraccin etiolgica poblacional
RAE = riesgo atribuible en expuestos
RAP = riesgo atribuible poblacional
pe = proporcin de sujetos expuestos (en la poblacin)
pce = proporcin de casos expuestos


Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
22
INCREMENTO RELATIVO DEL RIESGO
A trave!s de las medidas de asociacio!n como el RR se puede hallar el incremento relativo de
riesgo que se asocia a una exposicio!n. Dado que el valor nulo de una medida de asociacio!n es RR = 1
entonces, si se halla un RR = 1,5, podr estimarse el aumento relativo que ha experimentado el RR al
incrementar de 1 (ausencia de asociacio!n o valor nulo) a 1,5 (asociacio!n): 1,5 - 1 = 0,5. Este incremento
de 0,5 es de hecho el 50 % del valor nulo inicial RR = 1 (0,5 es la mitad de 1).
Por lo tanto, se expresa la cantidad de 0,5 en te!rminos de incremento relativo como un porcentaje (o
proporcio!n de incremento relativo debido a la exposicio!n) multiplica!ndolo por 100. Al obtener un RR = 1,5
se puede decir que ha habido un incremento relativo de riesgo del 50 % debido a la exposicio!n (en el
caso de asumir que efectivamente existe una relacio!n causal), pero esto no debe confundirse con el
incremento absoluto del riesgo que consiste en la diferencia entre el riesgo en expuestos y el riesgo en no
expuestos (o riesgo atribuible en expuestos).

INCREMENTO ABSOLUTO DEL RIESGO
Los efectos absolutos se pueden medir hallando la diferencia entre incidencias acumuladas,
densidades de incidencia o prevalencias entre un grupo expuesto a un factor de riesgo y otro no
expuesto.
Generalmente, los efectos absolutos son medidas u!tiles a la hora de valorar el impacto del
problema de Salud Pu!blica provocado por la exposicio!n a un factor de riesgo (por ejemplo, para la
administracio!n sanitaria) y asi! mismo el beneficio potencial esperable si elimina!semos dicho factor de
riesgo en personas expuestas.
El riesgo atribuible en expuestos (RAE) se llama tambie!n diferencia de riesgo, exceso de riesgo,
o incremento absoluto de riesgo. El te!rmino de riesgo atribuible en expuestos (RAE) expresa que!
incidencia de enfermedad es debida a la exposicio!n (relacio!n causal) y, por lo tanto, da una idea de la
frecuencia de enfermedad, en personas expuestas, que puede atribuirse a la exposicio!n a un factor de
riesgo determinado.
Por ejemplo, si se produjo enfermedad en el 2% de los no expuestos y en el 2,4% de los
expuestos, el RAE o incremento absoluto del riesgo ser del 0,4%, pero en cambio, el
RR=0,024/0,02=1,2 y corresponder a un incremento relativo del riesgo del 20%, ya que 1,2 es un 20%
superior a 1 (valor nulo).
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
2S
5. TIPOS DE ESTUDIOS EPIDEMIOLGICOS

MUESTRAS EN EPIDEMIOLOGI!A
Normalmente, no es posible estudiar a todas las personas que pertenecen a una poblacio!n. Por
ello, se seleccionan muestras o subconjuntos ma!s pequeos de dichas poblaciones. A la poblacio!n de la
que se extrae la muestra se le llama poblacio!n diana. Si el procedimiento de muestreo es el adecuado, la
muestra tendra! caracteri!sticas parecidas a la poblacio!n diana de la que se ha extrai!do, es decir el que sea
representativa de esta poblacio!n diana. Se podrn generalizar (validez externa) los resultados a la
poblacio!n entera si la muestra es representativa de dicha poblacio!n.
Existen diferentes procedimientos de muestreo. Estos procedimientos pueden clasificarse en dos grandes
grupos:
muestreo aleatorio o por probabilidad
muestreo no aleatorio.
El muestreo aleatorio se caracteriza porque todas las personas de la poblacio!n diana tienen una
probabilidad conocida de ser elegidas. Para realizar este tipo de muestreo se requiere un registro de
todos los sujetos pertenecientes a la poblacio!n diana. Es el muestreo que asegura una mayor
representatividad de la muestra y, siempre que sea posible, es el me!todo preferible.
Se habla de muestra aleatoria estratificada cuando se divide la poblacio!n en subgrupos, atendiendo a
alguna caracterstica importante como por ejemplo la edad o el nivel socioecono!mico, y se selecciona una
muestra aleatoria de cada grupo. Si el taman!o que se elige de cada subgrupo o estrato es proporcional a
la frecuencia de este subgrupo o estrato en la poblacio!n de origen, entonces la muestra total ara los
diferentes estratos sera! representativa de la poblacio!n de origen.
Muestra agrupada (cluster sampling). Consiste en que cada unidad de seleccio!n esta! constituida por un
grupo de personas (todos los nin!os de una escuela, los miembros de una familia, todos los pacientes de
un centro de salud, etc.). La unidad de muestreo final no es una persona individual, sino que es un
colectivo (cluster).
En otras ocasiones la seleccio!n de la muestra se hace por conveniencia (voluntarios, pacientes
de una determinada consulta...) o de forma sistema!tica segu!n criterios tales como el di!a de la semana, el
nu!mero de orden del paciente, etc. Puede ocurrir que aspectos tales como la gravedad del caso, la fase
de la enfermedad o la presencia de otras comorbilidades influyan sobre los criterios elegidos para la
seleccio!n de la muestra el dia de la semana en que se ve el paciente, la hora de visita... lo que
puede comprometer la representatividad de la misma. Cuando la probabilidad que tiene un sujeto de la
poblacio!n diana para ser elegido es desconocida se habla de muestreo no aleatorio.
Las muestras verdaderamente representativas escasean en la realidad. Qu problemas trae
esto? Los problemas son graves cuando el objetivo del estudio es responder a una pregunta descriptiva
(cul es la proporcin de fumadores?, cul es el colesterol medio en la poblacin?, qu porcentaje de
mujeres usan el mtodo sintotrmico?, etc.). En estas investigaciones el objetivo es calcular una media o
una proporcin usando la muestra en vez de la poblacin para ahorrar recursos y se hace absolutamente
necesario garantizar la representatividad. Hablamos de descripcin en estos casos porque no se estn
haciendo comparaciones.
En cambio, el problema de la muestra no representativa y el posible compromiso para la validez
externa no suele ser tan grave cuando se asume que no se va a describir una poblacin sino que
simplemente se trata de hacer comparaciones vlidas internamente para los que participan en el estudio
(es mejor el tratamiento mdico o el tratamiento quirrgico en estos pacientes? puede ser que el
consumo de caf haya protegido a sus consumidores frente a la diabetes? aumenta el riesgo de cncer
de mama si se consumen anticonceptivos orales?, etc.). En estas situaciones, aunque la muestra no sea
perfectamente representativa puede solventarse el problema y no deberan caer los investigadores en
una preocupacin obsesiva que les lleve a buscar metas utpicas en pro de garantizar la
representatividad estadstica. Esta preocupacin desaforada por obtener la representatividad estadstica a
veces ha podido hacer ms dao que bien a la ciencia, especialmente en la investigacin de las causas
de las enfermedades (epidemiologa analtica), tal como han denunciado los autores ms destacados en
epidemiologa. Rothman, quiz el principal de ellos, llega a afirmar taxativamente lo siguiente "la
representatividad es una falacia que ha contaminado a los estudios epidemiolgicos durante dcadas".
Esta fuerte afirmacin requiere ser matizada. Es cierto que muchos de los descubrimientos ms
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
24
importantes de la epidemiologa moderna se han realizado en muestras que no eran representativas en el
sentido estadstico del trmino. Por ejemplo, una muestra que slo inclua a varones ingleses, todos ellos
de clase alta, pues todos eran mdicos (y entonces, a pesar de las apariencias actuales, ser mdico s
que equivala a un alto estatus econmico) fue definitiva para comprobar que el tabaco produca cncer
de pulmn. Esta muestra no era en absoluto representativa de la poblacin general britnica. Sin
embargo, podran generalizarse sus resultados a las mujeres o a los varones que no fuesen mdicos?
Lo que debe tenerse en cuenta es que generalizar no es un proceso estadstico automtico.
En las encuestas transversales (descriptivas) s que interesa asegurar la representatividad, pues
lo que se hace es elegir una muestra a partir de la poblacin diana para ahorrar costes, pues medir una
caracterstica en toda la poblacin diana sera muy caro. Entonces, la representatividad estadstica
(seleccin por muestreo aleatorio) es un aspecto prioritario en esos caso, como hemos dicho. En cambio,
en los estudios comparativos (casos y controles, cohortes, ensayos clnicos, como se ver a
continuacin), el objetivo no es describir, sino llegar a realizar una inferencia cientfica, que no se basa en
extrapolar el resultado estimado en una muestra a una poblacin mayor o universo, sino que
precisamente suele requerir elegir personas peculiares (con frecuencia nada representativas) para hacer
la investigacin. Una vez obtenidas unas conclusiones con alta validez interna, se trata de generalizarlas
a toda la humanidad en funcin del conocimiento biolgico, no de una aplicacin automtica de principios
estadsticos. A veces ser preferible que participen en un estudio slo las personas ms motivadas y
conscientes, porque sern quienes proporcionarn una informacin ms fiable, aunque la baja
participacin reduzca la representatividad en el sentido estadstico del trmino.
En este sentido, a veces (no siempre, desde luego) los estudios con una baja proporcin de
candidatos que aceptan participar, pueden ser ms vlidos que aquellos donde se garantiza que una alta
proporcin de los invitados acepta participar. La ciencia adquirida con el estudio del tabaco y el cncer de
pulmn en los mdicos britnicos se extrapola a todas las personas, no mediante una "representatividad"
estadstica sino por las siguientes razones:
1) No hay ningn motivo biolgico para pensar que si el tabaco causa cncer en los varones no lo vaya a
causar en mujeres, es que es distinto el tejido pulmonar en los hombres y en las mujeres en cuanto a sus
susceptibilidad a cancergenos? Afirmar que es distinto supondra olvidar la histopatologa pulmonar.
2) No hay ningn motivo biolgico para pensar que si el tabaco causa cncer en quienes son intelectuales o
de clase alta no lo vaya a causar en los de clase baja o en quienes no han estudiado medicina, es que
cambia el tejido pulmonar cuando uno de clase social baja pasa a ser de clase alta o cuando alguien se
licencia en medicina?
3) Sucesivos estudios de otros pases realizados en otras muestras, que tampoco son por s mismas
representativos, corroboran que cuanto ms se exponen las personas al tabaco, mayor es su riesgo de
desarrollar cncer de pulmn (consistencia).
4) Estudios realizados en animales demuestran que el humo del tabaco es cancergeno.
5) El anlisis qumico del humo del tabaco identifica conocidos cancergenos en altas concentraciones
presentes en l.
6) Se observa que en quienes dejan de fumar se reduce mucho el riesgo de cncer de pulmn.
7) Se observa que en quienes nunca fumaron pero han convivido largamente con fumadores (fumadores
pasivos) tambin aumenta el riesgo de cncer de pulmn.
Todas estas razones, que no son de carcter estadstico, sino de conocimiento biolgico y
epidemiolgico, son los motivos realmente importantes para dar validez a los estudios de tipo comparativo
(aqu se comparan fumadores frente a no fumadores). Los estudios comparativos son los ms habituales
en la epidemiologa analtica y en el diseo experimental. Sin embargo, a quienes estn acostumbrados a
realizar estudios slo descriptivos les produce de entrada extraeza encontrarse con un estudio
comparativo que use una muestra claramente no representativa (es el caso de los mejores ensayos
clnicos que ms han cambiado la prctica mdica). Pero, simplemente teniendo en cuenta los principios
anteriores, puede comprenderse que la representatividad estadstica queda muy detrs en este tipo de
estudios no descriptivos que buscan hacer inferencias cientficas. Este es el sentido de las palabras de
Rothman antes citadas. De todos modos, cuando sea posible, tambin estos estudios mejoran si la
muestra que se elige cuenta con garantas de representatividad, pues entonces su aplicacin a una
poblacin diana es ms directa. La pena es perder la oportunidad de realizarlos, o comprometer
seriamente su viabilidad dndole prioridad equivocadamente al objetivo de que la muestra sea
representativa. Hay otras prioridades en el diseo.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
2S
ESTUDIOS ANALTICOS
Pretenden inferir causalidad. Se clasifican en:
Experimentales: el investigador asigna los participantes a recibir o no la exposicin.
! Experimentales puros: la asignacin es aleatoria
! Cuasi experimentales: no son aleatorizados.
Los estudios experimentales pueden ser:
! Ensayo clnico: son pacientes y se aleatorizan a una intervencin teraputica
! Ensayo de campo: son sujetos sanos y se aleatorizan a medidas preventivas
! Ensayo comunitario. Un colectivo es la unidad de aleatorizacin.
Los requisitos ticos son muy importantes en los ensayos. nicamente se asignarn exposiciones
protectoras. No deben existir mejores posibilidades de tratamiento que las ofrecidas. A la luz de los
conocimientos existentes, las dos alternativas deberan ser igualmente aceptables. No es tico comparar
con placebo si hay otro tratamiento eficaz. Los participantes deben estar adecuadamente informados de
las consecuencias de la participacin en el estudio y deben firmar su consentimiento. El ensayo debe ser
aprobado por un comit tico. Los ensayos con medicamentos requieren diversos requisitos legales.
No experimentales: tambin llamados observacionales. El investigador observa lo que de manera
natural ocurre en expuestos y no expuestos, sin que el investigador asigne nada.
! Cohortes: los sujetos inicialmente libres del desenlace se clasifican en expuestos y no expuestos, y
se les sigue para observar el desarrollo del desenlace o efecto. Una cohorte es un grupo de personas
que comparten una experiencia comu!n en un mismo periodo de tiempo. Por ejemplo, una cohorte de
nacimiento seri!a un grupo de personas nacidas en un mismo ao y una cohorte ocupacional o
laboral, un grupo de personas que trabajan en una misma profesio!n. En los estudios de cohortes
prospectivos
3
, todos tienen que estar libres de enfermedad al comienzo del estudio. No es necesario
realizar un estudio de cohortes con una sola exposicio!n. El ejemplo de la cohorte de trastornos de la
conducta alimentaria (TCA) en Navarra era un estudio de cohortes prospectivo en el que se
recogieron una serie de variables como los datos sociodemogra!ficos de las chicas, estado civil de los
padres, antecedentes familiares de trastornos psiquia!tricos, frecuencia de comidas en solitario,
exposicio!n a medios de comunicacio!n como las revistas del corazo!n o la radio y puntuaciones en
diferentes pruebas psicolo!gicas. Posteriormente, se midi la incidencia de casos nuevos de TCA que
se presentaron a lo largo de 18 meses de observacio!n. De esta forma se pudo asociar cualquier
exposicio!n con la incidencia de TCA.
! Casos y controles se examina comparativamente la exposicin al factor de riesgo en sujetos con la
enfermedad de inters (casos) y en sujetos libres de ella (controles). Las personas se seleccionan
basa!ndose en la presencia (casos) o ausencia (controles) de una enfermedad cuya etiologi!a se
quiere estudiar. A continuacio!n, se valora la presencia o no de factores de riesgo (exposicio!n) en el
pasado, para estimar si existe una mayor prevalencia de exposicio!n en enfermos en comparacio!n
con esa muestra de personas sanas que son los controles
4
.
El propo!sito de tener un grupo control es el poder medir la frecuencia relativa de expuestos y no
expuestos en la poblacio!n de riesgo; as pues, es imperativo que los controles se seleccionen de
forma independiente a su nivel de exposicio!n.
Los estudios de casos y controles pueden tener un cara!cter prospectivo cuando, despue!s de iniciarse
el estudio, se espera a que aparezcan casos nuevos de enfermedad en la poblacio!n (casos
incidentes) para ir incorpora!ndolos al grupo de personas enfermas. Los controles se suelen
incorporar tambie!n paulatinamente al estudio aunque a veces se pueden escoger aleatoriamente,
una vez conseguidos todos los casos que se requieren, de una lista de posibles controles. Por el

3
En los estudios de cohortes retrospectivos (no concurrentes o histo!ricos), tambie!n se identifican los grupos a comparar
basa!ndose en la presencia o no de la exposicio!n de intere!s, personas expuestas o no expuestas al comienzo del estudio, pero en
el momento en que comienza el estudio, ya se han producido todos los desenlaces. Estos estudios dependen totalmente de la
existencia de un buen registro. Lo que se hace es retroceder en el tiempo para identificar las cohortes expuestas y no expuestas y
se buscan los casos nuevos de enfermedad, en ambos grupos, y que tuvieron lugar en los an!os posteriores al comienzo de la
exposicio!n, pero que son aos previos al comienzo de la investigacin.
4
Una estrategia para reducir costes de un estudio de cohortes es almacenar las muestras biolo!gicas que se tomen de toda una
cohorte, pero no gastar dinero en analizar las muestras de todos los participantes, sino so!lo de aquellos que con el paso del
tiempo van desarrollando eventos, compara!ndolos con controles que no los hayan desarrollado en ese momento. Este diseo
sera un diseo de casos y controles anidados en la cohorte (nested case-control).
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
26
contrario, los estudios de casos y controles tienen cara!cter retrospectivo cuando los casos de
enfermedad ya se han producido todos al comienzo del estudio (casos prevalentes). Es aconsejable
utilizar solamente los casos incidentes para evitar el sesgo de supervivencia o falacia de Neyman
que consiste en que las personas que ma!s sobreviven a una enfermedad presentan probablemente
formas ma!s leves de la misma y por lo tanto probablemente tambie!n una menor exposicio!n al factor
de riesgo en comparacio!n con personas que fallecen antes, por padecer formas ma!s agudas y/o
graves de enfermedad.

ESTUDIOS DESCRIPTIVOS
Tratan de presentar, sintetizar y resumir la distribucin de la enfermedad o de la exposicin
atendiendo a variables epidemiolgicas de persona, lugar y tiempo.
En ocasiones no es sencillo distinguir entre estudios puramente descriptivos y analticos. Por
ejemplo, cuando construimos una tabla a partir de datos poblacionales, para resaltar diferencias de
frecuencias de enfermedad entre grupos, lo podemos hacer simplemente porque algo nos ha llamado la
atencio!n, o bien porque quiza!s la frecuencia de enfermedad observada nos parece diferente a la
esperada. En este u!ltimo caso se estara procediendo (aunque de manera implcita) a una comparacio!n
entre lo observado y lo esperado, lo que es un proceso analtico que nos conduce a valorar las posibles
causas de las diferencias observadas. Por otra parte, aunque no tengamos ninguna idea preconcebida
sobre lo que deberamos hallar en nuestros datos, la descripcio!n de los mismos nos puede llevar a
realizar comparaciones entre subgrupos de la muestra estudiada y a encontrar diferencias que sugieran la
existencia de factores de riesgo. La diferencia entre este estudio (con cara!cter eminentemente
descriptivo) y otro que fuera analtico de entrada, es que el primero tiene como objetivo generar hipo!tesis
mientras que el segundo se disea especi!ficamente para llegar a conclusiones etiolo!gicas basadas en
comparaciones correctas.
! Estudios transversales, de corte, (cross-sectional) o de prevalencia: recogen en un momento
concreto y de forma simultnea la exposicin y el efecto. No aseguran una correcta secuencia
temporal y, en principio, no pueden ser utilizados para inferir causalidad. Cuando se trata de
exposiciones estables en el tiempo (sexo, polimorfismos gene!ticos, etnia, etc.), debe considerarse
siempre que con este tipo de estudios no es posible diferenciar entre factores de riesgo (por tenerlos,
se esta! enfermo) y factores prono!sticos (por tenerlos, se tiene una supervivencia ma!s o menos
prolongada). No se debe olvidar nunca que la prevalencia depende tanto de la incidencia como de la
duracin de la enfermedad.
! Estudios ecolgicos tienen como unidad de estudio y anlisis a colectivos determinados segn
criterios geogrficos o temporales. A cada individuo se le asigna el valor medio o modal de la
exposicin de su grupo. Es decir, la unidad de observacio!n y ana!lisis es la poblacio!n, de tal forma
que se utilizan valores medios de exposicio!n (de ahi! que se puedan llamar ecolo!gicos) y desenlace
que se aplican o se refieren a una poblacio!n de estudio entera. Pueden servir para generar hiptesis.
No obstante, algunas intervenciones preventivas de tipo legislativo o en general estructural, so!lo
pueden medirse a este nivel, por ejemplo la prohibicio!n de beber alcohol con menos de 18 o! 21 an!os
o la legislacio!n que regula el aborto en un pas. Son estudios relativamente fa!ciles, econo!micos y
ra!pidos de realizar porque su aplicacio!n depende frecuentemente de informacio!n que ya existe a la
que se le llaman datos secundarios (encuestas nacionales de salud, registros rutinarios de
enfermedad), no recogidos especi!ficamente para el estudio. El inconveniente obvio de estos estudios
es que la correlacio!n asume que todos los miembros de las poblaciones esta!n expuestos en la
misma medida al factor de riesgo. El ca!lculo per capita por ejemplo del consumo total de carne por
pases y su relacin con las tasas de cncer de colon asume que todos los habitantes de un pas
comern la misma cantidad de carne. El error es asumir que todos los ciudadanos de un pas ( ode
una provincia o ciudad) tienen la misma exposicio!n. Adema!s, no se puede estar seguro de que las
personas que han tenido ca!ncer de colon son precisamente aquellas que han consumido mucha
carne. En resumidas cuentas, no se puede relacionar un individuo enfermo con su exposicio!n
especi!fica al factor estudiado. Por este motivo es posible que asociaciones medidas a nivel agregado
(estudios ecolgicos) sean contrarias a la realidad que se obtendra si se midiesen a nivel individual.
Este feno!meno se llama la falacia ecolo!gica. En la figura inferior se explica cmo el ndice de masa
corporal (IMC) est directamente asociado con el nivel econmico a nivel ecolgico (hay mayor IMC
medio en los pases ms ricos), pero inversamente asociado a nivel individual (en muchos pases
hay ms obesidad en las clases sociales ms desfavorecidas). La verdad cientfica la da la
asociacin medida individualmente, lo otro es falacia ecolgica, aunque tambin puede ser un efecto
contextual de inters en salud pblica.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
27
Figura 5.1. Falacia ecolgica.

! Series de casos: describen las caractersticas en la evolucin natural de un proceso.

Figura 5.2. Clasificacin de los principales estudios epidemiolgicos
















Tabla 5.1. Ventajas y limitaciones de los estudios analticos.
El mejor para inferir causalidad
Gran control de las condiciones del estudio
ENSAYOS La aleatorizacin minimiza los sesgos (poca confusin)
Condicionantes ticos
Escasa validez externa
Adecuados para enfermedades frecuentes
Adecuados para exposiciones raras
tiles para valorar multiefectividad
COHORTES Estudia historia natural enfermedad (secuencia temporal)
Calcula directamente incidencias
Complejos, duraderos y caros
Principal problema: prdidas durante el seguimiento
Adecuados para enfermedades raras
tiles para valorar multicausalidad
CASOS Y CONTROLES Reproducibles, breves y baratos
Mejor eficiencia estadstica
Principal problema: sesgos de seleccin y de informacin

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
28
6. SESGOS DE INFORMACIN Y SELECCIN


ERROR ALEATORIO Y PRECISIN
Un error aleatorio es un error que no es constante en cada medicio!n, no ocurre siempre en la misma
direccio!n. De manera aleatoria, obtenemos valores a veces mayores y a veces menores que el valor real.
Por ejemplo, hablariamos de error aleatorio en una ba!scula que a veces mide por defecto y otras por
exceso.
Habra! mayor precisio!n o mayor fiabilidad de una medicio!n, cuando los errores aleatorios sean pequen!os.
En ausencia de error sistema!tico, si realiza!ramos la media de una serie de mediciones con errores
aleatorios, dicho valor medio se acercara al valor real. El rango entre una serie de mediciones aumenta
con el grado de errores aleatorios. El error aleatorio no afecta en si! a la validez interna pero s dificulta la
posibilidad de encontrar una asociacio!n entre dos variables por la imprecisio!n de las medidas. La
estadstica trata fundamentalmente del error aleatorio (falta de precisin); la epidemiologa se ocupa del
error sistemtico o falta de validez. La validez puede ser interna o externa.

VALIDEZ INTERNA
La validez interna de un estudio epidemiolo!gico valora el grado en que los resultados obtenidos son
correctos para las personas incluidas en ese estudio concreto. Se obtiene evitando errores en el diseo
del estudio pero tambie!n en el ana!lisis de los datos.

VALIDEZ EXTERNA
La validez externa de un estudio es la capacidad de poder generalizar los resultados de la muestra en el
estudio a la poblacio!n de referencia o a aquella sobre la que se pretenden aplicar las conclusiones del
estudio. Se obtiene trabajando con muestras representativas de la poblacio!n de referencia (muestreo
aleatorio probabilstico, o cualquiera de las otras variedades, cuando es posible) y evitando que el
desarrollo del estudio o la falta de seguimiento adecuado de sus participantes modifiquen una seleccio!n
de personas inicialmente adecuada.

SESGOS
Un sesgo se puede definir como un error sistema!tico en un estudio epidemiolo!gico que tiene como
consecuencia la estimacio!n erro!nea de la asociacio!n entre la exposicio!n y el desenlace (entre variable
independiente y variable dependiente, respectivamente). Al trabajar con seres humanos, es pra!cticamente
imposible eliminar los sesgos en su totalidad; no es posible obtener grupos de comparacio!n ide!nticos que
solamente se diferencien en la exposicio!n de intere!s como en experimentos con animales gene!ticamente
similares. Los sesgos pueden originarse en cualquier fase de la investigacio!n: la revisio!n bibliogra!fica, la
seleccio!n de participantes, la obtencio!n de datos de mu!ltiples lugares o registros, en los procesos de
medicio!n, en el ana!lisis e interpretacio!n de los resultados y, finalmente, en la fase de publicacio!n.

SESGOS DE SELECCIN
Existe una caracterstica que simultneamente se asocia a mayor probabilidad de ser elegido y a un
determinado resultado en la asociacin. Un sesgo se seleccin lleva a que no se incluyan las personas
adecuadas para que la comparacin sea vlidamente causal.
! Mala seleccin al inicio del estudio. Por ejemplo, si para anticonceptivos orales-infarto se calcula el
riesgo atribuible en expuestas (RAE) y se exponen a anticonceptivos las mujeres especficamente
seleccionadas por tener bajo riesgo cardiovascular (no fumadoras, delgadas, normotensas) se
infravalorar el verdadero RAE.
! Sesgo del trabajador sano: (cohortes) la morbimortalidad asociada a una exposicin laboral de riesgo
es menor en trabajadores expuestos, ya que se exponen por ser especialmente sanos para este
trabajo (esto les hace tambin no ser retirados de l).
! Sesgo de sospecha diagnstica: la exposicin a un factor de riesgo levanta sospechas, propicia el
diagnstico y facilita entrar como caso en estudios de casos y controles.
! Falacia de Neyman o sesgo de supervivencia: ocurre en estudios de casos y controles con casos
prevalentes. Los factores de riesgo pueden ser tambin factores pronsticos que determinen la
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
29
duracin de la enfermedad. Si la exposicin agrava el pronstico, los casos prevalentes sern
preferentemente no expuestos (los expuestos mueren pronto y no tienen oportunidad de elegirse).
Esto infravalorara la asociacin. En caso contrario (el factor de riesgo es factor de buen pronstico),
se sobreestimara la asociacin. En la asociacin alcohol-miocardiopata dilatada, la miocardiopata
dilatada alcohlica tiene mejor pronstico que la isqumica o la idioptica. Los pacientes con
miocardiopata dilatada alcohlica viven ms por lo que es ms probable que sean elegidos como
casos; as la exposicin est ms representada en los casos, sobrevalorndose la asociacin.
! Sesgo de Berkson: en estudios de casos y controles con controles hospitalarios (los controles son
enfermos con enfermedades distintas a la estudiada). Sucede si el factor de riesgo se asocia con
mayor o con menor probabilidad de ser hospitalizado.
! Sesgo por prdidas diferenciales. En los estudios de seguimiento, suele haber participantes que
abandonan el estudio. El problema es que las prdidas suelen ser diferenciales. Si los perdidos
son diferentes a los retenidos, es posible que hubiesen respondido de manera diferente a la
exposicin. Unas prdidas>25% cuestionan seriamente los resultados. Para defender su validez,
se realiza:
o Comparaciones de caractersticas basales entre seguidos y perdidos
o Mtodos probabilsticos de ponderacin que le dan ms peso a los retenidos que
tienen caractersticas ms similares a los perdidos.
o Anlisis de sensibilidad: se repiten los anlisis asumiendo los supuestos:
(a) qu pasara si todos los perdidos desarrollasen el efecto
(b) qu pasara si ninguno lo desarrolla.
Si no cambia el RR, es improbable que haya existido sesgo por prdidas.

SESGOS DE CLASIFICACIN O INFORMACIN
Se trata de errores introducidos por el investigador al medir las variables. Hay que distinguir:
! Mala clasificacin no diferencial: el error afecta por igual a todos los grupos. Por ejemplo se
clasifica igual de mal la exposicin en los casos y en los controles; o se clasifica igual de mal la
incidencia de enfermedad en expuestos y no expuestos. Sesgan habitualmente hacia el valor nulo
(acercan el RR o la OR a 1).
! Mala clasificacin diferencial: el error afecta de un modo distinto a los grupos e introduce
diferencias en la clasificacin de unos y otros, por lo que el resultado de este sesgos es ms
peligroso por ser impredecible.
Son sesgos de informacin diferenciales los siguientes:
! El sesgo anamnsico (de recuerdo, recall bias) propio de estudios de casos y controles. Los casos
pueden recordar mejor las exposiciones perjudiciales porque achacan a ellas su enfermedad. Otro
ejemplo: en un estudio de deterioro cognitivo, los casos recuerdan peor la exposicin. Tambin
puede ocurrir que un caso mienta sobre su exposicin porque sospecha que ese factor caus su
enfermedad y no quiere reconocerlo.
! Sesgo del observador: el entrevistador investiga con diferente intensidad la exposicin o el
desenlace en el grupo de expuestos que en el de no expuestos.
Hay sesgos de informacin que pueden ser diferenciales o no:
! Sesgo de atencin o efecto Hawthorne: los participantes alteran su comportamiento cuando se
saben observados.
! Sesgo de inaceptabilidad: se tiende a infravalorar las exposiciones que se perciben como de
riesgo (drogas) o socialmente poco aceptadas (social desirability bias).
! Sesgo de obsequiosidad: se sobreestima la exposicin socialmente aceptada o protectora
(deporte).

Sesgo de informacin no diferencial:
! Sesgo de migracio!n diagno!stica: Un ejemplo cla!sico de sesgo de informacio!n no diferencial del
desenlace es el sesgo de la migracio!n diagno!stica o feno!meno de Will Rogers que suele ocurrir en
estudios que se desarrollan durante varios aos coincidiendo con cambios de criterios
diagno!sticos o con cambios de sensibilidad de los aparatos diagno!sticos. Habitualmente lo que
suele ocurrir es que al diagnosticar mejor a un paciente, se suelen ver mejor ciertas lesiones (por
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
Su
ejemplo, ganglios afectados) y algunos pacientes suelen acabar clasifica!ndose en un estadio
superior al que estaban. Evidentemente estos pacientes tienen una forma de enfermedad ma!s
grave que la del grupo donde estaban inicialmente (estadio II) aunque por otra parte tienen una
gravedad menor que la del grupo donde ahora se sitan (estadio III). Ocurre algo aparentemente
parado!jico; la mortalidad es menor en los dos grupos objeto de la migracio!n diagno!stica: la
mortalidad del estadio II bajara! porque hay menos pacientes graves y la mortalidad del estadio III
tambie!n bajar porque ahora hay personas con una gravedad de enfermedad menor que la que le
corresponde al grupo. Podri!amos explicar este feno!meno con el smil de la altura. Si la persona
ma!s alta de un grupo de gente baja pasa a pertenecer a otro grupo de personas con mayor altura,
ambos grupos vera!n disminuir la media de sus alturas.


OTROS SESGOS
! Regresin a la media: quienes mostraron valores extremos en una determinacin inicial tendern a
presentar posteriormente valores ms cercanos a la media. Se debe a mecanismos homeostticos, a
posibles mediciones errneas iniciales o a registros bajo circunstancias excepcionales en la primera
ocasin.
! Falacia ecolgica: la asociacin entre exposicin-efecto observada en la colectividad, no
necesariamente se sostiene a nivel individual.







Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S1
7. CONFUSIN E INTERACCIN.

Uno de los conceptos ma!s importantes en epidemiologa es el de confusio!n. Todo el trabajo que
se realiza al escoger, disear e implementar el mejor diseo posible para responder a una pregunta
cientfica consiste precisamente en lograr grupos de comparacio!n que sean contrafa!cticos. En definitiva,
se intenta reducir al ma!ximo ese componente de la medida de asociacio!n que en apartados anteriores
hemos llamado error o sesgo y conseguir as que la medida de asociacio!n coincida con la medida del
efecto que queremos conocer y valorar.
Por otra parte, para interpretar de manera crtica y correcta los resultados de los estudios que se publican
en la literatura cientfica, es tambie!n imprescindible comprender el feno!meno de confusio!n.
Una variable (o factor) de confusio!n se puede definir como una variable que distorsiona la medida de la
asociacio!n entre otras dos variables. El resultado de la presencia de una variable de confusio!n puede ser
la observacio!n de un efecto donde en realidad no existe o la exageracio!n de una asociacio!n que
realmente existe (confusio!n positiva) o, por el contrario, la atenuacio!n de una asociacio!n real e incluso
una inversio!n del sentido de una asociacio!n real (confusio!n negativa).

SESGOS DE CONFUSIN
Las relaciones especficas existentes entre las variables estudiadas y otras variables que no son el
efecto ni la exposicin distorsionan la medida de asociacin.

Las condiciones para que se d un factor
de confusin son, que esa variable:
! Est asociada con el efecto independientemente de la exposicin.
! Est asociada con la exposicin independientemente del efecto.
! No sea un eslabn causal intermedio entre exposicin y efecto.

Figura 7.1. Factor de confusin.






Se ha asociado el consumo de alcohol con un mayor riesgo de muchos cnceres; pero el
consumo de tabaco y alcohol se asocian. Es posible que sea el tabaco lo que realmente aumente el
riesgo y que no se haya controlado bien la confusin por tabaco. El concepto ms importante es que
podr ser factor de confusin toda variable que comparta causas comunes con la exposicin y con el
efecto.
Una variable (por ejemplo el sexo) puede ser un factor de confusin en una base de datos (de
un estudio determinado) y no serlo en otra.

MODIFICACIN DEL EFECTO O INTERACCIN
La interaccin entre dos factores supone una interdependencia entre sus mecanismos de
accin. Cuando al estratificar los datos globales segn las distintas exposiciones, la medida de
asociacin es distinta dentro de los diferentes estratos se dice que hay interaccin o modificacin del
efecto. La interaccin es un efecto biolgico real.
Por ejemplo, el efecto de los anticonceptivos hormonales sobre el riesgo de enfermedad
cardiovascular (ECV) puede estar modificado por el tabaco.

Tabla 7.1. Interaccin tabaco-anticonceptivos orales.
GLOBAL Casos Controles
Anticonceptivos s 2304 800
Anticonceptivos no 480 1600
OR global=9,6

Anlisis estratificado
Confusin!
Tabaco
Causa
Alcohol
Efecto
Cncer
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S2
FUMAN Casos Controles ORfum
Anticonceptivos s 1920 480 8,0
Anticonceptivos no 160 320

NO FUMAN Casos Controles ORno fum
Anticonceptivos s 384 320 4,8
Anticonceptivos no 320 1280

La interaccin anticonceptivos-tabaco se podra representar en una tabla (tabla 6.9)

Tabla 7.2. Interaccin anticonceptivos-tabaco.
Ratio casos/controles para cada posible categora.
No fuman Fuman
Anticonceptivos NO 320/1280=0,25 160/320=0,5

Anticonceptivos s

384/320=1,2

1920/480=4

Odds ratios
1
para cada posible categora.
No fuman Fuman
Anticonceptivos NO 1 (ref)

2


Anticonceptivos s

4,8


16,0


1
Tomando como referencia la categora no usuarias de anticonceptivos y no fumadoras

El efecto de los anticonceptivos es distinto en fumadoras que en no fumadoras. El tabaco
modifica el efecto de los anticonceptivos. Hablaremos de interaccin si:
! La medida de asociacin (OR) de los dos estratos es distinta entre s (8 ! 4,8).
! En la tabla que combina ambos efectos, el valor de odds ratio en la cuarta casilla (OR=16 ) se
aparta significativamente de la multiplicacin de las otras dos odds ratios (2 x 4,8) (interaccin
multiplicativa sinrgica o positiva). Este apartamiento puede darse porque lo observado sea mayor,
como sucede en el ejemplo (16>9,6), o tambin porque lo que se observe sea menor que el
producto de las otras dos odds ratio (interaccin negativa o antagonismo).
En este ejemplo se est asumiendo un modelo multiplicativo de interaccin. Esto es lo que
suele asumirse en estudios epidemiolgicos que valoran un desenlace dicotmico y que usan modelos
exponenciales (regresin logstica o de Cox), pero tambin podra hablarse de interaccin aditiva y
esto es lo que implcitamente se asume cuando la variable dependiente es continua (modelos de
ANOVA, ANCOVA o regresin mltiple). Se dir que hay interaccin aditiva cuando el efecto conjunto
de dos factores sea significativamente diferente de la suma de sus efectos por separado.




Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
SS
8. PROBABILIDAD. CONCEPTOS DE PROBABILIDAD.

CONCEPTOS DE PROBABILIDAD
Podra definirse inicialmente la probabilidad de un suceso como la proporcin de veces que ese suceso
ocurrira si repitisemos la experiencia un nmero muy grande de veces. Cul es la probabilidad de
que al lanzar una moneda al aire salga cara? Decimos que es del 50% porque suponemos que si
lanzamos muchas veces la misma moneda el 50% de ellas saldr cara. Hay dos tendencias principales
al concebir la probabilidad.
Segn el concepto frecuencista de probabilidad, la probabilidad es algo similar a una proporcin o
porcentaje: cuando decimos que la probabilidad de que algo ocurra vale 0,2 viene a significar lo mismo
que decir que ocurrir en el 20 % de los casos 1 de cada 5 veces. La definicin frecuencista mantiene
que las probabilidades son los lmites a los que tiende la proporcin o frecuencia relativa con la que
sucede un acontecimiento. Por ejemplo, si se lanza una moneda un nmero muy grande de veces, la
frecuencia relativa con la que saldr cara tender a ser del 50% (probabilidad = 0,5). As, el
pensamiento frecuencista define que la probabilidad de que ocurra un suceso sera el lmite de la
frecuencia relativa cuando el nmero de observaciones tiende a infinito. Ya que las frecuencias
relativas son observables empricamente, se puede pensar que los lmites a los que tienden pueden
proponerse como propiedades de los sistemas o mecanismos que generan las secuencias de
acontecimientos. Por eso a esta concepcin corresponde el concepto de la probabilidad como algo
objetivo (probabilidad fsica). En su forma ms pura el pensamiento frecuencista niega todo significado
a la probabilidad individual de un acontecimiento singular, ya que, al no engendrar una repeticin, no es
posible estimar empricamente su frecuencia relativa. Hay preguntas para las que no existen
posibilidades de repetir la experiencia, por ejemplo Cul es la probabilidad de que un graduado
universitario saque una oposicin en la primera convocatoria tras terminar la carrera? Slo habr una
primera convocatoria tras acabar la carrera. Aunque haya posibilidad de repeticin, esas repeticiones
ya son respuestas a otra pregunta distinta. Este problema podra presentarse al aplicar la probabilidad
al paciente individual ya que "no hay enfermedades sino enfermos". La respuesta frecuencista es
imputarle a cualquier paciente lo que ha ocurrido previamente con pacientes similares, siempre
acompaada de un cierto grado de incertidumbre, pero prescindiendo del hecho de que no hay dos
seres humanos iguales.
La otra filosofa es la bayesiana, que maneja la probabilidad como algo subjetivo, es decir el grado de
certeza que se posee sobre un asunto, la "credibilidad" o la probabilidad personal. Frecuencistas y
bayesianos constituyen actualmente dos clanes o grupos filosficos que mantienen una cordial disputa
en el mundo de la estadstica.
Los frecuencistas son ms abundantes que los bayesianos. A los bayesianos se les denuncia cierto carcter
arbitrario o irracional en sus probabilidades subjetivas (que se suelen llamar "a priori"), ya que estas
probabilidades no son directamente medibles. Tambin se podra decir que la verificacin frecuencista de la
probabilidad emprica nunca ha sido hecha. Nadie ha lanzado una moneda al aire infinitas veces.

FACTOR BAYES
Si en un estudio que incluye a 1000 pacientes, slo 200 de ellos padecen diabetes, la odds de
desarrollar diabetes se calculara dividiendo 200 entre 800 (odds =1/4).
Tambin podra expresarse la odds como 1:4. Se interpreta que apareci un diabtico por
cada 4 no-diabticos.
4
1
1000
200
diabticos no
diabticos
ODDS = = =

Como ya se vio en el captulo 1, se demuestra que la odds a posteriori (una vez que se sabe
que se ha cumplido una condicin) es igual a la odds marginal (no condicionada o previa a saber la
condicin), multiplicada por un factor. En la tabla 8.1, la odds de ser diabtico previamente a saber la
condicin, es decir no condicional a la glucosuria, se basa en la probabilidad total o marginal y se
calculara dividiendo 200 entre 800 (odds previa=1/4 o bien 1:4) y se interpreta que hay un diabtico
por cada 4 no-diabticos

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S4
Tabla 8.1. Presencia de glucosuria en pacientes diabticos y sin diabetes.
Diabetes No diabetes Total
Glucosuria 60 8 68
No
glucosuria
140 792 932
Total 200 800 1000

4
1
800
200
1000 / 800
1000 / 200
diabetes) (no P
(diabetes) P
ODDSprevia = = = =

Puede hablarse tambin de una odds posterior que sera la odds condicionada a cumplir un
requisito, en el ejemplo la odds posterior sera la odds condicionada a tener glucosuria. Esta odds
posterior valdra:
7,5
8
60
8/68
60/68
) glucosuria | diabetes (no P
) glucosuria | (diabetes P
posterior ODDS = = = =
El teorema de Bayes demuestra que la odds posterior (condicional) es igual a la odds previa
multiplicada por un factor al que llamaremos "factor Bayes" (al que en el captulo 1 se le llam RV+):

Bayes Factor ODDSprevia ior ODDSposter ! =

El factor Bayes equivale a la razn de probabilidades de la condicin, es decir al cociente de
probabilidades de presentar la condicin (glucosuria) entre los que tienen el evento (diabticos) y los
que no lo tienen (no-diabticos). Ya habamos dicho que tener glucosuria era 30 veces ms frecuente
entre los diabticos que entre los no-diabticos. A ese cociente se le llama Factor Bayes:
30
01 , 0
3 , 0
diabetes) no | a (glucosuri P
diabetes) | a (glucosuri P
Bayes Factor = = =
El factor Bayes se interpreta como que es 30 veces ms frecuente encontrar glucosuria en los
diabticos que en los no diabticos. Vemos que se cumple la regla de Bayes:
5 , 7
4
1
30 ODDSprevia Bayes Factor ior ODDSposter = ! = ! =
Como vimos ms arriba, la odds posterior era 7,5 y equivala a dividir 60 entre 8. Esta odds
posterior se interpreta como que entre los que tienen glucosuria hay 7,5 diabticos por cada no
diabtico (es 7,5 veces ms probable ser diabtico si se cumple la condicin de la glucosuria).
Si se transforma la odds en probabilidad, usando la expresin vista
odds 1
odds
+
= p

probabilidad = 7,5/(1+7,5) = 0,882.
Esta es la probabilidad posterior, es decir la probabilidad de diabetes condicionada a
glucosuria, que ya habamos calculado.
Si ahora nos cambiasen el problema y nos dijesen que, por ejemplo, en una poblacin con un
10% de diabticos, el 40% de los diabticos presentan glucemias por encima de 140 mg/dl y slo el 5%
de los no-diabticos las presentan, simplemente aplicando el teorema de Bayes podramos responder
a la pregunta de cul es la probabilidad de que una persona con glucemia superior a 140 sea diabtico:
9
1
9 , 0
1 , 0
diabetes) (no P
(diabetes) P
ODDSprevia = = =
8
05 , 0
4 , 0
diabetes) no | 140 (glucemia P
diabetes) | 140 (glucemia P
Bayes Factor = =
>
>
=
889 , 0
9
8
9
1
8 Bayes Factor ODDSprevia ior ODDSposter = = ! = ! =
La odds posterior valdra 8:9. Como hemos dicho, transformar una odds en una probabilidad
consiste simplemente en aadir el numerador al denominador.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
SS
Por lo tanto, la probabilidad de ser diabtico si se presenta una glucemia >140 mg/dl (ste es
el valor predictivo positivo) sera:
= > 140) glu | P(diab 0,889/(1+0,889) = 0,471.
El 47,1% de los que presentan glucemias superiores a 140 mg/dl sern diabticos en esa
poblacin. Esto es lo que ms le suele interesar al mdico, saber cul es la probabilidad de
enfermedad condicional a que un test diagnstico sea positivo. Esto se llama valor predictivo positivo.
Corresponde a la probabilidad a posteriori. Su odds es la odds posterior.

PLANTEAMIENTO BAYESIANO
Imaginemos que una enfermedad (E) se da en los pacientes que acuden a urgencias con una
relativa baja frecuencia, en concreto, se sabe que hay 1 persona con esa enfermedad por cada 200
que no la padecen. Esta ser nuestra odds previa a cualquier otra informacin. Nuestra presuncin de
que la padezca algn paciente que llega a urgencias, antes de saber nada ms de l, ser que su odds
de padecer esta enfermedad es 1 : 200. Pero le aplicamos dos pruebas y ambas resultan positivas.
Cada prueba puede ser positiva o negativa. Las caractersticas de las pruebas 1 y 2 son:
Prueba 1 Prueba 2
Sensibilidad 90%: p(prueba1+|E) = 0,9 70%: p(prueba2+|E) = 0,7
Especificidad 80%: p(prueba1-|nE)= 0,8 99%: p(prueba2-|nE)= 0,99
El planteamiento bayesiano ser el que recoge la figura 8.1
Figura 8.1. Evolucin sucesiva de la odds de enfermedad al resultar 2 pruebas diagnsticas
positivas.




















En la figura 8.1 se comprueba como la odds se va multiplicando por el Factor Bayes de cada
prueba a medida que las pruebas van dando resultados positivos. Este proceso podra continuar con
sucesivos pasos donde siempre se parte de la odds obtenida en el paso previo. Pero, en el ejemplo, ya
con dos pruebas positivas, la decisin debera ser que el paciente tiene la enfermedad, ya que es ms
probable que la tenga que su contrario. Al principio se nos han dado las probabilidades de un resultado
u otro de la prueba condicionada a la enfermedad. Al final estimamos una odds de enfermedad
condicionada a los resultados observados en las pruebas. Este es el fundamento de la estadstica
bayesiana. La estadstica frecuencista convencional calcula las probabilidades de que ocurra un
resultado condicionadas a que una hiptesis sea cierta (pero no se valora cul es la probabilidad de
que esa hiptesis sea cierta). La estadstica bayesiana en cambio calcula la probabilidad de que la
hiptesis sea cierta condicionada a los resultados obtenidos. Al factor Bayes, en el contexto de las
pruebas diagnsticas se le llama tambin razn de verosimilitud (likelihood ratio).

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S6
DISTRIBUCIN NORMAL
Es una distribucin de probabilidad terica para variables continuas. Tiene forma de campana,
es simtrica, mesocrtica y en ella la media, la mediana y la moda coinciden. Esta distribucin de
frecuencias, se usa mucho en bioestadstica y es conocida como campana de Gauss.
En una campana de Gauss el eje horizontal o de abscisas corresponde a cada uno de los
valores posibles de la variable que se estudia, mientras que el eje vertical (ordenadas) corresponde a
la probabilidad de que ocurran los valores. Pero la probabilidad de un valor individual aislado
tericamente es 0, y slo el rea que queda bajo la curva correspondiente a un cierto intervalo de
valores es el que se interpreta como la probabilidad de que ocurra alguno de los valores contenidos en
ese intervalo. La probabilidad de un valor concreto es 0 porque el modelo matemtico de la distribucin
normal es el de una variable continua y en esta situacin hablar de un valor concreto supondra una
exactitud absoluta y radical.
Por ejemplo, si sabemos que el nivel de colesterol total de una poblacin sigue una
distribucin normal y se nos pregunta cul es la probabilidad de que alguien tenga un colesterol=200
mg/dl, tendremos que decir que dicha probabilidad es 0, porque no nos estamos refiriendo a que tenga
un nivel de colesterol entre 199,5 y 200,5 mg/dl, ni entre 199,9 y 200,1 mg/dl, sino exactamente
200,000000000000, y habra que ampliar los dgitos decimales hasta el infinito. Nadie tiene
exactamente esa cifra de colesterol.
La solucin con la distribucin normal es valorar siempre la probabilidad de un rango de
valores entre dos lmites. Esto s puede hacerse, por cercanos que sean los lmites. Es preciso advertir
por tanto que las variables continuas (colesterol, tensin arterial, edad) tienen (tericamente) un
nmero infinito de posibles valores. En estos casos no tiene sentido hablar de la probabilidad de que
un sujeto presente un determinado valor puntual de colesterol, puesto que, como tal, no puede ser
calculada. En estos casos hablamos de densidad de probabilidad, un concepto que se refiere a la
probabilidad de que un sujeto tenga un valor incluido en un determinado intervalo entre dos valores.
As, cuando trabajamos con variables continuas, se tiende a realizar el lmite de cada una de las barras
de los histogramas o diagramas de barras de los que hemos comenzado hablando, logrando con ello
una distribucin mucho ms suave, pero en la cual, las alturas ya no son probabilidades, sino
densidades de probabilidad, y as ya no tiene sentido hablar de que haya una probabilidad de que se
d cada posible valor concreto de la variable, sino que tan slo podemos calcular probabilidades para
intervalos entre dos valores.

Figura 8.2. Campana de Gauss, distribucin normal.

En la figura 8.2. la suma de todo el rea bajo la curva (desde !" hasta +") tiene una
probabilidad del 100%. La altura de la ordenada no se puede interpretar como la probabilidad de que
ocurra un valor particular (esta probabilidad sera cero en una variable continua) sino que corresponde
al concepto de densidad de probabilidad.
Algunas de las variables estudiadas en medicina y en ciencias de la salud suelen seguir una
distribucin normal o de Gauss, siendo ms frecuentes los valores intermedios y ms raros los de los
extremos. Por qu este tipo de distribucin, en la que los valores centrales son muy frecuentes y en
cambio los valores alejados del centro (colas) son raros est muy presente?. Para resolver esta
cuestin podramos preguntarnos por ejemplo: de qu depende la altura de una persona? Sin nimo
de ser exhaustivos responderamos:
1-De la altura de su padre.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S7
2-De la altura de su madre.
3-De su nutricin (cantidad de energa consumida) durante la infancia y adolescencia .
4-De la velocidad de maduracin de su esqueleto (en esto influyen los niveles hormonales, la
edad en la que aparece la pubertad, etc).
5-Del aporte que reciba de vitamina D (sta a su vez se ve influenciada por la exposicin
mayor o menor a la luz solar) .
6-Del aporte de calcio.
7-Del ejercicio fsico.
8-De sus niveles de hormona de crecimiento.
9-etc... (aqu se incluyen muchos otros factores, algunos de ellos desconocidos actualmente).
Podemos pensar que estos 9 factores son como 9 dados que puntan alto o bajo. Sera muy
raro encontrar un caso en que todos simultneamente puntuaran tan alto que resultara un individuo con
2,40 m de altura. Lo ms frecuente es que unos "dados" punten alto, otros bajo y muchos en
posiciones intermedias. Esto pasa con la mayor parte de las caractersticas de los seres vivos: peso,
talla, frecuencia cardiaca, nmero de respiraciones por minuto, colesterol en sangre, presin arterial,
etc. todas estas variables dependen de muchos factores, todos ellos sometidos a su vez a una amplia
variabilidad biolgica y por ello suelen seguir una distribucin que se aproxima a la normal.
La distribucin normal es la indicada para datos que siguen una escala -al menos en teora-
continua (peso, talla, edad, colesterol, tensin arterial, cido rico, bilirrubina, etc.) y adems posee la
ventaja de que otras distribuciones, bajo ciertas condiciones, acaban aproximndose a ella, como
sucede con la distribucin binomial (para sucesos dicotmicos) cuando " se aproxima a 0,5 y n es
grande. Tambin se aproxima a la normal la suma de varias distribuciones uniformes. Esto es lo que
sucede con la suma de varios dados.
La distribucin normal se conoce tambin como curva o Campana de Gauss, en honor del
matemtico que la describi, y es muy til en estadstica por las razones mencionadas. La distribucin
normal terica nunca se da exactamente en la realidad, slo hay aproximaciones a ella, pero se puede
expresar como ecuacin matemtica. No es preciso conocer esta expresin matemtica para resolver
la mayor parte de los problemas relativos a la distribucin normal. Al ser expresada como un modelo o
ecuacin, la distribucin se hace continua y tericamente hay infinitos puntos, infinitos valores posibles.
En teora, su eje horizontal (abscisas) se extiende desde menos infinito hasta ms infinito.
En general, una distribucin normal se caracteriza por:
1) Tener forma de campana.
2) Ser simtrica.
3) No ser excesivamente plana ni excesivamente picuda (mesocrtica).
4) Coincidir en ella la media, la mediana y la moda.
5) Tener aproximadamente el 95% de sus valores dentro del intervalo 2 # (media 2
desviaciones estndar). Exactamente, el 95% de los individuos se encuentra dentro del
intervalo comprendido por 1,96 #. Incluso podemos afirmar que casi el 100% de los
valores estn dentro del intervalo 3 #.
6) Ser la distribucin muestral que siguen los ndices o estimadores estadsticos calculados en
una muestra.
Lo ms importante de todo es que cualquier distribucin aunque no siga una normal, tiende a
ella en su distribucin muestral. Por ejemplo, si tomamos 1000 muestras distintas, todas del mismo
tamao (por ejemplo, de 30 individuos) de la distribucin uniforme (lanzamiento de un slo dado) y a
todas ellas les calculamos su media y con estas 1000 medias hacemos una distribucin de frecuencias,
nos vuelve a aparecer la campana de Gauss. Aunque la poblacin de la que proceden las muestras no
siga una distribucin normal, los estimadores calculados en las sucesivas muestras s la siguen,
siempre que las muestras tengan suficiente tamao (n>30).

CLCULOS BSICOS CON UNA DISTRIBUCIN NORMAL
Desde el punto de vista prctico tambin es muy importante adquirir familiaridad con un procedimiento
que sirve para responder a muchas preguntas sobre una variable que sigue una distribucin normal.
Estas preguntas se puedan responder con una tabla y unos sencillos clculos (sumar, restar,
multiplicar y dividir).
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S8
El procedimiento consiste en tipificar o estandarizar la normal. Se trata simplemente de
transformar una determinada distribucin normal en otra que tenga una media igual a 0 y una
desviacin estndar igual a 1. Esto consigue que cualquier valor represente una distancia a la media
expresada como el nmero de desviaciones estndar en que ese valor se aleja de la media. Habr
valores positivos, los que estn por encima de la media y valores negativos, los que estn por debajo
de la media.
Para eso se emplea la siguiente ecuacin:





Donde x es la antigua variable y z es la nueva variable que ya sigue una distribucin normal de
media=0 y desviacin estndar=1. Para devolver la transformacin a su estado original tendremos:

X = +!z

Por ejemplo, si la media de tensin arterial sistlica de una poblacin es 120 mmHg y la
desviacin estndar es 25 mmHg, y se asume que sigue una distribucin normal, podemos responder
a diversas preguntas con slo unos clculos muy sencillos. As, si queremos saber qu proporcin de
personas tiene ms de 170 mmHg, habr que calcular el valor z que corresponde a 170:





Qu ventaja nos ofrece saber que 170 mmHg corresponde a un valor de z = +2?. En primer lugar
sabemos que est a 2 desviaciones estndar por encima de la media. En segundo lugar, existen tablas
que nos dicen cul es la probabilidad de que se d un valor superior o inferior a cada valor de z. Esas
son las tablas de la distribucin normal que vienen en todos los libros de estadstica. Estas tablas estn
encabezadas por una frase que dice Dentro de la tabla se proporciona el valor de p para +z o para -z.
Como z es positiva, nos dar el valor de la zona por encima de z. Para buscar una z= +2,00 hay que
localizar el valor correspondiente a 2,0 (en la primera columna) y ,00 (en la primera fila). La
probabilidad p correspondiente al rea de la cola que est a la derecha de un valor de z=+2 es
0,0228. Es decir, el 2,3% de los individuos tendrn valores superiores a 170 mmHg.
Tambin se pueden obtener la probabilidad correspondiente a cada z en excel con la expresin:
= DISTR.NORM.ESTAND (-z)
En nuestro ejemplo
= DISTR.NORM.ESTAND (-2)
y devolver
p = 0.028
En Excel siempre se debe meter con signo negativo, porque siempre da la cola de la izquierda.
En el software Stata se debe introducir:
display normal(-2) y devolver p = 0.028

Para saber cuntas personas tienen tensiones arteriales sistlicas entre 160 y 180 mmHg
tendremos que hacer lo mismo con 180 (le calculamos su z y es +2,40; a continuacin buscamos en la
tabla y nos dice que el 0,8% (0,0082) de las personas tendrn valores por encima de z=+2,40. A
continuacin hay que hacer lo mismo con 160 y su z valdr +1,60. Recordemos que esto simplemente
significa que 160 est a 1,6 desviaciones estndar por encima de la media. La probabilidad que nos da
la tabla de que alguien est a ms de 1,60 desviaciones estndar de la media es del 5,5% (0,0548). Lo
nico que queda es restar 0,8% de 5,5%.
Si hay un 0,8% de resultados por encima de 180
Y hay un 5,5% por encima de 160
Cuntos habr entre 160 y 180?
!
"
=
x
z
2
25
120 170
+ =
!
=
!
=
"
x
z
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S9
5,5% - 0,8% = 4,7%
La solucin es que el 4,7% de las personas de esa poblacin tienen tensiones sistlicas
comprendidas entre esos valores (160-180 mm Hg).
Tambin podemos preguntarnos: Qu valor deja al 90% de las personas por debajo de l? Esto
supone exactamente preguntarnos por cul es el percentil 90. Para hacerlo hay que recorrer un camino
similar, pero al revs, empezando por mirar las tablas:
1 Buscamos en las tablas qu valor de z deja 0,1 por encima.
Este valor es z=1,28.
2 Calculamos x a partir de z. Este valor es 152 mm Hg.

x = + z# = 120 + (1,28 x 25) = 152

Imaginemos otro ejemplo. Cul es la proporcin de individuos de una poblacin (sigue una
distribucin normal) que se encuentran entre los valores 20 y 35, si la media vale 30 y la desviacin
estndar 10? Los valores z respectivos sern 1 y +0,5 para 20 y 35. El rea bajo la curva que nos
interesa calcular es la delimitada por los valores -1 y +0.5 en la figura 8.2.
Para resolver el problema bastar con restar de 1 la suma de las probabilidades que quedan a la
derecha y a la izquierda del rea central, que es la que nos interesa.
Si hay un 15,9% de individuos por debajo de z= -1
Y hay un 30,9% por encima de z=+0,5
Cuntos habr entre z=-1y z=+0,5?
100% - (15,9% + 30,9%) = 53,2%

!"#$%&'()%*+%*,(-"#%.*/0%*/0%+(&*%&*+1,%#.".*1&'%#,(-".*%&*0&(*+1.'#120$13&*
&"#4(-
5
6*
Desviaciones
estndar (z)
% valores en cada cola (p a 1 cola) % central (media zs)
1 15,85 68,3
1,28 5 90
1,96 2,5 95
2,58 0,5 99
3 0,15 99,7
En Excel se pueue intiouucii la expiesion =BISTR.N0RN.ESTANB(z) y uai el iea que queua en la cola +%* -(* 17/01%#+(
paia caua valoi ue z que se esciiba, poi ejemplo: =BISTR.N0RN.ESTANB(-2) uevuelve p=u,u2S (1 cola).

La uistiibucion noimal es la uistiibucion que siguen muchos inuices o estimauoies
estauisticos calculauos en una "#$%&'(. Esta piopieuau es la ms impoitante. Significa que
si se toman muestias ue una poblacion que sigue cualquiei uistiibucion aunque no siga una
noimal, los estimauoies que se calculen en las sucesivas muestias tenuein a la
uistiibucion noimal. Aunque la poblacion ue la que pioceuan las muestias no siga una
uistiibucion noimal, los estimauoies calculauos en las sucesivas muestias si la siguen,
siempie que las muestias tengan suficiente tamao (n>Su).







5
Los datos excluidos del intervalo se reparten a ambos lados de la distribucin normal.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
4u
9. CONCEPTOS BSICOS DE BIOESTADISTICA
(adaptado del Compendio de salud pblica)

Segn una figuia seeia paia la saluu pblica, Floience Nightingale
6
, hay gianues
iazones paia apienuei estauistica:
)*!#+,$'%&(+,!-*,.%!&/*#0/&%!1$!"#%&!%&#,2!%&(&3%&34%!!
5*'!&/$%$!('$!&/$!"$(%#'$%!*5!63%!7#'7*%$ 89:6

;<=>?@<=AB>*?;<BCA!=AD>!

)89:;!<=!>?@8?AB=;!



Para trabajar con variables cualitativas se usan proporciones (p), mientras que para trabajar con
variables cuantitativas se usan habitualmente sus medias ( ).

C=<8<?;!<=!)=D<=DE8?!E=D)@?B!
Estiman cul es el valoi ms tipico o iepiesentativo ue una muestia. La "$,3(!
('3&"F&34(!$s el piomeuio ue touos los valoies y es la meuiua ue tenuencia cential ms
usaua. Poi ejemplo, la meuia aiitmtica ue los valoies 1, 2 y S es 2:

El inconveniente ue la meuia aiitmtica es que, en muestias pequeas, se ueja
influii mucho poi valoies extiemos, poi eso se uice que es poco iobusta. Si el teicei

6
Vivi en Inglaterra de 1820 a 1910. Es considerada la pionera de la enfermera moderna. Fue rebelde frente a los
prejuicios de su poca. Destac inicialmente en la guerra de Crimea. Tanto all como en otros conflictos blicos sus
brillantes acciones -basadas en evidencias- para organizar la atencin sanitaria lograron descender dramticamente
la mortalidad. Fue la primera mujer miembro de la Royal Statistical Society britnica. Su frase puede traducirse
como: Debemos estudiar estadstica para comprender la mente de Dios, porque en ella estn las medidas de Sus
designios.
x
( )
2
3
3 2 1
=
+ +
= =
!
n
x
x
i
Cualitativas
Escala
nominal
A, B, C

Caracterstica o cualidad que la persona posee o no posee.
Si slo hay dos categoras: variables dicotmicas o binarias.
Los posibles valores son excluyentes.
Permiten:
1)
clasificar o

diferenciar (igualdad/desigualdad)
Escala
oiuinal
I, II, III
Sus valoies son jeiaiquizables y oiuenables.
Auems ue
1)
clasificai o uifeienciai, peimiten:

2)
jeiaiquizai, o asignai '(+0*%.
Cuantitativas
Discreta
2, 6, 33
Solo pueuen tomai valoies numiicos enteios.
Sus valoies son finitos y no aumiten uecimales.
Auems ue 1) clasificai o uifeienciai y 2)jeiaiquizai, peimiten:
S) contai y
4) iealizai opeiaciones algebiaicas.
Continua
9.S, 28.96
Escala ue iazon. Son numiicas y aumiten cualquiei cantiuau
inteimeuia entie uos posibles valoies (uecimales).
Peimiten:
1)
clasificai o uifeienciai

2)
jeiaiquizai

S)
meuii
4)
opeiaciones algebiaicas.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
41
valoi en vez ue sei S fuese 24, la meuia aiitmtica subiiia a 9. En cambio, la "$,3(+(!+*!
%$!,$G(!3+5H#3'!7*'!$I&'$"*%J!ya que es aquel valoi que ueja la mitau ue las obseivaciones
poi uebajo y la mitau poi encima (si los uatos son paies, seiia la meuia ue los uos
valoies centiales). Seiia 2 en ambos casos. Siive tambin paia vaiiables oiuinales. Su
inconveniente es que no usa touos los uatos. La! "$,3(! 7*+,$'(,(! *&*'0(! a unas
obseivaciones ms impoitancia o peso (wi) que a otias. Poi ejemplo, si la teiceia
obseivacion (S) tiene un peso uel 8u% y las otias uos (1 y 2) solo uel 1u%:
C$,3(!7*+,$'(,(K! !
La!"*,(!es aquel valoi que se iepite con mayoi fiecuencia.

C=<8<?;!<=!9:;8E8LD!
Inuican el lugai o el oiuen que ocupa un uato uentio ue la uistiibucion a la que
peitenece. Los c#(+&3H$%!Inuican qu puesto tiene un ueteiminauo valoi ue una vaiiable
en el conjunto oiuenauo ue los uatos 8E:. Los peicentiles uiviuen la muestia en paites
poicentuales acumulativamente. Poi ejemplo el peicentil Su es el valoi que ueja el Su%
ue las obseivaciones ue la muestia poi uebajo. C$,3(+( =7$'4$+&3H!MN.

C=<8<?;!<=!<8;9=@;8LD!
Estiman la vaiiabiliuau ue los uatos. La v('3(+O(: se paiece al piomeuio ue las
uesviaciones cuauiticas ue caua valoi iespecto a la meuia, peio su uenominauoi es n-1
en vez ue sei n. Este uenominauoi (n-1) coiiesponue a los 0'(,*%! ,$! H3P$'&(, ue la
vaiianza. Al numeiauoi ue la vaiianza se le conoce como %#"(! ,$! 4#(,'(,*%. Poi
ejemplo, la vaiianza ue S valoies, 1, 2 y S, sei:
>('3(+O(!"#$%&'(H!Q%
R
SK !
El inconveniente ue la vaiianza es que tiene uniuaues al cuauiauo ue los uatos
oiiginales. La ,$%T3(43U+! $%&V+,('! *! ,$%T3(43U+! &W734(! elimina las uniuaues al cuauiauo,
pues consiste en extiaei la iaiz cuauiaua ue la vaiianza. La uesviacion tipica (s) tiene,
poi tanto, las mismas uniuaues que la meuia y es el inuice ue uispeision ms utilizauo:!
%!K !
El! 4*$5343$+&$! ,$! T('3(43U+! compaia la uispeision ue vaiiables con uistintas
uniuaues (es auimensional). Es el cociente entie uesviacion tipica y meuia aiitmtica:
!
E*$5343$+&$!,$!T('3(43U+K !
Se suele expiesai en poicentaje (en el ejemplo, el coeficiente ue vaiiacion inuicaiia
que la uesviacion tipica es el Su% ue la meuia). Pouiia sei >1uu%.
0n concepto tiascenuental en estauistica es el ue $''*'! $%&V+,('! Q==S! ue un
estimauoi (a no confunuii con la uesviacion estnuai). El EE miue el giauo ue
uispeision ue los estimauoies muestiales ue touas las posibles muestias ue igual
tamao que se puuiesen obtenei aleatoiiamente ue una poblacion. A mouo ue ejemplo,
se piesentan los EE ue una meuia y ue una piopoicion:!

9('(!#+(!"$,3(X! !
9('(!#+(!7'*7*'43U+X! !
Caua estimauoi tiene su piopio eiioi estnuai con su coiiesponuiente foimula.
@(+0*!3+&$'4#('&WH34*X!Es la uifeiencia entie el peicentil 7S y el peicentil 2S.
!
! !
( )
( )
2,7
0,8 0,1 0,1
3 0,8 2 0,1 1 0,1
w
w

i
i i
=
+ +
! + ! + !
= =
"
"
x
( ) ( ) ( ) ( )
1
1 3
2 3 2 2 2 1
1 n
x
2 2 2
2
=
!
! + ! + !
=
!
!
=
"
x
i
( )
1 1
1 n
x
2
= =
!
!
=
"
x
i
% 50 100
2
1
100
media
tipica Desviacion
= ! = ! =
x
s
n
s
EE
x
=
n
p p
EE
p
) 1 ( !
=
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
42
@=9@=;=D)?E8:D=;!-@YZ8E?;!
*
=(2-(*5696*C%F#%.%&'($1"&%.*G#HI1$(.*.%GJ&*%-*'1F"*+%*,(#1(2-%.6*
D(#1(2-%* C%F#%.%&'($13&*G#HI1$(* B(#($'%#K.'1$(.*
Cualitativas
nominales
uifico ue sectoies


La fiecuencia es piopoicional al
iea.
Cualitativas
oiuinales
Cuantitativas
uiscietas
Biagiama ue baiias

La fiecuencia es piopoicional a la
altuia ue las baiias.
Cuantitativas
continuas
Bistogiama
__
Los iectngulos se iepiesentan
juntos. El punto meuio uel
inteivalo pueue uai titulo a caua
iectngulo. La fiecuencia es
piopoicional al iea ue las
baiias.
Poligono ue fiecuencias

Se obtiene unienuo con una linea
las fiecuencias ue los puntos
meuios ue los inteivalos ue un
histogiama.
Poligono ue fiecuencias
acumulauas

Se suman las fiecuencias ue los
inteivalos pieceuentes.
Repiesenta cuntos sujetos ue la
muestia piesentan poi lo menos
un ueteiminauo valoi ue la
vaiiable.
uificos ue caja

Se iepiesentan la meuiana, el
iango inteicuaitilico, y los
valoies iaios (peiifiicos o
*#&H3$'%
[
). En este ejemplo no
hay outlieis.

uifico ue uispeision

Repiesenta la ielacion entie uos
vaiiables numiicas continuas.


7
Un valor perifrico es aqul que est muy alejado por arriba del percentil 75 o por abajo del percentil 25.
3
2
1
Grupo
D C B A
F
recu
en
cia
80
60
40
20
0
F
re
c
u
e
n
c
ia
60
50
40
30
20
10
0
57
38
33
49
4
25
9
11,0 10,0 9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0
0
5
10
15
20
25
A B C D E F
0
10
20
30
40
50
60
A B C D E F
10
8
6
4
x
10 8 6 4 2 0
y
10
8
6
4
2
0
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
4S
AL=;CD>MN<*?;*BNLOA>LP>*Q*BNL=C><=;<*?;*RA!S=;<A<*

=@@:@!;8;)=CY)8E:!\!=@@:@!?B=?):@8:!
Los eiioies sistemticos o sesgos estn piouuciuos poi un uefecto uel instiumento
ue meuiua o poi una tenuencia eiionea ue obseivauoi y, poi tanto, tienuen a
iegistiaise en el mismo sentiuo. Los eiioies aleatoiios o acciuentales son aquellos
uebiuos a pequeas causas imponueiables e imposibles ue contiolai 8T:.

=(2-(*56T6*?1I%#%&$1(.*%&'#%*%##"#%.*(-%('"#1".*U*%##"#%.*.1.'%4H'1$".6*
ERR0R ALEAT0RI0 ERR0R SISTENATIC0
- Impredecible
- Simtrico
- Inevitable, aunque estimable
- No afecta a la validez interna ni externa
- Equivale a falta de precisin
- Estimacin y control " Estadstica
- Predecible
- Asimtrico
- Corregible
- Afecta a la validez interna y/o externa
- Equivale a falta de validez (sesgo)
- Prevencin y control " Epidemiologa
Fuente: 8E:.
!
8D)=@>?B:;!<=!E:DZ8?D]?!
E*+4$7&*! ,$! 3+&$'T(H*! ,$! 4*+53(+O(X! Casi siempie iesulta impiacticable iecogei la
infoimacion ue las vaiiables ue inteis ue toua la poblacion. Poi ello, se suele tiabajai
con muestias extiaiuas ue una poblacion en las que se ueteiminan los $%&3"(,*'$%
muestiales (meuia, piopoicion, etc.). A paitii ue ellas, se necesita inuagai un iango ue
valoies uonue sea cieible que se encuentie el veiuaueio paimetio poblacional
(veiuaueia meuia ue la poblacion total, veiuaueia piopoicion, etc.) que no es factible
ueteiminai (pues paia haceilo se hubiesen iequeiiuo los uatos ue &*,( la poblacion). Al
iango u hoiquilla ue valoies cieibles paia ese paimetio poblacional que ahoia es
inaccesible se le uenomina 3+&$'T(H*! ,$! 4*+53(+O( 8TV5:. Se calcula el inteivalo usanuo
solo los uatos ue la muestia. Peio en ese inteivalo 4'$$"*%! o confiamos que estai
incluiuo el veiuaueio valoi poblacional (paimetio). Lo impoitante es sabei que si se
iepitiese el muestieo 1uu veces y a paitii ue las 1uu muestias se calculasen 1uu
inteivalos ue confianza al 9S%, habiia 9S inteivalos que iealmente contenuiian al
veiuaueio valoi uel paimetio poblacional y S que no lo contenuiian. !
EVH4#H*!,$!3+&$'T(H*%!,$!4*+53(+O(X!Los inteivalos ue confianza se calculan usanuo el
eiioi estnuai (EE), que es un inuicauoi ue la vaiiabiliuau ue los estimauoies
calculauos en muchas posibles muestias ue igual tamao que se tomen ue una
poblacion. En uefinitiva, el EE ue un estimauoi miue el giauo ue inceitiuumbie iespecto
a la capaciuau ue ese estimauoi paia aveiiguai el paimetio poblacional 8W:.
El clculo uel inteivalo ue confianza piesupone que los estimauoies muestiales ue
un paimetio siguen una uistiibucion noimal (teoiema cential uel limite).
La foimula paia el clculo uel inteivalo ue confianza vaiiai en funcion uel
paimetio que se uesee estimai. Sin embaigo, en geneial, pouemos afiimai que:
9('V"$&'*!7*PH(43*+(H! !$%&3"(,*'!^!OI==!
Aqui, z es el valoi coiiesponuiente a la uistiibucion noimal.

E:D)@?;)=!<=!689L)=;8;!
0n contiaste ue hipotesis implica una compaiacion entie un $5$4&* y la vaiiabiliuau
aleatoiia espeiaua ($''*'). Si la magnituu uel efecto obseivauo en la muestia es muy
supeiioi al eiioi, se uii que la muestia apoya la existencia ue tal efecto en la poblacion.
Si el efecto obseivauo en la muestia es similai o infeiioi en magnituu al eiioi, se
concluii que la muestia no apoya la existencia ue uicho efecto. Paia tomai una u otia
uecision, se establecen uos hipotesis (a nivel ue la poblacion):
!
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
44
637U&$%3%!+#H(!Q6NS: mantiene que el efecto ue inteis no existe (es nulo, es uecii,
vale u) en la poblacion ue la que pioceue la muestia. Si Bu fuese cieita, toua la
vaiiabiliuau obseivaua se pouiia explicai meiamente poi el azai.
637U&$%3%! (H&$'+(&3T(! Q6_S: mantiene que existe algn efecto uistinto ue u en la
poblacion ue la que pioceue la muestia. La vaiiabiliuau obseivaua no se
explicaiia totalmente poi el azai.
Las hipotesis (nula y alteinativa) se plantean siempie a nivel ue la poblacion; sin embaigo,
los uatos usauos paia apoyailas o iechazailas pioceuein ue la muestia.
Se calcula uespus un T(H*'! 7! ,$! %30+3534(43U+! $%&(,W%&34(, que estima la piobabiliuau ue
encontiai un efecto como el encontiauo *!#+*!&*,(TW(!"(2*' en la muestia si el efecto fuese u en
la poblacion (es uecii, si Bu fuese cieita). Esa piobabiliuau muchas veces coiiesponuei al iea
ue la cola ue la uistiibucion noimal paia un valoi z calculauo. El clculo ue tal valoi z se hai
muchas veces uiviuienuo el efecto entie el eiioi (eiioi estnuai). Cuanto menoi sea esa cola,
menos compatible sei el iesultauo encontiauo en la muestia con la hipotesis nula en la
poblacion.
8+&$'7'$&(43U+! ,$H! 4*+&'(%&$! ,$! /37U&$%3%X! El valoi 7 es una piobabiliuau
conuicionaua a que la hipotesis nula sea cieita. Inuica la piobabiliuau ue obseivai en la
muestia uifeiencias mayoies o iguales a las iealmente obseivauas si la hipotesis nula
fueia cieita.
>(H*'!7K *

?%$1.1"&%.*/0%*.%*'"4(&*%&*0&*$"&'#(.'%*+%*X1F3'%.1.*%&*I0&$13&*+%-*,(-"#*"*+%*
.1G&1I1$($13&*%.'(+K.'1$(
Y
6*
FZ[\[5* F][\9[*
Se rechaza la hiptesis nula No se puede rechazar la Hiptesis nula
No parece que el azar lo explique todo No se puede descartar que el azar lo explique todo
El efecto es mayor que el error El efecto es similar al error
Hay diferencias estadsticamente
significativas
No hay diferencias estadsticamente significativas
Existen evidencias a favor de la
hiptesis alternativa
No existen evidencias a favor de la hiptesis
alternativa.
Fuente: auaptauo ue 8E:. Los limites u,uS y u,1u son en cieito mouo aibitiaiios y no se les uebe uai una consiueiacion
uogmtica o absoluta. Entie u,uS y u,1u se pueue aumitii que, ue algn mouo se est en "tieiia ue nauie" y pouiia ueciise
que los iesultauos se apioximan o estn ceicanos a la significacion.

;)%4F-"*+%*$"&'#(.'%*+%*X1F3'%.1.6*
En una muestra de 100 varones, su permetro abdominal medio es 94 cm (s=9),
en otra muestra, esta vez de 136 varones, la media es 97 (s=9) .
Son significativamente distintas las medias de permetro abdominal en ambas muestras?

z = efecto/error = (94-97) / (9x((1/100)+(1/136))^0,5)= -3 / 1,186 = -2,53

El efecto (diferencia de medias: 94-97= -3) tiene una magnitud 2,53 veces superior al error.
El error corresponde al error estndar de la diferencia de medias para varianzas homogneas:

*
*
El resultado z=-2,53 corresponde a un valor p (a 1 cola) de 0,0057 y p=0,0114 (2 colas).
Conclusin: Se decide rechazar H0 (que mantiene que las muestras proceden de dos poblaciones que
no difieren en sus permetros abdominales) y se concluye que los permetros medios
son significativamente distintos en las dos muestras comparadas.
Nota: Paia compaiai uos meuias se usai habitualmente la uistiibucion t ue Stuuent que se paiece a la noimal, peio sus
valoies p cambian en funcion uel tamao muestial. Cuanto menoi sea n, ms impoitante es usai t.
Si en este ejemplo, se hubiese con la t, el valoi p (2 colas) hubiese siuo p=u,u12.

8
Los lmites 0,05 y 0,10 son en cierto modo arbitrarios y aproximados.
) | (
0
H observadas dif p !
2 1
1 1
n n
s EEDM + =
. hom . var
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
4S
Es impoitante uistinguii entie los conceptos ue significacion estauistica y ue
significacion o ielevancia pictica (significacion 4HW+34( en la investigacion muica). La
significacion estauistica es la mayoi o menoi piobabiliuau ue obtenei un iesultauo
como el obseivauo (o ms extiemo) en el estuuio si touo se uebieia solo al azai. Pueue
que una asociacion que hallemos sea estauisticamente significativa peio tenga poca
ielevancia clinica poique la magnituu ue la uifeiencia obseivaua no tiene ninguna
tiascenuencia paia la saluu ue un paciente. En el ejemplo ue la tabla anteiioi la
significacion clinica venuiia uaua poi la piegunta: como afectai a la saluu ue un vaion
ue esas caiacteiisticas que su peiimetio abuominal aumente en S cm.
!
=@@:@!)89:!_!\!=@@:@!)89:!R`!9:)=DE8?!=;)?<a;)8E?!

?%$1.1"&%.*/0%*.%*F0%+%&*'"4(#**
+%.F0^.*+%*0&*$"&'#(.'%*+%*X1F3'%.1.6
vERBAB (REALIBAB)
B
u
B
1

DECISIN

B
u

ACIERT0

ERR0R TIP0 2
(RIESu0 )

B
1

ERR0R TIP0 1
(RIESu0 u)
ACIERT0
(P0TENCIA, 1 - )
Fuente: (2)

El valoi 7 (ue significacion estauistica) estima la piobabiliuau ue cometei un eiioi
ue tipo 1 una vez que se han analizauo los uatos, en cambio el iiesgo alfa es el ciiteiio
ue uecision pieviamente estableciuo. Pueue paiecei a piimeia vista que alfa coinciue
con el valoi 7, peio lo que suceue es que el iiesgo alfa se iefieie a la piobabiliuau que el
investigauoi %$!53G(!,$!(+&$"(+*, establecienuo qu iiesgo ue cometei una equivocacion
est uispuesto a aumitii, es poi tanto un nmeio fijo y se especifica sin necesiuau ue
conocei los uatos; en cambio, 7 se calcula a posteiioii, a paitii ue los uatos analizauos
8W\_:.

*
!C`;a><*?;*BNL=C><=;*?;*RA!S=;<A<
9@8DE89?B=;!9@b=A?;!<=!E:D)@?;)=!<=!689L)=;8;!
Las piuebas ue contiaste ue hipotesis ms utilizauas apaiecen en la tabla siguiente,
agiupauas segn el tipo ue vaiiables que se analicen. Las piuebas paiamtiicas se llaman asi
poique se basan en paimetios (meuia, vaiianza, etc.) ue una uistiibucion teoiica ue
piobabiliuau y iequieien el cumplimiento ue unas conuiciones ue aplicacion ms estiictas.
Cuanuo no se cumplen tales supuestos o si las vaiiables uepenuientes siguen una escala oiuinal
se ueben usai las piuebas +*!7('("F&'34(%.
Las muestias inuepenuientes son aquellas en que no hay ninguna ielacion paiticulai entie
caua pai ue inuiviuuos ue los giupos que se compaian. En cambio los tests empaiejauos,
paieauos o ue meuiuas iepetiuas son los que estn inuicauos cuanuo se tiata ue un mismo sujeto
meuiuo en uos ocasiones o ue uiseos uonue se establecen compaiaciones entie paiejas
especificas y bien ielacionauas ue sujetos (heimanos, familiaies o contioles empaiejauos
inuiviuualmente con caua caso).

* *
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
46
!#0%2(.*+%*$"&'#(.'%*+%*X1F3'%.1.*(F-1$(2-%.*%&*$(+(*.1'0($13&6*
Variable
independiente*
Variable
dependiente*

Pruebas empleadas

Observaciones

Categrica

Categrica
Ji cuadrado
Ji cuadrado de tendencia lineal

Prueba exacta Fisher
Test de McNemar

REGRESIN LOGSTICA
Si muestra grande
Categoras siguen algn orden o variables
ordinales
Si muestra pequea
Medidas repetidas

Multivariable


Categrica


Cuantitativa
T-DE STUDENT
T-DE STUDENT PAREADA
ANALISIS VARIANZA
9
ANOVA MED. REPETIDAS
ANCOVA
Mann-Whitney
Wilcoxon
Kruskall-Wallis
10

Friedman
2 grupos. Muestras independientes
2 grupos. Medidas repetidas
>2 grupos. Muestras independientes
>2 grupos. Medidas repetidas
>2 grupos. Muestras independientes
2 grupos. Muestras independientes
2 grupos. Medidas repetidas
>2 grupos. Muestras independientes
>2 grupos. Medidas repetidas

Cuantitativa

Cuantitativa
REGRESIN
CORRELACIN-PEARSON
Correlacin-Spearman
REGRESIN MLTIPLE
Predice una variable a partir de otra
Asociacin
Asociacin
Multivariable

Categrica

Supervivencia
Kaplan-Meier
11

Log-Rank (Mantel-Haenzsel)
REGRESIN DE COX
REGRESIN DE POISSON
Curvas supervivencia
#2 curvas supervivencia
Multivariable
Multivariable
* Las vaiiables inuepenuientes (eje ue abscisas o ue las "x") son los pieuictoies que habitualmente anteceuen a los
supuestos efectos (tiatamiento asignauo, giupo al que peitenece el sujeto, caiacteiistica inicial o basal)
** Las vaiiables uepenuientes (eje ue oiuenauas o ue las "y") es el efecto, iesultauo o iespuesta que -conceptualmente al
menos- ocuiiiiia posteiioimente al pieuictoi; se tiata ue compiobai si esa vaiiable uepenue ue los pieuictoies.
Nota: se piesentan en maysculas las piuebas paiamtiicas

9@b=A?;!?!bD?!E:B?!\!9@b=A?;!?!<:;!E:B?;!
Si la hipotesis alteinativa en un test ue hipotesis apunta solo en una uiieccion,
inuicanuo la supeiioiiuau ue un giupo fiente al otio, se tiatai ue un test ue hipotesis
unilateial. Si poi el contiaiio, la hipotesis alteinativa mantiene la uifeiencia ue los
giupos, puuienuo sei cualquieia ue ellos el mayoi, se tiatai ue un test ue hipotesis
bilateial. En el piimei caso los valoies p seiian solo (!#+(!4*H(. Si una piueba bilateial
es significativa, tambin lo sei una piueba unilateial. Las piuebas a uos colas uain
valoies 7 "(2*'$% (y poi tanto con "$+*' significacion estauistica). Las piuebas a una
cola se empleain excepcionalmente. Se aconseja usai piuebas a uos colas.

NOCIONES DE ANLISIS MULTIVARIABLE
Actualmente, casi toda la estadstica que se usa en medicina y en salud
pblica consiste en anlisis multivariables que se basan en modelos de regresin
que tratan con tres o ms variables simultneamente. Rara vez existe un slo
predictor para cualquier suceso. Nuestro universo es multivariable. Los fenmenos
de inters para la salud pblica tambin tienen habitualmente mltiples causas. Los
anlisis estadsticos actuales intentan explicar un fenmeno (variable y o variable
dependiente en la figura siguiente) teniendo en consideracin varias variables
simultneamente. Los usos principales de estos modelos de regresin multivariable
son 3:

9
El ANOVA, al incluir muchos grupos, suele necesitar que se corrijan o penalicen los valores p por las
comparaciones mltiples que se pueden hacer, ya que al comparar todo con todo alguna comparacin resultara
significativa slo por azar. El mtodo clsico ms empleado para esta correccin es el de Bonferroni. Tambin se ha
usado el mtodo de Scheff. Hay otros menos conservadores (Sidak, Tukey, Tamhane, Gabriel, Duncan, Dunnet).
Recientemente se est usando mucho el mtodo de Benjamini-Hochberg que usa un lmite de significacin
estadstica progresivamente distinto para cada comparacin, tras ordenarlas de menor a mayor segn sus valores p.
1u
El test de Jonckheere-Terpstra, ms reciente, puede usarse para la misma finalidad que el de Kruskal-Wallis.
11
Se trata en realidad de un mtodo descriptivo.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
47
! El uso ms importante y ms frecuente es el de intentar ajustar las estimaciones
por posibles factores de confusin (ver captulo correspondiente). La existencia
de factores de confusin es omnipresente en la investigacin epidemiolgica.
Los factores de confusin son variables distintas a la exposicin (variable "x" o
independiente) y al efecto (variable "y" o dependiente), pero asociadas con ellas
(comparten causas comunes) que distorsionan las medidas de asociacin. Hoy
da nadie cree un anlisis estadstico que no est ajustado al menos por edad y
sexo. En el primer panel de la figura 5.1 la "y" correspondera a funcin cognitiva
(minimental test, MMSE), la lnea superior a los no fumadores (x1=0), la inferior a
fumadores (x1=1) y en el eje "x" estara la edad como cuantitativa (x2). Una
simple comparacin de la media de MMSE entre fumadores y no fumadores (t de
Student) no sera vlida, puesto que si los fumadores son ms jvenes, tendrn
mejor memoria, a pesar de que el tabaco les produzca deterioro cognitivo. Se
soluciona el problema introduciendo la variable x2 (edad) en el modelo. Entonces
el coeficiente de regresin b1 que acompaa a x1 dar la diferencia entre
fumadores y no fumadores a igualdad de edad. Es decir se consigue comparar
un fumador frente a un no fumador que sea de su misma edad. Si se introducen
otras variables xi (sexo, nivel educativo, antecedentes familiares, alelo de la
apoE, etc.) se puede conseguir reducir la posible confusin por dichos factores.
Se consigue ajustar por todo factor que se haya introducido en la ecuacin (8).
! El segundo uso es valorar la interaccin o modificacin del efecto. En el panel
intermedio de la figura se aprecia que el deterioro cognitivo se acelera ms con
la edad en los fumadores que en los no fumadores. Las diferencias segn tabaco
no son homogneas sino que aumentan con la edad. El tabaco modificara el
efecto de la edad (mayor deterioro cognitivo asociado a la edad en fumadores) y
la edad modificara el efecto del tabaco (mayores diferencias entre fumadores y
no fumadores a medida que aumenta la edad). A esto se le llama interaccin (9).
As como la confusin es un error sistemtico o sesgo que debe corregirse, la
interaccin no es ningn error, sino una realidad biolgica que debe valorarse y
describirse de la mejor manera posible. Se valora la interaccin mediante
trminos de producto (multiplicacin). La significacin estadstica (valor p) del
coeficiente b3 propio del trmino de producto indicar si el apartamiento del
paralelismo de ambas lneas es significativo o no. Cuando sea significativo se
podr hablar de que hay interaccin o modificacin del efecto.
! El tercer uso es introducir trminos cuadrticos o cbicos que permitan que las
relaciones sean en forma de U o sigan cualquier otro modelo distinto de la rgida
lnea recta (panel inferior de la figura). En el ejemplo de la figura (panel inferior)
se ha introducido un trmino cuadrtico (x
2
o lo que es igual x^2) para recoger
una relacin en forma de U. Este sera el caso de lo que sucede por ejemplo en
la relacin entre el consumo de alcohol y riesgo coronario.

*
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
48
Usos de los modelos multivariables.
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
Los coeficientes ue estos mouelos (bi) no son calculables a mano. Los
piopoiciona el oiuenauoi tias intiouucii los uatos y uaile instiucciones auecuauas 8E:.
La figuia piesenta las opciones ms habituales ue mouelos multivaiiables y su
ielacion con caua uno ue los mtouos uesciiptivos y ue anlisis bivaiiante ms
habituales. La uecision sobie qu mouelo multivaiiable usai uepenuei uel tipo ue
vaiiable ,$7$+,3$+&$ ("y") que se est utilizanuo.
! Paia vaiiables uepenuientes cuantitativas (numiicas) como el peso, la tension
aiteiial o el colesteiol, se usai la iegiesion lineal mltiple. Los coeficientes bi que
piopoiciona este mouelo son uiiectamente inteipietables como uifeiencias ue
meuias fiente al giupo o categoiia que se consiueie como iefeiencia (uifeiencia ue
meuias=u paia ese giupo, ya que l es el %#$H* o iefeiencia).
! Paia vaiiables uepenuientes uicotomicas (sino) como poi ejemplo habeise
vacunauo o no, tenei hipeitension (pievalencia) o usai el cintuion ue seguiiuau, se
usai la iegiesion logistica. Los coeficientes bi que piopoiciona este mouelo
iequieien sei exponenciauos paia que sean inteipietables. El exponencial (e
b
) uel
coeficiente coiiesponue a la ouus iatio (0R) ue ese giupo o categoiia iespecto a la
iefeiencia (0R=1 paia ese giupo ue iefeiencia) 89[:.
! Paia vaiiables uepenuientes uel tipo &3$"7*!/(%&(!#+!$T$+&* se elegii la iegiesion
ue Cox (7'*7*'&3*+(H! /(O(',%! "*,$HS. Poi ejemplo, se uebei usai la iegiesion ue
Cox en los anlisis ue supeivivencia o en estuuios longituuinales uonue se uesee
valoiai la inciuencia ue nuevos casos ue enfeimeuau en funcion ue una seiie ue
caiacteiisticas basales. Tambin se suele usai en los ensayos ue campo (pievencion
piimaiia). Como con la iegiesion logistica, los coeficientes bi que piopoiciona este
mouelo iequieien sei exponenciauos paia que sean inteipietables. El exponencial
(e
b
) uel coeficiente coiiesponuei ahoia a la hazaiu iatio (BR) ue ese giupo o
categoiia iespecto a la iefeiencia (BR=1 paia ese giupo ue iefeiencia) 899:.
*
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
49
*b"+%-".*40-'1,(#1(2-%.*4H.*0.(+".6*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
;<=>?@<=AB>*a>Q;<A>L>*
Se suele abusai en la investigacion en saluu pblica ue las piuebas ue
significacion estauistica (valoies p uel contiaste ue hipotesis). Bebeiia uaise mayoi
impoitancia a los inteivalos ue confianza que constituyen una alteinativa mucho ms
uiiecta y fcil ue entenuei. Las noimas STR0BE (;&'$+0&/$+3+0! &/$! @$7*'&3+0! *5!
*P%$'T(&3*+(H!%&#,3$%!3+!=73,$"3*H*02!;&(&$"$+&) inuican explicitamente que al esciibii
aiticulos sobie estuuios epiuemiologicos obseivacionales se piesenten las meuiuas ue
asociacion ajustauas y acompaauas ue sus inteivalos ue confianza.
Los inteivalos ue confianza habitualmente usan el concepto fiecuencista ue
piobabiliuau. Existen otia coiiiente uistinta ue la fiecuencista paia uefinii la
piobabiliuau: la filosofia bayesiana. Poi ejemplo, paia la piobabiliuau ue obtenei caia al
tiiai una moneua, la uefinicion fiecuencista mantiene que las piobabiliuaues son los
limites a los que tienue la piopoicion con la que salui caia si la moneua se lanzase
infinitas veces. Peio nauie ha lanzauo una moneua infinitas veces. En cambio, la filosofia
bayesiana maneja la piobabiliuau como un concepto %#PG$&3T*. Se tiata ue aauiile a la
inteipietacion fiecuencista el giauo ue ceiteza pievia uel investigauoi. Se usa la ceiteza
pievia paia matizai el iesultauo obteniuo en una muestia pequea. El giauo ue
cieuibiliuau que se tiene ue antemano sobie un fenomeno y hasta qu punto se est
uispuesto a pieuecii caua posible valoi uel iesultauo en la muestia se integia con los
iesultauos obseivauos iealmente en la muestia. Asi, paia el planteamiento bayesiano
seiia muy poco cieible ue antemano que llevai pieicing piotegiese fiente a la hepatitis,
peio seiia muy cieible que comei menos llevase a auelgazai. Esta cieencia se foimaliza
y se integia cuantitativamente paia matizai a la baja o al alza los iesultauos iealmente
obseivauos en la muestia.
La expiesion ms geneial y simple seiia:

odds posterior = odds a priori x Factor Bayes

La ouus posteiioi seiia el iesultauo uel anlisis bayesiano. La ouus pievia seiia
subjetiva (la cieencia que se tiene antes ue iniciai el estuuio). El Factoi Bayes se obtiene
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
Su
a paitii ue los uatos iecogiuos en la muestia. Esta expiesion iecueiua a la que se
piesenta en el capitulo 8 paia las piuebas uiagnosticas, peio se amplia tambin a los
uems tipos ue anlisis estauistico.
Existen mtouos sencillos y que no iequieien ningn %*5&1('$ especial paia
calculai inteivalos ue confianza con pioceuimientos bayesianos apioximauos 89E:.
*
C;O;C;LBA><*
*
(1) Pencheon D, Guest C, Melzer D, Gray AM. Oxford handbook of public health. N. York:
Oxford University Press, 2001;13.
(2) Martnez-Gonzlez MA, Snchez-Villegas A, Fauln Fajardo FJ (eds.). Bioestadstica
amigable. 2 ed. Madrid: Daz de Santos, 2006.
(3) Sents J, Pardell H, Cobo E, Canela J. Bioestadstica. 2 ed. Barcelona: Masson, 1995.
(4) de Irala J, Martnez-Gonzlez MA, Segu-Gmez M. Epidemiologa aplicada. 2 ed.
Barcelona: Ariel, 2008.
(5) Carrasco JL, Hernn MA, Martn-Hortelano C. El mtodo estadstico en la investigacin
mdica. Madrid: Ciencia, 1995.
(6) Rothman KJ, Greenland S, Lash TL. Modern Epidemiology, 3 ed. Filadelfia: Lippincott
Williams & Wilkins, 2008.
(7) Ware JH, Mosteller F, Delgado F, Donnelly C, Ingelfinger JA. P Values. En: Bailar JC III,
Hoaglin DC (eds.). Medical uses of statistics, 3 ed. Boston: New England Journal of
Medicine, 2009.
(8) de Irala J, Martnez-Gonzlez MA, Guilln-Grima F. Qu es un factor de confusin? Med
Clin (Barc.) 2001;117:377-85. (Fe errores: Med Clin (Barc.) 2001;117:775).
(9) de Irala J, Martnez-Gonzlez MA, Guilln-Grima F. Qu es una variable modificadora del
efecto? Med Clin (Barc.) 2001;117:297-302.
(10) Martnez-Gonzlez MA, de Irala J, Guilln-Grima F. Qu es una odds ratio? Med Clin
(Barc.) 1999;112:416-22.
(11) Martnez-Gonzalez MA, Alonso A, Lpez-Fidalgo J. Qu es una hazard ratio? (nociones
de anlisis de supervivencia). Med Clin (Barc.) 2008;131:65-72.
(12) Martnez-Gonzlez MA, Segu-Gmez M, Delgado-Rodrguez M. Cmo mejorar los
intervalos de confianza? Med Clin (Barc.) 2009;135:30-4.
















Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S1
10. INTRODUCCIN AL METANLISIS
(adaptado del compendio de salud pblica)

El metanalisis se usa para combinar mltiples estudios que intentan contestar todos a
la misma pregunta de investigacin. El trmino metaanlisis precede cronolgicamente al
concepto de revisin sistemtica. Lo acu el psiclogo Glass en 1976 para definir un conjunto de
tcnicas que se utilizan para cuantificar la informacin contenida en estudios similares que valoran
una misma pregunta de investigacin.
La revisin sistemtica es definida por la colaboracin Cochrane como una sntesis de
los resultados de varios estudios primarios mediante tcnicas que limitan los sesgos y el error
aleatorio. En la actualidad el trmino metaanlisis se reserva para denominar las tcnicas
estadsticas de combinacin de resultados, mientras que en el pasado inclua tambin la
nocin de revisin sistemtica.

SESGO DE PUBLICACIN
Lo ms frecuente es que los investigadores que desean combinar los estudios realizados
sobre un tema se basen en estudios publicados y aunque intenten sacar a la luz los no
publicados, los publicados tendrn siempre ms probabilidad de ser localizados.
El sesgo de publicacin se origina cuando lo que se publica no es representativo de lo
que se investiga. La trascendencia de este sesgo es grande para investigadores y lectores: si
lo que aparece no representa la realidad, se est distorsionando el propio proceso de
aprendizaje. Por eso es importante saber si este sesgo se presenta y cules son las razones
que favorecen su presencia.
Este sesgo no slo reside en evaluadores y comits editoriales de las publicaciones
cientficas, tambin reside en los autores, que muchas veces son los primeros en decidir no
enviar sus investigaciones a publicar: por considerar que esos resultados tienen poco inters,
por no tener la propiedad de los datos (estudios financiados por la industria, que puede buscar
que los resultados que no la favorecen permanezcan en el anonimato), o por sesgos (en
diseo o ejecucin) que comprometen la validez de un estudio.
Los hechos que se conocen que influyen en la presencia del sesgo de publicacin son:
! Significacin estadstica del resultado. Es el ms importante y en el que se basan los
procedimientos estadsticos para identificar la presencia del sesgo. Los resultados
significativos suelen ser los primeros en publicarse.
! Caractersticas de la investigacin realizada: algunas de ellas se asocian con una
probabilidad diferencial de publicacin: los estudios aleatorizados y los multicntricos se
publican ms. Los de gran tamao muestral rara vz dejan de publicarse. Los estudios
grandes suponen un mayor esfuerzo en su diseo y ejecucin y los autores ponen un
mayor inters en que los resultados no permanezcan ignorados, ya sean positivos o
negativos.
! La fuente de financiacin se asocia con la publicacin. El conflicto de inters puede dar
lugar a publicaciones engaosas o maquilladas y dar pie a que cierta documentacin
tenga ms probabilidad de ser publicada. Un ejemplo de ello es el papel desempeado por
la industria tabaquera al investigar los efectos del tabaquismo pasivo (se recoga la
informacin que resultaba menos perjudicial para la industria).
! El prestigio de la institucin puede jugar un papel en el sesgo de publicacin. Un ejemplo
histrico de esto es el artculo de Levin (1) sobre la relacin entre tabaco y cncer de
pulmn, retenido por el director de JAMA ante la desconfianza surgida por lo novedoso del
diseo (uno de los primeros estudios de casos y controles de la historia), hasta que lleg a
sus manos un estudio similar (de Wynder y Graham), firmado por un cirujano de prestigio
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S2
mundial (Graham), conocido por sus innovaciones. Public los dos estudios en el mismo
nmero, pero primero el de Wynder y Graham (2).
! Prejuicio: aqu el proceso editorial tiene ms responsabilidad. Por ejemplo, en la relacin
entre el consumo de cocana en el embarazo y riesgo fetal se ha comprobado que los
trabajos que no hallan un efecto nocivo sobre el feto se rechazan con ms frecuencia, a
pesar de que su calidad es similar a los restantes: as se est juzgando la metodologa por
los resultados, con resultados no crebles el evaluador minusvalora los mtodos.
! Regresin a la media: El sesgo de publicacin se ha intentado justificar parcialmente como
un fenmeno de regresin a la media. Los primeros artculos sobre una misma pregunta
de investigacin, por su mayor novedad, son ms fcilmente aceptados, que los que a
continuacin se remiten para su publicacin, y en los que se pueden manifestar con mayor
intensidad los aspectos mencionados con anterioridad.
En previsin de que un determinado estudio pase en el futuro a formar parte de un
metaanlisis ha supuesto la implantacin en muchas revistas de las normas CONSORT, para
los que quieran publicar un estudio de intervencin, y posiblemente ocurrir lo mismo con las
normas STARD para pruebas diagnsticas o las normas STROBE para estudios
observacionales.
Las normas PRISMA son las actualmente vigentes para escribir una revisin sistemtica.
http://www.prisma-statement.org/

Debieran hacerse esfuerzos para que toda investigacin con un mnimo de calidad se
publicase, con independencia de la significacin de sus resultados, pero el papel se vende
caro. Una opcin futura es la edicin electrnica (internet).
El registro de ensayos intenta monitorizar todo ensayo clnico en marcha para identificar
los que finalmente se publican y los qu ese esconden, aunque esto tambin tiene sus
limitaciones. Puede haber un conflicto de intereses, por ejemplo, si un organismo privado
prefiere que se ignore que un estudio est en marcha (no infrecuente en salud laboral) o
cuando se esperan beneficios econmicos en el desarrollo de nuevos frmacos. Tambin hay
ventajas: valorar el sesgo de publicacin, defender los derechos en ser el primero en
investigar un tema, conocer a otros que trabajan en temas relacionados, etc.
El sesgo de publicacin puede ser muy grave. Hay que cuantificarlo. Existen varios
procedimientos para ello:
! Representacin del ln RR y su intervalo de confianza frente al tamao de muestra del
estudio. Si se coloca el ln RR en el eje de ordenadas, se obtendr la imagen de un
embudo (funnel plot), con la parte ms estrecha dirigida a la derecha (ms precisin
cuando el tamao de muestra es mayor). La existencia una figura simtrica alrededor de
un eje que pasa por el valor ponderado del RR habla en favor de la ausencia de este error.
Cuando se coloca el ln RR en el eje de abscisas se obtiene una imagen similar a un rbol
de navidad. Obsrvese en la figura de la derecha que faltan estudios pequeos con RR
alrededor de la unidad.










Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
SS

! Clculo del nmero probable de estudios no publicados: requieren asumir supuestos ms
o menos subjetivos en su aplicacin. Se puede estimar el nmero de estudios con
resultados no significativos que se necesitaran para hacer que una asociacin global
significativa se hiciera no significativa estadsticamente (mtodo de Rosenthal). Tambin
se pueden aplicar otros mtodos como estrategias de remuestreo asumiendo que los
estudios encontrados con resultado no significativo son una muestra representativa de
todos los que se han hecho (publicados o no).
! El mtodo de Egger (Eggers method) es un procedimiento para detectar un sesgo de
publicacin. Consiste en una regresin lineal simple de la magnitud del efecto dividida por
su error estndar sobre el inverso del error estndar.


MTODOS DE COMBINACIN
Se pueden combinar los resultados publicados (metanlisis convencional) o combinar las
bases de datos (pooled analysis). En este ltimo caso, el anlisis estadstico es el habitual,
salvo que es conveniente incluir en los modelos multivariables una variable que identifique al
estudio. Este apartado se dedicar a la combinacin de datos procedentes de estudios
publicados.
Las tcnicas estadsticas de metaanlisis generan varios problemas:
! Se puede asumir que el efecto producido por la exposicin sea constante de estudio
en estudio (modelo de efectos fijos, MEF) o, por el contrario, tenga una distribucin al
azar a lo largo de los distintos estudios (modelo de efectos aleatorios, MEA).
! Los estudios individuales de un metaanlisis pueden no ser independientes, ya que
los ltimos pueden iniciarse tras conocer los resultados de los primeros. Es un
autntico problema: la investigacin actual se apoya en la del pasado.
! Existe una tendencia a encontrar resultados estadsticamente significativos conforme
el nmero de estudios aumenta, aunque no favorezcan la asociacin. Por ello, se
recomienda que el nivel de significacin (riesgo alfa) sea como mnimo del 1%. No
obstante, la mayora de los metaanlisis calculan intervalos de confianza del 95%.
Sea cual sea el procedimiento que se aplique, cada estudio proporcionar el mismo
parmetro, #i. Lo ms habitual es que este parmetro sea el logaritmo neperiano de una
medida multiplicativa de asociacin (riesgos relativos, odds ratios, etc). Lo que se hace viene a
ser una media ponderada de los parmetros de todos los estudios.
Recurdese que una media ponderada supone multiplicar cada dato por un peso y dividir
la suma de estos productos por la suma de los pesos. Por ejemplo si un alumno obtuvo un 4
en el examen final un 8 en el examen parcial, y un 85 en unos tests de clase, y los pesos son
del 60% para el examen final y del 20% para las otras dos notas, su media ponderada (Mp)
ser:
Mp =
w
i
x
i !
w
i !
=
(0, 6" 4) +(0, 2"8) +(0, 2"5)
0, 6 +0, 2 +0, 2
= 5
Del mismo modo, cuando se hace un metaanlisis lo que se combinan no son notas,
sino los resultados de diferentes estudios epidemiolgicos, utilizando un criterio de
ponderacin, es decir unos pesos llamados wi

:
#p = ($ wi#i)/$ wi

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S4
MTODOS PARA VARIABLES DICOTMICAS: MODELO MULTIPLICATIVO
Son mtodos que se basan en la nocin de riesgo relativo (RR). En este caso,
el parmetro #i ser el logaritmo neperiano del RR (o de la OR) en cada estudio, de
ah el subndice i.
Mtodo del inverso de varianza
Como ejemplo se expone el caso de la odds ratio (OR), que es lo ms utilizado
en metaanlisis. Para la combinacin de resultados, dado que la OR (al igual que el
RR) no sigue una distribucin normal, se transformar logartmicamente. Por tanto,
en el caso de que se use la OR, el parmetro #i corresponder al logaritmo
neperiano de la OR en cada estudio, es decir #i = lnORi.
!
i
= ln(OR
i
)
Por ejemplo, para el primer estudio de la tbla 10.1, el parmetro #i
corresponder a
!
i
= ln(0, 96) = !0, 04
Cada estudio proporciona un ln(ORi). Pero adems debe extraerse su varianza.
La varianza de ln(OR) se puede obtener a partir de los intervalos de confianza al
95% de la OR (mejor si est ya ajustada por factores de confusin). Los estudios
donde se ofrecen estimaciones ajustadas (controlando por uno o ms factores de
confusin), suelen proporcionar tambin el intervalo de confianza de la OR. En esta
situacin, se calcula la varianza con la ecuacin var (ln OR)= [(ln ORs - ln
ORi)/3,92]
2
, siendo ORs y ORi los lmites superior e inferior de confianza de la OR.
Esto es as porque 3,92 es el doble de 1,96 y 1,96 es el valor z de la distribucin
normal para un intervalo de confianza al 95%.
Por ejemplo, en el primer estudio de la tabla 10.1, la varianza de ln(OR1) sera
var(lnOR) =
ln(1, 28) !ln(0, 73)
3, 92
"
#
$
%
&
'
2
= 0,143
2
= 0, 0205

Tabla 10.1. Descenso de la colesterolemia por dieta y medicacin y mortalidad:
estudios de prevencin primaria


Estudio


Tto. experimental / tto. control
Gr. experimental Grupo control OR
Viven
(b)
Mueren(a) Viven (d) Mueren (c)
LA Veterans Dieta especial / convencional 250 174 245 177 0,96 (0,73-1,28)
Minnesota Dieta especial / convencional 2039 158 2044 153 1,04 (0,82-1,31)
OMS Clofibrato / placebo 5203 128 5209 87 1,47 (1,11-1,96)
Upjohn Colestipol / placebo 531 17 519 27 0,62 (0,31-1,19)
Lipids Colestiramina + dieta / placebo + dieta 1838 68 1829 71 0,95 (0,67-1,36)
Helsinki Gemfibrozil + dieta / placebo + dieta 2006 45 1988 42 1,06 (0,68-1,66)
Fuente: adaptado de 3.

Se usa como criterio de ponderacin el inverso de la varianza.
w
i
=
1
var(lnOR
i
)

El peso para el primer estudio sera
w
i
=
1
0, 0205
= 48, 8
As se va haciendo para todos los estudios como muestra la tabla 10.2.

Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
SS
Tabla 10.2. Varianzas y pesos del ejemplo de la Tabla 10.1 en la aplicacin del
mtodo del inverso de la varianza.

Estudio

OR

ln (OR)
V (ln OR) =
[(lnORs-lnORi)/3,92]
2


Peso (1/V)
Peso % del total
LA Veterans 0,96 -0,041 0,0205 48,73 48,73x100/224,7= 21,7
Minnesota 1,04 0,039 0,0143 70,02 31,2
OMS 1,47 0,385 0,0210 47,53 21,2
Upjohn 0,62 -0,478 0,1177 8,49 3,8
Lipids 0,95 -0,051 0,0326 30,66 13,6
Helsinki 1,06 0,058 0,0518 19,29 8,6
Total = 224,7 Total = 100%

Al final se calcula una media ponderada, que equivaldr al logaritmo neperiano
de la OR combinada (ln(ORp)).
ln(ORp) =
w
i
!
i !
w
ii !


Siendo ORp la odds ratio ponderada.
ln(ORp) =
(48, 73!"0, 041) +... +(19, 29!0, 058)
48, 73+... +19, 29
= 0, 065
Para pasar de lnORp a ORp ser necesario realizar la transformacin
antilogartmica.
ORp = e
ln(ORp)
= e
0,065
=1, 07
El siguiente paso es calcular un intervalo de confianza a la ORp. Para eso se
requiere su varianza (la del estimador combinado final).
La varianza del logaritmo natural de la ORp es igual al inverso de la suma de los
pesos de cada OR, V(ln ORp)= 1/($ wi). El intervalo de confianza de la ORp es =
ORp%EXP [ z&/2'V (ln ORp)], siendo z&/2 = 1,96 si se quiere una confianza del 95%.
IC95%= ORp!e
z!/2 Vp
=1, 07!e
1,96
1
224,72
= 0, 94"1, 22

La significacin global del parmetro se puede estimar dividiendo el logaritmo
natural del ORp por su error estndar, zasoc = ln ORp/[V(ln ORp)]^0,5, que sigue una
distribucin Normal (0,1). Se puede apreciar, no obstante, que el resultado no es
significativo porque el intervalod e confianza al 95% (0,94-1,22) comprende el valor
nulo (OR=1). El grado de homogeneidad se valora mediante el estadstico Q

Q= $ wi(ln ORi - ln ORp)
2

Q = 48,73(-0,041-0,065)
2
+!+19,29(0,058-0,065)
2
=8,4

Cuanto mayor sea el estadstico Q, ms argumentos habr para hablar de
heterogeneidad.
Q sigue una distribucin (
2
con (k - 1) grados de libertad, siendo k el nmero de
estudios (5 grados de libertad en el ejemplo). Para cada valor de chi cuadrado (con
sus respectivos grados de libertad) corresponde un valor p de significacin
estadstica.
En Stata display chi2tail(5,8.4) devolver p = 0.136
Cuanto mayor sea la chi cuadrado obtenido (chi cuadrado=Q), menor (ms
significativo) ser el valor p.
El punto de corte para detectar heterogeneidad se sita en el 10% (p = 0,1) y no
en el clsico 5% (p = 0,05). Aqu en el ejemplo no se cuenta con pruebas para
rechazar la homogeneidad, ay que p = 0,136.
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S6
Tabla 10.3. Resumen de la ponderacin por inverso de la varianza
(modelo de efectos fijos).
Objetivo Estimacin
Ponderacin resumen, #p
!
!
=
i
i i
p
w
w"
"
) (
1
i
i
Var
w
!
=
Error estndar de #p
!
=
i
p
w
EE
1
) ("
Intervalo de confianza de #p
) (
2 / p p
EE z ! !
"
#
Significacin estadstica de #p
) (
p
p
EE
z
!
!
=
Heterogeneidad, Q
( )
!
" =
2
p i i
w Q # #
(
2
con k 1 grados de libertad.
k = nmero de estudios
Si se ponderan RD, #p = RDp, #i = RDi y wi = 1/Var(RDi)
Si se ponderan RR, #p = ln(RRp), #i = ln(RRi) y wi = 1/Var(ln RRi)


Mtodo de efectos aleatorios (MEA) de DerSimonian Laird
Se puede incorporar explcitamente la variabilidad entre estudios y asumir un
modelo de efectos aleatorios (MEA: se le llama mtodo de DerSimonian Laird, Tabla
10.4), en vez de un MEF, como hasta ahora se ha hecho. Ahora se calcular la
varianza entre estudios ()
2
).


tau
2
= (8,4-6+1) / (224,7-(10920/224,7)) = 0,019
Los valores negativos de tau
2
se asume que son cero.
El peso de cada investigacin vendra dado ahora por: w*i= 1/(Vi + )
2
). Esto
supondra que la ORp
*
= $ (w*iORi)/$ w*i. La varianza y el intervalo de confianza se
estiman como en el caso anterior, cuando no se tuvo en cuenta la variabilidad entre
estudios. En el presente caso se sustituira wi por w*i.
En la Tabla 10.4 se resumen las varianzas de cada estudio, sus pesos, y los
nuevos pesos tras la comprobacin de que )
2
= 0,019.

Tabla 10.4. Varianzas y pesos del ejemplo de la Tabla 11.6 en la aplicacin del
modelo de efectos aleatorios ()
2
= 0,019).
Estudio V (ln OR) Peso* = [1/(V+)
2
)] %Peso
LA Veterans 0,0205 25,15 20,88
Minnesota 0,0143 29,84 24,77
OMS 0,0210 24,83 20,61
Upjohn 0,1177 7,30 6,06
Lipids 0,0326 19,29 16,01
Helsinki 0,0518 14,07 11,68

( )
!
"
!
#
$
!
%
!
&
'
(
+ (
=
) ) ) i i i
w w w
K Q
mx
/
1
, 0 .
2
2
*
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S7
Tabla 10.5. Resumen de la ponderacin por inverso de la varianza
(modelo de efectos aleatorios de DerSimonian Laird).
Objetivo Estimacin
Ponderacin resumen, #p


Q, wi y k como en la Tabla 11.3.
Error estndar de #p

Intervalo de confianza de #p

Significacin estadstica de #p

Heterogeneidad, Q

(
2
con k 1 grados de libertad


Como ya se ha mencionado, )
2
> 0 y se puede aplicar el MEA. Se recalculan los
pesos. En primer lugar se aprecia que los pesos son menores que en el MEF, lo que
se traducir en una mayor varianza (recuerde, el inverso de la suma de los pesos) y
un intervalo de confianza mayor. Se comprueba tambin que las diferencias en la
importancia de los estudios se han amortiguado: con los pesos originales el estudio
Minnesota era siete veces ms influyente que el de Upjohn (72,5 frente a 10,0),
mientras que con la nueva ponderacin, es algo superior a tres (27,1 frente a 8,1).
Se concede con el MEA una mayor importancia relativa a los estudios pequeos.
Con el MEA, la ORp = 1,05 y un intervalo de confianza ms amplio que con el
MEF, e igualmente no significativo (0,88-1,26). Al descender el valor de los pesos, la
prueba de homogeneidad Q se hace ms pequea, Q = 5,2, p = 0,39. Es ms difcil
encontrar heterogeneidad con el MEA.

Estrategia general de anlisis
La eleccin entre una medida basada en el RR o en la diferencia de riesgos
depende de los objetivos de la investigacin, pero anundan mucho ms los
metanlisis basados en el RR. En los estudios observacionales (cohortes, casos y
controles) el mtodo del inverso de la varianza permite combinar parmetros (p.ej.
RR) ajustados. Hay otros mtodos como el de Mantel-Haenszel y el de Peto que
obligan a utilizar directamente los datos brutos de cada casilla de la tabla 2x2, y es
probable que haya sesgo de confusin. Esto supone que los mtodos Mantel-
Haenszel y Peto se recomienden slo para los estudios experimentales, donde ae
puede asumir que al aleatorizar la exposicin se ha conseguido prevenir la
confusin.
Con respecto a la disyuntiva de utilizar el MEF o el MEA, se insiste en que la
eleccin debe especificarse a priori y no tras conocer los resultados. Es muy comn
empezar por un MEF (mucho ms restrictivo a la hora de considerar la
heterogeneidad, ya que es ms fcil detectarla con este procedimiento) y esto basta
!
!
=
*
*
i
i i
p
w
w "
"
2
*
) (
1
! " +
=
i
i
Var
w
!
!
"
!
!
#
$
!
!
%
!
!
&
'
(
+ (
=
)
)
)
i
i
i
w
w
w
K Q
2
2
1
, 0 max *
!
=
*
1
) (
i
p
w
EE "
) (
2 / p p
EE z ! !
"
#
) (
p
p
EE
z
!
!
=
( )
!
" =
2 *
p i i
w Q # #
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S8
si no hay heterogeneidad; por el contrario, si hay heterogeneidad se recurre al MEA.
A priori se recomienda el MEA cuando el nmero de estudios es pequeo (< 20).

El MEA asume que slo se dispone de una muestra de los estudios existentes,
asuncin ms realista que tener todo el universo de estudios, como subyace en el
MEF.
El MEA introduce un trmino de variabilidad adicional y aumenta la varianza del
estimador resumen, ampliando el intervalo de confianza final. Esto es una ventaja no
desdeable, ya que uno de los inconvenientes que se han sealado en el
metaanlisis es la facilidad de obtener intervalos de confianza exageradamente
estrechos y resultados estadsticamente significativos.
Sin embargo, la desventaja del MEA es que el mismo coeficiente de variabilidad
se aade por igual a cada estudio, lo que hace que se acabe concediendo una
mayor importancia relativa a los estudios pequeos frente a los grandes, lo que
supone que el MEA se influye ms por los errores que afectan a los estudios
pequeos, como el sesgo de publicacin.
Algunos autores recomiendan que se haga un anlisis de sensibilidad, siempre
y cuando sea posible, y combinar los resultados de las distintas investigaciones por
ms de un mtodo. Si los distintos anlisis coinciden, queda ms clara la robustez
de la inferencia.


ESTUDIO DE LA HETEROGENEIDAD
Siempre debe realizarse un anlisis de la heterogeneidad. Lo ms habitual es
usar el estadstico Q. Si el estadstico Q es grande y tiene un valor p significativo o
prximo a la significacin surgirn dudas sobre la homogeneidad de los estudios y la
capacidad de combinarlos se pone en tela de juicio.
La sntesis de estudios realizados en diferentes lugares y tiempos, sobre
distintas poblaciones y con diseos diferentes, con frecuencia da lugar a que los
resultados sean estadsticamente diferentes entre s. Esta heterogeneidad no puede
ignorarse. Supngase que todos los resultados de los estudios individuales son
ciertos, sin sesgos, y existe una marcada heterogeneidad; aqu el clculo de una
medida resumen que promediara de algn modo los diferentes estudios no aporta
nada (ms bien confunde). El conocimiento del promedio entre los diferentes
estudios no permite apreciar la riqueza de la variabilidad existente y lo ms acertado
sera investigar cules son las razones para que se produzcan resultados
contradictorios. El metaanlisis slo debe sacar un denominador comn slo cuando
de verdad ste existe.
Un inconveniente grave del anlisis de la heterogeneidad es que la mayora de
sus pruebas estadsticas no tienen una potencia estadstica adecuada,
especialmente cuando hay pocos estudios; por ello, el no rechazar la hiptesis de
homogeneidad no implica que no exista heterogeneidad.
Una alternativa interesante al estadstico Q es el estadsitco I
2
que cuantifica el
efecto de la heterogeneidad, proproporcionando una medida del grado de
inconsistencia en los resultados de los diferentes estudios. I
2
describe el porcentaje
de la variabilidad total entre estudios que es debida a heterogeneidad en vez de ser
debida al azar. I
2
se puede calcular como

I
2
= 100%"(Q - gl)/Q

donde Q es la cantidad antes presentada y gl son los grados de libertad.
En el ejemplo

I
2
= 100"(8,4 -5)/8,4 = 40.4% para el MEF

I
2
= 100"(5,2 -5)/5,2 = 3.8% para el MEA
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
S9
Los valores negativos de I
2
se asume que son cero. Eso permite que el rango de
valores para I
2
est entre el 0% y el 100%. Un valor del 0% indica que no se observa
heterogeneidad; en cambio valores grandes muestran nivelkes crecientes de
heterogeneidad (3).

En el anlisis de la heterogeneidad se debe partir de una reflexin acerca de
cules pueden ser las variables que pueden ejercer una influencia diferencial:
variables de diseo, exposicin, efecto, u otros factores de riesgo (variables de
persona, tiempo y lugar, etc.). A continuacin se puede proceder de varias maneras:
! Anlisis estratificado: se repite el metaanlisis en cada uno de los estratos. Si
desaparece la heterogeneidad dentro de los estratos es razonable pensar que
esa variable influye. El inconveniente que presenta esta estrategia es que puede
resultar poco eficiente si hay muchos estratos y el nmero total de estudios es
pequeo.
! Metarregresin: Suele ser ms eficiente que la tcnica anterior. En ella se utiliza
como variable dependiente la magnitud del efecto que se valora con una o varias
variables independientes: ln OR = *0 + $*ixi. Las tcnicas de metarregresin
trabajan con datos agregados y por lo tanto estn sometidas a los problemas de
la falacia ecolgica.
! Metaanlisis acumulado: es menos sensible que las anteriores para la
identificacin de la heterogeneidad.
! Anlisis de influencia: El anlisis de la heterogeneidad, en ocasiones, no revela
ninguna causa, sino que sugiere que tal heterogeneidad puede ser debida a un
error aleatorio, motivado porque una o varias investigaciones encuentran valores
que difieren de la media. Son valores extremos sin ninguna razn aparente. Un
anlisis de influencia puede ser aconsejable: consiste en repetir el anlisis con y
sin ellos. Si el resultado significativo depende de ellos, hay que ser cauto en la
inferencia. Tambin puede cambiarse el peso de esos estudios y comprobar qu
sucede.
! Anlisis de sensibilidad: puede hacerse de varias maneras: cambiando los
criterios de inclusin de los estudios que se combinan (generalmente
caractersticas metodolgicas) y, si se corrigieron errores, variando los criterios
utilizados para corregirlos.

GRFICO DE BOSQUE (FOREST PLOT)
El grfico de bosque o forest plots es el modo habitual de presentar un meta-anlisis y
est diseado para mostrar los riesgos relativos (u odds ratios) de mltiples estudios que
intentan contestar todos a la misma pregunta de investigacin. Inicialmente se us slo para
mostrar los resultados de diversos ensayos. En los ltimos 20 aos est siendo aplicad
tambin a estudios observacionales.
Los forest plots pueden adoptar diversas configuraciones, pero normalmente se
presentan como una lista situada a la izquierda con los nombres (muchas veces en orden
cronolgico) de cada uno de los estudios recogidos, seguida de unas figuras para cada
estudio que incluyen unas barras laterales (intervalo de confianza) en torno a un pequeo
cuadriltero central (estimacin puntual del RR), todo este grfico est situado a la derecha del
nombre del cada estudio. Las barras de confianza son horizontales. El grfico puede
representarse en escala logartmica cuando se usen odds ratios u otras medidas multilicativas
porque slo as los intervalos de confianza sern simtricos en torno a la estimacin puntual
(RR u OR de cada estudio). De lo contrario, podra darse mucha importancia indebidamente a
la parte del intervalo de confianza que es superior a 1, mientras que se le da poca importancia
a la inferior a 1 (ya que todo su margen de movilidad quedara meramente entre 0 y 1).
El rea de cada cuadriltero suele ser proporcional al peso que tiene el estudio. Se
representan dos lneas verticales, una es la correspondiente al nulo (RR=1) y otra corresponde
Universidad de Navarra Dpto. M. Preventiva y Salud Pblica
6u
a la estimacin combinada (ORp, por ejemplo) que resulta del metanlisis. Estas lenas cruzan
todos los estudios. Al final, en la parte inferior se representa como un rombo la estimacin
combinada global del metaanlisis. El rombo abarca el intervalo de confianza de la ORp.





REFERENCIAS
(1) Levin ML, Goldstein H, Gerhardt PR. Cancer and tobacco smoking: a preliminary report. JAMA 1950;143,
336338.
(2) Wynder EL, Graham EA. Tobacco smoking as a possible etiologic factor in bronchiogenic carcinoma. A study
of six hundred and eighty-four proved cases. JAMA 1950;143, 329336.
(3) Higgins JPT, Thompson SG, Deeks JJ, Altman DG. Measuring inconsistency in meta-analyses BMJ 2003;
327: 557560.



Overall (I-squared = 40.4%, p = 0.136)
LA Veterans
Study
Helsinki
OMS
Lipids
Upjohn
Minnesota
1.07 (0.94, 1.22)
0.96 (0.72, 1.27)
Ratio (95% CI)
1.06 (0.68, 1.66)
1.47 (1.11, 1.95)
0.95 (0.67, 1.35)
0.62 (0.32, 1.21)
1.04 (0.82, 1.31)
Odds
100.00
21.68
Weight
8.59
21.15
13.64
3.78
31.16
%
1.07 (0.94, 1.22)
0.96 (0.72, 1.27)
Ratio (95% CI)
1.06 (0.68, 1.66)
1.47 (1.11, 1.95)
0.95 (0.67, 1.35)
0.62 (0.32, 1.21)
1.04 (0.82, 1.31)
Odds
100.00
21.68
Weight
8.59
21.15
13.64
3.78
31.16
%

1 .5 1 2

Das könnte Ihnen auch gefallen