Sie sind auf Seite 1von 41

MTODOS ESTADSTICOS

Dr. Carlos Camilo CASTRILLN


Chi Ji Cuadrado
En la investigacin biomdica nos
encontramos con frecuencia con valores o
datos de tipo cualitativo, mediante los cuales
un grupo de individuos se clasifican en dos o
ms categoras mutuamente excluyentes.
Las proporciones son una forma habitual de
expresar frecuencias cuando la variable
objeto de estudio tiene dos posibles
respuestas, como presentar o no un evento
de inters (enfermedad, muerte, curacin,
etc.).
Chi cuadrado
Cuando lo que se pretende es comparar dos
o ms grupos de sujetos con respecto a una
variable categrica, los resultados se suelen
presentar a modo de tablas de doble entrada
que reciben el nombre de tablas de
contingencia.
La situacin ms simple de comparacin
entre dos variables cualitativas es aquella en
la que ambas tienen slo dos posibles
opciones de respuesta (variables
dicotmicas).
Ejemplo
Se quiere estudiar la posible asociacin
entre el hecho de que una gestante
fume durante el embarazo y que el nio
presente bajo peso al nacer,
Se trata de ver si la posibilidad de tener
bajo peso es diferente en gestantes que
fumen y gestantes que no fumen
durante la gestacin.
Tabla de contingencia (2x2)
Caractersti -ca A
Caracters-
tica B
Presente Ausente Total
Presente a b a + b
Ausente c d c + d
Total a + c b + d n
Problema
Se realiza un estudio de seguimiento sobre
una cohorte de 2000 gestantes, a las que se
interroga sobre su hbito tabquico durante
la gestacin y se determina adems el peso
del recin nacido.
Se obtiene la Tabla de contingencia para
estudiar la asociacin entre fumar durante la
gestacin y el bajo peso del nio al nacer.
Estudio de seguimiento de
2000 gestantes
RNBP RNBP

Gestante S No Total
Fumadora 43 (a) 207 (b) 250
No
fumadora
105 (c) 1645 (d) 1750
Total 148 1852 2000
Estudio de la tabla
a, b, c y d son las frecuencias observadas del
suceso en la realidad de nuestro ejemplo de
estudio (43, 207, 105 y 1645), siendo n
(2000) el nmero total de casos estudiados, y
a+b, c+d, a+c y b+d los totales marginales.
a+b=250 es el nmero total de mujeres
fumadoras durante el embarazo, c+d=1750
el nmero total de mujeres no fumadoras,
a+c=148 el nmero total de nios con bajo
peso al nacer y b+d=1852 el nmero total de
nios con peso normal al nacimiento.
Planteo de cuestiones
Determinar si existe una relacin
estadsticamente significativa entre las
variables estudiadas.
Cuantificar dicha relacin y estudiar su
relevancia clnica (medidas de
asociacin o de efecto: riesgo
relativo=RR, odds ratio= OR, reduccin
absoluta del riesgo=RAR).

Metodologa de anlisis
Nmero de categoras de las variables a
comparar.
Hecho de que las categoras estn
ordenadas o no.
Nmero de grupos independientes de
sujetos que se estn considerando o de
la pregunta a la que se desea
responder.
Procedimientos estadsticos
Chi cuadrado.
Correccin de Yates

Prueba exacta de R. A. Fisher.
Prueba de Mc Nemar.
Prueba Q de Cochran.

Anlisis de los residuos estandarizados.
Medidas de asociacin para escalas nominales
y ordinales.
Prueba de Chi cuadrado
En el contraste de independencia de variables
aleatorias cualitativas, determina si dos
variables cualitativas estn o no asociadas.

Si al final del estudio concluimos que las
variables no estn relacionadas podemos
decir con un determinado nivel de confianza,
previamente fijado, que ambas son
independientes.
La prueba Chi cuadrado
Para su cmputo es necesario calcular
las frecuencias esperadas (aquellas que
deberan haberse observado si la
hiptesis de independencia fuese
cierta), y compararlas con las
frecuencias observadas en la realidad.
Tabla Filas por Columnas
( )

= =

=
r
i
k
j
ij
ij ij
E
E O
1 1
2
2
_
Explicacin

Ov
denota a las frecuencias observadas. Es el nmero de
casos observados clasificados en la fila i de la columna
j.

Ev
denota a las frecuencias esperadas o tericas. Es el
nmero de casos esperados correspondientes a cada
fila y columna. Se puede definir como aquella
frecuencia que se observara si ambas variables fuesen
independientes.

ij
O
ij
E
Estadstico Chi cuadrado
Mide la diferencia entre el valor que debiera
resultar si las dos variables fuesen
independientes y el que se ha observdo en la
realidad. Cuanto mayor sea esa diferencia (y
por lo tanto, el valor de Chi cuadrado), mayor
ser la relacin entre ambas variables

El hecho de que las diferencias entre los
valores observados y esperados estn
elevadas al cuadrado convierte cualquier
diferencia en positiva.
Test Chi cuadrado
Test no dirigido (test de planteamiento
bilateral) que nos indica si existe o no
relacin entre dos factores pero no en qu
sentido se produce tal asociacin.

Para obtener los valores esperados (Ev),
stos se calculan a travs del producto de los
totales marginales dividido por el nmero
total de casos (n).
Tabla 1
( ) ( )
n
c a b a
E
+ +
=
11
( ) ( )
n
c a d c
E
+ +
=
21
( ) ( )
n
d b b a
E
+ +
=
12
( ) ( )
n
d b d c
E
+ +
=
22
Tabla 2
5 , 18
2000
250 148
11
=

= E
5 , 129
2000
1750 148
21
=

= E
5 , 231
2000
250 1852
12
=

= E
5 , 1620
2000
1750 1852
22
=

= E
Tabla 3
RNBP
Gestante S No Total
Fumadora 43
(18,5)
207
(231,5)
250
No
fumadora
105
(129,5)
1645
(1620,5)
1750
Total 148 1852 2000
Valor de Chi cuadrado
( ) ( ) ( ) ( )
04 , 40
5 , 1620
5 , 1620 1645
5 , 129
5 , 129 105
5 , 231
5 , 231 207
5 , 18
5 , 18 43
2 2 2 2
2
=

= _
Contraste de hiptesis
Ho: No hay asociacin entra las
variables (el bajo peso en el nio y el
hecho de fumar durante la gestacin
son independientes, no estn
asociados).
Ha: S hay asociacin entre las variables
(el bajo peso y el fumar durante la
gestacin estn asociados).
Hiptesis nula
Los valores cumplen una distribucin Ji
cuadrado, que depende de un parmetro
llamado grado de libertad: igual al producto
del nmero de filas - 1 x el nmero de
columnas - 1. En las variables dicotmicas los
grados de libertad son 1.
Si es cierta, el valor dentro del rango de
probabilidad segn la distribucin ji cuadrado.
El valor p es la probabilidad de obtener un
valor ms extremo que el que proporciona el
test o la probabilidad de obtener los datos
observados si fuese cierta la hiptesis de
independencia.
Grfico de la Tabla 4
Tabla 4
Probabilidad de un valor superior

Grados de
libertad

0,1

0,05

0,02
5

0,01

0,00
5

1

2,71

3,84

5,02

6,63

7,88

2

4,61

5,99

7,38

9,21

10,6
0

Valor crtico
En la Tabla 4 se determinan los grados de
libertad (en la primera columna) y el valor de
(en la primera fila).

El nmero que determina su interseccin es
el valor crtico correspondiente.

Si el Chi cuadrado que se obtiene toma un
valor mayor se dir que la diferencia es
significativa.
Simplificacin de Chi cuadrado
( )
( )( )( )( ) d b c a d c b a
bc ad n
+ + + +

=
2
2
_
Correccin de Yates
( )( )( )( ) d b c a d c b a
n
bc ad n
Y
+ + + +
|
.
|

\
|

=
2
2
2
_
T de Gosset Student
Sirve para estudiar la muestra
normal poco numerosa o muestra
de Gosset-Student (a diferencia
de la muestra normal numerosa o
muestra de Gauss).
Historia
William Sealy Gosset (Canterbury,
11/VI/1876-Beaconsfield, 16/10/1937)
ms conocido por su sobrenombre
literario Student, fue un matemtico,
estadstico y qumico ingls graduado
en Oxford que describi en Dublin en
1908 las tablas de la distribucin t de
Student segn la frmula z=t/v(n-1).
William Sealy Gosset
Problema
Se administr un hipntico a 5
pacientes. La cantidad de horas
dormidas fueron: 8 horas, 6 horas, 8
horas, 6 horas y 10 horas. Total
(sumatoria de horas) = 38 horas. La
media de horas dormidas fue por lo
tanto: 38 % 5 = 7,6 horas. Se pregunta
si esta media es significativa.
Solucin
El desvo estndar es la raz cuadrada del
cociente entre la sumatoria del cuadrado de
la resta entre cada valor y la media sobre el
nmero de casos menos uno.
(8-7,6)+(6-7,6)+(8-7,6)+(6-7,6)+(10-7,6)
0,4-1,6+0,4-1,6+2,4
0,16+2,56+0,16+2,56+5,76 = 11,20
5-1 = 4
11,20 % 4 = 2,8
Raz cuadrada de 2,8 = 1,67
Error estndar
Es la raz cuadrada del cociente entre la
sumatoria del cuadrado de la resta entre cada
valor y la media sobre el producto del
nmero de casos por la resta del nmero de
casos menos uno.
11,20
5 (5-1) = 20
11,20 % 20 = 0,74
Tv = 4 ; 2 P = 0,05 = 2,776
2,776 x 0,74 = 2.05
Error
La media (7,6) es muy superior a Tv x Sm v
(2,05), por lo tanto es significativa.
Cul es la probabilidad de error de esta
afirmacin?
Error relativo=media%error estndar= 7,6%
0,74= 10,...
Este error estara fuera de la tabla, a la
derecha del ltimo valor de la horizontal v=4;
por lo tanto la probabilidad de error de la
afirmacin la media es significativa es
inferior a uno por mil.
Distribucin T de Student
1 o

r

0.75

0.80

0.85

0.90

0.95

0.975

0.99

0.995

1

1.000

1.376

1.963

3.078

6.314

12.706

31.821

63.657

2

0.816

1.061

1.386

1.886

2.920

4.303

6.965

9.925

3

0.765

0.978

1.250

1.638

2.353

3.182

4.541

5.841

4

0.741

0.941

1.190

1.533

2.132

2.776

3.747

4.604

5

0.727

0.920

1.156

1.476

2.015

2.571

3.365

4.032

Curva
Funcin de densidad de
probabilidad



Riesgo relativo
Mal control Buen control
Infarto 10 7 17
No Infarto 250 461 711
260 468 728
Solucin
Chi cuadrado = 3,1
Nivel de probabilidad = 0,08
Riesgo (mal control) = 10%260=0,04
Riesgo (buen control)= 7%468 = 0,015
Riesgo relativo (RR)= 0,04%0,015=2,6
Odds: cuntas veces sucede contra las que
no sucede. Mal = 10 % 250 = 0,04 = ocurre
1 cada 25 veces que no. Bien = 7%461 =
0,015.
Odds Ratio: 0,04 % 0,015 = 2,6
(Oportunidad relativa o razn de ventaja)
Otros estudios
Validez. Reproductividad. Sensibilidad.
Validez: Sensibilidad. Especificidad.
Sensibilidad: VP/VP+FN
Especificidad: VN/VN+FP
Seguridad: Valor predictivo + y -.
Valor predictivo +: VP/VP+FP
Valor predictivo -: VN/VN+FN
Razn de probabilidad +: Sensibilidad/1-
Especificidad
Razn de probabilidad -: 1-
Sensibilidad/Especificidad
Otros
Riesgo de incumplimiento = 20% : 15%
= 1,3
Reduccin absoluta del riesgo = 5
Nmero de pacientes necesarios a
tratar = 1 / reduccin absoluta del
riesgo.
1 / 5 = 0,2 (20 de 100 pacientes)

Das könnte Ihnen auch gefallen