Beruflich Dokumente
Kultur Dokumente
= =
=
r
i
k
j
ij
ij ij
E
E O
1 1
2
2
_
Explicacin
Ov
denota a las frecuencias observadas. Es el nmero de
casos observados clasificados en la fila i de la columna
j.
Ev
denota a las frecuencias esperadas o tericas. Es el
nmero de casos esperados correspondientes a cada
fila y columna. Se puede definir como aquella
frecuencia que se observara si ambas variables fuesen
independientes.
ij
O
ij
E
Estadstico Chi cuadrado
Mide la diferencia entre el valor que debiera
resultar si las dos variables fuesen
independientes y el que se ha observdo en la
realidad. Cuanto mayor sea esa diferencia (y
por lo tanto, el valor de Chi cuadrado), mayor
ser la relacin entre ambas variables
El hecho de que las diferencias entre los
valores observados y esperados estn
elevadas al cuadrado convierte cualquier
diferencia en positiva.
Test Chi cuadrado
Test no dirigido (test de planteamiento
bilateral) que nos indica si existe o no
relacin entre dos factores pero no en qu
sentido se produce tal asociacin.
Para obtener los valores esperados (Ev),
stos se calculan a travs del producto de los
totales marginales dividido por el nmero
total de casos (n).
Tabla 1
( ) ( )
n
c a b a
E
+ +
=
11
( ) ( )
n
c a d c
E
+ +
=
21
( ) ( )
n
d b b a
E
+ +
=
12
( ) ( )
n
d b d c
E
+ +
=
22
Tabla 2
5 , 18
2000
250 148
11
=
= E
5 , 129
2000
1750 148
21
=
= E
5 , 231
2000
250 1852
12
=
= E
5 , 1620
2000
1750 1852
22
=
= E
Tabla 3
RNBP
Gestante S No Total
Fumadora 43
(18,5)
207
(231,5)
250
No
fumadora
105
(129,5)
1645
(1620,5)
1750
Total 148 1852 2000
Valor de Chi cuadrado
( ) ( ) ( ) ( )
04 , 40
5 , 1620
5 , 1620 1645
5 , 129
5 , 129 105
5 , 231
5 , 231 207
5 , 18
5 , 18 43
2 2 2 2
2
=
= _
Contraste de hiptesis
Ho: No hay asociacin entra las
variables (el bajo peso en el nio y el
hecho de fumar durante la gestacin
son independientes, no estn
asociados).
Ha: S hay asociacin entre las variables
(el bajo peso y el fumar durante la
gestacin estn asociados).
Hiptesis nula
Los valores cumplen una distribucin Ji
cuadrado, que depende de un parmetro
llamado grado de libertad: igual al producto
del nmero de filas - 1 x el nmero de
columnas - 1. En las variables dicotmicas los
grados de libertad son 1.
Si es cierta, el valor dentro del rango de
probabilidad segn la distribucin ji cuadrado.
El valor p es la probabilidad de obtener un
valor ms extremo que el que proporciona el
test o la probabilidad de obtener los datos
observados si fuese cierta la hiptesis de
independencia.
Grfico de la Tabla 4
Tabla 4
Probabilidad de un valor superior
Grados de
libertad
0,1
0,05
0,02
5
0,01
0,00
5
1
2,71
3,84
5,02
6,63
7,88
2
4,61
5,99
7,38
9,21
10,6
0
Valor crtico
En la Tabla 4 se determinan los grados de
libertad (en la primera columna) y el valor de
(en la primera fila).
El nmero que determina su interseccin es
el valor crtico correspondiente.
Si el Chi cuadrado que se obtiene toma un
valor mayor se dir que la diferencia es
significativa.
Simplificacin de Chi cuadrado
( )
( )( )( )( ) d b c a d c b a
bc ad n
+ + + +
=
2
2
_
Correccin de Yates
( )( )( )( ) d b c a d c b a
n
bc ad n
Y
+ + + +
|
.
|
\
|
=
2
2
2
_
T de Gosset Student
Sirve para estudiar la muestra
normal poco numerosa o muestra
de Gosset-Student (a diferencia
de la muestra normal numerosa o
muestra de Gauss).
Historia
William Sealy Gosset (Canterbury,
11/VI/1876-Beaconsfield, 16/10/1937)
ms conocido por su sobrenombre
literario Student, fue un matemtico,
estadstico y qumico ingls graduado
en Oxford que describi en Dublin en
1908 las tablas de la distribucin t de
Student segn la frmula z=t/v(n-1).
William Sealy Gosset
Problema
Se administr un hipntico a 5
pacientes. La cantidad de horas
dormidas fueron: 8 horas, 6 horas, 8
horas, 6 horas y 10 horas. Total
(sumatoria de horas) = 38 horas. La
media de horas dormidas fue por lo
tanto: 38 % 5 = 7,6 horas. Se pregunta
si esta media es significativa.
Solucin
El desvo estndar es la raz cuadrada del
cociente entre la sumatoria del cuadrado de
la resta entre cada valor y la media sobre el
nmero de casos menos uno.
(8-7,6)+(6-7,6)+(8-7,6)+(6-7,6)+(10-7,6)
0,4-1,6+0,4-1,6+2,4
0,16+2,56+0,16+2,56+5,76 = 11,20
5-1 = 4
11,20 % 4 = 2,8
Raz cuadrada de 2,8 = 1,67
Error estndar
Es la raz cuadrada del cociente entre la
sumatoria del cuadrado de la resta entre cada
valor y la media sobre el producto del
nmero de casos por la resta del nmero de
casos menos uno.
11,20
5 (5-1) = 20
11,20 % 20 = 0,74
Tv = 4 ; 2 P = 0,05 = 2,776
2,776 x 0,74 = 2.05
Error
La media (7,6) es muy superior a Tv x Sm v
(2,05), por lo tanto es significativa.
Cul es la probabilidad de error de esta
afirmacin?
Error relativo=media%error estndar= 7,6%
0,74= 10,...
Este error estara fuera de la tabla, a la
derecha del ltimo valor de la horizontal v=4;
por lo tanto la probabilidad de error de la
afirmacin la media es significativa es
inferior a uno por mil.
Distribucin T de Student
1 o
r
0.75
0.80
0.85
0.90
0.95
0.975
0.99
0.995
1
1.000
1.376
1.963
3.078
6.314
12.706
31.821
63.657
2
0.816
1.061
1.386
1.886
2.920
4.303
6.965
9.925
3
0.765
0.978
1.250
1.638
2.353
3.182
4.541
5.841
4
0.741
0.941
1.190
1.533
2.132
2.776
3.747
4.604
5
0.727
0.920
1.156
1.476
2.015
2.571
3.365
4.032
Curva
Funcin de densidad de
probabilidad
Riesgo relativo
Mal control Buen control
Infarto 10 7 17
No Infarto 250 461 711
260 468 728
Solucin
Chi cuadrado = 3,1
Nivel de probabilidad = 0,08
Riesgo (mal control) = 10%260=0,04
Riesgo (buen control)= 7%468 = 0,015
Riesgo relativo (RR)= 0,04%0,015=2,6
Odds: cuntas veces sucede contra las que
no sucede. Mal = 10 % 250 = 0,04 = ocurre
1 cada 25 veces que no. Bien = 7%461 =
0,015.
Odds Ratio: 0,04 % 0,015 = 2,6
(Oportunidad relativa o razn de ventaja)
Otros estudios
Validez. Reproductividad. Sensibilidad.
Validez: Sensibilidad. Especificidad.
Sensibilidad: VP/VP+FN
Especificidad: VN/VN+FP
Seguridad: Valor predictivo + y -.
Valor predictivo +: VP/VP+FP
Valor predictivo -: VN/VN+FN
Razn de probabilidad +: Sensibilidad/1-
Especificidad
Razn de probabilidad -: 1-
Sensibilidad/Especificidad
Otros
Riesgo de incumplimiento = 20% : 15%
= 1,3
Reduccin absoluta del riesgo = 5
Nmero de pacientes necesarios a
tratar = 1 / reduccin absoluta del
riesgo.
1 / 5 = 0,2 (20 de 100 pacientes)