Sie sind auf Seite 1von 65

1

Estadstica para los no


estadsticos

Epidemiologa Clnica. Inferencia causal.


Error aleatorio.
Deriva del hecho de tomar slo una muestra de la
poblacin terica sobre la que queremos sacar
conclusiones.
Su importancia puede disminuirse aumentando el
tamao de la muestra.
Su importancia puede cuantificarse mediante test de
hiptesis (probabilidad de error al rechazar la
hiptesis nula de igualdad) y/o el clculo de los
intervalos de confianza (valor del estimador muestral
con rango poblacional).
La ausencia de error aleatorio se denomina precisin.

Error aleatorio. Introduccin a favor.

Y as como el analfabetismo cierra a quien lo


padece casi todas las puertas de la cultura, el
anaritmetismo impide el acceso a esa puerta
maestra del conocimiento objetivo que es la ciencia.
Por supuesto, el discurso cientfico tambin utiliza el
lenguaje verbal, incluso ms que el numrico; pero
es en la cuantificacin y en la correlacin
matemtica de las magnitudes donde la ciencia se
realiza como tal, donde se vuelve concreta, precisa y
eficaz.

Carlo
CarloFrabetti.
Frabetti.Anaritmetismo.
Anaritmetismo.El
ElPais,
Pais,mircoles
mircoles24
24de
deenero
enerode
de1996.
1996.

Error aleatorio. Introduccin en contra.


La estadstica es una disciplina que debe una gran parte
de su configuracin actual a las matemticas. Las
matemticas, por otro lado, son un conjunto de
conocimientos tericos, abstractos, cuyos creadores, la
mayora de la veces, no pretendan resolver problemas
prcticos, sino generar abstracciones a partir de los
nmeros, deducir otros nuevos conocimientos tericos,
derivables de abstracciones previas o resolver problemas,
incoherencias o curiosidades generadas, como efectos
secundarios, en la creacin de teoras matemticas.
Considerar los conocimientos matemticos como el
resultado de mentes creadoras que jugaron con smbolos
o aceptaron retos de otros jugadores similares, no es
alejarse excesivamente de la historia de esta ciencia.
Manzano
ManzanoV.
V.Inferencia
Inferenciaestadstica.
estadstica.Aplicaciones
Aplicacionescon
conSPSS/PC+.
SPSS/PC+.Madrid:
Madrid:RA-MA,
RA-MA,1995;
1995;98.
98.

Estadstica. Proceso de medicin.


La Estadstica es la disciplina encargada del tratamiento de
los datos numricos derivados de los grupos de
indivduos.
La Medicin es el proceso por el que se representan las
propiedades de los fenmenos investigados mediante
nmeros o nombres.

Unidades de anlisis son las entidades objeto de nuestro


estudio (individuos, grupos, ciudades, hospitales, etc).
Las unidades de anlisis tienen caractersticas, que
varian (variables) y son objeto de comparacin entre ellas.

Estadstica. Proceso de medicin.


En cada una de estas caractersticas diferentes se incluyen
dimensiones o modalidades (niveles, categorias,
atributos, valores).
Entre las modalidades hay relaciones, en ocasiones
escasas y simples y otras veces mltiples y complejas.
Las Escalas de Medida de estas modalidades establecen
dos tipos de variables: Cualitativas y Cuantitativas.

Estadstica. Escalas de medida.


Tipos de
Escalas
Nominal

Ordinal

Variables

Relacin entre valores

Ejemplos

Nominales o
Categricas (Di o
Policotmicas
Ordinales

Igualdad/desigualdad

Raza, sexo, religin, estado


civil, profesin

Igualdad/desigualdad
Orden

Nivel socioeconmico, grado


de mejora o empeoramiento,
opiniones

Igualdad/desigualdad
Orden y
Unidad de medida emprica
Igualdad/desigualdad
Orden y unidad emprica de
medida, con cero absoluto

Grados centgrados, tiempo o


longitud sin origen
determinado
Tensin arterial, edad, peso,
grados Kelvin.

De
Cuantitivativas
Intervalo contnuas o
discretas
De Razn Cuantitativas
contnuas o
Discretas

Las variables de las escalas nominal y ordinal son cualitativas.

Estadstica. Diseo de un cuestionario y transferencia a


soporte en disco. Algunos puntos destacables.
Suele tenerse la tentacin de recoger ms informacin de la que
realmente se necesita, en previsin de que pueda usarse en el
futuro. Recuerda, si slo tienes que rellenar 20 items/indivduo,
les dedicars ms atencin que si rellenas 50.
Define bien las variables.
Para rellenar la base de datos estamos precisamente en este
curso; y casi, casi, slo hacemos el curso para sto.
Guarda alguna copia de seguridad. Si no lo haces, te acordars
de esta advertencia!.
En general, la matriz de datos muestra la informacin en filas
(pacientes) y columnas (variables).

Estadstica descriptiva.
Resume los valores que toman las variables en las
unidades de anlisis.
Atencin al examen de los datos, previo a la
realizacin de tcnicas ms complejas de
confirmacin de hiptesis.
Importancia central de la representacin grfica.
Resistencia de los estadsticos a valores extremos.
Distincin entre ajuste y resduo.
Apertura a la transformacin de variables para
conseguir modelos ms ajustados.

10

Estadstica descriptiva y Estadstica inferencial.


Estadstica descriptiva.
Resumen de los datos para condensar la informacin.

Estadstica inferencial.
Inferir los valores de la poblacin (parmetros) basndonos
en el conocimiento de los valores de la muestra
(estadsticos).

11

Estadstica descriptiva.
Resumen de los valores que toman las variables en
las unidades de anlisis:
Variables cualitativas:
Tablas de distribucin de frecuencias absolutas
o relativas.
Grficas (diagramas de barras y tartas).
Variables cuantitativas:
Medidas de tendencia central, de variabilidad, de
posicin, de simetra y de apuntamiento.
Grficas (histogramas, polgonos de
frecuencias, arbol y hoja, caja y bigotes, nube de
puntos, etc.).

12

Estadstica descriptiva. Variables cualitativas


Tablas de distribucin de frecuencias absolutas o
relativas.
Se disponen en filas los valores de la variable y en columnas
las frecuencias absolutas, relativas y acumuladas.
Las variables cuantitativas pueden agrupar los valores en
intervalos (categorizacin) y representarse tambin en una
tabla de distribucin de frecuencias o categorizarse.

13

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas:
Medidas de tendencia central.

x
=
n

Media aritmtica:
i =1 n
(Distribuciones normales)
Mediana: Valor que deja 50% de los casos a
ambos lados. Igual que el P50. (distribuciones
que no son normales).
Moda: Valor ms frecuente.

14

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas:
Medidas de de variabilidad (dispersin).
Rango: Distancia entre mayor y menor.
Percentiles. Valor bajo el que se encuentra una
cierta proporcin (cuartiles, deciles, n-tiles).
Recorrido intercuartlico: P25 a P75.
n

Varianza:

xi x
1

n 1
Desviacin estandar:

xi x
1

n 1

s
Coeficiente de variacin: CV ( x ) = 100 %
x
Q1 Q3
Coeficiente Variacin intercuartlico: CVI =

Q1 + Q3

15

Ajuste de un modelo
Media: Modelo para resumir nuestros datos.
Varianza: Error promediado para evaluar el ajuste del
modelo a los valores de los sujetos.
Como Desviacin Estandar se expresa en las mismas
unidades que la media.

= xi
i =1 n
n

1 x i x
n 1

(xi x )
n

n 1

16

Estadstica descriptiva. Variables cualitativas


Grficas (diagramas de barras y tartas o sectores).

Utilidades:
Presentar la informacin.
Evaluar la estructura de los datos.

Tipos:
Comparaciones de dos o ms nmeros (diagrama de barras o
pictogramas).
Distribucin de objetos individuales o medidas en diferentes
categoras (diagrama de sectores).
Mostrar el cambio en alguna cantidad con el paso del tiempo
(diagrama de lneas)
Mostrar la relacin entre dos mediciones (nube de puntos).

17

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas:
Grficas (histogramas y polgonos de
frecuencias).
Intervalos de clase, marca de clase, rango del
intervalo. Pedir 22 intervalos para este fichero.

18

Satisfaccin del usuario en puntuacin

Vlidos

Porcentaje
,3

Porcentaje
vlido
,3

Porcentaje
acumulado
,3

10,00
15,00

2
3

,5
,8

,5
,8

,8
1,5

20,00
25,00

4
5

1,0
1,3

1,0
1,3

2,5
3,8

30,00
35,00

6
7

1,5
1,8

1,5
1,8

5,3
7,0

40,00
45,00

8
9

2,0
2,3

2,0
2,3

9,0
11,3

50,00
55,00

10
11

2,5
2,8

2,5
2,8

13,8
16,5

60,00
65,00

12
13

3,0
3,3

3,0
3,3

19,5
22,8

70,00
75,00

14
15

3,5
3,8

3,5
3,8

26,3
30,0

80,00
85,00

16
17

4,0
4,3

4,0
4,3

34,0
38,3

90,00
95,00

18
19

4,5
4,8

4,5
4,8

42,8
47,5

100,00
105,00

20
19
18

5,0
4,8
4,5

5,0
4,8
4,5

52,5
57,3
61,8

17
16

4,3
4,0

4,3
4,0

66,0
70,0

15
14

3,8
3,5

3,8
3,5

73,8
77,3

13
12

3,3
3,0

3,3
3,0

80,5
83,5

11
10

2,8
2,5

2,8
2,5

86,3
88,8

9
8

2,3
2,0

2,3
2,0

91,0
93,0

165,00
170,00

7
6

1,8
1,5

1,8
1,5

94,8
96,3

175,00
180,00

5
4

1,3
1,0

1,3
1,0

97,5
98,5

185,00
190,00

3
2

,8
,5

,8
,5

99,3
99,8

195,00
Total

1
400

,3
100,0

,3
100,0

100,0

5,00

110,00
115,00
120,00
125,00
130,00
135,00
140,00
145,00
150,00
155,00
160,00

Estadstica descriptiva.
Variables cuantitativas

La distribucin
Normal
50

40

30

20

10
Std. Dev = 40,82
Mean = 100,0
N = 400,00

0
5,
20 ,0
5
19 ,0
5
18 ,0
5
17 ,0
5
16 ,0
5
15 ,0
5
14 ,0
5
13 ,0
5
12 ,0
5
11 ,0
5
10 0
,
95 0
,
85 0
,
75 0
,
65 0
,
55 0
,
45 0
,
35 0
,
25 0
,
15
0
5,
,0
-5

Frecuencia
1

VAR00001

50

La distribucin normal
Media, Mediana y Moda,
coinciden
Simtrica
Unimodal
Dos colas

40

Frecuencia absoluta

30

20

10

Probabilidades de los
valores de la variable en
los intervalos de clase.
68% (xsd)
95% (x 2sd)
99% (x 2.6sd)

Std. Dev = 40,82


Mean = 100,0
N = 400,00

19

0
5,
20 ,0
5
19 ,0
5
18 ,0
5
17 ,0
5
16 ,0
5
15 ,0
5
14 ,0
5
13 ,0
5
12 ,0
5
11 ,0
5
10 0
,
95 0
,
85 0
,
75 0
,
65 0
,
55 0
,
45 0
,
35 0
,
25 0
,
15
0
5,
,0
-5

Estadstica descriptiva. Estandarizacin de los


valores de una variable con distribucin normal.
80

x
x
Z=
i

60
100

80
40

N ( x, s 2 ) N (0,1)

60
20

Std. Dev = 40,82

40

Mean = 100,0
N = 400,00

0
20

0,0

40,0
20,0

80,0
60,0

100,0

VAR00001
-2,50

-1,50
-2,00

-,50
-1,00

Zscore(VAR00001)

120,0

68%
95%
99%
0,00

160,0
140,0

200,0
180,0

Std. Dev = 1,00


Mean = 0,00
N = 400,00

,50

1,50
1,00

2,50
2,00

20

21

Estadstica descriptiva. Trasformacin de variables


Tipo de
transformacin

Frmula

Cambios en forma de
distribucin

Ejemplo

xi = a + bxi

Ausentes

Tipificacin

xi = xiq
xi = log x
xi = xiq

Reduccin de asimetra.
Si q<1 a la izq.
si q> 1 a la dcha.
Cambio de curtosis

Aritmtica
Lineal
Potencia

Logaritmos y
races plegadas
Lgica

Ms representativos los
valores centrales.

Estadstica inferencial.
Muestreo
aleatorio

Estadstica Inferencial: Estimacin de un parmetro


poblacional y pertenencia de dos muestras a la misma
poblacin.
Intervalo de confianza y Test de Hiptesis

22

23

Estadstica inferencial.
Muestreo: Permite aplicar la estadstica inferencial.
Estadstica Inferencial, permite hacer inferencias sobre
los valores poblacionales:

Estima los parmetros poblacionales conociendo


los estadsticos muestrales.
Evalua si dos o ms muestras pertenecen a la
misma poblacin.

Mtodos de inferencia:
Intervalo de confianza.
Test de Hiptesis.

24

Intervalo de confianza

Teorema del Lmite Central.


Inferencia de un parmetro poblacional a partir
de un estimador muestral
Descriptive Statistics

N
Age
(years)
Valid N
(listwise)

Mean
236

57,07

Descriptive Statistics
Std.
Deviation

N
Age
(years)
Valid N
(listwise)

14,10

236

Descriptive Statistics

N
Age
(years)
Valid N
(listwise)

Mean
238

56,46

Std.
Deviation

Descriptive Statistics

13,26

N
Age
(years)
Valid N
(listwise)

Descriptive Statistics

Age
(years)
Valid N
(listwise)

Mean
243

56,86

1207

Mean
56,39

Std.
Deviation

Age
(years)
Valid N
(listwise)

258
258

56,94

55,00

Std.
Deviation
13,35

236

13,33

Age
(years)
Valid N
(listwise)

1207

13,30

Mean
250

55,83

Std.
Deviation
13,10

250

Descriptive Statistics

N
Age
(years)
Valid N
(listwise)

Descriptive Statistics

Mean

236

Std.
Deviation

243

Mean

Descriptive Statistics

238

25

Mean
264

55,94

Std.
Deviation
13,12

264

Descriptive Statistics
Std.
Deviation
13,63

N
Age
(years)
Valid N
(listwise)

Mean
219
219

54,93

Std.
Deviation
12,88

Teorema Central del Lmite.


Inferencia de un parmetro poblacional a partir de
un estimador muestral
Ki
n,x,s
Ki,x,s

Ki

N, ,
Ki

Ki
Ki,x,s

Ki

26

N = tamao poblacional.
n = tamao muestral.
k = nmero de muestras de tamao n.

N
k = =
n

N!
n! (N n)!

Sea cual sea la distribucin de una variable aleatoria poblacional, con media y varianza
2 , la distribucin de las medias, x, de muestras de tamao n es, aproximadamente, una
normal, con media y varianza 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto
ms aproximadamente cuanto mayor sea el tamao de n (por tanto, a mayor n, mayor
simetra de la distribucin).

(*) La raiz cuadrada de este valor es el Error estandar del estimador.

27

Teorema Central del Lmite.


Conociendo la media de nuestra muestra podemos
inferir la media de la poblacin de donde se obtuvo.

xi N , 2 n

-1.96*/n

1.96*/n

-1.96

1.96

Distribucin emprica

Tipificacin

xi
N (0,1)
n

Distribucin estandarizada

28

Clculo del Intervalo de Confianza de un estimador


x
P( 1.96
+ 1.96) = 0.95

P(1.96 x +1.96 ) = 0.95


n
n

1
96
1
96
P( x .
x+ .
) = 0.95
n
n
Parmetro () Estimador () 1.96 x (error estandar del estimador)

29

Error estandar y Error asociado a la estimacin o


error de muestreo.
Parmetro () Estimador () 1.96 x (error estandar del estimador)

El producto 1.96 n

se denomina
ERROR ASOCIADO A LA ESTIMACIN
ERROR DE MUESTREO.

El valor
se denomina ERROR
ESTANDAR de la media (del estimador en
general), es decir la desviacin estandar de
las medias muestrales (recuerda que mide
la bondad de ajuste).

30

Utilidad del Intervalo de Confianza.


Porqu utilizar un nico punto de corte cuando la
eleccin de ese punto es arbitraria?.
Porqu reducir la cuestin de si un tratamiento es
efectivo a un valor dicotmico (si/no) cuando sera
ms apropiado verlo como un continuum?. Guyatt G,
Jaenschke R, Heddle N, et al. Basic statistics for clinicians. 1.
Hypothesis testing. Can Med Assoc J 1995;152:27-32.

El IC proporciona un recorrido de posibilidades para


el valor poblacional en la escala de magnitud de la
variable medida, no una dicotoma arbitraria basada
tan solo en la significacin estadstica.

31

Intervalo de confianza para medias y proporciones


La frmula del IC para un estimador de una media es:

P( x t
x+t
) = 1
1 2 n
1 2 n
De manera similar, la frmula del IC para una
proporcin es:

P( p t
1 2

p q
p p + t
1 2
n

p q
) = 1
n

32

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.


Ho frecuencia de cncer los aos de vida son los
mismos en los sujetos fumadores que en los no
fumadores.
H0 p(A) = p(B) p(A) - p(B) = 0

H0 x(A) = x(B) x(A)- x(B) = 0

H 0 p(A) = p(B)

p(A)
=1
p(B)

La decisin del investigador estar basada en los datos


obtenidos en su muestra (informacin emprica).
Si la probabilidad (que vamos a buscar en la tabla con
la distribucin correspondiente al final del libro:
nmero de casos y grados de libertad) de obtener unos
resultados tan extremos o ms que los encontrados en
nuestro estudio es demasiado pequea, nos
atreveremos a rechazar H0.

Un ejemplo para entender el intervalo de confianza

33

34

Intervalo de confianza. Algunas ideas sueltas.


La magnitud del estimador indica la importancia del
efecto y la amplitud del IC la cantidad de variabilidad
(incertidumbre) inherente a la estimacin (muestreo).
Cualquier estadstico tiene su error estandar y por
tanto su IC.
Si el IC no incluye el valor nulo ( para diferencias, 0, y
para cocientes, 1), la p< 0,05 por definicin.
Cuanto menor sea la muestra, los resultados estarn
ms expuestos a no indicar la realidad de la poblacin
sobre la que se desean inferir resultados, debido a la
gran variabilidad del muestreo y al azar.

35

qu sucede si queremos tener ms o menos confianza


(99%, 90%) en que el parmetro poblacional se encuentre
en nuestro intervalo?
Si aumentamos o disminuimos el tamao muestral?

1
96
1
96
P( x .
x+ .
) = 0.95
n
n

Tabla de valores del estadstico Z para y


Nivel
Estadstico Z
0.90 bilateral
1.64
0.95 unilateral
1.64
0.95 bilateral
1.96
0.99 bilateral
2.57
0.999 bilateral
3.29
0.20
0.84
0.10
1.28
0.05
1.64
0.01
2.32

36

Intervalo de Confianza. Cambios con el nivel de confianza

Intervalo de Confianza. Cambios con el nivel de confianza y


el tamao muestral.

37

Intervalos de Confianza de los estimadores(*)

38

Decidir lo que constituye una diferencia clnicamente importante es difcil


e inevitablemente arbitrario. Las caractersticas del resultado que se
evala (prevenir una muerte, ictus grave, TIA), el riesgo basal, los efectos
adversos, los inconvenientes y el costo, todo influye.

A
B
C

10
Diferencia de TA entre
Diabticos y normales
o entre no tratados y
tratados con un
frmaco hipotensor.

D
E
F
G
(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuanta y
direccin) y no tanto en saber la probabilidad de que hallamos llegado a un
resultado falso positivo (si podemos o no rechazar la hiptesis nula).

39

Clculo del tamao


muestral

40

Clculo del tamao muestral. Estimacin de una media

P( 1.96
x +1.96 ) = 0.95
n
n

P( x 1.96
) = 0.95
n
La distancia entre x y no puede ser mayor que el mximo error
asociado a la estimacin posible para tener una seguridad del
95% de haber elegido una de las k muestras de la poblacin que
nos interesa.

x 1.96
n

El producto 1.96

x <

n se denomina ERROR ASOCIADO A LA ESTIMACIN ERROR DE MUESTREO.

El valor

n se denomina ERROR ESTANDAR de la media (del estimador en general).

41

Clculo del tamao muestral. Estimacin de una media

x 1.96
n

x <

= 1.96
n

n = (1.96)

2
2

Tomando muestras de, como mnimo, el tamao n, podemos asegurar


que en el (1-
)%, usualmente 95%, de ellas obtendremos medias que no
diferirn de en ms de la cantidad prefijada, .

42

Clculo del tamao muestral. Estimacin de una media


y una proporcin. Factores a considerar

n = (1.96)

2 pq
n = (1 . 96 ) 2

En consecuencia, el tamao muestral depender de las


pretensiones del investigador (lo que indica la subjetividad
inherente), ya que ste establecer las pautas de su estudio.

43

Test de hiptesis

44

Test de Hiptesis.
Test de hiptesis son procedimientos estadsticos que
nos permiten decidir acerca de una hiptesis
establecida sobre el valor de uno o ms parmetros
desconocidos (relaciones entre variables); es decir,
Establecer el grado de consistencia entre la hiptesis
establecida y la experiencia realizada.
El objetivo de los test de hiptesis consiste en ver si se
puede rechazar la hiptesis de independencia entre
dos variables (por ejemplo fumar y cncer de pulmn).
La hiptesis formulada de esta manera se llama
Hiptesis nula, Ho.

45

Test de Hiptesis. Evaluacin de una muestra.


Variable resultado (dependiente):
Frecuencia de cncer de pulmn.
Media de aos de supervivencia.
El objetivo ser saber si los valores de las variables
obtenidas en nuestra muestra son posibles en la
poblacin de referencia.

46

Test de Hiptesis. Evaluacin de dos muestras.


Variable predictora (independiente, factor):
Muestra A: Grupo de no fumadores.
Muestra B: Grupo de fumadores.
Variable resultado (dependiente):
Frecuencia de cncer de pulmn.
Mediana de aos de supervivencia.

47

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.


Ho frecuencia de cncer los aos de vida son los
mismos en los sujetos fumadores que en los no
fumadores.
H0 p(A) = p(B) p(A) - p(B) = 0
H 0 x(A) = x(B) x(A) - x(B) = 0

p(A)
H 0 p(A) = p(B)
=1
p(B)

La decisin del investigador estar basada en los datos


obtenidos en su muestra (informacin emprica).
Si la probabilidad de obtener unos resultados tan
extremos o ms que los encontrados en nuestro
estudio es demasiado pequea, nos atreveremos a
rechazar H0.

48

Test de Hiptesis. Aqu viene la p.


Ahora bien, siempre hay alguna probabilidad de que
nos equivoquemos, porque la realidad (la poblacin
terica de donde obtuvimos nuestra muestra) nunca
estar a nuestro alcance.

DECISION INVESTIGADOR
REALIDAD No rechazar Ho
Ho verdadera Correcto
H0 falsa Error , tipo II

Rechazar Ho
Error , tipo I
Correcto (1-)

El test estadstico que aplicamos nos proporciona la


probabilidad (p) de equivocarnos al rechazar H0.
(1- ): Potencia del test.

49

Test de Hiptesis. quin calcula la p(1)?


Naturalmente, ahora lo hacen las mquinas.
Supongamos que conocemos que el verdadero valor del
colesterol de una poblacin de varones con IAM es 240 mg/dl
y la d.e. es 40 mg/dl,
cul es la probabilidad de obtener una muestra de 100
sujetos seleccionados aleatoriamente de esa poblacin con una
media de 260 mg/dl? dicho de otra manera,
cul es la probabilidad de que un grupo de 100 sujetos de
esa poblacin, muestreados al azar, tenga una media de
Colesterol de 260 mg/dl?.
Estandarizamos y obtenemos la puntuacin Z.

Zi =

( xi i )

valor observado valor poblaciona l


error estandar del estimador

N (0,1)

50

Test de Hiptesis. quin calcula la p (2)?


Naturalmente, ahora lo hacen las mquinas.

Zi =

( xi )

260 240
40 100

=5

una media de 260 mg/dl se coloca a 5 veces el error


estandar de la media poblacional de 240 mg/dl.
La probabilidad de inters ser < 0.001.
La probabilidad de que una muestra de 100 sujetos con nivel
medio de colesterol de 260 mg/dl pertenezca a la poblacin de
referencia es muy pequea; sera muy raro que esta muestra
perteneciera a la poblacin referida.
En consecuencia, nos atrevemos a rechazar la hiptesis nula de que
esta muestra de 100 sujetos pertenece a la poblacin de referencia.

51

Test de Hiptesis. Aqu viene la p.


Debe recordarse siempre que aceptar Ho no significa
que sea verdadera.
Para un tamao de muestras suficientemente grandes
siempre podremos demostrar diferencias
estadsticamente significativas.

Zi =

( xi )

valor observado valor poblaciona l


error estandar del estimador

N (0,1)

Es fundamental establecer la diferencia clnicamente


relevante ms que la estadsticamente significativa.

52

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio
Han elegido los autores el escenario de forma
correcta?
Han establecido si los grupos son comparables y
si es necesario, han realizado ajustes para las
diferencias basales?.
Qu tipo de datos han utilizado?. Han usado los
tests estadsticos apropiados?.
Si los tests estadsticos son oscuros, porqu han
decidido utilizarlos?.
Los datos han sido analizados de acuerdo al
protocolo original del estudio?.
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.

53

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio
Datos apareados, colas y sujetos extremos.
Se han realizado tests apareados con datos
apareados?.
Se ha realizado una prueba de dos colas si el
efecto de la intervencin puede ser tambin de tipo
negativo?.
Se ha tratado el problema de los sujetos extremos
con sentido comn y con los ajustes estadsticos
apropiados?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.

54

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio
Correlacin, regresin y causalidad:
Se ha distinguido correlacin de regresin y se ha calculado
e interpretado correctamente el coeficiente de correlacin?.
Se han realizado asunciones sobre la naturaleza y direccin
de la causalidad?

Probabilidad y confianza.
Se han calculado e interpretado correctamente los
valores de la p.
Se han calculado los intervalos de confianza y los
reflejan las conclusiones de los autores?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.

55

Puntos a destacar en la valoracin de los aspectos


estadsticos de un estudio
Se han expresado los resultados en trminos de la
probabilidad de dao o beneficio que puede esperarse
en un paciente individual?

Riesgo Relativo/Odds ratio.


Reduccin del Riesgo Relativo.
Reduccin del Riesgo Absoluto.
Nmero Necesario para Tratar.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.

56

Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBU VARIABLE
VARIABLE
RELACIN ENTRE TEST ESTADSTICO
CION
INDEPENDEPENDIENTE LAS MUESTRAS
DIENTE
UNIVARIANTE O BIVARIANTE
Normal
Una sola
Cuantitativa
t-student para una muestra
(Param- muestra
Cualitativa
Chi-cuadrado para una muestra
tricos)
(compara con
valor terico)
Dicotmica

Categrica

Cuantitativa

Policotmica Categrica
Cuantitativa

No relacionadas

No existe (se usa Chi-cuadrado de


Pearson)

Relacionadas

Se usa el Test de McNemar

Relacionadas

t-student muestras dependientes

No relacionadas

t-student muestras independientes

No relacionadas

No existe (se usa Chi-cuadrado de


Pearson
ANOVA de una va (ONEWAY)
ANOVA de dos vas

No relacionadas

Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBUCION VARIABLE
VARIABLE
RELACIN ENTRE
TEST ESTADSTICO
INDEPENDIENTE
DEPENDIENTE
LAS MUESTRAS
UNIVARIANTE O BIVARIANTE
No normal
Una sola muestra
Binomial
(No paramtri(compara con valor
Chi-cuadrado de Pearson
cos)
terico)
Chi-cuadrado de Mantel-Haenzsel
Kolmogorow-Smirnov
Rachas
Dicotmica

Categrica

Relacionadas

Test exacto de McNemar


Prueba de los Signos

No relacionadas

Chi-cuadrado de Pearson
Test exacto de Fisher

Relacionadas

Prueba de los signos


Prueba de los rangos con signo de Wilcoxon

No relacionadas

Mann-Whitney
W de Wilcoxon
Mediana
Z Kolmogorov-Smirnov
Rachas de Wald-Wolfowitz
Valores extremos de Moses

Categrica

No relacionadas

Prueba Q de Cochran

Cuantitativa

Relacionadas

Friedman
W de Kendall (concordancia)

No relacionadas

Kruskal-Wallis
Mediana K variables
ANOVA de dos vas por rangos

Cuantitativas

Policotmica

57

tras).
DISTRIBUCION

VARIABLE
INDEPENDIENTE
UNIVARIANTE O BIVARIANTE

VARIABLE
DEPENDIENTE

RELACIN ENTRE
LAS MUESTRAS

TEST ESTADSTICO

COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico
Ambas variables cuantitativas, pero no hay deCorrelacin de Pearson
pendiente o independiente
No paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Spearman
pendiente o independiente
Correlacin Tau de Kendal
REGRESIN
Paramtrica
Cuantitativa o
Cuantitativa
Regresin lineal simple
Cualitativa

58

59

Asunciones para el uso de test paramtricos.


Distribucin normal
Distribucin normal de la variable dependiente para los dos
niveles del factor:
Pruebas estadsticas:
Test de Kolmogorov-Smirnov con la correccion de Lilliefors y test
de Shapiro-Wilk.
Asimetra y curtosis.

Evaluacin grfica:

Stem & Leaf.


normal probability plot (Q-Q plot).
detrended normal plot (P-P plot).
Histograma y curva normal: Permite echar un ojo al aspecto del
histograma valorando su distribucin.

60

Asunciones para el uso de test paramtricos:


Homogeneidad de las varianzas.
Homogeneidad de varianzas de la variable dependiente para
cada nivel del factor que se analiza en el modelo.
Pruebas estadsticas:
Test de Levene.
Asimetra (uno u otro lado) y curtosis (alejadas o prximas) .

Representacin grfica
Spread vs. Level
Scatter plots entre observados, predichos y residuales
estandarizados.

61

Asunciones para el uso de test paramtricos:


Variable medida al menos en escala de intervalo.
La variable dependiente debe medirse al menos en una escala
de intervalo, de forma que existe la misma proporcin entre dos
valores consecutivos de la escala.

62

Asunciones para el uso de test paramtricos:


Independencia de las observaciones.
Independencia de las observaciones con distribucin aleatoria
de la muestra en los diferentes subgrupos formados por las
combinaciones de niveles de los factores. Esto significa que la
puntuacin obtenida por un sujeto es independiente de la que
obtiene otro.
Prueba estadstica:
Test de las rachas.

63

Pruebas de inferencia estadstica. Comparacin de


medias entre dos grupos. T de student y pruebas no
paramtricas.

T de studen para una muestra.


T de student para muestras independientes.
T de student para muestras dependientes.
Pruebas no paramtricas:
Test de Mann-Whitney
Test de Wilcoxon

64

Pruebas de inferencia estadstica.


Comparacin de proporciones entre dos o mas grupos.
Test estadstico chi-cuadrado.
Test chi cuadrado:
Pearson.
Correccin de continuidad de Yates.
Razn de verosimilitud.
Prueba exacta de Fisher.
Asociacin lineal.
Prueba de McNemar
Prueba Q de Cochran.

Pruebas de inferencia estadstica.


Comparacin de medias entre dos o mas grupos.
Modelos Lineales Generalizados.
ANOVA y pruebas no paramtricas.

ANOVA de una va (factor).


ANOVA de dos o ms vas (factores).
ANCOVA.
MANOVA (anlisis multivariante de la varianza).
ANOVA de medidas repetidas.

65

Das könnte Ihnen auch gefallen