Beruflich Dokumente
Kultur Dokumente
Carlo
CarloFrabetti.
Frabetti.Anaritmetismo.
Anaritmetismo.El
ElPais,
Pais,mircoles
mircoles24
24de
deenero
enerode
de1996.
1996.
Ordinal
Variables
Ejemplos
Nominales o
Categricas (Di o
Policotmicas
Ordinales
Igualdad/desigualdad
Igualdad/desigualdad
Orden
Igualdad/desigualdad
Orden y
Unidad de medida emprica
Igualdad/desigualdad
Orden y unidad emprica de
medida, con cero absoluto
De
Cuantitivativas
Intervalo contnuas o
discretas
De Razn Cuantitativas
contnuas o
Discretas
Estadstica descriptiva.
Resume los valores que toman las variables en las
unidades de anlisis.
Atencin al examen de los datos, previo a la
realizacin de tcnicas ms complejas de
confirmacin de hiptesis.
Importancia central de la representacin grfica.
Resistencia de los estadsticos a valores extremos.
Distincin entre ajuste y resduo.
Apertura a la transformacin de variables para
conseguir modelos ms ajustados.
10
Estadstica inferencial.
Inferir los valores de la poblacin (parmetros) basndonos
en el conocimiento de los valores de la muestra
(estadsticos).
11
Estadstica descriptiva.
Resumen de los valores que toman las variables en
las unidades de anlisis:
Variables cualitativas:
Tablas de distribucin de frecuencias absolutas
o relativas.
Grficas (diagramas de barras y tartas).
Variables cuantitativas:
Medidas de tendencia central, de variabilidad, de
posicin, de simetra y de apuntamiento.
Grficas (histogramas, polgonos de
frecuencias, arbol y hoja, caja y bigotes, nube de
puntos, etc.).
12
13
x
=
n
Media aritmtica:
i =1 n
(Distribuciones normales)
Mediana: Valor que deja 50% de los casos a
ambos lados. Igual que el P50. (distribuciones
que no son normales).
Moda: Valor ms frecuente.
14
Varianza:
xi x
1
n 1
Desviacin estandar:
xi x
1
n 1
s
Coeficiente de variacin: CV ( x ) = 100 %
x
Q1 Q3
Coeficiente Variacin intercuartlico: CVI =
Q1 + Q3
15
Ajuste de un modelo
Media: Modelo para resumir nuestros datos.
Varianza: Error promediado para evaluar el ajuste del
modelo a los valores de los sujetos.
Como Desviacin Estandar se expresa en las mismas
unidades que la media.
= xi
i =1 n
n
1 x i x
n 1
(xi x )
n
n 1
16
Utilidades:
Presentar la informacin.
Evaluar la estructura de los datos.
Tipos:
Comparaciones de dos o ms nmeros (diagrama de barras o
pictogramas).
Distribucin de objetos individuales o medidas en diferentes
categoras (diagrama de sectores).
Mostrar el cambio en alguna cantidad con el paso del tiempo
(diagrama de lneas)
Mostrar la relacin entre dos mediciones (nube de puntos).
17
18
Vlidos
Porcentaje
,3
Porcentaje
vlido
,3
Porcentaje
acumulado
,3
10,00
15,00
2
3
,5
,8
,5
,8
,8
1,5
20,00
25,00
4
5
1,0
1,3
1,0
1,3
2,5
3,8
30,00
35,00
6
7
1,5
1,8
1,5
1,8
5,3
7,0
40,00
45,00
8
9
2,0
2,3
2,0
2,3
9,0
11,3
50,00
55,00
10
11
2,5
2,8
2,5
2,8
13,8
16,5
60,00
65,00
12
13
3,0
3,3
3,0
3,3
19,5
22,8
70,00
75,00
14
15
3,5
3,8
3,5
3,8
26,3
30,0
80,00
85,00
16
17
4,0
4,3
4,0
4,3
34,0
38,3
90,00
95,00
18
19
4,5
4,8
4,5
4,8
42,8
47,5
100,00
105,00
20
19
18
5,0
4,8
4,5
5,0
4,8
4,5
52,5
57,3
61,8
17
16
4,3
4,0
4,3
4,0
66,0
70,0
15
14
3,8
3,5
3,8
3,5
73,8
77,3
13
12
3,3
3,0
3,3
3,0
80,5
83,5
11
10
2,8
2,5
2,8
2,5
86,3
88,8
9
8
2,3
2,0
2,3
2,0
91,0
93,0
165,00
170,00
7
6
1,8
1,5
1,8
1,5
94,8
96,3
175,00
180,00
5
4
1,3
1,0
1,3
1,0
97,5
98,5
185,00
190,00
3
2
,8
,5
,8
,5
99,3
99,8
195,00
Total
1
400
,3
100,0
,3
100,0
100,0
5,00
110,00
115,00
120,00
125,00
130,00
135,00
140,00
145,00
150,00
155,00
160,00
Estadstica descriptiva.
Variables cuantitativas
La distribucin
Normal
50
40
30
20
10
Std. Dev = 40,82
Mean = 100,0
N = 400,00
0
5,
20 ,0
5
19 ,0
5
18 ,0
5
17 ,0
5
16 ,0
5
15 ,0
5
14 ,0
5
13 ,0
5
12 ,0
5
11 ,0
5
10 0
,
95 0
,
85 0
,
75 0
,
65 0
,
55 0
,
45 0
,
35 0
,
25 0
,
15
0
5,
,0
-5
Frecuencia
1
VAR00001
50
La distribucin normal
Media, Mediana y Moda,
coinciden
Simtrica
Unimodal
Dos colas
40
Frecuencia absoluta
30
20
10
Probabilidades de los
valores de la variable en
los intervalos de clase.
68% (xsd)
95% (x 2sd)
99% (x 2.6sd)
19
0
5,
20 ,0
5
19 ,0
5
18 ,0
5
17 ,0
5
16 ,0
5
15 ,0
5
14 ,0
5
13 ,0
5
12 ,0
5
11 ,0
5
10 0
,
95 0
,
85 0
,
75 0
,
65 0
,
55 0
,
45 0
,
35 0
,
25 0
,
15
0
5,
,0
-5
x
x
Z=
i
60
100
80
40
N ( x, s 2 ) N (0,1)
60
20
40
Mean = 100,0
N = 400,00
0
20
0,0
40,0
20,0
80,0
60,0
100,0
VAR00001
-2,50
-1,50
-2,00
-,50
-1,00
Zscore(VAR00001)
120,0
68%
95%
99%
0,00
160,0
140,0
200,0
180,0
,50
1,50
1,00
2,50
2,00
20
21
Frmula
Cambios en forma de
distribucin
Ejemplo
xi = a + bxi
Ausentes
Tipificacin
xi = xiq
xi = log x
xi = xiq
Reduccin de asimetra.
Si q<1 a la izq.
si q> 1 a la dcha.
Cambio de curtosis
Aritmtica
Lineal
Potencia
Logaritmos y
races plegadas
Lgica
Ms representativos los
valores centrales.
Estadstica inferencial.
Muestreo
aleatorio
22
23
Estadstica inferencial.
Muestreo: Permite aplicar la estadstica inferencial.
Estadstica Inferencial, permite hacer inferencias sobre
los valores poblacionales:
Mtodos de inferencia:
Intervalo de confianza.
Test de Hiptesis.
24
Intervalo de confianza
N
Age
(years)
Valid N
(listwise)
Mean
236
57,07
Descriptive Statistics
Std.
Deviation
N
Age
(years)
Valid N
(listwise)
14,10
236
Descriptive Statistics
N
Age
(years)
Valid N
(listwise)
Mean
238
56,46
Std.
Deviation
Descriptive Statistics
13,26
N
Age
(years)
Valid N
(listwise)
Descriptive Statistics
Age
(years)
Valid N
(listwise)
Mean
243
56,86
1207
Mean
56,39
Std.
Deviation
Age
(years)
Valid N
(listwise)
258
258
56,94
55,00
Std.
Deviation
13,35
236
13,33
Age
(years)
Valid N
(listwise)
1207
13,30
Mean
250
55,83
Std.
Deviation
13,10
250
Descriptive Statistics
N
Age
(years)
Valid N
(listwise)
Descriptive Statistics
Mean
236
Std.
Deviation
243
Mean
Descriptive Statistics
238
25
Mean
264
55,94
Std.
Deviation
13,12
264
Descriptive Statistics
Std.
Deviation
13,63
N
Age
(years)
Valid N
(listwise)
Mean
219
219
54,93
Std.
Deviation
12,88
Ki
N, ,
Ki
Ki
Ki,x,s
Ki
26
N = tamao poblacional.
n = tamao muestral.
k = nmero de muestras de tamao n.
N
k = =
n
N!
n! (N n)!
Sea cual sea la distribucin de una variable aleatoria poblacional, con media y varianza
2 , la distribucin de las medias, x, de muestras de tamao n es, aproximadamente, una
normal, con media y varianza 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto
ms aproximadamente cuanto mayor sea el tamao de n (por tanto, a mayor n, mayor
simetra de la distribucin).
27
xi N , 2 n
-1.96*/n
1.96*/n
-1.96
1.96
Distribucin emprica
Tipificacin
xi
N (0,1)
n
Distribucin estandarizada
28
1
96
1
96
P( x .
x+ .
) = 0.95
n
n
Parmetro () Estimador () 1.96 x (error estandar del estimador)
29
El producto 1.96 n
se denomina
ERROR ASOCIADO A LA ESTIMACIN
ERROR DE MUESTREO.
El valor
se denomina ERROR
ESTANDAR de la media (del estimador en
general), es decir la desviacin estandar de
las medias muestrales (recuerda que mide
la bondad de ajuste).
30
31
P( x t
x+t
) = 1
1 2 n
1 2 n
De manera similar, la frmula del IC para una
proporcin es:
P( p t
1 2
p q
p p + t
1 2
n
p q
) = 1
n
32
H 0 p(A) = p(B)
p(A)
=1
p(B)
33
34
35
1
96
1
96
P( x .
x+ .
) = 0.95
n
n
36
37
38
A
B
C
10
Diferencia de TA entre
Diabticos y normales
o entre no tratados y
tratados con un
frmaco hipotensor.
D
E
F
G
(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuanta y
direccin) y no tanto en saber la probabilidad de que hallamos llegado a un
resultado falso positivo (si podemos o no rechazar la hiptesis nula).
39
40
P( 1.96
x +1.96 ) = 0.95
n
n
P( x 1.96
) = 0.95
n
La distancia entre x y no puede ser mayor que el mximo error
asociado a la estimacin posible para tener una seguridad del
95% de haber elegido una de las k muestras de la poblacin que
nos interesa.
x 1.96
n
El producto 1.96
x <
El valor
41
x 1.96
n
x <
= 1.96
n
n = (1.96)
2
2
42
n = (1.96)
2 pq
n = (1 . 96 ) 2
43
Test de hiptesis
44
Test de Hiptesis.
Test de hiptesis son procedimientos estadsticos que
nos permiten decidir acerca de una hiptesis
establecida sobre el valor de uno o ms parmetros
desconocidos (relaciones entre variables); es decir,
Establecer el grado de consistencia entre la hiptesis
establecida y la experiencia realizada.
El objetivo de los test de hiptesis consiste en ver si se
puede rechazar la hiptesis de independencia entre
dos variables (por ejemplo fumar y cncer de pulmn).
La hiptesis formulada de esta manera se llama
Hiptesis nula, Ho.
45
46
47
p(A)
H 0 p(A) = p(B)
=1
p(B)
48
DECISION INVESTIGADOR
REALIDAD No rechazar Ho
Ho verdadera Correcto
H0 falsa Error , tipo II
Rechazar Ho
Error , tipo I
Correcto (1-)
49
Zi =
( xi i )
N (0,1)
50
Zi =
( xi )
260 240
40 100
=5
51
Zi =
( xi )
N (0,1)
52
53
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
54
Probabilidad y confianza.
Se han calculado e interpretado correctamente los
valores de la p.
Se han calculado los intervalos de confianza y los
reflejan las conclusiones de los autores?.
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
55
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
56
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBU VARIABLE
VARIABLE
RELACIN ENTRE TEST ESTADSTICO
CION
INDEPENDEPENDIENTE LAS MUESTRAS
DIENTE
UNIVARIANTE O BIVARIANTE
Normal
Una sola
Cuantitativa
t-student para una muestra
(Param- muestra
Cualitativa
Chi-cuadrado para una muestra
tricos)
(compara con
valor terico)
Dicotmica
Categrica
Cuantitativa
Policotmica Categrica
Cuantitativa
No relacionadas
Relacionadas
Relacionadas
No relacionadas
No relacionadas
No relacionadas
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBUCION VARIABLE
VARIABLE
RELACIN ENTRE
TEST ESTADSTICO
INDEPENDIENTE
DEPENDIENTE
LAS MUESTRAS
UNIVARIANTE O BIVARIANTE
No normal
Una sola muestra
Binomial
(No paramtri(compara con valor
Chi-cuadrado de Pearson
cos)
terico)
Chi-cuadrado de Mantel-Haenzsel
Kolmogorow-Smirnov
Rachas
Dicotmica
Categrica
Relacionadas
No relacionadas
Chi-cuadrado de Pearson
Test exacto de Fisher
Relacionadas
No relacionadas
Mann-Whitney
W de Wilcoxon
Mediana
Z Kolmogorov-Smirnov
Rachas de Wald-Wolfowitz
Valores extremos de Moses
Categrica
No relacionadas
Prueba Q de Cochran
Cuantitativa
Relacionadas
Friedman
W de Kendall (concordancia)
No relacionadas
Kruskal-Wallis
Mediana K variables
ANOVA de dos vas por rangos
Cuantitativas
Policotmica
57
tras).
DISTRIBUCION
VARIABLE
INDEPENDIENTE
UNIVARIANTE O BIVARIANTE
VARIABLE
DEPENDIENTE
RELACIN ENTRE
LAS MUESTRAS
TEST ESTADSTICO
COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio)
Paramtrico
Ambas variables cuantitativas, pero no hay deCorrelacin de Pearson
pendiente o independiente
No paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Spearman
pendiente o independiente
Correlacin Tau de Kendal
REGRESIN
Paramtrica
Cuantitativa o
Cuantitativa
Regresin lineal simple
Cualitativa
58
59
Evaluacin grfica:
60
Representacin grfica
Spread vs. Level
Scatter plots entre observados, predichos y residuales
estandarizados.
61
62
63
64
65