Beruflich Dokumente
Kultur Dokumente
EPIDEMIOLOGA
MODULO 2: ESTADSTICA DESCRIPTIVA BSICA I
Temas a tratar
Construccin de tablas
Medidas de tendencia central
Software R
Construccin de tablas
En la estadstica, para identificar los diferentes
comportamiento de un conjunto de datos, resulta pertinente
agrupar las observaciones en tablas que resuman la
informacin obtenida, para lograr esto se usan las siguientes
tcnicas:
Frecuencias simples
Tabla de frecuencias para datos no agrupados
Tablas de frecuencias para datos agrupados
Construccin de tablas
FUMA
SI
SI
SI
NO
NO
NO
SI
SI
NO
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
NO
SI
SI
Frecuencia simple
Frecuencia: Valor resumen del nmero de datos que comparten una misma
categora o valor de una variable, en las tablas se pueden observar estas
frecuencias de manera ordenada por medio de filas y columnas.
X
Fuma (Si)
No Fuma (No)
Total
# de casos
26
14
40
%
65%
35%
100%
Construccin de tablas
Datos no agrupados
Construccin de tablas
Datos no agrupados
Construccin de tablas
Datos no agrupados
=
=
Construccin de tablas
1 =
Datos no agrupados
9
= 0,18
50
11
2 =
= 0,22
50
4
6 =
= 0,08
50
Construccin de tablas
Datos no agrupados
= + 1
=
= .
Construccin de tablas
Datos no agrupados
1 = 9
2 = 9 + 11 = 20
6 = 9 + 11 + 12 + 10 + 4 + 4 = 50
Construccin de tablas
Datos no agrupados
=
= .
Construccin de tablas
Datos no agrupados
1 = 0,18
# pacientes
15
16
19
18
16
17
15
18
18
17
20
16
17
18
17
19
20
21
16
17
Construccin de tablas
Ejemplo
Construccin de tablas
Datos agrupados
Intervalos de clase
1. Determinar los valores extremos (mnimo y mximo) y despus realizar el
calculo del rango de los valores
=
2. Determinar el nmero de intervalos de clase ()
N de Intervalos: 2 >
3.
4.
3,3 log + 1
Construccin de tablas
Datos agrupados
1) =
2) = 3,3 log + 1
3) =
3) =
144
= 24
6
Construccin de tablas
1 = 0 + C
1 = 191 + 24 = 215
2 = 1 + C
2 = 215 + 24 = 239
3 = 2 + C
6 = 5 + C
Datos agrupados
3 = 239 + 24 = 263
6 = 311 + 24 = 335
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015
Construccin de tablas
Datos agrupados
13.1
7.1
14.8
19.0
10.2
18.0
19.8
15.0
17.3
10.8
22.3
14.5
18.4
10.2
15.8
16.5
15.0
17.6
4.2
13.4
21.2
14.7
13.8
21.0
16.6
11.2
20.2
14.4
13.5
18.2
12.4
17.0
26.7
15.5
22.0
12.9
17.1
14.9
12.0
14.0
14.3
11.1
18.9
8.3
17.9
7.4
18.0
19.8
16.0
21.2
Construccin de tablas
Ejemplo
Qu es la estadstica descriptiva?
Introduccin
Hasta ahora se ha tratado de organizar la informacin,
resumindola a travs de tablas de frecuencias y de la
representacin grfica, no obstante, en ocasiones se
requiere de algunas medidas que en forma muy directa
puedan indicar rasgos importantes de la muestra como
su magnitud, su homogeneidad, su simetra, etc.
Medida
Nmero que se calcula sobre la muestra y que refleja
cierta cualidad de la misma. El clculo de esta medida
requiere la posibilidad de efectuar operaciones con los
valores que toma la variable.
Medidas caractersticas
1. Medidas de tendencia central (indicadores de posicin):
Son medidas que nos indican la posicin que ocupa la
muestra.
2. Medidas de dispersin: Se utilizan para describir la
variabilidad o esparcimiento de los datos de la muestra
respecto a la posicin central.
Media aritmtica
La media aritmtica de un conjunto de datos:
1 , 2 , , se define como:
=
=1
1
=
=1
=
=1
=1
Cul es la media
aritmtica?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015
Cul es el promedio?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015
Cul es la media
aritmtica?
300
400
500
600
700
750
800
1000
1200
1500
Total
2
2
5
1
2
3
2
1
1
1
20
0,10
0,10
0,25
0,05
0,10
0,15
0,10
0,05
0,05
0,05
1,00
2
4
9
10
12
15
17
18
19
20
0,10
0,20
0,45
0,50
0,60
0,75
0,85
0,90
0,95
1,00
Propiedades de la media
La suma de las desviaciones de los datos con
respecto a la media es cero.
= 0
=1
Propiedades de la media
Si todos los datos de una muestra se multiplican por
una constante, el promedio de dicha muestra resulta
multiplicando por la misma constante.
=
;
=
Si = + , = 1,2, , , donde a y b son
constantes, entonces:
= +
1 +
=
2
Cul es el promedio
del conjunto de
datos?
Mediana
La mediana tiene el objetivo de dividir el conjunto de datos
en dos partes iguales.
= + +1
2
Mediana: ejemplos
1. Nmero de pacientes que llegan por hora a un servicio:
15, 16, 19, 18, 16, 17, 15, 18, 18, 17, 20, 16, 17, 18, 19, 20, 21,
16, 17
2. Precios de una pastilla X en 20 farmacias de una ciudad:
700, 500, 300, 750, 500, 300, 400, 700, 500, 1000, 600, 1500,
400, 500, 750, 750, 800, 1200, 500, 800
Mediana: ejercicio
Suponga que se tienen los siguientes niveles de colesterol
(mg/dL) para un grupo de pacientes obesos:
Cul es la mediana?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015
4
5
16
16
8
1
50
0,08
0,10
0,32
0,32
0,16
0,02
1,00
4
9
25
41
49
50
0,08
0,18
0,50
0,82
0,98
1,00
Moda
Cuando la variable de inters es de naturaleza discreta, la
moda (Mo) corresponde al dato de la muestra que tiene
mayor frecuencia (dato que ms se repite).
Cuando se trata de una variable de naturaleza continua, la
moda corresponde al(os) valor(es) alrededor del(os)
cual(es) se produce una mayor concentracin de datos, es
decir, a los puntos de mayor densidad de frecuencia.
Moda: ejemplo
Precios de una pastilla X en 20 farmacias de una
ciudad:
700, 500, 300, 750, 500, 300, 400, 700, 500, 1000, 600,
1500, 400, 500, 750, 750, 800, 1200, 500, 800
Cul es la moda?
Moda: ejemplo
En una poblacin del Cauca se tom una muestra de 50 familias
para observar el nmero de personas menores de 12 aos con el
propsito de estimar algunos indicadores sobre demanda
potencial de educacin escolar. La muestra arroj los siguientes
resultados:
Cul es la moda?
Cul es la
moda del
conjunto de
datos?
Algunas consideraciones
La sensibilidad es una cualidad de un indicador que permite
detectar cambios producidos en la muestra. Mucha sensibilidad
en un indicador puede ser contraproducente, puesto que
cambios irrelevantes (valores extremos) en la muestra pueden
producir grandes cambios en el indicador, lo cual puede
prestarse para interpretaciones equivocadas.
Algunas consideraciones
La media () y la mediana (Me) de un conjunto de
datos en general no son idnticas. Si el conjunto de
datos tiene una asimetra, entonces .
GRACIAS