Sie sind auf Seite 1von 54

FUNDAMENTOS DE ESTADSTICA Y

EPIDEMIOLOGA
MODULO 2: ESTADSTICA DESCRIPTIVA BSICA I

Temas a tratar
Construccin de tablas
Medidas de tendencia central
Software R

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas
En la estadstica, para identificar los diferentes
comportamiento de un conjunto de datos, resulta pertinente
agrupar las observaciones en tablas que resuman la
informacin obtenida, para lograr esto se usan las siguientes
tcnicas:

Frecuencias simples
Tabla de frecuencias para datos no agrupados
Tablas de frecuencias para datos agrupados

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas
FUMA
SI
SI
SI
NO
NO
NO
SI
SI
NO
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
SI
NO
SI
SI

Frecuencia simple

Frecuencia: Valor resumen del nmero de datos que comparten una misma
categora o valor de una variable, en las tablas se pueden observar estas
frecuencias de manera ordenada por medio de filas y columnas.

X
Fuma (Si)
No Fuma (No)
Total

# de casos
26
14
40

%
65%
35%
100%

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas (Datos no agrupados)


Ejemplo: En una poblacin del Cauca se tom una muestra
de 50 familias para observar el nmero de personas
menores de 12 aos con el propsito de estimar algunos
indicadores sobre demanda potencial de educacin escolar.
La muestra arroj los siguientes resultados:

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

Se comienza organizando la informacin, para ello se escriben los


distintos datos de los que consta la variable y se hace un conteo
para determinar el nmero de veces que aparece cada dato dentro
de una variable.
Frecuencia absoluta: Designada con el smbolo dentro de una
tabla, y expresan el nmero de veces que se repite un valor dentro
de la variable. La suma de las frecuencias absolutas resulta ser el
total de individuos que estn dentro del estudio.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

Frecuencia relativa: Designada con el smbolo dentro de una tabla, se


calculan dividiendo la frecuencia absoluta sobre el nmero total de
individuos. La suma de las frecuencias relativas es igual a 1.

=
=

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

1 =

Datos no agrupados

9
= 0,18
50

11
2 =
= 0,22
50

4
6 =
= 0,08
50

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

Frecuencia absoluta acumulada: Designada con el smbolo dentro de


una tabla, se calcula sumando a cada frecuencia absoluta la frecuencia
absoluta acumulada anterior; la primera frecuencia absoluta y la primera
frecuencia absoluta acumulada son las mismas y la ultima de la frecuencia
absoluta acumulada es igual al total de individuos que estn dentro del
estudio.

= + 1

=
= .

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

1 = 9
2 = 9 + 11 = 20

6 = 9 + 11 + 12 + 10 + 4 + 4 = 50

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

Frecuencia relativa acumulada : Designada con el smbolo


dentro de una tabla, se calcula sumando a cada frecuencia
relativa la frecuencia anterior, la primera frecuencia relativa y
la primera frecuencia relativa acumulada son las mismas y la
ultima de la frecuencia relativa acumulada corresponde a 1.

=
= .

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos no agrupados

1 = 0,18

2 = 0,18 + 0,22 = 0,4

6 = 0,18 + 0,22 + 0,24 + 0,2 + 0,08 + 0,08 = 1

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas: Datos no agrupados


Ejemplo
Se tiene que el nmero
de pacientes que llegan
por hora a un servicio.
En qu porcentaje de
las
ocasiones
se
presentan al servicio
menos de 19 pacientes?
En qu porcentaje 19
o ms?

# pacientes
15
16
19
18
16
17
15
18
18
17
20
16
17
18
17
19
20
21
16
17

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Ejemplo

Construccin de tablas (Datos agrupados)


EJEMPLO: Una compaa constructora resuelve estudiar la resistencia a la
compresin de una mezcla de concreto, con el objetivo de hacer control de
calidad. Para ello, se tomaron 50 cilindros de prueba de acuerdo con las
normas establecidas. Los resultados en /2 de presin obtenidos al
cabo de 28 das de curado se encuentran a continuacin.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos agrupados

Intervalos de clase
1. Determinar los valores extremos (mnimo y mximo) y despus realizar el
calculo del rango de los valores

=
2. Determinar el nmero de intervalos de clase ()

N de Intervalos: 2 >
3.

Determinar la amplitud de las clases


Amplitud de clase:

4.

3,3 log + 1

Determinar los lmites de las clases


Lmites de las clases: 1 = 0 + ; 2 = 1 + ; ; = 1 +
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos agrupados

1) =

1) = 335 191 = 144

2) = 3,3 log + 1

2) = 3,3 log 50 + 1 = 6,06 6

3) =

3) =

144
= 24
6

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

1 = 0 + C

1 = 191 + 24 = 215

2 = 1 + C

2 = 215 + 24 = 239

3 = 2 + C

6 = 5 + C

Datos agrupados

3 = 239 + 24 = 263

6 = 311 + 24 = 335
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

Datos agrupados

Se completa la tabla como para datos agrupados se tienen las mismas


frecuencias.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas: Datos agrupados


Tiempos de atencin (en minutos) de pacientes en el servicio de filtro urgencias de
un hospital local

13.1
7.1
14.8
19.0
10.2
18.0
19.8
15.0
17.3
10.8
22.3
14.5

18.4
10.2
15.8
16.5
15.0
17.6
4.2
13.4
21.2
14.7
13.8
21.0

16.6
11.2
20.2
14.4
13.5
18.2
12.4
17.0
26.7
15.5
22.0
12.9

17.1
14.9
12.0
14.0
14.3
11.1
18.9
8.3
17.9
7.4
18.0
19.8

16.0
21.2

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Construccin de tablas

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Ejemplo

Construccin de tablas: Consideraciones para datos


agrupados
Cuando los datos de agrupan en intervalos de clase, se produce
prdida de informacin, puesto que no se dispone de los datos
en forma individual.
No deben existir intervalos de clase que no contengan datos.
Cuando esto ocurra debern reagruparse los datos (los intervalos
pueden ser de diferente tamao).
Cuando sea posible debe procurarse que todos los intervalos
sean de igual longitud.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Qu es la estadstica descriptiva?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Introduccin
Hasta ahora se ha tratado de organizar la informacin,
resumindola a travs de tablas de frecuencias y de la
representacin grfica, no obstante, en ocasiones se
requiere de algunas medidas que en forma muy directa
puedan indicar rasgos importantes de la muestra como
su magnitud, su homogeneidad, su simetra, etc.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Qu entendemos por medida?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Medida
Nmero que se calcula sobre la muestra y que refleja
cierta cualidad de la misma. El clculo de esta medida
requiere la posibilidad de efectuar operaciones con los
valores que toma la variable.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Medidas caractersticas
1. Medidas de tendencia central (indicadores de posicin):
Son medidas que nos indican la posicin que ocupa la
muestra.
2. Medidas de dispersin: Se utilizan para describir la
variabilidad o esparcimiento de los datos de la muestra
respecto a la posicin central.

3. Medidas de forma: Tratan de medir el grado de simetra


y apuntamiento en los datos.
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Medidas de tendencia central


1. Media aritmtica
2. Mediana
3. Moda

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media aritmtica
La media aritmtica de un conjunto de datos:
1 , 2 , , se define como:

=
=1

1
=

=1

Si los datos corresponden a una variable discreta que est


organizada en una tabla de frecuencias, entonces:

=
=1


=1

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media aritmtica: ejemplo


En una poblacin del Cauca se tom una muestra de 50
familias para observar el nmero de personas menores
de 12 aos con el propsito de estimar algunos
indicadores sobre demanda potencial de educacin
escolar. La muestra arroj los siguientes resultados:

Cul es la media
aritmtica?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media aritmtica: ejercicio


Suponga que se tienen los siguientes niveles de
colesterol (mg/dL) para un grupo de pacientes obesos:

Cul es el promedio?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media aritmtica: ejemplo


En una poblacin del Cauca se tom una muestra de 50 familias
para observar el nmero de personas menores de 12 aos con el
propsito de estimar algunos indicadores sobre demanda
potencial de educacin escolar. La muestra arroj los siguientes
resultados:

Cul es la media
aritmtica?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media aritmtica: ejercicio


Precios de una pastilla X en 20 farmacias de una
ciudad:

300
400
500
600
700
750
800
1000
1200
1500
Total

2
2
5
1
2
3
2
1
1
1
20

0,10
0,10
0,25
0,05
0,10
0,15
0,10
0,05
0,05
0,05
1,00

2
4
9
10
12
15
17
18
19
20

0,10
0,20
0,45
0,50
0,60
0,75
0,85
0,90
0,95
1,00

Cul es la media aritmtica?


INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Propiedades de la media
La suma de las desviaciones de los datos con
respecto a la media es cero.

= 0
=1

Si todos los datos son iguales a k, entonces el


promedio es k = .

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Propiedades de la media
Si todos los datos de una muestra se multiplican por
una constante, el promedio de dicha muestra resulta
multiplicando por la misma constante.
=
;
=
Si = + , = 1,2, , , donde a y b son
constantes, entonces:
= +

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media para datos agrupados


Debido a que hay prdida de individualidad de la
informacin al agrupar datos, el clculo de la media se
hace de forma aproximada. Para ello se hace el
siguiente supuesto:
Los datos en cada intervalo estn uniformemente
distribuidos. Si esto es cierto, entonces:

1 +
=
2

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media para datos agrupados: ejemplo


Suponga que se tienen los siguientes niveles de
colesterol (mg/dL) para un grupo de pacientes obesos:

Cul es el promedio
del conjunto de
datos?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Media para datos agrupados: ejercicio


Tiempos de atencin (en minutos) de pacientes en el
servicio de filtro urgencias de un hospital local:
13.1, 7.1, 14.8, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8,
22.3, 14.5, 17.1, 14.9, 12.0, 14.0, 18.4, 10.2, 15.8, 16.5,
15.0, 17.6, 4.2, 13.4, 21.2, 14.7, 13.8, 21.0, 14.3, 11.1,
18.9, 8.3, 16.6, 11.2, 20.2, 14.4, 13.5, 18.2, 12.4, 17.0,
26.7, 15.5, 22.0, 12.9, 17.9, 7.4, 18.0, 19.8, 16.0, 21.2
Cul es el promedio del conjunto de datos?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana
La mediana tiene el objetivo de dividir el conjunto de datos
en dos partes iguales.

Si [1] , [2] , , [] corresponde a un conjunto de datos


ordenados de manera no descendente de una variable X,
entonces la mediana puede ser calculada como:
+1

= + +1
2

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana: ejemplos
1. Nmero de pacientes que llegan por hora a un servicio:
15, 16, 19, 18, 16, 17, 15, 18, 18, 17, 20, 16, 17, 18, 19, 20, 21,
16, 17
2. Precios de una pastilla X en 20 farmacias de una ciudad:
700, 500, 300, 750, 500, 300, 400, 700, 500, 1000, 600, 1500,
400, 500, 750, 750, 800, 1200, 500, 800

Cul es la mediana de los datos?


INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana: ejercicio
Suponga que se tienen los siguientes niveles de colesterol
(mg/dL) para un grupo de pacientes obesos:

Cul es la mediana?
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana para datos agrupados


Si los datos estn agrupados en m intervalos, la
mediana es el punto cuya frecuencia absoluta
acumulada es n/2 o la relativa acumulada es 0,5. Es
decir, la mediana es el valor x tal que F(x)=0,5.

Una vez localizado el intervalo que contiene la


mediana, se puede calcular la mediana como:
0,5 1
= 1 +

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana para datos agrupados: ejemplo


Suponga que se tienen los siguientes niveles de
colesterol (mg/dL) para un grupo de pacientes obesos:

Cul es la mediana del conjunto de datos?


INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Mediana para datos agrupados: ejercicio


Tiempos de atencin (en minutos) de pacientes en el
servicio de filtro urgencias de un hospital local:
Intervalos
4,2 - 7,95
7,95 - 11,7
11,7 - 15,45
15,45 - 19,2
19,2 - 22,95
22,95 - 26,7
Total

4
5
16
16
8
1
50

0,08
0,10
0,32
0,32
0,16
0,02
1,00

4
9
25
41
49
50

0,08
0,18
0,50
0,82
0,98
1,00

Cul es la mediana del conjunto de datos?


INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda
Cuando la variable de inters es de naturaleza discreta, la
moda (Mo) corresponde al dato de la muestra que tiene
mayor frecuencia (dato que ms se repite).
Cuando se trata de una variable de naturaleza continua, la
moda corresponde al(os) valor(es) alrededor del(os)
cual(es) se produce una mayor concentracin de datos, es
decir, a los puntos de mayor densidad de frecuencia.

A diferencia de los otros indicadores, este es el nico que


puede ser calculado cuando observamos variables
cualitativas.
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda: ejemplo
Precios de una pastilla X en 20 farmacias de una
ciudad:
700, 500, 300, 750, 500, 300, 400, 700, 500, 1000, 600,
1500, 400, 500, 750, 750, 800, 1200, 500, 800

Cul es la moda?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda: ejemplo
En una poblacin del Cauca se tom una muestra de 50 familias
para observar el nmero de personas menores de 12 aos con el
propsito de estimar algunos indicadores sobre demanda
potencial de educacin escolar. La muestra arroj los siguientes
resultados:

Cul es la moda?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda para datos agrupados


La moda se encuentra en el
intervalo de mayor frecuencia.

Si las dos clases adyacentes


tienen igual densidad de
frecuencia, se puede suponer
que la moda se encuentra en el
punto medio de la clase que la
contiene. En caso contrario, la
moda estar desplazada un poco
hacia la clase adyacente de
mayor densidad de frecuencia.
INSTITUTO NACIONAL DE CANCEROLOGA-ESE
FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda para datos agrupados


Cuando se tienen datos agrupados para una variable continua, la
moda puede ser calculada, primero ubicando el intervalo que
tenga la mayor frecuencia y luego aplicando la siguiente frmula:

Si los intervalos son de igual longitud:

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Moda para datos agrupados:


ejemplo
Suponga que se tienen los siguientes niveles de
colesterol (mg/dL) para un grupo de pacientes obesos:

Cul es la
moda del
conjunto de
datos?

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Algunas consideraciones
La sensibilidad es una cualidad de un indicador que permite
detectar cambios producidos en la muestra. Mucha sensibilidad
en un indicador puede ser contraproducente, puesto que
cambios irrelevantes (valores extremos) en la muestra pueden
producir grandes cambios en el indicador, lo cual puede
prestarse para interpretaciones equivocadas.

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

Algunas consideraciones
La media () y la mediana (Me) de un conjunto de
datos en general no son idnticas. Si el conjunto de
datos tiene una asimetra, entonces .

INSTITUTO NACIONAL DE CANCEROLOGA-ESE


FUNDAMENTOS DE ESTADSTICA Y EPIDEMIOLOGA - JUNIO 2015

GRACIAS

Das könnte Ihnen auch gefallen