Beruflich Dokumente
Kultur Dokumente
2.
3.
MEDIA ARITMTICA
Llamada tambin media o promedio, resulta de sumar los valores de todas las
observaciones y dividir la sumatoria entre el total de ellas. Se caracteriza por ser nica,
fcil de calcular y porque es afectada por todos y cada uno de los valores del conjunto,
28
de tal manera que los muy grandes o muy pequeos que salen del rango esperado
pueden distorcionarla, en tal caso, el valor discordante se analizar por separado.
Ejemplo; si se analiza un conjunto de datos de la variable talla (cm) de un grupo de
varones adultos, donde uno de ellos mide 230 centmetros, el valor discordante ser
230, ste distorcionar la media, luego, para evitar esa inconveniencia ser mejor
analizarlo por separado o de lo contrario, se debe calcular una mediana. La media se
calcula con las siguientes frmulas:
a.- A partir de una muestra (estadstico)
xi
n
x x2 x3 ... xn
1
n
Donde:
N es la poblacin
n es la muestra
x1, x2,x3, xn son los valores de
la variable
X es la media.
xi
N
Ejemplo 1
En la prctica del curso de Bioestadstica del I Semestre Acadmico de 2014, los
estudiantes del tercer ao, entre otros datos, contabilizaron el nmero de respiraciones
por minuto en situacin de reposo. Se desea saber la media de las respiraciones de
los estudiantes. Los datos se presentan a continuacin:
19
24
16
24
20
14
20
19
19
20
16
24
22
23
17
19
20
24
18
21
28
20
20
17
15
17
22
22
16
18
20
19
18
19
23
14
20
20
20
18
21
18
20
15
22
20
20
18
16
21
18
20
15
17
26
24
16
18
18
21
22
18
22
15
16
20
23
17
16
20
20
22
18
21
16
17
18
20
24
16
24
19
21
22
20
19
21
21
20
22
13
16
17
22
24
21
17
20
Frequency
0
16
17
18
19
20
21
respiraciones n
29
22
23
24
xi
19 19 ... 20
19.5
98
Ejemplo 2:
A continuacin se muestran las edades de 48 pacientes internados de urgencia en el
hospital Collique. Analice la forma de la distribucin con un grfico de tallo y hojas.
1
Paciente
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Edad
12 13 13 14 14 15 15 16 16 17 17 18 18 21 21 22 23 23 24 26 26 27 28 28
Paciente
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Edad
29 30 31 32 33 34 35 35 35 35 41 42 42 42 43 46 47 48 48 50 51 53 54 55
Stem-and-leaf de Edad
Leaf Unit = 1.0
5
13
19
25
23
18
14
9
5
1
50
Edad
40
30
20
10
1
1
2
2
3
3
4
4
5
5
N = 48
23344
55667788
112334
667889
01234
5555
12223
6788
0134
5
x
n
x1 x2 ...xn 12 13 ... 55
30.38 aos
n
48
30
MEDIANA
Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamao en
cuanto al nmero de observaciones se refiere. El primero ser igual o menor que la
mediana y el otro igual o mayor. Se usa con datos ordinales o con numricos que
pueden o no ser simtrcos, es decir que tienen o no una distribucin normal. La
mediana de un conjunto de datos se caracteriza por ser nica, su clculo es muy fcil
y a diferencia de la media los valores extremos no afectan su valor.
Pasos:
1. Los datos se ordenan en forma creciente: x1 + x2 ++xn
2. Calcular la posicin de la mediana teniendo en cuenta la frmula:
Me
n 1
2
Donde:
Me
n
es la mediana
es el tamao de la muestra
Me
n 1
2
Me
20 1
10.5
2
20 20
20 respiraciones por minuto
2
31
3.1.-Si n es impar:
Me
n 1
2
Me
21 1
11
2
MODA
Valor que se presenta con mayor frecuencia en un conjunto de datos. Se usa
solamente cuando se tiene inters en resaltar el o los valores ms frecuentes. Un
conjunto de datos puede tener ms de una moda o ninguna.
Ejemplo 4:
Una muestra de 17 alumnos, ingresantes a la universidad, fueron sometidos a un
examen bucodental para determinar la presencia de alguna enfermedad oral. Entre
otros datos se registr la edad de cada uno de ellos, los cuales se presentan a
continuacin, Cul es el valor modal?
Alumno
10
11
12
13
14
15
16
17
Edad
16
15
17
18
18
16
18
15
18
19
18
17
17
16
19
20
16
14
15
16
17
Para una mejor visualizacin del valor ms frecuente se ordenan los datos:
Alumno
Edad
15
15
16
16
16
16
17
17
17
10
18
11
18
12
18
13
18
18
19
Mo
El valor modal de la edad fue 18, pues, el dato se repite 5 veces.
CUANTILES
Se conocen tambin como medidas de localizacin. Se usan con datos numricos
sesgados o cualitativos medidos en escala ordinal.
1.- PERCENTILES (P)
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales. Un percentil
indica el porcentaje de los valores de un conjunto de datos que es menor o igual al
valor de un determinado percentil. Daniel3 lo define de la siguiente manera:
Dado un conjunto de n observaciones x1 x2 x2 , el p -simo percentil P es el
valor de X, tal que p por ciento o menos de las observaciones son menores que P
y (100 p) por ciento o menos de las observaciones son mayores que P.
32
19
20
Su importancia radica en su uso para comparar un valor individual con una norma. Se
usa intensamente en la interpretacin y desarrollo de tablas de crecimiento fsico, y de
mediciones de destreza de inteligencia, as como tambin para determinar rangos
normales de valores de laboratorio. Los lmites normales para la mayora de los
anlisis de laboratorio se establecen en los percentiles 2.5 y 97.5, de modo que estos
lmites normales contienen el 95% central de la distribucin. Los percentiles se
emplean cuando se usa la mediana, tambin se emplea cuando se usa la media, pero
el inters es comparar un valor individual de la variable con un conjunto de normas.
Por ejemplo, comparar el peso de un nio de 24 meses con lo establecido para esa
edad en una tabla de control del nio sano.
La frmula para calcular percentiles es:
k ( n 1)
100
Pk
Donde:
2.
55
61
65
68
73
55
61
65
68
73
55
62
65
68
74
56
62
65
68
74
56
62
65
68
75
56
62
65
69
75
57
62
65
69
75
57
63
66
69
75
57
63
66
69
75
57
63
66
71
75
58
63
66
71
76
58
64
66
72
76
59
64
67
72
77
59
64
67
72
79
59
64
67
72
80
P95
60
65
67
73
80
60
65
67
73
80
60 61
65 65
67 68
73 73
81 81
P95
95( n 1)
95.95 posicin
100
33
2.- CUARTILES
Son tres medidas de posicin que dividen a un conjunto de datos cuyos valores estn
ordenados generalmente de menor a mayor en cuatro partes iguales. Se les nombra
como Q1 , Q2 , Q3. Las frmulas para su clculo son tres, a saber:
Q1
n1
4
Q2
2( n 1)
4
Q3
3( n 1)
4
Donde:
Qi es el cuartil que se desea calculari
n
tamao de muestra
25%
25%
Q1
25%
25%
Q2
Q3
IQ Q3 Q1
Q3 Q1
2
55
61
65
68
73
55
61
65
68
73
55
62
65
68
74
56
62
65
68
74
Q1
Q1
56
62
65
68
75
56
62
65
69
75
57
62
65
69
75
57
63
66
69
75
57 57
63 63
66 66
69 71
75 75
Q2
58
63
66
71
76
100 1
25.25
4
58
64
66
72
76
59
64
67
72
77
59
64
67
72
79
Q3
59
64
67
72
80
60
65
67
73
80
60
65
67
73
80
60
65
67
73
81
61
65
68
73
82
El valor Q1 62
Interpretacin: El 25% de los nios tienen un nivel de glucosa igual o menor que 62
El Q2 es la mediana
34
Q3
3( n 1)
75.75 posicin
4
El valor Q3 72
Interpretacin: El 75% de los nios tienen un nivel de glucosa igual o menor que 72.
IQ Q3 Q1 72 62 10
Interpretacin: el 50% central de los nios tuvieron un nivel de glucosa entre 62 y 72.
3. Dividir el valor del intervalo cuartilar entre 2 para obtener la desviacin cuartilar
10
5
2
Casos
zona de epidemia
10000
8000
zona de alarma
6000
4000
zona de seguridad
2000
zona de xito
0
Ene
Feb
Mar
Abr
May
Jun
Jul
Ago
Set
Oct
Nov
Dic
Meses
Q1
Q2
35
Q3
Ao 2001
MEDIDAS DE DISPERSIN
Son aquellas que miden la variabilidad de un conjunto de datos. La magnitud de la
variabilidad es pequea cuando los valores son diferentes pero estn cercanos entre
s; si stos son muy diferentes la dispersin es grande. Los sinnimos de dispersin
son variabilidad y expansin. Ejemplo: si 10 estudiantes son pesados en una misma
balanza bajo las mismas condiciones, y se encuentra que cada uno pesa 50 kilos,
entonces no hay variacin en los pesos., el peso es constante. Otro grupo de 10
estudiantes. fueron pesados en iguales condiciones, los pesos fueron: 55, 60, 53, 56,
48, 50, 51, 58, 62, 59, en este caso, se observa que son diferentes, entonces hay
dispersin. Las medidas de dispersin que estudiaremos son: rango, varianza,
desviacin estndar y coeficiente de variacin.
RANGO
Es la diferencia entre el valor mximo y el mnimo de un conjunto de datos. Los
dems valores se encuentran entre estos. Es una medida apropiada cuando se quiere
enfatizar los valores extremos. Su uso es limitado por que toma en consideracin solo
la diferencia de dos valores. La frmula para calcularlo es:
R x mximo x mnimo
Donde:
x mximo
xmnimo
Ejemplo:
La siguiente serie corresponde a las edades aos de una muestra de 11 nios.
2
11 14 15 17 21 24 26
R= 26 2 = 24
El rango, es decir la diferencia entre el valor mximo y el mnimo es 24, obsrvese que
los dems valores estn entre los valores extremos.
VARIANZA
Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.
Si los valores de las distancias son iguales, el valor de la varianza es cero. Si los datos
son diferentes pero cercanos entre s, la varianza es pequea. Si los datos estn muy
distantes, la varianza es grande. Se puede definir tambin como la sumatoria de las
diferencias de cada uno de los datos con respecto a la media dividida entre n-1. Se
calcula restando de cada observacin el valor de la media; las diferencias se elevan al
cuadrado, luego la sumatoria se divide entre n-1 si los datos corresponden a una
muestra, o, entre N si pertenecen a una poblacin.
Las diferencias se elevan al cuadrado para desaparecer los signos negativas que se
generan al restar la media a cada uno de los valores xi, de esta manera se evita que
la suma algebrica de stas diferencias den como resultado cero. La varianza tiene las
propiedades matemticas necesarias para analizar mejor los datos en comparacin a
la desviacin media, medida que se obtiene de sumar las diferencia de los valores xi
con su media, sin tomar en cuenta el signo y dividiendo la sumatoria entre el nmero
de observaciones.
36
x1 x 2 x2 x 2 ... xn
n1
2 x x 2
n1
Donde:
xi representa los valores de la variable, x1 , x2 , ., etc.
n nmero de observaciones de la muetra
x es la media aritmtica
La frmula alternativa para un gran nmero de datos es:
n
xi2 n( x )2
s2
n1
USOS:
1.
37
RESPIRACIONES DE 20 ALUMNOS
24
23
respiraciones n
22
Q3
21
20
Me
19
Q1
18
17
16
x
n
19 16 ... 23 401
3.- Calcular la varianza, para lo cual se usar la frmula que corresponde a una
muestra, dado que es la medida con suficientes propiedades para usarla en inferencia
estadstica.
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza. Mide la variabilidad de los datos en las
unidades en que se midieron originalmente. Los smbolos son: s si se trata de una
muestra y 2 ; si es una poblacin. La frmula es:
S s 2
La desviacin estndar se calcula cuando tambin es apropiado el clculo de la media,
es decir, cuando la variable es cuantitativa y adems su distribucin es o tiende a ser
simtrica, la media se ubica al centro de la distribucin o muy cercana a ella.
38
68%
95%
99%
Estos valores son importantes a tener en cuenta cuando tenemos que hacer la
interpretacin de la desviacin estndar.
39
DESVIACIN MEDIA
Es una medida que expresa la forma en que las observaciones se dispersan alrededor
de la media. Consiste en sumar las desviaciones de las observaciones respecto a su
media y dividir la sumatoria entre n. Es el promedio simple de las desviaciones, la
frmula es la siguiente.
DM
( xi x )
n
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
19 16 20 22 21 24 23 19 22 17 20 20 20 21 18 22 18 17 19 23
El clculo se hace considerando los valores absolutos de las desviaciones, se obvia
los signos. La sumatoria de stas diferencias se divide entre el nmero de
observaciones.
DM
COEFICIENTE DE VARIACION
Es una medida de relativa, til para comparar la dispersin en dos o ms conjuntos
de datos, los que pueden ser medidos en las mismas unidades o no. Expresa en
porcentaje la relacin de la desviacin estndar y la media, la frmula es:
CV
s
100
x
CV
2.212
100 11.03%
20.05
40
Ejercicios de repaso
En los siguientes ejercicios: Identifique la naturaleza de la variable y la escala de
medicin. Calcule: la media, mediana, desviacin estndar y el coeficiente de
variacin. Interprete los resultados
1. En un programa para la deteccin de hipertensin, en una muestra de 30 hombres
en edades entre 30 y 40 aos, la distribucin de la presin diastlica (mnima) en
mm Hg fue la siguiente:
95
70
90
85
70 100
85
75
65
65
80
90
90 110
95
95
90
90
95 110 100
70
60
75
85
80
80 120
75
85
10
13
13
7
12
10
1
12
4
4
7
8
8
6
17
3
7
4
3
3
5
4
8
5
5
5
8
5
7
7
4
12
7
3
11
3
1
3
2
17
8
3
10
1
5
4
BIBLIOGRAFA
1. BONITA, Ruth;BEAGLEHOLE, 2008 Epidemiologa bsica. 2 ed. Organizacin
Robert y KJELLSTRM, Tord Panamericana de la Salud. Publicacin Cientfica No. 629
2. DANIEL, Wayne
3. DAWSON-SAUDERS B
4. PAGANO Marvello
41