Sie sind auf Seite 1von 24

CAPITULO III

69

MEDIDAS DEPOSICIN Y DISPERSIN

MEDIDAS DE POSICION
INTRODUCCION
Hasta ahora para describir un conjunto de datos, se han empleado las tablas y los grficos.
Estos son tiles para dar rpidamente una visin general del comportamiento de los valores
que asume una variable, as, en el caso de variables categricas, los diagramas son
suficientes para dar una descripcin completa de las mismas..
Sin embargo, para describir el comportamiento de variables cuantitativas, en general se
requiere una mayor precisin que la que puede proporcionar un grfico, es importante que
esa descripcin trascienda los lmites de lo visual y lo subjetivo en cuanto sea posible.
Como solucin a la situacin planteada, surgen las medidas de posicin y de dispersin,
para describir las caractersticas de las distribuciones en forma cuantitativa. Ms
exactamente, la precisin que es deseable obtener al describir el conjunto de datos
numricos se refiere a dos aspectos, cada uno de los cules se puede traducir en una
pregunta:
Existe algn valor de la variable que represente a la mayora de los valores del conjunto
de datos?.
Qu tan separados estn entre si, los diferentes valores que asume la variable respecto al
valor de la variable que representa a los datos?.
La primera pregunta se refiere a las medidas de posicin y la segunda, a las llamadas
medidas de dispersin.
As tambin, un investigador del campo educativo puede realizar una investigacin para
determinar si las aptitudes matemticas son diferentes segn el sexo de los estudiantes. Este
investigador tendr dos conjuntos de calificaciones, luego obtendr la calificacin
promedio de cada grupo y har la comparacin de los promedios. La variabilidad de los
datos es otro aspecto importante que el investigador debe de considerar, as, necesita saber
si las calificaciones son uniformes o vara entre los estudiantes del sexo femenino y del
sexo masculino.
MEDIDAS DE POSICION
En el campo social y educativo las medidas de tendencia central que se usan ms
frecuentemente son la media aritmtica, la mediana, los percentiles y la moda. A
continuacin desarrollaremos dichos temas.
MEDIA ARITMETICA
Definicin
Si x1 ,...., xn son los valores observados de una variable, la media aritmtica o
simplemente media o promedio de estos datos se define como el cociente de la suma de
todos los valores observados entre el nmero de datos o tamao de la muestra. Su expresin
matemtica es:

69

CAPITULO III

70

MEDIDAS DEPOSICIN Y DISPERSIN

x1 x 2 ... x n 1 n
xi ,
n
n i 1
donde n es el nmero total de observaciones .
X

(3.1)

As si los siguientes datos corresponden a las notas de 5 estudiantes en el curso de


estadstica: 12
15
11
09
13; entonces, la nota promedio del curso es
x1 x 2 ... xn 1
X
12 15 11 09 13 12 puntos
n
5
Media aritmtica ponderada
Nos permite calcular un promedio tomando en cuenta la importancia o peso de cada valor
observado de la variable con respecto al total. Su expresin matemtica es:
k

x w

Xw

i 1
k

(3.2)

w
i 1

donde, wi , es la importancia o peso que se asigna a cada valor de la variable.


Ejemplo 3.1
Supongamos que un profesor decide utilizar un promedio ponderado para obtener los
promedios finales de cada uno de los estudiantes que asisten al curso de estadstica. El
promedio de trabajos tendr un valor de 20% de la calificacin del estudiante, el examen
parcial 25%; el examen final 35%, promedio de prcticas 20%. A partir de los datos
siguientes calcularemos el promedio final para dos estudiantes cualesquiera.
Estudiante
1
2

Nota de trabajos Examen parcial


15
12
17
10

Examen final
18
14

Promedio prcticas
13
17

Solucin:
a) Obtengamos el promedio ponderado del primer estudiante. Aplicando la frmula (3.2) se
tiene:
k

Xw

x w
i 1
k

w
i 1

= Xw

15(0.2) 12(0.25) 18(0.35) 13(0.20)


14.9 puntos.
0.20 0.25 0.35 0.20

Si calculamos la media aritmtica de las notas del primer estudiante, obtendramos 14.5
puntos.

70

CAPITULO III

71

MEDIDAS DEPOSICIN Y DISPERSIN

b) Obtengamos el promedio ponderado del segundo estudiante. En este caso el promedio


ponderado es:
Xw

17(0.2) 10(0.25) 14(0.35) 17(0.20)


14.2 puntos.
0.20 0.25 0.35 0.20

Observe que la media aritmtica del segundo estudiante tambin es 14.5.


El primer estudiante tiene mayor promedio ponderado que el segundo estudiante debido a
que el examen final tiene mayor peso a pesar de que el segundo estudiante supera al
primero en las notas de trabajo y prctica.
Si los datos se presentan en una distribucin de frecuencias donde, los valores xi de la
variable se repiten f i veces, la frmula (3.1) quedar expresada en la siguiente forma:
X

1 k
xi f i
n i 1

(3.3)

Ejemplo 3.2
En la tabla 2.1 se tiene la distribucin de frecuencias del nmero de hijos de los estudiantes
de maestra. Encontraremos el nmero promedio de hijos.
Tabla 2.1 Nmero de hijos de los estudiantes de maestra
En la distribucin de frecuencias del nmero de hijos de los estudiantes de maestra,
ncontraremos el nmero promedio de hijos.
xi

fi

2
11
11
3
3
30

x1 =0
x2 =1
x3 =2

x4 =4
x5 =5

Total
Solucin:
Como los datos se encuentran tabulados usaremos la expresin (3.3) para obtener la media
aritmtica. Los clculos auxiliares se presentan en la siguiente tabla.
xi

x1 =0
x2 =1
x3 =2

x4 =4
x5 =5

fi

2
11
11
3
3

xi f i

0
11
22
12
15
71

CAPITULO III

72

Total

30

MEDIDAS DEPOSICIN Y DISPERSIN

60

Reemplazando en la frmula (3. 3) se tiene:


1 k
0(2) 1(11) 2(11) 4(3) 5(3) 60
X xi f i = X

2 hijos.
30
30
n i 1
estudiantes de la maestra tienen 2 hijos.

En

promedio

los

Si los datos se presentan en una distribucin de frecuencias agrupados en intervalos de


clase, los valores xi de la expresin (3.3) sern reemplazados por la marca de clase de
cada intervalo y el valor de la media aritmtica se obtiene de la siguiente manera:
X

1 k '
xi f i , xi' es la i - sima marca de clase

n i 1

(3.4)

Ejemplo 3.3
En la Tabla 3.1 se tiene las edades de un grupo de estudiantes de maestra de la Facultad de
Educacin matriculados en el semestre 2003-I. Obtengamos la media aritmtica.
.Tabla 3.1 Edad de los estudiantes de la maestra en
educacin matriculados en el 2003-I.
Edades
Marca de
Frecuencia
Li 1 , Li
clase
Absoluta
23
32
41
50
59

32
41
50
59
68

x i'

fi

27.5
36.5
45.5
54.5
63.5

6
12
8
2
2

Solucin:
Como los datos se presentan agrupados en intervalos de clase usaremos la expresin (3.4).
Los clculos auxiliares se presentan en la siguiente tabla.
Edades

Li 1 , Li
23 32 41 50 59 Total

32
41
50
59
68

Marca de
clase

Frecuencia
Absoluta

x i'

fi

27.5
36.5
45.5
54.5
63.5

6
12
8
2
2
30

y reemplazando en la frmula se encuentra:

72

xi' f i

165.0
438.0
364.0
109.0
127.0
1203.0

CAPITULO III

73

MEDIDAS DEPOSICIN Y DISPERSIN

1 n '
xi f i
n i 1
27.5(6) 36.5(12) 45.5(8) 54.5( 2) 63.5(2) 1203

40.1 aos .La


30
30
promedio de los estudiantes es 40.1 aos.
X

edad

Propiedades de la media aritmtica


1. La suma de las desviaciones de los valores de la variable respecto a la media aritmtica
es igual a cero. Expresado matemticamente tendremos:
k

x
i 1

X fi 0

Demostracin
k

x
i 1

X fi

x
i 1

fi X

f
i 1

n X n X 0 , puesto que X

x
i 1

fi

Ejemplo:
Las siguientes observaciones corresponden a la variable nmero de inasistencias a clases
durante un ao escolar, en un grupo de 20 estudiantes.
xi
fi

1
3

3
4

6
8

7
3

8
2

Solucin.xi

fi

xi f i

1
3
1 *3=3
3
4
3 *4=12
6
8
6 *8=48
7
3
7 *3=21
8
2
8 *2=16
Total
100
k
1
100
X xi f i
5 inasistencias en promedio durante el ao escolar.
20
n i 1
k

x
i 1

X f i 1 5 3 3 5 4 6 5 8 (7 5)3 (8 5) 2 12 8 8 6 6 0

2. La suma de los cuadrados de las desviaciones de todos los valores con respecto a la
media es mnima. Cuya expresin matemtica es:
73

CAPITULO III

x
i 1

MEDIDAS DEPOSICIN Y DISPERSIN

74

X f i es mnima
2

Ejemplo
Aplicaremos la propiedad a la distribucin de frecuencias del nmero de inasistencia a
clases:
1
3

xi
fi

3
4

6
8

7
3

8
2

Solucin:
Calculando los cuadrados de las desviaciones con respecto a la media y tambin con
respecto a cada uno de los valores de la variable se tiene:
xi

f i ( xi X ) 2 f i

1
3
6
7
8
Total

3
4
8
3
2

(1-5)2 *3=48
(3-5)2 *4=16
(6-5)2 *8=8
(7-5)2 *3=12
(8-5)2 *2=18
102

( xi 1) 2 f i

( xi 3) 2 f i

( xi 6) 2 f i

( xi 7) 2 f i ( x i 8) 2 f i

0
16
200
108
98
422

12
0
72
48
50
182

75
36
0
3
8
122

108
64
8
0
2
182

147
100
32
3
0
282

Observe que la suma de los cuadrados de las desviaciones respecto a la media de la


distribucin es menor que cualquier otra suma de las desviaciones con respecto a cada uno
de los valores de la muestra.
3. Dados k conjuntos de datos con sus medias X 1 , X 2, ... , X k y formados por
n1 , n 2 , ..., n k observaciones, respectivamente, la media global de todos los datos se
obtiene mediante la media ponderada, cuya expresin matemtica es:
k

X global

ni X i
n1 X 1 n2 X 2 ... nk X k
i 1

k
n1 n2 ... nk
ni
i 1

donde el numerador representa la suma de todas las observaciones y el denominador el


nmero total de observaciones.
Por ejemplo se tiene la distribucin del nmero de inasistencias a clases de una muestra de
20 alumnos, cuyo promedio de inasistencia es 5. Si particionamos la muestra en dos,
tendremos las siguientes submuestras, las que usaremos para verificar la propiedad 3.
Muestra 1:
xi

fi

xi f i

74

CAPITULO III

1
3
6
Total

75

3
4
8
15

MEDIDAS DEPOSICIN Y DISPERSIN

1 *3=3
3 *4=12
6 *8= 48
63
X1

63
=4.2
15

n1=15

Muestra 2:
xi

fi

7
8
Total
X2

3
2
5

37
7 .4
5

xi f i

7 *3=21
8 *2=16
37
n2 =5

n1 X 1 n2 X 2 15( 4.2) 5(7.4) 63 37 100

5
n1 n2
15 5
20
20
Hemos encontrado el mismo valor de la media de la muestra original, verificando as la
propiedad 3.

Luego la media global es X global

4. La media aritmtica de una constante por una variable, es igual al producto de la


constante por la media aritmtica de la variable. Esto es, si
y i Cx i i 1,..., n, entonces , Y C X

Ejemplo
La siguiente distribucin corresponde a las calificaciones en el curso de ingls de un grupo
de 25 estudiantes.
xi f i
Calificaciones Nmero
xi
de
estudiantes
fi

10
3
30
20
5
100
30
8
240
40
6
240
50
3
150
Total
25
760
La media de las calificaciones del curso de ingls es X 30.4 puntos.
Si el profesor opta por duplicar la calificacin a cada estudiante, cul ser la nueva media?
La forma ms rpida de obtener la nueva media ser aplicando la presente propiedad. Como
el profesor a cada estudiante le duplica la calificacin la constante es C=2., luego esta
constante ser multiplicada por la media de las calificaciones, es decir:
Y C X =2(30.4)=60.8. La nueva media de las calificaciones es Y =60.8.
75

CAPITULO III

76

MEDIDAS DEPOSICIN Y DISPERSIN

5. La media aritmtica de una constante ms una variable, es igual a la constante ms la


media aritmtica de la variable. Esto es, si yi xi C i 1,..., n, entonces ,Y X C
Ejemplo
Como parte de una tarea de laboratorio de nutricin, 15 estudiantes del tercer ao de la
Escuela Acadmico Profesional de Nutricin de la UNMSM matriculados el ao acadmico
2004, encontraron el nmero de caloras (X) de una porcin de lasaga. y obtuvieron los
siguientes valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
a) Encontraremos la media aritmtica del nmero de caloras.
b) Al acabar el trabajo, los estudiantes se informaron que el instrumento de medicin que
usaron estaba mal calibrado y marc en cada caso 300 caloras por debajo de su valor.
Encontraremos la media aritmtica de los nuevos valores de caloras.
Solucin:
a) La media aritmtica del nmero de caloras es:
X

526
35.06 caloras.
15

b) Sumamos a todas las observaciones de la variable X la constante C = 300, y los nuevos


valores de caloras (Y) es como sigue:
329 335 347 318 322 330 351 362 315 342 346 353 316 327 333
El clculo de la media aritmtica de los nuevos valores de caloras se podr simplificar
aplicando la propiedad 5, esto es:
Y X C =35.06+300 =335.06 caloras.
MEDIANA
Definicin
Dado x1 ,...., xn observaciones de la variable X, la mediana es el valor o punto medio que
supera al 50 por ciento de los valores observados de la variable y es superado por el
restante 50 por ciento. La forma de obtener el valor de la mediana depende del nmero de
observaciones. As si el nmero de observaciones es impar, la mediana es el valor de la
variable que ocupa la posicin central de los datos ordenados y si el nmero de
observaciones es par, la mediana es la media aritmtica de los dos valores que ocupan la
posicin central de los datos ordenados. Esta definicin se puede plasmar mediante la
siguiente expresin matemtica.

76

CAPITULO III

77

MEDIDAS DEPOSICIN Y DISPERSIN

Si n es impar :
Me x n 1

(3.5)

Si n es par :
x n x
Me

1
2

donde el subndice indica la posicin o lugar que ocupa el valor de la variable ordenada .
Si la muestra es de tamao impar, como por ejemplo: 13 11 19 20 18 21 23, donde

n 1
4 , por lo que la mediana es el valor de la variable que ocupa la
2
posicin 4 de las observaciones ordenadas: 11 13 18 19 20 21 23 . Me x 4 = 19.

n = 7, entonces

Si el tamao de la muestra es par, como por ejemplo 10 16 4 9 13 17, donde n = 6 y


ordenados
son:4
9
10
13
16
17,
entonces,
n
n
3 , 1 4 por lo que x (3) 10 , x ( 4 ) 13 ocupan la posicin central. Luego el
2
2
10 13
11.5 .
valor de la mediana es la media aritmtica de 10 y 13, es decir Me
2

Datos sin agrupar en intervalos de clase y presentados en tabla de frecuencias


Si los datos estn en una distribucin de frecuencias, para calcular la mediana se seguirn
los siguientes pasos:
1) Encontrar las frecuencias absolutas acumuladas
2) Encontrar

n
2

3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo


n
Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente inferior o
2
n
igual que
y Fi es la frecuencia absoluta acumulada inmediatamente superior que
2
n
.
2
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi
y
Fi 1

encontrar el valor de la mediana de acuerdo a la frmula siguiente:


Me xi

si

Fi 1

n
Fi
2

(a)

o
x xi
Me i 1
2

(3.6)
si

Fi-1

n
Fi
2

(b)

Ejemplo 3.4
Con la distribucin del nmero de hijos de los estudiantes de maestra presentados de la
Tabla 2.1 vamos a ilustrar la obtencin de la mediana.
77

CAPITULO III

78

MEDIDAS DEPOSICIN Y DISPERSIN

Solucin:
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
y luego calcular

fi

Fi

2
11
11
3
3
30

2
13
24
27
30

F2
F3

n
n
30
15 .
, es decir,
=
2
2
2

En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal forma


n
15 Fi 24 . Usando (3.6(a)), el valor de la variable asociada a la
2
frecuencia absoluta acumulada Fi F3 24, es x3 2 ; o sea, el valor de la mediana es

que, Fi 1 13

2. Me 2 . El 50% de los estudiantes de maestra tienen menos de 2 hijos.


Ejemplo 3.5
Considerando el ejemplo anterior, supongamos que la distribucin de frecuencias sea de la
siguiente forma:
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
Al calcular

n 30
15 ,se
=
2
2

fi

Fi

2
13
9
3
3
30

2
15 F2
24 F3
27
30

cumple que

n
2

coincide con

Fi 1

esto es,

n
15 Fi 24 . Usando (3.6(b)), ubiquemos los valores de la variable
2
Fi y Fi 1 . El valor de la variable asociada a la frecuencia absoluta
asociados a
acumulada Fi = F3 =24 es x3 =2, y el valor de la variable que corresponde a Fi 1 13
Fi 1 15

es x 2 =1, entonces la mediana es Me

x 2 x3 1 2

=1.5. El 50% de los estudiantes de


2
2

maestra tienen menos de 1.5 hijos.


78

CAPITULO III

MEDIDAS DEPOSICIN Y DISPERSIN

79

Datos agrupados en intervalos de clase y presentados en una tabla de frecuencia


Seguir los pasos 1), 2), 3) del caso anterior de datos sin agrupar en intervalos de clase y
como paso 4) ubicar el intervalo de clase asociado a la frecuencia absoluta acumulada Fi
y encontrar el valor de la mediana de acuerdo a la siguiente expresin:
n
Fi 1

Me Li 1 2
Fi Fi 1

Me Li 1

ai

Si Fi 1

n
Fi
2

(3.7)

Si Fi 1

n
Fi
2

donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai
es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi

Ejemplo 3.6
Obtengamos la mediana a partir de la distribucin de edad de los estudiantes de maestra
presentados en la Tabla 3.1
Solucin:
Para obtener la mediana previamente se calcula las frecuencias absolutas acumuladas como
se muestra a continuacin:
Edades

Al calcular

Li 1 , Li

Frecuencia
absoluta

Frecuencia absoluta
acumulada

fi

Fi

23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total

6
12
8
2
2
30

6 F1
18 F2
26
28
30

n 30
n

15 , se cumple Fi 1 = 6 < 15 <


2
2
2

Fi = 18, en este caso el

intervalo asociado a Fi F2 18 es 32 , 41 , este contiene el valor de la variable que


ocupa la posicin

n
30

15 . La amplitud del intervalo es 9 y el lmite inferior 32.


2
2

79

CAPITULO III

Entonces,

MEDIDAS DEPOSICIN Y DISPERSIN

80
usando

(3.7),

el

valor

15 6
9 32 6.75 38.75 .
18 6

Me 32

de

la

mediana

es

El 50% de los estudiantes tienen edades

inferiores a 38.75 aos.


Ejemplo 3.7
Supongamos que la distribucin de frecuencias para la edad de los estudiantes de maestra
sea de la siguiente forma:
Edades

Al calcular

Li 1 , Li

Frecuencia
absoluta

Frecuencia absoluta
acumulada

fi

Fi

23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total

6
9
11
2
2
30

6
15 F2
26 F3
28
30

n 30
n

15 , se cumple que
2
2
2

coincide con Fi 1 esto es, Fi 1 =15=

n
15 < Fi = 26. El intervalo de clase asociado a la frecuencia absoluta acumulada Fi =
2
F3 =26 es 41, 50 , luego usando (3.7) la mediana es Me Li 1 L2 41 . El 50% de

los estudiantes tienen edades inferiores a 41 aos.


MODA
Definicin: La moda es el valor de la variable que se repite con mayor frecuencia. Se
expresa como:
Mo x i si x i es el valor de la variable que ms se repite

(3.8)

Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, ste
no tiene moda. Tambin existen situaciones donde se tiene ms de una moda, en tal caso
diremos que la distribucin de frecuencias es bimodal, trimodal, multimodal.
As, para el conjunto de datos 10 11 11 12 13 09 15 la moda es Mo 11 (unimodal);
mientras que en el conjunto de valores observados 10 11 12 13 09 y 15 no existe moda.
Si el conjunto de datos es 11 11 11 12 12 12 05 04 , las modas son Mo 11 y
Mo 12 (bimodal).
A continuacin se presentan los mtodos de obtencin de la moda cuando se tiene un
mayor nmero de datos, razn por la cual previamente han sido tabulados.
80

CAPITULO III

81

MEDIDAS DEPOSICIN Y DISPERSIN

Datos sin agrupar en intervalos de clase y presentados en tablas de frecuencias


Para identificar el valor de la moda debe observarse la columna de las frecuencias
absolutas y seleccionar la mayor de ellas. Supongamos que esa frecuencia sea f i ,
entonces el valor de la moda es:
Mo xi

si f i f i 1

f i f i 1

(3.9)

donde:
f i 1 : frecuencia absoluta inmediatamente anterior a f i
f i 1 : frecuencia absoluta inmediatamente posterior a f i

Ejemplo 3.8
Con los datos presentados en el ejemplo 3.5 vamos a ilustrar la obtencin de la moda.
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5

fi

2
13
9
3
3

Solucin
Para calcular la moda, observamos la columna de frecuencias absolutas y vemos que la
mayor frecuencia corresponde a f 2 = 13. Por lo tanto el valor de la moda es x2 =1, es
decir Mo 1 .
Ejemplo 3.9
Con los datos de la siguiente tabla ilustraremos nuevamente la obtencin de la moda.
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Solucin:

81

fi

2
11
11
3
3

CAPITULO III

82

MEDIDAS DEPOSICIN Y DISPERSIN

Esta distribucin posee dos modas: Mo 1 y Mo 2 ; pues a la segunda frecuencia f 2


=11 le corresponde el valor x 2 1 y a la tercera frecuencia absoluta f 3 =11 le corresponde
el valor x3 2 . En esta caso la mayora de estudiantes tiene 1 o 2 hijos.
Datos agrupados en intervalos de clase, presentados en tablas de frecuencias
Debe observarse la columna de las frecuencias absolutas y detectar la mayor de ellas.
Supongamos que esa frecuencia sea f i , asociado a l se encuentra el intervalo de clase
Li 1 Li que contiene a la moda y se denomina intervalo modal. La moda se obtendr
mediante la siguiente expresin matemtica:

d1
d1 d 2

M o Li 1

a i

(3.10)

donde:
Li 1

es el lmite inferior del intervalo modal

fi

es la mayor frecuencia

f i 1 es la frecuencia inmediatamente anterior a la mayor frecuencia


f i 1 es la frecuencia inmediatamente posterior a la mayor frecuencia
d1 f i f i 1
d 2 f i f i 1
ai

es la amplitud del intervalo modal

Lo que se puede resumir en la siguiente metodologa:


1) En la tabla de frecuencia detectar la mayor frecuencia absoluta, la frecuencia absoluta
inmediatamente anterior e inmediatamente posterior a la mayor frecuencia absoluta.
2) Ubicar el intervalo correspondiente a la mayor frecuencia absoluta
3) Reemplazamos en la frmula correspondiente a la moda (3.10) los valores de las
frecuencias detectadas en el paso 1), el lmite inferior y la amplitud del intervalo que
contiene a la moda, ubicado en el paso 2).
Ejemplo 3.9
En el siguiente ejemplo correspondiente a la Tabla 3.1 se tiene las edades de un grupo de
estudiantes de maestra de la Facultad de Educacin matriculados en el semestre 2003-I.
Obtengamos la moda.
Edades

Frecuencia

Li 1 , Li Absoluta
fi

23 - 32
32 - 41

6
12
82

CAPITULO III

41 - 50
50 - 59
59 - 68

83

MEDIDAS DEPOSICIN Y DISPERSIN

8
2
2

Solucin:
Para obtener la moda se procede de la siguiente manera:
Se encuentra el valor de la mayor frecuencia absoluta, f 2 12 . El intervalo con mayor
frecuencia es 32 , 41 , su amplitud igual
a 9 y su lmite inferior es 32,
f i 1 6 , f i 1 8 entonces: d1= 12-6=6, d2= 12-8=4 .
Luego el valor de la moda es:

d1
6

ai =
32
9 32 5.4 37.4 aos.
6

d1 d 2
frecuente es 37.4 aos, es decir 37 aos.
M o Li 1

La

edad

ms

Ejemplo 3.10
En una muestra de 30 estudiantes, la variable disposicin para el estudio permiti establecer
la siguiente distribucin de frecuencias.

Disposicin para el estudio


1 Ninguna
2 Regular
3 Buena
4 Muy buena
5 Excelente

Nmero de estudiantes
2
7
5
9
7

Porcentajes
0.067
0.233
0.167
0.300
0.233

Podemos afirmar que con mayor frecuencia, 9 estudiantes respondieron tener muy buena
disposicin para el estudio. Luego la moda es muy buena disposicin para el estudio.
Cabe indicar que en este ejemplo, tenemos la distribucin de una variable cualitativa, luego
la moda es la nica estadstica de posicin que podemos calcular cuando se tiene una
variable cualitativa.
CUARTILES
Son nmeros que dividen la distribucin de frecuencia de un conjunto de datos en cuatro
partes iguales. Ellos son:

El cuartil uno, Q1, es el punto por debajo del cul se ubica el

El cuartil dos, Q2 , es el punto por debajo del cul se ubica el 50% de los datos.

El cuartil tres, Q3, es el punto por debajo del cul se ubica el


83

25% de los datos.

75% de los datos.

CAPITULO III

84

MEDIDAS DEPOSICIN Y DISPERSIN

Clculo de cuartiles en conjuntos de datos pequeos


Primero ordenamos los datos en orden de magnitud creciente. Los datos ordenados se
representan con x (1) , x ( 2 ) ,..., x ( n )
Luego encontramos la posicin para cada uno de los cuartiles, segn como sigue:
Para el cuartil uno calcular

1
n 1 y redondear al entero ms cercano. La observacin
4

ordenada que ocupa esta posicin, representa el cuartil uno. Si la posicin se encuentra a
mitad entre dos enteros el cuartil uno es el promedio de los dos valores correspondientes.
Para el cuartil dos (mediana) usar (3.5)
Para el cuartil tres calcular

3
n 1 y redondear al entero ms cercano. La observacin
4

ordenada que ocupa esta posicin, representa el cuartil tres. Si la posicin se encuentra a
mitad entre dos enteros el cuartil tres es el promedio de los dos valores correspondientes.
Ejemplo 3.11
Para los siguientes conjuntos de datos
a) 13 11 19 20 18 21 23
b) 11 13 18 19 20 21 23.
Obtendremos el cuartil uno, el cuartil tres y la mediana.
Solucin.
a) Si tenemos la siguiente muestra de datos:13 11 19 20 18 21 23, donde n=7, entonces,
para encontrar el cuartil uno calculamos

n 1 7 1

2 , por lo que el cuartil uno es el


4
4

valor de la variable que ocupa la posicin 2 de las observaciones ordenadas: 11 13 18 19


20 21 23. Luego Q1 x 2 13 .
Para encontrar el cuartil dos usamos la formula (3.5) y como n es impar
Me x

n 1

7 1

x 4 19

Para encontrar el cuartil tres calculamos


Q3 x 6 21 .

3
n 1 = 3 7 1 6 luego el cuartil tres es
4
4

b) Si tenemos otra muestra de datos, por ejemplo 10 16 4 9 13 17, donde n=6 y


ordenados son: 4 9 10 13 16 17, entonces, para encontrar el cuartil uno calculamos

n 1 6 1

1.75 , luego el entero ms cercano es 2 por lo que el cuartil uno es el valor


4
4
de la variable que ocupa la posicin 2 de las observaciones ordenadas, luego Q1 x 2 9

84

CAPITULO III

MEDIDAS DEPOSICIN Y DISPERSIN

85

3
n 1 = 3 6 1 5.25 luego el entero ms
4
4
cercano es 5 por lo que el cuartil tres es Q3 x 5 16

Para encontrar el cuartil tres calculamos

Para encontrar el cuartil dos o mediana usamos (3.5) y como n es par.


x
Me

n
1
2

6
1
2

x 3 x 4
2

10 13
11.5
2

Para obtener los cuartiles a partir de una distribucin de frecuencias, se procede como en
el caso del calculo de la mediana teniendo en cuenta que la fraccin n/2 ser cambiada por
las fracciones

n
,
4

2n
,
4

3n
segn
4

se requiera calcular el cuartil uno, cuartil

dos(mediana) o cuartil tres respectivamente.


Datos sin agrupar en intervalos de clase y presentados en tabla de frecuencias
I. Para encontrar el cuartil uno, proceder de la siguiente manera:
1) Encontrar las frecuencias absolutas acumuladas
2) Encontrar

n
4

3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo


n
Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente inferior o
4
n
igual que
y Fi es la frecuencia absoluta acumulada inmediatamente superior que
4
n
.
4
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi
y
Fi 1

encontrar el valor del cuartil uno de acuerdo a la frmula siguiente:


Q1 x i

si Fi 1

n
Fi
4

o
Q1

x i 1 x i
2

si Fi-1

n
Fi
4

(3.11)
II. Para encontrar el cuartil tres:
1) Encontrar las frecuencias absolutas acumuladas
2) Encontrar

3n
4

85

CAPITULO III

86

MEDIDAS DEPOSICIN Y DISPERSIN

3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo


3n
Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente anterior
4
3n
o igual que
y Fi es la frecuencia absoluta acumulada inmediatamente superior
4
3n
que
.
4
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi
y
Fi 1

encontrar el valor del cuartil tres de acuerdo a la frmula siguiente:


Q3 xi

si Fi 1

3n
Fi
4

o
Q3

xi 1 xi
2

si Fi-1

3n
Fi
4

(3.12)
Ejemplo 3.12
Con la distribucin del nmero de hijos de los estudiantes de maestra vamos a ilustrar la
obtencin del cuartil uno y el cuartil tres.
Solucin:
a) Cuartil uno.
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
y luego calcular

fi

Fi

2
11
11
3
3
30

2
13
24
27
30

n
n
30
7.5 .
, es decir,
=
4
4
4

En la columna de frecuencias absolutas acumuladas ubicamos Fi y Fi 1 de tal


n
7.5 Fi 13 .Usando (3.11), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F2 13, es x 2 1 ; luego, el
valor del cuartil uno es 1. Q1 x 2 1 . El 25% de los estudiantes tiene como

forma que, Fi 1 2

mximo un hijo.
86

CAPITULO III

87

MEDIDAS DEPOSICIN Y DISPERSIN

b) Cuartil tres.
Despus de encontrar la frecuencia absoluta acumulada como se muestra en la tabla
siguiente:
fi
Fi
Nmero se hijos
2
2
x1 =0
x2 =1
11
13
x3 =2
11
24
x4 =4
3
27
x5 =5
3
30
Total
30
Calculamos

3n
3n 3 30
es decir
=
=22.5.
4
4
4

En la columna de la frecuencia absoluta acumulada ubicamos Fi y Fi 1 de tal


3n
22.5 Fi 24 .Usando (3.12), el valor de la variable
4
asociada a la frecuencia absoluta acumulada Fi F3 24, es x3 2 ; luego, el
valor del cuartil tres es 2. Q3 x3 2 . El 75% de los estudiantes tiene dos o menos

forma que, Fi 1 13

hijos.
Clculo de los cuartiles a partir de una distribucin de frecuencias para datos
agrupados en intervalos de clase
Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n
n 2n 3n
incluida en la frmula (3.7) ser cambiada por las fracciones
,
,
segn se
2
4
4
4

requiera obtener el cuartil uno, cuartil dos(mediana) o cuartil tres respectivamente.


PERCENTILES
Son nmeros que dividen la distribucin en 100 partes iguales. De manera semejante a la
mediana, en que la distribucin de un conjunto de datos se dividi en dos partes, un 50%
inferior y otro 50% superior, o en cuartiles en donde la distribucin se dividi en cuatro
partes, cada una conteniendo un 25% de los datos.
As por ejemplo el percentil 10, P10, es el valor de la variable debajo del cual se encuentran
el 10% de los datos. Es importante calcularlos en distribuciones con un gran nmero de
datos.
Datos sin agrupar en intervalos de clase y presentados en una tabla de frecuencias.
Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n
n
ser cambiada por la fraccin k
de acuerdo al percentil que sea de nuestro inters
2
100

encontrar (k =1,2,,99), y luego continuar con los pasos ya conocidos:


1) Encontrar las frecuencias absolutas acumuladas
87

CAPITULO III

88

2) Obtener la fraccin k

MEDIDAS DEPOSICIN Y DISPERSIN

n
donde k puede tomar los valores k = 1, 2,. . . ,99
100

3) En la columna de las frecuencias absolutas acumuladas ubicar el intervalo


kn
Fi donde Fi 1 es la frecuencia absoluta acumulada inmediatamente
100
kn
inferior o igual que
y Fi es la frecuencia absoluta acumulada inmediatamente
100
kn
superior que
.
100
4) Ubicar en la columna del recorrido de la variable el valor xi asociado a Fi
Fi 1

encontrar el valor del percentil k de acuerdo a la frmula siguiente:


Pk xi

si Fi 1

kn
Fi
100

o
Pk

(3.13)
xi 1 xi
2

si Fi-1

kn
Fi
100

Datos agrupados en intervalos de clase y presentados en una tabla de frecuencia


Para obtener el percentil k en el caso de una distribucin de frecuencias para datos
agrupados en intervalos de clase seguir los pasos 1), 2), 3) del caso anterior de datos sin
agrupar en intervalos de clase y como paso 4) ubicar el intervalo de clase asociado a la
frecuencia absoluta acumulada Fi y encontrar el valor del percentil k de acuerdo a la
frmula siguiente:

n
Fi 1
100
Fi Fi 1

Pk Li 1

Pk Li 1

a
i

Si Fi 1

kn
Fi
100

(3.14)

Si Fi 1

kn
Fi
100

donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai
es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi

Ejemplo 3.13
Considerando los datos de la edad de los estudiantes de maestra vamos a obtener el
percentil 75 P75.
Previamente se calculan las frecuencias absolutas acumuladas como se muestra a
continuacin,
Edades
Frecuencias
Frecuencia absoluta
Li 1 , Li
absoluta
acumulada
fi

88

Fi

CAPITULO III

23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total
y al calcular k

MEDIDAS DEPOSICIN Y DISPERSIN

89
6
12
8
2
2
30

6
18
26
28
30

n
n
30
75
22.5 , se cumple Fi 1 = 18 < k
22.5 < Fi = 26,
100
100
100

en este caso el intervalo asociado a Fi F3 26 es 41, 50 , que contiene el valor de la


variable que ocupa la posicin 75
inferior

41.

Entonces,

usando

Pk Li 1

n
k
Fi 1
100

Fi Fi 1

30
22.5 . La amplitud del intervalo es 9 y el lmite
100

(3.14),

el

valor

del

percentil

75

P 75,

es

22.5 18
4.5
a
9 41
9 46.1 .
i = 41

26 18

El 75% de

los estudiantes tienen edades inferiores a 46.1 aos.


Comentarios
Dependiendo de lo que se quiera representar o explicar y del tipo de variable con la que
estemos trabajando, se elegir a la estadstica de posicin ms apropiada segn el caso,
por ello hacemos la siguientes observaciones.
La media aritmtica es afectada por valores extremos de la variable.
La mediana no es afectada por valores extremos (valores inferiores o superiores
muy distantes del valor central) de la variable.
La media, mediana y moda se pueden calcular para datos cuantitativos.
La moda es la nica medida que sirve tanto para el caso de variables categricas
como para variables cuantitativas, puesto que su definicin no exige ordenar los
valores de la variable, ni hacer operaciones matemticas con ellos. Por ejemplo, si
se est trabajando la distribucin de la variable nacionalidad para un determinado
conjunto de personas, no tiene ningn sentido hablar del promedio o de la mediana
de esa distribucin; en cambio si tiene sentido hablar de la moda.
Si se trabaja la distribucin de una variable cuantitativa, en principio tiene sentido
calcular la media, la moda y la mediana; pero para efectos prcticos, puede no
tenerlo. Entonces, hace falta desarrollar un cierto criterio para decidir en casos
particulares, cul es la mejor medida de tendencia central.
La media aritmtica es muy sensible a valores extremos. Entonces, si en una
distribucin hubiera presencia de dichos valores, la media no es la mejor de las
medidas de tendencia central. Por ejemplo en lo que sigue tenemos dos conjuntos de
datos, al triplicar el ltimo valor del conjunto2, el nico valor que se altera es la
media:
Media Mediana Moda
Conjunto1: 9,9,9,10,11,12,13,14,19
11.77
11
9
Conjunto2: 9,9,9,10,11,12,13,14,57
16
11
9
89

CAPITULO III

90

MEDIDAS DEPOSICIN Y DISPERSIN

Relacin entre la media mediana y moda


Puesto que las tres medidas de posicin tienen debilidades y fortalezas vale la pena
observarlos e interpretarlos en forma conjunta. Un forma de entender la relacin entre estos
tres es localizando los valores de cada uno de ellos en una distribucin de frecuencias.
La siguiente figura muestra las tres formas muy comunes de distribucin de frecuencias

Moda<Mediana< Media
Media=Mediana=Moda
Media<Mediana< Moda
(a)
(b)
(c)
En la distribucin de frecuencias (a) la posicin relativa de la media, mediana y moda
indica asimetra positiva
La distribucin de frecuencias (b) nos muestra que la media, mediana y moda de una
variable son iguales. Esta distribucin tiene forma de campana y se la conoce como
distribucin normal.(o campana de Gauss).
En la distribucin de frecuencias (c) la posicin relativa de la media, mediana y moda
indica asimetra negativa
Ejemplo 3.14
Con la base de DATOS1-maestra vamos a obtener la media aritmtica, la mediana, la
moda y el percentil 75 de la variable coeficiente de inteligencia usando el SPSS.
Solucin:
Al abrir la base de DATOS1-maestra y usar los comandos del SPSS de la pgina
salida del SPSS para la variable coeficiente de inteligencia es:

, la

Statistics
inteligencia
N
Mean
Median
Mode
Sum
Percentiles

Valid
Missing

75

70
0
101.79
100.00
100
7125
104.31

Al interpretar algunos resultados tenemos que:


Media:El coeficiente de inteligencia promedio de los estudiantes es 101.79 puntos.
Mediana: El 50% inferior de los estudiantes de maestra tienen un coeficiente de
inteligencia menor a 100 puntos.
Moda: La mayora de los estudiantes tiene coeficiente de inteligencia igual a 100 puntos.
90

CAPITULO III

91

MEDIDAS DEPOSICIN Y DISPERSIN

Percentil 75:El 75% de los estudiantes de maestra tienen un coeficiente de inteligencia


menor a104.3 puntos.
Ejemplo 3.15
Con la base de DATOS4- ciudadana obtendremos la media aritmtica, la mediana, la
moda, percentil 25 y el percentil 75 de la variable nmero de elecciones que asisti, usando
los comandos del SPSS.
Solucin:
Se abre la base de DATOS4-ciudadana y usando los comandos de la pgina , la salida
que proporciona el SPSS para la variable nmero de elecciones a las que asisti es la
iguiente:
Statistics
NMERO ELECCIONES QUE ASISTI
N
Valid
100
Missing
0
Mean
3.00
Median
3.00
Mode
3
Minimum
1
Maximum
5
Percentiles
25
2.00
75
4.00

Media:El nmero promedio de elecciones a la que asistieron representantes vecinales fue 3.


Mediana. El 50% de los representantes vecinales asistieron a menos de 3 elecciones.
Moda: La mayora de ciudadanos asisti a 3 elecciones
Percentil 25: El 25 % de los representantes vecinales asistieron a menos de 2 elecciones.
Percentil75:El 75 % de los representantes vecinales asistieron a menos de 4 elecciones.
Ejemplo 3.16
Con la base de DATOS3-educacin se obtendr la media aritmtica, la mediana, la moda y
los percentiles 10 y 90 para las variables edad, tiempo de servicio en la docencia y nota
promedio de los participantes, usando los comandos del SPSS.
Solucin:
Se abre la base de DATOS3-educacin y usamos los comandos de la pgina . En este
caso se selecciona las variables edad, tiempo de servicio en la docencia y nota promedio de
los participantes en el programa de capacitacin.
En el siguiente cuadro se presenta los resultados que proporciona el SPSS para las tres
variables .

91

CAPITULO III

92

MEDIDAS DEPOSICIN Y DISPERSIN

TIEMPO
EDAD DE LOS
DE
PARTICIPANTES SERVICIO
N
Valid
47
47
Mean
34.78
13.97
Median
34.84
14.00
Mode
30(a)
13(a)
Sum
1635
656
Percentiles 10
31.07
11.00
90
37.49
17.09
a Multiple modes exist. The smallest value is shown

NOTAS
PROMEDIO
47
11.536788
11.540694
8.8495(a)
542.2290
9.556556
13.417391

Media: La edad promedio de los participantes en el programa de capacitacin fue 34,78


aos, es decir 35 aos.
Mediana El 50% de los participantes en el programa de capacitacin tienen menos de 34.84
aos, es decir, 35 aos.
Moda: La mayora de los de los participantes tena 30 aos, pero la distribucin no es
unimodal, existen otras modas.
Percentil 10: El 10% de los participantes en el programa de de capacitacin tienen menos
de 31,07 aos, es decir 31 aos.

92

Das könnte Ihnen auch gefallen