Beruflich Dokumente
Kultur Dokumente
69
MEDIDAS DE POSICION
INTRODUCCION
Hasta ahora para describir un conjunto de datos, se han empleado las tablas y los grficos.
Estos son tiles para dar rpidamente una visin general del comportamiento de los valores
que asume una variable, as, en el caso de variables categricas, los diagramas son
suficientes para dar una descripcin completa de las mismas..
Sin embargo, para describir el comportamiento de variables cuantitativas, en general se
requiere una mayor precisin que la que puede proporcionar un grfico, es importante que
esa descripcin trascienda los lmites de lo visual y lo subjetivo en cuanto sea posible.
Como solucin a la situacin planteada, surgen las medidas de posicin y de dispersin,
para describir las caractersticas de las distribuciones en forma cuantitativa. Ms
exactamente, la precisin que es deseable obtener al describir el conjunto de datos
numricos se refiere a dos aspectos, cada uno de los cules se puede traducir en una
pregunta:
Existe algn valor de la variable que represente a la mayora de los valores del conjunto
de datos?.
Qu tan separados estn entre si, los diferentes valores que asume la variable respecto al
valor de la variable que representa a los datos?.
La primera pregunta se refiere a las medidas de posicin y la segunda, a las llamadas
medidas de dispersin.
As tambin, un investigador del campo educativo puede realizar una investigacin para
determinar si las aptitudes matemticas son diferentes segn el sexo de los estudiantes. Este
investigador tendr dos conjuntos de calificaciones, luego obtendr la calificacin
promedio de cada grupo y har la comparacin de los promedios. La variabilidad de los
datos es otro aspecto importante que el investigador debe de considerar, as, necesita saber
si las calificaciones son uniformes o vara entre los estudiantes del sexo femenino y del
sexo masculino.
MEDIDAS DE POSICION
En el campo social y educativo las medidas de tendencia central que se usan ms
frecuentemente son la media aritmtica, la mediana, los percentiles y la moda. A
continuacin desarrollaremos dichos temas.
MEDIA ARITMETICA
Definicin
Si x1 ,...., xn son los valores observados de una variable, la media aritmtica o
simplemente media o promedio de estos datos se define como el cociente de la suma de
todos los valores observados entre el nmero de datos o tamao de la muestra. Su expresin
matemtica es:
69
CAPITULO III
70
x1 x 2 ... x n 1 n
xi ,
n
n i 1
donde n es el nmero total de observaciones .
X
(3.1)
x w
Xw
i 1
k
(3.2)
w
i 1
Examen final
18
14
Promedio prcticas
13
17
Solucin:
a) Obtengamos el promedio ponderado del primer estudiante. Aplicando la frmula (3.2) se
tiene:
k
Xw
x w
i 1
k
w
i 1
= Xw
Si calculamos la media aritmtica de las notas del primer estudiante, obtendramos 14.5
puntos.
70
CAPITULO III
71
1 k
xi f i
n i 1
(3.3)
Ejemplo 3.2
En la tabla 2.1 se tiene la distribucin de frecuencias del nmero de hijos de los estudiantes
de maestra. Encontraremos el nmero promedio de hijos.
Tabla 2.1 Nmero de hijos de los estudiantes de maestra
En la distribucin de frecuencias del nmero de hijos de los estudiantes de maestra,
ncontraremos el nmero promedio de hijos.
xi
fi
2
11
11
3
3
30
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
Solucin:
Como los datos se encuentran tabulados usaremos la expresin (3.3) para obtener la media
aritmtica. Los clculos auxiliares se presentan en la siguiente tabla.
xi
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
fi
2
11
11
3
3
xi f i
0
11
22
12
15
71
CAPITULO III
72
Total
30
60
2 hijos.
30
30
n i 1
estudiantes de la maestra tienen 2 hijos.
En
promedio
los
1 k '
xi f i , xi' es la i - sima marca de clase
n i 1
(3.4)
Ejemplo 3.3
En la Tabla 3.1 se tiene las edades de un grupo de estudiantes de maestra de la Facultad de
Educacin matriculados en el semestre 2003-I. Obtengamos la media aritmtica.
.Tabla 3.1 Edad de los estudiantes de la maestra en
educacin matriculados en el 2003-I.
Edades
Marca de
Frecuencia
Li 1 , Li
clase
Absoluta
23
32
41
50
59
32
41
50
59
68
x i'
fi
27.5
36.5
45.5
54.5
63.5
6
12
8
2
2
Solucin:
Como los datos se presentan agrupados en intervalos de clase usaremos la expresin (3.4).
Los clculos auxiliares se presentan en la siguiente tabla.
Edades
Li 1 , Li
23 32 41 50 59 Total
32
41
50
59
68
Marca de
clase
Frecuencia
Absoluta
x i'
fi
27.5
36.5
45.5
54.5
63.5
6
12
8
2
2
30
72
xi' f i
165.0
438.0
364.0
109.0
127.0
1203.0
CAPITULO III
73
1 n '
xi f i
n i 1
27.5(6) 36.5(12) 45.5(8) 54.5( 2) 63.5(2) 1203
edad
x
i 1
X fi 0
Demostracin
k
x
i 1
X fi
x
i 1
fi X
f
i 1
n X n X 0 , puesto que X
x
i 1
fi
Ejemplo:
Las siguientes observaciones corresponden a la variable nmero de inasistencias a clases
durante un ao escolar, en un grupo de 20 estudiantes.
xi
fi
1
3
3
4
6
8
7
3
8
2
Solucin.xi
fi
xi f i
1
3
1 *3=3
3
4
3 *4=12
6
8
6 *8=48
7
3
7 *3=21
8
2
8 *2=16
Total
100
k
1
100
X xi f i
5 inasistencias en promedio durante el ao escolar.
20
n i 1
k
x
i 1
X f i 1 5 3 3 5 4 6 5 8 (7 5)3 (8 5) 2 12 8 8 6 6 0
2. La suma de los cuadrados de las desviaciones de todos los valores con respecto a la
media es mnima. Cuya expresin matemtica es:
73
CAPITULO III
x
i 1
74
X f i es mnima
2
Ejemplo
Aplicaremos la propiedad a la distribucin de frecuencias del nmero de inasistencia a
clases:
1
3
xi
fi
3
4
6
8
7
3
8
2
Solucin:
Calculando los cuadrados de las desviaciones con respecto a la media y tambin con
respecto a cada uno de los valores de la variable se tiene:
xi
f i ( xi X ) 2 f i
1
3
6
7
8
Total
3
4
8
3
2
(1-5)2 *3=48
(3-5)2 *4=16
(6-5)2 *8=8
(7-5)2 *3=12
(8-5)2 *2=18
102
( xi 1) 2 f i
( xi 3) 2 f i
( xi 6) 2 f i
( xi 7) 2 f i ( x i 8) 2 f i
0
16
200
108
98
422
12
0
72
48
50
182
75
36
0
3
8
122
108
64
8
0
2
182
147
100
32
3
0
282
X global
ni X i
n1 X 1 n2 X 2 ... nk X k
i 1
k
n1 n2 ... nk
ni
i 1
fi
xi f i
74
CAPITULO III
1
3
6
Total
75
3
4
8
15
1 *3=3
3 *4=12
6 *8= 48
63
X1
63
=4.2
15
n1=15
Muestra 2:
xi
fi
7
8
Total
X2
3
2
5
37
7 .4
5
xi f i
7 *3=21
8 *2=16
37
n2 =5
5
n1 n2
15 5
20
20
Hemos encontrado el mismo valor de la media de la muestra original, verificando as la
propiedad 3.
Ejemplo
La siguiente distribucin corresponde a las calificaciones en el curso de ingls de un grupo
de 25 estudiantes.
xi f i
Calificaciones Nmero
xi
de
estudiantes
fi
10
3
30
20
5
100
30
8
240
40
6
240
50
3
150
Total
25
760
La media de las calificaciones del curso de ingls es X 30.4 puntos.
Si el profesor opta por duplicar la calificacin a cada estudiante, cul ser la nueva media?
La forma ms rpida de obtener la nueva media ser aplicando la presente propiedad. Como
el profesor a cada estudiante le duplica la calificacin la constante es C=2., luego esta
constante ser multiplicada por la media de las calificaciones, es decir:
Y C X =2(30.4)=60.8. La nueva media de las calificaciones es Y =60.8.
75
CAPITULO III
76
526
35.06 caloras.
15
76
CAPITULO III
77
Si n es impar :
Me x n 1
(3.5)
Si n es par :
x n x
Me
1
2
donde el subndice indica la posicin o lugar que ocupa el valor de la variable ordenada .
Si la muestra es de tamao impar, como por ejemplo: 13 11 19 20 18 21 23, donde
n 1
4 , por lo que la mediana es el valor de la variable que ocupa la
2
posicin 4 de las observaciones ordenadas: 11 13 18 19 20 21 23 . Me x 4 = 19.
n = 7, entonces
n
2
si
Fi 1
n
Fi
2
(a)
o
x xi
Me i 1
2
(3.6)
si
Fi-1
n
Fi
2
(b)
Ejemplo 3.4
Con la distribucin del nmero de hijos de los estudiantes de maestra presentados de la
Tabla 2.1 vamos a ilustrar la obtencin de la mediana.
77
CAPITULO III
78
Solucin:
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
y luego calcular
fi
Fi
2
11
11
3
3
30
2
13
24
27
30
F2
F3
n
n
30
15 .
, es decir,
=
2
2
2
que, Fi 1 13
n 30
15 ,se
=
2
2
fi
Fi
2
13
9
3
3
30
2
15 F2
24 F3
27
30
cumple que
n
2
coincide con
Fi 1
esto es,
n
15 Fi 24 . Usando (3.6(b)), ubiquemos los valores de la variable
2
Fi y Fi 1 . El valor de la variable asociada a la frecuencia absoluta
asociados a
acumulada Fi = F3 =24 es x3 =2, y el valor de la variable que corresponde a Fi 1 13
Fi 1 15
x 2 x3 1 2
CAPITULO III
79
Me Li 1 2
Fi Fi 1
Me Li 1
ai
Si Fi 1
n
Fi
2
(3.7)
Si Fi 1
n
Fi
2
donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai
es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi
Ejemplo 3.6
Obtengamos la mediana a partir de la distribucin de edad de los estudiantes de maestra
presentados en la Tabla 3.1
Solucin:
Para obtener la mediana previamente se calcula las frecuencias absolutas acumuladas como
se muestra a continuacin:
Edades
Al calcular
Li 1 , Li
Frecuencia
absoluta
Frecuencia absoluta
acumulada
fi
Fi
23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total
6
12
8
2
2
30
6 F1
18 F2
26
28
30
n 30
n
n
30
79
CAPITULO III
Entonces,
80
usando
(3.7),
el
valor
15 6
9 32 6.75 38.75 .
18 6
Me 32
de
la
mediana
es
Al calcular
Li 1 , Li
Frecuencia
absoluta
Frecuencia absoluta
acumulada
fi
Fi
23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total
6
9
11
2
2
30
6
15 F2
26 F3
28
30
n 30
n
15 , se cumple que
2
2
2
n
15 < Fi = 26. El intervalo de clase asociado a la frecuencia absoluta acumulada Fi =
2
F3 =26 es 41, 50 , luego usando (3.7) la mediana es Me Li 1 L2 41 . El 50% de
(3.8)
Cuando todas las puntuaciones de un conjunto de datos tienen la misma frecuencia, ste
no tiene moda. Tambin existen situaciones donde se tiene ms de una moda, en tal caso
diremos que la distribucin de frecuencias es bimodal, trimodal, multimodal.
As, para el conjunto de datos 10 11 11 12 13 09 15 la moda es Mo 11 (unimodal);
mientras que en el conjunto de valores observados 10 11 12 13 09 y 15 no existe moda.
Si el conjunto de datos es 11 11 11 12 12 12 05 04 , las modas son Mo 11 y
Mo 12 (bimodal).
A continuacin se presentan los mtodos de obtencin de la moda cuando se tiene un
mayor nmero de datos, razn por la cual previamente han sido tabulados.
80
CAPITULO III
81
si f i f i 1
f i f i 1
(3.9)
donde:
f i 1 : frecuencia absoluta inmediatamente anterior a f i
f i 1 : frecuencia absoluta inmediatamente posterior a f i
Ejemplo 3.8
Con los datos presentados en el ejemplo 3.5 vamos a ilustrar la obtencin de la moda.
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
fi
2
13
9
3
3
Solucin
Para calcular la moda, observamos la columna de frecuencias absolutas y vemos que la
mayor frecuencia corresponde a f 2 = 13. Por lo tanto el valor de la moda es x2 =1, es
decir Mo 1 .
Ejemplo 3.9
Con los datos de la siguiente tabla ilustraremos nuevamente la obtencin de la moda.
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Solucin:
81
fi
2
11
11
3
3
CAPITULO III
82
d1
d1 d 2
M o Li 1
a i
(3.10)
donde:
Li 1
fi
es la mayor frecuencia
Frecuencia
Li 1 , Li Absoluta
fi
23 - 32
32 - 41
6
12
82
CAPITULO III
41 - 50
50 - 59
59 - 68
83
8
2
2
Solucin:
Para obtener la moda se procede de la siguiente manera:
Se encuentra el valor de la mayor frecuencia absoluta, f 2 12 . El intervalo con mayor
frecuencia es 32 , 41 , su amplitud igual
a 9 y su lmite inferior es 32,
f i 1 6 , f i 1 8 entonces: d1= 12-6=6, d2= 12-8=4 .
Luego el valor de la moda es:
d1
6
ai =
32
9 32 5.4 37.4 aos.
6
d1 d 2
frecuente es 37.4 aos, es decir 37 aos.
M o Li 1
La
edad
ms
Ejemplo 3.10
En una muestra de 30 estudiantes, la variable disposicin para el estudio permiti establecer
la siguiente distribucin de frecuencias.
Nmero de estudiantes
2
7
5
9
7
Porcentajes
0.067
0.233
0.167
0.300
0.233
Podemos afirmar que con mayor frecuencia, 9 estudiantes respondieron tener muy buena
disposicin para el estudio. Luego la moda es muy buena disposicin para el estudio.
Cabe indicar que en este ejemplo, tenemos la distribucin de una variable cualitativa, luego
la moda es la nica estadstica de posicin que podemos calcular cuando se tiene una
variable cualitativa.
CUARTILES
Son nmeros que dividen la distribucin de frecuencia de un conjunto de datos en cuatro
partes iguales. Ellos son:
El cuartil dos, Q2 , es el punto por debajo del cul se ubica el 50% de los datos.
CAPITULO III
84
1
n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil uno. Si la posicin se encuentra a
mitad entre dos enteros el cuartil uno es el promedio de los dos valores correspondientes.
Para el cuartil dos (mediana) usar (3.5)
Para el cuartil tres calcular
3
n 1 y redondear al entero ms cercano. La observacin
4
ordenada que ocupa esta posicin, representa el cuartil tres. Si la posicin se encuentra a
mitad entre dos enteros el cuartil tres es el promedio de los dos valores correspondientes.
Ejemplo 3.11
Para los siguientes conjuntos de datos
a) 13 11 19 20 18 21 23
b) 11 13 18 19 20 21 23.
Obtendremos el cuartil uno, el cuartil tres y la mediana.
Solucin.
a) Si tenemos la siguiente muestra de datos:13 11 19 20 18 21 23, donde n=7, entonces,
para encontrar el cuartil uno calculamos
n 1 7 1
n 1
7 1
x 4 19
3
n 1 = 3 7 1 6 luego el cuartil tres es
4
4
n 1 6 1
84
CAPITULO III
85
3
n 1 = 3 6 1 5.25 luego el entero ms
4
4
cercano es 5 por lo que el cuartil tres es Q3 x 5 16
n
1
2
6
1
2
x 3 x 4
2
10 13
11.5
2
Para obtener los cuartiles a partir de una distribucin de frecuencias, se procede como en
el caso del calculo de la mediana teniendo en cuenta que la fraccin n/2 ser cambiada por
las fracciones
n
,
4
2n
,
4
3n
segn
4
n
4
si Fi 1
n
Fi
4
o
Q1
x i 1 x i
2
si Fi-1
n
Fi
4
(3.11)
II. Para encontrar el cuartil tres:
1) Encontrar las frecuencias absolutas acumuladas
2) Encontrar
3n
4
85
CAPITULO III
86
si Fi 1
3n
Fi
4
o
Q3
xi 1 xi
2
si Fi-1
3n
Fi
4
(3.12)
Ejemplo 3.12
Con la distribucin del nmero de hijos de los estudiantes de maestra vamos a ilustrar la
obtencin del cuartil uno y el cuartil tres.
Solucin:
a) Cuartil uno.
Primero debemos encontrar las frecuencias absolutas acumuladas como se muestra a
continuacin:
Nmero se hijos
x1 =0
x2 =1
x3 =2
x4 =4
x5 =5
Total
y luego calcular
fi
Fi
2
11
11
3
3
30
2
13
24
27
30
n
n
30
7.5 .
, es decir,
=
4
4
4
forma que, Fi 1 2
mximo un hijo.
86
CAPITULO III
87
b) Cuartil tres.
Despus de encontrar la frecuencia absoluta acumulada como se muestra en la tabla
siguiente:
fi
Fi
Nmero se hijos
2
2
x1 =0
x2 =1
11
13
x3 =2
11
24
x4 =4
3
27
x5 =5
3
30
Total
30
Calculamos
3n
3n 3 30
es decir
=
=22.5.
4
4
4
forma que, Fi 1 13
hijos.
Clculo de los cuartiles a partir de una distribucin de frecuencias para datos
agrupados en intervalos de clase
Se procede como en el caso del clculo de la mediana teniendo en cuenta que la fraccin
n
n 2n 3n
incluida en la frmula (3.7) ser cambiada por las fracciones
,
,
segn se
2
4
4
4
CAPITULO III
88
2) Obtener la fraccin k
n
donde k puede tomar los valores k = 1, 2,. . . ,99
100
si Fi 1
kn
Fi
100
o
Pk
(3.13)
xi 1 xi
2
si Fi-1
kn
Fi
100
n
Fi 1
100
Fi Fi 1
Pk Li 1
Pk Li 1
a
i
Si Fi 1
kn
Fi
100
(3.14)
Si Fi 1
kn
Fi
100
donde:
Li 1 es el lmite inferior del intervalo asociado a la frecuencia absoluta acumulada Fi
ai
es la amplitud del intervalo asociado a la frecuencia absoluta acumulada Fi
Ejemplo 3.13
Considerando los datos de la edad de los estudiantes de maestra vamos a obtener el
percentil 75 P75.
Previamente se calculan las frecuencias absolutas acumuladas como se muestra a
continuacin,
Edades
Frecuencias
Frecuencia absoluta
Li 1 , Li
absoluta
acumulada
fi
88
Fi
CAPITULO III
23 - 32
32 - 41
41 - 50
50 - 59
59 - 68
Total
y al calcular k
89
6
12
8
2
2
30
6
18
26
28
30
n
n
30
75
22.5 , se cumple Fi 1 = 18 < k
22.5 < Fi = 26,
100
100
100
41.
Entonces,
usando
Pk Li 1
n
k
Fi 1
100
Fi Fi 1
30
22.5 . La amplitud del intervalo es 9 y el lmite
100
(3.14),
el
valor
del
percentil
75
P 75,
es
22.5 18
4.5
a
9 41
9 46.1 .
i = 41
26 18
El 75% de
CAPITULO III
90
Moda<Mediana< Media
Media=Mediana=Moda
Media<Mediana< Moda
(a)
(b)
(c)
En la distribucin de frecuencias (a) la posicin relativa de la media, mediana y moda
indica asimetra positiva
La distribucin de frecuencias (b) nos muestra que la media, mediana y moda de una
variable son iguales. Esta distribucin tiene forma de campana y se la conoce como
distribucin normal.(o campana de Gauss).
En la distribucin de frecuencias (c) la posicin relativa de la media, mediana y moda
indica asimetra negativa
Ejemplo 3.14
Con la base de DATOS1-maestra vamos a obtener la media aritmtica, la mediana, la
moda y el percentil 75 de la variable coeficiente de inteligencia usando el SPSS.
Solucin:
Al abrir la base de DATOS1-maestra y usar los comandos del SPSS de la pgina
salida del SPSS para la variable coeficiente de inteligencia es:
, la
Statistics
inteligencia
N
Mean
Median
Mode
Sum
Percentiles
Valid
Missing
75
70
0
101.79
100.00
100
7125
104.31
CAPITULO III
91
91
CAPITULO III
92
TIEMPO
EDAD DE LOS
DE
PARTICIPANTES SERVICIO
N
Valid
47
47
Mean
34.78
13.97
Median
34.84
14.00
Mode
30(a)
13(a)
Sum
1635
656
Percentiles 10
31.07
11.00
90
37.49
17.09
a Multiple modes exist. The smallest value is shown
NOTAS
PROMEDIO
47
11.536788
11.540694
8.8495(a)
542.2290
9.556556
13.417391
92