Beruflich Dokumente
Kultur Dokumente
MEDIDAS DE RESUMEN
INTRODUCCIN. Son valores numricos que sirven para caracterizar un conjunto de
datos; es decir, que nos permiten describir el comportamiento de los datos. Se clasifican
en medidas de Tendencia Central, medidas de posicin, medidas de Dispersin y
medidas de Forma.
3.1. MEDIDAS DE TENDENCIA CENTRAL. Son medidas de resumen que nos indican
alrededor de qu valor se agrupan o concentran los datos. Son medidas de
Tendencia Central o Centralidad: la Media Aritmtica, la Mediana, la Moda, la Media
Geomtrica.
3.1.1.
Media Aritmtica. Conocida tambin como promedio o simplemente
media, se define como el cociente de la suma de los datos y el tamao de la
muestra. Sean los datos
define como:
X 1 X 2 X 3 ... X n
n
o, utilizando el signo de suma:
n
X
i 1
n
Media muestral:
,
Frmula para datos no agrupados o sin
tabular
(1)
Donde: n= Numero total de datos o tamao de la muestra.
N
Media poblacional:
X
i 1
n=6
90
15
6
117,1
14,6
8
Dados los siguientes datos: 20, 24, 22, 25, 28, 20, 20, 20, 22, 22, 20, 24, 25, 28,
20, 24, su media aritmtica es:
20 24 22 25 28 20 20 20 22 22 20 24 25 28 20 24
16
20 20 20 20 20 20 22 22 22 24 24 24 25 25 28 28
X
16
20(6) 22(3) 24(3) 25(2) 28(2)
X
16
(2)
120 66 72 50 56 364
X
22.75
16
16
X
20
24
25
X
i 1
fi
n
Frmula para Datos Agrupados o tambin llamados
tabulados (3)
La frmula (3) tambin puede utilizarse cuando los datos estn agrupados en una
distribucin de frecuencias, siendo los X i los puntos medios de los intervalos.
Dada la distribucin de frecuencias:
Intervalos
fi
Xi
10-16
7
13
16-22
13
19
22-28
15
25
28-34
10
31
34-40
5
37
50
Aplicando la frmula (3)
fi
7
13
15
10
5
50
Xifi
91
247
375
310
185
1208
1208
24.16
50
3,1
2,4
4,0
3,5
3,0
3,5
3,8
4,2
4,0
3.1.2.
Mediana
Mediana para datos no agrupados o tambin para datos agrupados sin
intervalos de clase.
Calcule la mediana de los siguientes datos:
A: 5, 7, 9, 11, 13n=5 Me=9
B: 8, 10, 11, 13, 15, 16 n=6
Me=(11+13)/2=12
C: 12, 7, 8, 10, 3, 5, 9, 15
c: 3,5,7,8,9,10,12,15
n=8
Me=(8+9)/2=8.5
La mediana es el valor que se encuentra en el centro de un conjunto ordenado
de datos. As, para obtener la mediana de un conjunto de datos, previamente
debe ordenarse los datos de menor a mayor. Luego debe determinarse el
n 1
lugar que ocupa la mediana calculando 2 . Si el nmero de datos es impar
n 1
2
El intervalo de la mediana es el
n 1
acumulada a Fi, la frecuencia acumulada menor tal que Fi > 2
n 1
Fi 1 )
2
LRI A
fi
Se utiliza la frmula: Me =
(
c)
Donde LRI: es el lmite real inferior del intervalo mediano.
A: la amplitud del intervalo mediano.
Fi-1 : frecuencia acumulada del intervalo que antecede al intervalo
mediano.
fi : es la frecuencia simple del intervalo mediano.
Ejemplo:
Intervalos fi
Fi
7-13
7
7
13-19
13
20
Fi-1
19-25
15
35
= Fi
25-31
10
45
31-37
5
50
n 1 50 1
25.5
2
2
busca en las frecuencias absolutas acumuladas
(25.5 20)
15
Me = 19 + 6
= 19 + 2.2
Me = 21.2 Significa que el 50% de los datos son menores que 21.2 y el
otro 50% de los datos son mayores que 21.2
Ejercicio. Calcule la mediana de los datos de la distribucin:
Intervalos
fi
3-11
5
11-19
7
19-27
8
27-35
13
35-43
17
43-51
10
3.1.3.
Moda
Moda para datos no agrupados o tambin para datos agrupados sin
intervalos.
Cul es la moda en los siguientes conjuntos de datos:
A : 3, 5, 7, 5, 8, 5, 2, 5
Mo=5 Distribucin unimodal
B: 5, 5, 3, 4, 7, 7, 7, 8, 5
Mo=5 y 7
Distribucin bimodal
C: 5, 3, 7, 9, 8, 1, 12, 11
No existe moda
Qu es moda?
La moda es el dato que ms se repite. Es el dato que tiene mayor frecuencia.
Cul es la moda en la distribucin:
Xi
4
6
8
10
12
14
fi
3
5
12
6
4
2
Mo=8 porque tiene la mayor frecuencia absoluta simple.
Moda en datos agrupados en intervalos:
Intervalos
fi
3-11
5
11-19
7
19-27
8
27-35
13=fi-1
35-43
17=fi
43-51
10=fi+1
Para hallar la moda se procede as:
a)Se determina el intervalo que contiene a la moda( intervalo de mayor frecuencia)
b)Se aplica la frmula:
1
)
2 donde
Mo = LRI + A ( 1
1 f i f i 1 y 2 f i f i 1
al modal.
Para el ejemplo, el intervalo modal es 35 -< 43, por lo tanto la moda es :
4
Mo = 35 + 8 ( 4 7 ) = 35 + 2.9 = 37.9
Ejercicio. Halle la moda de:
Intervalos fi
12- 17
5
17- 22
8
22- 27
15
27- 32
22
32- 37
17
37- 42
13
3.2
MEDIDAS DE POSICIN
Estas medidas, llamadas tambin Cuantiles, dividen a un conjunto de datos
ordenados en grupos iguales. Entre estas medidas tenemos a los cuartiles, a los
deciles y a los percentiles.
CUANTILES PARA DATOS SIN
AGRUPADOS SIN INTERVALOS:
AGRUPAR
TAMBIEN
PARA
DATOS
3.2.1 CUARTILES
Son tres valores Q1, Q2 y Q3 que dividen al conjunto de datos ordenados en
cuatro grupos iguales: _______ !_______!_______!______
25% Q1 25% Q2 25% Q3 25%
El cuartil 1, Q1 , es el valor que supera al 25% de los datos y es superado por el
75% de los datos.
Qu es el cuartil 2, Q2 ?
El cuartil 3, Q3 , es el valor que supera al 75% de los datos y es superado por el
25% de los datos.
Calculo del cuartil Qi
Se ordenan los datos.
Se ubica el lugar que ocupa el cuartil, calculando
i (n+ 1)
4
i = 1, 2, 3.
i(n+ 1)
4
donde i = 1, 2, 3. En
3 (12+ 1)
4
n=12
= 9.75
Es un valor que est entre el dato que se encuentra en el lugar 9 y el dato que
se encuentra en el lugar 10.
Q3 = 16 + 0.75 ( 20- 16)
Q3 = 16 + 3 = 19
Significa que el 75% de los datos son menores que 19 y el 25% de los datos
son mayores que 19.
3.2.2 DECILES
Son nueve valores D1, D2, , D9 que dividen a un conjunto ordenado de datos
en diez grupos iguales. Qu significa D2? Qu significa D6?
3.2.3 PERCENTILES
Son 99 valores P1, P2, , P99 que dividen a un conjunto ordenado de datos en
100 grupos iguales.
Qu significa P30? Qu significa el P80?
Podemos notar que el Q2 = Me, Q3 = P75 , Q1 = P25, P50 = D5 = Me
CUANTILES PARA DATOS AGRUPADOS EN INTERVALOS.
Hallando percentiles, hallamos tambin los deciles y cuartiles. Para hallar los
percentiles seguimos el procedimiento siguiente:
Para hallar el percentil Pr
1) Obtenemos las frecuencias absolutas acumuladas.
2) Identificamos el intervalo del percentil. Calculamos:
nr
100
3) Aplicamos la frmula:
nr
F i1
Pr = LRI + A ( 100
fi
nr
100
40 x 84
100
=33.6
33.620
15
-1
-2
-1.5
1.5
S2
1 1 4 4 2.25 2.25
5
= 2.9
S2
(X
X )2
n 1
S2
2
i
( X i ) 2
n 1
X i2
Xi
121
14641
14161
14884
13924
14042.25
14762.25
86414.5
119
122
118
118.5
121.5
720.0
La varianza es:
S2
86414.5
(720) 2
6
86414.5 86400
5
=
S = 2.9
Calcule la varianza para los datos del conjunto B.
Cmo se calcula la varianza para datos agrupados en una distribucin
de frecuencias?
Varianza para datos agrupados en una distribucin de frecuencias
La frmula que se utiliza es:
S2
X i2 f i
( X i f i ) 2
n 1
fi
Xi
5
7
8
13
17
10
60
fi
7
15
23
31
39
47
60
Xifi
5
7
8
13
17
10
1860
X i2 f i
35
245
105 1575
184 4232
403
12493
663 25857
470 22090
66492
(1860) 2
66492
2
60 66492 57660
S
59
59
= 149.69
La desventaja de la varianza es que est expresada en el cuadrado de las
unidades; es decir, si los datos estn dados en metros la varianza est dada en
m2 o si los datos estn dados en segundos la varianza est dada en segundos 2.
3.3.3 La desviacin estndar. Llamada tambin desviacin tpica, es la raz
cuadrada de la varianza. Se la denota con S. La desviacin estndar, a
diferencia de la varianza, se expresa en las unidades de los datos.
Para los datos agrupados, del ejemplo, su desviacin estndar es:
S=
149.69 = 12.23
S
x100%
C.V. = X
Expresa qu porcentaje de la media es la desviacin estndar.
Ejemplos, el coeficiente de variacin para el conjunto A es:
1.70
x100% 1.42%
C.V. = 120
La desviacin estndar es el 1.42% de la media.
Calcule el coeficiente de variacin para los datos de la distribucin de
frecuencias.
El coeficiente de variacin sirve para comparar la dispersin dos o ms
conjuntos de datos que tienen diferentes unidades de medidas.
Tambin sirve para comparar la dispersin de dos o ms conjuntos de datos
que difieren en media aritmtica.
Ejemplo:
Dados los conjuntos de datos:
A : 65, 68, 70, 64, 60
B: 7, 9, 5, 3, 10
que son los pesos, en kilogramos, de un conjunto de personas adultas y de un
conjunto de nios, respectivamente. En qu conjunto hay mayor dispersin?.
Las medias de los conjuntos son X A 65.4kg y X B 6.8kg y las desviaciones
estndar S A 3.85kg y S B 2.86kg , respectivamente. De acuerdo a las
desviaciones estndar podemos estar tentados a afirmar que en el conjunto A
hay mayor dispersin que en el conjunto B, Sin embargo, los coeficientes de
variacin nos permiten dar una respuesta correcta a la pregunta.
3.85
x100% 5.89%
C.V.A = 65.4
2.86
x100% 42.06%
C.V.B = 6.8
As=
Si
Si
Si
As
As
As
horizontales.
3 ( XM
d)
S
Para
este
Ap
Si
Si
Si
4
( X i X)
=
3
nS
3. La nota mnima para aprobar una asignatura es 11. Si un estudiante obtiene las
notas: 12, 08, 9.5, 13.5, 8.5, 10, 11.5, 14 en los trabajos mensuales de la
asignatura en cuestin. El estudiante fue aprobado?.
4. Dada la siguiente distribucin:
Xi
fi
1
2
2
4
3
7
4
3
5
3
Puntuacin
0-30
30-50
50-70
70-90
90-100
N de
empleados
94
140
160
98
8
Centro de la ciudad: 955 1000 985 980 940 975 965 999 1247 1119
Periferia: 750
755 725 705 694 725 690 745 575 800
a) Para cada conjunto de datos calcule: la media, desviacin estndar y
coeficiente de variacin.
b) Qu puede decirse acerca de los departamentos sin amoblar que rentan en el
centro de la ciudad y en la periferia? Compare las rentas de las dos reas.
11.Los siguientes datos representan muestras de 20 problemas que reportaron los
clientes en dos oficinas diferentes de una compaa telefnica, y el tiempo, que
tom resolverlos (en minutos)
Tiempo para resolver problemas en la central I
1.48 1.75 0.78 2.85 o.52 1.60 4.15 3.97 1.48 3.10
1.02 0.53 0.93 1.60 0.80 1.05 6.32 3.93 5.45 0.97
Tiempo para resolver problemas en la central II
7.55 3.75 0.10 1.10 0.60 0.52 3.30 2.10 0.58 4.02
3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0.72
Para cada una de las oficinas de la central telefnica:
a) Calcule: Media aritmtica, rango,
desviacin estndar y coeficiente de
variacin.
b) Con base en los resultados del inciso c) Existen diferencias entre las dos
oficinas?
12.La siguiente muestra representa las edades de 25 personas sometidas a un
anlisis de preferencias para un estudio de mercado:
25
19 21
35
44
20
27
32
38
33
18
30
19
29
33 26
24
28
39
31
31
18
17
30
27
Calcular e interpretar la media aritmtica y determinar la varianza.
13.Calcular la varianza de las siguientes cantidades medidas en metros: 3, 3, 4, 4, 5
14.Los siguientes datos son las calificaciones reportadas por el profesor:
Calificaci
ones
0-1
2-3
4-5
6-7
8-9
10-11
12-13
14-15
N Alumnos
1
1
3
0
5
4
6
10
17.Qu forma tiene las distribuciones descritas por las siguientes medidas de
tendencia central?:
a. Media = 46, Mediana = 42, Moda = 39.
b. Media = 3,1, Mediana = 3,1, Moda = 3,1.
c. Media = 105, Mediana = 110, Moda = 115.
18. Determine si las siguientes aseveraciones son verdaderas falsas. Una
aseveracin verdadera tiene que ser siempre verdadera.
a. El rango entre cuartiles es la mitad del rango.
b. El promedio est siempre entre el primer y tercer cuartil.
c. La mediana est siempre entre el primer y tercer cuartil.
d. La desviacin estndar de una distribucin simtrica es siempre igual al
rango entre cuartiles.
e. El promedio de una distribucin simtrica es siempre igual a la mediana.
19. Un Profesor le entrega las notas en el primer control y les dice que el promedio
fue de 5,7. Si usted obtuvo un 6,2:
a. Puede su nota ser la mxima?
b. Puede ser que el 50% de los estudiantes tuvieron mejor nota que usted?
c. Si adems el Profesor da la desviacin estndar, Con cul se sentira mejor:
con una desviacin estndar de 0,6 con una de 1,1? Explique.
20. Un estudio encontr que los estudiantes hombres de una Universidad pesaban
en promedio 66 kilos con una desviacin estndar de 9 kilos. Las mujeres
pesaban en promedio 55 kilos, con una desviacin estndar de 9 kilos.
a. Puede decir si el estudiante de ms peso es Un hombre una mujer?
Explique.
b. Encuentre el promedio y la desviacin estndar en libras (1 kg = 2,2 libras).
c. Si juntamos los hombres y las mujeres, la desviacin estndar ser: Menor
que, mayor que igual a 9?
21. Los estudiantes de Sociales siempre manifiestan que tienen mayor dificultad
en los cursos que involucre el tratamiento de clculos matemticos, es por ello
que se realiz una medicin de la memoria en estudiantes de primer ao de la
carrera. La experiencia consisti en exponer 10 palabras y 10 nmeros ante
los estudiantes durante 10 segundos. Despus de cuatro das de clases, se
pidi a los alumnos que recordaran las palabras y nmeros que se haban
mostrados previamente, registrndose los siguientes resultados: