Beruflich Dokumente
Kultur Dokumente
, puesto que
f
=
n
f
*
i
i
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 30
en donde
m es el nmero de clases
x
i
la marca de clase de la clase i, y
f
i
la frecuencia de la clase i
b) Mediana
Es el valor que divide al conjunto de datos de la muestra en dos conjuntos de igual
tamao, es decir, es aquel valor para el cual existen el mismo nmero de datos
menores o iguales a l que mayores o iguales a l. En otras palabras, la mediana es
aquel valor para el cual el 50% de los datos son menores o iguales a l.
Para calcular la mediana de la muestra cuando los datos no se encuentran agrupados
en una tabla de distribucin de frecuencias, se deben seguir los siguientes pasos:
1.- Se ordenan los datos en forma creciente.
2.- Una vez ordenados se tienen dos casos:
a) Si el nmero de datos es impar, la mediana es el valor central; aquel que se
encuentre en el lugar
2
1 n +
en la ordenacin. Esto es:
2
x
= x
~
1 n+
b) Si el nmero de datos es par, la mediana ser el promedio de los dos datos
centrales en la ordenacin, es decir, de la datos que se encuentren en los
lugares
2
n
y 1
2
n
+ .
2
x
+
x
= x
~
1 +
2
n
2
n
Ejemplo:
En un proceso de manufactura, se observa el nmero de veces al mes que se detiene
el proceso durante un perodo de un ao, debido a fallas mecnicas de la maquinaria.
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 31
Los datos obtenidos son los siguientes: 7, 4, 1, 3, 9, 2, 7, 8, 0, 7, 3, 2. Obtenga la
mediana del nmero de fallas.
Resolucin:
1) Ordenando los datos de menor a mayor se tiene:
0, 1, 2, 2, 3, 3, 4, 7, 7, 7, 8, 9
2) Dado que el nmero de datos es par, la mediana ser el promedio de los datos
que ocupan los lugares n/2 y (n/2) + 1 en la ordenacin, es decir, la mediana
ser el promedio de los datos que ocupen los lugares 6 y 7 en la ordenacin.
3.5 =
2
4 + 3
= x
~
Si los datos se encuentran agrupados, para obtener la mediana se debe realizar una
interpolacin en la ojiva, como se indica a continuacin:
1.- Identificar la clase en la que se alcanza el 50% de los datos. Esta clase recibe el
nombre de clase mediana.
2.- Graficar la ojiva correspondiente a la clase mediana.
F
i + 1
F
i
(0.5)n
Frecuencia Acumulada
Lmites de clase
L
i
+ 1
L
i
Mediana
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 32
2
n
=
F
;
F
-
F
F
-
F
=
L
-
L
L
- x
~
50%
i 1 i+
i 50%
i 1 i+
i
F
-
F
F
-
2
n
=
L
-
L
L
- x
~
i 1 i+
i
i 1 i+
i
L
+
F
-
F
)
L
-
L
)(
F
-
2
n
(
= x
~
i
i 1 i+
i 1 i+ i
en donde:
L
i
es el lmite inferior de la clase mediana
L
i+1
es el lmite superior de la clase mediana
F
i
es la frecuencia acumulada hasta L
i
F
i+1
es la frecuencia acumulada hasta L
i+1
n es el tamao de la muestra
Ejemplo:
Los datos que se despliegan en la siguiente tabla de distribucin de frecuencias
provienen de un conjunto de observaciones de la duracin (en minutos) de las
llamadas telefnicas locales que se realizan en el D. F. Calcule la mediana de dichos
datos.
Lmites de
clase
Marca de
clase Frecuencia
Frecuencia
Acumulada
0 - 3 1.5 15 15
3 - 6 4.5 29 44
6 - 9 7.5 10 54
9 - 12 10.5 5 59
12 15 13.5 4 63
15 - 18 16.5 1 64
Resolucin:
La muestra es de tamao n = 64, por lo tanto, n/2 = 32
Por lo anterior, la clase mediana es la segunda, esto es, la mediana est entre 3 y 6.
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 33
De donde, entonces,
( )
L
+
F
-
F
L
-
L F
-
2
n
= x
~
i
i 1 i+
i 1 i+ i
,
_
= 4.7586 3 +
15 - 44
3) - 15)(6 - 32 (
c) Moda
Se denota como m
o
y es aquella observacin que se repite con mayor frecuencia
dentro de la muestra. Puede existir ms de una moda en una misma muestra. De los
datos agrupados se puede considerar como moda, la marca de clase del intervalo con
mayor frecuencia.
Es importante hacer notar que a diferencia de la media aritmtica y la mediana, la
moda no necesariamente es un valor nico. Esto significa que en un mismo conjunto de
datos, pueden existir varias modas, aunque tambin puede ser nica.
2.- MEDIDAS DE DISPERSIN
Existen varias medidas de dispersin, y algunas de ellas (la mayora) se miden con
respecto a la media por ser esta ltima una medida que se encuentra alrededor del
centro del rango de la muestra, y considerarse una medida representativa de los datos.
Estas medidas nos permiten, adems de describir el comportamiento de la muestra,
44
15
32
Frecuencia Acumulada
Lmites de clase
6 3
x
~
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 34
validar la representatividad de la media como caracterstica de todo el conjunto de
datos.
Rango
Tal vez la medida de tendencia central ms simple sea el rango que se defini para
construir la tabla de distribucin de frecuencias. Es una medida de dispersin
interesante, ya que proporciona informacin inmediata acerca de la variabilidad que
tienen los datos entre s.
Como se dijo antes, el rango se define como la diferencia entre los datos mayor y
menor en la muestra, esto es:
Rango = Dato mayor en la muestra - dato menor en la muestra.
Aunque el rango es una medida importante de dispersin, existen otras medidas, que
proporcionan informacin adicional acerca de dicha variabilidad, algunas de ellas las
definiremos a continuacin. Veamos:
Sean x
i
, i = 1, 2, ..., n los datos de la muestra. Para medir la dispersin promedio de los
datos con relacin a la media de la muestra, pensaramos inmediatamente en lo
siguiente:
n
) x -
x
(
i
n
1 = i
,
sin embargo, si desarrollamos dicha suma, encontramos que se anula,
independientemente de cuales sean los datos considerados, ya que :
x
x
= ) x -
x
(
n
1 = i
i
n
1 = i
i
n
1 = i
-
pero por definicin x n x
n
x
= x = _ i
n
1 = i
i
n
1 = i
de donde: 0 = x n - x n = ) x -
x
(
i
n
1 = i
esto es: 0 = ) x -
x
(
i
n
1 = i
m d
Si los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la
expresin para el clculo de la desviacin media se transforma en
n
f
| x -
x
|
= . .
i i
m
1 = i
m d
en donde m es el nmero de clases, x
i
es la marca de la clase i, y f
i
es la frecuencia
de la misma clase.
2) Utilizar una funcin cuadrtica. Esta es probablemente la forma ms
generalizada de resolver el problema.
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 36
Varianza:
Si x
i
(i=1,2,3,..,n) son los datos de la muestra, se define la varianza de la muestra (s
2
)
como:
s
2
=
n
) x -
x
(
2
i
n
1 = i
en tanto que si los datos se tienen en forma agrupada, se calcular la varianza como
se indica a continuacin:
s
2
=
n
f ) x -
x
(
i
2
i
m
1 = i
donde x
i
son los datos en la muestra y n es el tamao de la muestra.
Si los datos se encuentran en forma agrupada:
m'
r
=
f
f
x
i
m
1 = i
i
r
i
m
1 = i
donde x
i
son marcas de clase, f
i
son las frecuencias de clase y m es el nmero de
clases
El r-simo momento o momento de orden r, de la muestra con respecto a la media se
define como:
Si los datos se encuentran sin agrupar:
m
r
=
n
) x -
x
(
r
i
n
1 = i
donde x
i
son datos de la muestra y n es el tamao de la muestra.
Si los datos se encuentran agrupados:
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 38
m
r
=
f
f
) x -
x
(
i
m
1 = i
i
r
i
m
1 = i
donde x
i
es la marca de clase, f
i
la frecuencia y m el nmero de clases.
As la varianza es el segundo momento respecto a la media y la media es el primer
momento respecto al origen.
3.- PARMETROS DE FORMA
Coeficiente de sesgo o asimetra
El coeficiente de sesgo se denota por "a" y se define como: a =
s
m
3
3
, donde m
3
es el
tercer momento respecto a la media.
De esta forma, si: a < 0 Sesgo negativo
a > 0 Sesgo positivo
a = 0 Simtrica
Curva Simtrica
Curva Asimtrica (Sesgo positivo)
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 39
Coeficiente de curtosis
Es una medida del grado de apuntamiento de una distribucin. Se denota por k.
k =
s
m
4
4
k
'
>
<
a mesocrtic 3
ca leptocrti 3
ca platicrti 3
0
0.2
0.4
0.6
0.8
1
-4 -2 2 4
x
Distribucin Mesocrtica
0
0.2
0.4
0.6
0.8
1
-4 -2 2 4
x
Distribucin Leptocrtica
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 40
Ejemplo:
Una muestra de 20 trabajadores de una Ca. obtuvieron los siguientes salarios en un
mes determinado: $240000, $240000, $240000,$240000, $240000, $240000, $240000,
$240000, $255000, $255000, $265000, $265000, $280000, $280000, $290000,
$300000, $305000, $325000, $330000, $340000.
Calcular: la media, mediana, moda, varianza, desviacin estndar, coeficiente de
desviacin, rango, coeficiente de sesgo, coeficiente de curtosis. Qu puede decir
acerca de los salarios?
Resolucin:
a)Media:
20
340000 330000 325000 305000 300000 290000 2(280000) 2(265000) 2(255000) 8(240000) + + + + + + + + +
x = 270,500
b) Mediana: 260000 =
2
265000 + 255000
=
2
x
+
x
= x
~
+1
2
n
2
n
c) Moda = 240,000
Distribucin Platicrtica
0
0.2
0.4
0.6
0.8
-4 -3 -2 -1 1 2 3
x
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 41
d) Varianza: 000 1,097,250, =
20
) x -
x
(
=
s
2
i
20
1 = i 2
e) Desviacin Estndar: s = 33,124.76
f) Coeficiente de variacin: c.v.=
x
s
= 0.1225 = 12.25%. Esto es que los datos se alejan
de la media un 12.25 %.
g) Rango= 100,000
h)Coeficiente de sesgo:
s
m
= a
3
3
20
) x -
x
(
=
m
3
i
20
1 = i
3
x
Moda: Primera marca de clase. Mo=245,500
Mediana: 256,000 = x
~
Rango= 361,000 235,000 = 126,000
Varianza: 500 1,158,727, =
20
10 2.3175E
=
20
f
) 273,850 -
x
(
=
s
i
2
i
11
1 = i 2
+
3 0.83310573 =
) 67 (34,040.08
13 3.286E
= a
3
+
por lo tanto tiene un sesgo positivo
Coeficiente de curtosis:
s
m
= k
4
4
Estadstica Estadstica Descriptiva
M. en I. Isabel Patricia Aguilar Jurez 43
18 3.15764E =
20
19 6.31528E
=
f
i
11
1 = i
f
i
)
4
x -
x
i
(
11
1 = i
=
m
4
+
+
) ( =
s
4
4
7 34,040.086
k = 2.351796702 ; k < 3 , por lo tanto es platicrtica.