Beruflich Dokumente
Kultur Dokumente
Hemos visto que la información se organiza resumiéndola a través de tablas de 1. La suma de las desviaciones de los datos con respecto a la media es
frecuencias y de la representación gráfica. Existen algunas medidas que en cero.
forma muy directa pueden indicar rasgos importantes de la muestra, como su
magnitud, su homogeneidad, su simetría, etc. − = , la verificación puede hacerse en forma sencilla:
=
La media aritmética de una muestra de datos: se define como: 2. Si todos los datos son iguales a k, es decir, una constante,
entonces: = , Veamos:
+ + + =
= = =
= = =
= = = =
Si los datos corresponden a una variable discreta que está organizada
en una tabla de frecuencias, se puede escribir: 3. Si todos los datos de una muestra se multiplican por una constante k, el
promedio de dicha muestra resulta multiplicado por la misma constante, es
decir:
=
=
= Si = = =
, donde m representa el número de
=
valores distintos que toma la variable .
= = =
= = = =
Ejemplo 1
Ejemplo 2
1 1 0,1 Se ha tomado una muestra de parejas de casados y se han observado las
= × + × + × + ×
2 4 0,4 = = = variables X e Y.
3 4 0,4
4 1 0,1 X : Ingreso mensual del esposo, Y : Ingreso mensual de la esposa
Se encontró que el ingreso promedio mensual de los esposos es Tabla 1
= $1.000.000 y de las esposas = $800.000.
Intervalo de Marca de Frecuencia Frecuencia
Si se define la variable ingreso familiar Z, como la suma de los ingresos de los clase Clase absoluta relativa
esposos, entonces el ingreso familiar de la pareja i será: Zi = Xi + Yi y el ′ (ni) (hi)
ingreso familiar promedio será: (10,20] 15 12 0.12
(20,30] 25 16 0.16
(30,40] 35 42 0.42
= + = $1.000.000 + $800.000 = $1.800.000
(40,50] 45 25 0.25
(50,60] 55 5 0.05
5. Si una muestra de n elementos, se divide en k submuestras excluyentes y
exhaustivas, que tienen n1, n2,...,,nk elementos (n1 + n2 +... + nk = n),
con promedios respectivamente, entonces el promedio de la × + × + × + × + ×
Entonces: = =
muestra global estará dado por:
+ + + La mediana (Me)
=
La mediana de una muestra se define como un valor Me, tal que supera no
Ejemplo 3
más de la mitad de los datos y es superado por no más de la mitad de los
Una muestra de 500 trabajadores tienen un salario promedio de $1.080.000, si datos.
el salario promedio de los hombres es $1.200.000, y el de las mujeres
$1.000.000, ¿cuántos hombres y mujeres hay? Ejemplo 1
Si n1 es el número de hombres y n2 el de mujeres, entonces: Supóngase que se tiene la siguiente muestra ordenada en forma ascendente:
2, 5, 7, 9, 11. Observe que el 7, éste supera dos datos (no más de la mitad) y
es superado por dos datos (no más de la mitad), así que Me = 7.
n1 + n2 = 500 (1)
× + ×
= (2) por ejemplo, sea la muestra 2, 5, 7, 9, 11, 15, al aplicar la definición al valor 7;
éste supera a 2 datos (no más de la mitad) y es superado por 3 datos (no más
de la mitad) esto implica que 7 es mediana. Al ensayar con el valor 9; éste
Resolviendo (1) y (2) se obtiene: n1 = 200 y n2 = 300 supera tres datos (no más de la mitad) y es superado por dos datos (no más de
la mitad), es decir que también 9 es mediana; nótese además que cualquier
punto de la recta real, que se encuentre entre 7 y 9, cumple con la definición,
Cálculo de la media aritmética para los datos agrupados en intervalos de en estos casos la mediana es el promedio de los dos datos que son medianos
clase (Variables Continuas). así pues:
+
Se puede calcular en este caso la media, en forma aproximada, usando = =
la propiedad 5 y el supuesto de que los datos en cada intervalo están
uniformemente distribuidos.
Cálculo de la mediana cuando los datos están agrupados en intervalos
de clases (Variables Continuas).
Donde m representa el número de
=
= = ⋅ intervalos de clase. La mediana es el punto cuya frecuencia Relativa acumulada es 50%,
= es decir la mediana es el valor x tal que:
Ejemplo 4
N(x) = o en forma equivalente: H(x) = 50%
Dada la siguiente distribución de frecuencias:
De acuerdo con esto el intervalo [Linf , Lsup) que contiene la mediana es Si se pretende formar una idea de la magnitud de los salarios de dicha
tal que: empresa, usando la media aritmética se tiene:
H(Linf ) < 50% y H(Lsup) ≥ 50% = = × + × + × +
=
Observe gráficamente: + × + ×
H(L i -1 ) 0.50 H(L i )
=
Ci
La mediana en cambio es más resistente a los valores extremos, en este caso,
la mediana corresponde al valor Me = $130.000.
$ 100.000 20 %
$ 120.000 10 %
$ 130.000 25 %
$ 150.000 40 %
$ 1.200.000 5%
100 %