Beruflich Dokumente
Kultur Dokumente
DISPERSIÓN
CIV – 282
UAJMS – 2017
Miden la dispersión de
los datos de una
muestra.
R = Xmáx – X min
Si el recorrido de la variable es mayor en un
conjunto de observaciones, que en otro, es de
suponer que la dispersión de datos sea superior en
uno que en otro.
Sin embargo en ciertas ocasiones este recorrido
ofrece una medida errónea de la dispersión, esto se
subsana al menos en parte, utilizando el recorrido
inter cuartílico.
RECORRIDO INTER CUARTILICO
Es la diferencia entre el 3er. y 1er.
cuartil, o también la diferencia entre los
percentiles 75avo y 25avo, es decir
RI = Q3 – Q1
RI = P75 – P25
RECORRIDO INTER DECIL
Qd = Q 3 – Q1
2
DM i 1
n
m
DM i 1
n
Esta última fórmula también se podría escribir:
m
DM hi yi y
i 1
17 1 1 xx i
18 2 2 DM i 1
n
20 4 4
26
22 6 6
DM 3,25
128 26 8
Respuesta:
ny
38 - 40 39 20 780
i i
40 - 42 41 10 410 3.572
42 - 44 43 5 215 y i 1
35,7
100
n 100
3.572
REGLA:
1. Conformar la tabla de distribución de frecuencias
2. Determinar la media aritmética
3. Encontrar las desviaciones de cada yi con respecto a la media
4. Tomar el valor absoluto de las desviaciones obtenidas
5. Multiplicar los valores absolutos obtenidos por ni y sumarlos.
Finalmente el resultado dividir por el Nro. total de
observaciones.
Intervalo yi ni yi.ni Yi - Y Yi - Y ni Yi - Y
28 - 30 29 8 232 -8 8 64
30 - 32 31 15 465 -6 6 90
32 - 34 33 15 495 -4 4 60
34 - 36 35 12 420 -2 2 70
36 - 38 37 15 555 0 0 0
38 - 40 39 20 780 2 2 40
40 - 42 41 10 410 4 4 40
42 - 44 43 5 215 6 6 30
Sumatorias 100 3.572 394
m
n i yi y
DM i 1
n
394
DM 3,94
100
La DM (absoluta), indica que tan lejos en promedio
se encuentra cada observación con respecto a la
media.
Si la distancia es muy alta indica que existe gran
dispersión entre los datos observados.
Si es muy baja, refleja un gran agrupamiento y que
los valores son parecidos entre si.
b) La Desviación Mediana Absoluta
DMe es el promedio de los valores absolutos de las
diferencias entre cada observación y la mediana de estas es
decir :
n
x Me
i
Para datos No Agrupados
DMe i 1
n
m
n
VARIANZA (s2)
y DESVIACIÓN TÍPICA (s)
( xi x ) 2
Para datos No agrupados
V ( x ) sx 2 i 1
n
n i ( yi y ) 2
Para datos agrupados
V ( y ) sy 2 i 1
n
( xi x ) 2
Para datos No Agrupados
V ( x ) sx 2 i 1
n1
n
n i ( yi y ) 2
Para datos Agrupados
V ( y ) sy 2 i 1
n1
Varianza Poblacional
La varianza de una población finita de N
elementos X1,X2, X3………..XN, se define como
la media aritmética del cuadrado de las
desviaciones de las observaciones con
respecto a la media de la población, y se
denota por:
N
(X i u) 2
σ
2 i 1
N
Ejemplo: Datos Discretos
Las frecuencias cardiacas por minuto, de 5 niños
son : 130, 132, 127, 129, 132
Determinar la varianza de las frecuencias
cardiacas de la muestra:
Solución:
1. Se calcula 1ero. la media aritmética de la muestra
2. Se calcula la diferencia entre cada observación y
la media aritmética.
3. Se eleva al cuadrado estas desviaciones
(diferencias)
4. Se suman los cuadrados de las desviaciones
5. La suma se divide por n-1, si la muestra es
pequeña y por n-1 o simplemente n, si la muestra
es muy grande.
Siguiendo el ejemplo:
n= 5
n
xi- x (xi- x)2
xi
x 650
i
127 -3 9 x i 1
130 pulsaciones / min
129 -1 1
n 5
x x
130 0 0 n
2
i
132 2 4 18
132 2 4 s'
2 i 1
3,6
n 5
650 18 Con la corrección de Bessel:
x x
n
2
Podemos observar que S’2, es i
claramente menor que S2, debido 18
a que la muestra es pequeña. s
2 i 1
4,5 pulsaciones
n1 4
Respuesta:
La varianza en la muestra de las
frecuencias cardiacas de los niños
con respecto a la X calculada (130
pulsaciones/minuto) es de 4,5.
Ejemplo para datos continuos:
La distribución de las cuotas anuales de 100
compañías de un seguro de $1.000, para
trabajadores de 40 años es:
2 2
Intervalo yi ni yi.ni Yi - Y (Yi – Y) 2 ni ( Yi – Y) 2
ny i i
3.572 Luego:
y i 1
35,7 Aplicando la fórmula
n 100
n
n ( y y)
i i
2
V ( y ) sy 2 i 1
n
1.596,2
V ( y ) sy 15,96
2
100
Luego:
La varianza es 15,96.
O sea:
La distancia de cada una de las
observaciones con respecto a la
media encontrada 35,7, es de
15,96 $us.
Propiedades de la Varianza
La varianza de un conjunto de
observaciones x1, x2, x3………….
………………………… xn, siempre es
un Nro. no negativo
d) DESVIACIÓN TÍPICA o Desviación
Estándar (s)
Si bien ya se sabe como calcular la varianza, con la
fórmula que expresa cuantitativamente la dispersión
de un conjunto de observaciones, existe un
inconveniente en su interpretación, ya que está
expresada en el cuadrado de la dimensión en que
se expresa la característica de la variable, lo que
crea confusión.
Por esta razón basándonos en el valor calculado para
la varianza se calcula una medida de dispersión en la
misma dimensión en que están los datos. Esta
medida o estadígrafo es la desviación típica o
estándar
d) DEFINICIÓN DE LA
DESVIACIÒN TÍPICA
La desviación típica o estándar “S” de
las observaciones x1, x2, x3………….
………………………… xn, de una característica
x. se define como la raíz cuadrada
positiva de la varianza
Si los datos
no están D ( x ) sx V ( x ) s 2
agrupados
Si los datos
están
agrupados
D ( y ) sy V ( y ) s 2
Siguiendo el Ejemplo: para datos
No agrupados y discretos:
D ( x ) sx V ( x ) sx 2
D
(
x)
sx4
,
5
2,
12
D( x ) sx 2 ,12
Luego:
La desviación en las pulsaciones de los
niños, respecto a la media encontrada
de 130 es de 2,12 pulsaciones/min.
Al tratarse de una dispersión
pequeña, se puede afirmar que la
pulsación promedio obtenida de los
niños es representativa.
Siguiendo el ejemplo: para datos
Agrupados y continuos:
D ( y ) sy V ( y ) s 2
D( y ) sy 15,96 15,96
D( y ) sy 3 ,99
Luego:
La distancia de cada una de las
cuotas de las 100 empresas, respecto
a la media encontrada 35,7 es de
3,99 $us.
Al tratarse de una dispersión
pequeña, se puede afirmar que el
precio promedio obtenido de las
cuotas del seguro para los 100
empresas es representativo.
Gracias
por su
atención