Beruflich Dokumente
Kultur Dokumente
Hasta el momento hemos estudiado los valores centrales de la distribucin, pero tambin es importante conocer si los valores en general
estn cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de dispersin.
Rango:
Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo
notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero indudablemente es muy fcil de
calcular.
Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin
embargo, la mas utilizada es con respecto a la media.
Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que
precisaremos una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las
desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Desviacin media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
Varianza:
o tambin por
Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la
variable viene dada en cm. La varianza vendr en cm2.
Desviacin tpica:
Es la raz cuadrada de la varianza, se denota por Sx o x.
Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de
estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la representaremos por
la calcularemos de la siguiente forma:
Cuasidesviacin tpica:
La raz cuadrada de la cuasivarianza y la denotaremos por SN1 o N-1.
Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad
de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de
alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida.
Coeficiente de Variacin:
Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos
muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.
Ejemplo
Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.
45
55
50
300
-19,4
116,4
2258,16
15000
55
65
10
16
60
600
-9,4
94
883,6
36000
65
75
19
35
70
1330
0,6
11,4
6,84
93100
75
85
11
46
80
880
10,6
116,6
1235,96
70400
85
95
50
90
360
20,6
82,4
1697,44
32400
N=
50
420,8
6082
246900
3470
Dm=
C.V.=