Sie sind auf Seite 1von 6

Medidas de Dispersin.

Las medias de tendencia central o posicin nos indican donde se sita un dato dentro de una
distribucin de datos. Las medidas de dispersin, variabilidad o variacin nos indican si esos datos
estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se encuentran
los datos. Estas medidas de dispersin nos permiten apreciar la distancia que existe entre los
datos a un cierto valor central e identificar la concentracin de los mismos en un cierto sector de
la distribucin, es decir, permiten estimar cun dispersas estn dos o ms distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos,
siendo la media aritmtica el dato central ms utilizado. Cuando existe una dispersin pequea se
dice que los datos estn dispersos o acumulados cercanamente respecto a un valor central, en
este caso el dato central es un valor muy representativo. En el caso que la dispersin sea grande el
valor central no es muy confiable. Cuando una distribucin de datos tiene poca dispersin toma el
nombre de distribucin homognea y si su dispersin es alta se llama heterognea.
Rango
El rango o recorrido intercuartlico es la diferencia entre el valor mximo y el valor mnimo en un
grupo de nmeros aleatorios. Se le suele simbolizar con R.
Requisitos del rango
Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo

El medio rango o rango medio de un conjunto de valores numricos es la media del mayor y
menor valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor.
En consecuencia, el medio rango es:

Desviacin media o desviacin promedio
La desviacin media o desviacin promedio es la media aritmtica de los valores absolutos de las
desviaciones respecto a la media aritmtica.
PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es
relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de
vista geomtrico, la distancia que induce la desviacin media en el espacio de observaciones no es
la natural (no permite definir ngulos entre dos conjuntos de observaciones). Esto hace que sea
muy engorroso trabajar con ella a la hora de hacer inferencia a la poblacin.
Cuando mayor sea el valor de la desviacin media, mayor es la dispersin de los datos. Sin
embargo, no proporciona una relacin matemtica precisa entre su magnitud y la posicin de un
dato dentro de una distribucin.
La desviacin media al tomar los valores absolutos mide una observacin sin mostrar si la misma
est por encima o por debajo de la media aritmtica.
MTODOS DE CLCULO
Para Datos No Agrupados
Se emplea la ecuacin:

Para Datos Agrupados en Tablas de Frecuencia
Se emplea la ecuacin:

Varianza y desviacin estndar
La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media
aritmtica, es decir, es el promedio de las desviaciones de la media elevadas al cuadrado. La
desviacin estndar o desviacin tpica es la raz de la varianza.
La varianza y la desviacin estndar proporcionan una medida sobre el punto hasta el cual se
dispersan las observaciones alrededor de su media aritmtica.
PROPIEDADES
- La varianza y desviacin estndar (o cualquier otra medida de dispersin) indican el grado en que
estn dispersos los datos en una distribucin. A mayor medida, mayor dispersin.
- La varianza es un nmero muy grande con respecto a las observaciones, por lo que con
frecuencia se vuelve difcil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en
trminos de los datos originales elevados al cuadrado, se obtiene unidades de medida de los datos
que no tiene sentido o interpretacin lgica. Por ejemplo, si se calcula la varianza de una
distribucin de datos medidos en metros, segundos, dlares, etc, se obtendr una varianza
mediada en metros cuadrados, segundos cuadrados, dlares cuadrados, respectivamente,
unidades de medida que no tienen significado lgico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la raz cuadrada de la
misma, es decir, se calcula la desviacin estndar, la cual es un nmero pequeo expresado en
unidades de los datos originales y que tiene un significado lgico respeto a los mismos.
A pesar de lo anterior, es difcil describir exactamente qu es lo que mide la desviacin estndar.
Sin embargo, hay un resultado til, que lleva el nombre del matemtico ruso Pafnuty Lvovich
Chebyshev, y se aplica a todos los conjuntos de datos. Este teorema de Chebyshev establece que
para todo conjunto de datos, por lo menos 1- 1/k2 de las observaciones estn dentro de k
desviaciones estndar de la media, en donde k es cualquier nmero mayor que 1. Este teorema se
expresa de la siguiente manera:

MTODOS DE CLCULO
Para Datos No Agrupados
La varianza para una poblacin se calcula con:

Para Datos Agrupados en Tablas de Frecuencia
La varianza para una poblacin se calcula con:

Para Datos Agrupados en Intervalos
La varianza para una poblacin se calcula con:


Coeficiente de Variacin.
El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube de puntos a la
recta de regresin obtenida es satisfactorio. Se define como el cociente entre la covarianza y el
producto de las desviaciones tpicas (raz cuadrada de las varianzas).

Propiedades
El coeficiente de correlacin, r, presenta valores entre 1 y +1.
Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy
dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin.
Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo
lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente.
Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo
lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.es

Das könnte Ihnen auch gefallen