Sie sind auf Seite 1von 3

Conceptos:

Medidas de dispersión: Según Córdova (2003), Las medidas de dispersión o variabilidad son
números que miden el grado de separación de los datos con respecto a un valor central, que
generalmente es la media aritmética. Las principales medidas de dispersión son:

a) El rango: En una serie de datos, es la diferencia entre sus valores máximo y mínimo. Esto
es,
𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
siendo 𝑥𝑚á𝑥 el valor máximo y 𝑥𝑚í𝑛 el valor mínimo.
El rango es una medida de dispersión muy fácilmente calculable, pero es muy inestable, ya
que depende únicamente de los dos valores extremos. Su valor puede cambiar grandemente
si se añade o elimina un sólo dato.
b) El rango intercuartil: es la diferencia entre sus cuartiles tercero y primero. Esto es,
𝑅𝐼 = 𝑄3 − 𝑄1
El rango intercuartil es una medida que excluye el 25 % más alto y el 25 % más bajo, dando
un rango dentro del cual se encuentra el 50% central de los datos observados y a diferencia
del rango total no se encuentra afectada por los valores extremos.
c) La varianza: Es una medida que cuantifica el grado de dispersión o de variación de los
valores de una variable cuantitativa con respecto a su media aritmética. Si los valores
tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores
tienden a distribuirse lejos de la media, la varianza será grande. La varianza se define como
la media aritmética de los cuadrados de las diferencias de los datos con respecto a su media
aritmética.
d) La desviación estándar: es la raíz cuadrada positiva de la varianza. La desviación estándar
calculada a partir de una muestra se denotará por 𝑠 , y referida a la población por 𝜎. Esto
es, 𝑠 = √𝑠 2
e) El coeficiente de variación: Es una medida de dispersión relativa (libre de unidades de
medidas), que se define como la desviación estándar dividido por la media aritmética. Esto
es,
𝑠
𝐶𝑉 =
𝑥̅
El coeficiente de variación se utiliza para comparar la variabilidad de dos o más series de
datos que tengan medias iguales o diferentes o que tengan unidades de medida iguales o
diferentes (por decir, una serie en kilogramos y otra serie en metros).

Regresión lineal: Según Córdova (2003), Dados 𝑛 pares de valores (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), …, (𝑥𝑛 , 𝑦𝑛 )
de una variable bidimensional ( X , Y ) . La regresión lineal de Y con respecto a X, consiste en
determinar la ecuación de la recta: 𝑌 = 𝑎 + 𝑏𝑋, que mejor se ajuste a los valores de la muestra,
con el fin de poder predecir o estimar Y (variable dependiente) a partir de X (variable
independiente).

El proceso de predecir o estimar Y a partir de la variable X, se le llama regresión. Hallar la función


lineal 𝑌 = 𝑎 + 𝑏𝑋, consiste en determinar los valores de 𝑎 y 𝑏 a partir de los datos de la muestra.

Correlación lineal: Según Ruiz (2004) en su libro “Manual de estadística” dice que se conoce
como correlación al análisis del grado de dependencia que existe entre las variables (𝑥, 𝑦).

El término “correlación” literalmente significa relación mutua; de este modo, el análisis de


correlación mide e indica el grado en el que los valores de una variable se relacionan con los valores
de otra. Más exactamente, el análisis que se ocupa de medir la relación entre una sola variable
independiente y la variable dependiente se llama análisis de correlación simple.

La medida de asociación lineal más frecuentemente utilizada entre dos variables es “r” o coeficiente
de correlación lineal de Pearson; este parámetro se mide en términos de covarianza de X y Y.

𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦

Interpretación:
Si 𝑟 = 1, se dice que hay una correlación perfecta positiva.

Si 𝑟 = −1, se dice que hay una correlación perfecta negativa.

Si 𝑟 = 0, se dice que no hay correlación entre las dos variables.

Diagramas de caja: Según Córdova (2003), son unas gráficas útiles para reflejar propiedades de
los datos, la cual se basa en la mediana (o en la media), los cuartiles y valores extremos. La caja
representa el rango intercuartil que encierra el 50% de los valores y tiene la mediana (Me) dibujada
dentro. El rango intercuartil tiene como extremos el percentil 75, 𝑃75 (cuartil superior) y el percentil
25, 𝑃25 (cuartil inferior).

Además de la caja, se incluye la extensión de los datos mediante segmentos que se extienden de la
caja hacia el valor máximo (U) y hacia el valor mínimo \L) de los datos. Este recuadro se dibuja
con el eje de la variable en forma horizontal o vertical como se indica en la figura que sigue.

REFERENCIAS:

Córdova, M. (2003). Estadística descriptiva e inferencial. Quinta edición. Recuperado de:


https://www.elsolucionario.org/estadistica-descriptiva-e-inferencial-manuel-cordova-zamora-5ta-
edicion/
Ruiz, D. (2004). Manual de estadística. Recuperado de:
http://www.eumed.net/cursecon/libreria/drm/drm-estad.pdf

Das könnte Ihnen auch gefallen