Sie sind auf Seite 1von 8

Medidas de tendencia central y de

2
variabilidad
Introducción
En el módulo anterior se analizaron los tipos de variables y se presentó la forma de
presentar datos por medios gráficos. La distribución de frecuencias es útil con
respecto a la presentación gráfica de los datos, pero en sí misma no permite estable-
cer comparaciones entre dos o más distribuciones. A menudo se desea describir en
forma cuantitativa las características de las distribuciones, para lo cual es importan-
te obtener las medidas de tendencia central y de variabilidad.

Una medida de tendencia central de un conjunto de datos proporciona una idea del Los directivos de una facultad necesitan
saber las notas promedio de los estudiantes
valor central de un conjunto aparentemente desordenado de observaciones, y una de un determinado semestre para asignar
medida de variabilidad nos permite determinar de qué forma está disperso un dato las becas de estudio para el siguiente
con relación a los otros de la distribución. semestre.

Objetivos del módulo


1. Interpretar las medidas de tendencia central y comprender sus aplicaciones.
2. Desarrollar destreza para calcular las medidas de tendencia central.
3. Aplicar las medidas de tendencia central.
4. Interpretar y utilizar las medidas de dispersión.
5. Desarrollar destrezas para calcular las medidas de dispersión.
6. Aplicar las medidas de dispersión.
7. Interpretar diagramas de cajas y bigotes.

Preguntas básicas
1. ¿Cuál es la diferencia entre la media, la mediana y la moda?
2. ¿Cuáles son las medidas de variabilidad más utilizadas?
3. ¿Cómo se interpreta el diagrama de cajas y bigotes?

Contenidos del módulo


2.1 Medidas de tendencia central
2.1.1 Media aritmética
2.1.2 Mediana
2.1.3 Moda
2.2 Medidas de variabilidad
2.2.1 Rango
2.2.2 Cuartiles
2.2.3 Deciles Vea el módulo 2 del programa
2.2.4 Percentiles de televisión Estadística.
2.2.5 Rango intercuantílico
2.2.6 Desviación estándar y varianza
2.3 Diagramas de cajas y bigotes Estadística
29
Capítulo 1: Estadística descriptiva

2.1 Medidas de tendencia central


Las medidas de tendencia central permiten resumir un conjunto de datos de forma
que se dé una visión general de éstos. Entre ellas se encuentran las siguientes:

2.1.1 Media aritmética

Se define como la suma de los datos dividida entre el número de los mismos:

¦X
n

i
i 1
X ,
n

en donde

n : número de observaciones.
X : valor de cada observación.
X : media aritmética o simplemente media.

La media es sensible al valor exacto de todos los datos en la distribución y es muy


sensible a los datos extremos.

Ejemplo

Calcule la media de los siguientes datos:

5, 2, 8, 2, 3, 2, 4, 0, 6.

Solución

¦X
n

i 1
i
5 28 2 3 2 4 0 6
X 3.55.
n 9

2.1.2 Mediana

Se define como el valor que divide una distribución de datos ordenados en dos
mitades. La mediana es menos sensible a los datos extremos y se denota como X .

Procedimiento para determinar la mediana:

1. Se ordenan los datos.

2. Si el número de observaciones, n, es impar, la mediana es el dato que se


encuentra en la posición ( n  1) / 2, y si el número de observaciones es par,
la mediana es el promedio de los datos que se encuentran en los lugares
n / 2 y n / 2  1.

30
Módulo 2: Medidas de tendencia central y de variabilidad

Ejemplo

Calcule la mediana de los siguientes datos:

30, 20, 17, 12, 30, 30, 14, 29.

Solución

1. Primero se debe ordenar el conjunto de datos:

12, 14, 17, 20, 29, 30, 30, 30.

2. Dado que el número de observaciones es par, la mediana de los datos es:


dato 4  dato 5 20  29 49
24.5.
2 2 2

2.1.3 Moda

Es el valor que ocurre con mayor frecuencia (aunque puede existir más de una moda
para un conjunto de datos).

Ejemplo 1

Calcule la moda de los siguientes datos:

40, 37, 6, 4, 4, 4, 2, 1, 1.

Solución

La moda de este conjunto de datos es 4, con una frecuencia de 3.

Para ilustrar las tres medidas de centralidad se muestran a continuación gráficas con
sus correspondientes valores de media, mediana y moda (figura 2.1).

Figura 2.1. Medidas de tendencia central.

La media aritmética es equivalente al punto de equilibrio de los datos, la mediana


divide el área bajo la curva en dos partes iguales y la moda corresponde al máximo
de la curva.

Ejemplo 2

Se desarrolló un estudio de los efectos de fumar sobre los patrones de sueño. La


medición que se observa es el tiempo, en minutos, que toma quedar dormido. Se
obtuvieron los siguientes datos:

Estadística
31
Capítulo 1: Estadística descriptiva

Fumadores: 69.3, 56.0, 22.1, 47.6, 53.2, 48.1, 52.7, 34.4, 60.2, 43.8, 23.2, 13.8.

No fumadores: 28.6, 25.1, 26.4, 34.9, 29.8, 28.4, 38.5, 30.2, 30.6, 31.8, 41.6,
21.1, 36.0, 37.9, 13.9.

Encuentre la media, la mediana y la moda de cada una de las muestras y comente qué
clase de impacto parece tener el fumar sobre el tiempo que se requiere para quedar
dormido.

Solución

Fumadores

1. Media:
69.3  56.0  ...  23.2  13.8
X 3.7.
12

El promedio del tiempo para quedarse dormido siendo fumador es de 43.7


minutos.

2. Mediana:

Datos ordenados:

13.8, 22.1, 23.2, 34.4, 43.8, 47.6, 48.1, 52.7, 53.2, 56.0, 60.2, 69.3.

Como el número de datos es par, la mediana de los fumadores es:

47.6  48.1
X 47.85.
2

3. Moda: la distribución de los fumadores no presenta moda, es decir, no hay


valores que se repiten.

No fumadores

1. Media:
28.6  25.1  26.4  ...  37.9  13.9
X 30.32.
15

El tiempo promedio para quedarse dormido siendo no fumador es de 30.32


minutos.

2. Mediana:

Datos ordenados:

13.9, 21.1, 25.1, 26.4, 28.4, 28.6, 29.8, 30.2, 30.6, 31.8, 34.9, 36.0,
37.9, 38.5, 41.6.

32
Módulo 2: Medidas de tendencia central y de variabilidad

Como el número de datos es impar, la mediana de los no fumadores es:


X 30.2.

3. Moda: la distribución de los no fumadores no tiene moda.

Se puede concluir que el tiempo en quedarse dormido aumenta con la condición de


fumar, es decir, los fumadores presentan tiempos para quedarse dormidos más altos
que los no fumadores.

2.2 Medidas de variabilidad


La variabilidad es un aspecto muy importante en estadística que nos permite
caracterizar la naturaleza de los datos. Existen diferentes medidas de variabilidad
para un conjunto de datos cuantitativos.

2.2.1 Rango

Se define como la diferencia entre las observaciones máxima y mínima de una distri-
bución:

R X máx  X mín .

Ejemplo

Para el siguiente conjunto de datos calcule el rango: 5, 2, 2, 1, 5, 3, 2, 3, 4.

Solución

R X máx  X mín 5  1 4.

2.2.2 Cuartiles

Dividen la distribución de un conjunto de datos en cuatro partes iguales cada una


con el mismo número de observaciones, es decir, el 25% del total de los datos. Los
puntos que separan los valores son los cuantiles. El primer cuantil es el valor corres-
pondiente al 25% y está dado por Q1; el segundo cuantil es el valor correspondiente
al 50% y se denota como Q2; y el tercer cuantil es el valor que separa el 75% de las
observaciones y se denota como Q3.

Ejemplo

Los siguientes datos representan las mediciones de intensidad solar realizadas en


distintos días en una localidad del sur de España:

562, 869, 708, 775, 704, 809, 856, 655, 806, 878, 909, 918, 558, 768, 870, 918, 940,
946, 661, 820, 898, 935, 952, 957, 693, 835, 905, 939, 955, 960, 498, 653, 730 y 753.

Estadística
33
Capítulo 1: Estadística descriptiva

Iniciaremos ordenando el conjunto de datos para determinar luego el primer y el


tercer cuantiles.

498, 558, 562, 653, 655, 661, 693, 704, 708, 730, 753, 768, 775, 806, 809, 820, 835,
856, 869, 870, 878, 898, 905, 909, 918, 918, 935, 939, 940, 946, 952, 955, 957, 960.

El primer cuantil es el valor para el cual al menos (0.25)(34) = 8.5 de las medidas son
iguales o menores que él y al menos (0.75)(34) = 25.5 valores son mayores que él; de
esta forma 8 valores son iguales o menores de 704 y 26 valores están situados por
encima de 704. Luego el primer cuantil es Q1 = 704.

El tercer cuantil se obtiene contando 8 valores desde el extremo derecho en el


conjunto de datos ordenado; de esta forma, Q3 = 935.

2.2.3 Deciles

Dividen el conjunto de datos en diez partes iguales, en las que el primer decil
corresponde al valor por debajo del cual está el 10% de las observaciones, el segun-
do decil corresponde al valor por debajo del cual está el 20% de las observaciones
y así sucesivamente.

2.2.4 Percentiles

Un percentil es el valor sobre la escala de medida debajo del cual cae un porcentaje
dado de los datos en la distribución.

2.2.5 Rango intercuantílico

Se define como la diferencia entre el tercer cuantil y el primer cuantil.

Q Q3  Q1 .

Ejemplo

Continuando con el ejemplo de las mediciones de intensidad solar, el rango


intercuantílico de este conjunto de datos es:

Q Q3  Q1 935  704 231.

2.2.6 Desviación estándar y varianza

Desviación estándar. Es una medida de la dispersión con respecto a la media, y es


sensible a cada dato de la distribución. Si un dato se aleja de la media, el valor de la
desviación estándar es mayor, y si un dato se mueve más cerca de la media, el valor
de la desviación estándar es menor. Se designa con la letra S y se calcula mediante
la siguiente fórmula:

34
Módulo 2: Medidas de tendencia central y de variabilidad

¦(X  X )2
n

n 1
i 1
S .

Varianza. La varianza de un conjunto de datos es el cuadrado de la desviación


estándar. Esta medida no es muy utilizada en la estadística descriptiva puesto que
da unidades de medidas elevadas al cuadrado:

¦(X  X )2
n

n 1
2 i 1
S .

Ejemplo

Para el siguiente conjunto de datos calcule la varianza y la desviación estándar:

9, 6, 4, 6, 5, 8, 7, 6, 7, 0.

Solución

Puesto que

96 46587670
X 5.8,
10
se tiene que

(9  5.8) 2  (6  5.8) 2  (4  5.8) 2  ...  (6  5.8) 2  (7  5.8) 2  (0  5.8) 2


S2 248,
9

y por tanto la desviación estándar es igual a

¦(X  5.8) 2
10

i
i 1
S 1.5748.
9

2.3 Diagramas de cajas y bigotes


El diagrama de cajas y bigotes proporciona información sobre el centro, la disper-
sión y la simetría. En él se pueden ubicar los cuantiles, la media, la mediana y los
valores máximo y mínimo de los datos. Además se pueden identificar puntos extre-
mos, los cuales aparecen antes del primer cuantil o después del tercer cuantil indi-
cando que en la distribución de datos existen valores muy altos o muy bajos que no
están incluidos en el rango intercuantílico.

Estadística
35
Capítulo 1: Estadística descriptiva

La figura 2.2 muestra un diagrama de cajas y bigotes para un conjunto de datos que
es simétrico, donde la mediana está en el centro de la caja y los bigotes tienen la
misma longitud.

Figura 2.2. Diagrama de cajas y bigotes simétrico.

Las figuras 2.3 y 2.4 ilustran dos diagramas de cajas y bigotes para un conjunto de
datos sesgados. Si la distribución está sesgada hacia la derecha, la mediana está
ubicada hacia el lado izquierdo del centro de la caja, y si está sesgada a la izquierda,
la mediana está ubicada hacia el lado derecho del centro de la caja. Así mismo se
puede observar que las longitudes de los bigotes son diferentes para los dos gráfi-
cos, lo que indica que hay asimetría en el conjunto de datos.

Figura 2.3. Diagrama de cajas y bigotes sesgado hacia la derecha.

Figura 2.4. Diagrama de cajas y bigotes sesgado hacia la izquierda.

Resumen
Se presentaron las medidas de centralidad y de variabilidad utilizadas para analizar variables únicamente de tipo
cuantitativo. Además se presentó un gráfico que permite agrupar estas dos medidas (el diagrama de cajas y bigotes),
que es muy útil ya que en él se ve claramente qué tanto están dispersas las observaciones y cuál es su valor central.

36

Das könnte Ihnen auch gefallen