Sie sind auf Seite 1von 13

Estadística descriptiva

Medidas de centralización
• La finalidad de todo proceso estadístico es obtener
información cuantitativa sobre alguna característica de un
determinado colectivo, lo que obliga a trabajar con gran
cantidad de datos.
• Para simplificar el estudio se utilizan ciertos indicadores o
medidas que nos informan directa y suficientemente acerca
de la característica estudiada.
• Estos indicadores, también llamados estadísticos, sirven para
valorar ciertos aspectos de la distribución de datos como son
la centralización de datos, la dispersión, la simetría, la
concentración, la dependencia entre variables, etc.
Medidas de centralización
• Cuando se tiene un grupo de observaciones, se desea
describirlo a través de un solo número. Para tal fin, no se usa
el valor más elevado ni el valor más pequeño como único
representante, ya que sólo representan los extremos.
• Una de las propiedades más sobresalientes de la distribución
de datos es su tendencia a acumularse hacia el centro de la
misma.
• Esta característica se denomina tendencia central.
• Las medidas de tendencia central más usuales son:
• La media aritmética
• La mediana
• La moda
La media poblacional
• La media aritmética de todos los valores, es igual a la suma de
todos ellos dividida entre N (número de valores de la
población) . Se denota por 𝜇
• Matemáticamente hablando:
σ𝑋
𝜇=
𝑁

Entonces, con los datos: 10, 8, 6, 15, 10, 5, hallar la media


poblacional:

10 + 8 + 6 + 15 + 10 + 5 54
𝜇= = =9
6 6
Cualquier característica medible de una población recibe el
nombre de parámetro.
La media de una muestra
• Con frecuencia se selecciona una muestra de la población para
encontrar alguna característica específica de la población.
• La media de una muestra de n valores, tomados de una población N,
es igual a la suma de todos ellos dividida entre n. Se denota por 𝑋ത
• Matemáticamente hablando:

σ𝑋
𝑋ത =
𝑛

Entonces, con los datos: 10, 8, 6, 15, 10, 5, 2, 3, 5, 23 hallar la media de


los seis primeros datos.

10 + 8 + 6 + 15 + 10 + 5 54
𝑋ത = = =9
6 6
La media, propiedades
1. Es una medida totalmente numérica; o sea, sólo pueden
calcularse en datos de características cuantitativas.
2. En su cálculo se toman en cuenta todos los valores de la
variable.
3. Es altamente afectada por los valore extremos.
4. Es única, o sea, un conjunto de datos numéricos tiene una y
sólo una media aritmética.
La media ponderada
En determinadas distribuciones estadísticas es notorio que no
todos los valores de la variable tienen la misma influencia, y por
ello, a cada valor se le asigna un coeficiente diferenciador,
llamado peso. Para calcular la media aritmética se utilizan estos
pesos dando lugar a la media aritmética ponderada, de forma
que, si la variable toma los valores x1, x2, …, xn con pesos
respectivos p1, p2, …, pn,

σ𝑛𝑖=1(𝑥𝑖 · 𝑝𝑖 )
𝑋ത =
σ𝑛𝑖=1 𝑝𝑖
La media para datos agrupados
• Si los datos vienen agrupados en una tabla de
frecuencias, la media es

σ 𝑓𝑋𝐶
𝑋ത =
𝑛
Xc = punto medio de cada clase
La mediana
La mediana es el punto central de una serie de datos ordenados
de forma ascendente o descendente.
• Para calcular la mediana, primero debemos ordenar los datos
de menor a mayor o viceversa y luego:

• Si N es impar: la mediana es el valor que queda justo al centro

• Si N es par: se busca al media aritmética entre los dos valores


centrales.
La mediana
• Características:
• En su cálculo no intervienen todos los valores de la variable.
• No es afectada por los valores extremos.

• Por ejemplo, 9 vendedores vendieron el siguiente número de


aparatos, en orden ascendente: 5, 7, 8, 10, 11, 12, 13, 14, 16.
Solución: Como N es impar, la mediana, Me = 11.

• Si son 8 los vendedores y vendieron la siguiente cantidad de


aparatos: 5, 7, 8, 9, 11, 12, 11, 14.
Solución: Como N es par, la mediana se halla la media entre
9+11
los dos valores centrales, 𝑀𝑒 = = 10
2
La mediana para datos
agrupados
• La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias
absolutas .
𝑁
• Es decir, tenemos que buscar el intervalo donde se encuentra
2
𝑁
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 · 𝑎𝑖
𝑓𝑖

• Donde Li es el límite inferior de la clase donde se encuentra la


mediana.
• N/2 es la semisuma de las frecuencias acumuladas.
• Fi-1 es la frecuencia acumulada anterior a la clase mediana.
• ai es la amplitud de la clase.
La moda
• La moda de un conjunto de datos numéricos es el valor que
más se repite, es decir, el que tiene el mayor número de
frecuencias absolutas.
• La moda es una medida de tendencia central muy importante,
porque permite planificar, organizar y producir para satisfacer
las necesidades de la mayoría.
• Características:
• En su cálculo no se incluyen todos los valores de las variables.
• Puede ser afectado grandemente por el método de designación
de los intervalos de clases.
• Puede ser calculada en distribuciones de frecuencias que tengan
clases abiertas.
• No es afectada por los valores extremos.
• No es única, inclusive puede no existir.
La moda para datos agrupados
𝑓𝑖 − 𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + · 𝑎𝑖
𝑓𝑖 − 𝑓𝑖−1 + 𝑓𝑖 − 𝑓𝑖+1

• Li es el límite inferior de la clase modal


• fi es la frecuencia absoluta de la clase modal
• fi-1 es la frecuencia absoluta inmediatamente inferior a la
clase modal
• fi+1 es la frecuencia absoluta inmediatamente posterior a la
clase modal
• ai es la amplitud de clase

Das könnte Ihnen auch gefallen