Sie sind auf Seite 1von 78

Estadísticos

TEMA 3.3
Estadísticos
Definición
◦ Número obtenido a partir del análisis de una
variable estadística.
◦ Procedimiento de cálculo bien definido:
aplicación de fórmula aritmética
◦ Cuantifica uno o varios aspectos de la
información (confirmación de tabla o gráfico)
◦ Si calculados a partir de muestras se
denominan estadísticos.
◦ Si calculados a partir de una población,
reciben el nombre de parámetros.
Estadísticos
Tipos
◦ De tendencia central o centralidad
◦ De dispersión
◦ De forma
Estadísticos
De tendencia central
◦ Indican en torno a qué valor (centro) se
distribuyen los datos.
Media
Aritmética (ponderada)
Geométrica
Armónica
Moda
Mediana
Estadísticos
De tendencia central
◦ Media aritmética
El parámetro media se re presenta por µ.
El estadístico media se denota como X

Valor obtenido al sumar todos los datos y


dividir el resultado entre el número total de
elementos.
n

∑x
i =1
i
X =
x1 + x 2 + x3 + ... + x n
X = N
N
Estadísticos
De tendencia central
◦ Media aritmética

Ejemplo: peso (kg) 84, 91, 72, 68, 87 y 78


kg. El peso medio es
Estadísticos
De tendencia central
◦ Media aritmética
Para variables discretas agrupadas

x1 n1 + x 2 n2 + x3 n3 + ... + x n nn
X =
N
n
xi
27
ni
1
xi · ni
27
∑x n
i =1
i i
28 2 56 X =
29 6 174 N
30 7 210
31 8 248
32 3 96
944
X= = 30,45
33 3 99
31
34 1 34
31 944
Estadísticos
De tendencia central
◦ Media aritmética
Variables continuas agrupadas
n

x1 n1 + x 2 n2 + x3 n3 + ... + x n nn ∑x n i i
X = X = i =1
N N
Li-1, Li xi ni xi · ni
[10, 20) 15 1 15
[20, 30) 25 8 200
1820
[30,40) 35 10 350 X= = 43,33
[40, 50) 45 9 405 42
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1820
Estadísticos
De tendencia central
◦ Media aritmética
Observaciones
Sólo para variables cuantitativas.
Independiente de la amplitud de los intervalos
Sensible a valores extremos
La suma de las desviaciones de todas las puntuaciones
respecto a la media es igual a cero.
Influencia de un cambio de origen: si a todos los valores
de una muestra se le suma/resta una constante c, la
media de la nueva muestra es igual a la media de la
muestra inicial más /menos) la constante.
Influencia de un cambio de escala: si todos los valores
de una muestra son multiplicados/divididos) por una
constante c, la media de la nueva muestra es igual a la
media de la muestra inicial multiplicada/dividida por c.
Estadísticos
De tendencia central
◦ Media aritmética ponderada
Cuando no todos los elementos tienen la misma importancia
o presentan variaciones acumulativas
Para promediar porcentajes, tasas, números índices etc.
CÁLCULO multiplicar cada uno de los números por un
valor específico (“peso” o ponderación representan el
número de veces que el valor de la variable es más
importante que el de otra).
k

∑ wi xi
xw = i =1
k

∑ wi
i =1
Estadísticos
De tendencia central
◦ Media aritmética ponderada
Ventajas:
Intervienen todos los valores de la distribución.
Los valores extremos tienen menor influencia que en la
media aritmética.
◦ Inconvenientes
Cálculo complicado.
Estadísticos
De tendencia central
◦ Media geométrica
Raíz N-ésima del producto de los valores

G = n x1 × x 2 × ... × x n

Usada cuando los datos no varían


linealmente su valor depende de varios
factores a la vez.
CÁLCULO: temperaturas de un proceso
químico
4
13.4 x12.8 x11.9 x13.6 = 4 27758.7968
Estadísticos
De tendencia central
◦ Media armónica
Datos: 3.1, 2.8, 2.84, 3.05, 3.09,

1 n
H = n
= n
1 / n∑1 / xi ∑1 / xi
i =1 i =1

5
H = =
1 / 3.1 + 1 / 2.8 + 1 / 2.84 + 1 / 3.05 + 1 / 3.09

5 5
= = = 2.9703
0.3226 + 0.3571 + 0.3521 + 0.3279 + 0.3236 1.6833
Estadísticos
De tendencia central
◦ Moda
Valor más frecuente
El que más se repite
En el caso de variables continuas clase modal

Se representa por Mo
Ej: distribución 2, 3, 3, 4, 4, 4, 5, 5
Mo = 4
Estadísticos
De tendencia central
◦ Moda
Casos particulares
Si todas las puntuaciones tienen la misma
frecuencia no hay moda.
Ej: 2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes comparten la


misma frecuencia máxima promedio de las
dos puntuaciones adyacentes.
Ej: 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Estadísticos
De tendencia central
◦ Moda
Si dos o más puntuaciones no adyacentes tienen la
misma frecuencia (máxima) distribución bimodal o
multimodal
Ej: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Ojo, puede ser resultado de mezcla de
poblaciones/muestras

Inconvenientes
Parámetro poco representativo, salvo cuando es clara, por
que no intervienen todos los valores de la distribución
Única medida de posición central que puede obtenerse en
las variables de tipo cualitativo
Estadísticos
De tendencia central
◦ Moda
Variables cualitativas (nominales y ordinales)
y cuantitativas discretas
Valor o valores con la máxima frecuencia

xi ni
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
31
Estadísticos
De tendencia central
◦ Moda
Variables continuas (datos agrupados)
Caso A intervalos con la misma amplitud
ni − ni −−11
Mo = Li −1 + • ai
(ni − ni −1 ) + (ni − ni +1 )
Li-1 límite inferior de la clase modal.
ni número de casos de la clase modal.
ni-1 número de casos de la clase inmediatamente inferior a la
modal
ni-+1 número de casos de la inmediatamente posterior a la modal
ai amplitud de cada clase

ni +1
Alternativa: Mo = Li −1 + • ai
(ni −1 + ni +1 )
Estadísticos
De tendencia central
◦ Moda
Variables continuas (datos agrupados)
Caso A intervalos con la misma amplitud.

Primer paso ¿clase modal? [66,69)

Li-1, Li ni
[60, 63) 5
[63, 66) 18

[66, 69) 42
[69, 72) 27
[72, 75) 8
100
Estadísticos
De tendencia central
◦ Moda
Caso B intervalos tienen amplitudes distintas.
1º paso buscar clase modal
2º paso cálculo altura
ni
hi =
ai
3º paso aplicar fórmula
hi − hi −1
Mo = Li −1 + • ai
(hi − hi −1 ) + (hi − hi +1 )

Alternativa: hi +1
Mo = Li −1 + • ai
(hi −1 + hi +1 )
Estadísticos
De tendencia central
◦ Moda
Los intervalos tienen amplitudes distintas.
Calificaciones (suspenso, aprobado, notable y
sobresaliente) de un grupo de 50 alumnos.

Li-1, Li ni hi
[0, 5) 15 15/5=3

[5, 7) 20 20/2=10
[7, 9) 12 12/2=6
[9, 10) 3 3/1=3
50
Estadísticos
De tendencia central
◦ Mediana
No ligada al valor numérico de las observaciones
sino a su posición relativa dentro de los datos
posición central cuando están ordenados de
menor a mayor
Separa una distribución en dos partes iguales
valor que deja un 50 % de los datos a su
izquierda y el otro 50 % a su derecha.
Estadístico Me
Sólo variables cuantitativas
Estadísticos
De tendencia central
◦ La mediana
Cálculo
A partir de los datos ordenados de menor a mayor.
El procedimiento depende del formato de los datos
(variables discretas o continuas)
Estadísticos
De tendencia central
◦ La mediana
Cálculo (datos originales)
Número impar de individuos: puntuación central de la
misma
N
Me = + 0,5 2, 3, 4, 4, 5, 5, 5, 6, 6
2
Siendo N = número de individuos de la serie

Número par de individuos: promedio de las dos


puntuaciones centrales
Me = promedio de N/2 y N/2+1 7, 8, 9, 10, 11, 12
Me= 9,5
Estadísticos
De tendencia central
◦ La mediana
Cálculo para distribuciones discretas
Buscar primer valor de Ni (frecuencia absoluta acumulada)
que iguale o supere a

CASO 1: coincide con un valor de las frecuencias


acumuladas media entre la observación que
presenta dicha frecuencia absoluta acumulada y la
siguiente.
CASO 2: no coinciden con ningún valor de la
columna de las frecuencias acumuladas primera
observación cuya frecuencia acumulada supera N/2
Estadísticos
De tendencia central
◦ La mediana
Cálculo para distribuciones discretas
xi ni Ni
27 1 1
N 31
28 2 3
= = 16 ,5
29 6 9
2 2
30 7 16

31 8 24 El primer valor de Ni que supera 16.5


32 3 27 es 24
33 3 30
34 1 31 Me = 31
31
Estadísticos
De tendencia central
◦ La mediana
Cálculo para datos agrupados (continuas)
Buscar el intervalo mediano
Primer valor de Ni que iguale o supere a

Aplicar la fórmula
N
− N i −1
Me = Li −1 + 2 • ai
ni
Li-1 límite inferior del intervalo mediano
Ni-1 frecuencia acumulada anterior al intervalo mediano
ai amplitud de la clase.
La mediana es independiente de las amplitudes de los
intervalos
Estadísticos
De tendencia central
◦ La mediana
Cálculo para datos agrupados
(continuas)
Li-1, Li ni Ni
100
[60, 63) 5 5 Intervalo mediano = = 50
[63, 66) 18 23 2
[66, 69) 42 65
[69, 72) 27 92 Primer valor de Ni que iguale o
[72, 75) 8 100 supere 50 = 65
100
Intervalo mediano: [66, 69)
N
− N i −1
2 50 − 23
Me = Li −1 + • ai = 66 + * 3 = 67.93
ni 42
Estadísticos
De dispersión
◦ Informan sobre cuánto se alejan del
centro todos los valores de la
distribución.
Rango o recorrido
Desviación respecto a la media
Desviación media
Varianza
Desviación típica
Estadísticos
De dispersión
◦ Rango o recorrido:
Diferencia entre el mayor y el menor de los
datos
Cálculo sencillo
Sólo tiene en cuenta los valores extremos (cuanto
mayor sea la diferencia mayor el rango) pero no
necesariamente supone incremento de la
dispersión
Estadísticos
De dispersión
◦ La desviación respecto a la media
Diferencia entre cada individuo de la variable
estadística y la media aritmética de toda la
distribución.
Di = xi − x

◦ La desviación media (absoluta)


Media aritmética de los valores absolutos de
las desviaciones respecto a la media.
n

x1 − x + x 2 − x + x3 − x + ... + x n − x ∑x
i =1
i −x
Dx = Dx =
N N
Estadísticos
De dispersión
◦ La desviación media
Cálculo de la desviación media de la
distribución 9, 3, 8, 8, 9, 8, 9, 18
Estadísticos
De dispersión
◦ La desviación media
Distribución discreta

xi ni xi · ni |xi-X| |xi-X|* ni
27 1 27 3,55 3,55
944
X = = 30,45
28 2 56 2,55 4,9 31
29 6 174 1,55 8,7
30 7 210 0,55 3,2
31 8 248 0,55 4,4
40,5
Dx = = 1,30
32 3 96 1,55 4,6 31
33 3 99 2,55 7,6
34 1 34 3,55 3,55
31 ∑ 944 ∑ 40,5
Estadísticos
De dispersión
◦ La desviación media
Distribución continua con datos agrupados
x1 − x n1 + x 2 − x n2 + x3 − x n3 + ... + x n − x n n
Dx =
N
n
Li-1, Li xi ni xi · ni |xi - X| |xi - X| . ni

i =1
x i − x ni
[10, 15) 12,5 3 37,5 9,286 27,858
Dx =
N [15, 20) 17,5 5 87,5 4,286 21,43

[20, 25) 22,5 7 157,5 0,714 4,998

[25, 30) 27,5 4 110 5,714 22,856

[30, 35) 32,5 2 65 10,174 21,428

21 457,5 98,57
Estadísticos
De dispersión
◦ La varianza
Media aritmética del cuadrado de las
desviaciones respecto a la media
s2 (muestra); σ2 (población)
n
2 2
( x1 − x) + ( x2 − x) + ... + ( xb − x) 2 ∑ i
( x − x ) 2

S2 = S2 = i =1
N N
En forma resumida
n2
2 2
x + x + ... + x 2
2 x 2
S2 = 1 2
−xn S =∑ −x
2 i

N i =1 N
Estadísticos
De dispersión
◦ La varianza
Cálculo:
Datos = 9, 3, 8, 8, 9, 8, 9, 18

S2 =
Estadísticos
De dispersión
◦ La varianza
Datos agrupados
n

( x − x ) 2
n + ( x − x ) 2
n + ... + ( x − x ) 2
nn
∑ i ni
( x − x ) 2

S2 = 1 1 2 2 b
S2 = i =1
N N

En forma resumida
2
n
2 2
x n + x n + ... + x n 2
2 xi ni
2
S =2 1 1 2 2
−x n n S =∑
2
−x
N i =1 N
Estadísticos
De dispersión
◦ La varianza
Variable discreta (fórmula sencilla)
xi ni xi · ni xi2 · ni
n 2
27 1 27 729 xi ni
2
28 2 56 1568
S =∑
2
−x
29 6 174 5046 i =1 N
30 7 210 6300
31 8 248 7688
944
32 3 96 3072 X = = 30,45
33 3 99 3267 31
34 1 34 1156
31 944 28826

2 28826
S = − (30,45) 2 = 2,67
31
Estadísticos
De dispersión
◦ La varianza
Variables continuas (fórmula sencilla)
n 2 Li-1, Li xi ni xi · ni xi2 · ni
x n 2
S =∑
2 i i
−x [10, 20) 15 1 15 225
i =1 N [20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

[50, 60) 55 8 440 24 200

[60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250


2 88050
S = − (43,33) 2 = 218,94 42 1820 88050
42
Estadísticos
De dispersión
◦ La varianza
Datos agrupados (fórmula compleja)
Li-1, Li xi ni xi · ni xi – X (xi – X)2 (xi – X)2 * ni

[10, 20) 15 1 15 -28,33 802,8 802,78

[20, 30) 25 8 200 -18,33 336,1 2688,89

[30,40) 35 10 350 -8,33 69,4 694,44

[40, 50) 45 9 405 1,67 2,8 25,0

[50, 60) 55 8 440 11,67 136,1 1088,89

[60,70) 65 4 260 21,67 469,4 1877,78

[70, 80) 75 2 150 31,67 1002,8 2005,56

42 1 820 9183,33
n

∑ ( xi − x)2ni 1820 9183,33


S 2
= i =1 X = = 43,3 S2 = = 218,65
N 42 42
Estadísticos
De dispersión
◦ La varianza
Propiedades
Siempre un valor positivo o cero (desviaciones elevadas
al cuadrado).
Si a todos los individuos de la variable
se les suma un número la varianza no varía
se multiplican por un número la varianza queda
multiplicada por el cuadrado de dicho número
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular
la varianza total.
Si tienen el mismo tamaño:

Si tienen distinto tamaño


Estadísticos
De dispersión
◦ La varianza
Observaciones
Muy sensible a valores atípicos
No expresada en las mismas unidades que los
datos originales (desviaciones elevadas al
cuadrado).
Estadísticos
De dispersión
◦ La desviación típica (tipo o estándar)
Raíz cuadrada de la varianza
s (muestra); σ (población)
n

S=
2 2
( x1 − x) + ( x2 − x) + ... + ( xb − x) 2
∑ i
( x
i =1
− x ) 2

N S=
N
Simplificando
n
xi2 2
x12 + x22 + ... + xn2 2 S = ∑ −x
S= −x i =1 N
N

En muestras pequeñas N≤30 se suele sustituir el


denominados por N-1
Estadísticos
De dispersión
◦ La desviación típica
Cálculo distribución:
9, 3, 8, 8, 9, 8, 9, 18

S=
Estadísticos
De dispersión
◦ La desviación típica
Para distribuciones continuas
n

( x1 − x) 2 n1 + ( x2 − x) 2 n2 + ... + ( xb − x) 2 nn
∑ i ni
( x
i =1
− x ) 2

S=
N
S=
N

2 2
x n + x n + ... + x n 2
n
xi2 ni 2
S= 1 1 2 2
−x
2
n n S= ∑ −x
N i =1 N
Estadísticos
De dispersión
◦ La desviación típica
Cálculo para datos agrupados (fórmula sencilla)
n
xi2 2
S = ∑ −x Li-1, Li xi ni xi · ni xi2 · ni
i =1 N
[10, 20) 15 1 15 225

[20, 30) 25 8 200 5000

[30,40) 35 10 350 12 250

[40, 50) 45 9 405 18 225

88050 2 [50, 60) 55 8 440 24 200


S= − (43,33) = 14,797
42 [60,70) 65 4 260 16 900

[70, 80) 75 2 150 11 250

42 1 820 88 050
Estadísticos
De dispersión
◦ La desviación típica
Propiedades
Siempre un valor positivo o cero
Si todos los valores de la variable
se les suma un número la desviación típica no
varía.
se multiplican por un número la desviación típica
queda multiplicada por dicho número.
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.
Si tienen el mismo tamaño

Si tienen distinto tamaño


Estadísticos
De dispersión
◦ La desviación típica
Observaciones
Parámetro de dispersión absoluta:
Cuanto más altos los valores de partida, más
alta la desviación típica
Cuanta más pequeña mayor será la
concentración de datos alrededor de la media.
Muy sensible a las puntuaciones extremas.
Estadísticos
De dispersión
◦ El coeficiente de variación
Relación entre la desviación típica y la media
Se expresa en porcentajes
S
CV = • 100
x

Permite comparar las dispersiones de dos


distribuciones distintas, siempre que sus
medias sean positivas
A mayor coeficiente de variación mayor
dispersión
Estadísticos
Puntuaciones
◦ Puntuaciones típicas
Resultado de dividir la desviación respecto a
la media entre la desviación típica
(tipificación)
Se utilizan para comparar las puntuaciones
obtenidas en distintas distribuciones
(parámetro de dispersión relativa

Se representa por Z xi − x
Z=
S
Estadísticos
Puntuaciones
◦ Puntuaciones típicas
Observaciones
La media aritmética de las puntuaciones típicas es
0
La desviación típica de las puntuaciones típicas es
1
Adimensionales independientes de las
unidades utilizadas
Estadísticos
Puntuaciones
◦ Puntuaciones típicas
30
Xi (xi – X¯) zi X = = 4,28
7
3 1,65 -0,64

4 0,08 -0,24
44,23
S= = 2,51
7
5 0,51 0,14

1 10,79 -1,44 Para xi = 3 (primer caso)


2 5,22 -1,04

6 2,93 0,54

9 22,22 1,74
xi − x 3 − 4,28
Z= = = −0,64
30 S 2,51
Estadísticos
De posición (estructura)
◦ Dividen un conjunto de datos en grupos
con el mismo número de individuos
◦ Son:
Cuartiles: dividen la serie de datos en cuatro
partes iguales
Deciles: dividen la serie de datos en diez
partes iguales
Percentiles: dividen la serie de datos en cien
partes iguales
Estadísticos
De posición (estructura)
◦ Los cuartiles
Tres valores que dividen un conjunto de
datos ordenados en cuatro partes iguales.
1C, 2C y 3C valores correspondientes al 25%,
al 50% y al 75% de los datos.
2C = mediana.
Estadísticos
De posición (estructura)
◦ Obtención cuartiles
Ordenar los datos de menor a mayor
Buscar el lugar que ocupa cada cuartil

Número impar de datos


2, 5, 3, 6, 7, 4, 9

Número par de datos


2, 5, 3, 4, 6, 7, 1, 9
Estadísticos
De posición (estructura)
◦ Cálculo de cuartiles para datos agrupados

Buscar la clase donde Ni =>


k•N
− N i −1
C k = Li −1 + 4 • ai
ni

Li-1 límite inferior de la clase seleccionada


Ni-1 frecuencia acumulada anterior a la clase seleccionada
ni frecuencia absoluta de la clase seleccionada
ai amplitud de la clase
Estadísticos
De posición (estructura)
◦ Cálculo de los cuartiles para datos
agrupados
Ejemplo k•N
− N i −1
Li-1, Li ni Ni C k = Li −1 + 4 • ai
ni
[50, 60) 8 8
1C
[60, 70) 10 18

[70, 80) 16 34

[80, 90) 14 48

[90, 100) 10 58
2C
[100, 110) 5 63

[110, 120) 2 65

65
3C
Estadísticos
De posición (estructura)
◦ Deciles
Nueve valores que dividen la serie de datos
en diez partes iguales
Equivalen a los valores correspondientes al
10%, al 20%... al 90% de los datos.
D5 coincide con la mediana

k•N
− N i −1
Dk = Li −1 + 10 • ai
ni
Estadísticos
De posición (estructura)
◦ Deciles
k•N
− N i −1
Dk = Li −1 + 10 • ai
ni
Li-1, Li ni Ni

[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Estadísticos
De posición (estructura)
◦ Gráfico de caja y bigotes
• Proporciona: idea intuitiva de la simetría
de la distribución de los datos
Detecta valores atípicos
• Necesitamos saber valores mínimo y
máximo, cuartiles 1C (25% de los datos),
2C o mediana (el 50% de los datos) y 3C
(75% de los datos)
• Rango Inter Cuartílico (RIC): (3C-1C)
• Ls Límites superior 3C+1.5*RIC
• Lm Límite inferior 1C-1.5*RIC
• Atípicos: < 1C-3*RIC y > 3C+3*RIC
Estadísticos
De posición (estructura)
◦ Desviación cuartílica

Li-1, Li ni Ni

[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
3C − 1C 90,75 − 68,25
[110, 120) 2 65 DC = = = 11,25
65
2 2
Estadísticos
De posición (estructura)
◦ Desviación percentílica

Li-1, Li ni Ni

[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58 D9 − D1 101 − 58,12
DP10−90 = = = 16,37
[100, 110) 5 63 2 2
[110, 120) 2 65
65
Estadísticos
De forma
◦ Simetría de los datos respecto al valor central
Asimetría negativa: la cola de la distribución se
alarga para valores inferiores a la media.
Simétrica: mismo número de elementos a izquierda
y derecha de la media (coinciden la media, la
mediana y la moda) campana de Gauss (normal).
Asimetría positiva: la cola de la distribución se
alarga para valores superiores a la media.
Estadísticos
De forma
◦ Coeficientes de asimetría o de sesgo
◦ Coeficiente de asimetría de Pearson: mide la
diferencia entre la media y la moda respecto a
la dispersión del conjunto
Para distribuciones unimodales y poco asimétricas.

X − Mo 3 ∗ ( X − Me)
As = As =
S S
As < 0 As = 0 As > 0

X = Mo Mo X
X Mo
Estadísticos
De forma
◦ Coeficientes de asimetría o de sesgo
Coeficiente de asimetría de Fisher
Evalúa la proximidad de los datos a su media
x cuanto mayor sea el numerador, mayor
asimetría

1
∑ i
( x
i =1
− X ) 3
ni
g1 = 3 ⋅
S N
Estadísticos
De forma
Coeficientes de asimetría o de sesgo
Coeficiente de secgo cuartílico (Bowley-Yule)
Toma como referencia los cuartiles

(Q3 − Q2 ) − (Q2 − Q1 )
SC =
Q3 − Q1
Estadísticos
De forma
◦ Coeficientes de asimetría o de sesgo
◦ Coeficiente de Bowley-Yule
Si <0 asimetría negativa: la distancia de la mediana al
primer cuartil es menor que al tercero.
Si =0 distribución simétrica: el primer y tercer cuartil
están a la misma distancia de la mediana.
Si >0 asimetría positiva, ya que la distancia de la
mediana al tercer cuartil es mayor que al primero.
Estadísticos
De forma
◦ Coeficiente de apuntamiento o curtosis
Mide cuán escarpada o achatada está una curva o
distribución.
Indica la cantidad de datos cercanos a la media, de
manera que a mayor grado de curtosis, más
escarpada (o apuntada) será la forma de la curva.
Estadísticos
De forma
Coeficiente de apuntamiento o curtosis
k

1
∑ i
( x
i =1
− X ) 4
ni
Ap = 4 ⋅
S N

Mesocúrtica Ap=3 Leptocúrtica Ap > 3 Platicúrtica Ap < 3


Estadísticos
De forma

Li-1, Li xi ni xi · ni xi · X (xi ·X )2ni (xi ·X )3ni (xi ·X )4ni

[0, 10) 5 2 10 -27,25 1540,13 -42738,47 1185992,51

[10,20) 15 5 75 -17,75 1575,31 27961,80 496321,9

[20,30) 25 9 225 -7,75 540,56 -4189,36 32467,5

[30,40) 35 12 420 2,25 60,75 136,69 307,5

[40,50) 45 8 360 12,25 1200,50 14706,13 180150,0

[50,60) 55 4 220 22,25 1980,25 44060,56 980347,5

40 1310 6897,50 -15968,25 2875587


Estadísticos
De forma
n

X =
1310
= 32,75
∑ (x
i =1
i − x ) 2 ni
6897,50
40 S= = = 13,13
N 40

1
∑ i
( x
i =1
− X ) 3
ni
1 − 15968,25
g1 = 3 ⋅ = 3
⋅ = −0,17
S N 13,13 40
k

1
∑ i
( x
i =1
− X ) 4
ni
1 2875587
Ap = 4 ⋅ = 4
⋅ = 2,41
S N 13,13 40
Estadísticos
De concentración
◦ Cuantifican el grado de igualdad en el
reparto de los valores de una variable
◦ Indicadores del grado de distribución de
la variable
Índice de Gini
Curva de Lorenz
Estadísticos
De concentración
◦ Índice de Gini: ingresos per cápita
Estadísticos
De concentración
◦ Índice de Gini

k −1
∑ (p i − q i )
i =1
IG = k −1
∑ pi
i =1
Estadísticos
De concentración
◦ Índice de Gini
Li-1 - Li xi ni Ni pi = ui= xini Ui qi = pi - qi
(Ni/∑ni) * (Ui/∑ui) *
100 100
(0 – 50] 25 23 23 8,85 575 575 1,48 7,37
(50 – 100] 75 72 95 36,54 5400 5975 15,38 21,16
(100 – 150] 125 62 157 60,38 7750 13725 35,33 25,06
(150 – 200] 175 48 205 78,85 8400 22125 56,95 21,90
(200 – 250] 225 19 224 86,15 4275 26400 67,95 18,20
(250 – 300] 275 8 232 89,23 2200 28600 73,62 15,61
(300 – 350] 325 14 246 94,62 4550 33150 85,33 9,29
(350 – 400] 375 7 253 97,31 2625 35775 92,08 5,22
(400 – 450] 425 5 258 99,23 2125 37900 97,55 1,68
(450 – 500] 475 2 260 100,00 950 38850 100,00 0,00
260 38850 125,48
651,15
Estadísticos
De concentración
◦ Índice de Gini
k −1
∑ ( pi − q i ) 125,48
i =1
IG = k −1
= = 0,193
651,15
∑ pi
i =1

◦ Número entre 0 y 1
0 = igualdad máxima = dispersión
1 = desigualdad máxima= concentración
Estadísticos
De concentración
◦ Curva de Lorenz
Representación gráfica de pi en % (abscisa)
y qi en % (ordenada)
Cuanto más cerca de la diagonal, menor
concentración/más homogeneidad en la
distribución.
Cuanto más cerca de los ejes (parte inferior),
mayor concentración/menor homogeneidad
Estadísticos
De concentración
◦ Curva de Lorenz

120,0

100,0

80,0

60,0
qi
% 40,0

20,0

0,0
0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 100, 110,
0 0

pi %

Das könnte Ihnen auch gefallen