Sie sind auf Seite 1von 55

28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Características de Una Distribución de


Frecuencias
Fecha: 2007
From: Estadística descriptiva
Publisher: Ediciones Paraninfo, S.A.
Tipo de documento: Topic overview
Páginas: 45
Content Level: (Level 5)

Texto completo:

Características de Una Distribución de


Frecuencias

Página 18

2.1. Introducción
Como ya se comentó en el Capítulo 1, la información que suministra una tabla de frecuencias acerca
de un carácter estadístico puede ser representada en un gráfico, o sintetizada en unas medidas
numéricas que describan de manera más precisa el comportamiento del carácter analizado. En este
capítulo se van a estudiar las denominadas medidas de posición, medidas de dispersión y medidas
de forma. Para ello, se hará referencia a los caracteres cuantitativos, es decir, se utilizarán los
términos variable y valor, aunque algunas de estas medidas (posición) también son de aplicación
para el caso de los caracteres cualitativos o atributos.

Las medidas de posición permiten situar la distribución, es decir, fijan el comportamiento global de
una variable a partir de los valores individuales recogidos en la tabla. Las primeras medidas de
interés son las medidas de posición o tendencia central de la distribución que, en cierta manera,
reflejan el centro o punto sobre el que gravita el conjunto de valores de la distribución. Otras medidas
de posición más generales son las no centrales. Las medidas de dispersión determinan la variabilidad
existente en los valores de la variable. Las medidas de forma informan, sin necesidad de representar
gráficamente la distribución, sobre la deformación horizontal (medidas de asimetría) y vertical
(medidas de curtosis o apuntamiento) de la misma.

2.2. Medidas de posición


2.2.1. MEDIDAS DE POSICIÓN CENTRAL

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 1/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Las medidas de posición central más importantes son las medias (aritmética, geométrica y armónica),
la mediana y la moda.

2.2.1.1. Media aritmética

Dada una distribución de frecuencias (xi; ni), la media aritmética, o simplemente media, que se
denota por x¯, viene definida por la expresión

Como

, la media aritmética también puede expresarse como:

Página 19

Como puede apreciarse, en la media aritmética cada valor de la variable va ponderado por su
importancia relativa en la distribución. No obstante, no tiene por qué coincidir con ningún valor de la
distribución, siendo su centro de gravedad.

Si los datos estuvieran agrupados en intervalos, la expresión de la media aritmética sería la misma,
pero utilizando, esta vez, la marca de clase (x'i).

EJEMPLO 2.1
Las pensiones mensuales de jubilación de 50 personas, trabajadores autónomos, son las siguientes:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 2/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

La pensión mensual será:

EJEMPLO 2.2
Agrupando la distribución del ejemplo anterior en cinco intervalos de igual amplitud, se tiene:

Página 20

y la media aritmética toma el valor:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 3/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

En el primer intervalo, se observa que hay 15 personas que perciben una pensión comprendida
entre 450 y 500 euros; sin embargo, al utilizar la marca de clase lo que se hace es suponer que la
pensión de todas esas personas es de 475 euros; lo mismo ocurre en los demás intervalos. Como
puede observarse, la pensión media de esta distribución no coincide con la del Ejemplo 2.1, es decir,
se ha cometido un error, denominado error de agrupamiento. Con las distribuciones agrupadas se
simplifican mucho los cálculos pero también se pierde información, o, dicho de otra manera, la
información es menos exacta (lo que lleva en nuestro ejemplo a una pensión media ligeramente
inferior a la real), por lo que habrá que ver hasta qué punto compensa el agrupar o no los valores de
la distribución en intervalos.

Las principales propiedades de la media aritmética son las siguientes:

1. La suma de las desviaciones de los valores de la variable respecto a su media aritmética es cero:

2. La media aritmética del cuadrado de las desviaciones de los valores de la variable respecto a una
constante k cualquiera se hace mínima cuando dicha constante es igual a la media aritmética
(Teorema de König). En efecto,

por lo que

se hace mínima cuando

, ya que en ese caso

se anula.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 4/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos disjuntos, la media


aritmética de todo el conjunto se encuentra relacionada con las medias aritméticas de los
subconjuntos disjuntos. Considérese la distribución expuesta en la tabla de la página siguiente, de
donde se han obtenido k subconjuntos disjuntos de tal manera que

Página 21

La media aritmética del conjunto total será:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 5/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Esta propiedad es muy útil cuando se incorpora algún valor a la distribución, porque no hace falta
calcular nuevamente la media de todos los valores. Si a la distribución del Ejemplo 2.1 se le añaden
las pensiones de 5 trabajadores más, cada una de 600 euros, la pensión media de los 55
trabajadores es

Página 22

4. Si a todos los valores xi de una distribución (xi; ni) se les suma (resta) una constante b, la media
aritmética de la nueva distribución (yi; ni) queda aumentada (disminuida) en esa constante. En otros
términos, a la media aritmética le afectan los cambios de origen.

Si yi = xi ± b, la media aritmética de la variable y será:

5. Si a todos los valores xi, de una distribución (xi; ni) se les multiplica (divide) por una constante a,
distinta de cero, la media aritmética de la nueva distribución (yi; ni) queda multiplicada (dividida) por
esa constante. Es decir, a la media aritmética le afectan los cambios de escala.

Si yi = axi, la media aritmética de la variable y será

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 6/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

6. Como consecuencia de las dos propiedades anteriores, si a una variable se le aplica un cambio de
origen b y un cambio de escala a, la media de la nueva variable y = ax ± b será

La media aritmética tiene una serie de ventajas:

En su cálculo intervienen todos los valores de la distribución, lo cual parece un requisito


indispensable de un promedio.
Es fácil de calcular y siempre se puede determinar. En distribuciones agrupadas es necesario
que los intervalos estén perfectamente definidos; si los intervalos son del tipo menor que o
mayor que, al no poderse calcular la marca de clase tampoco se puede calcular la media.
Es única.
La media aritmética es el centro de gravedad de la distribución, en virtud de la primera
propiedad.

Página 23

EJEMPLO 2.3

Considérense las siguientes tres distribuciones de salarios anuales (miles de euros):

Estas distribuciones tienen idéntica media aritmética: 70 (en otros términos, idéntico centro de
gravedad, representado por ▴). Sin embargo, en las dos primeras este valor es el resultado de
promediar valores muy parecidos entre sí, y en la tercera valores muy grandes con valores muy
pequeños.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 7/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

El principal inconveniente de la media aritmética es la escasa representatividad que puede tener,


como valor central de la distribución, en el caso de que la variable tome valores anormalmente
extremos (como ocurre en la tercera distribución del Ejemplo 2.3), dando lugar a conclusiones no muy
fiables.

2.2.1.2. Media geométrica

La media geométrica de una distribución de frecuencias (xi; ni), que se representa por G, se define
como la raíz N-ésima del producto de los valores de la variable elevados a sus correspondientes
frecuencias absolutas.

Página 24

Nótese que

y utilizando las propiedades de los logaritmos,

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 8/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Por tanto:

es decir, el logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los
valores de la variable.

Como puede observarse, en el cálculo de la media geométrica también intervienen todos los valores
de la distribución. Sin embargo, uno de los grandes inconvenientes de esta medida central es su no
representatividad cuando uno (o varios) de los valores sea cero, ya que G se anula. Por otra parte,
cuando algunos de los valores de la variable son negativos, existen determinados casos en los cuales
no se puede calcular la media geométrica; esto no significa que no exista sino que no se puede
determinar.

La media geométrica se suele utilizar para promediar, por ejemplo, tipos de interés, tasas de
variación, porcentajes y números índice, es decir, cuando los valores de la variable presentan
variaciones acumulativas.

EJEMPLO 2.4

Un individuo invirtió 12.000 euros en un plan de pensiones. Durante los cinco años siguientes las
tasas de revalorización fueron del 5,6%, 2,25%, 4,15%, 8% y 9%, respectivamente. Calcúlese la tasa
de revalorización media anual de esos cinco años.

Si a la cantidad inicial invertida, S0, se le aplican sucesivamente las tasas de revalorización anuales,
r1, r2, r3, r4, r5, se obtienen las cantidades resultantes para los cinco años:

Página 25

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 9/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

La tasa media anual que ha de calcularse (r), que debido a su naturaleza se conoce como tasa
media anual acumulativa, debe ser tal que, aplicada sucesivamente durante cinco años a la cantidad
inicial, proporcione el montante del último año considerado. Es decir, se debe verificar

o bien

Por tanto,

expresión que involucra la media geométrica de (1 + ri), siendo G = 1 + r.

Despejando la tasa media anual r, ésta resulta ser

Por tanto, al individuo le es indiferente que su dinero se incremente un porcentaje distinto cada año o
que aumente todos los años un 5,77%, ya que al final del quinto año la cuantía de su plan de
pensiones va a ser la misma:

Si se hubiese utilizado la media aritmética, el incremento sería

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 10/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

resultado no realista, pues 12.000(1 + 0,058)5 = 15.907,78 euros, cifra que no coincide con la
cantidad total que el individuo en cuestión tiene al final del quinto año: 15.886,13 euros.

2.2.1.3. Media armónica

La media armónica H de una distribución de frecuencias (xi; ni) se define como la inversa de la media
aritmética de los inversos de los valores de la variable; esto es,

Página 26

Igual que las dos medias anteriores, la media armónica tiene la ventaja de que en su cálculo
intervienen todos los valores de la variable; sin embargo, no tiene sentido su utilización cuando algún
valor de la distribución sea nulo.

La media armónica se suele utilizar para promediar rendimientos, productividades, etc., es decir,
cuando las unidades de medida de la variable analizada vienen dadas en forma de cociente.

EJEMPLO 2.5
Una empresa de equipos electrónicos tiene tres talleres de montaje con las siguientes cifras
mensuales:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 11/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

La productividad media del trabajo (número de equipos por empleado) se calcula de la siguiente
forma:

Nótese que 4.500/30 es el número de empleados del taller A:

Análogamente, 2.400/15 y 3.000/25 son los empleados de los talleres B y C, respectivamente, esto
es, 160 y 120.

Si se calcula la media aritmética de las productividades, se llega a:

resultado erróneo, pues, si se toma como productividad media 23,33 equipos por empleado, el
número total de equipos producidos sería 430 x 23,33 = 10.032, cuando la cifra real es de 9.900.

Página 27

2.2.1.4. Medias ponderadas

Cuando la ponderación de los valores de la variable (wi) es distinta de la frecuencia (absoluta o


relativa) se tienen las denominadas medias (aritmética, geométrica y armónica) ponderadas,
definidas, respectivamente, como

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 12/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

2.2.1.5. Mediana

Suponiendo que los valores de la variable están ordenados de menor a mayor, la mediana se define
como aquel valor que divide la distribución de frecuencias de forma que el número de frecuencias que
quedan a su izquierda es igual al número de las que quedan a su derecha.

Distribuciones no agrupadas en intervalos

Si el número total de datos es impar, la definición proporciona siempre un único valor, ya que
denominando k al número de observaciones inferiores y superiores a la mediana resulta que

siendo la mediana el valor que ocupa el lugar k + 1 de la distribución.

Sin embargo, si el número de datos es par, habrá dos valores medianos: el que ocupa el lugar

el que ocupa el lugar

puesto que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 13/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 28

En este caso, se conviene en tomar como valor mediano la media aritmética de ambos. No obstante,
esto no es sino un convenio. Perfectamente podría tomarse como mediana uno u otro.

Distribuciones agrupadas en intervalos

En el caso en que la distribución se encontrase agrupada en intervalos, no se tendrá un valor


mediano sino un intervalo mediano. Una vez establecido dicho intervalo mediano, hay que determinar
un valor dentro de él que se corresponda con la mediana, valor que no se puede calcular de forma
exacta puesto que se desconocen los diferentes valores que toma la variable en cada uno de los
intervalos. Existen varios criterios para aproximar el valor mediano:

a) Si se asigna ni a un punto, se puede considerar que la mediana es cualquier valor del intervalo,
exceptuando Li-1, puesto que los intervalos se consideran abiertos por la izquierda y cerrados por la
derecha.

b) Si no se asigna ni a un punto sino que se considera que todos los valores del intervalo están
distribuidos de manera uniforme dentro de él, se puede aproximar la mediana de la forma siguiente:

▪ Número de datos impar

Como se ha visto en distribuciones no agrupadas en intervalos, si el número de datos es impar la


mediana es aquel valor de la variable, supuesta una ordenación de menor a mayor, que ocupa el
lugar:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 14/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 29

Siguiendo este mismo criterio, el intervalo mediano será aquel que contenga la frecuencia

. Si el intervalo mediano es Li-1 – Li y se observa el histograma acumulativo de frecuencias del


Gráfico 2.1 se tiene:

Gráfico 2.1

Evidentemente, Me = Li-1 + m, y m se determina mediante la siguiente reglade tres:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 15/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

despejando m se tiene que

con lo que

Página 30

▪ Número de datos par

En este caso se dispone de dos valores medianos, que son los que ocupan las posiciones

Si ambos valores están en el mismo intervalo Li-1 – Li (intervalo mediano) se tiene que

pudiéndose tomar como mediana cualquiera de ellos o la media de los dos:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 16/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

es decir, la misma expresión que la obtenida para el caso de que la frecuencia total sea impar.

Si los dos valores medianos se encuentran en distintos intervalos, se procedería de forma análoga.

La mediana, como medida de posición central, resulta de gran utilidad en los casos siguientes:

Cuando existan valores anormalmente bajos o elevados. La mediana es menos sensible que la
media aritmética a estos valores extremos porque en su determinación no intervienen todos los
valores de la variable sino los que ocupan las posiciones centrales.
Cuando en las distribuciones agrupadas en intervalos el primero sea del tipo menor que o el
último del tipo mayor que, siempre y cuando ninguno de estos intervalos sea el intervalo
mediano.
Cuando se analizan variables cualitativas que vienen dadas en escala ordinal. En este caso, no
se puede determinar la media aritmética, siendo la mediana la medida de tendencia central más
representativa.

Página 31

EJEMPLO 2.6

Se dispone de la siguiente información acerca de las prestaciones mensuales por desempleo (euros)
percibidas por 15 personas:

Como el número de datos es impar, la prestación mensual mediana es el valor que ocupa el lugar

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 17/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

es decir, Me = 631 euros.

Si la distribución anterior tuviera un número par de observaciones como, por ejemplo,

donde

el primer valor mediano sería 631 y el segundo 644, siendo la media aritmética de ambos 637,5.

Página 32

EJEMPLO 2.7

El número de beneficiarios de prestaciones de nivel contributivo por desempleo en España en 2004,


según la edad de los mismos, viene recogido en la siguiente tabla:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 18/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Como se dispone de un número par de datos, los dos valores medianos ocupan, respectivamente,
las posiciones:

Dado que ambos se encuentran en el mismo intervalo mediano (35-40), la mediana es

EJEMPLO 2.8

Según la «Estadística de Accidentes de Trabajo» del Ministerio de Trabajo y Asuntos Sociales, entre
enero y septiembre de 2005 los accidentes laborales con baja registrados en España durante la
jornada de trabajo fueron, según su gravedad: leves: 675.190; graves: 7.508; mortales: 770.

Página 33

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 19/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Igual que ocurre en el caso de las variables, al ser el número de observaciones par, los dos valores
medianos corresponderán a aquellas dos modalidades que ocupen los lugares:

es decir, en cualquier caso, a los accidentes leves. En caso de dos modalidades medianas distintas,
es obvio que no se puede calcular la media aritmética de ambas, debiéndose proceder con un juicio
razonable. Si el número de observaciones es impar, existiría con una única modalidad central.

2.2.1.6. Moda

La moda es aquel valor de la variable que presenta mayor frecuencia absoluta, es decir, aquel que
más veces se repite. Puede darse el caso de que existan varios valores que presenten la máxima
frecuencia absoluta, teniéndose entonces una distribución bimodal, trimodal, etc.

Si la distribución está agrupada en intervalos, en primer lugar habrá que determinar el intervalo modal
y, posteriormente, elegir como moda un valor de dicho intervalo. Se distinguen dos casos:

A. La amplitud de los intervalos es la misma

En este caso, el intervalo modal es aquel que presenta mayor frecuencia absoluta y, como se
desconocen los valores incluidos en dicho intervalo, se puede aproximar la moda siguiendo varios
criterios:

A.1. Si se asigna ni a un punto, se puede elegir cualquier valor del intervalo como moda (descartando
el extremo inferior por considerar el intervalo abierto por la izquierda).

A.2. Si se considera que todos los valores del intervalo están distribuidos de manera uniforme dentro
de él y el intervalo modal es Li–1 – Li, la moda estará más cerca (lejos) del intervalo de la derecha
cuanto mayor (menor) frecuencia tenga este intervalo y menor (mayor) tenga el izquierdo (Grífico
2.2).

Página 34

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 20/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Gráfico 2.2.

La semejanza de los triángulos

permite hallar la longitud del segmento

(cantidad que se debe sumar a Li–1, para obtener el valor de la moda).

Por la semejanza de los triángulos, se verifica que

de donde se deduce que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 21/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

siendo

Por tanto,

B. La amplitud de los intervalos es distinta

En este caso, el intervalo modal no es el que tiene mayor frecuencia absoluta sino el que tiene mayor
frecuencia por unidad de intervalo, es decir, mayor densidad de frecuencia

. Una vez determinado el intervalo modal se puede aproximar la moda siguiendo los criterios vistos en
el caso anterior, siendo el más razonable el último

Página 35

con

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 22/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Por último, la moda es la mejor medida de tendencia central en el análisis de los atributos dados en
escala nominal, ya que sus modalidades no son susceptibles de ser ordenadas y tampoco admiten
ningún tipo de operación algebraica.

EJEMPLO 2.9

Los contratos registrados en España durante los ejercicios 2004 y 2005, según modalidad de
contratación y duración del contrato, fueron

El tipo de contrato más frecuente en nuestro país, tanto en el ejercicio 2004 como en 2005, fue el
eventual por circunstancias de la producción, puesto que es el que presenta en ambos años la
mayor frecuencia absoluta.

Página 36

EJEMPLO 2.10

Las prestaciones mensuales por desempleo (euros) de un determinado número de individuos son las
que se recogen en la siguiente tabla:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 23/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

El intervalo con mayor densidad de frecuencia es (500-600) y la moda sería

2.2.2. MEDIDAS DE POSICIÓN NO CENTRAL


Estas medidas, como su nombre indica, no reflejan ninguna tendencia central. Se denominan
genéricamente cuantiles y son aquellos valores de la variable, odenados en sentido creciente, que
dividen la distribución en partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias. Si la mediana divide la distribución en dos partes con idéntico número de observaciones,
por extensión, los cuartiles (Ci), deciles (Di) y percentiles (Pi) dividen a la misma en 4, 10 y 100
partes, respectivamente, con el mismo número de frecuencias.

A. Distribuciones no agrupadas en intervalos

La explicación se centrará en los cuartiles, si bien es fácilmente generalizable a los deciles y


percentiles.

Los cuartiles quedan perfectamente determinados si el número total de observaciones es inferior en


una unidad a cualquier múltiplo de 4. Sin embargo, en otros casos es necesario recurrir a
procedimientos que permitan determinar un valor concreto. Los procedimientos que se proponen son
los siguientes:

a) Si el número total de observaciones es múltiplo de 4: el primer y tercer cuartil quedan


perfectamente determinados; sin embargo, como segundo cuartil se tienen dos valores medianos, ya
que el número total de observaciones es par, optando por calcular la media aritmética de ambos.

Página 37

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 24/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

El primer cuartil ocupa el lugar:

El segundo cuartil o mediana: media aritmética de los dos valores medianos.

Los dos valores medianos ocupan los lugares:

El tercer cuartil ocupa el lugar

b) Si el número total de observaciones es inferior en una unidad a un múltiplo de 4:

Los cuartiles C1 C2 y C3 son los valores que ocupan los lugares:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 25/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

c) Si el número total de observaciones es inferior en 2 unidades a un múltiplo de 4: en este caso,


existen dos valores para cada cuartil, por lo que se considera la media aritmética de ambos.

Página 38

El primer y segundo valor del primer cuartil ocupan los lugares

El primer y segundo valor del segundo cuartil o mediana ocupan los lugares

El primer y segundo valor del tercer cuartil ocupan los lugares

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 26/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

d) Si el número total de observaciones es inferior en 3 unidades a un múltiplo de 4: como el número


total de observaciones es impar se tomará un valor mediano y dos valores para el primer y tercer
cuartil, y se procede posteriormente a promediar éstos.

El primer y segundo valor del primer cuartil ocupan los lugares

Página 39

El segundo cuartil o mediana ocupa el lugar

El primer y segundo valor del tercer cuartil ocupan los lugares

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 27/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

B. Distribuciones agrupadas en intervalos

Como en el caso anterior, se hará referencia a los cuartiles, si bien se puede proceder de forma
similar para la determinación de deciles y percentiles.

En primer lugar, hay que establecer el intervalo que contiene a cada uno de ellos y, posteriormente,
asignar un valor de dicho intervalo al cuartil correspondiente. De manera análoga a como se procedía
en la determinación de la mediana, se puede tomar como cuartil cualquier valor del intervalo excepto
el correspondiente al extremo inferior, por considerarse los intervalos abiertos por la izquierda, o bien
aplicar la siguiente expresión:

siendo NCi el lugar que ocupa el cuartil i-ésimo.

EJEMPLO 2.11

A partir de la siguiente distribución de salarios mensuales (euros), determínese el primer cuartil:

Como N es inferior en dos unidades a un múltiplo de cuatro, hay dos primeros cuartiles. Para el
primero:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 28/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 40

y, para el segundo:

es decir, 12 y 13, respectivamente. Por tanto, el primer y segundo valor del primer cuartil son

por lo que, promediando ambos, se considera como primer cuartil 1.550 euros.

2.3. Medidas de dispersón


Supóngase, por ejemplo, que el coste extra salarial (en euros) que cuatro trabajadores de una
empresa A y otros cuatro de una empresa B les suponen a ambas un determinado mes es:

pudiéndose apreciar que en la empresa B los valores de la variable varían poco y en la A mucho. Si
se calcula el coste extra salarial medio de ambas distribuciones, el resultado obtenido es 235 euros.
Sin embargo, estas dos distribuciones son bien distintas, ya que a la empresa A ningún trabajador le
supone un coste extra salarial próximo a 235 euros y a la B sí. Es decir, se puede considerar que el
coste extra salarial medio de los cuatro trabajadores de la empresa B es más representativo que el de
los cuatro de la empresa A.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 29/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Esto indica que, para caracterizar una distribución, además de calcular las medidas de posición,
también resulta necesario analizar su variabilidad. Dicha variabilidad, habitualmente, se mide
respecto a una medida de posición central, pretendiendo, de esta manera, conocer la
representatividad de los valores centrales de la distribución, es decir, si estos valores sintetizan de
forma satisfactoria o no toda la información de la distribución.

Página 41

Existen dos tipos de medidas de dispersión: las absolutas y las relativas. Las primeras se utilizan
cuando se trata de analizar la variabilidad de, únicamente, una distribución de frecuencias y, las
segundas, cuando se pretende comparar la variabilidad de dos o más.

2.3.1. MEDIDAS DE DISPERSIÓN ABSOLUTAS


A Medidas de dispersión obtenidas por comparación directa entre los valores de la variable

Recorrido o rango

Se define como la diferencia entre el máximo y mínimo valor de la variable:

En el ejemplo anterior, el recorrido de la distribución de la empresa A es 270 euros y en la empresa B


20 euros. Al tener ambas el mismo número de observaciones y ser el recorrido de la distribución de la
empresa B mucho más pequeño, en principio, se puede suponer que esta distribución está menos
dispersa que la de la empresa A; o dicho de otra manera, las diferencias entre sus valores son
menores.

Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo, el inconveniente que
presenta es que sólo depende de los valores extremos, por lo que si éstos se encuentran alejados del
resto de los valores de la distribución (es decir, son valores anómalos) puede dar lugar a
conclusiones erróneas.

Recorrido o rango intercuartílico

Para evitar el problema de los valores anómalos, se suele emplear el denominado recorrido o rango
intercuartílico, que se define como la diferencia entre el tercer y primer cuartil

donde el intervalo de longitud RI contiene el 50% de lo valores centrales de la distribución. Cuanto


mayor sea el recorrido intercuartílico mayor será la variabilidad o dispersión de la distribución de
frecuencias.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 30/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Diferencia media de Gini

Se define como

Página 42

esto es, el promedio de las diferencias (en valor absoluto) entre cada par de valores de la
distribución. Su principal incoveniente radica en la tediosidad de su cálculo.

B Medidas de dispersión obtenidas por comparación entre los valores de la variable y una medida de
posición central

Si lo que se pretende es analizar la mayor o menor representatividad de los valores centrales de la


distribución, es necesario utilizar otro tipo de medidas que hagan referencia a algún promedio. De
todos los promedios estudiados se ha elegido la media aritmética, porque es la medida de posición
central por excelencia habida cuenta de sus propiedades y ventajas. Dentro de las medidas de
dispersión absolutas respecto a la media aritmética, la varianza y la desviación típica son las más
utilizadas.

Varianza

Para determinar la mayor o menor separación entre los valores de la variable y la media aritmética,
se podrían promediar las desviaciones de cada valor respecto a la media aritmética

sin embargo, por la primera propiedad de la media aritmética, esta expresión es nula ya que las
desviaciones positivas se compensan con las negativas. Una forma de evitar esta circunstancia es
considerar las desviaciones elevadas al cuadrado, con lo cual tiene que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 31/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Esta expresión se denomina varianza y se define como la media aritmética de los cuadrados de las
desviaciones entre los valores de la variable y la media aritmética, siendo, por la segunda propiedad
de la media aritmética, una medida de dispersión óptima.

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media
aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y, por tanto, menor
representatividad tendrá la media aritmética.

Las propiedades de la varianza son las siguientes:

1. La varianza siempre es mayor o igual a cero.

Página 43

2. La varianza se puede expresar como:

3. Si de un conjunto de valores se pueden obtener dos o más subconjuntos disjuntos, la varianza de


todo el conjunto se encuentra relacionada con las varianzas de los subconjuntos disjuntos.
Considerése la siguiente distribución:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 32/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

de donde se han obtenido k subconjuntos disjuntos de tal manera que

Página 44

La varianza del conjunto total será

Ya se vio que

es la media total de los k grupos

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 33/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

De la misma forma se podría expresar

Por tanto,

Pero los dos últimos términos de la expresión anterior no son sino la varianza de una distribución
cuyos valores son las medias de los grupos y sus frecuencias absolutas los tamaños de los mismos.
En consecuencia, la varianza global de la distribución se puede expresar como la media ponderada
de la varianza de los grupos más la varianza de la distribución de medias anteriormente citada.

O, en otros términos, como

ya que la media de la distribución de medias grupales es la media de la variable.


https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 34/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 45

Por consiguiente, la varianza global se puede obtener como una suma ponderada de las varianzas de
cada grupo (primer sumando) más una suma ponderada de las diferencias cuadráticas de las medias
de cada grupo con respecto a la media global. En definitiva, la varianza global se puede
descomponer en dos sumandos: el primero hace referencia a la variabilidad intrínseca de cada grupo
(variabilidad intragrupos) y el segundo a la variabilidad de las medias de cada grupo (variabilidad
intergrupos).

4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta) una constante b, la
varianza de la nueva distribución (yi; ni) no varía, es decir, a la varianza no le afectan los cambios de
origen (si por ejemplo a todos los trabajadores de una empresa les suben el sueldo mensual 100
euros, la variabilidad de los salarios sigue siendo la misma).

Si yi = xi ± b, la varianza de la variable y será

5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide) por una constante a,
distinta de cero, la varianza de la nueva distribución (yi; ni) queda multiplicada (dividida) por esa
constante al cuadrado; es decir, a la varianza le afectan los cambios de escala.

Si yi = axi, la varianza de la variable y será

6. Teniendo en cuenta las dos propiedades anteriores, si a una variable se le aplica un cambio de
origen b y un cambio de escala a, la varianza de la nueva variable yi = axi + b es

Desviación típica o estándar

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 35/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

La varianza viene expresada en las mismas unidades de medida que la variable analizada pero
elevadas al cuadrado, lo que dificulta su interpretación (piénsese que en una distribución de salarios
la varianza vendrá dada en euros2). Ante esta situación, es necesario definir otra medida que venga
expresada en las mismas unidades de medida que la variable. Esta medida es la desviación típica o
estándar.

Página 46

Se define la desviación típica como la raíz cuadrada con signo positivo de la varianza, esto es,

Cuanto mayor sea la desviación típica, mayor dispersión existirá entre los valores de la distribución y
la media aritmética y, por tanto, la media aritmética será menos representativa.

Las propiedades de la desviación típica se deducen directamente de las de la varianza:

1. La desviación típica siempre es mayor o igual que cero.

2. La desviación típica también puede expresarse como

3. A la desviación típica no le afectan los cambios de origen: si yi = xi ± b, entonces

4. A la desviación típica le afectan los cambios de escala: si yi = axi, entonces

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 36/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

5. Si a una variable se le aplica un cambio de origen b y un cambio de escala a, la desviación típica


pasa a ser

6. La desviación típica, igual que la varianza, es una medida de dispersión óptima.

EJEMPLO 2.12

La siguiente tabla contiene la distribución de altas diarias de afiliados a la Seguridad Social en


España durante el mes de enero de 2006 (en miles). Calcúlese la media diaria de dichas altas, así
como su desviación típica.

Página 47

El núimero medio de altas diarias, en miles, será

y su desviación típica, también en miles,


https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 37/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

2.3.2. MEDIDAS DE DISPERSIÓN RELATIVAS


Supóngase, por ejemplo, que se dispone de las distribuciones de edades de los trabajadores afiliados
a la Seguridad Social en los regímenes especiales agrícola y marítimo: en el agrícola la edad media
es de 43 años y la desviación típica de 5 años, y en el marítimo la edad media también es de 43 años
pero la desviación es de 8 años. Evidentemente, puesto que la edad media es la misma en ambos
regímenes, la distribución del régimen marítimo presenta mayor dispersión, ya que tiene mayor
desviación típica y, por tanto, la edad media es menos representativa que en el régimen agrícola. Sin
embargo, si las edades medias fueran distintas, no se podría utilizar la desviación típica para
determinar la representatividad de las mismas, ni tampoco en

Página 48

el caso de que las unidades de medida fuesen diferentes (por ejemplo, si se tiene una distribución de
salarios y otra de edades).

Para evitar estos inconvenientes, hay que poner en relación la medida de dispersión con la de
tendencia central, y ello en forma de cociente para que la medida resultante sea adimensional. Este
tipo de cocientes son las denominadas medidas de dispersión relativas, de las que existen varias en
la literatura estadística, siendo la más utilizada el coeficiente de variación de Pearson.

Este coeficiente se define como el cociente entre la desviación típica y el valor absoluto de la media
aritmética

Se puede apreciar que:

Como las unidades de medida de la desviación típica y de la media aritmética son las mismas,
este cociente es adimensional; por tanto, es útil para comparar varias distribuciones.
Como el coeficiente de variación representa el número de veces que la desviación típica
contiene a la media, cuanto mayor sea este coeficiente, mayor dispersión existirá (más veces
contendrá la desviación típica a la media aritmética), por lo que menor será la representatividad
de la media aritmética y menor será la homogeneidad de los valores de la distribución.
El coeficiente de variación utiliza toda la información de la distribución.
El coeficiente de variación se anula cuando la desviación típica es cero. En este caso no
existiría dispersión y todos los valores de la distribución son iguales.
Cuando la media aritmética es cero, no tiene sentido su cálculo.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 38/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Este coeficiente puede expresarse también en porcentaje, simplemente multi-plicando la


expresión anterior por 100.

EJEMPLO 2.13

En el Ejemplo 2.12 se ha procedido al cálculo de la media y la desviación típica de las altas diarias
de afiliados a la Seguridad Social en España durante el mes de enero de 2006. Ahora, en la tabla
adjunta, se presenta la información relativa a las bajas diarias de afiliados en España durante dicho
mes (también en miles). ¿Cuál de las dos medias diarias, la de altas o la de bajas, es más
representativa?

Página 49

Procediendo de la misma manera que en el ejemplo anterior, el número medio de bajas, en miles,
seraá

y su variabilidad en torno a este valor medio, también en miles,

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 39/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Para determinar cuál de las dos medias es más representativa, se procede al cálculo de los
coeficientes de variación de ambas distribuciones de frecuencias,

llegándose a la conclusión de que, si bien ambos son muy similares, la media de las bajas diarias en
los registros de afiliación a la Seguridad Social es ligeramente más representativa.

Página 50

2.3.3. VARIABLE TIPIFICADA


Supóngase que se dispone de una distribución de frecuencias (xi; ni) con una determinada media y
desviación típica. Si a todos los valores de la distribución se les resta la media y se les divide por la
desviación típica, la variable resultante se denomina variable tipificada:

y se caracteriza porque su media es cero y su varianza uno, como puede comprobarse fácilmente
aplicando las propiedades de la media y varianza.

EJEMPLO 2.14

Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por una empresa española
y la otra por una americana. La empresa española le ofrece un sueldo anual bruto de 53.000 euros,
mientras que la oferta de la americana es de 50.000 $. Por otro lado, esta persona tiene información
sobre el sueldo medio y la desviación típica salarial de las distribuciones de ambas empresas:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 40/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

¿En cuál de las dos empresas la posición relativa de este individuo es mejor respecto a los demás
trabajadores?

Como las unidades de medida de ambas distribuciones no son iguales, no se pueden comparar las
remuneraciones de las dos empresas, por lo que habrá que transformar estos valores de manera
que las distribuciones tengan la misma media y la misma desviación típica, es decir, habrá que
tipificar los salarios.

En el caso de los salarios ofertados al individuo en cuestión, se tiene que

Como las distribuciones de los salarios tipificados tienen media igual a cero y desviación típica igual
a 1, se observa que en ambas empresas la remuneración de ese individuo está por encima de la
media. Sin embargo, en la empresa española estaría 3,71 desviaciones típicas por encima de la
media, mientras que en la americana su salario sería 7,82 desviaciones típicas superior al salario
medio, lo que refleja que su posición relativa frente a los demás trabajadores es mejor en la empresa
americana.

Página 51

2.3.4. DESIGUALDAD DE TCHEBICHEFF

En caso de no disponer de la distribución de frecuencias nada se puede saber sobre el número de


frecuencias mayores que un determinado valor de la variable, o menores que él, o comprendidos
entre dos valores de la variable. Sin embargo, si se conocen la media y la desviación típica de dicha
distribución es posible conocer el número mínimo de frecuencias contenidas en un intervalo simétrico
respecto de la media, aunque no se disponga de la distribución de frecuencias. Tal aportación, sin
duda importante, se debe al matemático ruso Tchebicheff.

Sea una distribución de frecuencias (xi; ni). Se divide en dos clases: la primera, C1, contiene los
valores de la variable que distan de la media de la distribución (en valor absoluto) más que una
distancia k positiva. La segunda, C2, contiene el resto de valores.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 41/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

En consecuencia:

y como en C1 resulta que

, se tiene que

y despejando se obtiene que

o bien,

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 42/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 52

En el caso particular en que k = k*Sx, siendo k* una constante mayor que cero, se tiene que

La interpretación de este resultado es como sigue: el porcentaje del total de valores de la distribución
que se encuentran comprendidos entre la media aritmética ± k* veces la desviación típica de la
distribución es, como mínimo, 1 – 1/k*2. De este resultado se desprende que, para cualquier
distribución de frecuencias:

— Entre

están comprendidas, al menos, el 75% de las frecuencias de la distribución.

— Entre

están comprendidas, al menos, el 89% de las frecuencias de la distribución.

— Entre

están comprendidas, al menos, el 94% de las frecuencias de la distribución.

2.4. Medidas de forma


Para realizar un resumen completo de la variable objeto de estudio se deben analizar, además de las
medidas de posición y dispersión, otra serie de medidas que caracterizan de forma más precisa el
comportamiento de dicha variable, ya que pueden existir distribuciones que presenten el mismo valor
central e igual grado de dispersión, y diferir, sin embargo, en la forma o aspecto de sus histogramas o
diagramas de barras. Estas medidas se conocen con el nombre de medidas de forma y pueden ser
de dos tipos: de asimetría y de apuntamiento o curtosis.

2.4.1. MEDIDAS DE ASIMETRÍA


El objetivo de estas medidas es determinar, sin necesidad de dibujar la distribución de frecuencias, la
deformación horizontal de los valores de la variable analizada respecto a un valor central,
generalmente la media aritmética.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 43/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Una distribución es simétrica cuando a la izquierda y derecha de su media existe el mismo número de
valores, de manera que equidisten dos a dos de la media y tengan, además, cada uno de ellos la
misma frecuencia. Sin embargo, no siempre ocurre esto; por ello, resulta necesario el uso de medidas
que determinen la mayor o menor asimetría de los valores de la variable respecto a la media
aritmética, siendo deseable que estas medidas vengan dadas en forma de cociente y, por tanto, sean
adimensionales.

Página 53

Para ver el grado y la dirección de la asimetría de una distribución se podrían promediar las
desviaciones de los valores de la variable respecto a la media aritmética, ya que podría pensarse que
un promedio negativo implicaría asimetría a la izquierda, un promedio positivo asimetría a la derecha,
un promedio grande mucha asimetría y un promedio pequeño poca asimetría. Pero, como ya se ha
visto, dicho promedio es cero. Como interesa mantener los signos de estas desviaciones, no pueden
elevarse a un número par pues se perderían; por tanto, habrá que elevarlas al número impar más
pequeño: 3. Por último, se dividen por la desviación típica al cubo con el fin de que la medida
resultante sea adimensional, es decir,

La expresión resultante, la más habitual por otra parte, es conocida como el coeficiente de asimetría
de Fisher.

Para calcular m3 se utiliza la expresión del Apéndice del final de este capítulo:

El Gráfico 2.3 recoge los tres casos posibles que pueden darse:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 44/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Gráfico 2.3

Página 54

Si la distribución es simétrica: g1 = 0.
Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.

También se puede señalar que:

Si la distribución es simétrica:

.
Si la distribución es asimétrica positiva o a la derecha:

.
Si la distribución es asimétrica negativa o a la izquierda:

2.4.2. MEDIDAS DE APUNTAMIENTO O CURTOSIS

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 45/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

El coefíciente de curtosis de una distribución determina el grado de apuntamiento que ésta tiene
respecto a otra distribución denominada distribución normal1 , que, por otra parte, es la que sigue una
gran mayoría de distribuciones económicas.

Este coefíciente se utiliza cuando las distribuciones son simétricas o ligeramente asimétricas, ya que
en este tipo de distribuciones frecuentemente se da el caso de que las más altas que la normal en las
colas también lo son en el centro.

Igual que ocurre con el coeficiente de asimetría, el de curtosis también es adimensional y su


expresión es la siguiente:

Para calcular m4 se utiliza la expresión del Apéndice del final de este capítulo:

El coeficiente de curtosis de la distribución normal es nulo, de tal forma que:

Si la distribución es mesocúrtica o igual de apuntada que la normal: g2 = 0.


Si la distribución es platicúrtica o menos apuntada que la normal2 : g2 < 0.
Si la distribución es leptocúrtica o más apuntada que la normal: g2 > 0.

Página 55

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 46/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Gráfico 2.4.

Las denominaciones de mesocúrtica, platicúrtica y leptocúrtica fueron dadas originariamente porque


entre ciertas distribuciones simétricas regulares se podía percibir que las que tenían frecuencias
relativas más elevadas en las colas eran también las que tenían mayores frecuencias relativas en la
parte central. Evidentemente, esto no tiene por qué ocurrir para otro tipo de distribuciones simétricas
o para las asimétricas y, aunque la nomenclatura anterior es útil, debe ser entendida como que
describe el signo del coeficiente de apuntamiento más que la forma de la distribución.

Algunas particularidades importantes relativas al coeficiente de apuntamiento son las siguientes:

1. El coeficiente de apuntamiento es siempre mayor que – 2.

Considérese la desigualdad de Cauchy

salvo que ai y bi sean proporcionales, en cuyo caso la relación es de igualdad.

Hágase

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 47/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Entonces, se tiene que

Página 56

siendo sólo la relación de igualdad cuando la distribución de frecuencias se encuentra concentrada


en dos valores.

Es decir,

y, por consiguiente,

2. En distribuciones regulares, simétricas y unimodales el coeficiente de apuntamiento es siempre


menor que 1,2.

3. Existe una relación entre los coeficientes de asimetría y apuntamiento, que viene dada por

EJEMPLO 2.15

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 48/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

En una empresa con 150 empleados, el número de horas extraordinarias/año de los mismos sigue la
distribución expuesta en las dos primeras columnas de la tabla:

Determínense los coeficientes de asimetría y curtosis.

Los momentos m3 y m4 se calculan en función de los momentos respecto al origen, utilizando las
expresiones del Apéndice de este capítulo.

Página 57

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 49/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

El coeficiente de asimetría de Fisher es:

y la distribución es asimétrica positiva o a la derecha.

Por otra parte, el coeficiente de curtosis resulta:

y la distribución es leptocúrtica (más apuntada que la normal).

2.5. Box and whisker plots (Gráficos de caja y bigotes)


Un box and whisker plot permite determinar fácilmente de forma visual la tendencia central, la
variabilidad, la asimetría y la existencia de valores anómalos en una distribución de frecuencias.

Página 58

Un box and whisker plot incluye las siguientes características de la distribución (véase Ejemplo 2.16):

1. Box (caja): la línea interior de la caja representa la mediana, la de la izquierda el primer cuartil y
la de la derecha el tercer cuartil. La caja, que recoge el 50% de las observaciones centrales de
la distribución, se determina uniendo los extremos de estas tres líneas por dos segmentos
paralelos.
2. Whiskers (bigotes): la observación más grande (pequeña) que no se aleja más de 1,5 veces el
recorrido intercuartílico (C3 – C1) desde el tercer (primer) cuartil se encuentra unida a la caja por
el denominado whisker derecho (izquierdo).
3. Valores sospechosos de ser anómalos (o): los puntos que sobrepasan los extremos de los
whiskers pero no están a más de 3 veces el recorrido intercuartílico desde el lado derecho
(izquierdo) de la caja.
4. Valores anómalos (*): puntos que se alejan del lado derecho (izquierdo) de la caja 3 o más
veces el recorrido intercuartílico.

Como ya se ha visto, la mediana proporciona una idea de la tendencia central de la distribución y el


recorrido intercuartílico indica la variabilidad de la misma (a mayor/menor recorrido intercuartílico
mayor/menor variabilidad).

La proximidad de la mediana a los extremos de la caja y la longitud de los whiskers indicarán la


asimetría de la distribución: si la asimetría es a derechas la mediana estará próxima al extremo de la
derecha de la caja y/o la longitud del whisker derecho será mayor que la del izquierdo. Si la asimetría
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 50/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

es a izquierdas, la mediana estará próxima al extremo izquierdo de la caja y/o la longitud del whisker
izquierdo será mayor que la del derecho. Si la distribución es simétrica, la mediana se ubicará en el
centro de la caja y los whiskers serán simétricos respecto de la mediana.

Los extremos de los whiskers representan los valores más grandes y más pequeños de la distribución
que no son considerados anómalos. Los valores sospechosos de ser anómalos deberán ser
considerados con prudencia y los anómalos pueden no considerarse como pertenecientes a la
distribución en cuestión.

EJEMPLO 2.16

Se dispone de la distribución sobre las bajas laborales (en días) de los trabajadores de una empresa
(véase la tabla de la página siguiente).

Si se observa el Gráfico 2.5, la mediana es de 2 días de baja laboral, no pudiéndose considerar


excesiva la dispersión de la distribución ya que el recorrido intercuartílico es también 2. La asimetría
de la distribución es hacia la derecha ya que la longitud del whisker derecho es mayor que la del
izquierdo (g1 = 1,506).

La longitud de los whiskers es, como máximo, de 1,5 veces el recorrido intercuartílico (1,5 x 2 = 3)
desde ambos extremos de la caja, es decir, los valores que no son considerados

Página 59

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 51/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Gráfico 2.5. Box and whisker plot.

anómalos son los comprendidos entre – 2 y 6. En este caso, como la variable no toma valores
negativos ni tampoco el valor 6, se consideran como mínimo y máximo valor no anómalos de la
distribución el 0 y el 5, respectivamente.

Por otra parte, existe un valor sospechoso de ser anómalo, el correspondiente a la observación 30 (x
= 7), pues sobrepasa al whisker derecho y está entre 1,5 y 3 veces el recorrido intercuartílico desde
el extremo derecho de la caja.

Finalmente, existen dos valores anómalos, que son los correspondientes a las observaciones 31 y
32 (x = 9 y x = 10), ya que se alejan más de 3 veces el recorrido intercuartílico desde el extremo
derecho de la caja.

Como ya se había avanzado, el valor sospechoso de ser anómalo deberá ser considerado con
prudencia, mientras que los dos anómalos pueden ser considerados no representativos de la
distribución.

Página 60

APÉNDICE. Momentos potenciales


Los momentos de una distribución son valores característicos de la misma deducidos a partir de
todos los valores de la distribución, de modo que si dos distribuciones son iguales, todos sus
momentos son también iguales.

Los momentos potenciales se definen como:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 52/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

donde c es un número real cualquiera y r el orden del momento.

En función de los valores que tome c, se pueden considerar dos tipos de momentos: momentos
respecto al origen y momentos respecto a la media aritmética o momentos centrales.

A) MOMENTOS RESPECTO AL ORIGEN


Generalmente se representan por ar y se obtienen cuando c = 0, es decir,

Los primeros momentos respecto al origen son:

B) MOMENTOS RESPECTO A LA MEDIA ARITMÉTICA O MOMENTOS


CENTRALES

Se representan por mr y se obtienen cuando

, por lo que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 53/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Página 61

Los primeros momentos centrales son

A efectos prácticos, una cuestión relevante de los momentos centrales es que se pueden expresar,
utilizando el binomio de Newton3 , en función de los momentos respecto al origen:

Casos particulares

1 La representación gráfica de la distribución normal es una campana (campana de Gauss) que se


caracteriza por ser simétrica respecto al eje de abscisas. El coeficiente de apuntamiento de este tipo
de distribuciones, tal y como se ha definido, es nulo.

2 No obstante, como se verá posteriormente, este coeficiente no puede tomar valores inferiores a – 2.

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 54/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias

Texto completo: COPYRIGHT 2007 Cengage Learning Paraninfo, S.A.


Cita de fuente (MLA 8.a edición)
Montero Lorenzo, Jóse Maria. "Características de Una Distribución de Frecuencias." Estadística
descriptiva, Paraninfo, 2007, pp. 17-61. Gale Ebooks,
https://link.gale.com/apps/doc/CX4052100008/GVRL?u=unad&sid=GVRL&xid=d49ed557.
Accessed 28 Sept. 2019.

Número de documento de Gale: GALE|CX4052100008

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 55/55

Das könnte Ihnen auch gefallen