Beruflich Dokumente
Kultur Dokumente
Texto completo:
Página 18
2.1. Introducción
Como ya se comentó en el Capítulo 1, la información que suministra una tabla de frecuencias acerca
de un carácter estadístico puede ser representada en un gráfico, o sintetizada en unas medidas
numéricas que describan de manera más precisa el comportamiento del carácter analizado. En este
capítulo se van a estudiar las denominadas medidas de posición, medidas de dispersión y medidas
de forma. Para ello, se hará referencia a los caracteres cuantitativos, es decir, se utilizarán los
términos variable y valor, aunque algunas de estas medidas (posición) también son de aplicación
para el caso de los caracteres cualitativos o atributos.
Las medidas de posición permiten situar la distribución, es decir, fijan el comportamiento global de
una variable a partir de los valores individuales recogidos en la tabla. Las primeras medidas de
interés son las medidas de posición o tendencia central de la distribución que, en cierta manera,
reflejan el centro o punto sobre el que gravita el conjunto de valores de la distribución. Otras medidas
de posición más generales son las no centrales. Las medidas de dispersión determinan la variabilidad
existente en los valores de la variable. Las medidas de forma informan, sin necesidad de representar
gráficamente la distribución, sobre la deformación horizontal (medidas de asimetría) y vertical
(medidas de curtosis o apuntamiento) de la misma.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 1/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Las medidas de posición central más importantes son las medias (aritmética, geométrica y armónica),
la mediana y la moda.
Dada una distribución de frecuencias (xi; ni), la media aritmética, o simplemente media, que se
denota por x¯, viene definida por la expresión
Como
Página 19
Como puede apreciarse, en la media aritmética cada valor de la variable va ponderado por su
importancia relativa en la distribución. No obstante, no tiene por qué coincidir con ningún valor de la
distribución, siendo su centro de gravedad.
Si los datos estuvieran agrupados en intervalos, la expresión de la media aritmética sería la misma,
pero utilizando, esta vez, la marca de clase (x'i).
EJEMPLO 2.1
Las pensiones mensuales de jubilación de 50 personas, trabajadores autónomos, son las siguientes:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 2/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
EJEMPLO 2.2
Agrupando la distribución del ejemplo anterior en cinco intervalos de igual amplitud, se tiene:
Página 20
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 3/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
En el primer intervalo, se observa que hay 15 personas que perciben una pensión comprendida
entre 450 y 500 euros; sin embargo, al utilizar la marca de clase lo que se hace es suponer que la
pensión de todas esas personas es de 475 euros; lo mismo ocurre en los demás intervalos. Como
puede observarse, la pensión media de esta distribución no coincide con la del Ejemplo 2.1, es decir,
se ha cometido un error, denominado error de agrupamiento. Con las distribuciones agrupadas se
simplifican mucho los cálculos pero también se pierde información, o, dicho de otra manera, la
información es menos exacta (lo que lleva en nuestro ejemplo a una pensión media ligeramente
inferior a la real), por lo que habrá que ver hasta qué punto compensa el agrupar o no los valores de
la distribución en intervalos.
1. La suma de las desviaciones de los valores de la variable respecto a su media aritmética es cero:
2. La media aritmética del cuadrado de las desviaciones de los valores de la variable respecto a una
constante k cualquiera se hace mínima cuando dicha constante es igual a la media aritmética
(Teorema de König). En efecto,
por lo que
se anula.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 4/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 21
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 5/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Esta propiedad es muy útil cuando se incorpora algún valor a la distribución, porque no hace falta
calcular nuevamente la media de todos los valores. Si a la distribución del Ejemplo 2.1 se le añaden
las pensiones de 5 trabajadores más, cada una de 600 euros, la pensión media de los 55
trabajadores es
Página 22
4. Si a todos los valores xi de una distribución (xi; ni) se les suma (resta) una constante b, la media
aritmética de la nueva distribución (yi; ni) queda aumentada (disminuida) en esa constante. En otros
términos, a la media aritmética le afectan los cambios de origen.
5. Si a todos los valores xi, de una distribución (xi; ni) se les multiplica (divide) por una constante a,
distinta de cero, la media aritmética de la nueva distribución (yi; ni) queda multiplicada (dividida) por
esa constante. Es decir, a la media aritmética le afectan los cambios de escala.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 6/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
6. Como consecuencia de las dos propiedades anteriores, si a una variable se le aplica un cambio de
origen b y un cambio de escala a, la media de la nueva variable y = ax ± b será
Página 23
EJEMPLO 2.3
Estas distribuciones tienen idéntica media aritmética: 70 (en otros términos, idéntico centro de
gravedad, representado por ▴). Sin embargo, en las dos primeras este valor es el resultado de
promediar valores muy parecidos entre sí, y en la tercera valores muy grandes con valores muy
pequeños.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 7/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
La media geométrica de una distribución de frecuencias (xi; ni), que se representa por G, se define
como la raíz N-ésima del producto de los valores de la variable elevados a sus correspondientes
frecuencias absolutas.
Página 24
Nótese que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 8/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Por tanto:
es decir, el logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los
valores de la variable.
Como puede observarse, en el cálculo de la media geométrica también intervienen todos los valores
de la distribución. Sin embargo, uno de los grandes inconvenientes de esta medida central es su no
representatividad cuando uno (o varios) de los valores sea cero, ya que G se anula. Por otra parte,
cuando algunos de los valores de la variable son negativos, existen determinados casos en los cuales
no se puede calcular la media geométrica; esto no significa que no exista sino que no se puede
determinar.
La media geométrica se suele utilizar para promediar, por ejemplo, tipos de interés, tasas de
variación, porcentajes y números índice, es decir, cuando los valores de la variable presentan
variaciones acumulativas.
EJEMPLO 2.4
Un individuo invirtió 12.000 euros en un plan de pensiones. Durante los cinco años siguientes las
tasas de revalorización fueron del 5,6%, 2,25%, 4,15%, 8% y 9%, respectivamente. Calcúlese la tasa
de revalorización media anual de esos cinco años.
Si a la cantidad inicial invertida, S0, se le aplican sucesivamente las tasas de revalorización anuales,
r1, r2, r3, r4, r5, se obtienen las cantidades resultantes para los cinco años:
Página 25
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 9/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
La tasa media anual que ha de calcularse (r), que debido a su naturaleza se conoce como tasa
media anual acumulativa, debe ser tal que, aplicada sucesivamente durante cinco años a la cantidad
inicial, proporcione el montante del último año considerado. Es decir, se debe verificar
o bien
Por tanto,
Por tanto, al individuo le es indiferente que su dinero se incremente un porcentaje distinto cada año o
que aumente todos los años un 5,77%, ya que al final del quinto año la cuantía de su plan de
pensiones va a ser la misma:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 10/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
resultado no realista, pues 12.000(1 + 0,058)5 = 15.907,78 euros, cifra que no coincide con la
cantidad total que el individuo en cuestión tiene al final del quinto año: 15.886,13 euros.
La media armónica H de una distribución de frecuencias (xi; ni) se define como la inversa de la media
aritmética de los inversos de los valores de la variable; esto es,
Página 26
Igual que las dos medias anteriores, la media armónica tiene la ventaja de que en su cálculo
intervienen todos los valores de la variable; sin embargo, no tiene sentido su utilización cuando algún
valor de la distribución sea nulo.
La media armónica se suele utilizar para promediar rendimientos, productividades, etc., es decir,
cuando las unidades de medida de la variable analizada vienen dadas en forma de cociente.
EJEMPLO 2.5
Una empresa de equipos electrónicos tiene tres talleres de montaje con las siguientes cifras
mensuales:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 11/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
La productividad media del trabajo (número de equipos por empleado) se calcula de la siguiente
forma:
Análogamente, 2.400/15 y 3.000/25 son los empleados de los talleres B y C, respectivamente, esto
es, 160 y 120.
resultado erróneo, pues, si se toma como productividad media 23,33 equipos por empleado, el
número total de equipos producidos sería 430 x 23,33 = 10.032, cuando la cifra real es de 9.900.
Página 27
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 12/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
2.2.1.5. Mediana
Suponiendo que los valores de la variable están ordenados de menor a mayor, la mediana se define
como aquel valor que divide la distribución de frecuencias de forma que el número de frecuencias que
quedan a su izquierda es igual al número de las que quedan a su derecha.
Si el número total de datos es impar, la definición proporciona siempre un único valor, ya que
denominando k al número de observaciones inferiores y superiores a la mediana resulta que
Sin embargo, si el número de datos es par, habrá dos valores medianos: el que ocupa el lugar
puesto que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 13/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 28
En este caso, se conviene en tomar como valor mediano la media aritmética de ambos. No obstante,
esto no es sino un convenio. Perfectamente podría tomarse como mediana uno u otro.
a) Si se asigna ni a un punto, se puede considerar que la mediana es cualquier valor del intervalo,
exceptuando Li-1, puesto que los intervalos se consideran abiertos por la izquierda y cerrados por la
derecha.
b) Si no se asigna ni a un punto sino que se considera que todos los valores del intervalo están
distribuidos de manera uniforme dentro de él, se puede aproximar la mediana de la forma siguiente:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 14/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 29
Siguiendo este mismo criterio, el intervalo mediano será aquel que contenga la frecuencia
Gráfico 2.1
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 15/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
con lo que
Página 30
En este caso se dispone de dos valores medianos, que son los que ocupan las posiciones
Si ambos valores están en el mismo intervalo Li-1 – Li (intervalo mediano) se tiene que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 16/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
es decir, la misma expresión que la obtenida para el caso de que la frecuencia total sea impar.
Si los dos valores medianos se encuentran en distintos intervalos, se procedería de forma análoga.
La mediana, como medida de posición central, resulta de gran utilidad en los casos siguientes:
Cuando existan valores anormalmente bajos o elevados. La mediana es menos sensible que la
media aritmética a estos valores extremos porque en su determinación no intervienen todos los
valores de la variable sino los que ocupan las posiciones centrales.
Cuando en las distribuciones agrupadas en intervalos el primero sea del tipo menor que o el
último del tipo mayor que, siempre y cuando ninguno de estos intervalos sea el intervalo
mediano.
Cuando se analizan variables cualitativas que vienen dadas en escala ordinal. En este caso, no
se puede determinar la media aritmética, siendo la mediana la medida de tendencia central más
representativa.
Página 31
EJEMPLO 2.6
Se dispone de la siguiente información acerca de las prestaciones mensuales por desempleo (euros)
percibidas por 15 personas:
Como el número de datos es impar, la prestación mensual mediana es el valor que ocupa el lugar
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 17/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
donde
el primer valor mediano sería 631 y el segundo 644, siendo la media aritmética de ambos 637,5.
Página 32
EJEMPLO 2.7
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 18/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Como se dispone de un número par de datos, los dos valores medianos ocupan, respectivamente,
las posiciones:
EJEMPLO 2.8
Según la «Estadística de Accidentes de Trabajo» del Ministerio de Trabajo y Asuntos Sociales, entre
enero y septiembre de 2005 los accidentes laborales con baja registrados en España durante la
jornada de trabajo fueron, según su gravedad: leves: 675.190; graves: 7.508; mortales: 770.
Página 33
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 19/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Igual que ocurre en el caso de las variables, al ser el número de observaciones par, los dos valores
medianos corresponderán a aquellas dos modalidades que ocupen los lugares:
es decir, en cualquier caso, a los accidentes leves. En caso de dos modalidades medianas distintas,
es obvio que no se puede calcular la media aritmética de ambas, debiéndose proceder con un juicio
razonable. Si el número de observaciones es impar, existiría con una única modalidad central.
2.2.1.6. Moda
La moda es aquel valor de la variable que presenta mayor frecuencia absoluta, es decir, aquel que
más veces se repite. Puede darse el caso de que existan varios valores que presenten la máxima
frecuencia absoluta, teniéndose entonces una distribución bimodal, trimodal, etc.
Si la distribución está agrupada en intervalos, en primer lugar habrá que determinar el intervalo modal
y, posteriormente, elegir como moda un valor de dicho intervalo. Se distinguen dos casos:
En este caso, el intervalo modal es aquel que presenta mayor frecuencia absoluta y, como se
desconocen los valores incluidos en dicho intervalo, se puede aproximar la moda siguiendo varios
criterios:
A.1. Si se asigna ni a un punto, se puede elegir cualquier valor del intervalo como moda (descartando
el extremo inferior por considerar el intervalo abierto por la izquierda).
A.2. Si se considera que todos los valores del intervalo están distribuidos de manera uniforme dentro
de él y el intervalo modal es Li–1 – Li, la moda estará más cerca (lejos) del intervalo de la derecha
cuanto mayor (menor) frecuencia tenga este intervalo y menor (mayor) tenga el izquierdo (Grífico
2.2).
Página 34
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 20/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Gráfico 2.2.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 21/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
siendo
Por tanto,
En este caso, el intervalo modal no es el que tiene mayor frecuencia absoluta sino el que tiene mayor
frecuencia por unidad de intervalo, es decir, mayor densidad de frecuencia
. Una vez determinado el intervalo modal se puede aproximar la moda siguiendo los criterios vistos en
el caso anterior, siendo el más razonable el último
Página 35
con
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 22/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Por último, la moda es la mejor medida de tendencia central en el análisis de los atributos dados en
escala nominal, ya que sus modalidades no son susceptibles de ser ordenadas y tampoco admiten
ningún tipo de operación algebraica.
EJEMPLO 2.9
Los contratos registrados en España durante los ejercicios 2004 y 2005, según modalidad de
contratación y duración del contrato, fueron
El tipo de contrato más frecuente en nuestro país, tanto en el ejercicio 2004 como en 2005, fue el
eventual por circunstancias de la producción, puesto que es el que presenta en ambos años la
mayor frecuencia absoluta.
Página 36
EJEMPLO 2.10
Las prestaciones mensuales por desempleo (euros) de un determinado número de individuos son las
que se recogen en la siguiente tabla:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 23/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 37
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 24/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 25/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 38
El primer y segundo valor del segundo cuartil o mediana ocupan los lugares
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 26/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 39
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 27/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Como en el caso anterior, se hará referencia a los cuartiles, si bien se puede proceder de forma
similar para la determinación de deciles y percentiles.
En primer lugar, hay que establecer el intervalo que contiene a cada uno de ellos y, posteriormente,
asignar un valor de dicho intervalo al cuartil correspondiente. De manera análoga a como se procedía
en la determinación de la mediana, se puede tomar como cuartil cualquier valor del intervalo excepto
el correspondiente al extremo inferior, por considerarse los intervalos abiertos por la izquierda, o bien
aplicar la siguiente expresión:
EJEMPLO 2.11
Como N es inferior en dos unidades a un múltiplo de cuatro, hay dos primeros cuartiles. Para el
primero:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 28/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 40
y, para el segundo:
es decir, 12 y 13, respectivamente. Por tanto, el primer y segundo valor del primer cuartil son
por lo que, promediando ambos, se considera como primer cuartil 1.550 euros.
pudiéndose apreciar que en la empresa B los valores de la variable varían poco y en la A mucho. Si
se calcula el coste extra salarial medio de ambas distribuciones, el resultado obtenido es 235 euros.
Sin embargo, estas dos distribuciones son bien distintas, ya que a la empresa A ningún trabajador le
supone un coste extra salarial próximo a 235 euros y a la B sí. Es decir, se puede considerar que el
coste extra salarial medio de los cuatro trabajadores de la empresa B es más representativo que el de
los cuatro de la empresa A.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 29/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Esto indica que, para caracterizar una distribución, además de calcular las medidas de posición,
también resulta necesario analizar su variabilidad. Dicha variabilidad, habitualmente, se mide
respecto a una medida de posición central, pretendiendo, de esta manera, conocer la
representatividad de los valores centrales de la distribución, es decir, si estos valores sintetizan de
forma satisfactoria o no toda la información de la distribución.
Página 41
Existen dos tipos de medidas de dispersión: las absolutas y las relativas. Las primeras se utilizan
cuando se trata de analizar la variabilidad de, únicamente, una distribución de frecuencias y, las
segundas, cuando se pretende comparar la variabilidad de dos o más.
Recorrido o rango
Esta medida tiene la ventaja de ser muy sencilla de calcular. Sin embargo, el inconveniente que
presenta es que sólo depende de los valores extremos, por lo que si éstos se encuentran alejados del
resto de los valores de la distribución (es decir, son valores anómalos) puede dar lugar a
conclusiones erróneas.
Para evitar el problema de los valores anómalos, se suele emplear el denominado recorrido o rango
intercuartílico, que se define como la diferencia entre el tercer y primer cuartil
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 30/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Se define como
Página 42
esto es, el promedio de las diferencias (en valor absoluto) entre cada par de valores de la
distribución. Su principal incoveniente radica en la tediosidad de su cálculo.
B Medidas de dispersión obtenidas por comparación entre los valores de la variable y una medida de
posición central
Varianza
Para determinar la mayor o menor separación entre los valores de la variable y la media aritmética,
se podrían promediar las desviaciones de cada valor respecto a la media aritmética
sin embargo, por la primera propiedad de la media aritmética, esta expresión es nula ya que las
desviaciones positivas se compensan con las negativas. Una forma de evitar esta circunstancia es
considerar las desviaciones elevadas al cuadrado, con lo cual tiene que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 31/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Esta expresión se denomina varianza y se define como la media aritmética de los cuadrados de las
desviaciones entre los valores de la variable y la media aritmética, siendo, por la segunda propiedad
de la media aritmética, una medida de dispersión óptima.
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media
aritmética. Cuanto mayor sea la varianza mayor dispersión existirá y, por tanto, menor
representatividad tendrá la media aritmética.
Página 43
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 32/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 44
Ya se vio que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 33/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Por tanto,
Pero los dos últimos términos de la expresión anterior no son sino la varianza de una distribución
cuyos valores son las medias de los grupos y sus frecuencias absolutas los tamaños de los mismos.
En consecuencia, la varianza global de la distribución se puede expresar como la media ponderada
de la varianza de los grupos más la varianza de la distribución de medias anteriormente citada.
Página 45
Por consiguiente, la varianza global se puede obtener como una suma ponderada de las varianzas de
cada grupo (primer sumando) más una suma ponderada de las diferencias cuadráticas de las medias
de cada grupo con respecto a la media global. En definitiva, la varianza global se puede
descomponer en dos sumandos: el primero hace referencia a la variabilidad intrínseca de cada grupo
(variabilidad intragrupos) y el segundo a la variabilidad de las medias de cada grupo (variabilidad
intergrupos).
4. Si a todos los valores (xi) de una distribución (xi; ni) se les suma (resta) una constante b, la
varianza de la nueva distribución (yi; ni) no varía, es decir, a la varianza no le afectan los cambios de
origen (si por ejemplo a todos los trabajadores de una empresa les suben el sueldo mensual 100
euros, la variabilidad de los salarios sigue siendo la misma).
5. Si a todos los valores xi de una distribución (xi; ni) se les multiplica (divide) por una constante a,
distinta de cero, la varianza de la nueva distribución (yi; ni) queda multiplicada (dividida) por esa
constante al cuadrado; es decir, a la varianza le afectan los cambios de escala.
6. Teniendo en cuenta las dos propiedades anteriores, si a una variable se le aplica un cambio de
origen b y un cambio de escala a, la varianza de la nueva variable yi = axi + b es
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 35/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
La varianza viene expresada en las mismas unidades de medida que la variable analizada pero
elevadas al cuadrado, lo que dificulta su interpretación (piénsese que en una distribución de salarios
la varianza vendrá dada en euros2). Ante esta situación, es necesario definir otra medida que venga
expresada en las mismas unidades de medida que la variable. Esta medida es la desviación típica o
estándar.
Página 46
Se define la desviación típica como la raíz cuadrada con signo positivo de la varianza, esto es,
Cuanto mayor sea la desviación típica, mayor dispersión existirá entre los valores de la distribución y
la media aritmética y, por tanto, la media aritmética será menos representativa.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 36/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
EJEMPLO 2.12
Página 47
Página 48
el caso de que las unidades de medida fuesen diferentes (por ejemplo, si se tiene una distribución de
salarios y otra de edades).
Para evitar estos inconvenientes, hay que poner en relación la medida de dispersión con la de
tendencia central, y ello en forma de cociente para que la medida resultante sea adimensional. Este
tipo de cocientes son las denominadas medidas de dispersión relativas, de las que existen varias en
la literatura estadística, siendo la más utilizada el coeficiente de variación de Pearson.
Este coeficiente se define como el cociente entre la desviación típica y el valor absoluto de la media
aritmética
Como las unidades de medida de la desviación típica y de la media aritmética son las mismas,
este cociente es adimensional; por tanto, es útil para comparar varias distribuciones.
Como el coeficiente de variación representa el número de veces que la desviación típica
contiene a la media, cuanto mayor sea este coeficiente, mayor dispersión existirá (más veces
contendrá la desviación típica a la media aritmética), por lo que menor será la representatividad
de la media aritmética y menor será la homogeneidad de los valores de la distribución.
El coeficiente de variación utiliza toda la información de la distribución.
El coeficiente de variación se anula cuando la desviación típica es cero. En este caso no
existiría dispersión y todos los valores de la distribución son iguales.
Cuando la media aritmética es cero, no tiene sentido su cálculo.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 38/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
EJEMPLO 2.13
En el Ejemplo 2.12 se ha procedido al cálculo de la media y la desviación típica de las altas diarias
de afiliados a la Seguridad Social en España durante el mes de enero de 2006. Ahora, en la tabla
adjunta, se presenta la información relativa a las bajas diarias de afiliados en España durante dicho
mes (también en miles). ¿Cuál de las dos medias diarias, la de altas o la de bajas, es más
representativa?
Página 49
Procediendo de la misma manera que en el ejemplo anterior, el número medio de bajas, en miles,
seraá
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 39/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Para determinar cuál de las dos medias es más representativa, se procede al cálculo de los
coeficientes de variación de ambas distribuciones de frecuencias,
llegándose a la conclusión de que, si bien ambos son muy similares, la media de las bajas diarias en
los registros de afiliación a la Seguridad Social es ligeramente más representativa.
Página 50
y se caracteriza porque su media es cero y su varianza uno, como puede comprobarse fácilmente
aplicando las propiedades de la media y varianza.
EJEMPLO 2.14
Un individuo tiene que elegir entre dos ofertas de trabajo: una propuesta por una empresa española
y la otra por una americana. La empresa española le ofrece un sueldo anual bruto de 53.000 euros,
mientras que la oferta de la americana es de 50.000 $. Por otro lado, esta persona tiene información
sobre el sueldo medio y la desviación típica salarial de las distribuciones de ambas empresas:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 40/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
¿En cuál de las dos empresas la posición relativa de este individuo es mejor respecto a los demás
trabajadores?
Como las unidades de medida de ambas distribuciones no son iguales, no se pueden comparar las
remuneraciones de las dos empresas, por lo que habrá que transformar estos valores de manera
que las distribuciones tengan la misma media y la misma desviación típica, es decir, habrá que
tipificar los salarios.
Como las distribuciones de los salarios tipificados tienen media igual a cero y desviación típica igual
a 1, se observa que en ambas empresas la remuneración de ese individuo está por encima de la
media. Sin embargo, en la empresa española estaría 3,71 desviaciones típicas por encima de la
media, mientras que en la americana su salario sería 7,82 desviaciones típicas superior al salario
medio, lo que refleja que su posición relativa frente a los demás trabajadores es mejor en la empresa
americana.
Página 51
Sea una distribución de frecuencias (xi; ni). Se divide en dos clases: la primera, C1, contiene los
valores de la variable que distan de la media de la distribución (en valor absoluto) más que una
distancia k positiva. La segunda, C2, contiene el resto de valores.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 41/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
En consecuencia:
, se tiene que
o bien,
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 42/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 52
En el caso particular en que k = k*Sx, siendo k* una constante mayor que cero, se tiene que
La interpretación de este resultado es como sigue: el porcentaje del total de valores de la distribución
que se encuentran comprendidos entre la media aritmética ± k* veces la desviación típica de la
distribución es, como mínimo, 1 – 1/k*2. De este resultado se desprende que, para cualquier
distribución de frecuencias:
— Entre
— Entre
— Entre
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 43/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Una distribución es simétrica cuando a la izquierda y derecha de su media existe el mismo número de
valores, de manera que equidisten dos a dos de la media y tengan, además, cada uno de ellos la
misma frecuencia. Sin embargo, no siempre ocurre esto; por ello, resulta necesario el uso de medidas
que determinen la mayor o menor asimetría de los valores de la variable respecto a la media
aritmética, siendo deseable que estas medidas vengan dadas en forma de cociente y, por tanto, sean
adimensionales.
Página 53
Para ver el grado y la dirección de la asimetría de una distribución se podrían promediar las
desviaciones de los valores de la variable respecto a la media aritmética, ya que podría pensarse que
un promedio negativo implicaría asimetría a la izquierda, un promedio positivo asimetría a la derecha,
un promedio grande mucha asimetría y un promedio pequeño poca asimetría. Pero, como ya se ha
visto, dicho promedio es cero. Como interesa mantener los signos de estas desviaciones, no pueden
elevarse a un número par pues se perderían; por tanto, habrá que elevarlas al número impar más
pequeño: 3. Por último, se dividen por la desviación típica al cubo con el fin de que la medida
resultante sea adimensional, es decir,
La expresión resultante, la más habitual por otra parte, es conocida como el coeficiente de asimetría
de Fisher.
Para calcular m3 se utiliza la expresión del Apéndice del final de este capítulo:
El Gráfico 2.3 recoge los tres casos posibles que pueden darse:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 44/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Gráfico 2.3
Página 54
Si la distribución es simétrica: g1 = 0.
Si la distribución es asimétrica positiva o a la derecha: g1 > 0.
Si la distribución es asimétrica negativa o a la izquierda: g1 < 0.
Si la distribución es simétrica:
.
Si la distribución es asimétrica positiva o a la derecha:
.
Si la distribución es asimétrica negativa o a la izquierda:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 45/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
El coefíciente de curtosis de una distribución determina el grado de apuntamiento que ésta tiene
respecto a otra distribución denominada distribución normal1 , que, por otra parte, es la que sigue una
gran mayoría de distribuciones económicas.
Este coefíciente se utiliza cuando las distribuciones son simétricas o ligeramente asimétricas, ya que
en este tipo de distribuciones frecuentemente se da el caso de que las más altas que la normal en las
colas también lo son en el centro.
Para calcular m4 se utiliza la expresión del Apéndice del final de este capítulo:
Página 55
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 46/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Gráfico 2.4.
Hágase
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 47/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 56
Es decir,
y, por consiguiente,
3. Existe una relación entre los coeficientes de asimetría y apuntamiento, que viene dada por
EJEMPLO 2.15
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 48/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
En una empresa con 150 empleados, el número de horas extraordinarias/año de los mismos sigue la
distribución expuesta en las dos primeras columnas de la tabla:
Los momentos m3 y m4 se calculan en función de los momentos respecto al origen, utilizando las
expresiones del Apéndice de este capítulo.
Página 57
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 49/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 58
Un box and whisker plot incluye las siguientes características de la distribución (véase Ejemplo 2.16):
1. Box (caja): la línea interior de la caja representa la mediana, la de la izquierda el primer cuartil y
la de la derecha el tercer cuartil. La caja, que recoge el 50% de las observaciones centrales de
la distribución, se determina uniendo los extremos de estas tres líneas por dos segmentos
paralelos.
2. Whiskers (bigotes): la observación más grande (pequeña) que no se aleja más de 1,5 veces el
recorrido intercuartílico (C3 – C1) desde el tercer (primer) cuartil se encuentra unida a la caja por
el denominado whisker derecho (izquierdo).
3. Valores sospechosos de ser anómalos (o): los puntos que sobrepasan los extremos de los
whiskers pero no están a más de 3 veces el recorrido intercuartílico desde el lado derecho
(izquierdo) de la caja.
4. Valores anómalos (*): puntos que se alejan del lado derecho (izquierdo) de la caja 3 o más
veces el recorrido intercuartílico.
es a izquierdas, la mediana estará próxima al extremo izquierdo de la caja y/o la longitud del whisker
izquierdo será mayor que la del derecho. Si la distribución es simétrica, la mediana se ubicará en el
centro de la caja y los whiskers serán simétricos respecto de la mediana.
Los extremos de los whiskers representan los valores más grandes y más pequeños de la distribución
que no son considerados anómalos. Los valores sospechosos de ser anómalos deberán ser
considerados con prudencia y los anómalos pueden no considerarse como pertenecientes a la
distribución en cuestión.
EJEMPLO 2.16
Se dispone de la distribución sobre las bajas laborales (en días) de los trabajadores de una empresa
(véase la tabla de la página siguiente).
La longitud de los whiskers es, como máximo, de 1,5 veces el recorrido intercuartílico (1,5 x 2 = 3)
desde ambos extremos de la caja, es decir, los valores que no son considerados
Página 59
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 51/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
anómalos son los comprendidos entre – 2 y 6. En este caso, como la variable no toma valores
negativos ni tampoco el valor 6, se consideran como mínimo y máximo valor no anómalos de la
distribución el 0 y el 5, respectivamente.
Por otra parte, existe un valor sospechoso de ser anómalo, el correspondiente a la observación 30 (x
= 7), pues sobrepasa al whisker derecho y está entre 1,5 y 3 veces el recorrido intercuartílico desde
el extremo derecho de la caja.
Finalmente, existen dos valores anómalos, que son los correspondientes a las observaciones 31 y
32 (x = 9 y x = 10), ya que se alejan más de 3 veces el recorrido intercuartílico desde el extremo
derecho de la caja.
Como ya se había avanzado, el valor sospechoso de ser anómalo deberá ser considerado con
prudencia, mientras que los dos anómalos pueden ser considerados no representativos de la
distribución.
Página 60
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 52/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
En función de los valores que tome c, se pueden considerar dos tipos de momentos: momentos
respecto al origen y momentos respecto a la media aritmética o momentos centrales.
, por lo que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 53/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
Página 61
A efectos prácticos, una cuestión relevante de los momentos centrales es que se pueden expresar,
utilizando el binomio de Newton3 , en función de los momentos respecto al origen:
Casos particulares
2 No obstante, como se verá posteriormente, este coeficiente no puede tomar valores inferiores a – 2.
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 54/55
28/9/2019 Gale eBooks - Documento - Características de Una Distribución de Frecuencias
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60961107ffc27a0 55/55