Beruflich Dokumente
Kultur Dokumente
1 Introduccin
Los fenmenos biolgicos no suelen ser constantes, por lo que ser necesario que junto
a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una
medida que haga referencia a la variabilidad que refleje dicha fluctuacin.
En este sentido pueden examinarse varias caractersticas, siendo las ms comunes:
La tendencia central de los datos;
La dispersin o variacin con respecto a este centro;
Los datos que ocupan ciertas posiciones.
La simetra de los datos.
La forma en la que los datos se agrupan.
A lo largo de este captulo, y siguiendo este orden, iremos estudiando los estadsticos
que nos van a orientar sobre cada uno de estos niveles de informacin: valores alrededor
de los cuales se agrupa la muestra, la mayor o menor fluctuacin alrededor de esos
valores, nos interesaremos en ciertos valores que marcan posiciones caractersticas de
una distribucin de frecuencias as como su simetra y su forma.
2.3.1 La media
La media aritmtica de una variable estadstica es la suma de todos sus posibles
valores, dividida por el total de los mismos.
2.3.2. Proposicin
La suma de las diferencias de la variable con respecto a la media es nula, es decir,
Demostracin
Basta desarrollar el sumatorio para obtener
Este resultado nos indica que el error cometido al aproximar un valor cualquiera de la
variable, por ejemplo x1, mediante el valor central , es compensado por los dems
errores:
2.3.3. Observacin
A pesar de las buenas propiedades que ofrece la media, sta posee algunos
inconvenientes:
Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que
todas las observaciones intervienen en el clculo de la media, la aparicin de una
observacin extrema, har que la media se desplace en esa direccin. En
consecuencia,
2.3.4.Medias generalizadas
En funcin del tipo de problema varias generalizaciones de la media pueden ser
consideradas. He aqu algunas de ellas aplicadas a unas observaciones x1, ..., xn:
La media geomtrica
, es la media de los logaritmos de los valores de la variable:
La media armnica
, se define como el recproco de la media aritmtica de los recprocos, es
decir,
Por tanto,
La media cuadrtica
, es la raz cuadrada de la media aritmtica de los cuadrados:
2.3.5 La mediana
Consideramos una variable discreta X cuyas observaciones en una tabla estadstica han
sido ordenadas de menor a mayor. Llamaremos mediana, Medal primer valor de la
variable que deja por debajo de s al
de las observaciones. Por tanto, si n es el
nmero de observaciones, la mediana corresponder a la observacin [n/2]+1, donde
representamos por
Observacin
Entre las propiedades de la mediana, vamos a destacar las siguientes:
2.3.5.1 Ejemplo
Sea X una variable discreta que ha presentado sobre una muestra las modalidades
2.3.6 La moda
Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias, es
decir, cualquier valor de la variable que posea una frecuencia mayor que su anterior y su
posterior.
2.3.6.1 Observacin
De la moda destacamos las siguientes propiedades:
De forma anloga se definen los deciles como los valores de la variable que dividen a
las observaciones en 10 grupos de igual tamao. Ms precisamente, definimos D1,D2, ...,
D9 como:
, pues sabemos que esa suma vale 0, ya que las desviaciones con
respecto a la media se compensan al haber trminos en esa suma que son de
signos distintos.
La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones
se miden en metros, la varianza lo hace en
). Si queremos que la medida de
dispersin sea de la misma dimensionalidad que las observaciones bastar con tomar su
raz cuadrada. Por ello se define la desviacin tpica o estandar, , como
2.6.1.1 Ejemplo
Calcular la varianza y desviacin tpica de las siguientes cantidades medidas en metros:
3,3,4,4,5
La varianza es:
2.7.4.5 Observacin
Adems de las propiedades que hemos demostrado sobre la varianza (y por tanto sobre
la desviacin tpica), ser conveniente tener siempre en mente otras que enunciamos a
continuacin:
Sin embargo esas cantidades no son totalmente independientes, pues estn ligadas por
una restriccin:
El problema no deriva slo de que una de las medidas sea de longitud y la otra sea de
masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa,
de dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el
peso en toneladas de una poblacin de 100 elefantes con el correspondiente en
miligramos de una poblacin de 50 hormigas.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por
ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los
elefantes (toneladas). Si la ingeriera gentica no nos sorprende con alguna barbaridad,
lo lgico es que la dispersin de la variable peso de las hormigas sea practicamente nula
(Aunque haya algunas que sean 1.000 veces mayores que otras!)
En los dos primeros casos mencionados anteriormente, el problema viene de la
dimensionalidad de las variables, y en el tercero de la diferencia enorme entre las
medias de ambas poblaciones. El coeficiente de variacin es lo que nos permite evitar
estos problemas, pues elimina la dimensionalidad de las variables y tiene en cuenta la
proporcin existente entre medias y desviacin tpica. Se define del siguiente modo:
Basta dar una rpida mirada a la definicin del coeficiente de variacin, para ver que las
siguientes consideraciones deben ser tenidas en cuenta:
Slo se debe calcular para variables con todos los valores positivos. Todo ndice
de variabilidad es esencialmente no negativo. Las observaciones pueden ser
positivas o nulas, pero su variabilidad debe ser siempre positiva. De ah que slo
debemos trabajar con variables positivas, para la que tenemos con seguridad que
.
2.9.2.1 Observacin
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales (figura
2.8):
Asimetra positiva:
Si las frecuencias ms altas se encuentran en el lado izquierdo de la media,
mientras que en derecho hay frecuencias ms pequeas (cola).
Asimetra negativa:
Cuando la cola est en el lado izquierdo.
2.11 Problemas
Ejercicio 2..1. En el siguiente conjunto de nmeros, se proporcionan los pesos
(redondeados a la libra ms prxima) de los bebs nacidos durante un cierto intervalo de
tiempo en un hospital:
4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8, 9, 11,
8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.
1. Construir una distribucin de frecuencias de estos pesos.
2. Encontrar las frecuencias relativas.
0,110
0,098
0,118
0,111
0,120
0,106
0,126
0,122
0,132
0,112
0,099
0,128
0,112
0,105
0,108
0,101
0,102
0,094
0,117
0,103
0,115
0,112
0,129
0,1114
0,113
0,119
0,120
0,111
0,115
0,135
0,100
0,107
0,119
0,121
0,107
0,117
0,123
0,103
0,130
0,122
0,113
0,109
0,100
0,134