Beruflich Dokumente
Kultur Dokumente
1.4.2 Mediana.
1.4.3 Moda.
1.5.1 Rango.
1.5.3 Varianza.
Por ejemplo, Mendelal estudiar la manera como diferían entre sí las plantas de
guisantes en altura, color de las semillas, color de las vainas y color de las flores,
tuvo que hacer sus conclusiones necesariamente basándose en un grupo de
plantas relativamente poco numeroso comparado con toda la población de plantas
de guisantes de un tipo particular.
Al hacer un enunciado, como por ejemplo, sobre el color de las flores, las
conclusiones de Mendel dependían de la muestra particular de plantas disponibles
para este estudio.
En la terminología estadística, el procedimiento inductivo implica el hacer
inferencias acerca de una población adecuada ó universo a la luz de lo averiguado
en un subconjunto aparte o muestra.
1) RANGO.
R = N_max - N_min
Ejemplo.
R= 15- 5
2) AMPLITUD TOTAL.
AT = (R+1)
3) LAS CLASES.
Están formadas por dos extremos. El menor se llama límite inferior el mayor se
llama límite superior. Hay distintos tipos de clases.
4) EL NUMERO DE CLASES.
Nc= 1 + 3.33log ( N )
Donde:
Vi = AT / Nc
Donde:
POLIGONO DE FRECUENCIA
OJIVAS:
MODA
La moda es el valor que aparece con mayor frecuencia en la serie de datos. Así
por ejemplo, de la serie {14, 15, 17, 17, 21, 21, 21, 33, 36, 40}, la moda es 21.
Otros inconvenientes son que puede darse el caso de que una determinada serie
no tenga moda o que tenga varias modas.
Por ejemplo:
5, 6, 10, 5, 8, 6, 7, 4 (2 modas)
MEDIANA
Por ejemplo:
Media Aritmética
La media aritmética simple está dada por la formula SX/n y que significa: la suma
de todos los valores dividida por el número de datos.
Por ejemplo:
Si los valores que toma x en una serie de datos, no todos tienen la misma
importancia, es válido asignar "pesos" o "ponderaciones" de acuerdo a la
importancia de cada dato.
En la serie del ejemplo anterior aparecen los números; pero cada uno con
diferente frecuencia. Si cada uno de estos datos se multiplica por su respectiva
frecuencia o ponderación y se suman estos productos, se obtendrá la misma suma
que si se hubieran sumado uno por uno.
10 10 4 40
13 13 3 39
14 14 1 14
15 15 1 15
Suma = 52 9 108
52/4 = 13 108/9 = 12
Media Geométrica
Como este sistema de cálculo resulta muy difícil de emplear, máxime cuando son
números grandes o largas series de datos, en la práctica se recurre a los
logaritmos.
xg = antilog (3.11)
4
xg = antilog 0.78
xg = 6
Media Armónica
Xa = 3
Clases x f F fx
29.5-34.5 32 1 1 32
34.5-39.5 37 3 4 111
39.5-44.5 42 8 12 336
44.5-49.5 47 9 21 423
49.5-54.5 52 7 28 364
54.5-59.5 57 4 32 228
59.5-64.5 62 3 35 186
64.5-69.5 67 3 38 201
69.5-74.5 72 2 40 144
Total 40 2025
Donde:
x es el punto medio de clase
f es la frecuencia absoluta
F es la frecuencia acumulada
fx es el producto del punto medio por la frecuencia absoluta
Donde:
L = Limite inferior de la clase modal.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
anterior.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior.
C = Intervalo de clase.
Por ejemplo:
Primero se localiza la clase modal que es aquella en la que hay la mayor densidad
de frecuencia por unidad de intervalo y luego aplicar la formula.
La clase es: 44.5 - 49.5
Entonces:
Mo = 44.5 + 1 * 5
1+2
Donde:
n = Número total de observaciones.
L = Limite inferior de la clase que contiene la mediana.
f = Frecuencia de la clase que contiene la mediana.
F = Frecuencia acumulada "menos de" de la clase anterior.
C = Intervalo de clase.
x = S fx = 2025 = 50.62
n 40
Percentiles (datos agrupados)
Donde:
Pm = Percentil m.
m = Número del percentil deseado.
n = Número total de observaciones.
L = Limite inferior de la clase donde está el percentil.
f = Frecuencia de la clase que contiene el percentil.
F = Frecuencia acumulada de la clase anterior a la que contiene el percentil
C = Intervalo de clase.
O sea que el P72 es el 28.8° término de la serie y éste queda en la clase 54.5 -
59.5.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están
referidos a la variabilidad que exhiben los valores de las observaciones, ya que si
no hubiere variabilidad o dispersión en los datos interés, entonces no habría
necesidad de la gran mayoría de las medidas de la estadística descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un
valor representativo, las medidas de dispersión nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la información.
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad
de los valores de la distribución respecto al valor central. Distinguimos entre
medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.
1.5.1 Rango
Se denomina rango estadístico (R) o recorrido estadístico al intervalo de menor
tamaño que contiene a los datos; es calculable mediante la resta del valor mínimo
al valor máximo; por ello, comparte unidades con los datos. Permite obtener una
idea de la dispersión de los datos.
Por ejemplo, para una serie de datos de carácter cuantitativo como es la estatura
tal y como:
donde la notación x(i) indica que se trata del elemento i-ésimo de la serie de datos.
De este modo, el rango sería la diferencia entre el valor máximo (k) y el mínimo; o,
lo que es lo mismo:
R = x(k) − x(1)
justo sólo hay dos valores en los datos, :a,b, y hay exactamente
la mitad de datos igual a :a y :b
1.5.3 Varianza
En teoría de probabilidad, la varianza (σ2) de una variable aleatoria es una medida
de su dispersión definida como la esperanza del cuadrado de la desviación de
dicha variable respecto a su media.
El término varianza fue acuñado por Ronald Fisher en un artículo de 1918 titulado
The Correlation Between Relatives on the Supposition of Mendelian Inheritance.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación
típica es una medida (cuadrática) que informa de la media de distancias que
tienen los datos respecto de su media aritmética, expresada en las mismas
unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
de tendencia central, sino que necesitamos conocer también la desviación que
representan los datos en su distribución respecto de la media aritmética de dicha
distribución, con objeto de tener una visión de los mismos más acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones
1.5.3.- VARIANZA.
Demostración
y como
obtenemos
Exigimos que:
Se calcula:
Propiedades y aplicaciones