Beruflich Dokumente
Kultur Dokumente
Tambin a veces se
representa por
x1 x2 ... xN i1
N
N
x f x2 f2 .... xn fn
x 11
f1 f2 .... fn
xifi
i1
n
f
i1
x f
i1
i i
1 BAC CCSS
-
Cuestin 1:Qu ocurrir con el valor de la media si a todos los datos de la distribucin se les
suma (o resta) la misma constante? Y si se multiplican o dividen por esa constante?
Cuestin 2: En un grupo de 20 alumnos se ha calculado la nota media en un examen de
matemticas y nos ha quedado 5,7. Si se incorpora al grupo un nuevo alumno y saca un 7,3 en el
mismo examen, cul ser la nueva media de la clase?
Cuestin 3: Pensar algn caso en el que no pueda calcularse la media, o en el que el valor de sta
carezca de sentido
Ejercicio: 1.- Calcular la media para las siguientes distribuciones de datos:
a) Caso 1: Pocos datos
Notas de los alumnos de 1 Bachillerato: 6, 4, 3, 2, 8, 6, 5, 6, 7, 3, 2, 1, 7, 3, 9, 2, 1, 6, 7, 5, 4,
5, 3, 4, 5
b) Caso 2: Pocos valores de la variable y muchos datos
Notas de
Matemticas
N de alumnos
30
40
20
50
70
30
40
50
20
c) Caso 3: Muchos valores de la variable y muchos datos (es el caso de variable continua)
Notas de
Matemticas
N de alumnos
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
90
70
60
50
30
B) MEDIANA
La mediana de una distribucin es un valor Me que divide a la distribucin en dos partes iguales;
es decir, deja tantas observaciones a la izquierda como a la derecha.
- Para calcular la mediana en caso de pocos datos y sin agrupar se colocan estos en orden
creciente de magnitud. Si el nmero de datos es impar la mediana coincide con el valor central.
Si el nmero de datos es par, cualquier valor comprendido entre los dos valores centrales es una
mediana, pero se suele tomar el valor medio de los dos valores centrales.
- Si tenemos muchos datos y sin agrupar, se construye la tabla de frecuencias acumuladas F i, y
N
se toma la mediana como aquel valor de la variable xi para el cual Fi sea igual o supere
2
- En caso de datos agrupados en intervalos primero buscaremos el intervalo mediano, que es el
primer intervalo de clase cuya frecuencia acumulada es igual o superior a la mitad del nmero de
N
observaciones,
.
2
Como primera aproximacin puede tomarse la mediana como la marca de clase de dicho intervalo;
sin embargo podemos calcularla de forma ms exacta con el siguiente razonamiento: si
suponemos que los datos dentro de cada intervalo estn distribuidos uniformemente, y llamamos
(xi-1, xi) al intervalo mediano; fi a la frecuencia absoluta de dicho intervalo y F i-1 a la frecuencia
absoluta acumulada en el intervalo anterior al mediano, el clculo de la mediana es:
10
1 BAC CCSS
Me xi1
N
Fi1
2
(xi xi1 )
fi
Al igual que suceda con la media, el valor calculado no es el valor real de la mediana, pero
compensa con la reduccin de operaciones que hay que realizar. Adems si los datos dentro del
intervalo estn distribuidos de un modo ms o menos uniforme el valor obtenido se aproxima
mucho al real.
Ejercicio: 2.- Calcular la mediana para las siguientes distribuciones de datos:
a) Caso1: Notas de los alumnos de 1 Bachillerato: 6, 4, 3, 2, 8, 6, 5, 6, 7, 3, 2, 1, 7, 3, 9, 2,
1, 6, 7, 5, 4, 5, 3, 4, 5
b) Caso 2:
Notas de
1
2
3
4
5
6
7
8
9
Matemticas
N de alumnos
30
40
20
50
70
30
40
50
20
c) Caso 3:
Notas de
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
Matemticas
N de alumnos
90
70
60
50
30
C)MODA
La moda Mo es el dato que ms se repite, es decir el valor de la variable con mayor frecuencia
absoluta. Es la nica medida de centralizacin que tiene sentido estudiar en
una variable cualitativa, pues no precisa la realizacin de ningn clculo. La
moda no tiene por qu ser nica, sino que puede haber distribuciones
multimodales.
Si los datos estn agrupados en intervalos elegimos el intervalo modal, que
es aquel con mayor frecuencia absoluta. Aunque hay una frmula para un
clculo ms ajustado del valor de la moda, slo vamos a estudiar su clculo
grfico. Para ello se unen los extremos del intervalo modal con los contiguos
como se muestra en la figura. El punto de corte de dichas lneas nos da el
valor aproximado de la moda.
Ejercicio: 3.- Se ha preguntado a un grupo de alumnos de 1 de Bachillerato sus pesos y los
resultados obtenidos se han colocado en la siguiente tabla. Calcula la media, mediana y moda de
la distribucin de datos:
Peso (xi)
N de personas(fi)
mci fi
Fi
[45,50)
5
[50,55)
9
[55,60)
12
[60,65)
8
[65,70)
7
[70,75]
4
11
1 BAC CCSS
DM
f x
i1
C) VARIANZA
Se llama varianza de una serie de datos x 1, x2, x3, ..., xn, que tienen frecuencias f1, f2, f3, ..., fn
respectivamente, y se representa por 2 (o s2), a la media aritmtica de los cuadrados de las
desviaciones respecto de la media, esto es:
La varianza tambin puede calcularse como
n
f (x
i1
x)
2 = x
2 =
i1
xi2 fi
xi fi
in
D) DESVIACIN TPICA
Es la raz cuadrada positiva de la varianza y se denota por (o s).
n
f(x x)
i1
E) COEFICIENTE DE VARIACIN
Se llama coeficiente de variacin y se representa por C.V. al cociente entre la desviacin tpica
y el valor absoluto de la media.
C.V .
Consideraciones:
- Tanto la varianza como la desviacin tpica miden la dispersin de los datos respecto de la
media. La varianza tiene el inconveniente que la unidad de medida en la que viene
expresada es el cuadrado de la unidad en que se expresan los datos; sin embargo, la
desviacin tpica viene expresada en las mismas unidades que los datos, por eso es ms
utilizada.
12
1 BAC CCSS
-
x y
y
x
, x y x es ms representativa. Es decir, si las medias son
fi
Ejercicio: 4.- Calcular recorrido, varianza, desviacin tpica y CV para los datos:
Notas de
a)
1
2
3
4
5
6
7
8
Matemticas
N de alumnos
3
4
2
5
7
3
4
5
b)
Notas de
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
Matemticas
N de alumnos
9
7
6
5
3
9
2
1 BAC CCSS
5.-MEDIDAS DE POSICIN
Las medidas de posicin pretenden localizar el lugar que ocupa un cierto elemento en la
distribucin. Tambin las utilizaremos para responder a preguntas tales como entre qu lmites
se encuentra el 50% central de los datos?, cul es el valor por debajo del cual estn el 90% de
los datos?, etc.
A) CUARTILES
Son cada uno de los valores que divide la distribucin en 4 partes iguales. Reciben los nombres
de primer, segundo y tercer cuartil respectivamente y se representan por Q 1, Q2 y Q3. De modo
que debajo del primer cuartil queda el 25% de la distribucin, debajo del segundo el 50% y
debajo del tercero el 75% de la misma. Es claro que Q 2 es precisamente la mediana.
Para calcularlos hacemos algo similar a lo que hacamos en el clculo de la mediana.
Si los datos son pocos, vemos que dato ocupa cada lugar directamente. Lo vemos con el siguiente
ejemplo:
Ejemplo: Los pesos de 20 alumnos de clase son: 53, 62, 48, 60, 47, 52, 50, 63, 54, 52, 63, 51,
50, 80, 65, 63, 60, 62, 63, 86
En primer lugar ordenamos los datos y observamos directamente:
47, 48, 50, 50, 51, 52, 52, 53, 54, 60, 60, 62, 62, 63, 63, 63, 63, 65, 80, 86
25%
25%
Q1 = 51,5
25%
Me = 60
25%
Q3 = 63
14
1 BAC CCSS
Q1 xi1
N
Fi1
4
(xi xi1 )
fi
Q3 xi1
Q3 xi1
3N
Fi1
4
(xi xi1 )
fi
Fi
6
16
19
20
3N
Fi1
15 - 6
4
(xi xi1 ) 165
10 174
fi
10
B) DECILES
Son los valores de la distribucin que dividen a esta en diez partes iguales, y los denotamos por
D1, D2, D3, ...., D9. As D1 deja por debajo el 10% de los valores de la distribucin, D 2 deja por
debajo el 20% de los valores de la distribucin, y as sucesivamente. El valor de D 5 coincide con
la media.
Para calcularlo se hace lo mismo que en los cuartiles para datos sin agrupar, y para datos
agrupados se utiliza la frmula:
kN
Fi 1
D k x i1 10
(x i x i1 )
fi
C) PERCENTILES
Son los valores que dividen la serie de datos en cien partes iguales. Los denotamos por P 1, P2,
P3, ...., P99. As P1 deja por debajo el 1% de los valores de la distribucin, P 2 deja por debajo el 2%
de los valores de la distribucin, y as sucesivamente. Es claro
kN
que P50 coincide con la mediana.
Fi 1
100
Para calcularlo se hace lo mismo que en los cuartiles para datos
Pk x i 1
(x i x i 1 )
fi
sin agrupar, y para datos agrupados se utiliza la frmula:
15
1 BAC CCSS
9
2
16
1 BAC CCSS
n alumnos
hi
pi
Fi
Hi
Pi
Totales
5.- Los salarios, en miles de pesetas, de 100 empleados de una empresa vienen dados por la tabla
siguiente:
Miles de pesetas
40-70
70-100
100-130
130-160
160-190
N de empleados
13
30
32
15
10
Construye el histograma asociado a estos datos. Calcula la media y la desviacin tpica.
6.- En un grupo de 50 mujeres se estudia el nmero de hijos. Los valores encontrados son:
4 2 3 1 3 1 0 4 1 1 5 2 2 2 2 2 1 3 1 2 3 1 2 1 2
0 0 2 2 2 4 4 4 1 0 2 2 2 0 3 4 3 5 0 1 2 1 3 2 2
Calcula la media, la varianza y la desviacin tpica. Construye la tabla de frecuencias. Haz una
representacin grfica mediante un diagrama de barras.
17
1 BAC CCSS
18