Sie sind auf Seite 1von 10

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES. PARMETROS ESTADSTICOS
1.-INTRODUCCIN
Aunque las tablas estadsticas y las representaciones grficas contienen toda la informacin
relativa a un problema, muchas veces interesa simplificar ese conjunto de datos por uno o varios
parmetros que caractericen de la mejor forma posible esa distribucin de frecuencias y que,
adems nos permita comparar unas distribuciones con otras. En este sentido hay unos
parmetros de centralizacin, que tienden a situarse en el centro de la distribucin, unos
parmetros de dispersin cuyo valor indica si los datos estn concentrados o dispersos
alrededor de un valor prefijado; y unos parmetros de posicin que tienden a situarse en un
determinado lugar de la distribucin.
2.-MEDIDAS DE CENTRALIZACIN
A) MEDIA ARITMTICA O MEDIA
La media aritmtica de un conjunto de N valores x 1, x2, x3, ..., xN es el cociente entre la suma de
todos los valores observados (valores de la variable) y el nmero total de observaciones (tamao
poblacional); se representa por x y su expresin aritmtica es:
N

Tambin a veces se
representa por

x1 x2 ... xN i1

N
N

Si tenemos la tabla de frecuencias absolutas, la media se calculara as:


n

x f x2 f2 .... xn fn
x 11

f1 f2 .... fn

xifi
i1
n

f
i1

x f
i1

i i

Cuando tenemos datos agrupados en intervalos, consideraremos como valor de variable x i al


punto medio de cada intervalo, es decir, la marca de clase. El valor calculado, evidentemente no
es el valor real de la media, pero compensa con la reduccin de operaciones que hay que realizar.
Adems si los datos dentro del intervalo estn distribuidos de un modo ms o menos uniforme la
media calculada se aproxima mucho a la real.
Ventajas:
- La media es el valor medio o promedio de las observaciones.
- La media es el parmetro de centralizacin ms utilizado
- Es un valor situado entre los valores extremos de la variable.
- Su clculo slo tiene sentido cuando la variable es cuantitativa.
- Presenta rigor matemtico
- Es sensible a cualquier cambio en los datos
Desventajas:
-

No siempre es posible calcular la media e incluso a veces sta carece de significado. En


estos casos se utilizan otras medidas de centralizacin.
Es sensible a los valores extremos
No es recomendable emplearla en distribuciones muy asimtricas

1 BAC CCSS
-

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
Si se emplean variables discretas o cuasi-cualitativas, la media aritmtica puede no
pertenecer al conjunto de valores de la variable

Cuestin 1:Qu ocurrir con el valor de la media si a todos los datos de la distribucin se les
suma (o resta) la misma constante? Y si se multiplican o dividen por esa constante?
Cuestin 2: En un grupo de 20 alumnos se ha calculado la nota media en un examen de
matemticas y nos ha quedado 5,7. Si se incorpora al grupo un nuevo alumno y saca un 7,3 en el
mismo examen, cul ser la nueva media de la clase?
Cuestin 3: Pensar algn caso en el que no pueda calcularse la media, o en el que el valor de sta
carezca de sentido
Ejercicio: 1.- Calcular la media para las siguientes distribuciones de datos:
a) Caso 1: Pocos datos
Notas de los alumnos de 1 Bachillerato: 6, 4, 3, 2, 8, 6, 5, 6, 7, 3, 2, 1, 7, 3, 9, 2, 1, 6, 7, 5, 4,
5, 3, 4, 5
b) Caso 2: Pocos valores de la variable y muchos datos
Notas de
Matemticas
N de alumnos

30

40

20

50

70

30

40

50

20

c) Caso 3: Muchos valores de la variable y muchos datos (es el caso de variable continua)
Notas de
Matemticas
N de alumnos

[0,5)

[5,6)

[6,7)

[7,9)

[9,10)

90

70

60

50

30

B) MEDIANA
La mediana de una distribucin es un valor Me que divide a la distribucin en dos partes iguales;
es decir, deja tantas observaciones a la izquierda como a la derecha.
- Para calcular la mediana en caso de pocos datos y sin agrupar se colocan estos en orden
creciente de magnitud. Si el nmero de datos es impar la mediana coincide con el valor central.
Si el nmero de datos es par, cualquier valor comprendido entre los dos valores centrales es una
mediana, pero se suele tomar el valor medio de los dos valores centrales.
- Si tenemos muchos datos y sin agrupar, se construye la tabla de frecuencias acumuladas F i, y
N
se toma la mediana como aquel valor de la variable xi para el cual Fi sea igual o supere
2
- En caso de datos agrupados en intervalos primero buscaremos el intervalo mediano, que es el
primer intervalo de clase cuya frecuencia acumulada es igual o superior a la mitad del nmero de
N
observaciones,
.
2
Como primera aproximacin puede tomarse la mediana como la marca de clase de dicho intervalo;
sin embargo podemos calcularla de forma ms exacta con el siguiente razonamiento: si
suponemos que los datos dentro de cada intervalo estn distribuidos uniformemente, y llamamos
(xi-1, xi) al intervalo mediano; fi a la frecuencia absoluta de dicho intervalo y F i-1 a la frecuencia
absoluta acumulada en el intervalo anterior al mediano, el clculo de la mediana es:

10

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS

Me xi1

N
Fi1
2

(xi xi1 )
fi

Al igual que suceda con la media, el valor calculado no es el valor real de la mediana, pero
compensa con la reduccin de operaciones que hay que realizar. Adems si los datos dentro del
intervalo estn distribuidos de un modo ms o menos uniforme el valor obtenido se aproxima
mucho al real.
Ejercicio: 2.- Calcular la mediana para las siguientes distribuciones de datos:
a) Caso1: Notas de los alumnos de 1 Bachillerato: 6, 4, 3, 2, 8, 6, 5, 6, 7, 3, 2, 1, 7, 3, 9, 2,
1, 6, 7, 5, 4, 5, 3, 4, 5
b) Caso 2:
Notas de
1
2
3
4
5
6
7
8
9
Matemticas
N de alumnos
30
40
20
50
70
30
40
50
20
c) Caso 3:
Notas de
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
Matemticas
N de alumnos
90
70
60
50
30
C)MODA
La moda Mo es el dato que ms se repite, es decir el valor de la variable con mayor frecuencia
absoluta. Es la nica medida de centralizacin que tiene sentido estudiar en
una variable cualitativa, pues no precisa la realizacin de ningn clculo. La
moda no tiene por qu ser nica, sino que puede haber distribuciones
multimodales.
Si los datos estn agrupados en intervalos elegimos el intervalo modal, que
es aquel con mayor frecuencia absoluta. Aunque hay una frmula para un
clculo ms ajustado del valor de la moda, slo vamos a estudiar su clculo
grfico. Para ello se unen los extremos del intervalo modal con los contiguos
como se muestra en la figura. El punto de corte de dichas lneas nos da el
valor aproximado de la moda.
Ejercicio: 3.- Se ha preguntado a un grupo de alumnos de 1 de Bachillerato sus pesos y los
resultados obtenidos se han colocado en la siguiente tabla. Calcula la media, mediana y moda de
la distribucin de datos:
Peso (xi)
N de personas(fi)
mci fi
Fi

[45,50)
5

[50,55)
9

[55,60)
12

[60,65)
8

[65,70)
7

[70,75]
4

11

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
3.-MEDIDAS DE DISPERSIN
Por qu las medidas de dispersin?
Las medidas de centralizacin representan bien a un conjunto de datos cuando estn agrupados
en torno a ellas, pero no cuando hay bastantes observaciones alejadas de ellas. Las medidas de
dispersin miden, por tanto, el grado de alejamiento de los datos respecto a las medidas de
centralizacin, fundamentalmente respecto de la media. Esas medidas son:
A) RANGO O RECORRIDO
El recorrido de una distribucin es la diferencia entre el dato mayor y el dato menor
obtenidos al observar los valores de la variable.
B) DESVIACIN MEDIA
Se llama desviacin media de una serie de datos x 1, x2, x3, ..., xn, que tienen frecuencias f1, f2,
f3, ..., fn respectivamente, y se representa por DM, a la media aritmtica de los valores absolutos
de las desviaciones respecto de la media, esto es:
n

DM

f x
i1

C) VARIANZA
Se llama varianza de una serie de datos x 1, x2, x3, ..., xn, que tienen frecuencias f1, f2, f3, ..., fn
respectivamente, y se representa por 2 (o s2), a la media aritmtica de los cuadrados de las
desviaciones respecto de la media, esto es:
La varianza tambin puede calcularse como
n

f (x
i1

x)

la media de los cuadrados menos el


cuadrado de la media.

2 = x

2 =

i1

xi2 fi

xi fi

in

D) DESVIACIN TPICA
Es la raz cuadrada positiva de la varianza y se denota por (o s).
n

f(x x)
i1

E) COEFICIENTE DE VARIACIN
Se llama coeficiente de variacin y se representa por C.V. al cociente entre la desviacin tpica
y el valor absoluto de la media.

C.V .

Consideraciones:
- Tanto la varianza como la desviacin tpica miden la dispersin de los datos respecto de la
media. La varianza tiene el inconveniente que la unidad de medida en la que viene
expresada es el cuadrado de la unidad en que se expresan los datos; sin embargo, la
desviacin tpica viene expresada en las mismas unidades que los datos, por eso es ms
utilizada.
12

1 BAC CCSS
-

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
El CV es un nmero real positivo que no tiene dimensiones, es decir no depende de las
escalas usadas al medir, y se utiliza para comparar dispersiones de dos variables
estadsticas. En ocasiones se suele expresar en tanto por ciento.
El CV mide la dispersin relativa de los datos en relacin con la media. Cuanto ms
pequeo sea ms concentrados estarn los datos alrededor de la media, siendo por tanto
la media ms representativa.
Si X e Y son dos variables de medias x e y y desviaciones tpicas x y y :
a) Si x y , x < y x es ms representativa.
b) Si

x y

y
x
, x y x es ms representativa. Es decir, si las medias son

distintas ser ms representativa la que tenga menor CV


En ambos casos la serie de datos X est ms concentrada que la serie Y.
Cuestin 4:Qu ocurrir con el valor de la desviacin tpica si todos los datos de la distribucin
se multiplican o dividen por una constante?
Puedes analizarlo con una caso prctico para la siguiente distribucin:
xi

fi

Ejercicio: 4.- Calcular recorrido, varianza, desviacin tpica y CV para los datos:
Notas de
a)
1
2
3
4
5
6
7
8
Matemticas
N de alumnos
3
4
2
5
7
3
4
5
b)
Notas de
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
Matemticas
N de alumnos
9
7
6
5
3

9
2

4.- SIMETRA Y ASIMETRA


Hay conjunto de datos donde las tres medidas de centralizacin (media, mediana y moda)
coinciden. En este caso se dice que la distribucin de datos es simtrica.
En general para estudiar la simetra o no de una distribucin de datos podemos estudiar su
grfica, su tabla o los valores de estas medidas de centralizacin.
La representacin grfica simtrica por excelencia
corresponde a una Distribucin Normal y recibe el
nombre de Campana de Gauss.
En esta campana, el valor mximo corresponde a la
media aritmtica, siendo los valores centrales ms
frecuentes que los alejados, y se tiene que:
En el intervalo ( x , x + ) se encuentra el
68,2 % de los datos
En el intervalo ( x 2, x + 2) se encuentra el
95,5 % de los datos
En el intervalo ( x 3, x + 3) se encuentra el 99,7 % de los datos
En general las distribuciones de datos no se adaptan totalmente a una campana de Gauss, sino
que presentan asimetra. Estudiemos la asimetra de una distribucin con un ejemplo.
Ejemplo: Sean las estaturas (en cm) de 20 alumnos las siguientes:
13

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
157, 160, 160, 161, 164, 164, 165, 167, 168, 168, 170, 170, 171, 172, 173, 175, 175, 177, 182, 194
Mediante los clculos necesarios obtenemos x 169,6 y s = 8,32
Podemos observar adems que:
En el intervalo ( x , x + ) = (161,28, 177,92), hay 14 datos, lo que corresponde al 70%
de los datos
En el intervalo ( x 2, x + 2) = (152,96, 186,24), hay 19 datos, lo que corresponde al
90% de los datos
En el intervalo ( x 3, x + 3) = (144,64, 194,56), hay 20 datos, lo que corresponde al
100% de los datos
Si estudiamos el histograma de esta distribucin, y aunque la
media se corresponde aproximadamente con el valor ms alto del
polgono de frecuencias, la distribucin claramente no es
simtrica.
Para ver la asimetra podemos representar sobre una escala
graduada un rectngulo limitado por los valores extremos (157 y
194) y sealando en su interior la mediana (169). Observamos as
que la distribucin de estaturas con relacin a la mediana est
ms dispersa a la derecha; es asimtrica a la derecha.

5.-MEDIDAS DE POSICIN
Las medidas de posicin pretenden localizar el lugar que ocupa un cierto elemento en la
distribucin. Tambin las utilizaremos para responder a preguntas tales como entre qu lmites
se encuentra el 50% central de los datos?, cul es el valor por debajo del cual estn el 90% de
los datos?, etc.
A) CUARTILES
Son cada uno de los valores que divide la distribucin en 4 partes iguales. Reciben los nombres
de primer, segundo y tercer cuartil respectivamente y se representan por Q 1, Q2 y Q3. De modo
que debajo del primer cuartil queda el 25% de la distribucin, debajo del segundo el 50% y
debajo del tercero el 75% de la misma. Es claro que Q 2 es precisamente la mediana.
Para calcularlos hacemos algo similar a lo que hacamos en el clculo de la mediana.
Si los datos son pocos, vemos que dato ocupa cada lugar directamente. Lo vemos con el siguiente
ejemplo:
Ejemplo: Los pesos de 20 alumnos de clase son: 53, 62, 48, 60, 47, 52, 50, 63, 54, 52, 63, 51,
50, 80, 65, 63, 60, 62, 63, 86
En primer lugar ordenamos los datos y observamos directamente:
47, 48, 50, 50, 51, 52, 52, 53, 54, 60, 60, 62, 62, 63, 63, 63, 63, 65, 80, 86
25%

25%
Q1 = 51,5

25%
Me = 60

25%
Q3 = 63

14

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
Si hay muchos datos pero no estn agrupados en intervalos, observamos directamente la tabla
de frecuencias acumuladas, como vemos en el ejemplo:
Edad
fi
Fi
Q1 = 16
16
130
130
> N/4 (50)
Q3 = 17
17
30
160
> 3N/4 (150)
18
30
190
19
10
200
N = 200
Si los datos estn agrupados en intervalos, primero obtenemos el intervalo que contiene el
cuartil y luego calculamos el valor de este mediante las frmulas, al igual que hacamos en el
clculo de la mediana:

Q1 xi1

N
Fi1
4

(xi xi1 )
fi

Q3 xi1

Lo vemos con el ejemplo:


Estatura
fi
Q1 [155, 165)
[155 , 165)
6
Q3 [165, 175)
[165 , 175)
10
[175 , 185)
3
[185 , 195]
1
N = 20
N
Fi1
5-0
4
Q1 xi1
(xi xi1 ) 155
10 163,33
fi
6

Q3 xi1

3N
Fi1
4

(xi xi1 )
fi
Fi
6
16
19
20

> N/4 (5)


> 3N/4 (15)

3N
Fi1
15 - 6
4
(xi xi1 ) 165
10 174
fi
10

B) DECILES
Son los valores de la distribucin que dividen a esta en diez partes iguales, y los denotamos por
D1, D2, D3, ...., D9. As D1 deja por debajo el 10% de los valores de la distribucin, D 2 deja por
debajo el 20% de los valores de la distribucin, y as sucesivamente. El valor de D 5 coincide con
la media.
Para calcularlo se hace lo mismo que en los cuartiles para datos sin agrupar, y para datos
agrupados se utiliza la frmula:
kN
Fi 1
D k x i1 10
(x i x i1 )
fi
C) PERCENTILES
Son los valores que dividen la serie de datos en cien partes iguales. Los denotamos por P 1, P2,
P3, ...., P99. As P1 deja por debajo el 1% de los valores de la distribucin, P 2 deja por debajo el 2%
de los valores de la distribucin, y as sucesivamente. Es claro
kN
que P50 coincide con la mediana.
Fi 1
100
Para calcularlo se hace lo mismo que en los cuartiles para datos
Pk x i 1
(x i x i 1 )
fi
sin agrupar, y para datos agrupados se utiliza la frmula:

15

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
Ejercicio 5.- Calcular Q3, D1, P45 para la siguiente distribucin de datos:
a)
Notas de
1
2
3
4
5
6
7
8
Matemticas
N de alumnos
3
4
2
5
7
3
4
5
b)
Notas de
[0,5)
[5,6)
[6,7)
[7,9)
[9,10)
Matemticas
N de alumnos
9
7
6
5
3

9
2

CUESTIONES DISTRIBUCIONES UNIDIMENSIONALES


1.- La nota media de 10 alumnos es de 65. Si le preguntamos su nota a otros tres alumnos ms,
resultando ser estas notas: 5, 7 y 9, cul es la nueva media de estos 13 alumnos?
2.- Se eligen al azar tres nmeros del 0 al 9 y se forma con ellos un nmero de tres cifras. Se
sabe que la media de las tres cifras es 5 y la moda existe y es 7. Cul es el mayor nmero que
se pudo formar de esta manera?
3.- Poner un ejemplo de distribuciones de varianza nula
4.- Sean dos conjuntos de datos
A: 1, 3, 5, 7 y 9
B: 1, 5, 10, 15 y 30
Sin necesidad de hacer ningn clculo Cul de los dos tiene mayor dispersin?
5.- El peso medio de 5 chicas es 56,2 Kg y el peso medio de 7 chicos es 62,8 Kg. Hallar:
a) Peso total de las chicas
b) Peso total de los chicos
c) Peso medio de todo el grupo
EJERCICIOS FINALES ESTADSTICA UNIDIMENSIONAL
1.- Calcular la media, moda, varianza, desviacin tpica y coeficiente de variacin de la siguiente
distribucin de datos:
Nota de Matemticas
2
3
4
5
6
7
8
9
10
N de alumnos
5
7
4
6
5
3
3
2
1
2.- Rellenar la siguiente tabla con las frecuencias relativas, porcentuales y absolutas acumuladas:
Xi
fi
hi
pi
Fi
2
6
3
4
4
6
5
5
6
7
7
2

16

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
Calcular tambin la mediana, el tercer cuartil, el sexto decil y el vigsimotecer percentil para los
siguientes datos
3.- Calcular la mediana y el sptimo decil en la siguiente distribucin de datos. Adems dibujar el
histograma de la distribucin
Nota
N alumnos
[0,5)
10
[5,6)
4
[6,7)
5
[7,9)
7
[9,10]
3
4.- La siguiente tabla nos muestra las notas de lengua de una clase de 1 Bachillerato.
a) Rellenar la tabla
b) Calcular la media, la mediana y la moda
c) Calcular la varianza, de las dos formas posibles, la desviacin tpica y el coeficiente de
variacin.
d) Realizar un diagrama de barras y un polgono de frecuencias absolutas para esta
distribucin
Nota
Lengua

n alumnos

hi

pi

Fi

Hi

Pi

Totales
5.- Los salarios, en miles de pesetas, de 100 empleados de una empresa vienen dados por la tabla
siguiente:
Miles de pesetas
40-70
70-100
100-130
130-160
160-190
N de empleados
13
30
32
15
10
Construye el histograma asociado a estos datos. Calcula la media y la desviacin tpica.
6.- En un grupo de 50 mujeres se estudia el nmero de hijos. Los valores encontrados son:
4 2 3 1 3 1 0 4 1 1 5 2 2 2 2 2 1 3 1 2 3 1 2 1 2
0 0 2 2 2 4 4 4 1 0 2 2 2 0 3 4 3 5 0 1 2 1 3 2 2
Calcula la media, la varianza y la desviacin tpica. Construye la tabla de frecuencias. Haz una
representacin grfica mediante un diagrama de barras.

17

1 BAC CCSS

TEMA 2: DISTRIBUCIONES UNIDIMENSIONALES.


PARMETROS ESTADSTICOS
7 .- Las puntuaciones obtenidas, en palabras por minuto en una prueba de velocidad lectora
aplicada a 42 estudiantes fueron:
110 53
98
112 71
96
80
70
87
48
74
81
87
79
90
105 106 100 75
72
52
57
73
99
58
57
69
90
80
43
47
109 90
79
66
67
104 75
81
56
91
81
Determina los intervalos de clase, halla las marcas de clase. Agrupa los datos por intervalos.
Presenta estos datos en una tabla de frecuencias absolutas, relativas y de porcentajes.
Representa los datos mediante un histograma. Construye el polgono de frecuencias. Calcula la
media y la desviacin tpica.
8.- Las calificaciones en matemticas de 25 alumnos del grupo A son:
6, 6, 7. 6, 7, 5, 5, 6, 7, 5, 4, 5, 4, 9, 3, 3, 5, 5, 5, 9, 5, 4, 5, 4, 8
mientras que los 20 alumnos del grupo B fueron:
6, 6, 7, 3, 10, 3, 5, 5, 2, 5, 4, 3, 9, 4, 9, 5, 6, 6, 6, 7
a) En qu grupo los alumnos obtuvieron mejor nota media?
b) En qu grupo las notas estn ms dispersas?
9.- Con los datos del ejercicio anterior, determina los extremos del intervalo que contiene el
50% de las notas centrales de cada grupo
10.- De los 200 alumnos que responden a una prueba de 12 tems, el 10% responde correctamente
a 3 tems, el 50% responde correctamente a 7 tems, el 30% a 10 tems y el resto al total de
tems de la prueba. Calcula:
a) Media aritmtica, mediana y moda.
b) Cuntos alumnos se encuentran en el intervalo ( x , x + ) ?
c) Cul es el coeficiente de variacin?
11.- Los precios, en unidades monetarias, de la gasolina sper, a lo largo de 1993 fueron:
99,1
100,8
103,6
111,8
110,3
109,5
108,7
99,7
101,0
104,0
111,4
109,1
109,6
108,8
99,3
101,6
103,9
112,1
108,5
109,3
108,0
100,0
102,5
104,5
111,5
108,9
108,4
107,2
100,7
103,8
104,6
110,9
109,3
108,5
Formaban una distribucin simtrica o asimtrica?

18

Das könnte Ihnen auch gefallen