Beruflich Dokumente
Kultur Dokumente
Distribuciones de frecuencias
Índice
• Definición de Estadı́stica.
• Conceptos Generales.
• Tipos de caracteres.
• Resúmenes numéricos.
• Tablas de frecuencias.
1 Introducción
Aunque en sus orı́genes tenı́a como principal objetivos recopilar datos demográficos, sociológicos
y económicos, debido al gran avance de la ciencia, se ha producido una ampliación de estos
objetivos. Encontrar una definición para esta ciencia suele ser trabajoso debido por un lado a
la dificultad de resumir en pocas palabras el conjunto de conceptos que ésta implica y por otro
a su continua evolución.Una de las definiciones más usadas es la siguiente
La Estadı́stica es la ciencia que trata la teorı́a y aplicación de métodos apropiados
para coleccionar, representar, resumir y analizar datos, ası́ como realizar inferencias
a partir de los mismos.
A partir de esta definición, podemos considerar dos partes de la Estadı́stica, según sus
objetivos:
1
Hay que notar que en dicho proceso inferencial se cometen errores inherentes al método
inductivo, siendo necesario disponer de medidas de la precisión de las conclusiones obtenidas.
En este sentido, la Estadı́stica Inferencial o Inferencia Estadı́stica o Estadı́stica Matemática,
emplea como herramienta básica el Cálculo de Probabilidades.
2 Conceptos generales
• Población: Es el conjunto de elementos, objetivo de la investigación estadı́stica que se
pretenda realizar.
Ejemplo 1
POBLACIÓN: Alumnos de la Universidad de Sevilla.
CARACTERES: Sexo, carrera que estudia, curso, número de hijos, perı́metro craneano en cm.
MODALIDADES:
2
3 Tipos de caracteres
Si consideramos el ejemplo anterior, podemos observar que hay caracteres que son medibles
o numéricamente cuantificables, y que se denominan cuantitativos, por ejemplos número de
hijos o perı́metro craneano. Por otro lado, hay otros caracteres no cuantificables o suceptibles de
medida, como sexo o carrera, y que reciben el nombre de cualitativos o atributos.
En el caso de que el carácter sea cuantitativo a cada modalidad se le asignará un número
real a través de las denominadas Variables estadı́sticas. Se pueden clasificar en dos tipos:
• Discretas. No pueden tomar ningún valor entre dos consecutivos o bien, aún siendo
continuas, vienen dados como un conjunto de datos individuales. Por ejemplo el número
de hijos o el número de coches.
4 Resúmenes numéricos
El primer paso en el estudio estadı́stico descriptivo de un conjunto de datos será la construcción
de tablas u otros tipos de esquemas que permitan resumir y ordenar la estructura de dichos
datos, facilitando ası́ la posterior extracción de conclusiones.
3
FRECUENCIA ACUMULADA Se define la frecuencia acumulada de la modalidad xi al
número de individuos que presentan esa modalidad o una menor. Se denota Ni . Evidentemente
Pi
j=1 nj = Ni .
MARCA DE CLASE Se define la marca de clase del intervalo Ii = [Li−1 , Li ) como el punto
medio del mismo, xi = Li − Li−1 , i = 1, . . . , k.
Ejemplo 2 Ocho lotes de 1000 piezas de una cierta empresa eléctrica contiene las siguientes piezas
defectuosas:
6, 9, 1 ,7, 5, 1 ,1 ,3.
xi ni fi Ni Fi
1 3 3/8 3 3/8
3 1 1/8 4 4/8
5 1 1/8 5 5/8
6 1 1/8 6 6/8
7 1 1/8 7 7/80
9 1 1/8 8 1
8 1
4
• Rango de valores de los datos.
• Simetrı́a.
1. Examinar los datos para decidir cuantos dı́gitos se van a conservar, truncando a partir
del último dı́gito retenido. Todos los dı́gitos, salvo el último, forman el tronco de la
observación, el último dı́gito es la hoja. El lugar de truncamiento, que podemos hacer con
o sin redondeo, dependerá del tipo de datos.
2. Escribir la lista de posibles troncos desde el menor al mayor y cada hoja a la derecha del
tronco al que pertenece. Adicionalmente, se pueden ordenar las hojas sobre cada tronco
en orden ascendente.
3. Añadir una serie de anotaciones indicando de qué forma se pueden leer los datos a partir
del diagrama y el número de datos.
4. Además, si hay valores que se separan en exceso del resto, se anotan aparte indicando el
sentido de distanciamiento. De esta forma, se obtiene un diagrama más compacto.
A veces, cuando los dı́gitos correspondientes a las hojas son unidades, se originan diagramas
con pocos troncos pero si se toman décimas, aparecen demasiados. En estos casos, se puede
dividir un tronco en dos partes, diferenciando cada parte con un “*” para las hojas de 0 a 4, y
con un “.” para las de 5 a 9. También es posible diferenciar cinco partes distintas empleando
“*”, “T”, “F”, “S” y “.” para hojas de 0 a 1, 2 a 3, 4 a 5, 6 a 7, y 8 a 9 respectivamente.
En la Figura 1. y la Figura 2. se representan diagramas de tronco y hoja para los datos de
los ejemplos anteriores, 1. y 2., respectivamente.
En la primera fila, se da información sobre la unidad utilizada y como están representados los
valores sobre el diagrama. Si hay valores extremos, se representan en la fila siguiente, indicando
si son superiores o inferiores. Por ejemplo, en la Figura 2., hay tres valores extremos inferiores.
5
unidad = 1 1|2 representa 12
5*|00112344
5.|555678
6*|0011122333444
6.|5555566677888999999
7*|0000000111111222233344444
7.|5555555555666666666777777777788888899999
8*|0000000111111222223333334444444
8.|5555566677788999
9*|0000112234
9.|5667888
INF|34,39,41
4T|3
4F|55
4S|6
4.|88899999
5*|0000000011111
5T|222333333333333333
5F|444444444444555555555555
5S|6666667777
5.|8888888888999999
6*|000000000001111111
6T|222222