Beruflich Dokumente
Kultur Dokumente
Kennedy de Arbeláez
Objetivo: Caracterizar variables cuantitativas para datos agrupados a partir de tablas de frecuencias,
construcción del histograma de frecuencias, polígono de frecuencias y ojiva para describir la variable.
La caracterización de variables cuantitativas debe realizarse teniendo en cuenta dos grandes criterios: datos
agrupados y datos no agrupados.
Datos agrupados
La agrupación de datos corresponde a la elaboración de tablas de frecuencias mediante las que se resumen los
datos en algunos rangos, sobre los cuales se hace un conteo.
Una vez se han recogido los datos de una muestra o población, es necesario familiarizarse con ellos antes de
elaborar la tabla, explorando una representación visual y tratando de buscar patrones de comportamiento de la
variable.
Para la construcción gráfica de un conjunto de datos existen varias opciones; sin embargo, la más aceptada por
su aplicación es el diagrama de tallo y hojas.
La técnica del diagrama de tallo y hojas consiste en dividir los valores numéricos correspondientes a una
determinada variable estadística, en una parte llamada tallo, que será el primer o primeros dígitos desde la
izquierda, y otra parte llamada hojas, que estará formada por los dígitos restantes. Por ejemplo, los siguientes
datos corresponden a las edades, en años, de 30 actores postulados a protagonizar la siguiente película nacional.
21 30 11 27 23 28 36 37 21 39
13 22 45 21 19 37 14 31 21 34
19 37 40 20 24 28 27 21 37 39
Se observa que todas las edades de los artistas están en las decenas: 10, 20, 30, 40. Como tallo se utilizará el
primer dígito de cada puntaje y como hoja el segundo dígito. Normalmente, la representación se realiza en
posición vertical; para esto se traza una recta vertical y se escriben los tallos a la izquierda de la recta (Figura
4).
1 de 7
A continuación, se coloca cada hoja en su correspondiente tallo; esto se hace escribiendo el último dígito a la
derecha de la recta vertical, en frente de su dígito principal correspondiente. Por ejemplo, para el valor 21, el
tallo es 2 y la hoja 1 (Figura 5).
Para el otro dato, 27, el tallo 2 ya se ubicó, luego, lo único que se debe hacer es ubicar la hoja (figura 6).
Este proceso se realiza para todos los datos, obteniéndose el siguiente diagrama:
Al observar el diagrama se puede concluir que las edades de la mayoría de los actores están centradas alrededor
de los 20 y los 30 años. Es importante aclarar que el tallo puede estar constituido por varios dígitos, mientras
que las hojas deben ser representadas por un único dígito. Por ejemplo, si un dato tiene tres cifras, el tallo serán
las decenas y las unidades las hojas. Si los datos tienen una cifra decimal, esta será la hoja y las unidades el
tallo. Por otro lado, es importante cuando los datos están muy alejados entre sí, el diagrama de tallos no es una
buena representación gráfica de ellos. El diagrama de tallo y hojas puede ser usado también como un principio
de comparación entre dos grupos o muestras distintas.
Ejemplo: El rector de dos colegios decide comparar el número de estudiantes que llegan tarde en cada colegio.
Pide a sus respectivos coordinadores que midan los retardos en los últimos días. Los resultados se muestran en
la tabla 5.
Elaborar un diagrama de tallo y hojas para los datos de los dos colegios.
Solución
2 de 7
Un diagrama de tallo y hojas para los dos colegios puede elaborarse en dos columnas, utilizando los mismos
tallos. Para esto, se debe tener en cuenta el número de retardos en cada colegio, ubicándolos a la derecha e
izquierda de los tallos. Así,
A partir del diagrama se observa que a pesar de que el coordinador del colegio 1 consideró más días que el del
colegio 2, el número de estudiantes que llegan tarde al colegio 1 es menor que el del número 2, ya que en el
primero la mayoría de los datos están centrados entre los 20 y los 40 estudiantes, mientras que para el segundo
los datos están centrados entre 40 y 50 estudiantes. Cuando la variable que se está considerando se mide con
respecto al tiempo, el gráfico que ilustra el comportamiento puede construirse con base en este.
Ahora se puede construir una tabla de frecuencias para los datos agrupados, de la siguiente manera:
Una distribución de frecuencias es un resumen de una lista de datos. Puede considerarse un criterio de
agrupación de los datos que permite visualizarlos de manera reducida y clara.
El primer paso en este proceso es encontrar una medida que determine la longitud de la distribución. A dicha
medida se le llama rango de la distribución, y se obtiene restando el dato mayor del dato menor.
Rango = DM - Dm
Una vez obtenida esta longitud, se determina el número de intervalos que se van a utilizar; este criterio puede
ser definido por la persona que realiza el estudio, de acuerdo con la naturaleza de los datos. Sin embargo, una
buena aproximación a este número se hace calculando la raíz cuadrada del número de datos en la muestra.
No. de intervalos = √
El número de intervalos calculado debe ser un número entero; en caso de no serlo, se utiliza una aproximación.
Para definir el tamaño de cada intervalo, basta con dividir el rango obtenido entre el número aproximado de
intervalos
Los intervalos se construyen de acuerdo con los datos recogidos, es decir, si la información obtenida contiene
una cifra decimal, los límites de los intervalos también deben tenerla. Después de definir los anteriores valores,
se construye una tabla de frecuencias.
3 de 7
En esa tabla se ubican los intervalos y el número de datos contenidos en cada uno
de ellos. Es importante garantizar que cada dato se incluye en un solo intervalo.
Por ejemplo, el presidente de la junta de acción comunal del barrio debe presentar
un informe al consejo regional sobre la antigüedad, en meses de las familias en el
barrio. Los datos se muestran en la tabla 6.
Tabla 6
Si se quiere construir una distribución de frecuencias para la variable antigüedad en el barrio, se tiene que:
rango = 52 - 16 = 36
Al determinar el número de intervalos se sugiere aproximar al menor entero que se obtiene después de calcular
la raíz. Así,
No. de intervalos = √ = 7,41 ≈ 7
Por lo tanto,
Tamaño del intervalo = = 5,14 ≈ 5
Para construir el primer intervalo se utiliza el dato menor; este valor es el límite inferior del intervalo. El límite
superior se halla sumando al límite inferior el tamaño del intervalo.
El límite inferior del segundo intervalo es una unidad mayor que el límite superior del primer intervalo, y el
límite superior se obtiene sumando, como en el primer caso, la longitud del intervalo al límite inferior.
Siguiendo este proceso se generan todos los intervalos de la tabla de frecuencias, tal y como se muestra en la
tabla 7.
Una vez se han construido los intervalos de la tabla se deben construir las
frecuencias teniendo en cuenta que:
La frecuencia relativa acumulada Fr. es el cociente entre la frecuencia acumula da y el tamaño de la muestra.
Fr =
4 de 7
Las marcas de clase mi son los puntos medios de cada intervalo. Estas se utilizan para construir la gráfica del
polígono de frecuencias. Así, en el ejemplo, la tabla de frecuencias es:
El histograma es el gráfico de barras de la variable. Para el ejemplo de la variable antigüedad de los habitantes
del barrio, el histograma es
A partir del histograma se observa que la mayoría de los habitantes lleva viviendo
en el barrio entre 22 y 33 meses. Además, existe un bajo porcentaje de personas
que llevan más que ese periodo viviendo en el barrio. También se puede concluir
que no hay personas nuevas allí, pues los habitantes más recientes llevan viviendo
allí 16 meses.
A partir del polígono se puede ver que del tercer intervalo en adelante se presenta un decrecimiento en la
antigüedad de los habitantes del barrio, mientras que la variación del primero al segundo intervalo es de
crecimiento. El polígono de frecuencias se interpreta en la mayoría de ocasiones en términos de las pendientes
de las rectas que unen cada una de las marcas de clase. La ojiva de una variable corresponde al polígono de
frecuencias acumuladas. La ojiva para la variable antigüedad se muestra en la figura 9.
El profesor de matemáticas desea mostrar que el nivel de los estudiantes para resolver problemas es bajo. Para
ello decidió proponer una prueba de diagnóstico a sus 40 alumnos. La prueba se calificó con puntajes de O a
100. Los resultados son los que se muestran en la tabla:
5. Construir el histograma de frecuencias para cada una de las dos tablas anteriores.
6 de 7
6. Construir el polígono de frecuencias de las dos tablas. Usar el mismo plano.
8. Si el profesor debe mostrar los resultados al comité académico del colegio, ¿con cuál de las dos tablas debe
hacerlo? Justificar la respuesta.
9. Construir las ojivas de las dos tablas. Elaborar algunas conclusiones de los gráficos.
La valoración se hará de la siguiente manera: cada uno de los anteriores puntos tienen un valor de 0,55; si
todos son correctos el total es 5,0.
Nota: Sé que todos los estudiantes no tiene la posibilidad de un computador en su casa y ante la contingencia
que estamos viviendo NO salga de su casa; por esta razón desarrolle la actividad en el cuaderno de estadística y
tómele fotos y envíelas al correo sebastianjfkarbelaez@gmail.com, si usted no tiene la facilidad o acceso a
internet por whatsapp envíela a un compañero que le haga el favor sirviéndole de puente.
7 de 7