Sie sind auf Seite 1von 7

Institución Educativa Departamental John F.

Kennedy de Arbeláez

Taller 4: Cuarta semana Título: Manejo de variables cuantitativas

Taller para los grados 1001, 1002 y 1004

Objetivo: Caracterizar variables cuantitativas para datos agrupados a partir de tablas de frecuencias,
construcción del histograma de frecuencias, polígono de frecuencias y ojiva para describir la variable.

Lea el siguiente texto y este muy atento a los ejemplos.

Caracterizar variables cuantitativas

La caracterización de variables cuantitativas debe realizarse teniendo en cuenta dos grandes criterios: datos
agrupados y datos no agrupados.

Datos agrupados

La agrupación de datos corresponde a la elaboración de tablas de frecuencias mediante las que se resumen los
datos en algunos rangos, sobre los cuales se hace un conteo.

Una vez se han recogido los datos de una muestra o población, es necesario familiarizarse con ellos antes de
elaborar la tabla, explorando una representación visual y tratando de buscar patrones de comportamiento de la
variable.

Para la construcción gráfica de un conjunto de datos existen varias opciones; sin embargo, la más aceptada por
su aplicación es el diagrama de tallo y hojas.

Diagrama de tallo y hojas

La técnica del diagrama de tallo y hojas consiste en dividir los valores numéricos correspondientes a una
determinada variable estadística, en una parte llamada tallo, que será el primer o primeros dígitos desde la
izquierda, y otra parte llamada hojas, que estará formada por los dígitos restantes. Por ejemplo, los siguientes
datos corresponden a las edades, en años, de 30 actores postulados a protagonizar la siguiente película nacional.

21 30 11 27 23 28 36 37 21 39
13 22 45 21 19 37 14 31 21 34
19 37 40 20 24 28 27 21 37 39
Se observa que todas las edades de los artistas están en las decenas: 10, 20, 30, 40. Como tallo se utilizará el
primer dígito de cada puntaje y como hoja el segundo dígito. Normalmente, la representación se realiza en
posición vertical; para esto se traza una recta vertical y se escriben los tallos a la izquierda de la recta (Figura
4).

1 de 7
A continuación, se coloca cada hoja en su correspondiente tallo; esto se hace escribiendo el último dígito a la
derecha de la recta vertical, en frente de su dígito principal correspondiente. Por ejemplo, para el valor 21, el
tallo es 2 y la hoja 1 (Figura 5).

Para el otro dato, 27, el tallo 2 ya se ubicó, luego, lo único que se debe hacer es ubicar la hoja (figura 6).

Este proceso se realiza para todos los datos, obteniéndose el siguiente diagrama:

Al observar el diagrama se puede concluir que las edades de la mayoría de los actores están centradas alrededor
de los 20 y los 30 años. Es importante aclarar que el tallo puede estar constituido por varios dígitos, mientras
que las hojas deben ser representadas por un único dígito. Por ejemplo, si un dato tiene tres cifras, el tallo serán
las decenas y las unidades las hojas. Si los datos tienen una cifra decimal, esta será la hoja y las unidades el
tallo. Por otro lado, es importante cuando los datos están muy alejados entre sí, el diagrama de tallos no es una
buena representación gráfica de ellos. El diagrama de tallo y hojas puede ser usado también como un principio
de comparación entre dos grupos o muestras distintas.

Ejemplo: El rector de dos colegios decide comparar el número de estudiantes que llegan tarde en cada colegio.
Pide a sus respectivos coordinadores que midan los retardos en los últimos días. Los resultados se muestran en
la tabla 5.

Elaborar un diagrama de tallo y hojas para los datos de los dos colegios.

Solución
2 de 7
Un diagrama de tallo y hojas para los dos colegios puede elaborarse en dos columnas, utilizando los mismos
tallos. Para esto, se debe tener en cuenta el número de retardos en cada colegio, ubicándolos a la derecha e
izquierda de los tallos. Así,

A partir del diagrama se observa que a pesar de que el coordinador del colegio 1 consideró más días que el del
colegio 2, el número de estudiantes que llegan tarde al colegio 1 es menor que el del número 2, ya que en el
primero la mayoría de los datos están centrados entre los 20 y los 40 estudiantes, mientras que para el segundo
los datos están centrados entre 40 y 50 estudiantes. Cuando la variable que se está considerando se mide con
respecto al tiempo, el gráfico que ilustra el comportamiento puede construirse con base en este.

Ahora se puede construir una tabla de frecuencias para los datos agrupados, de la siguiente manera:

Tablas de frecuencias(o distribuciones de frecuencias)

Una distribución de frecuencias es un resumen de una lista de datos. Puede considerarse un criterio de
agrupación de los datos que permite visualizarlos de manera reducida y clara.

Construcción de una distribución de frecuencias

El primer paso en este proceso es encontrar una medida que determine la longitud de la distribución. A dicha
medida se le llama rango de la distribución, y se obtiene restando el dato mayor del dato menor.

Rango = DM - Dm

Una vez obtenida esta longitud, se determina el número de intervalos que se van a utilizar; este criterio puede
ser definido por la persona que realiza el estudio, de acuerdo con la naturaleza de los datos. Sin embargo, una
buena aproximación a este número se hace calculando la raíz cuadrada del número de datos en la muestra.

No. de intervalos = √

El número de intervalos calculado debe ser un número entero; en caso de no serlo, se utiliza una aproximación.
Para definir el tamaño de cada intervalo, basta con dividir el rango obtenido entre el número aproximado de
intervalos

Tamaño del intervalo =

Los intervalos se construyen de acuerdo con los datos recogidos, es decir, si la información obtenida contiene
una cifra decimal, los límites de los intervalos también deben tenerla. Después de definir los anteriores valores,
se construye una tabla de frecuencias.

3 de 7
En esa tabla se ubican los intervalos y el número de datos contenidos en cada uno
de ellos. Es importante garantizar que cada dato se incluye en un solo intervalo.
Por ejemplo, el presidente de la junta de acción comunal del barrio debe presentar
un informe al consejo regional sobre la antigüedad, en meses de las familias en el
barrio. Los datos se muestran en la tabla 6.

Tabla 6

Si se quiere construir una distribución de frecuencias para la variable antigüedad en el barrio, se tiene que:
rango = 52 - 16 = 36

Al determinar el número de intervalos se sugiere aproximar al menor entero que se obtiene después de calcular
la raíz. Así,
No. de intervalos = √ = 7,41 ≈ 7
Por lo tanto,
Tamaño del intervalo = = 5,14 ≈ 5

Para construir el primer intervalo se utiliza el dato menor; este valor es el límite inferior del intervalo. El límite
superior se halla sumando al límite inferior el tamaño del intervalo.

El límite inferior del segundo intervalo es una unidad mayor que el límite superior del primer intervalo, y el
límite superior se obtiene sumando, como en el primer caso, la longitud del intervalo al límite inferior.
Siguiendo este proceso se generan todos los intervalos de la tabla de frecuencias, tal y como se muestra en la
tabla 7.

Una vez se han construido los intervalos de la tabla se deben construir las
frecuencias teniendo en cuenta que:

La frecuencia f de un intervalo es la cantidad de datos que están contenidos en


el rango determinado por los límites.

La frecuencia relativa fr es el cociente entre la frecuencia y el tamaño de la


muestra fr. =

La frecuencia relativa se considera importante para la interpretación y


presentación de los datos, ya que proporciona un dato comparado con el total de
la muestra o de la población, y no solamente el número de observaciones de un intervalo.

La frecuencia acumulada F de un intervalo es la sumatoria de frecuencias de los intervalos anteriores,


incluyendo su frecuencia.

La frecuencia relativa acumulada Fr. es el cociente entre la frecuencia acumula da y el tamaño de la muestra.
Fr =

4 de 7
Las marcas de clase mi son los puntos medios de cada intervalo. Estas se utilizan para construir la gráfica del
polígono de frecuencias. Así, en el ejemplo, la tabla de frecuencias es:

Las frecuencias relativa y relativa acumulada se pueden considerar como la


proporción de datos que se encuentran en cada intervalo. Si la frecuencia
relativa se multiplica por 100 se obtiene el porcentaje de datos ubicados en
cada intervalo.
De la tabla, se puede concluir que la mayoría de los habitantes del barrio
tienen entre 22 y 27 meses de vivir allí. El 89% de los habitantes del barrio
lo habitan desde hace 39 meses o menos. Solamente el 1,8% de los
habitantes viven allí desde hace más de 52 meses,

Histogramas y polígonos de frecuencias


Además de presentar un resumen de los datos obtenidos, en algunas ocasiones es importante producir un
gráfico que permita describir el comportamiento de la variable. Para tal fin se utilizan dos tipos de gráficos, el
histograma de frecuencias y el polígono de frecuencias.

El histograma es el gráfico de barras de la variable. Para el ejemplo de la variable antigüedad de los habitantes
del barrio, el histograma es

A partir del histograma se observa que la mayoría de los habitantes lleva viviendo
en el barrio entre 22 y 33 meses. Además, existe un bajo porcentaje de personas
que llevan más que ese periodo viviendo en el barrio. También se puede concluir
que no hay personas nuevas allí, pues los habitantes más recientes llevan viviendo
allí 16 meses.

El histograma de frecuencias acumuladas se construye usando los intervalos en el


eje horizontal y las frecuencias acumuladas en el eje vertical. El histograma de
frecuencias se muestra en la figura 8.

El polígono de frecuencias es una representación lineal del histograma en la cual


se describe el comportamiento de la variable entre los intervalos. Para construir un
polígono de frecuencias, se ubica en el eje horizontal la marca de clase de cada
5 de 7
intervalo. Luego, en el eje vertical se ubican las frecuencias obtenidas en la tabla. A fin de que la gráfica
corresponda a un polígono, es necesario construir una clase, o intervalo, anterior a la primera y una posterior a
la última, a las cuales se les asignará una frecuencia de cero. Así, el polígono de frecuencias para la variable
antigüedad es:

A partir del polígono se puede ver que del tercer intervalo en adelante se presenta un decrecimiento en la
antigüedad de los habitantes del barrio, mientras que la variación del primero al segundo intervalo es de
crecimiento. El polígono de frecuencias se interpreta en la mayoría de ocasiones en términos de las pendientes
de las rectas que unen cada una de las marcas de clase. La ojiva de una variable corresponde al polígono de
frecuencias acumuladas. La ojiva para la variable antigüedad se muestra en la figura 9.

Actividad: Desarrolle los puntos dados de acuerdo con la información brinda.

El profesor de matemáticas desea mostrar que el nivel de los estudiantes para resolver problemas es bajo. Para
ello decidió proponer una prueba de diagnóstico a sus 40 alumnos. La prueba se calificó con puntajes de O a
100. Los resultados son los que se muestran en la tabla:

1. Construir el diagrama de tallo y hojas de los puntajes obtenidos por los 40


estudiantes en la. Prueba, elaborar algunas conclusiones del diagrama.

2. Si se considera que la prueba se pasa con 50 puntos o más, ¿qué porcentaje de


estudiantes aprobaron? Usar el diagrama de tallo y hojas.

3. Construir una distribución de frecuencias usando los intervalos 0 a 9 puntos, 10 a 19


puntos, 20 a 29 puntos y así sucesivamente hasta el intervalo de 90 a 99 puntos.
Elaborar algunas conclusiones de la tabla.

4. Construir una distribución de frecuencias para ello calcule el rango, el número de


intervalos y el ancho del intervalo. Elaborar algunas conclusiones de la tabla.

5. Construir el histograma de frecuencias para cada una de las dos tablas anteriores.

6 de 7
6. Construir el polígono de frecuencias de las dos tablas. Usar el mismo plano.

7. Con base en el gráfico de los dos polígonos, establecer algunas diferencias.

8. Si el profesor debe mostrar los resultados al comité académico del colegio, ¿con cuál de las dos tablas debe
hacerlo? Justificar la respuesta.

9. Construir las ojivas de las dos tablas. Elaborar algunas conclusiones de los gráficos.

La valoración se hará de la siguiente manera: cada uno de los anteriores puntos tienen un valor de 0,55; si
todos son correctos el total es 5,0.

Nota: Sé que todos los estudiantes no tiene la posibilidad de un computador en su casa y ante la contingencia
que estamos viviendo NO salga de su casa; por esta razón desarrolle la actividad en el cuaderno de estadística y
tómele fotos y envíelas al correo sebastianjfkarbelaez@gmail.com, si usted no tiene la facilidad o acceso a
internet por whatsapp envíela a un compañero que le haga el favor sirviéndole de puente.

7 de 7

Das könnte Ihnen auch gefallen