You are on page 1of 6

UN PASEO POR LA ESTADÍSTICA DESCRIPTIVA

Este material es complemento de los trabajos prácticos propuestos para la asignatura Estadística
Aplicada de la extensión áulica Partido de la Costa. Fue preparado por Prof. Alicia López en junio de
2008.

A un grupo de 1060 estudiantes en reposo se le midió la cantidad de pulsaciones por


minuto en estado de reposo. Estas observaciones se presentan en la Ilustración 1:

Ilustración 1: Observaciones de las pulsaciones por minuto de 1060 estudiantes en reposo


48 48 50 51 51 51 52 52 52 53 53 53 54 54 54 55 56 56 56 56
56 57 57 57 57 57 58 58 58 58 58 59 59 59 59 59 59 60 60 60
60 60 60 60 60 60 60 60 60 60 60 60 60 61 61 61 61 61 61 61
61 61 61 61 61 61 61 61 61 62 62 62 62 62 62 62 62 62 62 62
62 62 62 62 62 63 63 63 63 63 63 63 63 63 63 63 63 63 63 63
63 63 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64 64
64 64 65 65 65 65 65 65 65 65 65 65 65 65 65 65 65 65 65 65
65 65 66 66 66 66 66 66 66 66 66 66 66 66 66 66 66 66 66 66
66 66 67 67 67 67 67 67 67 67 67 67 68 68 68 68 68 68 68 68
68 68 68 68 68 68 68 68 68 68 68 68 68 68 68 68 68 68 68 68
68 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69 69
69 69 69 69 69 69 69 69 69 69 69 70 70 70 70 70 70 70 70 70
70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70
70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70 70
71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71 71
72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 72
72 72 72 72 72 72 72 72 72 72 72 72 72 72 72 73 73 73 73 73
73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73 73
73 73 73 73 73 73 73 73 73 73 74 74 74 74 74 74 74 74 74 74
74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74
74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74
74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74 74
74 74 74 74 74 75 75 75 75 75 75 75 75 75 75 75 75 75 75 75
75 75 75 75 75 76 76 76 76 76 76 76 76 76 76 76 76 76 76 76
76 76 76 76 76 76 76 76 76 76 76 76 76 76 76 77 77 77 77 77
77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77
77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77
77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77 77
77 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
78 78 78 78 78 78 78 78 78 78 78 79 79 79 79 79 79 79 79 79
79 79 79 79 79 79 79 79 79 79 79 80 80 80 80 80 80 80 80 80
80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80
80 80 80 80 80 80 81 81 81 81 81 81 81 81 81 81 81 81 81 81
81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81 81
81 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82
82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82
82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82
82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 82 83 83 83 83
83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 83 84 84 84 84
84 84 84 84 84 84 84 84 84 84 85 85 85 85 85 85 85 85 85 85
85 85 85 85 85 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86
86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86
86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 86 87
87 87 87 87 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88 88
88 88 89 89 89 89 89 89 89 89 89 89 89 89 89 89 90 90 90 90
90 90 90 90 90 90 90 90 91 91 91 91 91 91 91 91 91 91 91 91
91 91 91 91 91 91 91 91 92 92 92 92 92 92 92 92 92 92 92 92
92 92 92 92 92 92 92 92 92 92 93 93 93 93 93 93 93 93 93 93
93 93 93 93 93 93 93 93 94 94 94 94 94 94 94 94 94 94 94 94
94 94 94 94 94 94 95 95 96 96 97 97 98 98 98 98 98 98 99 99
99 99 99 99 100 100 100 100 101 101 101 101 102 102 102 102 104 107 107 110

Tantos datos pueden darnos información valiosa para tomar decisiones. Antes que
nada, les recomendamos explorar los datos, haciéndose preguntas…

ACTIVIDAD 1:
Elaboren una lista de por lo menos diez preguntas que te surjan de mirar los datos.
En esta actividad no se pide realizar cálculo alguno, ni que puedas responder a las
preguntas. Es importante que te detengas en esta actividad antes de seguir adelan-
te.

Es muy posible que algunas preguntas hayan tenido que ver con las veces con que
se repite alguna observación, esto es, la frecuencia. ¿Cuál es la observación de pul-
sación por minuto más frecuente? ¿Cuál será el número más alto del conjunto de
datos? ¿Y el menor? ¿Cómo se distribuyen las frecuencias si las ordenamos de me-
nor a mayor? ¿Obtendremos el mismo tipo de información si consideramos los datos
uno por uno o si los agrupamos? ¿Influye el modo en que los agrupamos?

ACTIVIDAD 2:
¿Qué representación consideras más adecuada para mostrar la distribución de fre-
cuencias, una tabla o un gráfico? Analiza las distintas posibilidades y justifica tu res-
puesta.

No siempre es sencillo contar, clasificar y mostrar los datos mientras los exploramos.
Se espera que en esta etapa nos encontremos lo más libre de prejuicios posibles.
Un modo simple de contar y clasificar datos numéricos es el diagrama de tallo – hoja

ACTIVIDAD 3:
Prepara un diagrama tallo – hoja con los datos de la Ilustración 1 para establecer las
frecuencias de aparición de cada observación. Prepara un diagrama de barras que
muestre la distribución de frecuencias

No olviden que las herramientas se diseñan para ayudar en el trabajo, no para com-
plicarlo. En la Actividad 3 ¿encontraron algún obstáculo para aplicar la técnica?
¿Qué estrategia se les ocurre aplicar para sortearlo?
Con tantos datos disponibles, casi como que surge la necesidad de agruparlos para
tener una idea más acabada de lo que ellos “tratan de decirnos”. Esto es, agruparlos
en intervalos. La decisión de cómo construir los intervalos es subjetiva y forzarán la
información producida. Realicen la siguiente actividad para explorar algunas posibili-
dades.

ACTIVIDAD 4:
Agrupa los datos de la Ilustración 1 en
 Diecisiete intervalos regulares, semiabiertos a izquierda
 Diecisiete intervalos regulares, semiabiertos a derecha
 Dieciséis intervalos regulares
 Once intervalos distribuidos de esta forma: tres intervalos de amplitud 8, cinco
intervalos de amplitud 4, tres intervalos de amplitud 8
 Siete intervalos regulares

Las actividades anteriores nos han dado una idea de cómo se distribuyen los datos
de la población que estamos estudiando. Algunas de las preguntas que nos hicimos
en la actividad 2 conducían a respuestas que ubicaban un número en ese conjunto.

Entre las medidas de posición se destacan los promedios. Estamos acostumbrados


a pensar en EL promedio. Pero en un conjunto de datos podemos encontrar distintos
elementos que están “por el medio”: media aritmética, mediana, moda.

La media aritmética (el consabido “promedio”) es la relación entre la suma de los


valores del conjunto de datos y la cantidad de elementos de ese conjunto. En el caso
de nuestras 1060 observaciones, la media aritmética será
n

∑X
i =1
i
81521
X= ↔X= = 76,90
n 1060

La mediana es el valor que divide en dos mitades el conjunto ordenado de observa-


ciones. Esto es, a ambos lados de la mediana tengo la misma cantidad de observa-
ciones. En nuestro caso, la mediana es el valor que ocupa el lugar 530, esto es 77.
La moda es el valor que con mayor frecuencia aparece en el conjunto de datos. En
nuestro caso es 74. El que estos valores estén relativamente muy próximos nos dan
una idea acerca de cómo se posicionan respecto de un “centro” o “eje”. Nos permite
aventurar si existe algún tipo de simetría, etc.

¿Qué sucede si en vez de tomar valores individuales tomamos valores agrupados?


¿Habrá variación entre los promedios considerados individualmente y los promedios
considerados en intervalos? Al agrupar en intervalos ganamos en claridad, pero ine-
vitablemente sacrificamos información. Veamos qué sucede al considerar los 17 in-
tervalos regulares, en sus dos casos de intervalos semiabiertos:

17 intervalos regulares semiabiertos 11 intervalos irregulares semiabiertos


a izquierda a derecha a izquierda a derecha
Media 62 62 96 96
Mediana 60 49 101 103
Observa las gráficas de los cinco casos ¿Te animás a dar una explicación? Escríbe
brevemente un informe con tus conclusiones, recomendando la alternativa más ade-
cuada para describir esta situación.

Ilustración 2: Distribución de las observaciones consideradas individualmente

80
70
60
Observaciones

50
40
30
20
10
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
Pulsaciones por minuto

Ilustración 3: Observaciones agrupadas en 17 intervalos semiabiertos a izquierda

200
180
160
Observaciones

140
120
100
80
60
40
20
0
47-51
51-55
55-59
59-63
63-67
67-71
71-75
75-79
79-83
83-87
87-91
91-95
95-99
99-103
103-107
107-111
111-115

Pulsaciones por minuto

Ilustración 4: Observaciones agrupadas en 17 intervalos semiabiertos a derecha

200
180
160
Observaciones

140
120
100
80
60
40
20
0
47-51
51-55
55-59
59-63
63-67
67-71
71-75
75-79
79-83
83-87
87-91
91-95
95-99
99-103
103-107
107-111
111-115

Pulsaciones por minuto


Ilustración 5: Distribución de observaciones agrupadas en 11 intervalos semiabiertos a iz-
quierda

250
Observaciones
200

150

100

50

0
41-49 49-57 57-65 65-70 70-75 75-80 80-85 85-90 90-98 98- 106-
106 114
Pulsaciones por minuto

Ilustración 6: Distribución de observaciones agrupadas en 11 intervalos semiabiertos a dere-


cha

250

200
Observaciones

150

100

50

0
41-49 49-57 57-65 65-70 70-75 75-80 80-85 85-90 90-98 98- 106-
106 114
Pulsaciones por minuto

Ilustración 7: Tabla de frecuencias de las 1060 observaciones


Pulsac. x minuto Frec. Frec. acum Pulsac. x minuto Frec. Frec. acum.
48 2 2 78 70 631
50 1 3 79 20 651
51 3 6 80 35 686
52 3 9 81 35 721
53 3 12 82 75 796
54 3 15 83 20 816
55 1 16 84 14 830
56 5 21 85 15 845
57 5 26 86 54 899
58 5 31 87 5 904
59 6 37 88 18 922
60 16 53 89 14 936
61 16 69 90 12 948
62 16 85 91 20 968
63 17 102 92 22 990
64 20 122 93 18 1008
65 20 142 94 18 1026
66 20 162 95 2 1028
67 10 172 96 2 1030
68 29 201 97 2 1032
69 30 231 98 6 1038
70 49 280 99 6 1044
71 20 300 100 4 1048
72 35 335 101 4 1052
73 35 370 102 4 1056
74 75 445 104 1 1057
75 20 465 107 2 1059
76 30 495 110 1 1060
77 66 561

Ilustración 8: 17 intervalos regulares semiabiertos (amplitud 4)


Semiabierto a izquierda Semiabierto a derecha
Intervalo Frec. Intervalo Frec.
47-51 6 47-51 3
51-55 10 51-55 12
55-59 21 55-59 16
59-63 65 59-63 54
63-67 70 63-67 77
67-71 128 67-71 118
71-75 165 71-75 165
75-79 186 75-79 186
79-83 165 79-83 165
83-87 88 83-87 103
87-91 64 87-91 49
91-95 60 91-95 48
95-99 16 95-99 12
99-103 12 99-103 14
103-107 3 103-107 5
107-111 1 107-111 3

Ilustración 9: 11 intervalos irregulares semiabiertos


semiabierto a izquierda semiabierto a derecha
41-49 2 41-49 2
49-57 24 49-57 19
57-65 116 57-65 101
65-70 138 65-70 109
70-75 185 70-75 214
75-80 221 75-80 206
80-85 159 80-85 179
85-90 103 85-90 106
90-98 90 90-98 96
98-106 19 98-106 24
106-114 3 106-114 3