Sie sind auf Seite 1von 7

Lic.

Manuel Morales Martnez

DEPARTAMENTO DE CIENCIAS BSICAS ESTADSTICA


UNIDAD II: ORGANIZACIN DE DATOS
DISTRIBUCIN DE FRECUENCIAS
Es un agrupamiento de datos en categoras mutuamente excluyentes dando el nmero de
observaciones de cada categora. El objetivo es agrupar los datos en una tabla que muestre
las clases (categoras) y el nmero de observaciones en cada una.
CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS.
1.- Debemos calcular el nmero de Intervalos de Clases (categoras) el cual depende del
nmero de observaciones n.
k 1 (3.322 log n)
k n
Es conveniente que se construyan entre 5 y 20 intervalos de clases. Si el nmero es muy
pequeo se puede ocultar informacin, si es muy grande se corre el riesgo de construir
algunos intervalos que estn vacos, es decir que no tengan ningn dato.
2.- Para calcular la longitud de cada intervalo se tiene como regla general: divdase la
diferencia de la mayor de las observaciones y la menor entre el nmero de intervalos que se
Mayor menor
w
k
van a construir.
3.- Fije los lmites de clases. Determine los lmites de clase de manera que pueda colocar
cada observacin nicamente en una clase. Se debe estar seguro que el primer intervalo
incluya la mnima de las observaciones y l ltimo contenga la mayor de las observaciones.
Ejemplo: Los datos siguientes representan las razones de costo beneficio para 25 distintos
tipos de acciones en el mercado de valores.
20.5
16.9
8.8

19.5
7.8
22.1

15.6
23.3
20.8

24.1
11.8
12.6

9.9
18.4
15.9

k 1 3.322 log 25 5.644 6

CLASE
1
2
3
4
5
6

INTERVALO
5.3 9.2
9.3 13.2
13.3 17.2
17.3 21.2
21.3 25.2
25.3 29.2

FREC. ABS.
3
5
8
5
3
1

15.4
13.4
w

12.7
14.3

5.4
19.2

17.0
9.2

28.6
16.8

28.6 5.4
3.8667 3.9
6

ABS. ACUM.
3
8
16
21
24
25

FREC. REL.
3/25
5/25
8/25
5/25
3/25
1/25

REL. ACUM.
3/25
8/25
16/25
21/25
24/25
25/25

A partir de esta informacin podemos concluir que, aunque es importante describir el


conjunto de n = 25 observaciones, es comn que se tenga ms inters en la poblacin de la
cual se tom la muestra. Se puede pensar que las 25 razones de costo beneficio
1

Lic. Manuel Morales Martnez

representan una muestra representativa de todas las tasas de costo beneficio de todas las
acciones en el mercado de valores.
GRAFICOS ESTADSTICOS
1.- DIAGRAMA DE TALLO Y HOJAS.
Es otra forma de agrupar una serie de datos consiste en utilizar una tcnica muy sencilla la
cual consiste en: cada valor numrico se divide en dos partes, el o los dgitos principales
forman el tallo y los dgitos secundarios forman las hojas. Los tallos estn colocados a lo
largo del eje vertical, y las hojas de cada tallo a lo largo del eje horizontal.
Ejemplo: En el cuadro siguiente se muestra el nmero de anuncios radiofnicos de 30
segundos pagados el ao pasado por cada uno de los 45 miembros de la Asociacin de
Vendedores de Vehculos Usados. Organice los datos en un diagrama de tallo y hojas y
responda a las siguientes preguntas:
a) Alrededor de qu valores se concentra el mayor nmero de anuncios?
b) Cul es el menor nmero de anuncios pagados por un comerciante?
c) Cul es el mayor nmero de anuncios pagados por un comerciante?
96
156
117
119
138

93
139
120
97

SOLUCIN:
Tallo Hojas
8
8 9
9
6 3 5
10
8 7 3
11
7 3 2
12
7 5 7
13
9 5 2
14
8 2 3
15
6 5 5

88
142
112
89

6
4
7
0
9

4
6
2
5
4

117
94
135
118

4
3
1
5
6

7
9 8 3
0 4
8

127
107
132
136

95
125
111
125

113
155
125
143

Ordenando estos
datos podemos
observar que se tiene
mucha informacin
a partir del mismo,
incluyendo la
respuesta a las
preguntas
planteadas al inicio.

96
155
104
120

2
9
15
(9)
21
13
6
3

108
103
106
103

Tallo
8
9
10
11
12
13
14
15

94
112
139
113

Hojas
8 9
3 4 4
3 3 4
1 2 2
0 0 4
2 4 5
2 3 8
5 5 6

148
127
134
124

5
6
3
5
6

6
7
3
5
8

6
8
7
5
9

7
7 8 9
7 7
9

La informacin que se ha agregado ala izquierda del diagrama significa lo siguiente: el 2, 9


y 15 representa el nmero de datos que hay en cada uno de los tallos; el (9) indica el
nmero de datos que hay en el tallo 11 pero adems indica donde se encontrar el valor
promedio de los datos; el 21 indica el nmero de datos que hay desde el tallo 12 hasta el
ltimo tallo, el 13 indica que quedan 13 observaciones por agrupar y as sucesivamente.
Respondiendo a las preguntas:
a) El mayor nmero de anuncios se concentra entre los 111 y los 119 anuncios es 9.
b) El menor nmero de anuncios pagados por un miembro de la asociacin es 89.
c) El mayor nmero de anuncios pagados por un miembro de la asociacin es 156.

Lic. Manuel Morales Martnez

Una forma de presentar los datos consiste en crear un grfico que describa visualmente el
comportamiento que tiene un conjunto de datos de una muestra representativa de una
poblacin particular en un momento dado. A continuacin se presentan algunos de los ms
importantes grficos estadsticos ms usados.
1.- HISTOGRAMA:
Es un grfico en el que los intervalos de clases se representan en el eje horizontal y las
frecuencias absolutas o relativas porcentuales se representan en el eje vertical. Las
frecuencias se representan por las alturas de las barras, y las barras se trazan adyacentes una
de otra. Este tipo de grfico se usa para representar variables cuantitativas discretas o
continuas.

Distribucin de precios de 80 vehculos vendidos por "Grupo Q"


25
20
Frecuencias

15
10
5
0
Precios

2.- POLGONO DE FRECUENCIA:


Un polgono de frecuencia es semejante a un histograma. Consiste en segmentos de lnea
que conectan los puntos formados por la interseccin del punto medio de cada clase (Marca
de Clase) y la frecuencia de clase. La escala en el eje x corresponde a los puntos medios
de cada clase y la escala en el eje y corresponde a las frecuencias de clases (absolutas o

Lic. Manuel Morales Martnez

relativas porcentuales). El histograma y el polgono de frecuentas nos permite obtener una


visin rpida de las principales caractersticas de los datos.

Distribucin de precios de 80 vehculos vendidos por "Grupo Q"


25
20
Frecuencias

15
10
5
0
Precios

3.- POLGONO DE FRECUENCIA ACUMULADA (OJIVA):


Es un grfico de los lmites reales superiores sobre las frecuencias acumuladas ya sea en
absoluto o en porcentaje, se usan para comparar dos o ms variables.

Distribucin de preciso de 80 vehculos vendidos por "Grupo Q"


100
80
60
Frecuencias Acumuladas

40
20
0
1

Precios

Lic. Manuel Morales Martnez

4.- GRFICA DE BARRAS:


Pueden usarse para describir cualquiera de los niveles de medicin (nominal, ordinal, de
intervalo o de razn).

Porcentaje de aumento en algunas ocupaciones de 1988 al 2000


Supervisores
Profesores (Secundaria)
Enfermeras Tituladas
Analista de Cmputo
Agentes de Viajes
Asistentes Mdicos
0

10

20

30

Porcentajes

40

50

60

70

80

Lic. Manuel Morales Martnez

5.- BARRAS AGRUPADAS:


Se usan para mostrar la asociacin o relacin entre dos o ms variables las que pueden ser
cualitativas o cuantitativas discretas.

Porcentaje de viviendas segn Tipo y Condicin de Ocupacin


60
50
40
Porcentajes 30 URBANA

RURAL

20
10
0
HABITADA

DESHABITADA

Condicin de Ocupacin

IGNORADA

Lic. Manuel Morales Martnez

6.- GRAFICA DE SECTOR O PASTEL:


Es especialmente til para describir datos del nivel nominal. Se deben calcular los grados
que corresponden a cada una de las frecuencias y reflejar las frecuencias relativas
porcentuales en cada uno de los sectores.

Gastos hechos por la Lotera Nacional segn dependencias pblicas

9%2%
EDUCACION

10%

SALUD

MUNICIPIOS

JUBILADOS

56%
23%

OTROS