Beruflich Dokumente
Kultur Dokumente
kn
Frecuencias
absolutas n i
n1
n2
.
.
xk
nk
k
Total
Frecuencias
relativas h i
h1
h2
.
.
n
i 1
Frecuencias
porcentajes p i
p1
p2
.
.
hk
k
h
i 1
pk
1
p
i 1
100
Ejemplo Supngase que ante la pregunta del nmero de hijos por familia
(variable X) una muestra de 20 hogares, marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores
distintos 0, 1, 2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La
distribucin de frecuencias de X se da en la tabla 2.6.
Frecuencias
Absolutas
ni
1
4
7
6
2
Frecuencias
Relativas
hi
0.05
0.20
0.35
0.30
0.10
Frecuencias
Porcentajes
hi (%)
5
20
35
30
10
Total
20
1.00
100
Fuente.- Datos obtenidos de los formularios de la encuesta.
Distribucin de frecuencias por intervalos.
La distribucin de frecuencia por intervalos o clases se usa cuando se han
hecho muchas observaciones y la variable estadstica (contina) toma muchos
valores distintos o cuando el nmero de valores distintos de una variable
discreta es grande, con lo que el campo de variabilidad es muy grande.
En este caso, trataremos de agrupar los valores de la variable en intervalos
adecuadamente elegidos para no perder mucha informacin.
Para esclarecer la construccin de la tabla de frecuencia para datos agrupados
en intervalos de clase, desarrollaremos un ejemplo.
Ejemplo
La siguiente informacin corresponde a las medidas de las alturas de 100
alumnos (dados en cm.) tomados en la oficina mdica de Bienestar
Universitario de la UNP, durante la ltima semana de setiembre de 2007.
151
173
167
180
170
189
176
161
176
168
185
172
181
178
166
179
169
159
175
178
161
168
182
171
164
177
175
156
169
154
174
167
181
172
170
163
177
168
187
170
173
166
180
170
160
169
176
168
184
171
165
168
179
169
158
175
167
165
182
171
163
177
168
161
152
174
167
181
170
161
162
176
168
186
172
166
166
180
169
159
175
168
168
183
171
165
178
169
169
155
174
167
181
170
170
163
177
168
188
173
K = ? , n = 100
R c K 5 8 40
155
160
165
170
175
180
185
190
Figura
Sin embargo una dificultad se presenta cuando algunos de los datos coincide
con cualquiera de los puntos de divisin: 150, 155, 160, 165, 170, 175, 180,
185 y 190.
5. Supongamos que un dato es 155 donde lo colocamos?- en el primer
intervalo cuyos extremos son 150 y 155?- (ver Fig. 2.1) en el segundo
intervalo que tiene por extremos 155 y 160?Para aclarar est ambigedad adoptamos, el intervalo abierto por la izquierda
que no incluye al valor 150 (lmite inferior del intervalo) y cerrado por la derecha
que incluye al valor 155 (lmite superior del intervalo). Este tipo de intervalo se
representa matemticamente por:
inferior del intervalo y
Yi
( Yi1 Yi
, donde
Yi1
representa el lmite
( 150 155
- (170
180]
(180
185]
- (185 - 190]
Nota.- Tambin existen otros dos tipos de intervalos de clases, definidas como:
( Yi1 Yi )
Intervalo abierto. Los lmites son abiertos e indican que la clase
contiene valores superiores al lmite inferior y valores inferiores al lmite
superior.
[ Yi1 Yi )
Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda
(incluye al lmite inferior del intervalo) y abierto por la derecha (no incluye al
lmite superior del intervalo).
Yi1
intervalo.
6. Es conveniente que todos y cada uno de los datos que se hallen dentro de
un mismo intervalo, estn representados por un mismo valor. Este valor
caracteriza a la clase y por eso se llama marca de clase, se obtiene
promediando los lmites de cada intervalo. Una formula para calcular la marca
de clase o punto medio de un intervalo es:
Y Yi
Yi i 1
2
7. A continuacin debemos realizar la clasificacin y conteo de los datos (ver
tabla 1.2), es decir, colocar cada uno de ellos dentro de su clase, todos
representados por un mismo signo: una tarja.
Intervalo de
clase
( Yi1 Yi
150
155
160
165
170
175
180
185
155
160
165
170
175
180
185
190
Tabla
Marca de
clase
Yi
Conteo
Frecuencia
ni
152.5
157.5
162.5
167.5
172.5
177.5
182.5
182.5
Marca de
clase
Yi
150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total
152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5
( Yi1 Yi
n 1 n 2 n k n i n
i 1
Propiedad.
N i n 1 n 2 n i n j
j1
Propiedad.
N i N i 1 n i
, de donde
n i N 1 N i 1
hi
ni
n
0 hi 1
i 1, 2, ..., k..
,
h 1 h 2 h k h i 1
i 1
Propiedad.
1.
N
Hi i
n
Propiedad.
n
j1
nj
n
j1
hj
j1
H i H i 1 h i
Interpretacin.
n2 = 5, significa que 5 alumnos tienen una estatura mayor de 155 cm. y menor o
igual a 160 cm.
N4 = 54, significa que 54 alumnos tienen una estatura mayor que 150 cm. y
menor o igual que 170 cm., o tambin significa que 54 alumnos tienen una
estatura menor o igual a que 170 cm.
h3 = 0.12, significa que el 12% de los alumnos tienen una estatura mayor de
160 cm. y menor o igual a 165 cm.
H6 = 0.87, significa que el 87% de los alumnos tienen una estatura mayor que
150 cm. y menor o igual que 180 cm., o tambin significa que 87% de los
alumnos tienen una estatura menor o igual a que 180 cm.
N6 - N2 = 87 - 9 = 78 alumnos tienen una estatura mayor que 160 cm. Y menor o
igual que 180 cm.
REPRESENTACIN
FRECUENCIAS.
GRFICA
DE
LAS
DISTRIBUCIONES
DE
Las grficas deben ser tan sencillas y claras, de tal manera que sean
comprensibles sin la ayuda de las descripciones del texto.
Toda grfica debe tener ttulo que indique con claridad el contenido de la misma.
En toda grfica se debe explicar la fuente de donde fueron obtenidos los datos;
adems aclarar las escalas, leyendas, notas y convenciones que ayuden a
identificar las caractersticas presentadas.
Frecuencias
Absolutas
ni
1
4
7
6
2
20
Frecuencias
Relativas
hi
0.05
0.20
0.35
0.30
0.10
1.00
Frecuencias
Porcentajes
hi (%)
5
20
35
30
10
100
0
0
Nmero de hijos
Nmero de
empleados
[ 0 - 10)
[ 10 - 20)
[ 20 - 30)
[ 30 - 40)
[ 40 - 60)
[ 60 - 80)
[ 80 - 100)
[ 100 - 140)
[ 140 - 180)
[ 180 - 260)
Total
Amplitud
Ci
10
10
10
10
20
20
20
40
40
80
250
ni
5
20
35
40
50
30
20
20
15
15
250
hi
0.02
0.08
0.14
0.16
0.20
0.12
0.08
0.08
0.06
0.06
250
Densidad
h i /c i
0.002
0.008
0.014
0.016
0.010
0.006
0.004
0.002
0.0015
0.0008
250
100 x h i %
2%
8%
14 %
16 %
20 %
12 %
8%
8%
6%
6%
250
0.016
14%
0.014
0.012
20%
0.010
8%
0.008
12%
0.006
8%
0.004
8%
0.002
6%
0
10
20
30
40
60
80
100
140
6%
180
260
161
176
168
185
172
181
178
166
179
169
159
175
178
161
168
182
171
164
177
175
156
169
154
174
167
181
172
170
163
177
168
187
170
173
166
180
170
160
169
176
168
184
171
165
168
179
169
158
175
167
165
182
171
163
177
168
161
152
174
167
181
170
161
162
176
168
186
172
166
166
180
169
159
175
168
168
183
171
165
178
169
169
155
174
167
181
170
170
163
177
168
188
173
( Yi1 Yi
150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total
Marca de clase
Yi
152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5
4
5
12
33
17
16
9
4
100
0.04
0.05
0.12
0.33
0.17
0.16
0.09
0.04
1.00
4
9
21
54
71
87
96
100
Frecuencia
acumulada
0.04
0.09
0.21
0.54
0.71
0.87
0.96
1.00
Ejemplo . Abriendo la ventana Descripcin y luego escogiendo la opcin Datos numricos Anlisis
unidimensional Opciones grficas y finalmente seleccionar Histograma de frecuencias en el
programa estadstico STAGRAPHICS, obtener el grfico de histograma de frecuencias absolutas para el
ejemplo 2.32.
Nmero de alumnos
40
30
20
10
0
150 155 160 165 170 175 180 185 190
Estatura en cm.
Figura . Histograma de frecuencias de los alumnos segn su estatura
b) Polgono de frecuencias.
Cuando la variable est agrupada en intervalo de clase, el polgono de
frecuencia se obtiene uniendo los puntos medios de las bases superiores de
cada rectngulo en el histograma.
Ejemplo 2.34. Abriendo la ventana Descripcin y luego escogiendo la opcin Datos numricos
Anlisis unidimensional Opciones grficas y finalmente seleccionar Histograma de frecuencias en el
programa estadstico STAGRAPHICS, obtener el grfico de histograma de frecuencias absolutas para el
ejemplo 2.32.
Nmero de alumnos
40
30
20
10
0
147.5 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 192.5
Estatura en cm.
Figura 2.7. Polgono de frecuencias de la estatura de los alumnos .
Nmero de alumnos
100
80
60
40
20
0
150
155
160
165
170
175
180
185
190
Estatura en cm.
Figura . Polgono de frecuencias acumuladas Menor o igual que para la estatura de los
alumnos .
GRFICO PARA LA DISTRIBUCIN DE FRECUENCIA DE VARIABLE CUALITATIVA.
Nmero de
Consumidores: ni
8
9
3
20
Frecuencias
relativas: hi
0.40
0.45
0.15
1.00
Frecuencias
Porcentajes: hi(%)
40
45
15
100
Nmero de personas
10
8
6
4
2
0
Blanco
Negro
Rojo
15.00%
Color de preferencias
Blanco
Negro
Rojo
40.00%
45.00%
Media.
Media geomtrica.
Media armnica.
Mediana.
Moda.
xi
N
xi
n
xi 19
1.73
n 11
xi 110
27.5
n
4
No es Representativo
(No homogeneidad de Datos)
x f
i
x f
i i
# de
Mascot
as
fi
3
10
12
20
25
50
3
4
Total
Ejemplo 2:
Xi . fi
0
0 = no tienen mascotas
1 = Tienen una mascota
2 = Tienen dos mascotas
3 = Tienen tres mascotas
4 = Tienen cuatro mascotas
Calcule la media.
xi. fi 50
2
n
25
Si es
Formula de la
Marca de clase
Clases
Intervalos
Marca
de
Clase
Xi
Frecuencia
fi
0.4 - 2.7
2.7 - 5.0
5.0 - 7.3
7.3 - 9.6
9.6 - 11.9
11.9 - 14.2
14.2 - 16.5
TOTAL
1.55
3.85
6.15
8.45
10.75
13.05
15.35
-------
5
8
14
11
7
3
2
50
Formula de la Me
Xi . fi
7.75
30.8
86.1
92.95
75.25
39.5
30.7
x f
i
=
363.05
Li Ls 0.4 2.7
1.55
2
2
x f
i i
dia (
363.05
7.261
50
~
x
MEDIANA: ( me)
Es la medida de Tendencia Central que divide un conjunto ordenado en
forma creciente o decreciente en dos grupos iguales de modo que la mitad
(50%)de las observaciones tendr valores que son menores que la mediana
y la otra mitad (50%) alcanzara valores mayores que esta .
DATOS NO TABULADOS SIN AGRUPAR:
Me
n 1
2
, Si es una
muestra.
Me
N 1
2
, Si es una
Poblacin.
Me X
n 1
)
2
X
Me
n
)
2
n 1
)
2
2.
7 1
)
2
n 1
)
2
sea
2.
111
)
2
n 1
)
2
tiene la posicin
sea
este nmero es el 6 ,
X
Me
n
)
2
X
2
n 1
)
2
Me 10.05
X6 X7
9.7 10.4
2
2
Me LI (
n
) Fi 1
2
fi
) * Tic
Me LI (
n
) Fi 1
2
Fi ( Fi 1)
) * Tic
Variables
X
Frecuencia
Fi
Frecuencia
Acumulad
Fi
Fi - 1
11
Fi
3
4
16
20
Total
20
Fi + 1
n
)
2
5 (10) 11
Con lo cual la mediana estar en la clase que tiene como frecuencia
acumulada Fi al cual aplicamos la siguiente Formula :
Me LI (
n
) Fi 1
2
fi
10 5
) * Tic 2 (
) *1 2.88
6
Me 2
Li - Ls
fi
Fi
150 - 155
155 - 160
160 - 165
Marca de
clase
X
152.5
157.5
162.5
4
5
12
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total
167.5
172.5
177.5
182.5
187.5
-
33
17
16
9
4
100
4
9
21
54
71
87
96
100
-
FI- 1
Fi
Fi+1
n
)
2
21 (50) 54
Me LI (
n
) Fi 1
2
fi
) * Tic 165 (
54 21
) * 5 170
33
MODA (Mo) :
Es el valor que se representa con mayor frecuencia en un conjunto de datos
Mo = Observacin con mayor frecuencia
Mo =8
Distribucin monomodal
(Tiene una Mo)
Poblacin : 3 ; 3 ;4 ;1 ;5 ; 6 ;7 ;3 ;8 ;7; 9 ;2 ;7
Mo =3
Mo =7
Distribucin bimodal
(Tiene dos Mo)
Muestra: 1; 2; 3; 6; 7:9; 8
Mo =No hay moda
Nmero de Familias
(fi)
60
120
210
360
160
50
30
990
Fi-1
Fi
Fi+1
Mo LI (
d1
) * Tic
d1 d 2
d1 =fi fi-1
d2 =fi fi+1
Li =Limite inferior de la clase modal
Fi = Frecuencia absoluta de la clase modal.
Fi-1 = Frecuencia absoluta de la clase inmediatamente anterior a la clase
modal .
Fi+1 = Frecuencia absoluta de la clase inmediatamente Posterior a la clase
modal
Tic= amplitud .
Determinar Para la siguiente distribucin :
Li - Ls
150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total
Marca de
clase
X
152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5
-
fi
4
5
12
33
17
16
9
4
100
Fi-1
Fi
Fi+1
Mo 165 (
21
) * 5 167.8378378
21 16
x1 * x2 ... * xn
log 10
n
i 1
* Log10 * yi
Primero debemos de
EJEMPLO 01
Marca de Clase
92
93
94
95
96
Frecuencia
11
21
10
ni
4
11
21
10
4
Total
50
Log10Yi
1.9637878
7
1.9689829
1.9731278
1.9777236
1.9822712
-------
ni log10 Yi
7.8551513
21.653312
41.435684
19.777236
7.929084
98.650464
Primero
calculamos
Log con base
10 (Yi).
Segundo los
resultados
log 10 G
98.650464
1.97300938
50
101.97300038 93.9731533
Donde:
MG es media geomtrica, yi es marca de clase, fi la frecuencia de clase
correspondiente, n el nmero total de datos utilizados.
LA MEDIA ARMONICA
Se define como la inversa de la media aritmtica de los inversos de un
conjunto de datos
A
n
n
n1
n
2 ... k
x1
x2
xk
n
n
x
i 1
6
1
1
1
1
1
1
5
9 12
7
15
3
6.4
Nota:
La media armnica siempre es menor o igual que la media aritmtica,
ya que para cualesquiera nmeros reales positivos
Considera todos los valores de la distribucin y en ciertos casos, es
ms representativa que la media aritmtica.
yH M h
1
1 k ni
n i1 y i
n
n
ni
i 1 y i
(23)
- 6.0
- 10.0
- 14.0
- 18.0
- 22.0
yH
n
n
fi
x
i 1
fi
3
7
12
16
20
Xi
4
8
12
16
20
40
f i /Xi
0.750
0.875
1.000
0.500
0.500
3.625
40
11.03
3.625
1
1
0
x H
i 1 x i
n
e p t
de donde
1
t
x H
3
3
x
i 1
3
3
3
0.25
1
1
1
3 4 5 12
1/ 3 1/ 4 1/ 5
0.261
3
3
180
En este caso el promedio por docena es 0.261
Pagando 0.261 soles por docena, tendramos
0.261 x 12 = 3.132 soles
Es decir, se obtiene 0.132 soles ms de lo que en realidad se gast por las 12
docenas. Por tanto, la media aritmtica en este caso es incorrecta.
VARIANZA
Es una medida que nos ayuda a comprender la variabilidad de los datos, que
tan distanciados estn de la media. Si los valores tienden a concentrase
alrededor de su media , la varianza ser pequea . Si los valores tienden a
distribuirse lejos de la media , la varianza ser grande .
La varianza calculada a partir de la media ser denotada por
2
S2
y referida a
s
2
(x
i 1
x) 2
n 1
n 1
xi
x )
i 1
s2
i 1
f i ( xi x ) 2
n 1
x2 fi x
i 1
n 1
n 1
2
i
ni
( x i ni ) 2
i 1
i 1
Para la
Muestra
n
s2
i 1
f i ( xi ) 2
i 1
fi 2
N
Para la
Poblacin
Nota : para la aplicacin de estas formulas si queremos sacar la desviacin
estndar solo le sacamos la raz cuadrada .
Ejemplo -Para datos sin Agrupar o no Tabulados
Se determino los pesos de una muestra de cartas procesadas en una oficina
postal ,pesadas hasta el gramo mas prximo ,son : 21 , 28 , 30 , 12 , 14 ,
17 , 28 ,10 , 16 , 25
n
s2
(x
i 1
x) 2
n 1
cuadrado
Aplicando el mtodo abreviado
10
xi 21 18 ... 25 191
i 1
n
s
n 1
2
x
i 1
x )
i
10
x
i 1
2
i
1
(191) 2
4059
45.6555
9
10
Gramos
al
Ejemplo 01:
Li Ls
xi
fi
( xi x ) 2
( xi x ) 2 f i
30 35
35 40
40 -45
45 -50
50 55
55 - 60
60 65
Total
32.5
37.5
42.5
47.5
52.5
57.5
62.5
---
2
4
7
18
12
6
1
50
243.36
112.32
31.36
0.36
19.36
88.36
207.36
---
486.72
449.44
219.52
6.48
232.32
530.16
207.36
2132
Solucin:
X 48.1
n
s2
f (x
i 1
x) 2
n 1
2132
43.5102
49
s 43.5102 6.596226
Varianza
Desviacin estndar
Ejemplo 02:
Aplicando frmula Reducida:
Li - Ls
xi
fi
xi f i
( xi2 f ) 2
30 35
35 40
40 -45
45 -50
50 55
55 - 60
60 65
Total
32.5
37.5
42.5
47.5
52.5
57.5
62.5
---
2
4
7
18
12
6
1
50
65
150
297.5
855
630
345
62.5
2405
2112.5
5625
12643.75
40612.5
33075
19837.5
3906.25
117812.5
s2
n 1
x i ni
2
( x i ni ) 2
i 1
i 1
s 43.5102 6.59622
1
(2405) 2
117812
.
5
43.5102
49
50
Varianza
Desviacin estndar
Propiedades de la varianza.
1. La varianza de un conjunto de observaciones x 1, x2, , xn siempre es
un nmero no negativo. Esto es
V(X) 0
2. La varianza de una constante es cero. Esto significa, que si x 1= x2=
= xn = b constante, entonces:
V(b) 0
DESVIACIN ESTNDAR
Es la raz cuadrada positiva de la varianza
La desviacin estndar calculada a partir de la Muestra se denota por
referida a una poblacin se denota por
DATOS SIN AGRUPAR O NO TABULADOS
Esto seria
s2
para la Muestra
1 n
2
2
xi x
n i 1
Esto seria =
1
N
x
i 1
para la Poblacin
1 n
2
2
xi x
n i 1
Ejemplo 01 :
Calcular la desviacin estndar
4 , 9 , 14 , 19 , 23 , 28 , 37 , 54 , 62 , 70
n = 10
10
= 32
x2
= 1024
x 4 2 9 2 14 2 19 2 23 2 28 2 37 2 54 2 62 2 70 2 14996
i 1 i
1
(14996) 1024 2221.81
10
fi( x
i 1
x )
Ejemplo 02 :
Calcular la siguiente distribucin de frecuencias por intervalos encontrar la
desviacin estndar
Li - Ls
Xi
fi
( xi x )
( xi x )
40 50
50 60
60 -70
70 80
80 -90
TOTAL
45
55
65
75
85
---
3
5
7
4
1
20
-17
-7.5
2.5
12.5
22.5
---
306.25
56.25
6.25
156.25
506.25
---
x f
i i
363.05
7.261
50
fi( xi x )
918.75
281.25
43.75
625.00
506.25
fi( x
x ) 2375
fi( x
i 1
x )
2375
10.9
20
65 - 62.5 = 2.5
( xi x )
Luego :
( -17.5 )2= 306.25
2
( -7.5 )
= 56.25
2
( 2.5 ) = 6.25
( 12.5) 2= 156.25
(22.5) 2= 506.25
fi( xi x )
Luego :
(3*306.25)=918
( 5*56.25)=281.25
( 7*6.25)=43.75
(4* 156.25)=625.00
( 1*506.25)=506.25
S
X
= 48.1 y
= 6.596226
S 6.596226
*100 13.71%
X
48.1