Sie sind auf Seite 1von 62

INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing.

Diego Tume Ruiz


FREDERICK WINSLOW TAYLOR.
ESTADISTICA
CONCEPTOS BASICOS
Poblacin: Constituido por el conjunto total de elementos, individuos u objetos con una o varias
caractersticas comunes observables.
Por ejemplo: la estatura, el peso, el tiempo, la temperatura, etc.
A la poblacin se representa por N, y de acuerdo a su tamao puede ser:
a) Poblacin Finita: Cuando est constituido por un nmero definido de elementos (individuos u
objetos). Por ejemplo, el nmero de alumnos de cierta Universidad.
b) Poblacin Infinita: Cuando est constituido por un nmero indefinido de elementos. Por
ejemplo, los puntos de un a recta numrica.
Muestra: Es una parte representativa de la poblacin con las mismas caractersticas de la poblacin y se
considera como un subconjunto de la poblacin.
Tamao de la muestra: se representa como n al conjunto total de elementos de la muestra, la cual puede
variar desde uno hasta el total de la poblacin. La muestra de acuerdo a su tamao puede ser:
a) Muestra Representativa: Cuando nos proporciona una informacin global acerca de alguna
caracterstica observable de una poblacin o universo estadstico.
b) Muestra al Azar o Aleatoria: Se denomina as, cuando todos los elementos o datos de una
poblacin o universo estadstico sometidos a muestreo, tienen igual oportunidad o ser probables a
ser seleccionados.
c) Muestra Sesgada o viciada: Cuando los elementos de una poblacin sometidos a muestreo, han
sido seleccionados mediante criterios subjetivos. Por ejemplo, si de la poblacin de cierta
Universidad el rector selecciona solo a los de ms alto puntaje de rendimiento, decimos que es
una muestra sesgada, dado que no han sido considerados todos los elementos de la poblacin
universitaria. Esta muestra as no es representativa.
Individuo, unidad elemental o experimental
Es cada uno de los elementos de la poblacin o muestra en quien vamos a observar la caracterstica en
estudio.
Variable o caractersticas: Se define como una caracterstica que presentan los individuos o unidades
elementales de una poblacin o muestra. La variable puede ser:
a) Variable Cualitativa : Es cuando la caracterstica de los elementos reflejan la presencia de un
determinado atributo y no estn asociados a valores numricos. A su vez esta variable puede ser:
- Variable cualitativa nominal : Por ejemplo, las personas que estn a favor o en contra de
cierta medida econmica, el color de ojos, etc. Es decir, que poseen un atributo y son
susceptibles a una ordenacin.
- Variable Cualitativa Jerarquizada : Por ejemplo, las pruebas de degustacin de algn
producto alimenticio.
b) Variable Cuantitativa : Las caractersticas de los elementos (individuos u objetos) estn
asociados a valores numricos. A su vez esta variable puede ser:
- Variable Cuantitativa Discreta: En su esencia son numricos, reflejan una magnitud, y
pueden ser puestos en correspondencia biunvoca con los nmeros naturales. Por
ejemplo, el nmero de hijos de una familia, donde el conjunto de valores posibles es:
{0,1,2,.,25}
- Variable Cuantitativa Continua: El conjunto de nmeros posibles de esta variable se
puede representar como un intervalo en los nmeros reales. Por Ejemplo, registrar el
tiempo de duracin de una bombilla elctrica; su representacin podra ser 0 X 1000
horas, donde X representa el tiempo de duracin de la bombilla.
Manual de Estadstica General
1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
ORGANIZACIN Y PRESENTACION DE DATOS
Distribuciones de Frecuencias
Un conjunto de datos, puede ser resumido y clasificado de acuerdo a criterios convenientes.
Provengan las informaciones de censos o de muestras relativamente grandes, siempre sern tiles
para el anlisis, ya que difcilmente podran obtenerse conclusiones vlidas de datos estadsticos
no clasificados.
Los tipos de variables fundamentales, por lo menos para este trabajo, sern los siguientes:
a) Variables cardinales : Susceptibles de medicin cuantitativa; y las que a su vez
comprenden:
- Continuas: variables que admiten siempre un valor intermedio dentro de un
intervalo de valores (longitud, peso, estatura, ingresos, inteligencia, etc.)
- Discretas: variables que no admiten siempre un valor intermedio dentro de un
intervalo de valores (nmero de hijos por familia, nmero de accidentes de
transito por da, etc.).
b) Variables Ordinales : slo susceptibles de ordenacin pero no de medicin cuantitativa
(grado de cultura de una persona: muy culta, regularmente culta, poco culta, inculta).
Para cada uno de estos tipos de variables, un conjunto de observaciones puede dar origen a
una distribucin de frecuencias; y sta debe entenderse como un cuadro o tablas de resumen de
los datos originales.
En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar
a un resumen efectivo de la informacin original. El punto medio de cada intervalo se
denominar marca de clase y constituir el valor representativo de cada intervalo. El nmero de
observaciones que corresponden a cada intervalo se denominar frecuencias absolutas.
Una tabla de distribucin de frecuencias para variable continua y sus smbolos
correspondientes se presenta de la siguiente forma:
i Intervalos de Clase
LI
i
- LS
i
Marca de Clase
X
i

Frecuencia Absoluta
f
i
1 LI
1
LS
1
X
1
f
1
2 LI
2
LS
2
X
2
f
2
3 LI
3
LS
3
X
3
f
3
. . . .
. . . .
. . . .
K LI
k
- LS
k
X
k
f
k
Manual de Estadstica General
2
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Donde:
Amplitud del Intervalo: C
i
= LS
i
LI
i
Amplitud Total o Rango: R = LS
k
LI
1
Marca de Clase: X
i
= LI
i
+ LS
i
2
Nmero de Observaciones: n =
Estas Tablas pueden ser de amplitud constante o de amplitud variable, segn los valores que
tome C
i
.
Cuando se trata de variables discretas o discontinuas, la tabla de distribucin de frecuencias
adquiere la forma siguiente:
X
i
f
i
X
1
f
1
X
2
f
2
X
3
f
3
. .
. .
. .
X
k
f
k
Cabe destacar que cuando la variable adquiere numerosos valores distintos para abreviar el
trabajo, con cierta arbitrariedad y con alguna prdida de precisin, puede tratarse como una
variable continua, formando intervalos de clase.
Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como la
siguiente:
Variable Frecuencia
Caracterstica A f
A
Caracterstica B f
B
Caracterstica C f
C
. .
. .
. .
Caracterstica Z f
z
As entonces las tablas de distribucin de frecuencias facilitan enormemente el anlisis. Es muy
ventajoso disponer de informaciones clasificadas en intervalos o en valores especficos de la
variable, ya que, de esta manera, es posible obtener conclusiones primarias acerca de la variable
que se investiga.
Manual de Estadstica General
3

k
i
i
f
1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Por otro lado, la variable cuantitativa continua tiene tambin otras conveniencias usuales como:
1. Interpretacin continua de los valores discretos:
Consideremos, por ejemplo, la longitud, supongamos que una regla no muestra ms all
de los centmetros, ello permite atribuir valores tales como:
1.68, 1.69, 1.70, pero no valores intermedios.
Esta limitacin, es debido a la imperfeccin del instrumento de medida, no a que sean
imposibles estos valores intermedios.
Por ello para salvar la continuidad, vamos a admitir que cada valor discreto representa a
todos los infinitos valores situados media unidad de medida (medio centmetro) a su
izquierda y media unidad a su derecha.
En nuestro caso, 1.68 representa a los infinitos valores que van desde 1.675 hasta 1.685
(incluido el 1.68), el valor 1.69 representa a todos los valores que van desde 1.685 hasta
1.695, etc.
Es decir, 1.68 representa a una clase con infinitos valores intermedios.
Llamaremos Intervalo elemental a cada una de estas clases.
Diremos que 1.675 es el Lmite exacto inferior del intervalo representado por 1.68, y 1.685
es el lmite exacto superior.
Diremos que 1.685 es el lmite exacto inferior del intervalo representado por 1.69, y 1.695
es su lmite exacto superior.
Admitiremos, por tanto, que 1.685 es, a la vez, lmite exacto superior de un intervalo y
lmite exacto inferior del intervalo siguiente.
Habra que distinguir entre intervalos abiertos y cerrados, abiertos por la derecha
(izquierda) y cerrados por la izquierda (derecha). Por tanto, la amplitud de cada intervalo
elemental valdr la unidad de medida utilizada si nos valemos de intervalos semiabiertos.
2. Intervalos elementales y compuestos
Recordemos que cada valor discreto representa a todos los valores situados media unidad a
su izquierda y media unidad a su derecha. Es decir, con cada valor discreto va asociado un
intervalo de amplitud unidad que hemos llamado elemental. Llamaremos intervalo
compuesto (o, simplemente intervalo) al conjunto de varios intervalos elementales
consecutivos. Por regla general, todos los intervalos compuestos (para un conjunto de
datos) contendrn cada uno de ellos el mismo nmero de intervalos elementales.
3. Lmites exactos y lmites aparentes
Supongamos que en una investigacin de valor discreto mnimo obtenido es 8 y el mximo
es 19. Los valores discretos posibles (incluyendo el 8 y el 19) sern:
8,9,10,11,12,13,14,15,16,17,18,19
Manual de Estadstica General
4
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Cada uno de ellos representa un intervalo elemental unitario. Formemos un intervalo
compuesto con los intervalos elementales representados por 8,9 y 10. Dado que es 7.5 el
lmite exacto inferior del intervalo elemental representado por el 8 y es 10.5 el lmite
exacto superior del intervalo elemental representado por el 10, aceptaremos 7.5 como
lmite exacto inferior del intervalo compuesto y 10.5 como lmite exacto superior del
mismo. Por consiguiente, tendremos 4 intervalos compuestos cuyos lmites exactos sern:
7.5-10.5, 10.5-13.5, 13.5-16.5, 16.5-19.5.
Llamaremos lmites aparentes de estos cuatro intervalos a: 8-10, 11-13, 14-16, 17-19.
Ntese que estos valores aparentes son los nicos que, de hecho, pueden aparecer.
4. Amplitud de un Intervalo
Es la diferencia entre su lmite exacto superior y su lmite exacto inferior. En el ejemplo
anterior la amplitud de los cuatro intervalos ser:
10.5-7.5 = 13.5-10.5 = 16.5-13.5 = 19.5-16.5 = 3
Punto medio de un intervalo o marca de Clase.
Es la media aritmtica de sus dos lmites exactos, o de sus lmites aparentes
,
los otros puntos medios de los intervalos son: 12, 15 y 18
Amplitud Total o Rango
Es la diferencia entre la puntuacin mxima y la mnima. O, teniendo en cuenta los lmites
exactos de los intervalos elementales o compuestos, diferencia entre la puntuacin mxima
y la mnima ms una unidad.
Clculo de la amplitud total o rango
a) Datos no agrupados en intervalos
Por ejemplo, para los datos siguientes: 18, 29, 39, 40, 54.
A
T
= R = 54-18 = 36
A
T
= R = 54-18 + 1 = 54.5 17.5 = 37
17.5 18 18.5 53.5 54 54.5
...
36
37
Manual de Estadstica General
5

+
2
5 . 10 5 . 7
9
2
10 8

+
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
b) Datos agrupados en intervalos
i Intervalo X
i
f
i
1 24 38 31 4
2 39 53 46 5
3 54 68 61 2
4 69 83 76 5
5 84 98 91 6
A
T
= R = 91-31 = 60 A
T
= R = 91-31 + 15 = 75
Si en realidad las nicas puntuaciones existentes son los puntos medios de los
intervalos. Loa amplitud total sera la diferencia entre el punto medio del intervalo
mximo (91) y el punto medio del intervalo mnimo (31) .
A su vez la unidad que puede ser aadida es la unidad de intervalo (c
i
), medio intervalo
por debajo del punto medio mnimo y medio intervalo por encima del punto medio
mximo. En otras palabras, aadir una unidad de intervalo, equivale a aceptar como
amplitud total la diferencia entre el lmite exacto superior del intervalo mximo y el
lmite exacto inferior del intervalo mnimo (31-7.5 = 23.5 y 91+7.5 = 98.5). Teniendo
en cuenta los intervalos, la amplitud total sera:
A
T
= R = 98 24 = 74 A
T
= R = 98 24 + 1 = 98.5 23.5 = 75 es decir, para
lmites aparentes o lmites exactos.
23.5 31 38.5 83.5 91 98.5
...
60
75
Respecto de las frecuencias, es posible y generalmente til presentarlas en trminos
relativos, calculando la proporcin que corresponde a cada intervalo o marca de clase
sobre el total de observaciones.
Se denomina frecuencia relativa, y se simbolizar por h
i
:
h
i
= y
Tanto las frecuencias absolutas como las relativas son susceptibles de acumulacin
respecto de los intervalos o marca de clase.
Manual de Estadstica General
6
n
fi 1
1

k
i
i
h
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Las frecuencias absolutas acumuladas se simbolizar por F
i
y se define por:
F
i
= , j < k
Es decir, el nmero de observaciones menores o iguales que un determinado valor
de la variable, equivale a la suma de las frecuencias absolutas desde f
1
hasta f
j
(donde j
es un nmero entero menor que k), o sea, justamente, todas las frecuencias que
corresponden a valores de la variable menor o igual a x
i
. Es decir, F
i
= f
1
+ f
2
+ ... + f
j
La ltima frecuencia absoluta acumulada es igual al tamao de la muestra (F
k
=
n), ya que incluye todas las frecuencias absolutas desde f
1
a f
k
, que es justamente la
ltima.
Las frecuencias relativas acumuladas, se simbolizar por H
i
y se define por:
H
i
= , j < k
Es decir, Hi = h1 + h2 + ... + hj, es la suma de las frecuencias relativas
correspondientes a los intervalos cuyas marcas de clase son menores o iguales a xi. La
frecuencia acumulada se obtiene tambin de:
H
i
=
La ltima frecuencia relativa acumulada H
k
, es igual a la unidad, puesto que,
H
k
= = = 1
En general este tipo de frecuencias se acumulan en sentido creciente de la variable.
Con las frecuencias acumuladas es posible efectuar comparaciones con bastante
facilidad cuando el tamao de las diversas muestras es diferente.
Manual de Estadstica General
7

j
i
i
f
1

j
i
i
h
1
n
F
i
n
F
k
n
n
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
REPRESENTACION GRAFICA
En general, la representacin grfica de una tabla de distribucin de frecuencias, permite percibir
con mayor claridad algunas caractersticas de un conjunto de datos que se investiga.
a) Representacin grfica de variable continua : Si se utiliza un par de ejes coordenados,
en el eje de las abscisas se representar la variable estudiada, en tanto que en el eje de las
ordenadas, se representar las frecuencias correspondientes. Recurdese que en este tipo de
variables la frecuencia corresponde a un intervalo y por esto se representa mediante una
superficie.
Con el siguiente ejemplo se ilustrar estas ideas; admtase, en este sentido, la siguiente
tabla correspondiente a las edades de los alumnos del curso de estadstica:
i
Edades Alumnos Amplitud de
Intervalo
C
i

LI
i
- LS
i
f
i
C
i
1 18 22 10 4 1
2 22 26 20 4 1
3 26 30 16 4 1
4 30 38 12 8 2
5 38 - 40 1 2 0.5
C
i

=
N de amplitud unitaria estandarizada. Puesto que la amplitud de intervalo ms frecuente es 4, puede
adoptrsela como amplitud unitaria; as el cuarto intervalo tendr dos veces la amplitud unitaria elegida y el
quinto intervalo tendr la mitad de de dicha amplitud.
Figura 1.
a
i
=
20
Histograma de Frecuencia
15
Polgono de Frecuencia
10
5
Intervalos de Clase
Superficie = Base x Altura
f
i
= c
i
x a
i
a
i
= Frecuencia por intervalo estandarizado
Manual de Estadstica General
8
i
i
c
f
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
b) Representacin grfica de variable discreta . En este caso la frecuencia correspondiente
a cada valor de la variable estar representada por una barra vertical.
Figura 2.
f
i
0
x
i
Naturalmente, se puede construir, en forma similar, grficas que relacionen la variable con
cualquiera de los tipos de frecuencias que se han expuesto, relativas, acumuladas. etc.
Distribucin acumulada y polgonos acumulados (ojivas)
Otros mtodos tiles de presentacin para facilitar el anlisis y la interpretacin de datos, son
la construccin de tablas de distribucin acumulada y el trazado de polgonos acumulados.
Ambos se pueden desarrollar a partir de la tabla de distribucin de frecuencias, con la tabla
de distribucin de porcentajes. Por ejemplo:
Tabla 1
Distribucin de frecuencias de ndices de calificacin para 35 estudiantes del curso de
estadstica:
i ndice de
calificacin
f
i
h
i
%h
i
1 2.00 2.40 5 0.143 14.3
2 2.40 2.80 9 0.257 25.7
3 2.80 3.20 13 0.371 37.1
4 3.20 3.60 4 0.114 11.4
5 3.60 4.00 4 0.114 11.4
35 0.999* 99.9*
* Error a redondeo
Manual de Estadstica General
9
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Construccin de una tabla de distribucin de porcentaje acumulado:
Para esto debemos anotar las fronteras inferiores de cada clase en la tabla de distribucin de
porcentaje y agregar una frontera adicional al final.
Para calcular los porcentajes acumulados en la columna de menos de, se examina una
frontera inferior particular y se determina el porcentaje de observaciones de menos de esa
frontera.
Tabla 2
Distribucin de porcentaje acumulado de ndices de calificacin para 35 estudiantes del curso
de estadstica.
ndice de
Calificacin
%h
i
Porcentaje
Menos de
De estudiar
Igual a o mayor que
2.0 0.0 0.0 100.0
2.4 14.3 14.3 85.7
2.8 25.7 40.0 60.0
3.2 37.1 77.1 22.9
3.6 11.4 88.6 11.4
4.0 11.4 100.0 0.0
Luego, con el uso de la Tabla 2, 0.0% de las observaciones son de menos de 2.0; 14.3% de
las observaciones son de menos de 2.4; 40% de las observaciones son de menos de 2.8; y as
sucesivamente, hasta que el 100.0% de las observaciones son de menos 4.0.
La columna igual a o mayor que, se construye para cada frontera inferior al determinar el
porcentaje de observaciones iguales a o mayores que ese valor particular. De aqu que el 100.0%
de las observaciones son mayores que o iguales a 2.0; 85.7% de las observaciones son mayores
que o iguales a 2.4; 60.0% de las observaciones son mayores que o iguales a 2.8, y as
sucesivamente, hasta que 0.0% de las observaciones sean mayores que o iguales a 4.0.
Para verificacin, para cada valor de frontera inferior, el porcentaje de observaciones menores
que y el porcentaje de observaciones igual a o mayor que el valor debe sumar 100.00%. Esto
es lgico porque si, por ejemplo, como se indica en la tabla 2, no hay observaciones de menos de
2.0 y si el 14.3% de las observaciones es de menos de 2.4 y el resto, 85.7% de las observaciones,
debe ser mayor que o igual a 2.4.
Manual de Estadstica General
10
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Construccin de un polgono de porcentaje acumulado u ojiva
El fenmeno de inters los ndices de calificacin se representan sobre el eje
horizontal, mientras que los porcentajes acumulados (de la columna menos de y de la columna
igual a o mayor que), se representa en el eje vertical.
Los valores graficados son las fronteras inferiores segn estn enlistados en la tabla de
distribucin de porcentaje acumulado (tabla 2).

Curva
menos de
Curva
Igual a o
mayor que
Se aprecia en la figura 3 que las dos curvas estn constituidas por una sucesin de segmentos en
lnea recta que conectan los puntos trazados y se intersectan en el valor 50%. Se notar, adems,
que si estuviera un espejo en posicin horizontal a lo largo de este eje de 50%, la reflexin en la
parte superior concordar con la reflexin en la parte inferior.
La curva de menos de es siempre creciente (u horizontal), mientras que la curva igual a o
mayor que es siempre decreciente (u horizontal).
La ventaja principal de la ojiva es la facilidad con la cual se puede interpolra entre los puntos
trazados. Por ejemplo, el investigador podra desear una aproximacin del porcentaje de
estudiantes con ndices de calificacin menores a un valor especfico, digamos 2.5. Para esto se
proyecta una lnea vertical hacia arriba en 2.5, hasta que interfecta la curva de menos de y,
luego, se obtiene la aproximacin al porcentaje deseado al sentido horizontal hasta el eje de
porcentaje. En este caso, alrededor de 20.0% de los estudiantes de estadstica tienen ndices de
menos de 2.5. (esto implica que el 80.0% de los estudiantes de estadstica tiene ndices de 2.5 o
ms. Esto se obtiene al proyectar la lnea vertical hacia arriba en 2.5 hasta que cruza la curva de
igual a o mayor que y, luego, al leer en sentido horizontal hasta el eje de porcentaje).
Manual de Estadstica General
11
0
20
40
60
80
100
120
0 1 2 3 4 5
Indice de Calificacin
P
o
r
c
e
n
t
a
j
e

d
e

E
s
t
u
d
i
a
n
t
e
s
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Como ejemplo adicional, el investigador puede desear una aproximacin del ndice de
calificacin para el cual varios porcentajes seleccionados se estudiantes tienen ndices menores
que esa cifra. Algunos puntos de porcentaje que es comn considerar son el valor de 25.0%, el
valor de 50.0% y el valor de 75.0%. A partir de un punto deseado de porcentaje, digamos 25.0%
se hace una proyeccin horizontal hasta que intersecte la curva de menos de. Liego, se hace la
aproximacin al ndice de calificacin deseado al bajar una perpendicular (una lnea vertical) en
el punto de interseccin y el resultado se lee a lo largo del eje horizontal. En este caso, el 25.0%
de los estudiantes de estadstica tienen, ms o menos, ndices de calificacin menores de 2.57. En
el 50.0%, el valor aproximado del ndice de calificacin es de 2.91, mientras que al 75.0%, el
valor aproximado es de 3.18.
Las aproximaciones como las antes citadas son de gran utilidad cuando se comparan dos o ms
conjuntos de datos.
Pasos necesarios para llegar a una tabla completa de distribucin de
frecuencia
1) Determinacin de la amplitud total, recorrido de la variable o rango .
a. Variable cuantitativa discreta
A
T
= R = X
mx
X
mn
Variable discreta con interpretacin continua
- Para lmites aparentes
A
T
= R = X
mx
X
mn
- Para lmites reales o exactos
A
T
= R = X
mx
X
mn
+ 1
b. Variable cuantitativa continua
A
T
= R = X
mx
X
mn
- A partir de una tabla de frecuencia
A
T
= R = LS
k
LI
1
- Si slo se cuenta con marcas de clase
A
T
= R = X
k
X
1
- La amplitud total equivalente acepta la A
T
con lmites reales o exacta a partir de
las marcas de clases.
A
T
= R = X
k
X
1
+ C
Manual de Estadstica General
12
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
2) Nmero aproximado de intervalo de clases
Esto depende del criterio estadstico y/o investigador. Para nuestros ejemplos
utilizaremos la regla de Sturges, su relacin emprica es:
K = 1 + 3.3 log. n
Donde:
K = nmero aproximado de clases
n= nmero total de datos, observaciones, elementos o mediciones disponibles
Por ejemplo, si n = 49 entonces, K = 1 + 3.3 log. 49 = 6.5776
Luego, K puede tomar valores enteros 5, 6 o 7. La aproximacin siempre debe hacerse
por exceso y no por defecto, es preferible que la amplitud total se amplifique a que
queden datos sin clasificar.
No obstante, en general, la distribucin de frecuencia debe tener, cuando menos cinco,
pero no ms de 15 clases. Si no hay suficientes clases, hay demasiada concentracin de
datos; si hay demasiado agrupamientos, entonces hay poca concentracin de datos. En
cualquiera de los casos, se obtendra poca informacin.
3) Amplitud de intervalo (C
i
)
C
i
= LS
i
- LI
l
Si se desea presentar una tabla de distribucin de frecuencia con amplitud de intervalos
constantes, aplicar la relacin.
C =
A veces por conveniencia y facilidad de lectura, la amplitud de intervalo o ancho de clase
seleccionado, se redondea.
Otros criterios estadsticos conducen a establecer una diferencia entre la amplitud total
terica (R
t
) y amplitud total real (R
r
), esta debido al redondeo. De la misma relacin,
R
t
= KC. A la diferencia denominaremos exceso (E = R
t
R
r
)
4) Determinacin del exceso
Es un proceso emprico que depende del criterio estadstico y/o investigador. La finalidad
es establecer el nmero de clases a fin de evitar que algunos datos queden sin clasificar.
Para esto nos valemos de la relacin:
E = R
t
R
r
R
t
= Amplitud total terica debido al redondeo de la amplitud de intervalo.
R
r
= Amplitud total real a partir de los datos disponibles.
Manual de Estadstica General
13
K
R
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Para esta diferencia se pueden presentar los siguientes casos:
Criterios
a) Si E = 0
X
mn
= tomar como LI
1
X
mx
= tomar como LS
k
b) Si E >0
El exceso E se particiona en E
1
y E
2
arbitrariamente de tal manera que, E=E
1
+E
2
.
En este caso X
mn
y X
mx
pasan a ser valores extremos provisionales de la variable
de inters y los extremos definitivos, se ajustarn a:
X
mn
= X
mn
E
1
= LI
1
X
mx
= X
mx
+ E
2
= LS
k
Manual de Estadstica General
14
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
RESUMEN
CONSTRUCCION DE TABLAS DE FRECUENCIAS
PARA VARIABLES CUANTITATIVAS
a) Para Datos No Agrupados
Por ser la informacin bastante pequea, no existen tablas de frecuencias y nicamente Los
Datos se Presentan Ordenados, en Filas o en Columnas.
Ejemplo:
La siguiente informacin es la edad de 12 personas:
17 12 20 22 30 25 27 35 41 21 60 70
Ordenando los datos y presentndolos en columnas se tiene:
Edades (X
i
): 12 17 20 21 22 25 27 30 35 41 60 70
b) Para Datos Agrupados para Variable Discreta
Se procede de la siguiente manera:
1. Identificar la variable en estudio
2. Asignarle una letra cualquiera (generalmente X) para efectos de identificacin)
3. Ordenar los datos, en forma creciente o decreciente
4. Efectuar la respectiva tabulacin de los datos
5. Calcular los elementos de la Tabla de Frecuencias
Ejemplo:
La siguiente informacin corresponde al nmero de hijos que tiene una familia, de un
grupo total de 30. La informacin es la siguiente:
5 3 5 9 2 2 4 2 4 3
1 6 1 8 5 7 2 6 3 4
4 7 3 5 6 1 2 7 6 6
Se pide hallar su Tabla de Distribucin de Frecuencias.
Manual de Estadstica General
15
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
La Tabla ser la siguiente:
Xi = N de Hijos por familia (X
i
)
X
i
f
i
h
i
F
i
H
i
%
1 3 0.1000 3 0.1000 10.00
2 5 0.1667 8 0.2667 16.67
3 4 0.1333 12 0.4000 13.33
4 4 0.1333 16 0.5333 13.33
5 4 0.1333 20 0.6666 13.33
6 5 0.1667 25 0.8333 16.67
7 3 0.1000 28 0.9333 10.00
8 1 0.0333 29 0.9666 3.33
9 1 0.0333 30 0.9999 3.33
30 0.9999
~
1.0000
99.99
~
100.00%
c) Para Datos Agrupados Variable Continua
Se procede de la siguiente forma:
1. Identificar la variable en estudio
2. Asignar una letra cualquiera (generalmente Y) para efectos de identificacin
3. Calcular el Rango (R) de los datos, mediante
R = X
mx
- X
mn
4. Determinar el valor del nmero de intervalos (K) en caso de que se desconozca.
5. Calcular la amplitud (C
i
) para cada intervalo mediante:
C
i
= R
K
6. Construir los intervalos, empezando por el dato menor.
7. Efectuar la Tabulacin respectiva
8. Calcular cada uno de los elementos de la Tabla de Frecuencias.
Manual de Estadstica General
16
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo
La siguiente relacin de datos corresponde a los pesos de un grupo de 40 personas.
Utilizando 8 intervalos, construir la Tabla de Distribucin de Frecuencia.
50 66 75 49 73 55 61 64 57 49
49 54 75 57 63 61 59 57 49 66
70 60 60 74 60 62 65 64 72 58
70 50 65 70 72 61 71 51 72 55
Luego se tiene:
Variable: Pesos de un grupo de personas (Y
i
)
Rango = Dato mayor Dato menor = 75 49 = 26 = 26
N de Intervalos: K = 8
Amplitud: Ci = 26/8 = 3.25 ~ 3
Intervalos: Sern cerrados por la izquierda y abiertos por la derecha: [ )
Tabla de Distribucin de Frecuencias
Y
i
Y
i
f
i
h
i
% F
i
H
i
[49 52) 50.5 7 0.18 18 7 0.18
[52 55) 53.5 1 0.03 3 8 0.21
[55 58) 56.5 5 0.12 12 13 0.33
[58 61) 59.5 5 0.12 12 18 0.45
[61 64) 62.5 5 0.12 12 23 0.57
[64 67) 65.5 6 0.15 15 29 0.72
[67 70) 68.5 0 0.00 0 29 0.72
[70 73) 71.5 7 0.18 18 36 0.90
[73 73) 74.5 4 0.10 10 40 1.00
40 1.00 100
Manual de Estadstica General
17
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
CONSTRUCCION DE TABLAS DE FRECUENCIA
PARA VARIABLES CUALITATIVAS
La Tabla de Distribucin de Frecuencias para Variables Cualitativas es similar a la descrita para
Distribucin de Frecuencias para Variables Cuantitativas
Ejemplo:
Se tiene 30 personas clasificadas por su lugar de procedencia, de acuerdo a la siguiente clave:
L = Lima A = Arequipa CH = Chiclayo
H = Huancayo P = Puno
Los datos son los siguientes:
L H L H H P H A CH A
A CH A H H P CH L P A
A P CH CH A L L A L P
Se pide construir la Tabla de Distribucin de Frecuencias:
X
i
f
i
h
i
% F
i
H
i
Lima 6 0.20 20 6 0.20
Arequipa 8 0.26 26 14 0.46
Chiclayo 5 0.17 17 19 0.63
Huancayo 6 0.20 20 25 0.83
Puno 5 0.17 17 30 1.00
30 1.00 100
Manual de Estadstica General
18
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
EJEMPLOS DE APLICACION
a) Distribucin de Frecuencias con Datos sin Agrupar
Colectivo: 20 familias. (n = 20)
Variable X: ingresos anuales expresados en miles de soles.
Valores observados:
18, 20, 22, 19, 18, 20, 18, 19, 21, 20, 20, 21, 18, 20, 21, 19, 20, 21, 18, 20
Tabla de distribucin de frecuencias:
Ingresos
X
i
Frecuencias
Absolutas
f
i
Frecuencias
Relativas
h
i
Frecuencias
Absolutas
Acumuladas
F
i
Frecuencias Relativas
Acumuladas
H
i
18 5 5/20 = 0.25 5 0.25
19 3 3/20 = 0.15 5+3=8 0.25+0.15 = 0.40
20 7 7/20 = 0.35 5+3+7=15 0.25+0.15+0.35 = 0.75
21 4 4/20 = 0.20 5+3+7+4=19 0.25+0.15+0.35+0.20 = 0.95
22 1 1/20 = 0.05 5+3+7+4+1=20 0.25+0.15+0.35+0.20+0.05=1.00
n = 20 1.00
REPRESENTACIN GRFICA:
Diagrama de Barras
X (Ingresos anuales en miles de S/.)
Manual de Estadstica General
19
Frecuencias (f
i
)
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
b) Distribucin de Frecuencias con Datos Agrupados en Intervalos
Colectivo: 60 cilindros fabricados por una mquina. (n = 60)
Variable X: longitud en centmetros
Valores observados:
239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248
250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250
248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252
250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238
K = 1 + 3.3 log(60) o Tambin K =
K = 1 + 3.3 (1.77) K = 7.7 8
K = 1 + 5.8 = 6.8 7
R = 259 236 = 23
C = R/K
C = 23/7 = 3.28 3
Tabla de frecuencias con datos agrupados en intervalos:
Intervalos
LI - LS
Marcas de
Clases
X
i
Frecuencias
Absolutas
f
i
Frecuencias
Absolutas
Acumuladas
F
i
Frecuencias
Relativas
h
i
Frecuencias
Relativas
Acumuladas
H
i
[236 239) 237.5 4 4 0.07 0.07
[239 242) 240.5 2 6 0.03 0.10
[242 245) 243.5 4 10 0.07 0.17
[245 248) 246.5 9 19 0.15 0.32
[248 251) 249.5 21 40 0.35 0.67
[251 254) 252.5 13 53 0.22 0.89
[254 257) 255.5 2 55 0.03 0.92
[257 260] 258.5 5 60 0.08 1.00
60 1.00
Manual de Estadstica General
20
60
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Representacin grfica de la distribucin de frecuencias:
Variable X (Longitud)
c) Distribucin de Frecuencias con Datos Agrupados en Intervalos de diferente ancho
Colectivo: 1000 empresas de un sector. N = 1000
Variable X: ventas mensuales en miles de soles.
Valores observados: se han agrupado en intervalos.
Tabla de distribucin de frecuencias:
Intervalos Ci fi Fi hi Hi
Amplitud
Intervalo
Alturas
Ai
[0 50) 25 100 100 0.10 0.10 50 2
[50 100) 75 250 350 0.25 0.35 50 5
[100 200) 150 400 750 0.40 0.75 100 4
[200 400) 300 200 950 0.20 0.95 200 1
[400 800] 600 50 1000 0.05 1.00 400 0.125
1000 1
Ai: altura o densidad de frecuencias = frecuencia / amplitud intervalo
Manual de Estadstica General
21
HISTOGRAMA
4
2
4
9
21
13
2
5
0
5
10
15
20
25
[236 - 239) [239 - 242) [242 - 245) [245 - 248) [248 - 251) [251 - 254) [254 - 257) [257 - 260]
F
r
e
c
u
e
n
c
i
a
s

(
f
i
)
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
REPRESENTACIN GRFICA:
HISTOGRAMA
Manual de Estadstica General
22
0
50
100
150
200
250
300
350
400
450
50 100 200 400 800
HISTOGRAMA
0
1
2
3
4
5
6
50 100 200
400 800
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
EJERCICIOS RESUELTOS
Ejercicio 1:
Las puntuaciones obtenidas por un grupo de en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribucin de frecuencias y dibuja el polgono de
frecuencias.
SOLUCION:
x
i
Recuento f
i
F
i
n
i
N
i
13 III 3 3 0.15 0.15
14 I 1 4 0.05 0.20
15 5 9 0.25 0.45
16 IIII 4 13 0.20 0.65
18 III 3 16 0.15 0.80
19 I 1 17 0.05 0.85
20 II 2 19 0.10 0.95
22 I 1 20 0.05 1
20
Polgono de frecuencias
Manual de Estadstica General
23
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejercicio 2:
El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente
serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3,
3, 3, 2, 1, 3, 3, 3, 2, 3, 2,
2, 3, 3, 3, 2, 2, 2, 2, 2, 3,
2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.
SOLUCION:
x
i
Recuento x
i
F
i
n
i
N
i
1 6 6 0.158 0.158
2 12 18 0.316 0.474
3 16 34 0.421 0.895
4 IIII 4 38 0.105 1
38 1
Diagrama de barras
Manual de Estadstica General
24
DIAGRAMA DE BARRAS
6
12
16
4
0
2
4
6
8
10
12
14
16
18
1 2 3 4
Xi
f
i
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejercicio 3:
Las calificaciones de 50 alumnos en Matemticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8,
4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras.
x
i
f
i
F
i
n
i
N
i
0 1 1 0.02 0.02
1 1 2 0.02 0.04
2 2 4 0.04 0.08
3 3 7 0.06 0.14
4 6 13 0.12 0.26
5 11 24 0.22 0.48
6 12 36 0.24 0.72
7 7 43 0.14 0.86
8 4 47 0.08 0.94
9 2 49 0.04 0.98
10 1 50 0.02 1.00
50 1.00
Diagrama de barras
Ejercicio 4:
Manual de Estadstica General
25
DIAGRAMA DE BARRAS
1 1
2
3
6
11
12
7
4
2
1
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 10
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
f
i
8 10 16 14 10 5 2
1 Construir la tabla de frecuencias.
2 Representar el histograma y el polgono de frecuencias.
SOLUCION:
Intervalos x
i
f
i
F
i
h
i
H
i
[50, 60) 55 8 8 0.12 0.12
[60, 70) 65 10 18 0.15 0.27
[70, 80) 75 16 34 0.24 0.51
[80,90) 85 14 48 0.22 0.73
[90, 100) 95 10 58 0.15 0.88
[100, 110) 105 5 63 0.08 0.96
[110, 120) 115 2 65 0.03 0.99
65 0.99
Histograma Polgono de Frecuencia
Ejercicio 5:
Manual de Estadstica General
26
0
2
4
6
8
10
12
14
16
18
50 60 70 80 90 100 110 120
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50,
en un examen de Fsica.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44,
31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1. Construir la tabla de frecuencias.
2. Dibujar el histograma y el polgono de frecuencias.
SOLUCION:
Se pueden encontrar dos soluciones:
Primero haciendo uso de las formulas tenemos:
Nmero de Intervalos:
K = 1 + 3.3 log(40) K = 1 + 3.3(1.6) K = 6.28 6
K = K = 6.32 6
Amplitud del Rango: R = 48 3 = 45
Ancho de Clase: C = 45/6 C = 7.5 8
x
i
f
i
F
i
h
i
H
i
[0, 8) 4 2 2 0.05 0.05
[8, 16) 12 5 7 0.13 0.18
[16, 24) 20 4 11 0.10 0.28
[24, 32) 28 8 19 0.20 0.48
[32, 40) 36 16 35 0.40 0.88
[40, 48] 44 5 40 0.13 1.01
40 10.1
Segundo haciendo Intervalos de Ancho de Clase de 5:
Se distribuye en 10 intervalos tal como se muestra en la Tabla de distribucin
siguiente:
x
i
f
i
F
i
h
i
H
i
Manual de Estadstica General
27
40
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.275
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 47.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1.000
40 1
Histograma
EJERCICIOS PROPUESTOS
Manual de Estadstica General
28
POLIGONO DE FRECUENCIAS
0
2
4
6
8
10
12
[0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50]
HISTOGRAMA
0
2
4
6
8
10
12
[0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50]
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejercicio 1:
Los miembros de una cooperativa de viviendas tienen las siguientes edades:
42 60 60 38 60 63 21 66 56 57 51 57 44 45 35 30 35 47 53 49
50 49 38 45 28 41 47 42 53 32 54 38 40 63 48 33 35 61 47 41
55 53 27 20 21 42 21 39 39 34 45 39 28 54 33 35 43 48 48 27
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58 56 59 60 40 24
Elabore una tabla de frecuencias.
Ejercicio 2:
Agrupe los siguientes datos en una Tabla de Frecuencia:
23 21 43 41 19 29 17 33 35 30
25 11 28 40 22 45 43 23 29 32
9 47 47 31 12
Ejercicio 3:
Si las marcas de clase en una distribucin de frecuencias de pesos de estudiantes
son: 128, 137, 146, 155, 164, 173 y 182 libras, hallar:
(a) El tamao de Intervalo de Clase
(b) Los Limites reales de clase
(c) Los Limites de Clase
Suponiendo los pesos medidos con aproximacin de unidad de libra.
Ejercicio 4:
La menor de 150 medidas efectuadas es 5.18 cm., y la mayor 7.44 cm. Determinar un sistema adecuado
de:
(a) Intervalos de Clase
(b) Limites reales de Clase
(c) Marcas de Clase que puedan utilizarse para formar una distribucin de frecuencias de estas
medidas.
Ejercicio 5:
En la siguiente Tabla los pesos de 40 estudiantes en el Instituto Taylor se registran con
aproximacin de una libra.
Construir una distribucin de frecuencias.
138 164 150 132 144 125 149 157 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128
MEDIDAS DE TENDENCIA CENTRAL
Manual de Estadstica General
29
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Son Valores Centrales en Torno a los Cuales se Agrupan las Observaciones, en general se los
designa como promedios, y son de extraordinaria utilidad tanto en el anlisis de una distribucin
como en la comparacin entre distribuciones.
Las medidas de tendencia central ms importantes y conocidas son:
- La Media Aritmtica
- La Mediana
- La Moda o Modo
Tambin son medidas de tendencia central: La media geomtrica, la media armnica, los
cuarteles, la media cuadrtica y la media bicuadrtica.
LA MEDIA ARITMETICA
- Es el cociente que resulta de dividir la suma de todas las observaciones posibles
entre el nmero de ellas.
- Es un valor de la variable, posiblemente no observable, y viene dado en la misma
unidad de la variable. Se simboliza por
Para Datos No Agrupados
Se suman todas las observaciones, y el total se divide entre el nmero de ellas; sean X
1
, X
2
, ...,
X
m
las n observaciones con que cuenta la media aritmtica de estas observaciones ser:
=
Ejemplo:
Se tienen las siguientes edades en aos: 8, 15, 23, 30, 17
Solucin:
Edad en aos
8
15
17
23
30
La media aritmtica est dado por :
=
= 8 + 15 + 17 + 23 + 30 = 93 = 18.6 aos
5 5
Para Datos Agrupados, Variable Discreta
Manual de Estadstica General
30
X
X
n
X
m
i
i
1
X
n
X
m
i
i
1
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Sea X
i
, donde i = 1,2, ..., m, sus frecuencias correspondientes. Entonces la media aritmtica est
dada por:
=
Pero se sabe que:
= n
De donde se tiene:
=
Ejemplo: Se tiene la siguiente distribucin, hallar la media aritmtica
N de Habitantes
(X
i
)
N de Casas
(f
i
)
X
i
f
i
1 1000 1000
2 3000 6000
3 7000 21000
4 8000 32000
5 12000 60000
6 6000 36000
7 5000 35000
8 4000 32000
9 2000 18000
48000 241000
= 241000 = 5 habitantes
48000
Para Datos Agrupados, Variable Continua
Sean Y
i
, donde i = 1, 2, ..., m, las marcas de clase de los m intervalos; y
sean f
i
, donde i = 1, 2, ... , m, sus frecuencias respectivas; entonces se tiene que:
= y como = n
Entonces se tiene:
=
Ejemplo:
En la siguiente distribucin de obreros clasificados por sus salarios, halle la media aritmtica
Manual de Estadstica General
31

m
i
i
m
i
i i
f
f X
1
1
X

m
i
i
f
1
X
n
f X
m
i
i i
1
X X
Y

m
i
i
m
i
i i
f
f Y
1
1
'

m
i
i
f
1
n
f Y
m
i
i i
1
'
Y
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Salarios (Miles de Soles)
Y
i
Obreros
(f
i
)
Marca de Clase
(Y
i
)
Y
i
f
i
[4 12) 15 8 120
[12 20) 87 16 1392
[20 28) 45 24 1080
[28 36) 13 32 415
[36 - 44] 0 40 0
160 3008
= 3008 = 18.80
160
Mtodo Abreviado: Este mtodo se emplea slo para intervalos de igual amplitud.
La media aritmtica est dada por:
= A
t
+ C
i

Donde: d
i
=
A
t
= es una marca de clase arbitraria, situada hacia el centro de la distribucin
C
i
= amplitud constante de los intervalos
Ejemplo: Trabajemos con el ejemplo anterior.
Salarios
Y
i
Obreros
(f
i
)
(Y
i
) d
i
d
i
f
i
[4 12) 15 8 - 15 120
[12 20) 87 16 0 1392
[20 28) 45 24 45 1080
[28 36] 13 32 26 415
160 3008
Tomemos: A
t
= 16
Para hallar los d
i
se procede como sigue:
Por ejemplo para d
1
:
d
1
= ; C
i
= 8 d
1
= = d
1
= -1
En forma anloga se halla los restantes d
i
, y se completa la Tabla de frecuencias.
Hallando la Media Aritmtica
Manual de Estadstica General
32
Y Y Y
Y
n
d f
m
i
i i
1
i
t
C
A Yi '
8
16 8
8
8
i
t
C
A Y '
1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
= A
c
+ C
i
= 16 + 8 = 18.8
PROPIEDADES DE LA MEDIA ARITMETICA
1. La Suma de las desviaciones ponderadas de los valores de la variable
respecto de la media aritmtica es cero.
= 0
2. La media aritmtica de una variable ms (menos) una constante (T) es
igual a la media de la variable ms (menos) la constante.
M [X
i
T] = M [X
i
] T
3. La media aritmtica de una variable multiplicada (o dividida) por una
constante (T) es igual a la constante que multiplica (o divide) a la media de la variable,
M [X
i
T] = T M [X
i
]
4. La media aritmtica de la suma de dos o ms variables es igual a la suma
de las medias de cada una de las variables.
M [X
i
+ Y
i
] = M [X
i
] + M [Y
i
]
5. Si una muestra se divide en r submuestras, con medias , , ... ,
, y tamaos n
1
, n
2
, ..., n
r
respectivamente, entonces la media total de la muestra es:
M [X] = =
=
IMPORTANCIA DE LA MEDIA ARITMETICA
- La Media Aritmtica es el Centro de Gravedad de la Distribucin
- Es la medida de tendencia central mas estable
- Es el Valor Preferido en los clculos estadsticos por ser el ms fiable.
- Es el promedio que Representa mejor al grupo.
Ejercicios Resueltos
Manual de Estadstica General
33
Y
n
d f
m
i
i i
1
100
56
Y

m
i
i
f X Xi
1
) (
1
X
2
X
r
X
r
r r
n n n
n X n X n X
+ + +
+ + +
...
...
2 1
2 2 1 1
X

r
i
i
r
i
i i
n
n X
1
1
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
1. La siguiente tabla de distribucin de frecuencias, corresponde a las
edades de 19 funcionarios pblicos. Calcular la edad promedio (Media Aritmtica
Ponderada) en dicha distribucin.
Edades f
i
f
i
X
i
34 2 68
35 3 105
36 1 36
37 3 111
38 4 142
39 2 78
40 2 80
41 2 82
19 712
Solucin:
f
i
= 19
f
i
X
i
= 712
=
= 37.4
2. En un Notaria hay 10 secretarias que ganan S/. 60 diariamente, 4
Asesores que ganan S/. 100 y una registradora que gana S/. 200. Calcular la media
aritmtica ponderada.
Clase f
i
f
i
X
i
60 10 600
100 4 400
200 1 200
15 1200
Solucin:
f
i
= 15
f
i
X
i
= 1200
= = 80
3. La siguiente tabla de distribucin de frecuencias, corresponde al nmero
de faltas anual de los congresistas. Calcular el promedio (media aritmtica) de faltas del
hemiciclo.
Intervalos
Marca
de
Clase
fi di fidi
[60 63) 61 5 -2 -10
[63 66) 64 18 -1 -18
[66 69) 67 42 0 -28 43
[69 71) 70 27 1 27
[71 - 74] 73 8 2 16
100 - 15
Solucin:
Aplicamos la formula: C = LS
1
LI
1
C = 63 60 = 3
f
i
d
i
= 15
f
i
= 100
A = 67
= 67 + 15 x 3
100
= 67.45
Manual de Estadstica General
34
X
19
712
X
15
1200
X
X
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
4. La siguiente tabla de distribucin de frecuencias, corresponde al nmero
de folios que tienen los proyectos de ley. Calcular el promedio (media aritmtica) de folios
que tienen los proyectos de ley que se presentan al congreso.
Intervalos
Marca de
Clase
fi di fidi
[50 65) 57 10 -3 -30
[65 80) 72 15 -2 -30
[80 95) 87 20 -1 -20
[95 110) 102 40 0 -80 65
[110 - 125] 127 30 1 30
[125 140) 132 10 2 20
[140 155) 147 5 3 15
130 - -15
Solucin:
Aplicamos la formula: C = LS
1
LI
1
C = 65 60 = 5
f
i
d
i
= -15
f
i
= 130
A = 102
= 102 + -15 x 3
130
= 103.73
Manual de Estadstica General
35
X
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
LA MEDIANA (Md): La mediana de una coleccin de datos ordenados por su magnitud, es el
Valor Medio, o La Media Aritmtica de los dos Valores Medios. Es el valor que divide a una
distribucin en dos partes iguales. Esto significa que a uno y otro lado de este valor mediano se
encuentra no ms del 50% del total de las observaciones.
Para Datos No Agrupados
Se procede de la siguiente forma:
Se Ordenan los Datos en forma creciente o decreciente y se tiene:
Si el nmero de observaciones o datos es Impar; la mediana es el Valor Central.
Ejemplo: S = { 70, 80, 90, 100, 150} Hallar la Mediana
Solucin: Como el nmero de datos (n=5) es impar, entonces la Md. es el valor
Central:
Mediana: Md = 90
Ejemplo: Los siguientes datos representan puntuaciones S = { 15, 10, 12, 19, 08}
Hallar la Mediana
Solucin: Ordenamos los datos S={08, 10, 12, 15, 19}. Como el nmero de datos
(n = 5) es impar, entonces la Md es el valor central:
Mediana: Md = 12
Si el nmero de observaciones o datos es Par, la mediana es el Promedio de los
Valores Centrales.
Ejemplo: Los siguientes datos representan las notas de un alumno:
P = { 3, 6, 7, 8, 9,12} Hallar la Mediana.
Solucin: Como el nmero de datos (n = 6) es par, entonces la Md. es el promedio
de los valores centrales (7,8)
Mediana: Md = 7 + 8 = 7.5
2
Ejemplo: Los siguientes datos representan nmero de cursos aplazados:
P = { 2, 0, 5, 8, 3,1} Hallar la Mediana.
Solucin: Ordenamos los datos P = { 8, 5, 3, 2,1, 0} Como el nmero de datos (n =
6)
es par, entonces la Md. Es el promedio de los valores centrales (3,2)
Mediana: Md = 3 + 2 = 2.5
2
Manual de Estadstica General
36
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Datos Agrupados (Variable Discreta)
Se realizan los siguientes pasos:
1. Se Halla n/2, es decir, el nmero total de observaciones sobre 2.
2. Se ubica una frecuencia acumulada menor o igual que n/2. A esta frecuencia acumulada
la denotamos por F
j-1
, entonces se tendr: F
j-1
n
2
3. Luego se considera:
i) Si F
j-1
< n Md = X
j
2
ii) Si F
j-1
= n Md =
2
Ejemplo: Hallar la mediana, en la siguiente distribucin que representa el nmero de
personas que viven en la casa:
X
i
f
i
F
i
2 3 3
3 2 5
4 5 10
5 8 18
6 8 26
7 7 33
8 7 40
40
a) Se halla n/2
n = 40 = 20
2 2
b) Se debe buscar una frecuencia acumulada que sea
menor o igual a 20. Observando la tabla se
encuentra el valor 18 que es menor que 20.
Entonces: F
j-1
= 18
c) Como F
j-1
= 18 < n = 20 Md = X
j
En este caso X
j
es 6
Entonces: Md = 6
Ejemplo: Hallar la mediana, en la siguiente distribucin que representa el nmero de hijos
que tienen en 40 familias:
X
i
f
i
F
i
0 1 1
1 9 10
2 10 20
3 7 27
4 8 35
5 5 40
40
a) Se halla n/2
n = 40 = 20
2 2
b) Se debe buscar una frecuencia acumulada que
sea menor o igual a 20. Observando la tabla se
encuentra el valor 20 que es el valor buscado.
Entonces: F
j-1
= 20
c) Como F
j-1
= 20 = n = 20 Md = X
j-1
+ X
J
2 2
En este caso X
j-1
= 2 y X
j
= 3
Entonces: Md = 2 + 3 = 5 = 2.5
2 2
Manual de Estadstica General
37
2
1 j j
X X +

F
j-1
X
j
F
j-1
X
j
X
j-1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Datos Agrupados (Variable Contnua)
Se siguen los mismos pasos que en el caso anterior, es decir:
a. Se Halla n/2
b. Se Busca Fj-1 n
2
c. Se tiene:
i) Si Fj-1 n , la mediana ser
2
Formula: n F
j-1
Md = L
i
+ 2 C
f
j
Donde:
L
i
= Limite Inferior del Intervalo o Clase que contiene la mediana
n = nmero total de observaciones
f
j
= Frecuencia de Intervalo que contiene a la mediana (Md)
C = Amplitud del Intervalo de clase
F
i-1
= frecuencia acumulada del Intervalo que precede al intervalo que contiene a la Md.
ii) Si F
j-1
= n Md = L
i
2
Ejemplo 1: Hallar la mediana para la siguiente distribucin que corresponde a los salarios por
da, de los empleados de la empresa XYZ.
Y
i
f
i
F
i
[50 60) 8 8
[60 70) 10 18
[70 80) 16 34
[80 -90) 14 48
[90 -100] 17 65
65
Solucin:
1. Hallar n/2
n = 65 = 32.5
2 2
2. Se busca F
j-1
n
2
Observamos que 18 < 32.5
Entonces F
j-1
= 18
3. Ahora Aplicando la formula
tenemos:

Md = 70 + 32.5 18 10
16
Md = 70 + 14.5 10
16
Md = 79.06
Manual de Estadstica General
38
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo 2: Hallar la mediana de los pesos de 40 personas de un instituto clasificados en la
Distribucin de Frecuencias.
Pesos f
i
[42 49) 5
[49 56) 4
[56 63) 14
[63 70) 8
[70 77) 6
[77 - 83] 3
40
Solucin:
n = 40 = 20
2 2
Md = 56 + ( 20 9 ) x 7
14

Md = 61.5

Ejemplo 3: Hallar la mediana de 65 trabajadores de una empresa que sus sueldos oscilan entre
50 y 120 dlares.
Sueldos f
i
[50 60) 8
[60 70) 10
[70 80) 16
[80 90) 14
[90 100) 10
[100 110) 5
[110 120] 2
65
Solucin:
Sueldos f
i
F
i
[50 60) 8 8
[60 70) 10 18
[70 80) 16 34
[80 90) 14 48
[90 100) 10 58
[100 110) 5 63
[110 120] 2 65
n 65
Aplicando la Formula: n = 65 = 32.5
2 2
Aplicando la Formula: Md = 70 + ( 32.5 18 ) 10
16
Md = 79.06
Manual de Estadstica General
39
32.5
Intervalo q contiene la mediana
Frecuencia Absoluta Acumulada hasta antes del
intervalo q contiene a la mediana
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo 4: Hallar la mediana de 15 estudiantes cuyos puntajes obtenidos oscilan entre 51.5 y
80.5 Kilogramos.
Puntajes f
i
[51.5 56.5) 2
[56.5 61.5) 3
[61.5 66.5) 1
[66.5 71.5) 4
[71.5 76.5) 2
[76.5 80.5] 3
15
Solucin:
Aplicando la Formula:
n = 15 = 7.5
2 2
Aplicando la Formula:
Md = 66.5 + ( 7.5 6 ) 5
4
Md = 68.38
Importancia de la Mediana:
Da a conocer el PUNTO MEDIO EXACTO de la distribucin, es decir, el punto
correspondiente al 50% de la serie.
No es Afectada por los valores extremos.
Manual de Estadstica General
40
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
LA MODA (Mo): Es aquel registro que tiene mayor frecuencia absoluta o el ms comn de la
variable. Se simboliza por Mo.
Para Datos no Agrupados
Ejemplo: S = { 4, 3, 2, 1, 4, 3, 5, 3, 1, 2} Hallar la Moda.
Solucin: Moda: Mo = 3 } es el elemento q mas veces se repite
Ejemplo: P = { 2, 5, 1, 3, 5, 4} Hallar la Moda.
Solucin: Moda: Mo = 5 } es el elemento q mas veces se repite
Datos Agrupados Variable Discreta
Es el valor de la variable a la que le corresponde la Mayor Frecuencia.
Ejemplo 1: Hallar la Moda de la siguiente distribucin que corresponde al numero de hijos de
familias:
X
i
f
i
2 3
3 2
4 5
5 8
6 8
7 7
8 7
Ejemplo 2: Hallar la Moda de la siguiente distribucin:
X
i
f
i
0 5
1 10
2 14
3 17
4 20
5 8
6 6
Manual de Estadstica General
41
X
j
f
j
Mayor Frecuencia
Solucin:
1) Se Halla f
j
: Mayor frecuencia
f
j
= 8
2) Luego Mo = X
j
En este caso Mo = 5 y 6
X
j
f
j
Mayor Frecuencia
Solucin:
1) Se Halla f
j
: Mayor frecuencia
f
j
= 20
2) Luego Mo = X
j
En este caso Mo = 4
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Datos Agrupados Variable Continua
Se hace uso de la siguiente formula:
Formula: Mo = Li + (d
1
) x C
d
1
+ d
2
Donde:
L
i
= Limite Inferior de la Clase modada
n = nmero total de observaciones
d
1
= Es la diferencia entre la frecuencia modada y la
frecuencia anterior a la modada (f
j
f
j-1
)
d
2
= Es la diferencia entre la frecuencia modada y la
frecuencia siguiente a la modada (f
j
- f
j+1
)
C = Amplitud del Intervalo
Nota: La Amplitud de Clase debe ser constante para poder aplicar esta frmula.
Ejemplo 1: Hallar la moda para los siguientes datos agrupados.
Pesos f
i
[51 56) 2
[56 61) 3
[61 66) 1
[66 71) 4
[71 76) 2
[76 80] 3
15
Ejemplo 2: Hallar la moda de 65 trabajadores de una empresa.
Salarios f
i
[50 60) 8
[60 70) 10
[70 80) 16
[80 90) 14
[90 100) 10
[100 110) 5
[110 120] 2
65
Manual de Estadstica General
42
Solucin:
Aplicando la Formula:
d
1
= 4 1 = 3 d
2
= 4 2 = 2
Mo = 66 + ( 3 ) x 5 = 69
3 + 2
Solucin:
Aplicando la Formula:
d
1
= 16 10 = 6 d
2
= 16 14 = 2
Mo = 70 + ( 6 ) x 10 = 77.5
6 + 2
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo 3: Hallar la moda de 200 trabajadores de una empresa cuyos ingresos anuales en
miles de soles es:
Salarios f
i
[6 10) 0
[10 14) 30
[14 18) 70
[18 22) 60
[22 26) 40
200
Manual de Estadstica General
43
Solucin:
Aplicando la Formula:
d
1
= 70 30 = 40 d
2
= 70 60 = 10
Mo = 14 + ( 40 ) x 4 = 17.2
40 + 10
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
ESTADIGRAFOS DE DISPERSION
Los estadgrafos de dispersin son medidas que nos dan la mayor o menor concentracin de
observaciones con respecto a un valor central.
Miden el grado de dispersin o concentracin de los valores o datos, alrededor de alguna de las
medidas de tendencia central.
Estos estadgrafos son los siguientes:
- El Recorrido
- La Desviacin Media
- La Varianza
- La Desviacin Estndar
- El Coeficiente de Variacin
EL RECORRIDO
El Recorrido o Rango de un conjunto de datos est por la Diferencia Existente entre el Mayor y
el Menor Valor de una variable estadstica.
Se representa por R, y se expresa: R = X
Max
- X
min
Cunado Mayor es el Rango, Mayor es la Dispersin de los datos alrededor de la medida de
tendencia central.
Ejemplo 1: Determinar el rango, para los siguientes datos: Xi : 2, 3, 5, 21, 10, 0
Solucin:
R = X
Max
X
min
R = 21 0 R = 21
Ejemplo 2: Determinar el rango, en la siguientes distribucin de frecuencia: (Salarios anuales en
miles de soles)
Solucin:
Intervalo
[80 85)
[85 90)
[90 95)
[90 100)
[100 105)
[105 110)
[110 115]
En este caso, se trata de variable contnua,
entonces el Valor Mayor (X
M
) ser el lmite
superior (L
s
) del ltimo intervalo y el valor
menor (X
m
) ser el lmite inferior (L
i
) del
primer intervalo.
Luego: R = X
Max
X
min
R = L
s
- L
i
R = 115 80
R = 35
Manual de Estadstica General
44
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Nota: Se debe hacer notar que este estadgrafo da una Falsa Impresin del Grado de
Dispersin, ya que el rango Depende de la distancia que existe entre sus dos Valores Extremos
con relacin a los dems.
LA DESVIACION MEDIA
Llamada tambin desviacin promedio o variacin media. Est definida como la Media
Aritmtica de las Diferencias de cada Valor de una Serie de Datos, Respecto a la Media
Aritmtica de Dicha Serie.
Se Simboliza por D.M.
Para Datos No Agrupados
Sean X
1
, X
2
, X
m
las observaciones con que se cuenta, se tiene: D.M. =
Donde:
D.M. = Desviacin Media
n = Nmero de Observaciones
X
i
= Valor que toma la variable
= Media Aritmtica
= Valor Absoluto de las Desviaciones con respecto a la Media.
Ejemplo: Hallar la desviacin media de los siguientes datos: 2 3 6 8 11
Solucin:
1. Se debe hallar la Media Aritmtica
= = 2 + 3 + 6 + 8 + 11 = 30 = 6
5 5
2. Se determinan las desviaciones con respecto a la media.
X
i
2 |2 - 6| 4
3 |3 - 6| 3
6 |6 - 6| 0
8 |8 - 6| 2
11 |11 6| 5
14
Luego: D.M. =
D.M. = 14
5
D.M. = 2.8
Manual de Estadstica General
45
n
X Xi
m
i

1
X Xi
X
n
X
m
i
i
1
X X X
X Xi X Xi
n
X Xi
m
i

1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Para Datos Agrupados (Variable Discreta)
Sea Xi : donde i = 1, 2, , m, valores de la variable X;
Sea fi: donde i = 1, 2, , m, sus frecuencias correspondientes; y
Sea la media aritmtica de dichos valores; la desviacin media est dada por:
D.M. =
Ejemplo: Hallar la Desviacin Media para los datos del siguiente cuadro:
X
i
f
i
X
i
f
i
f
i
8 4 32 20.95 12.95 51.80
14 10 140 6.95 69.50
19 17 323 1.95 33.15
22 9 198 1.05 9.45
27 12 324 6.05 72.60
30 8 240 9.05 72.40
60 1257 308.90
Solucin:
1) Hallar la media aritmtica: = = 1257 =
20.95
60
2) Hallar D.M. D.M. = = 308.90
= 5.148
60
Para Datos Agrupados (Variable Continua)
Sea X
i
, donde i = 1, 2, ..., m, las marcas de clase de los m intervalos:
Sea f
i
, donde i = 1, 2, ..., m, sus frecuencias respectivas; y
Sea la media aritmtica: la desviacin media est dada por:
D.M. =
Manual de Estadstica General
46
n
f X Xi
i
m
i

1
X
n
f X
m
i
i i
1
X
n
f X Xi
i
m
i

1
X Xi
X
X Xi
X
n
f X X
i
m
i
i

1
'
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo: Hallar la desviacin media para los datos del siguiente cuadro:
X
i
f
i
[4 12) 15
[12 20) 87
[20 28) 45
[28 36] 13
160
Solucin:
1. Hallar la media aritmtica: = = 3008 = 18.8
160
X
i
X
i
f
i
X
i
f
i
f
i

[4 12) 8 15 120 18.8 10.8 162.0
[12 20) 16 87 1392 2.8 243.6
[20 28) 24 45 1080 5.2 234.0
[28 36] 32 13 416 13.2 171.6
160 3008 811.2
2. Hallar D.M.
D.M. = = 811.2 = 5.07
160
LA VARIANZA:
Esta medida proporciona informacin sobre el Grado de Dispersin de los valores de una serie
con Respecto a su Media Aritmtica de tal modo que mientras Mayor sea el Valor de la
Varianza, Mayor es la dispersin y cuanto ms pequea sea la Varianza, mayor es la
concentracin de los datos o valores alrededor de su media aritmtica.
Es la media o Promedio del Cuadrado de las Desviaciones de la Variable Respecto a su Media.
Nota: La Varianza est dada en unidades cuadradas correspondientes a la unidad en la que est
dada la variable.
Para Datos No Agrupados:
Se emplea la siguiente formula: S
2
= o S
2
= -
Manual de Estadstica General
47
X Xi ' X Xi '
n
f X
m
i
i i
1
'
X
X
n
f X X
i
m
i
i

1
'
n
X X
m
i
i

1
2
) (
n
X
m
i
i
1
2
2
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Donde: S
2
= Varianza
n = nmero de observaciones
X
i
= Valores que toma la variable
= Media Aritmtica
(X
i
- )
2
= Desviacin de la variable con respecto a la media, elevado al
cuadrado
Ejemplo: Determinar la varianza para los datos que aparecen en la siguiente tabla,
correspondiente a salarios en miles de soles: 2, 4, 6
Solucin:
1) Hallar la media aritmtica: =
= 2 + 4 + 6 = 4
3
X
i
X
i
2
2 4 4 16
4 16
6 36
56
2) Hallar: S
2
= - =
56 16 = 18.66 - 16 = 2.66
3
Para Datos Agrupados (Variable Discreta):
Sea X
i
, donde i = 1, 2, ..., m, valores de la variable X.
Sea f
i
, donde i = 1, 2, ..., m; sus frecuencias correspondientes: sea la media aritmtica de
dichos valores y n el nmero de observaciones, se tiene que la varianza est dada por:
S
2
= = -
S
2
= -
Manual de Estadstica General
48
X
X
n
X
m
i
i
1
X
X
2
X
n
X
m
i
i
1
2
2
X
n
f X X
i
m
i
i

1
2
) (
n
f X
m
i
i i
1
2
2
X
n
f X
i
m
i
i
1
2
2
1

,
_

n
f X
m
i
i i
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
Ejemplo: Considerando los datos que aparecen en la siguiente tabla:
Personas
Activas X
i
N de familias f
i
X
i
2
X
i
2
f
i
X
i
f
i
1 16 1 16 16
2 20 4 80 40
3 9 9 81 27
4 5 16 80 20
50 257 103
Solucin
S
2
= -
S
2
= 257 - S
2
= 5.14 (2.06)
2
S
2
= 5.14 4.24 = 0.9
50
S
2
= 0.9
Para Datos Agrupados (Variable Continua):
Sea X
i
, donde i = 1, 2, ..., m, las marcas de Clase de los m intervalos.
Sea f
i
, donde i = 1, 2, ..., m; sus frecuencias respectivas: sea la media aritmtica y n el nmero
de observaciones, la varianza est dada por:
S
2
= = -
Ejemplo: Consideremos los datos que aparecen en la Tabla siguiente:
Peso (Kg) Personas (f
i
) X
i
X
i

2
X
i

2
f
i
X
i
f
i
[30 40) 0 35 1225 0 0
[40 50) 10 45 2025 20250 450
Manual de Estadstica General
49
n
f X
i
m
i
i
1
2
2
1

,
_

n
f X
m
i
i i
2
50
103

,
_

n
f X X
i
m
i
i

1
2
) ' (
n
f X
m
i
i i
1
2
'
2
1
'

,
_

n
f X
m
i
i i
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
[50 60) 20 55 3025 60500 1100
[60 70) 30 65 4225 126750 1950
[70 80] 10 75 5625 56250 750
70 263750 4250
Solucin:
Aplicando la formula tenemos:
S
2
= 263750 - S
2
= 3767.857 - (60.714)2
70
S
2
= 3767.857 - 3686.1897 S
2
= 81.66
Metodo Abreviado para Datos Agrupados (Variable Continua):
Se emplea nicamente cuando la Amplitud es constante.
S
2
= C
i
2
Donde: d
i
=
Ejemplo: Haciendo uso del mtodo abreviado, calcular la varianza de los datos considerados en
la Tabla del ejemplo anterior.
Peso (Kg) Personas (f
i
) X
i
d
i
f
i
d
i
f
i
d
i
2
[30 40) 0 35 -3 0 0
[40 50) 10 45 -2 -20 40
[50 60) 20 55 -1 -20 20
[60 70) 30 65 0 0 0
[70 80] 10 75 1 10 10
70 -30 70
Solucin:
S
2
= (10)
2
S
2
= 100 [1 (-0.4285)
2
] = 100 [1 0.1836]
S
2
= 100 [0.8164] S
2
= 81.64
Manual de Estadstica General
50
2
70
4250

,
_

1
1
1
1
1
]
1

,
_



2
1 1
2
n
d f
n
d f
m
i
i i
m
i
i i
i
t i
C
O X '
1
1
]
1

,
_

2
70
30
70
70
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
LA DESVIACION ESTANDAR O TIPICA
Es una de las medidas de dispersin ms confiables. Mide el Grado de Normalidad de la
Distribucin de los datos mustrales alrededor de la media aritmtica dentro de sus valores
extremos mnimo y mximo, es decir, mide la dispersin alrededor de la media.
A mayor valor de la desviacin estndar, mayor es la dispersin.
La Desviacin Estndar se define como la Raz Cuadrada, con signo positivo, de la Varianza y
se Representa por S.
Para datos No Agrupados:
La Desviacin Estndar de una serie de variables X
1
, X
2
, ..., X
m
est definida por:
S = S =
Donde:
S = desviacin estndar
X
i
= valores que toma la variable
= media aritmtica de los datos
n = nmero de observaciones
(Xi - )
2
= desviaciones de la variable, con respecto a la media, elevado al cuadrado.
Nota:
1) S es mayor que cero
2) S = 0, en el caso que las Xi sean iguales, y por lo tanto, no hay dispersin
Ejemplo: Calcular la desviacin tpica o estndar para los siguientes datos: 2, 4, 6
Solucin:
n = 3
X
i
X
i
2
2 4 4 16
4 16
6 36
Manual de Estadstica General
51
X
n
X Xi
m
i

1
2
) (
2
1
2
X
n
X
m
i
i

X
X
X
2
X
S = 16
3
56
= 66 . 2
S = 1.63
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
56
Para datos Agrupados (Variable Discreta):
Sea X
i
, donde: i = 1, 2, ..., m; valores de la variable X;
Sea f
i
, donde: i = 1, 2, ..., m; sus frecuencias correspondientes;
Sea la media aritmtica, y n el nmero de observaciones, la desviacin estndar est dada por:
S = S =
Ejemplo: Consideramos la siguiente distribucin de frecuencias.
X
i
f
i
X
2
X
2
f
i
X
i
f
i
1 16 1 16 16
2 20 4 80 40
3 9 9 81 27
4 5 16 80 20
50 257 103
S = S = 0.94
Para datos Agrupados (Variable Continua):
Sea X
i
, donde: i = 1, 2, ..., m; son las marcas de clase de los intervalos;
Sea f
i
, donde: i = 1, 2, ..., m; sus frecuencias respectivas;
Sea la media aritmtica, y n el nmero de observaciones, la desviacin estndar est dada por:
S = S =
Ejemplo: Hallar la desviacin estndar para la siguiente distribucin de frecuencias:
Peso (Kg) Personas
(f
i
)
X
i
X
i

2
f
i
X
i
f
i
[30 40) 0 35 0 0
[40 50) 10 45 20250 450
Manual de Estadstica General
52
X
n
f X X
m
i
i i

1
2
) (
2
1 1
2

,
_



n
f X
n
f X
m
i
i i
m
i
i i
2
50
103
50
257

,
_

X
n
f X X
m
i
i i

1
2
) ' (
2
1 1
2
' '

,
_



n
f X
n
f X
m
i
i i
m
i
i i
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
[50 60) 20 55 60500 1100
[60 70) 30 65 126750 1950
[70 80] 10 75 56250 750
70 263750 4250
Solucin:
S = S = S = 9.03
Mtodo Abreviado para datos Agrupados (Variable Continua):
Este mtodo se aplica nicamente para Intervalos con Amplitud Constante.
Se emplea la siguiente frmula:
S = C
i
Donde:
d
i
= Y
i
- O
t
C
i
Ejemplo: Haciendo uso del mtodo abreviado, calcular la desviacin estndar para la
distribucin de frecuencias del ejemplo anterior.
Peso (Kg)
Personas
(f
i
)
X
i
d
i
f
i
d
i
f
i
d
i
2
[30 40) 0 35 -3 0 0
[40 50) 10 45 -2 -20 40
[50 60) 20 55 -1 -20 20
[60 70) 30 65 0 0 0
[70 80] 10 75 1 10 10
70 -30 70
S = 10 S = 10 S = 9.03
Manual de Estadstica General
53
2
70
4250
70
263750

,
_

66 . 81
2
1 1
2

,
_



n
d f
n
d f
m
i
i i
m
i
i i
2
70
30
70
70

,
_

8164 . 0
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
EL COEFICIENTE DE VARIACION
Sirve para determinar la Homogeneidad o Heterogeneidad del Grupo que se analiza, cuando
menor es el coeficiente de variacin el grupo es ms homogneo. Su valor se da en trminos de
porcentaje. Se emplea tambin para comparar dos distribuciones en base a su dispersin.
Se representa por C.V. y se expresa de la siguiente manera:
C.V. = 100%
Ejemplo:
En la Zona A, el promedio de hijos por familia es de 5, con S = 3
En la Zona B, el promedio de hijos por familia es de 2, con S = 1
Cul de los grupos es ms homogneo?
Datos
Zona A Zona B
= 5 = 2
S = 3 S = 1
Calculo de los coeficientes de variacin:
i) Para la zona A
C.V. = 100% C.V. = 60%
ii) Para la zona B
C.V. = 100% C.V. = 50%
Como el C.V. para la zona B, es menor que el C.V. para la Zona A, entonces concluimos que el
grupo B es el ms homogneo.
Manual de Estadstica General
54

,
_

X
S
Donde:
S = desviacin estndar
X = media aritmtica
X
X

,
_

5
3

,
_

2
1
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
EJERCICIOS RESUELTOS
1. Desarrollar
a) Completar los datos que faltan en la siguiente tabla estadstica:
Xi fi Fi hi
1 4 0.08
2 4
3 16 0.16
4 7 0.14
5 5 28
6 38
7 7 45
8
b) Calcula la media, mediana y moda de esta distribucin
Solucin:
a. La Frecuencia relativa de 1 es 0.08 = 4 , de donde n = 50, lo que nos permite
n
completar la tabla
Xi fi Fi hi Xifi
1 4 4 0.08 4
2 4 8 0.08 8
3 8 16 0.16 24
4 7 23 0.14 28
5 5 28 0.10 25
6 10 38 0.20 60
7 7 45 0.14 49
8 5 50 0.10 40
50 1.00 238
b. La Media Aritmtica: = 238 = 4.76
50
La Mediana: n = 50 = 25
2 2
Md = 5
Manual de Estadstica General
55
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
La Moda: Es la mayor frecuencia por que son datos agrupados, entonces Mo = 6
2. Observados los alquileres de un conjunto de despachos se ha obtenido:
Alquiler en
miles de Soles
fi
[00 - 15) 17
[15 - 30) 130
[30 - 45) 180
[45 60) 30
[60 - 75) 10
[75 - 90] 5
Calcula la moda y la mediana
Solucin:
Como los datos son agrupados tenemos:
Para la Moda: Mo = 30 + 50 x 15 Mo = 30 + 3.75
150 + 50
Mo = 33.75
Para la Mediana:
Alquiler en
miles de Soles
fi Fi
[00 - 15) 17 17
[15 - 30) 130 147
[30 - 45) 180 327
[45 60) 30 357
[60 - 75) 10 367
[75 - 90] 5 372
372
Md = 30 + 186 - 147 x 15 = 30 + 3.25 = 33.25
180
Manual de Estadstica General
56
n = 372 = 186
2 2
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
3. Se considera una distribucin de datos agrupados en intervalos cuyo polgono de
frecuencia acumulada es el de la figura:
Calcular:
a) Tabla de distribucin de frecuencias
b) La Media
Solucin
a)
Xi fi Fi hi Hi Xifi
20 3 3 0.15 0.15 60
40 6 9 0.30 0.45 240
60 5 14 0.25 0.70 300
80 0 14 0 0.70 0
100 6 20 0.30 1.00 600
20 1.00 1200
b)
= 120 = 60
20
Manual de Estadstica General
57
0
5
10
15
20
25
0 20 40 60 80 100 120
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
4. La distribucin de las notas obtenidas por 60 alumnos en un examen, agrupados en intervalos, es:
Determine:
a) La Media Aritmtica
b) La Mediana
c) La Moda
d) La Desviacin Media
Solucin:
Manual de Estadstica General
Notas fi
[0 1) 1
[1 2) 2
[2 3) 5
[3 4) 7
[4 5) 9
[5 6) 15
[6 7) 11
[7 8) 6
[8 9) 3
[9 10] 1
Notas Xi fi Fi Xifi
X Xi '
X Xi '
fi
[0 1) 0.5 1 1 0.5 4.75 4.75
[1 2) 1.5 2 3 3 3.75 7.50
[2 3) 2.5 5 8 12.5 2.75 13.75
[3 4) 3.5 7 15 24.5 1.75 12.75
[4 5) 4.5 9 24 40.5 0.75 6.75
[5 6) 5.5 15 39 82.5 0.25 3.75
[6 7) 6.5 11 50 71.5 1.25 13.75
[7 8) 7.5 6 56 45 2.25 13.5
[8 9) 8.5 3 59 25.5 3.25 9.75
[9 10] 9.5 1 60 9.5 4.25 4.25
60 315 90
58
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
a) La Media Aritmtica: = 315 = 5.25
60
b) La Mediana: n = 60 = 30
2 2
Md = 5 + 30 - 24 x 1 = 5.04
15
c) La Moda: Mo = 5 + 6 . x 1 = 5 + 0.6 = 5.6
6 + 4
d) La Desviacin Media: D.M. = 90 = 1.5
60
PROBLEMAS PROPUESTOS
1. Se distribuye el nmero de empresas segn sus inversiones en millones de soles.
[ )
s i
L L
i
f
4 10 1
10 16 3
16 22 6
22 28 12
28 34 11
34 40 5
40 46 2
a) Cuntas empresas intervienen en menos de 25 millones de soles?
b) Hallar la Media Aritmtica, Mediana, La Moda, la Desviacin Media
2. Se tiene las temperaturas observadas en el hemisferio norte durante 24 das en C.
Manual de Estadstica General
59
X
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
[ )
s i
L L
i
f
h
i
-19 - -17
-17 -15 2
-15 -13 8
-13 -11 0.125
-11 -9 4
-9 -7 0.2083
a) Durante cuntos das se obtuvo una temperatura de 16 a 10?
b) Hallar la Mediana y la Desviacin Media
3. La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias.
[ )
s i
L L
i
f
F
i
h
i
160 170
170 180 48 60
180 190 0.125
190 200 0.075
200 210
a) Determinar el nmero de familias que ganan menos de 200 nuevos soles.
b) Hallar la Moda y la Mediana
4. Se revisaron 20 lotes de 48 artculos cada uno y se encontr el siguiente nmero de artculos
defectuosos por lote: 3, 2, 5, 0, 1, 3, 2, 1, 0, 1, 3, 4, 2, 4, 4, 4, 3, 3, 2, 3
Construir el cuadro de distribucin de frecuencias y qu porcentaje de lotes tienen 2 o ms
pero menos de 4 artculos defectuosos?
5. Dado el siguiente cuadro estadstico referente a los pesos de cierto nmero de pacientes en un
hospital.
[ )
s i
L L
i
f
0 12 5
12 24 24
24 36 18
36 48 36
48 - 60 17
a) Cuntos pacientes pesan mas de 19 y menos de 38 kilos?
b) Hallar la Desviacin Media
c) Hallar la Mediana
Manual de Estadstica General
60
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
6. En una prueba de estadstica se evaluaron a n estudiantes y se obtuvo el siguiente cuadro
estadstico.
Marca de
clase
45 55 65 75 85
Frecuencia
relativa
2n/25 3n/100 n/50 3n/50 n/100
a) Qu porcentaje de estudiantes obtuvieron una nota menor que 60 puntos o mayor o igual
a 80 puntos?
b) Hallar la Mediana, La Moda y la Desviacin Media
7. Dada la siguiente distribucin de frecuencias en base al ingreso familiar de 200 familias.
[ )
s i
L L
i
f
F
i
- 12
- 270
- 300 30 90
- 126
330 -
- 50
a) Cuntas familias tienen un ingreso comprendido entre 260 y 320?
b) Hallara La media Aritmtica, La Mediana y la Moda
8. Se tiene la siguiente distribucin simtrica.
[ )
s i
L L
i
f
F
i
h
i
- 8
12 -
- 1/5
- 24 17
-
Si el ancho de clase es constante. Cuntos datos habr en el intervalo [12 20>?
Hallar la Median y la Media Aritmtica
9. Los tiempos de vida til (en das) de un tipo de bacteria, se tabul en una distribucin de
frecuencias de 5 intervalos de igual amplitud con frecuencias relativas acumuladas: 0.10;
0.25; 0.55; 0.80; 1.00. Determine la distribucin de frecuencias absolutas, si la tercera
Manual de Estadstica General
61
INSTITUTO SUPERIOR TECNOLOGICO Prof. Ing. Diego Tume Ruiz
FREDERICK WINSLOW TAYLOR.
frecuencia absoluta acumulada es 11, si la segunda marca de clase es 6, y si el lmite inferior
del cuarto intervalo es 12.
Hallar la Media Aritmtica, La Mediana y La Moda
Manual de Estadstica General
62

Das könnte Ihnen auch gefallen