Beruflich Dokumente
Kultur Dokumente
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con
mayor frecuencia.
Caractersticas de la moda
La moda se puede calcular para datos medidos en cualquier escala de medicin.
El valor de la moda no se ve afectado por valores extremos.
La moda no siempre es un valor nico. Una serie de datos puede tener dos modas (bimodal) o
ms modas (multimodal).
Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos
comprados por 14 clientes de cierto supermercado.
2
80
80
19
Ejemplo 2
En la empresa A, se midi el nmero de errores por da que cometieron 158 obreros al ensamblar
un determinado producto. Calcule e interprete la moda del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar el producto
Nmero de errores Nmero de obreros
0
25
45
60
28
Mediana
Es el percentil 50, tambin llamado segundo cuartil.
Caractersticas de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.
La mediana es un estadstico que no se ve afectado por valores extremos. Por eso se le utiliza
cuando hay datos inusuales o el polgono de frecuencias no es muy simtrico.
Ejemplo 3
El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar
una tarea se muestra en la siguiente tabla.
Capacitados
4,5
4,3
2,7
8,2
8,3
6,4
5,4
No capacitados
8,3
7,4
8,5
8,5
9,0
8,4
18
3,4
2,7
5,6
Calcule e interprete la mediana del tiempo para cada grupo. Compare los valores hallados y
comente.
20
Ejemplo 4
En la empresa A se tom una muestra aleatoria de trabajadores y se les pregunt por sus ingresos
mensuales, en dlares, obtenindose los siguientes resultados.
Distribucin de trabajadores por sus ingresos mensuales (en dlares)
Ingresos (en dlares)
[
Marca de clase
]
Nmero de trabajadores
30
175
225
200
45
225
275
250
190
275
325
300
140
275
325
325
2600
130
2500
25
Media Aritmtica
La media aritmtica es el valor que se obtiene al dividir la suma total de los datos entre el nmero
de datos.
Caractersticas de la media
Se puede calcular para datos medidos en escala de intervalo o razn.
El clculo de la media es sencillo y es la medida de tendencia central ms conocida.
El valor de la media depende de todos los datos, por lo que la presencia de valores muy
grandes o muy pequeos con respecto a los dems pueden cambiar drsticamente su valor.
y = ax + b
n
= nx
i =1
21
(x
x) = 0
i =1
(x
2
c ) , entonces S (c ) tiene mnimo absoluto
i =1
i =1
x=
Ejemplo 5
Calcule e interprete la media de los siguientes datos que representan el nmero de papeletas
pendientes de pago de cada uno de 11 choferes de vehculos de transporte pblico seleccionados
al azar.
12
13
25
20
17
19
15
14
28
Ejemplo 6
En la empresa A, se midi el nmero de errores que cometieron 158 obreros al ensamblar un
determinado producto. Calcule e interprete la media del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar un producto
Nmero de errores Nmero de obreros
0
25
45
60
28
m n
i i
x=
i =1
m f
i i
i =1
22
Ejemplo 7
En el distrito A se tom una muestra aleatoria de jvenes y se les pregunt por su estatura, en
centmetros, obtenindose los siguientes resultados.
Distrito A. Estaturas de una muestra de 800 jvenes
Marca de
clase
150
Nmero de
jvenes
Porcentaje
de jvenes
Nmero
acumulado
de jvenes
166
Porcentaje
acumulado
de jvenes
0,48
32%
0,95
800
xp =
w x
i =i
n
w
i =1
23
-20
30
Grupo 2
Grupo 3
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:
R = valor mximo valor mnimo
24
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango intercuartil = RIC = Q3 Q1= P75 P25
Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como referencia los
valores de los cuartiles como medidas de posicin, la mediana como medida de tendencia central
y el valor del rango intercuartil como medida de dispersin. Adems, permite apreciar la forma de
la distribucin de los datos (simtrica o asimtrica).
Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera dato
atpico a cualquier valor que est:
o a ms de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
o a ms de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil
o
o
o
Sobre un eje horizontal, se traza un rectngulo con los extremos en el primer cuartil (Q1) y
tercer cuartil (Q3).
En la caja rectangular se traza un segmento vertical en el lugar de la mediana.
Se determinan los lmites para deteccin de datos atpicos:
- el lmite superior est a 1,5(RIC) a la derecha de Q3
- el lmite inferior est a 1,5(RIC) a la izquierda de Q1
Se detectan los datos atpicos.
Se trazan los bigotes desde los extremos de la caja hasta los datos mnimo y mximo dentro de
los lmites inferior y superior.
Se marcan con un asterisco (*) las localizaciones de los datos atpicos (datos fuera de los
lmites superior e inferior).
25
Ejemplo 10
Se seleccion una muestra de 45 viviendas y se registr el monto cobrado por la empresa
proveedora por consumo de luz en el ltimo mes. Obtenga un diagrama de cajas para mostrar la
distribucin de los montos cobrados.
10,7 45,0 59,8 65,7 87,4 97,1 98,1 98,8 99,2 99,5 99,6 99,7 102,4 106,3 107,3
108,2 108,7 109,2 109,3 109,9 111,4 112,1 112,6 112,9 115,0 115,4 116,4 116,5 119,1 119,2
119,6 120,4 120,6 121,5 122,1 122,7 124,0 124,5 124,9 125,1 125,2 127,1 128,1 129,0 200,8
26
Ejemplo 11
Se desea comparar el resultado de la primera prctica de tres horarios de Estadstica de EEGGCC,
para lo cual, se tienen los siguientes resultados.
H
1
H
2
H
3
0
1
1
2
1
2
3
1
2
4
1
2
1
1
1
3
1
1
1
3
1
2
1
4
1
2
1
4
1
0
1
2
1
4
1
1
1
2
1
4
1
1
1
2
1
4
1
2
1
2
1
4
1
2
1
2
1
5
1
3
1
3
1
5
1
3
1
3
1
6
1
3
1
3
1
6
1
4
1
4
1
6
1
5
1
4
1
6
1
5
1
5
1
6
1
6
1
5
1
7
1
6
1
5
1
7
1
6
1
5
1
8
1
7
1
5
1
8
1
7
1
5
1
8
1
7
2
0
1
8
2
0
Construya un diagrama de cajas que permita comparar las notas en los tres horarios.
Desviacin absoluta
Dados n datos x1, x2,, xn la desviacin absoluta de los datos se define como:
n
D. A. =
x x
i
i =1
Desviacin estndar
Dados n datos x1, x2,, xn la desviacin estndar de los datos se define como:
n
sd x =
(x
i =1
x)
( 6) 2 + ( 1) 2 + 32 + 4 2
= 3.937
4
27
Ejemplo 13
Calcule e interprete la media y la desviacin estndar de los siguientes datos que representan el
nmero de personas atendidas por da en la caseta de informacin de un proyecto inmobiliario, en
una muestra de 15 das.
18
10
11
Ejemplo 14
Calcule la desviacin estndar de los siguientes datos.
xi
ni
20
85
48
120
26
150
45
n (m x )
sd x =
i =1
f (m x )
i =1
Ejemplo 15
Calcule la media y la desviacin estndar de los siguientes datos.
Intervalos
[2,5
Marca de clase
12,0]
ni
9
75
56
8
4
28
Varianza
Dados n datos x1, x2,, xn la varianza de los datos se define como sd x2 = (sd x )
Se cumple que sd =
2
x
(x
i =1
x)
n
x
xi
i =1
=
i =1
n
n
2
i
sd y2 = a 2 sd x2 , de donde sd y = a sd x
Ejemplo 16
En una ciudad, se ha registrado el precio, en varias tiendas, de varillas de acero de 12 mm,
encontrndose un precio medio de 19,80 nuevos soles y una desviacin estndar de 0,85 nuevos
soles. Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la
nueva desviacin estndar de los precios.
Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica qu proporcin de la media es la
desviacin estndar.
La frmula para el coeficiente de variacin para una muestra es
CV =
sd x
x
Ejemplo 18
El coeficiente de variacin de los salarios un grupo de trabajadores es 0,12. Si se aprueba un
aumento del 20% ms una bonificacin especial de S/.115, el nuevo coeficiente de variacin ser
igual a 0,06. Determine el valor de la media y la varianza de los salarios de los obreros, antes y
despus del aumento.
Ejemplo 19
El siguiente cuadro muestra la distribucin de sueldos mensuales de los empleados de dos
empresas A y B en el mes de julio del 2011.
Empresas A y B. Sueldos mensuales en diciembre del 2011
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[2 500 3 500]
14
]3 500 4 500]
25
25
]4 500 5 500]
35
83
]5 500 6 500]
15
Puntuacin estandarizada Z
Indica a cuntas desviaciones estndar, por arriba o por debajo de la media, se encuentra un valor.
Permite comparar los resultados de un individuo en distintas pruebas en las que las
distribuciones de los resultados de los otros miembros de la poblacin sean distintas.
Si los datos son xi, i = 1, 2,, n, entonces los datos estandarizados son:
zi =
xi x
sd x
i = 1, 2,, n
30
f1 = f k ,
x Q2
As = 3
sd x
Ejemplo 21
El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuacin:
25
14
19
14
15
16
15
15
18
15
52
24
36
15
15
23
24
31
Ejemplo 22
El siguiente cuadro muestra la distribucin del sueldo mensual de los empleados de dos empresas
A y B en julio del 2011.
Empresas A y B. Sueldos mensuales en julio del 2012
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1 500 2 500]
]2 500 3 500]
40
]3 500 4 500]
12
25
]4 500 5 500]
]5 500 6 500]
32