Beruflich Dokumente
Kultur Dokumente
2015-1
ESTADSTICA DESCRIPTIVA
Captulos: 1; 2 y 3
danielmavila@yahoo.es
RR 02640-R-2011
descontarn
puntos
aiga,
osea,
Definicin de Estadstica
La Estadstica es la ciencia de la
sistematizacin, recogida, ordenacin y presentacin
de los datos referentes a un fenmeno que presenta
variabilidad o incertidumbre para su estudio metdico,
con objeto de
deducir las leyes (Razonamiento deductivo: teora de
probabilidad) que rigen esos fenmenos.
Estadstica Descriptiva
RECOLECCIN
DE LOS
DATOS
ANLISIS
DE LOS
DATOS
ANLISIS
DESCRIPTIVO
PRESENTACIN
DE LOS
DATOS
TABLAS,
GRFICOS
Experimento
Es un estudio en el que se manipulan
intencionalmente
una
o
ms
variables
independientes (supuestas causas - antecedentes),
para analizar las consecuencias que la
manipulacin tiene sobre una o ms variables
dependientes (supuestos efectos consecuentes),
dentro de una situacin de control para el
investigador.
Determina si la presencia / ausencia de una
variable afecta a otra. Determina la magnitud de la
influencia. Debe tener control sobre el efecto de
variables extraas.
NOTACIN CIENTFICA
Utilizando la notacin cientfica el nmero se
escribe como un producto de dos partes: un
nmero comprendido entre 1 y 10 y una potencia
de 10.
El nmero se representa con una cifra entera
seguido de todas las cifras significativas y
multiplicado por la potencia de 10. La potencia de
diez recibe el nombre de exponente.
NOTACION CIENTIFICA
El exponente positivo de la potencia de diez indica el
nmero de lugares que la coma decimal se debe mover
hacia la derecha si expresamos el nmero sin la potencia
de diez. Un exponente negativo indica que se mover
hacia la izquierda.
Ejemplo:
42581000000 equivale a _____________________ con 3 decimales
0,042581 equivale a _____________________
con 2 decimales
8.88887E+11
8.89E-01
Cifras significativas
5 cifras significativas
5 cifras significativas
0,000059847 mg
203,6589 pulg
289 360 000 km
0,005474 mm
______________________
______________________
______________________
______________________
Poblacin y muestra
Alumnos de la Facultad.
Clientes con tarjeta Bonus.
Pacientes que se atienden en un consultorio.
Departamentos construidos con el Programa Mi Vivienda
VARIABLES
Segn su naturaleza
Variable no mtrica, cualitativa, nominal o categrica
Se define cuando expresa una cualidad, caracterstica o atributo, tienen
carcter cualitativo, es decir, sus datos se expresan mediante una
palabra, como por ejemplo: Los colores, profesiones, causa de
accidentes, etc. Tambin se llaman estadsticas o de atributos.
Escalas de medicin
cuantificar la distancia entre una categora y otra, por ejemplo: ciclo acadmico.
Ejemplo:
Objeto de actitud medido: El voto
Afirmacin: Votar es una obligacin de
todo ciudadano responsable
Muy de acuerdo
De acuerdo
"Afirmacin"
Ni de acuerdo, ni en
En desacuerdo
desacuerdo
Muy en
desacuerdo
"Afirmacin"
Totalmente de
acuerdo
De acuerdo
Neutral
En desacuerdo
Totalmente en
desacuerdo
"Afirmacin"
Definitivamente Probablemente
si
si
Indeciso
Probablemente Definitivamente
no
no
"Afirmacin"
Completamente
verdadero
Verdadero
Ni falso, ni verdadero
Falso
Completamente
falso
Diferencial Semntico
Consiste en una serie de adjetivos extremos
que califican al objeto de actitud con un
conjunto de adjetivos bipolares; entre cada
par de adjetivos, se presentan varias opciones
y el sujeto selecciona aquella que en mayor
medida refleje su actitud.
Diferencial Semntico
Ejemplo:
Objeto de actitud: Candidato A
Justo__:__:__:__:__:__:__Injusto
Debe observarse que los adjetivos son
extremos y que entre ello hay siete
opciones de respuesta. Cada sujeto califica al
candidato A en trminos de esta escala de
adjetivos bipolares.
Escala de Stapel
Tcnica de autoinforme para la medicin de actitudes en que
se pide a los sujetos que indiquen el grado de exactitud con
que cada una de diversas afirmaciones describe al objeto
de inters. Ejemplo:
Seleccione un nmero positivo para palabras que en su
opinin, describa con precisin al objeto (por ejemplo
servicio administrativo de la Facultad). Cuanto ms
exacta piense que es la descripcin, tanto mayor ser el
nmero positivo que debe elegir. De igual modo,
seleccione un nmero negativo para las expresiones que
en su opinin no la describa exactamente.
-5
-4 +1
+5
El trato es corts.
El horario es conveniente.
La regin de
Arequipa convoc a
un referendo sobre la
aprobacin de la Ley
del Talin.
Completa la tabla de
distribucin de
frecuencias absolutas
y relativas asumiendo
los valores resultantes
que desees.
OPCIN
VOTOS Frecuencia
(000) relativa %
fi = ni/N
ni
SI
TOTAL (N)
1 200
c
m
4) Determinar los lmites de cada clase i: Yi-1 (Lmite inferior de
la clase i) y Yi (Lmite superior de la clase i)
Yi = Yi-1 + c
5)
6)
7)
fi
hi
N
8)
i
Hi h j
j 1
9)
m
*
H h
i ji j
Ejemplo
El contenido de nicotina para producir cncer pulmonar, en miligramos, para una cajetilla de
40 cigarrillos marca TMata se registraron de la siguiente manera:
1.09
1.92
2.31
1.79
2.28
1.74
1.47
1.97
0.85
1.24
1.58
2.03
1.7
2.17
2.55
2.11
1.86
1.9
1.68
1.51
1.64
0.72
1.69
1.85
1.82
1.79
2.46
1.88
2.08
1.67
1.34
1.93
1.4
1.64
2.09
1.75
1.63
2.37
1.75
1.69
fi
hi
hi%
Hi
Hi%
Hi*
Hi*%
[0.72-1.025>
0.05
5.0%
0.05
5.0%
100.0%
[1.025-1.33>
0.05
5.0%
0.1
10.0%
0.95
95.0%
[1.33-1.635>
0.15
15.0%
0.25
25.0%
0.9
90.0%
[1.635-1.94>
19
0.475
47.5%
0.725
72.5%
0.75
75.0%
[1.94-2.245>
[2.245-2.55]
1
y > ( o [ ) no incluye a
0.125
B
6-10
C
11-15
D
16-20
E
21-30
F
31
Clases de desigual tamao. Los intervalos de clase que son desiguales no son
frecuentes en el anlisis estadstico, la utilizacin de los mismos se debe evitar;
sin embargo, en algunas investigaciones es indispensable su utilizacin; tal es el
caso de las investigaciones que tienen como propsito particular analizar valores
que varan en un amplio recorrido de la variable. Cuando se utiliza este tipo de
clase de los intervalos de clase deberan ser incrementados de una forma
ordenada, de ser posible. Este tipo de clases se utiliza algunas veces para
reportar datos relacionados con valuaciones de activos o ingresos personales.
La siguiente TDF contiene los ingresos mensuales en US$ de los
futbolistas mejor pagados en el mundial.
Clase
Menos de 150,000
150,000 239,000
340,000 429,000
430,000 519,000
520,000 609,000
610,000 699,000
700,000 789,000
790,000 y ms
Total
Frecuencia
67
36
10
8
7
8
7
7
150
Marca de clase
?
194500
384500
474500
564500
654500
744500
?
Ejercicio
y n1 = 1
Yi = Marca de clase i
Diagramas de sectores
(tartas, polares)
El rea de cada sector es
proporcional a su frecuencia (abs. o rel.)
10
60
70
80
90
100
110
120
130
S/.
419
400
375
Recuento
300
255
215
200
127
100
54
24
23
17
7 Ocho o ms
Nme ro de hijos
250
Recuento
200
150
100
50
20
40
60
80
Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente
diagrama integral. Se realizan a partir de las frecuencias acumuladas.
Indican, para cada valor de la variable, la cantidad (frecuencia) de
individuos que poseen un valor inferior o igual al mismo.
Un diagrama donde
cada valor de datos es
dividido en una "hoja"
(normalmente el ltimo
dgito) y un "tallo" (los
otros dgitos). Por
ejemplo "32" sera
dividido en "3" (tallo) y
"2" (hoja).
Los valores del "tallo" se
escriben hacia abajo y
los valores "hoja" van a
la derecha (o izquierda)
del los valores tallo.
El "tallo" es usado para
agrupar los puntajes y
cada "hoja" indica los
puntajes individuales
dentro de cada grupo.
20
14
18
7
10
10
6
8
18
5
9
9
13
7
14
23
13
3
10
15
13
6
32
4
10
12 19
7 10
9
7
27 19
9
6
18
13
10
16
7
24
7
11
8
15
22
668
1032
23
1
0
Parmetro y estadstico
Ejercicios
Medidas de posicin
Se define el cuantil (fractil) de orden k como un valor de la
variable por debajo del cual se encuentra una frecuencia
acumulada determinada.
Casos particulares de los cuantiles son los: percentiles
(centiles), cuartiles, deciles, quintiles, etctera.
Mtodos para calcular percentiles: Haverage, Waverage, Round
y Empirical y Aempirical
25%
75%
25%
P95%
5%
Ejercicios:
1) En un lote de bolsas de cemento Portland Tipo I Ecolgico
(aproximadamente 42,5 kg) almacenados en la Distribuidora Nemesia
Tchevishef EIRL. Qu percentil es superado solo por el 25% de las
bolsas de mayor peso?
Percentil ________.
2) El colesterol se distribuye simtricamente en la poblacin. Se
considera patolgico los valores extremos. El 90% de los individuos
son normales.
a) Entre qu percentiles se encuentran los individuos normales?
Entre el percentil ______ y el percentil _______.
b) Entre qu cuartiles y percentiles se encuentra la mitad de los
individuos ms normales de una poblacin?
Entre el cuartil _______ y el cuartil _______.
Entre el percentil _____ y el percentil __________
Ejercicios: (...)
P
K
L
i
K * n F 1
100
i
f
P
n : nmero de datos
Li : frontera de clase (Semisuma de lmite inferior
clase i y lmite superior clase i+1
: amplitud de clase
Ejemplo:
La tabla muestra la experiencia en aos de los
peones de la constructora A Lo Techo Pecho.
Experiencia
(aos)
Peones
0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27
Total
18
42
68
120
40
34
12
334
Menor
Experiencia
25 %
P75
Mayor
Experiencia
Kn 75( 334)
Experiencia
(aos)
0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27
N peones
fi
18
42
68
120
40
34
12
334
Frec. Acumulada
Fi
18
60
128
248
288
322
334
F=248
En esta clase
se localizan del
249avo 288avo
75 * (334) 248 1
100
*4
P
15.5
75
40
Diagrama de Caja
Es un grfico de caja es muy til para
representar diferencias entre grupos as como
mostrar los valores atpicos (discordantes, raros,
outliers, aislados). Permite analizar y resumir un
conjunto de datos univariante dado.
Para elaborar el diagrama solo se necesitan
cinco valores estadsticos: el valor mnimo, Q1
(primer cuartil); la mediana (Q2, segundo
cuartil); Q3 (tercer cuartil) y el valor mximo.
La principal desventaja es que no presenta
ninguna informacin de las frecuencias de los
datos.
Diagrama de Caja
Aparecen
valores
extremos
Poca
dispersin
Mucha
dispersin
o
X > Q3 + 1,5 IQR
o
X > Q3 + 3 IQR
z ks
(Box-and-Whisker plot)
Presin atmosfrica en 61 puntos de la Costa Nostra
105
125
138
148
153
110
126
138
148
153
158
160
168
168
112
127
138
148
154
160
170
112
128
138
149
154
160
172
118
130
141
150
154
163
172
119
132
142
150
154
164
176
120
133
144
150
155
164
179
120
134
145
151
156
165
120
135
146
151
156
166
Max
Q1
Md
132,5
149
105
158,5
179
Diagrama de Caja
Ejemplo. La empresa periodstica La Hora de la Beldad SA tiene
las siguientes ventas de sus revistas, elabora el diagrama de caja.
Mes 1
Mes 2
Mes 3
100
400
800
200
300
750
300
200
600
400
100
550
Solucin
1000
800
600
400
200
0
N=
Producto A
Producto B
Producto C
Producto D
Ejercicio
Medidas de centralizacin
Aaden unos cuantos casos particulares a las medidas de
posicin. Son medidas que buscan posiciones (valores) con
respecto a los que los datos muestran tendencia a agruparse.
Si se calcula la media armnica (H), la media geomtrica
(G) y la media aritmtica (X), para los mismos datos se tiene
que: H < G < X
Se dice que un estadstico es resistente (robusto) cuando ste no se
ve afectado por la presencia de valores muy alejados del resto de
la distribucin, por ejemplo los frctiles, mediana, M-estimadores
(estimadores basados en el mtodo de mxima verosimilitud. Se
tienen los siguientes de Hubert, de Tukey, de Andrews, de
Hampel, los cuales difieren entre s por los pesos que asignan a
los casos. El SPSS los calcula en el procedimiento EXPLORAR).
No es un estadstico resistente la media aritmtica, como
alternativa existe la media truncada (media recortada, media
podada, trimmed mean) en la que se elimina un % de la cola
inferior y superior de la distribucin o la media winsorizada
sustituye ese % de valores por valores del centro de la
distribucin.
x
donde:
i 1
fi Xi
i 1
fi
: media muestral
x : frecuencia absoluta de la clase i
f i : marca de la clase i
Xi
Grupos de edad
Hombres
Mujeres
Frecuencia
Frecuencia
< 20 aos
17 654
20 902
20 24 aos
10 943
34 448
25 29 aos
9 322
26 834
30 44 aos
11 106
52 854
> 44 aos
14 216
41 274
Fuente: INEI
1) Qu poblacin (la de hombres o la de mujeres) presenta una edad
media mayor?
2) Cul est ms envejecida en trminos medios?
Medidas de centralizacin
Propiedades de la mediana
-No utiliza todos los elementos
-Se puede calcular con datos ordinales
-Se ve menos afectada por datos atpicos que la media aritmtica.
-Minimiza la suma de diferencias en valor absoluto (recordar que
la media aritmtica minimizaba la suma de diferencias en trminos cuadrticos)
Km 1
5 6
Nm. Emp.
1
26
Cul elegir?
Moda
Media
Mediana
Ejercicio.
Se
han
analizado
los
promedios
promocionales de la asignatura Estadstica y
Probabilidad, y se ha obtenido lo siguiente: la nota
modal de la Seccin A es 15, la nota media 12,8 y la
mediana 13,5;en la Seccin B la nota modal es 11, la
nota media 14 y la mediana 13,5. Se pide:
a) Bosquejar una curva que represente la informacin
dada para cada seccin.
b) Sera posible que en la Seccin A, ms de la mitad
de los estudiantes obtenga ms que la nota media?
c) Sera posible que en la Seccin B, ms de la mitad
de los estudiantes obtenga menos que la nota
media?
Resistencia y robustez
Estadsticos resistentes: Son aquellos que no se ven
influidos (o solo ligeramente) por pequeos cambios en los
datos.
3, 4, 4, 5, 5, 6, 7, 8, 9, 11
Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismos
Fr
sesClases
Xi
fXi F f frF Frfr
Li 375
345330-345
337 3337 33 0,093 0,09
0,09 0,09
Realiza
la interpolacin
360345-360
352 3352 632)0,09
6 0,18
0,09
0,18 para hallar el valor de la Mo
375360-375
367 4367 10
10 0,29
0,11 0,29
4 0,11
1
Mo Li
h
390375-390
382 12382 22
0,34
0,63
12
22
0,34
0,63
1
1 2
7 0,20
405390-405
397 7397 29
29 0,83
0,20 0,83
2 4 0,11
420405-420
412 4412 33
33=0,94
0,11
0,94
12
4
=8
2 = 12 7 = 5
1
435420-435
427 2427 352 0,06
35 1,00
0,06 1,00
ALTOTAL 35
35 1,00 1,00
8
Mo 375
15 384.23
85
Extensin del intervalo h = 390 - 375
M. Clase
Fr.
Fr. ac.
40 50
45
50 60
55
10
15
60 70
65
21
36
70 - 80
75
11
47
80 - 90
85
52
90 - 100
95
55
100 130
115
58
xn
x
i
i i
45 5 55 10 115 3
69,3
58
0,5 58 N i 1
( Li Li 1 )
ni
0,5 58 15
60
(70 60) 66,6
21
Mediana C0,5 Li 1
58
P75 C0,75 Li 1
0,75 58 N i 1
43,5 36
( Li Li 1 ) 70
(80 70) 76,8
ni
11
Media geomtrica
( xg )
Media geomtrica ( xg )
a) Obtencin Se obtiene extrayendo la raz ensima
del producto de los n valores de una serie.
xg n X1 * X 2 * X 3 * ...X n
Ejemplo:
La siguiente tabla muestra la tasa de aumento en los precios
de los bienes y servicios (inflacin) transados en el Distrito
de Acar durante los meses indicados. Calcula e interpreta la
tasa media mensual de la inflacin.
Meses
Aumento de
precios
Enero
Febrero
Marzo
Abril
Mayo
2.6%
5.4%
3.8%
0.5%
1.4%
Ejemplo (...)
b) Clculos
xg
n (1
x 1 ) * (1 x 2.) * ...(1 xn )
Ejemplo (...)
c) Interpretacin
MG n (vn ) / (v1 ) 1
Donde:
Vn = Valor en el periodo n (final)
V1 = Valor en el periodo 1 (inicial)
n = Nmero de periodos
Media armnica (
xh)
xh
X
i 1
Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro mdicos al realizar una operacin al ploro.
Calcula e interpreta el tiempo medio.
Mdico
Tiempo
(minutos)
45
38
52
40
xh
xh
4
1
1
1
1
45 38 52 40
43.117953 minutos
xh 43 minutos 7 segundos/operacin
b) Interpretacin:
Si se selecciona al azar a uno de los cuatro
mdicos, se espera que realice este tipo de ciruga
en 43 minutos aproximadamente.
10
14
30
36,5
(365/10)
"
73,0
(365/ 5)
"
26,07
(365/14)
"
12,17
(365/30)
"
60,83
(365/ 6)
Total
208,57
Simetra
Media
Media
X Mo
As
sx
Media:
Moda:
Mediana:
Desviacin estndar:
300
160
140
300
200
120
200
100
100
60
40
0
27
45 48 51 54 57 60 63 66 69 72 75 78 81 84
Platicrtica
100
Frecuencia
Frecuencia
80
37
32
45
41
Mesocrtica
53
49
61
57
69
65
77
73
85
81
0
3
93
89
99
27
16
37
32
47
42
Leptocrtica
57
52
67
62
77
72
87
82
97
92
108
102 138
Curtosis
4
(
X
X
)
n
i
i 1
4
x
C r
4
(
X
X
)
n
i
i 1
4
x
1
( x )
n
2
x
i
2
i
1
S ( x x)
n
2
1
2
S
( xi x )
n1 i
2
S S
donde:
x : media muestral
f i : frecuencia absoluta de la clase i
MCi : marca de clase i
14 16 16 16 16 18 (a)
10 12 19 20 15 20 (b)
15 14 15 15 15 15 (c)
16,0
16,0
14,8
1,1547
3,95811
0,37268
Sist.
70 80 80 80 80 90 (d)
centesimal 40 80 80 80 80 90 (e)
80,0
75,0
5,7735
16,0728
D.S.M.
1,26491
6,32456
vigesimal
Propiedades de la varianza
a) La varianza es un nmero no negativo.
b) Si todos los datos son iguales a una
constante c, su varianza es igual a 0. En este
caso la media es igual a c. No hay dispersin.
c) Si a cada uno de los datos x1, ... ,xn se les
suma una constante b, entonces la varianza de
los datos transformados: x1 + b, ... ,xn + b es
igual a la varianza de los datos originales.
d)
Si a cada uno de los datos x1, ... ,xn se
les multiplica por una constante k, entonces
la varianza de los datos transformados: kx1,
... , kxn es igual a la varianza de los datos
originales multiplicada por el cuadrado de
la constante. Esto es, si la varianza de los
datos originales es s2 entonces la varianza
de los datos transformados es k2s2.
en donde
ms 2x ns 2y
mn
m
n
( x M )2
( y M )2 ,
mn
mn
Si las medias
2 ns 2
ms
x
y
s2
mn
S
CV
x
CV
Coeficiente de variacin
Es una cantidad adimensional. Interesante para comparar la
variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan ms dispersin en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o
donde el valor 0 sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F
El coeficiente de variacin elimina la dimensionalidad de las
variables y tiene en cuenta la proporcin existente entre una
medida de tendencia y la desviacin tpica o estndar.
El principal inconveniente, es que al ser un coeficiente
inversamente proporcional a la media aritmtica, cuando est tome
valores cercanos a cero, el coeficiente tender a infinito
Ejemplo:
Covarianza
Es una estadstica que mide el grado de dispersin
o variabilidad conjunta de dos variables X e Y
(variables bivariantes) con respecto a sus
respectivas medias.
Es til para describir el comportamiento de una
variable en relacin con otra.
Aporta una idea muy burda de la relacin entre X y
Y. Solo interesa su signo algebraico, no su
magnitud, a diferencia de la varianza que solo es
positiva.Las unidades son al cuadrado (Soles2)
Si Cov(X,Y) > 0 indica que valores altos de X se
relacionan con valores igualmente altos de Y, y
viceversa.
Si Cov(X,Y) = 0 implica que si X asume un valor
ms alto que su media no indica algo sobre el valor
de Y en relacin con su media.
INCONVENIENTE: Depende de las dimensiones de las
variables
Covarianza
medida de
variabilidad conjunta.
No tiene lmite
superior o inferior,
depende de las
unidades en que se
mida
Coeficiente de
Correlacin
(Pearson)
Cov( x, y )
y y x x
i 1
Cov( y, x)
Var ( y)Var ( x)
Ejercicio.
La accin comn de la empresa Thiago (T) tiene una rentabilidad
esperada del 10% y una desviacin estndar del 5% anual. La
accin comn de la empresa Casas (C) tiene una rentabilidad
esperada del 20% y una desviacin estndar del 60% anual.
a) Cul es la rentabilidad esperada de una cartera que se
compone de 40% del ttulo T y 60% del ttulo C?
b) Cul es la covarianza de las rentabilidades de T y C si el
coeficiente de correlacin () entre T y C es de 0,5?
La Universidad Voc A. Buso (UVAB) quiere dar una beca a uno de dos
estudiantes de sistemas educativos diferentes y se asignar al que tenga
mejor expediente acadmico:
El estudiante A tiene una calificacin de 8 en un sistema donde la
calificacin se comporta como N(6,1).
El estudiante B tiene una calificacin de 80 en un sistema donde la
calificacin se comporta como N(70,10).
No podemos comparar directamente 8
puntos de A frente a los 80 de B, pero
como ambas poblaciones se comportan
de modo normal, podemos tipificar y
observar las puntuaciones sobre una
distribucin de referencia N(0,1).
Como zA > zB, podemos decir que el
porcentaje de compaeros del mismo
sistema de estudios que ha superado
en calificacin al estudiante A es mayor
que el que ha superado B. En principio
A es mejor candidato para la beca.
zA
xA A
86
2
1
A
x B 80 70
zB B
1
B
10
Parmetros
Salario medio
Desviacin tpica
C. Manos a la C. La Vida
Urbe
en Concreto
S/.963
S/.26
S/.972
S/.28
I) Compara S y CV
Sistema
vigesimal
Sist.
Centesimal
Promedios
14 16 16
10 12 19
15 14 15
S i
e
c n
c
Media
Finales
16 16 18 (a)
16.0
20 15 20 (b)
16.0
15 15 15 (c)
14.8
70 80 80 80 80 90 (d)
40 80 80 80 80 90 (e)
80.0
75.0
D.S.P.
1.15470054
3.95811403
0.372678
CV
0.07217
0.24738
0.02512
5.77350269
16.0728
0.07217
0.2143
14 16 16 16 16 18 (a)
40 80 80 80 80 90 (e)
16.0
75.0
(18)
(90)
Z
1.73205
0.93326
Vigesimal
Centesimal
14 16 16 16 16 18 (a)
70 80 80 80 80 90 (d)
16.0
80.0
(18)
(90)
1.73205
1.73205
D.S.M.
1.26491106
6.32455532
CV
0.07906
0.07906
Z
1.58114
1.58114
Tiempos de embolsado de
Maca de la Pirinaca (en
minutos)
Media Arit.
S
CV
de 1/4 kg
0,92
0,98
1,04
0,90
0,99
0,966
0,050
5,22%
de 1 kg
4,52
4,35
4,60
4,70
4,50
4,534
0,116
2,56%
0,
0,
k 1,
2
P X 2
2
P X 1 2
1
P X k 2
k
Ejemplo
La media de los pesos de las bolsas de maca de la pirinaca
es igual a 15,1333 kg y la desviacin estndar es 2,8952
kg.
En el intervalo 9,3429 - 20,9237, que tiene la media
como centro y dos desviaciones estndar muestrales como
radio, existe, segn Chevyshev, por lo menos el 75% de
los datos.
Ejemplo.
Los N datos correspondientes a la produccin diaria de gasolina de la planta El
Perreo tienen una media aritmtica de 150
000 galones con una desviacin estndar de
1 000 galones.
Hallar la proporcin de das cuya produccin de gasolina est comprendida entre
148 000 y 152 000.
Propuesta de Solucin
El intervalo 148 000, 152 000
corresponde a x - ks, x + ks con x =
150000; s = 1000 y k = 2.
Aplicando la propiedad de Chebyshev con
k = 2, se tiene que la proporcin de das
cuya produccin est en el intervalo
indicado es por lo menos igual a:
2
1 (1/k ) = 0,75.
Ejemplo.
Propuesta de Solucin
x - ks, x + ks.
Como la menor produccin es 147 000,
un intervalo que cumple la condicin es:
147 000,00; 153 162,20
Ejemplo.
XX
Z
s
Propuesta de Solucin
1
1
1
1 0,0204 0,9796
k2
72
1-3
4-6
7-9
10 - 12
13 - 15
16 - 18
19 - 21
22 - 24
N de bolsas
24
83
52
22
11
MEDIDAS DE CONCENTRACIN
Las medidas de concentracin tratan de poner de relieve el mayor o menor
grado de igualdad en el reparto del total de los valores de la variable, son por
tanto indicadores del grado de distribucin de la variable.
Para este fin, estn concebidos los estudios sobre concentracin.
Denominamos concentracin a la mayor o menor equidad en el reparto de la
suma total de los valores de la variable considerada (renta, salarios, etc.).
Las infinitas posibilidades que pueden adoptar los valores, se encuentran
entre los dos extremos:
1.- Concentracin mxima, cuando uno solo percibe el total y los dems
nada, en este caso, nos encontraremos ante un reparto no equitativo:
x1 = x2 = x3 = = xn-1 = 0 y xn.
2.- Concentracin mnima, cuando el conjunto total de valores de la variable
esta repartido por igual, en este caso diremos que estamos ante un reparto
equitativo
x1 = x2 = x3 = = xn-1 = xn.
Algunas medidas de concentracin:
Indice de Gini, Coeficiente, por tanto ser un valor numrico.
Curva de Lorenz, grfico, por tanto ser una representacin en ejes
coordenados.
ndice de Gini