Sie sind auf Seite 1von 31

Material de Clases Germn Pomachagua Perez 20-ago-13

Germn Elas Pomachagua Prez


CLASE05: MEDIDAS DE DISPERSION
gpomachagua@hotmail.com
Material de Clases Germn Pomachagua Perez 20-ago-13
Una de las caractersticas importantes en el
anlisis de los datos es la DISPERSIN
VARIABILIDAD.
La dispersin es la cantidad de variacin, de los
datos en torno al promedio.
Las medidas de Dispersin ms usadas son:
MEDIDAS DE DISPERSIN
RANGO
RANGO INTERCUARTILIC0
VARIANZA
DESVIACION ESTANDAR
COEFICIENTE DE VARIACION
Material de Clases Germn Pomachagua Perez 20-ago-13
MEDIDAS DE DISPERSIN
Nos permiten
cuantificar cuan
separados estn los
datos de una
distribucin.

A
=
B

Dispersin A > B
A
B
Material de Clases Germn Pomachagua Perez 20-ago-13
Permite ubicar 50% de los datos
que se encuentran en el centro de
la distribucin
R.I.= Q
3
Q
1

Mide la dispersin en la parte
central de los datos, as que no se
ve influenciada por los valores
extremos.
Es una medida resistente en el
sentido de ser poco sensible a las
observaciones extremas
150 160 170 180 190
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
150 160 170 180 190
25% 25% 25% 25%
Mn. P
25
P
50
P
75
Mx.
Rango intercuartlico
Rango
2 : RANGO INTERCUARTILICO
Material de Clases Germn Pomachagua Perez 20-ago-13
Ejemplo2: La tabla muestra la experiencia (en aos) del personal que
labora en el Hospital Central.
a)Entre qu valores se encuentra el
50% intermedio de estos datos?
Rpta:
b)Cul es el rango intercuartlico?
Rpta:

Experiencia
(aos)
Trabajadores
F
0 4 18 18
4 - 8 42 60
8 - 12 68
128
12 - 16 120 248
16 - 20 40 288
20 - 24 34 322
24 - 27 12 334
Total 334
Rango
Intercuartlico
50 %
25 %
Q
3

25 %
Q
1

Material de Clases Germn Pomachagua Perez 20-ago-13
Ejemplo 1: Sean los puntajes de un grupo de trabajadores. Calcular el RI y ver si y
ver si hay datos atpicos
150 151 150 147 155 145 151 152 150 149
166 142 158 153 144 190 145 147 151 156
ORDEN PUNTAJES
1 142
2 144
3 145
4 145
5 147
6 147
7 149
8 150
9 150
10 150
11 151
12 151
13 151
14 152
15 153
16 155
17 156
18 158
19 166
20 190
SOLUCION: Primero ordenar los datos
Material de Clases Germn Pomachagua Perez 20-ago-13
3. VARIANZA: La varianza se define como la media
de las diferencias cuadrticas de todas las
observaciones con respecto a su media
aritmtica.
Se usa
Para comparar dos o ms poblaciones.
En inferencia estadstica
Para calcular el tamao de muestra


Material de Clases Germn Pomachagua Perez 20-ago-13
x
1

x
2

.
.
.
.
.
x
N
Poblacin (X)
Parmetro
o
2

Muestra (X
j
)
x
1j

x
2j

.
.
x
nj
Estimador
S
2

2
2
1
( )
N
i
i
x
N

o
=

=

1
) (
1 1
2
2

=

=
n
x x
s
n
i
2 2
S o de estimador es manera esta De
Material de Clases Germn Pomachagua Perez 20-ago-13
MEDIDAS DE DISPERSIN
DATOS SIN AGRUPAR
1
) (
1
2
2

=
n
x x
S
n
i
i
1
1
2
1 2
2

|
.
|

\
|


=
=
n
n
x
x
S
n
i
n
i
i
i
Calculo
abreviado
DATOS AGRUPADOS
SIN INTERVALOS CON INTERVALOS



1
) (
1
2
2

=
n
x x f
S
m
i
i i
1
) (
1
2
2

'
=

=
n
x X f
S
m
i
i i
Material de Clases Germn Pomachagua Perez 20-ago-13
Ejemplo1 :
Calcular la varianza de los siguientes valores numricos:
5, 9, 11, 7


Primero calculamos el promedio




Entonces la varianza ser




Utilizando la frmula simplificada:


5 9 11 7
x 8
4
+ + +
= =
2 2 2 2
2
(5 8) (9 8) (11 8) (7 8) 9 1 9 1
S 6.667
3 3
+ + + + + +
= = =
2 2 2 2 2
2
(5 9 11 7 ) 4(8)
S 6.667
3
+ + +
= =
1
) (
1
2
2

=
n
x x
S
n
i
i
Material de Clases Germn Pomachagua Perez 20-ago-13
8 8 - 10 = 2 4
10 10 - 10 = 0
0
5 5 - 10 = 5
25
12 12 - 10 = 2
4
10 10 - 10 = 0 0
15
15 - 10 = 5 25
i
X X x
i

( )
2
X x
i

60 X=

( )

= 0 X x
i
10
6
60
= = x
( )

= 58 X
2
x
i
Ejemplo2: La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma siguiente:
1
) (
1 1
2
2

=

=
n
x x
s
n
i
6 . 11
1 6
58 2
=

=
S
Material de Clases Germn Pomachagua Perez 20-ago-13
Reemplazando
1
1
2
1 2
2

|
.
|

\
|


=
=
n
n
x
x
S
n
i
n
i
i
i
Ejemplo3: Se uso dos tipos de mquinas para la produccin de un tipo de agujas
descartables. Se tomo una muestra de 5 y se muestran los tiempos en segundos.
A: 14, 24, 46, 50, 70
B: 15, 38, 46, 52, 53
En qu grupo hay mas dispersin?
Material de Clases Germn Pomachagua Perez 20-ago-13
2 . 491
4
8 . 1964
2
= = s
Reemplazando

Usando la frmula en
maquina A
2 . 491
4
8 . 1964
2
= = S

=
=
5
1 i
1
) (
1
2
2

=

=
n
x x
S
n
i
i
Material de Clases Germn Pomachagua Perez 20-ago-13
DATOS AGRUPADOS: sin intervalos
1
) (
1
2
2

=
n
x x f
S
m
i
i i
Ejemplo: En cierta clnica, muestra los das de
permanencia que se distribuye entre sus paciente
Das (xi) N Pacientes(f
j
) Xifi
1 3 3
5 3 15
6 3 18
9 4 36
12 1 12
14 84
Material de Clases Germn Pomachagua Perez 20-ago-13
DATOS AGRUPADOS: con intervalos
1
) (
2
1
2

'
=

=
n
X X f
S
i
i
i
i
X'
Li - Ls fi
[39 - 46] 3
<46 - 53] 2
<53 - 60] 7
<60 - 67] 3
<67 - 74] 6
21
Material de Clases Germn Pomachagua Perez 20-ago-13
PROPIEDADES DE LA VARIANZA
Se X una variable tal que X
i :
x
1
, x
2
,.., x
n
1. La varianza de una constante es cero
En este caso X
i :
k, k,..,k i:1, 2..n
0 ) ( ) ( = = K V X V
3. La varianza de una constante multiplicada por una variable mas(o
menos) una constante es igual a:
En este caso Y
i
=ax
i
b i:1, 2..n
) ( ) ( ) ( ) (
2
X V a aX V b aX V Y V = = =
2. La varianza de una constante multiplicada por una variable, es igual
a la constante al cuadrado multiplicada por la varianza de la variable.
Y
i :
kx
i
i:1, 2..n
) ( ) ( ) (
2
X V k kX V Y V = =
Material de Clases Germn Pomachagua Perez 20-ago-13
61 15 7 243
16 22 2 491
. . B es S
. . A es S
= =
= =
1
) (
1
2

=

=
n
x x
S
n
i
i

Luego la desviacin estndar de
4. DESVIACIN ESTNDAR (TPICA): Es la raz cuadrada
de la varianza
MEDIDAS DE DISPERSIN
Material de Clases Germn Pomachagua Perez 20-ago-13
5. COEFICIENTE DE VARIACIN: Es una medida de variabilidad
relativa de los datos, permite comparar la variabilidad de dos o
ms conjuntos de datos.
100 . . =
X
s
V C
Tipo
s
C.V.
A 40.8 22.16 0.5432
B 40.8 15.61 0.3826
X
Si el Coeficiente de Variacin es:
< 5% ----> datos muy homogneos, Media
aritmtica muy representativa

5% s CV < 20% ----> datos con homogeneidad
aceptable. La media aritmtica es
representativa

Si el CV > 20% ----> datos heterogneos, la
media aritmtica es poco representativa

Material de Clases Germn Pomachagua Perez 20-ago-13
Material de Clases Germn Pomachagua Perez 20-ago-13
MEDIDAS DE FORMA
Las medidas de forma permiten comprobar si una distribucin de frecuencia
tiene caractersticas especiales como simetra, asimetra, nivel de
concentracin de datos y nivel de apuntamiento que la clasifiquen en un tipo
particular de distribucin.
En este capitulo analizaremos dos medidas de forma:
1) Coeficiente de asimetra
2) Curtosis
Las medidas de forma son necesarias para determinar el comportamiento de los
datos y as, poder adaptar herramientas para el anlisis probabilstico.
Material de Clases Germn Pomachagua Perez 20-ago-13
Estadsticos para detectar asimetra
Hay diferentes estadsticos que sirven para detectar asimetra.
Coeficiente de simetra de Pearson: Se usa solo en datos unimodales




Basado en la diferencia entre el 1 y 2 cuartiles y 2 y 3.
Basados en desviaciones con signo al cubo con respecto a la media.




Calculados con ordenador. Es pesado de hacer a mano.
En funcin del signo del estadstico diremos que la asimetra es positiva o
negativa.
S
M x
As
e)
( 3
=
3
1
3
1
( )
n
i
i
x x
n
As
s
=

=

Material de Clases Germn Pomachagua Perez 20-ago-13
x
8 10 12 14 16 18 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
8 10 12 14 16 18 20
x s
78 %
x
-2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
-2 -1 0 1 2 3
x s
66 %
x
0 2 4 6 8 10 12 14
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0 2 4 6 8 10 12 14
x s
78 %
Asimetra negativa
As<0
Asimetra nula
(simtrica) As=0
Asimetra positiva
As>0
<Me<Mo
=Me=Mo >Me>Mo
Las medidas de asimetra se dirigen a elaborar un indicador que
permita establecer el grado de simetra (asimetra) que presenta la
distribucin, sin la necesidad de llevar a cabo su representacin
grafica (histograma)
Material de Clases Germn Pomachagua Perez 20-ago-13
Curtosis
La curtosis nos indica el grado de apuntamiento
(aplastamiento) de una distribucin con respecto a la
distribucin normal (distribucin simtrica).
Indican el nivel de concentracin de los datos
respecto a su media.


3
) (
1
4
1
4

=

=
s
x x
n
K
n
i
i
Material de Clases Germn Pomachagua Perez 20-ago-13
Apuntamiento o curtosis
Platicrtica (aplanada): curtosis < 0




Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
0.0 0.2 0.4 0.6 0.8 1.0
x s
57 %
Apuntada como la normal
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
-3 -2 -1 0 1 2 3
x s
68 %
Apuntada
-2 -1 0 1 2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
-2 -1 0 1 2
x s
82 %
Mesocrtica (como la normal): curtosis = 0
Leptocrtica (apuntada): curtosis > 0
sern de especial
inters las mesocrticas
y simtricas (parecidas
a la normal).
Material de Clases Germn Pomachagua Perez 20-ago-13
ANALISIS EXPLORATORIO DE DATOS
Antes de proceder a cualquier anlisis se debe
hacer un Anlisis Exploratorio que nos permita
ver la naturaleza de los datos.
El Anlisis exploratorio se usa par detectar
valores atpicos (outliers) es decir valores que
no son igual al resto
Material de Clases Germn Pomachagua Perez 20-ago-13
Diagrama de Caja y Bigotes
Un diagrama de cajas es una grfica que describe la distribucin de un
conjunto de datos tomando como referencia los valores de los cuartiles
como medida de posicin y el valor del rango intercuartil como medida de
referencia de dispersin. Adems, nos permite apreciar visualmente el tipo
de distribucin de los datos (simtrica o asimtrica) y la identificacin de
valores extremos (datos atpicos).
Material de Clases Germn Pomachagua Perez 20-ago-13
Es un dato atpico si cae fuera del intervalo

<P
25
-1.5xR.I. , P
75
+1.5xR.I.>
en la grafica se indica como

Es un dato atpico si cae fuera del intervalo

<P
25
-3xR.I. , P
75
+3xR.I.>
en la grafica se indica como *
PROCEDIMIENTO DE CALCULO
Material de Clases Germn Pomachagua Perez 20-ago-13
Material de Clases Germn Pomachagua Perez 20-ago-13
29
Ejemplo2: Un grupo de 47 personas fueron sometidas a un tratamiento para
disminuir el nivel de colesterol en la sangre. Se registr el nivel de colesterol de
los 47 antes y despus de realizado el tratamiento. Calcular si hay datos atpicos
Antes
146 160 182 186 186 190 200 200 202 210 214 216
218 218 220 220 220 226 234 234 236 236 238 240
242 244 244 248 248 258 266 270 270 272 276 276
278 278 282 288 288 294 294 350 385 401 420
Despus
142 156 160 162 164 166 168 170 178 178 182 182
182 182 182 182 184 186 188 188 196 198 198 198
198 200 200 204 204 206 212 214 216 218 230 232
236 238 242 242 248 256 256 264 264 280 294
Material de Clases Germn Pomachagua Perez 20-ago-13
Ejemplo 1: Los trabajadores de cierta empresa tienen un sueldo promedio de $383.29,
con una varianza de 30.571 ($)
2
. Si a cada trabajador se le aumenta el sueldo en 8%
ms un bono de $10.5.
a) Determine el sueldo promedio y la varianza luego del aumento.
b) En porcentaje en cual hay mas variabilidad antes o despus del aumento
Ejemplo 2: En una Empresa donde los salarios tienen una media de $100 y una
desviacin estndar de $10, el sindicato solicita que cada salario X, se transforme en Y,
mediante la siguiente relacin Y = 2,5 X +10. El Gerente acoge la peticin rebajando los
salarios propuestos por el sindicato en10%, lo que es aceptado. Qu distribucin de
salarios es ms homognea? Qu propuesta prefieren los trabajadores?
Ejemplo 3 : El coeficiente de variacin de los salarios pagados a 200 trabajadores de
una empresa es del 30%. Con el aumento de 100 soles a cada trabajador, el nuevo
coeficiente de variacin sera del 25% Qu cantidad debe tener disponible la
compaa para hacer efectiva la nueva planilla? .Rpta: S/.120,000
Material de Clases Germn Pomachagua Perez 20-ago-13
Ejemplo4: En un proceso de reorganizacin una empresa pblica fue sometida a
evaluacin mediante una prueba de conocimientos con escala de calificacin
centesimal. Las puntuaciones obtenidas fueron tabuladas en un cuadro de
frecuencias con 7 clases de igual amplitud. Si la puntuacin mnima es de 30
puntos, la media aritmtica es de 61.5 y las frecuencias acumuladas porcentuales
de los intervalos del 1 al 6 son respectivamente: 8, 23, 43, 73, 91 y 97.
Identificar el tipo de asimetra que presenta esta distribucin.
a) Calcular e interpretar el coeficiente de variacin..
b) Si la empresa tiene 2000 trabajadores y el directorio acuerda promocionar a
todos los empleados con una puntuacin superior a la media + S. Cuntos
trabajadores sern promovidos?.

Das könnte Ihnen auch gefallen