Sie sind auf Seite 1von 40

MEDIDAS DE DISPERSION O DE VARIABILIDAD

GRUPO B

Qu grupo es mas disperso?

GRUPO A

Menor dispersin = ms homogneo


Mayor dispersin = menos homogneo
Menor dispersin = menos heterogneo
Mayor dispersin = ms heterogneo
1. Variacin, se refiere a la cantidad en que
los datos u observaciones varan entre si,
esta variacin puede medirse.

2. Los datos que estn relativamente


cercanos entre si, tienen bajas medidas de
variabilidad, mientras que los que estn
mas alejados entre si tienen medidas de
variacin mas grandes,
MEDIDAS DE DISPERSIN

Como su mismo nombre lo indica miden la dispersin o


variabilidad de los datos u observaciones en la muestra.
Las medidas de dispersin son necesarias para
ampliar la descripcin de la distribucin, ya que
valores promedio similares son producidos por
distribuciones con recorrido diferente
Ejemplo
GRUPO 1

Qu grupo presenta mayor variabilidad?

GRUPO 2
Ejemplo
EXACTITUD Y PRECISION
EJEMPLO:Se tienen datos de resistencia(en
libras por pulgada cuadrada) al estallamiento
obtenidos de dos muestras de seis botellas cada
una:
M1: 230 250 245 258 265 240
M2:190 228 305 240 265 260
MEDIDAS DE DISPERSION ABSOLUTAS

a) Rango (R).- Se define como la diferencia entre


el valor mximo y mnimo .

R=V.max - V.min.

Ejemplo: A continuacin se presentan los datos de


consumo de O2 (oxgeno) por un salmn (mm3/h).
95 94 94 93 94 94 93 95 93
Determine la amplitud.
A = 95 - 93 = 2 mm3/h
1,0
EJEMPLO
1,3
Los siguientes datos representan la 2,2
2,2
prdida de peso en Kg, en un grupo de
1,6
personas que se sometieron a un 2,3
tratamiento durante el ltimo ao 2,3
2,3
2,1
R = V.max - V.min
2,2
R = 2,3 - 1
R= 1,3 Kg 2,1
2,2
2,3
2,3
2,1
2,1
2,0
2,0
2,1
b) Desviacin Media (DM).- Medida de dispersin que
se puede utilizar en aquellas distribuciones en las que
la medida de tendencia central ms significativa haya
sido la media.

b1) Para datos sin agrupar b2) Para datos agrupados

n m

x
_


_ - x fi
i
xi - x
DM = i 1

DM = i 1
m

n f
i=1
i
Ejemplo. Los pesos de una muestra de cajas con frenos
en un taller son (en Kg.)
103, 97, 101, 106 y 103.

103 102 97 102 101 102 106 102 103 102


DM 2,4 kg
5
Ejemplo: Del ejemplo medidas de resistencia a rompimiento en onzas,
Calcule la desviacin media.

| 17,1 27,36 | 2 | 20,9 27,36 | 7 ......... | 36,1 27,36 | 3


DM 3,82 onzas
40
C) Varianza.- se define como la media de las diferencias cuadrticas
de n observaciones con respecto a su media aritmtica
Varianza

Poblacional Muestral

c1)Para datos sin agrupar c2)Para datos agrupados

n n m

(x (x
_ _
2
2 ( xi x) x) 2 f i
i - ) i
S2 i 1
2 = i 1 =
S2 = i 1
n 1
N n 1
n _2

m _2
x
2
x i nx 2
Donde: i fi n x
S 2
= i 1
:Media n 1 S 2 = i 1
n 1
poblacional Donde:
Donde:
_
xi: Observacin x :Media muestral _
x :Media muestral
N: Poblacin xi : Observacin i
xi:Marca de clase i
n : tamao de muestra
n: tamao de muestra

fi; Frecuencia absoluta simple


d) Desviacin Estndar o Desviacin Tpica.- A la raz cuadrada
(positiva) de la varianza se le denomina desviacin estndar o
desviacin tpica o desviacin estndar

Desviacin Estndar

d1)Para datos sin agrupar d2)Para datos agrupados

n m

i
_
( xi x) 2 ( x x ) 2
fi
S = i 1
n 1 s i 1
n 1
m

x f n x
n 2 2
_2

i i
x2 i n x
i 1 s i 1
S =
n 1 n 1
Ejemplo

Determine la varianza y desviacin tpica


de las siguientes cantidades medidas en
metros:
3,3,4,4,5
Ejemplo.
De las siguientes determinaciones en porcentaje de humedad (H2O):
Calcule e interprete:
a)El promedio aritmtico
b)La desviacin estndar

0,48 0,37 0,47 0,40 0,44 0,46 0,43


Ejemplo: Consideremos la siguiente tabla para ilustrar el clculo de la varianza
y desviacin estndar

17,12
.2 20,9 2
.7 .... 36,12
.3 40( 27,36 2
)
s2 23,84 onzas 2
39
s 4,88 onzas
e)Recorrido Intercuartlico
Es la diferencia entre el cuartil superior (Q3) y
cuartil inferior (Q1). Cuanto mayor sea RI, mayor
ser la dispersin.
RI = Q3 Q1

Ej. Si en una distribucin de


frecuencias de los pesos de 100
estudiantes los cuartiles superior e
inferior son 62 kg y 70 kg
respectivamente, tenemos que:
RI= 70-62 = 8 kg
Coeficiente de variacin (CV).- Es una medida de
dispersin relativa, est exenta de unidades y se expresa
en %. Se usa para comparar las dispersiones de dos
distribuciones diferentes.

S
CV = . 100
_
x
As, si por ejemplo tenemos dos grupos de mujeres de 11 y 25 aos
con medias y desviaciones tpicas dadas por la tabla siguiente:

Peso Desviacin 2
Medio Tpica cv .100 5% (11 aos)
40
11 aos 40 Kg. 2 Kg.
2
25 aos 50 Kg. 2 Kg. cv .100 4% (25 aos )
50
Puede parecernos, al observar en ambos grupos una
desviacin tpica igual, que ambos grupos de datos tienen la
misma dispersin. No obstante, como parece lgico, no es lo
mismo una variacin de dos kilos en un grupo de elefantes que
en uno de conejos. El coeficiente de Variacin elimina esa
posible confusin al ser una medida de la variacin de los
datos pero en relacin con su media. Al grupo de mujeres de 11
aos le corresponde un coeficiente de variacin de Pearson del
5% y al grupo de mujeres de 25 aos le corresponde un coeficiente de
variacin de Pearson del 4%

Lo que indica una mayor dispersin en el grupo de mujeres de 11


aos.
Ejemplo:
A continuacin se presentan las tarifas (en
unidades monetarias) de dos laboratorios de
anlisis clnicos. El laboratorio I tiene sus tarifas en
soles y el laboratorio II en dlares Cul de ellos
tiene un plan tarifario ms homogneo o estable?.

Laboratorio I (soles) Laboratorio II (dlares)


40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar por


cada una de los laboratorios
Laboratorio I
n
Xi 393
x i 1
56.14
n 7
x Xi x Xi x 2

40 -16.14 260.50
70 13.86 192.10
60 3.86 14.90
48 -8.14 66.26
52 -4.14 17.14
65 8.86 78.50
58 1.86 3.46
X 393 Xi x 0 Xi x
2
632,86
Si Xi x 632.86
2

n
i
( X x )
2
632.86
S i 1
10.27
n 1 7 1

S
CV 100
x

10.27
CV 100 18.29%
56.14
Laboratorio II n

Xi 847
x i 1 105.87
n 8
x Xi x Xi x 2

70 -35.87 1286.6569
35 -70.87 5022.5569
150 44.13 1947.4569
140 34.13 1164.8569
82 -23.87 569.7769
110 4.13 17.0569
140 34.13 1164.8569
120 14.13 199.6569
X 847 Xi x 0,04 Xi x
2
11372,88

n
Si X i x
2
11372.88
i 1

n
(X i x )
2
11372,88
S i 1
40.30
n 1 8 1

S 40,30
CV 100 CV 100 30,06%
x 105,87

El Laboratorio II presenta una mayor variabilidad


en el plan tarifario.
Ejemplo.
Se han registrado durante 20 das, el nmero de viajeros que
hacen reservaciones en una agencia de viajes :

Nmero de
viajeros: xi fi
12 3
13 3
14 6
15 3
16 5
70 20

Calcule e interprete la desviacin estndar


EJEMPLO
Las secciones A, B, y C de la asignatura de Estadstica del Instituto ALFA ,
rinden el mismo examen parcial. Los resultados obtenidos se muestran en las
siguientes tablas:
Seccin A Seccin B Seccin C
yi fi Intervalos yi*fi Fi fi*yi2
2,5 3 [2 6> 16 6 150
7,5 8 [6 10> 144 12 600
12,5 22 [10 14> 240 48 5184
17,5 30 [14 18> 32 60 2700

a)El profesor de la Seccin A sostiene que su seccin es la mejor. Es


correcta la afirmacin del profesor? Justifique
b)En cul de las secciones las notas son ms homogneas?
c)Justifique el uso de la medida de dispersin de la parte b.
PROPIEDADES DE LA VARIANZA

Donde: k es una constante


X y Y variables
Medidas de Forma de la Distribucin
Medidas de Asimetra.- Las medidas de asimetra indican la
deformacin horizontal de las distribuciones de frecuencia.


x Me Mo

asimetra negativa
asimetra positiva

x Me Mo

x Me Mo
distribucin simtrica
Se concluye que cuando la poblacin tiene un sesgo, la
mediana es la mejor medida de posicin, ya que
siempre se encuentra entre la moda y la media
aritmtica.
El coeficiente de asimetra se puede calcular de la
siguiente manera:

3( x Me)
CAs
s
Si:
CAs = 0 La distribucin es simtrica
CAs < 0 La distribucin es asimtrica
negativa o sesgada a la Izquierda
CAs > 0 La distribucin es asimtrica positiva
o sesgada a la derecha
Medidas de Apuntamiento o Curtosis .- Una medida de
curtosis indica la deformacin vertical de una distribucin de
frecuencias.
( P75 P25 )
K1 0,5
P90 P10

Distrib. platicurtica
Distrib. leptocrtica Distrib. mesocrtica

K--> 0,5
K--> -0,5
Tambin podemos hacer uso de la siguiente frmula, si los datos
Estn agrupados:

k1
f ( x x)
i i
4
/n m4
3 4 3
4
s s
Si:
k1 > 0 La curva es Leptocrtica

k1 < 0 La curva es Platicrtica

k1 = 0 La curva es Mesocrtica
REFERENCIAS BIBLIOGRAFICAS
CORDOVA ZAMORA, Manuel. ESTADSTICA. EDITORIAL LIBRERA MOSHERA.
QUINTA EDICIN. 2003.
JAYL. DEVORE. PROBABILIDAD Y ESTADSTICA PARA INGENIERIA Y
CIENCIAS
INTERNATIONAL THOMSON EDITORES, S.A de C.V . 1998.
RICHARD A JOHNSON. PROBABILIDAD Y ESTADISTICA PARA INGENIEROS DE
MILLER Y FREUND. Ed. PRENTICE HALL HISPANOAMERICANAS. SA. 1997
MEXICO.
MOYA CALDERON RUFINO. ESTADSTICA DESCRIPTIVA. CONCEPTO Y
APLICACIONES. EDIT. SAN MARCOS S.A. 1991.
Cuestionario

1. Cuando calculamos la mediana, consideramos a todo el conjunto de


observaciones.
2. Cuando la poblacin esta sesgada positiva o negativamente, a menudo es
preferible utilizar la mediana como mejor medida de posicin, debido a
que siempre se encuentra entre la media y la moda
3. Las medidas de tendencia central de un conjunto de datos se refieren al
grado en que las observaciones estn dispersas

4. Las medidas de tendencia central explican la variabilidad de un


conjunto de observaciones
5. La moda es la categora de mayor frecuencia absoluta acumulada.

6. Si organizamos las observaciones de un conjunto de datos en orden


descendente, el punto de datos que se encuentra en medio es la mediana
del conjunto de datos
7. Cuando se trabaja con datos agrupados, podemos calcular una media
aproximada si suponemos que cada valor de una clase dada es igual a su
punto medio

8. El valor que ms se repite en un conjunto de datos se conoce como moda

9.Para un arreglo de datos con 51 observaciones, la mediana ser el valor de


la observacin numero 26 del conjunto de observaciones.

10.La desviacin estndar se mide en las mismas unidades que las


observaciones del conjunto de datos
11. Si la curva de una cierta distribucin tiene el extremo mas largo
hacia la izquierda de la escala de medicin del eje horizontal, se dice que
la distribucin esta negativamente sesgada
12.Despus de agrupar un conjuntos de datos en un cierto numero de clases,
podemos identificar la clase mediana como la que tiene el mayor numero
de observaciones

13.Una mediana calculada a partir de un conjunto de datos en el que se


evidencian datos extremos es una buena estimacin del valor real.

14.Podemos calcular una media para cualquier conjunto de datos, si se nos


da su distribucin de frecuencias

15.La variable gnero (femenino, masculino) es dicotmica.

16. El numero de elementos de una poblacin se denota con n


17.Los valores extremos de un conjunto de datos tienen un fuerte efecto
sobre la mediana

18.La diferencia entre las observaciones mas alta y mas baja de un conjunto
de datos se conoce como media geomtrica

19.La medidas dispersin cuantifican la variabilidad de un conjunto de datos


.

20.La desviacin estndar es igual a la raz cuadrada positiva de la varianza

21. .La diferencia entre las observaciones mas alta y mas baja de un
conjunto de datos se conoce como el recorrido intercuartlico.

22. El recorrido intercuartlico es la diferencia del cuarto superior y cuarto


inferior.
23.Un percentil es una medida de posicin relativa que divide a la
distribucin en 100 partes iguales.

24.La varianza es igual a la desviacin estndar elevada al cuadrado.

25. .El coeficiente de variacin es una medida de dispersin relativa

26. La medida de dispersin que con mas frecuencia utilizan los


especialistas en estadstica es la desviacin estndar

27.Una de las ventajas de la mediana es que no se ve afectada por


observaciones extremas
28. Una desventaja de la media aritmtica es que se ve afectada por datos
extremos.
30. Cada poblacin tiene una varianza que se simboliza con S2

31. Marca de clase es el resultado de medir una caracterstica de


una unidad estadstica o elemental.

32.Cuando la poblacin tiene un sesgo, la media resulta ser la


mejor medida de posicin

33. Los grficos circulares son recomendables para representar


variables cuantitativas continuas

34. El cuartil 3 (Q3) es equivalente al percentil 75 (P75) y decil 3


(D3)

Das könnte Ihnen auch gefallen