Sie sind auf Seite 1von 10

Gua de Estadstica I

Medidas de dispersin
Mientras los estadsticos de tendencia central nos indican los valores alrededor de los cuales se
sitan un grupo de observaciones, los estadsticos de variabilidad o dispersin muestran si los
valores de las observaciones estn prximos entre s o estn muy separados.
Dos conjuntos de datos pueden tener la misma localizacin central y no obstante, ser muy
distintos si uno se halla ms disperso que el otro.
Por ejemplo, supongamos que usted es un agente de compras de una importante empresa
manufacturera, y con regularidad coloca pedidos con dos proveedores distintos. Ambos le indican
que necesitan alrededor de 10 das hbiles para surtir sus pedidos. Despus de varios meses de
trabajar as encuentra usted que el promedio de das necesarios para surtir los pedidos es,
realmente, unos 10 para cada proveedor. Los histogramas que resumen la cantidad de das hbiles
requeridos para surtir los pedidos se ven en la figura. Aunque la cantidad promedio es, ms o
menos, de 10 en ambos casos. Tienen stos el mismo grado de confiabilidad para entregar a
tiempo?. Observe la dispersin, o variabilidad, en los histograma. Qu proveedor prefiere usted?

Para la mayora de las empresas es importante recibir materiales y suministros tiempo. Las
entregas a los siete u ocho das de J. C. Clark Distributor pueden considerarse favorables; sin
embargo, algunas de las entregas a los 13 o 15 das podran ser desastrosas en trminos de la
utilizacin de la mano de obra y del cumplimiento de los programas de produccin. Este ejemplo
ilustra un caso en el que la dispersin, o variedad, en los tiempos de entrega puede ser la
consideracin ms importante para seleccionar un proveedor. Para la mayora de los agentes de
compra, la menor dispersin que muestra Dawson Supply, Inc. hara que fuera el proveedor ms
consistente y preferido.
Dispersin:
Es el grado en que los datos numricos tienden a extenderse alrededor de un valor medio. La
dispersin de la distribucin suministra informacin complementaria que permite juzgar la
confiabilidad de nuestra medida de tendencia central. Si los datos estn ampliamente dispersos, la
localizacin central ser menos representativa de los datos en su conjunto de lo que sera en el
caso de datos que se acumulasen ms alrededor de la media. Adems, si no conviene tener una
amplia dispersin de valores respecto al centro o si esa dispersin implica un riesgo inaceptable,
deberemos ser capaces de reconocerlo y no escoger las distribuciones que presentan la mxima
dispersin.

Gua de Estadstica I

Por ejemplo, a los analistas financieros les interesa la dispersin de las ganancias de una empresa,
las utilidades con una fuerte dispersin indican un riesgo mayor parar los accionistas que las
utilidades que permanecen relativamente estables.
Las medidas de dispersin se dividen en dos grandes grupos:
1- Las medidas de dispersin absolutas: son aquellas que vienen expresadas en las mismas
medidas que identifican a la serie de datos.
2- Las medidas de dispersin relativas: son relaciones entre medidas de dispersin absolutas
y medidas de tendencia central.

Medidas de dispersin absoluta:


Rango o recorrido
Es la diferencia entre el valor ms alto y el ms bajo observado
Notacin: R
Frmula: R = xmx - xmin
Un rango pequeo indica poca variacin, uno grande indica una gran variabilidad.
Observaciones:
No es muy til porque slo toma en cuenta los valores mximo y mnimo de una
distribucin por lo que no da una idea de la verdadera concentracin de los valores.

Igual rango, pero diferente variabilidad.


No se puede utilizar en distribuciones que tengan intervalos abiertos.
Puede ser afectado por observaciones externas.

Gua de Estadstica I

Varianza
Es la medida del cuadrado de la distancia promedio entre la media y cada elemento de la
poblacin.
2 para la poblacin
Notacin:
s 2 para la muestra
Frmulas:
Datos no agrupados
Datos agrupados
N

2
(x i )
i =1

2
(x i x )
i =1

n -1

(x i )2 * f i

i =1
N
g

(x i x )

i =1

*f

n -1

Nota: La teora matemtica establece que si pretendemos estimar la varianza de una poblacin a
partir de la varianza una de sus muestras, resulta que el error cometido es generalmente menor,
cuando para la varianza de la muestra se divide por n 1 y no por n, porque el valor resultante da
una mejor estimacin de la varianza de la poblacin.
Sin embargo, para grandes valores de n (n >30) no hay prcticamente diferencia entre dividir por
n o por n-1.
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido la siguiente tabla:

Gua de Estadstica I
li - li+1
[53 56)
[56 59)
[59 62)
[62 65)
[65 68)
[68 71)
[71 74)

fi
2
5
9
15
12
5
2

xi
54,5
57,5
60,5
63,5
66,5
69,5
72,5

Fi
2
7
16
31
43
48
50

hi
0,0400
0,1000
0,1800
0,3000
0,2400
0,1000
0,0400

% hi
4
10
18
30
24
10
4

Hi
0,0400
0,1400
0,3200
0,6200
0,8600
0,9600
1,0000

% Hi
4
14
32
62
86
96
100

Para calcular la varianza agregamos una nueva columna:


li - li+1
fi
xi
(x i x )2 * f i
[53 56)
2
54,5
168,5448
[56 59)
5
57,5
190,9620
[59 62)
9
60,5
91,0116
[62 65)
15
63,5
0,4860
[65 68)
12
66,5
95,4288
[68 71)
5
69,5
169,3620
[71 74)
2
72,5
155,5848
= 871,38
871,38
s2 =
= 17,7833 pulgadas2
49
Algunas propiedades de la varianza:
*La varianza de una constante es cero.
*Siempre es una cantidad positiva.
*La varianza del producto de una constante por una variable es igual al producto de la
constante al cuadrado por la varianza de la variable.
Observaciones sobre la varianza:
Las unidades de la varianza son los cuadrados de las unidades de los datos y en muchas
ocasiones no son fciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el
conjunto.


Desviacin tpica o estndar.


Se define como la raz cuadrada positiva de la varianza
para la poblacin
Notacin:
s para la muestra
Frmulas:

Gua de Estadstica I
Datos no agrupados
N

Datos agrupados
g

(x i )

i =1

N
n

2
(x i x )

(x i )2 * f i

i =1
N
g

i =1

S=

n -1

(x i x )

i =1

*f

n -1

Tomando el resultado de la varianza calculada anteriormente, s = 4,2170 pulgadas.


Algunas propiedades de la desviacin tpica:
*La desviacin tpica de una constante es cero.
*Siempre es una cantidad positiva.
*La desviacin tpica del producto de una constante por una variable es igual al producto de la
constante por la desviacin tpica de la variable.
Observaciones sobre la desviacin tpica:
Entre sus aplicaciones tenemos el teorema de Chebyshev, el cual afirma que para
1
cualquier conjunto de datos, al menos 1 2 de la observaciones estn dentro de k
k
desviaciones tpicas de la media (K >1). En virtud de esto, si por ejemplo, k = 2 nos dara
0,75. Lo que significa que si formamos un intervalo de 2 desviaciones tpicas por debajo
de la media hasta 2 desviaciones tpicas por encima de la media, en dicho intervalo se
encontrarn como mnimo el 75% de todas las observaciones.
Nos permite determinar con mayor grado de precisin dnde se sitan los valores de una
distribucin de frecuencia en relacin con la media.
Las unidades de la desviacin tpica se expresan en las mismas unidades de los datos.
Puede sufrir un cambio desproporcionado por la existencia de valores extremos en el
conjunto.

Medidas de dispersin relativa:

dispersin absoluta
promedio
Estas medidas vienen generalmente expresadas en porcentajes y su funcin es la de determinar
entre varias distribuciones la de mayor o menor dispersin, esto tiene como ventaja que nos
permite comparar distribuciones donde las unidades pueden ser diferentes ya que estas medidas
son independientes de las unidades utilizadas. Adems, varias distribuciones pueden tener un
mismo valor para determinada medida de dispersin y ser la variabilidad de sus datos en relacin
con la media, diferente
Se trabajar con:
Dispersin relativa =

38

Gua de Estadstica I
Coeficiente de variacin.
Mide el grado de dispersin de un conjunto de datos en relacin con su media.
Notacin: CV
Frmulas:
s
CV = *100% para la muestra
x

* 100% para la poblacin

Observaciones:
El CV es un estadstico til para comparar la dispersin de conjuntos de datos que
tienen distintas desviaciones estndar y distintos promedios.
El CV pierde su utilidad cuando la media se aproxima a cero.
Para los efectos de la situacin que se ha mantenido como ejemplo, tenemos
s = 4,2170 pulgadas.
x = 63,68 pulgadas.
4,22
*100% = 6,62%
CV =
63,68
Interpretacin: la desviacin tpica de la muestra es el 6,62% del valor de la media de la muestra.
CV =

Es importante destacar que las medidas de dispersin relativa sirven para comparar las
variabilidades de dos conjuntos de valores (poblaciones o muestras), mientras que si deseamos
comparar a dos individuos de cada uno de esos conjuntos, es mejor usar valores tipificados.

Variables tipificadas
Los distintos conjuntos de datos estn asociados por lo general a diferentes medias, ya sea porque
son de naturaleza diferente o porque al ser la misma caracterstica medida, sus centros no son los
mismos. Con el propsito de reducir los datos a un mismo punto de referencia y a una escala
comn, se realiza entre ellos una transformacin llamada tipificacin.
Se conoce por tipificacin de una variable x a efectuar el cambio de origen y de escala de la
variable.
Notacin: z

xx
para muestras
z = s
Frmulas:
z = x - para poblacin

Esta nueva variable carece de unidades de medida y permite comparar dos o ms cantidades que
en un principio no son comparables porque aluden a conceptos diferentes. Tambin es aplicable a
casos en que se quieran comparar individuos semejantes de poblaciones diferentes. Por ejemplo,
si deseamos comparar el nivel acadmico de dos estudiantes de diferentes universidades, z nos

Gua de Estadstica I
indica cuntas desviaciones estndar est un valor por arriba o por debajo de la media del
conjunto de datos al cual pertenece.
Ejemplo:
Un estudiante obtuvo 84 puntos en el examen final de matemticas, en el que la nota media fue
76, y la desviacin tpica 10. En el examen final de fsica obtuvo 90 puntos, siendo la media 82 y
la desviacin tpica 16. En qu examen sobresali ms?.
Examen de matemtica
x = 76
s = 10
x = 84
84 76
z=
= 0,8
10
Sobresali ms en matemticas.

Examen de fsica
x = 82
s = 16
x = 90
90 82
z=
= 0,5
16

Gua de Estadstica I
Medidas de Sesgo y Curtosis
Medidas de sesgo
En un anlisis estadstico de una serie de valores, no slo interesa conocer el promedio y la
dispersin de los datos, sino tambin cmo se refleja o se acerca esta serie a una distribucin
simtrica.

Sesgo
Es el grado de asimetra de una distribucin.

Curvas simtricas.
Son aquellas en las cuales al trazar una lnea vertical desde la cumbre de la curva al eje
horizontal, se divide su rea en dos partes iguales.
Grficamente

Curvas asimtricas
Son aquellas curvas en las cuales al trazar una lnea vertical desde su cumbre al eje horizontal,
no se divide su rea en dos partes iguales y pueden ser:
1) Asimetra positiva (sesgo a la derecha): es una curva que disminuye gradualmente
hacia el extremo superior de la escala.

Gua de Estadstica I
2) Asimetra negativa (sesgo a la izquierda): es una curva que disminuye
gradualmente hacia el extremo inferior de la escala.

Coeficiente de asimetra de Pearson.


Notacin: SK
Frmulas:
x Mo
1. SK =
s
3 (x Med )
2. SK =
s
Si SK > 0 La asimetra es positiva.
Si SK = 0 Hay simetra.
Si SK < 0 La asimetra es negativa.
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haban obtenido los siguientes valores:
x = 63,68 pulgadas
Mo = 64 pulgadas
s = 4,2170 pulgadas
SK = -0,0759 asimetra negativa, sesgo a la izquierda.

Medidas de curtosis
Curtosis
Es el grado de pico o de apuntamiento que presenta una distribucin. El patrn de referencia es la
distribucin normal o gaussiana.
1) Curva platicrtica: es aquella que presenta un pico ligero, es achatada.

Gua de Estadstica I
2) Curva mesocrtica: es aquella no es ni muy puntiaguda ni muy achatada (es la curva
normal).

3) Curva leptocrtica: es aquella que presenta un pico alto.

El coeficiente de curtosis.
Es al medida que nos da una idea acerca del achatamiento o levantamiento de la curva en relacin
con la normal.
Notacin: K
Para determinar la curtosis, se establece el porcentaje de valores que se encuentran en el intervalo
x s para considerar lo siguiente:
Si el resultado es menor a 68%, es platicrica
Si el resultado es aproximadamente igual a 68%, es mesocrtica
Si el resultado es mayor a 68%, es leptocrtica
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido: x = 63,68 pulgadas y s = 4,22 pulgadas. Al calcular el
porcentaje para el intervalo x s se obtuvo 68,44%, por lo que es aproximadamente mesocrtica.

Das könnte Ihnen auch gefallen