Sie sind auf Seite 1von 28

FORMAS TPICAS DE LOS DIAGRAMAS DE

DISPERSIN ESTADSTICA

LA DESVIACION TIPICA Y OTRAS MEDIDAS


DE DISPERSION

Introduccin.
Hemos visto que las medidas de tendencia central
nos
proporcionan
informacin
sobre
el
comportamiento de un conjunto de observaciones, a
travs de un dato que tiende a ubicarse en un punto
central. Sin, embargo no nos proporcionan
informacin sobre las variaciones o dispersin que
pueden tener los datos en su conjunto, es decir, sobre
la homogeneidad o heterogeneidad de los datos.
2

Medidas de Dispersin.
Concepto.- A los estadgrafos que nos permiten medir el
grado de concentracin o dispersin de los valores o
datos, alrededor de un promedio, se les denomina
estadgrafos de dispersin.
Existen varias medidas de dispersin, siendo las ms
comunes:
Recorrido o Rango.
El Rango Semi-intercuartil
La varianza
Desviacin estndar, etc.
3

Medidas de Dispersin
Medida de informacin respecto a la cantidad de
VARIABILIDAD presente en un conjunto de datos.
dispersin
AMPLITUD TOTAL O RANGO: A
2 2
VARIANZA
DESVIACIN TPICA O ESTANDARD
SEMIRECORRIDO INTERCUARTLICO
COEFICIENTE DE VARIACIN CV

Recorrido o Rango (R)


El rango constituye una de las medidas ms simples que
miden la dispersin de un conjunto de datos.
El recorrido de un conjunto de observaciones es la
diferencia entre el mayor y el menor valor de la variable
que se analiza:

R X mx X min

La Desviacin Media (DM)


Es el promedio de las desviaciones de cada valor de la
variable respecto de la media aritmtica.

DM

X
i 1

X
DM

nY Y
i 1

Si los datos no estn


Si los datos estn tabulados
tabulados.
Donde:
m = numero de clase., ni = frecuencia absoluta de la clase i; Yi = marca de clase o punto
medio de la clase i.

,
6

El Rango semi-intercuartil (Q)


El rango semi-intercuartil, o desviacin cuartil, de un
conjunto de datos, se define como:
Q

Q3 Q1
,
2

SEMIRRECORRIDO INTERCUARTILICO

Q3 Q1 P75 P25
Q

2
2

1) Determinar la posicin para cada Percentil

(35 1) 0.25 9
Para el P75 (35 1) 0.75 27
2) La clase que contiene P25 Li 360
2) La clase que contiene P75 Li 390
Para el P25

3) Realizar la
interpolacin

Q3 390

Q2 360

35 0.75 22
7

35 0.25 6
4

15 399.11

15 370.31

Pr

Li

n.r Fa
f

399.11 370.31
Q
14,4
2

Varianza
muestra

poblacin
DATOS SIN
AGRUPAR

DATOS
AGRUPADOS

f x
2

n

2 x x
s
n 1

2 f x x
s
n 1

Varianza
La varianza es una medida que proporciona informacin
sobre el grado de dispersin de los valores de un conjunto
de datos con respecto a su media aritmtica, de tal modo
que mientras mayor sea el valor de la varianza, mayor es la
dispersin y cuanto mas pequea sea la varianza, menor es
la dispersin, lo que significa que mayor es la
concentracin de los datos o valores alrededor de su media
aritmtica.
La varianza es el promedio del cuadrado de las desviaciones
de cada valor de la variable respecto de la media aritmtica.
10

Mtodo de calculo para datos sin


agrupar
La formula que se utiliza para datos sin agrupar es la
siguiente:
n
2
Xi X

S 2 i 1
,
n
donde:
S2 :

Varianza

Xi :

Valores individuales de la variable.

X:

n:

Media aritmtica.
Nmero de observaciones.
11

Mtodo de calculo para datos agrupados sin


intervalos
Cuando los datos estn agrupados en una tabla de variable
discreta se utiliza la siguiente frmula:
n

S2

X
i 1

2
i i

i 1

fi

S2

2
X
i fi
i 1

X2

12

Mtodo de calculo para datos agrupados con


intervalos
Cuando los datos estn agrupados en una Tabla de
variable cuantitativa continua, se utiliza la
siguiente frmula:
n

S
2

Y
i 1

fi

Y f

i 1

S2

Y
i 1

fi

Y 2

Donde:
Yi : Marca de clase del i-simo intervalo de clase
13

Ejemplo: Calcular la varianza de la siguiente distribucin de


sueldos en dlares ($) de trabajadores de un Hospital, sabiendo
que la media de los sueldos es:174,40 dlares.
Sueldos

fi

($)
90-120
120-150
150-180
180-210
210-240
240-270
270-300

11
13
20
17
15
3
1

Total

80

14

El siguiente cuadro ilustra la forma cmo se organizan los


datos para obtener los elementos de la frmula de la varianza.
Sueldos ($)
Yi f i
Yi
fi
Yi 2 f i
90-120
120-150
150-180
180-210
210-240
240-270
270-300

11
13
20
17
15
3
1

Total

Y
i 1

fi

fi

i 1

1155
1755
3300
3315
3375
765
285

121275
236925
544500
646425
759375
195075
81225
2584 800

S 2 1903,36

80

105
135
165
195
225
255
285

32310 30406,64 1903,36

15

Desviacin Estndar (S)


La desviacin Estndar de una distribucin se define como
la raz cuadrada de la varianza. Por consiguiente para su
calculo solo debemos agregarle una raz cuadrada a las
frmulas de la varianza.
Mtodo de calculo para datos sin agrupar:
X
n

i 1

16

Mtodo de calculo para datos agrupados sin intervalos

X
i 1

2
i

fi

i 1

fi

2
i

i 1

fi

X2

Mtodo de calculo para datos agrupados con


intervalos
n

Y
i 1

fi

Y f

i 1

Y
i 1

fi

17

Propiedades de la Varianza

V X

a) Para cualquier distribucin la varianza es siempre una


cantidad no negativa. S 2 V X 0
b) Si el valor de las observaciones son todas iguales, entonces
la varianza es cero.
c) La varianza de una constante es cero.
V K 0,

K : constante

d) La varianza del producto de una constante por una variable,


es igual al cuadrado de la constante por la varianza de la
variable.
V KX K 2V X ,
K : constante
e) La varianza de la suma de una variable ms una constante,
es igual a la varianza de la variable. V X K V X , K : constante
X :var iable
f) Para dos muestras de tamaos que tienen medias iguales
y
varianzas respectivamente. La varianza total est dada por:

S12 n1 S 22 n2
S
n
2

18

Propiedades de la desviacin Estndar


1) La desviacin Estndar ya fue definida.
2) Frecuentemente, cuando n es grande n 30 , la
distribucin
de
las
n
observaciones
es
aproximadamente simtrica o tiene la forma de una curva
normal. De acuerdo a las reas bajo la curva normal
indicados en Tablas se puede sostener que:
a) 68,27% de los casos estn entre X S y X S (o sea una
desviacin estndar a cada lado de la media).
b) 95,45% de los casos estn entre X 2S y X 2S (o sea, dos
desviaciones estndar a cada lado de la media).
c) 99,73% de los casos estn entre X 3S y X 3S (o sea, tres
desviaciones estndar a cada lado de )
19

COEFICIENTE DE VARIACION

Esta definido por la expresin


S
CV
X

Donde:
S : desviacin estndar del conjunto de datos.
X : media aritmtica del conjunto de datos.

Este estadgrafo de dispersin se expresa en unidades independientes de la


naturaleza de la variable. El valor se puede expresar en trminos porcentuales.
Es un estadgrafo que se utiliza para comparar dos o ms distribuciones,
cuando las unidades de medida de las variables estn expresadas en diferentes
unidades o escalas de medida.
20

La varianza es una media de cuadrados de los desvos (MC)

2
x x

n-1

suma de cuadrados
de los desvios (SC)

grados de libertad (GL)

La divisin por n-1 asegura que la varianza muestral sea una estimacin
centrada de la varianza poblacional
Es sensible a valores extremos (alejados de la media).
Sus unidades son el cuadrado de las de la variable

DESVIACIN TPICA
Es la raz cuadrada de la varianza

S S 2

Tiene las misma dimensionalidad (unidades) que la variable.

Coeficiente de variacin
s
CV
x

Es el cociente entre la desviacin tpica y la media.


Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media

Es frecuente indicarla en porcentajes


Si la media es 80 y la desviacin tpica 20 entonces
CV =20/80 = 0,25 = 25% (variabilidad relativa)
Es adimensional. Interesante para comparar la variabilidad de
diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan ms dispersin en peso que en altura.
No debe usarse cuando la variable presenta valores negativos o donde
el valor 0 sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F

MEDIDAS DE RESUMEN

Medidas de tendencia central


Medidas de dispersin
Medidas de posicin
FORMA DE LADISTRIBUCION

medidas de asimetra (sesgo)

as = +

as = Coeficiente de asimetra

asimetra positiva

asimetra negativa

distribucin simtrica

x Mn
as 3
s
Es nulo cuando la
distribucin es simtrica

TIPOS DE CURVAS

SIMTRICA
las observaciones equidistan del mximo central con la
misma frecuencia.
Coinciden Media, Moda y Mediana
ASIMTRICA
la cola ms larga determina la direccin del sesgo.
Se separan la Media, Mediana y Moda
BIMODAL

MULTIMODAL

FORMA DE LADISTRIBUCION
Medidas de
asimetra
Medidas
de apuntamieno o curtosis

Exceso de
frecuencias

Distrib. leptocurtica

Exceso de
frecuencias

Distrib. platicurtica

LA ASIMETRA
Definicin: Es la deformacin horizontal de la curva
de frecuencias.

Frmulas:

Simbologa: As
Nivel de medicin:
Intervalos o razn

Asimetra a la izquierda o negativa

Coeficientes de Asimetras de Pearson:


AS 1

x Mo
S

AS 2

Coeficiente Cuartil de Asimetra:

AS 3

Asimetra a la derecha o positiva

Q3 2Q2 Q1
Q3 Q1

Coeficiente Percentil de Asimetra

AS 4

Mo Me x

3( x Me)
S

P90 2 P50 P10


P90 P10

Mo Me x
Curva Normal:

Mo Me x

LA CURTOSIS PERCENTILICA
Definicin: El Coeficiente de Curtosis
Percentlico es una media de la curtosis basada
en los cuartiles y percentiles.

Frmula:
De donde:

Q
P90 P10

Simbologa: k
Nivel de medicin:
Ordinal, Intervalos o
razn

Si:

K: Coeficiente de Kurtosis.
P90: Percentil 90.
P10: Percentil 10.
Q3 Q1
Q: Desviacin Quartil: Q
2

La grfica
platicrica

La grfica
mesocrtica

La grfica
leptocrtica

LA CURTOSIS DE FISHER

El Coeficiente de Curtosis viene


definido por la siguiente frmula:
n

Frmula:
g2

La grfica
platicrica

(1 / n)( ( xi x )
i 1

s4

La grfica
mesocrtica

Simbologa: k
Nivel de medicin:
Ordinal, Intervalos o
razn

Los resultados pueden ser los siguientes:


g2 = 0 (distribucin mesocrtica).
g2 > 0 (distribucin leptocrtica).
g2 < 0 (distribucin platicrtica).
La grfica
leptocrtica

Das könnte Ihnen auch gefallen