Sie sind auf Seite 1von 31

Universidad De San

Martin de Porres
Escuela de Medicina Humana

BIOESTADÍSTICA

Medidas de
Dispersión

Mg. Wilver Rodríguez López


Las medidas de dispersión o variabilidad

Son útiles porque:


Permiten juzgar la confiabilidad de la
medida de tendencia central.
Los datos demasiados dispersos tienen
un comportamiento especial.
Es posible comparar dispersión de
diversas muestras.
AMPLITUD TOTAL: A ó RANGO: R

Se obtiene de la diferencia entre el dato mayor y


el dato menor.

Ejemplo:
Los siguientes datos representan los pesos de 10
pacientes. Calcule el rango.
60, 58, 80, 70, 75, 55, 76, 60, 68, 70

Amplitud Total ó Rango = 80 - 55 = 25

Interpretación
La diferencia entre el paciente con mayor peso y el paciente con
menor peso es 25 kilos.
Cálculo a partir de datos agrupados
Se utiliza la siguiente formula:

Amplitud Total o Rango = ( Ls - Li ) + 1


donde:
Ls : Limite superior de la última clase

L : Limite inferior de la primera clase


i
Ejemplo:
La distribución de frecuencias siguiente representa
las estancia hospitalaria(días) de una muestra de
pacientes. Calcule e interprete el rango

Nº Días Nº de Pacientes
1-4 4 Rango = (20 - 1) + 1
5-8 8
9 - 12 15
13 - 16 23 R = 20
17 - 20 10
Total 60

Interpretación: la diferencia de días entre el


paciente que más días hospitalarios y el paciente
con menos días hospitalarios es de 20 días.
Ventajas
 fácil de calcular
 fácil de entender e interpretar

Desventajas
 sólo considera los valores extremos
 no toma en cuenta ni el número de datos ni el
valor de éstos
 no es posible de calcular en tablas con
extremos abiertos.
La VARIANZA
Es una medida de dispersión e indica la
desviación promedio con respecto a la media
aritmética
a) Cálculos a partir de datos no agrupados.
para una muestra
n

 (X i  x )
2


2 i 1

para un población S n 1

 (X i   )
2

 
2 i 1

N
Ejemplo:
La siguiente información se refiere a los días de
hospitalización de 6 pacientes en un centro de salud:
8, 10, 5, 12, 10, 15. Calcule la varianza.
Elaboramos un cuadro de la forma siguiente

x Xi  x Xi  x  2

8 8 - 10 = 2 4 60
10 10 - 10 = 0 0 x
5 5 - 10 = 5 25
6
12 12 - 10 = 2 4
10
15
10 - 10 = 0
15 - 10 = 5
0
25
x  10
 X  60  Xi  x   0  Xi  x   58
2
 Xi  x   58
2

 (X i  x )
2

S 
2

n 1

2
58

S 6 1  11,6 días 2
LA DESVIACION ESTANDAR

Es la raíz cuadrada de la varianza, sea


poblacional o muestral.
a) Cálculos a partir de datos no agrupados
n
 (Xi  x)
2
Para la muestra i 1
S  s2 
n 1
N
 (Xi   )
2
Para la población
  2  i 1
N
Ejemplo:
En relación al ejemplo anterior. Calcular la desviación
estándar de los siguientes días hospitalarios:
8, 10, 5, 12, 10, 15
Ya sabemos por el ejemplo anterior que S2 = 11,6 días2.
Entonces:

S
2
s
S  11,6 días 2

S  3,4 días
Teorema de Chebyshev

µ-3δ µ-2δ µ-δ µ µ+δ µ+2δ µ+3δ

68.3 %

95.5 %

99.7 %
El coeficiente de variación
Es una medida de variabilidad relativa de los
datos, permite comparar la variabilidad de dos o
más conjuntos de datos expresados en unidades
diferentes (peso; kg. y libras).

a) Calculos a partir de datos no agrupados

Para la muestra: s
CV   100
x
Para la población:

CV   100

Ejemplo:
A continuación se presentan los pesos en dos grupos de pacientes
¿Cuál de los grupos tiene un peso más estable?.

I grupo II grupo
40,70,60,48,52,65,58 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar para


cada uno de los grados
Grupo I
n
 Xi
393
x  i 1
  56,14
n 7
x Xi  x Xi  x  2

40 -16,14 260,50
70 13,86 192,10
60 3,86 14,90
48 -8,14 66,26
52 -4,14 17,14
65 8,86 78,50
58 1,86 3,46

 X  393  Xi  x   0  Xi  x  2


 632,86
Si  Xi  x   632,86
2

n
 i
( X  x )
2
i 1 632,86
S   10,27
n 1 7 1

S
CV   100
x
10,27
CV   100  18,29
56,14
Grupo II n
 Xi
i 1 847
x    105,87
n 8

x Xi  x Xi  x  2

70 -35,87 1286,6569
35 -70,87 5022,5569
150 44,13 1947,4569
140 34,13 1164,8569
82 -23,87 569,7769
110 4,13 17,0569
140 34,13 1164,8569
120 14,13 199,6569

X  847  Xi  x   0,04  Xi  x 


2
 11372,88
n
Si  Xi  x 2  11372,88
i 1

n
 ( Xi  x )
2
i 1 11372,88
S   40,30
n 1 8 1

S 40,30
CV   100 CV  100  30,06
x 105,87

El II grupo presenta una mayor variabilidad en sus


pesos que el I grupo.
CONSIDERACIONES
SI:

C.V  33% La distribución se puede considerar


aproximadamente simétrica.

C.V ≥ 33% La distribución puede ser asimétrica


positiva o negativa.

07/09/2018
Medidas Forma:

Curvas simétricas: Cuando


al trazar una línea el área se
divide en dos partes iguales. Curvas asimétricas o
sesgadas: Concentrados en
el extremo inferior o superior
del eje horizontal.
La “cola” indica el tipo de
sesgo.
Coeficiente de Simetría de Pearson

p = 3 (X - Me)
S
p<0 p=0 p>0

Asimetría a la izquierda Simétrica Asimetría a la derecha


X<Me<Mo X=Me=Mo Mo<Me<X
Coeficiente de Curtosis

Refleja el grado de agudeza.


(a) Leptocúrtica (concentración al centro)
(b) Mesocúrtica (distribuidos simétricamente)
(c) Platicúrtica (aplanada).
DESVIACIÓN ESTANDAR

( f i xi ) 2
 f i xi 
2

S n
n 1

Donde: fi: frecuencias absolutas simples


Xi: puntos medios de los intervalos de clase
Ejemplo:
Calcular la desviación estándar de la siguiente
distribución de frecuencias:
Nº de Días
Hospitalarios Xi fi Xi*fi Xi2*fi
2 - 4 3 4 12 36
5 - 7 6 10 60 360
8 - 10 9 15 135 1215
11 - 13 12 30 360 4320
14 - 16 15 5 75 1125
17 - 19 18 1 18 324
Total 65 660 7380
DESVIACIÓN ESTANDAR

660
7380 
65
S
65  1

S  3.25
USO DE LAS DIFERENTES
MEDIDAS DE DISPERSION
• La desviación estándar se emplea cuando
también es apropiado el uso de la media,
es decir, con distribuciones simétricas(no
sesgadas) de datos numéricos.
• Percentiles y rango intercuartilicos se
emplean, cuando la distribución no es
simétrica(sesgada) y es apropiado el uso
de la mediana.
USO DE LAS DIFERENTES
MEDIDAS DE DISPERSION
• El rango es una medida apropiada para
datos numéricos cuando el propósito es
enfatizar valores extremos.
• El coeficiente de variación es útil cuando
la intención es comparar dos
distribuciones numéricas medidas en
escalas diferentes.
El “Boxplot” (Diagrama de Caja)
• Al igual que el histograma y el gráfico de
Tallo y Hoja permite tener una idea visual
de la distribución de los datos (simetría y
variabilidad)
• Permite detectar outliers (valores
extremos).
• Permite comparar la media y la
variabilidad de varios grupos (alternativa
gráfica a pruebas estadísticas)
Boxplot: Procedimiento
1. Dibujar una caja cuyo límite inferior será
Q1 y el superior Q3. Dentro de la caja
trazar una línea que localice la mediana.
2. Calcular el rango intercuartílico:
R.I. (Q) = RIQ = Q3 – Q1
3. Dibujar un “bigote” del borde inferior de
la caja hasta Q1-1.5xRIQ .
Boxplot: Procedimiento
5. Dibujar otro“bigote” del borde
superior de la caja hasta
Q3+1.5xRIQ .
6. Dibujar cualquier observación que
se ubique fueras de los bigotes
(estos serán los outliers).
BoxPlot: Ejemplo

50

40

30
Datos

20

10

Das könnte Ihnen auch gefallen