Sie sind auf Seite 1von 39

Medidas Descriptivas de las

Variables Cuantitativas

PROFESOR: PRSPERO CELSO BENITES GRADOS


MEDIDAS DE TENDENCIA CENTRAL

LA MEDIA
MEDIANA
MODA
PERCENTILES
MEDIA DATOS SIN AGRUPAR

MEDIA DATOS DE LA POBLACION


x i
i 1
N

x
MEDIA DATOS DE LA MUESTRA
i
6, 4, 4, 1, 5, 3, 2, 6, 8, 5, 2. x i 1
n
PARA DATOS AGRUPADOS DE VARIABLE DISCRETA

Si los datos estn ordenados con una tabla de


frecuencia tenemos:

variable fi DATOS AGRUPADOS


xi f1
k

x f
: :

: : i i

xk fk x i 1
n
Ejemplo: Calcule la media aritmtica en la tabla siguiente:

Nmero de Nmero de
habitaciones Viviendas
1 3
2 4
3 7
4 10
5 2
Total 26
PARA DATOS AGRUPADOS POR INTERVALOS
Si n valores de una variable cuantitativa X estn
organizados en una distribucin de frecuencias de k
intervalos, donde:
m1, m2, , mk son las marcas de clase.
f1, f2, , fk son las frecuencias absolutas respectivas.
Entonces, la media aritmtica esta dada por:

m i fi
x i 1
n
INTERVALOS mi fi Fi
[15 19> 17 5 5
[19 23> 21 5 10
[23 27> 25 13 23
[27 31> 29 4 27
[31 35> 33 2 29
[35 39> 37 1 30
n = 30
LA MEDIANA

Definicin: La mediana (Me) o valor mediano


de una serie de valores observados, es el
nmero que separa a la serie de datos
ordenados (en forma creciente o decreciente) en
dos partes de igual nmero de datos.
La mediana es la medida promedio que
depende del nmero de orden de los datos.
CALCULO DE LA MEDIANA

PARA DATOS NO AGRUPADOS

Para realizar el clculo de la mediana de n valores no


agrupados de una variable cuantitativa X se siguen los
siguientes pasos:

1. Se ordenan los datos en forma creciente.


2. Luego, se ubica el valor central Me.
Si n es impar, la mediana es el dato ordenado del centro.
Pero si n es par, la mediana es la semisuma de los dos
valores ordenados centrales.
Ejemplo
Supongamos que tenemos las edades (en aos) de 11
abogados antiguos que sufren de Hipertensin.

51, 52, 47, 30, 69, 29, 40, 86, 77, 36, 80.

Hallar la mediana de la edad de los abogados que sufren


de hipertensin.
PARA DATOS AGRUPADOS

Para datos agrupados en intervalos se utiliza la


siguiente frmula:
n
2 Fi 1
Me L I A
fi

Donde:
L I : es el limite inferior del intervalo de la mediana.

A : es la amplitud del intervalo de la mediana.


Fi 1 : es la frecuencia acumulada anterior a la clase
mediana.
fi : es la frecuencia simple de la clase mediana.
INTERVALOS mi fi Fi
[15 19> 17 5 5
[19 23> 21 5 10
[23 27> 25 13 23
[27 31> 29 4 27
[31 35> 33 2 29
[35 39> 37 1 30
n = 30
LA MODA

Definicin: La moda de una serie de datos es el


valor Mo que se define como el dato que ocurre
con mayor frecuencia.
La moda no siempre existe y si existe, no siempre es
nica. La moda es el promedio menos importante
debido a su ambigedad.
Ejemplo Se realizo una encuesta a 12
estudiantes del doctorado de la USP, sobre el
nmero de hijos y se obtuvo las siguientes
respuestas:

Nmero Nmero de
de hijos estudiantes Hallar la moda.
1 1
2 3
3 5
4 3
Total 12
PARA DATOS AGRUPADOS EN INTERVALOS

Para calcular la moda de n datos organizados por


intervalos se siguen los siguientes pasos:
Primero se determina el intervalo que contiene
a la Mo. Este intervalo se denomina intervalo
modal y que debe ser el nico con mayor
frecuencia, tiene amplitud A, frecuencia fi y sus
frecuencias vecinas antes y despus son fi-1 y fi+1
respectivamente.
Luego se aplica la formula:

Mo =LI + ( ) A
+

Donde:
LI = Limite inferior del intervalo modal
A = Valor de la amplitud de los intervalos
= -
= - +
INTERVALOS mi fi Fi
[15 19> 17 5 5
[19 23> 21 5 10
[23 27> 25 13 23
[27 31> 29 4 27
[31 35> 33 2 29
[35 39> 37 1 30
n = 30
PERCENTILES
Son medidas de posicin que dividen el total de observaciones
en 100 partes iguales, la formula para calcular percentiles es:

nk
Fi 1
Pk L I A 100
Donde: fi

k 1,2,....,99.
L I : es el limite inferior del intervalo de la mediana.
A : es la amplitud del intervalo de la mediana.
Fi 1 : es la frecuencia acumulada anterior a la clase mediana.
f i : es la frecuencia simple de la clase mediana.
Ejercicio
Supongamos que tenemos los puntajes de 50 alumnos
en una prueba de 100 preguntas. Determinar el P25, P60.

Nmero de
Puntajes
alumnos
[20 -30) 3
[30-40) 6
[40-50) 7
[50-60) 14
[60-70) 7
[70-80) 7
[80-90) 3
[90-100] 3
Total 50
MEDIDAS DE DISPERSIN
Indican si las puntuaciones son muy parecidas o muy distintas entre s.

Las siguientes distribuciones tienen todas una media de 4. Qu las diferencia?


7, 6, 3, 3, 1
3, 4, 4, 5, 4
4, 4, 4, 4, 4

Existen dos procedimientos:

1. Considerar el recorrido o amplitud de la escala en la que se distribuyen las


puntuaciones;
2. Describir la variacin por medio de las diferencias que se producen entre
todas las puntuaciones y un ndice de tendencia central.
En que se diferencian con las medidas de
tendencia central?
Mientras las medidas de tendencia central nos indican
dnde se concentra un grupo de puntuaciones, las
medidas de dispersin refieren a la homogeneidad /
heterogeneidad de una distribucin.
Cmo se relacionan con las medidas de
tendencia central?
- Son complementarias.
- Para calcular las medidas de dispersin es necesario
conocer los valores de otras medidas. (media aritmetica)
- Ambos tipos de medidas son necesarias para la descripcin
de una distribucin.
MEDIDAS DE DISPERSIN
La medidas de dispersin o variabilidad son nmeros reales
que miden el grado o nivel de separacin de los datos con
respecto a un valor central, que generalmente es la media
aritmtica.
Las principales medidas de dispersin son:
El rango
La varianza.
La desviacin estndar y
El coeficiente de variacin.
EL RANGO

El rango de variacin o recorrido, denotado


por R es el nmero que resulta de la
diferencia del valor mximo menos el valor
mnimo de una serie de datos observados.
R = Valor mximo Valor mnimo
Ejemplo:
De la siguiente serie de datos, hallar el rango:
6, 4, 4, 1, 5, 3, 2, 6, 8, 5, 2.
LA VARIANZA
Es una medida de dispersin que, en promedio, cuantifica el
nivel de dispersin o de variabilidad de los valores de una
variable cuantitativa con respecto a su media aritmtica.
Denotacin:
2
Varianza Muestral s

Varianza Poblacional 2
DESVIACIN ESTNDAR

Es la raz cuadrada positiva de la varianza.

s s 2
2
Varianza para datos no agrupados:
n

i
n

(x 2
i x) 2 ( x )
s
2 i 1 2 i 1

n 1 N

Desviacin Estndar datos no agrupados


n

i
n

(x i x) 2 ( x ) 2

s i 1 i 1

n 1 N
Ejemplo:

Hallar la varianza y desviacin estndar de los


siguientes datos muestrales:

2, 6, 8, 10, 3, 5, 4, 8.
Varianza para datos agrupados
K

i
K

( x x) 2
i
2
fi ( x ) fi
s
2 i 1
2 i 1

n 1 N

Desviacin Estndar para datos agrupados


K

(x )
K

( x x) 2 2
i fi i fi
s i 1
i 1

n 1 N
Ejemplo:
De los siguientes datos, hallar la varianza y
desviacin estndar.

N hijos por
fi
familia
0 1
1 4
2 7
3 6
4 2
Total 20
Coeficiente de Variacin
Se denota por CV, y es una medida de dispersin relativa, que se
define como el cociente de la desviacin estndar entre la media
aritmtica. Esto es:
s
CV 100
x

El coeficiente o ndice de variacin se utiliza para comparar la


variabilidad de dos o ms series de datos que tengan medias
iguales o diferentes o que tengan unidades de medida iguales o
diferentes.
Ejemplo:
Un estudio sobre el monto de bonos pagados y los aos de
servicio empleados, dio como resultado los siguientes datos
estadsticos: la media de los bonos pagados fue $200
(dlares), y la desviacin estndar fue $40. La media del
numero de aos de servicio fue 20 aos, y la desviacin
estndar 2 aos. Compare las dispersiones relativas de las
dos distribuciones empleando el coeficiente de variacin.
Solucin:
Las distribuciones estn en unidades diferentes (dlares y aos de servicio).
Por lo tanto se convierten en coeficiente de variacin.

Para los bonos Para los aos de servicio



CV = (100) CV = (100)

= 200 = 20
S = 40 S=2
40 2
CV = 200 (100) = 20% CV = 20 (100) = 10%

Al interpretar se puede ver que existe mayor dispersin relativa con


respecto a la media en la distribucin de los bonos pagados en comparacin
con la distribucin de los aos de servicio (porque 20% > 10%).
Ejemplo:
Se va ha comparar la variacin en los ingresos anuales de varios ejecutivos con
la variacin de los ingresos de trabajadores no calificados. En una muestra de
ejecutivos la media es $500000 y S = $50000: Para una muestra de empleados
no calificados la media es $32000 y S = $3200 uno se ve tentado a afirmar que
hay mayor dispersin en los ingresos anuales de los ejecutivos porque $50000
> $3200, sin embargo la medias son tan distantes que se necesitan convertir
los valores estadsticos a coeficiente de variacin para poder efectuar una
comparacin significativa de los variaciones en los ingresos anuales.

Para los ejecutivos Para los trabajadores no calificados


CV = S/X (100) CV = S/X (100)
CV = 50000/500000(100) = 10% CV = 3200/32000(100) = 10%

No existe diferencia en la dispersin relativa de los dos grupos


Ejemplo
Se ha evaluado a 3 obreros para saber su rapidez en la
fabricacin de un artculo, sus resultados en segundos se
presentan en la siguiente tabla. Mediante el C.V. indicar
que obrero tiene mejor rendimiento

Obrero1 Obrero2 Obrero3


61.8 60.8 61.4
61.9 60.7 61.2
63.2 62.9 63.3
63.8 62.8 61.0
Ejercicio 1

INTERVALOS mi fi Fi
[15 19> 17 5 5
[19 23> 21 5 10 Encuentre todas
[23 27> 25 13 23 las medidas de
[27 31> 29 4 27
tendencia central
y de dispersin
[31 35> 33 2 29
[35 39> 37 1 30
n = 30
Ejercicio 3

Calcule las medidas de tendencia central

Numero de Nmero de
Hijos Familias
0 1
1 4
2 7
3 6
4 2
Total 20
Ejercicio 4
Supongamos que tenemos las edades de 50 presos del penal
Cambio Puente, se pide determinar la edad promedio de los
presos.

Nmero de
Puntajes
presos
[20 -30) 3
[30-40) 6 Encuentre todas las
[40-50) 7 medidas de tendencia
[50-60) 14 central y de dispersin
[60-70) 7
[70-80) 7
[80-90) 3
[90-100] 3
Total 50
Ejercicio 5

Consideremos el peso de 21 estudiantes de la escuela de


postgrado. Segn la siguiente distribucin de frecuencias:

Peso Nmero de
[Li-LS) estudiantes
50-55 4 Calcule la mediana del
55-60 3 peso de los 21
60-65 2
estudiantes.
65-70 4
70-75 6
75-80 2
TOTAL 21
Ejercicio 6

Consideremos el peso de 21 estudiantes de la escuela


de postgrado. Segn la siguiente distribucin de
frecuencias:
Peso Nmero de
[Li-LS) estudiantes
50-55 4 Calcule la moda del
55-60 3 peso de los 21
60-65 2
alumnos.
65-70 4
70-75 6
75-80 2
TOTAL 21
Ejercicio 7

Calcule la varianza y desviacin estndar, de los


siguientes datos muestrales, sobre el pago de servicio
por cliente en un estudio de abogados.
Pago de servicios
# de clientes
(S/.)
[260-340) 1
[340-420) 2
[420-500) 4
[500-580) 10
[580-660) 16
[660-740) 8
[740-820) 4

Das könnte Ihnen auch gefallen