Beruflich Dokumente
Kultur Dokumente
Estadística
Medidas de Tendencia
Central y Posición
Introducción
Resumir los datos de una muestra o población en un solo
valor o en algunos pocos valores podría ser de mayor utilidad
que el tener todos los datos en su conjunto. Este resumen
sería de mayor interés para analizar el comportamiento de
las variables en estudio.
En esta parte del curso aprenderemos a utilizar las medidas
de tendencia central, las cuales resumen los datos en un solo
valor y tratará de posicionarse en el centro de las distribución
de los datos, es por eso, que se denomina «tendencia
central».
También aprenderemos las medidas resumen que no
necesariamente están en el centro de la distribución de los
datos, como por ejemplo los cuartiles o quintiles, estos
pueden resumir el conjunto de los datos en 4 o 5 valores
respectivamente.
Capacidad general:
Calcula e interpreta la medidas de posición y aplica
según la escala de medición de la variable.
Capacidades específicas:
• Calcula e interpreta la Media, Mediana y Moda para
datos sin agrupar y agrupados.
• Aplica las propiedades de la Media.
• Calcula e interpreta los Percentiles para datos sin
agrupar y agrupados.
• Realiza e interpreta el diagrama de cajas.
• Analiza los valores extremos.
MEDIDAS DE RESUMEN
Las medidas de resumen se
pueden clasificar de acuerdo a la
característica de los datos que se
desea evaluar:
Ejemplo:
Un centro meteorológico tiene registrado los porcentajes de humedad de una zona
industrial observados en 12 días. Calcule el porcentaje medio de humedad de
dicha zona basado en la siguiente información:
92 88 95 76 ....... 82
X 87.5
12
La media aritmética
Ejercicio
a) = 2500
Solución
76 80 82 82 83 88 89 92 92 93 95 95
a) 7 9 7 8 7 4 7 13 7
b) 5 3 4 5 7 3 5 6 3
Es igual tanto a 3, como a 5.
Esta serie de datos es bimodal (dos modas).
c) 5 4 6 11 7 2 15 9 1
No existe moda.
La Moda
Ejemplo:
Los productos declarados con problemas de
funcionamiento en una fábrica de artefactos eléctricos
durante los últimos 6 meses se muestran a continuación:
Producto Cantidad
Televisores 25
Radio 107
grabadoras
Licuadoras 45
Otros 12
¿Cuál es el artefacto más frecuente con problemas de
funcionamiento? Interprete el resultado.
Medidas de tendencia central si los
datos son Agrupados
Media aritmética
i fi
k
x /
x f i i k
i 1 x i 1
n
x h i i
N i 1
Media aritmética: Cuantitativa
discreta
Interrupciones f
El número de interrupciones
semanales en el sistema de red de 0 20
una prestigiosa empresa registrado 1 15
el último año. La tabla de 2 8
distribución de frecuencias para 3 6
estos datos se muestra 4 2
continuación. 5 1
Calcule el promedio del número de Total 52
interrupciones semanales.
Interprete el resultado.
Solución:
0𝑥20+1𝑥15+2𝑥8+3𝑥6+4𝑥2+5𝑥1
X= = 1.19 es el promedio del
20+15+8+6+2+1
estatura mínima
¿Qué medida estadística debemos utilizar?
Los Percentiles dividen
un conjunto de datos en
100 partes
porcentualmente iguales.
Pk X ( E ) 0, d * ( X ( E 1) X ( E ) )
Ejercicio:
Dados los siguientes datos: 0 , 20, 18 , 3, 3, 4 ,15 ,10 ,10 ,9 ,8 , 4,
Calcular: D2, D9, P50, P80
SOLUCION
1er paso.- Ordenar los datos de menor a mayor.
• calcular: nk
100
nk
buscar un Fi ]Li , Ls ] es la clase percentil
100
w nk
Pk Li Fi 1
fi 100
Diagrama de Cajas
Valores
Extremos
(outliers).- Son
aquellos
valores que
están fuera de
LI LS los límites.
RIC (Rango Intercuartil).- RIC= P25 – P75: Indica la dispersión del 50%
central de los datos.
Diagrama de Cajas (Boxplot)
Construcción
1. Se calcula: Q1, Q2 , Q3 , RIC y 1,5RIC.
2. Se traza una línea de referencia horizontal o
vertical (para la escala)
3. Se traza un rectángulo con los extremos en el
primer y tercer cuartil y se traza una recta
vertical en la mediana.
4. Se dibujan los límites a 1,5 rango intercuartil
de los cuartiles 1 y 3, Se considera que los
datos fuera de estos límites son atípicos:
Li Q1 1.5( RIC ) Ls Q3 1.5( RIC )
5. Las líneas antes y después de las cajas se llaman
bigotes, se traza desde los extremos de la caja
hasta el mínimo y máximo dentro de los límites
inferior y superior.
6. Se marcan con un asterisco los valores fuera de
los límites (valores atípicos).
bigote
Diagrama de cajas
Diagrama de Cajas
Permite
La identificación de
los valores extremos
“outliers”
Ejemplo 1
Un ingeniero desea analizar la resistencia a la ruptura (en
onzas) de una muestra de 36 hilos de cáñamo para lo cual
obtuvo los siguientes datos:
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Resistencia
Dos modos que usan los empleados para ir a
trabajar diariamente son el transporte público y
privado (automóvil), A continuación vemos unas
muestras de tiempos en minutos de cada modo:
Público 28 29 32 37 33 25 29 32 41 34
privado 29 31 33 32 34 30 31 32 35 33
2.¿Quién de
15 los grupos es
más
homogéneo?
Notas
10
3. ¿Algún
grupo posee
notas
5
4 atípicas?
4. ¿Qué
0 forma de
H1 H2 H3
asimetría
poseen los
Fuente: Estadística Aplicada a los Negocios UPC-2011 02
grupos?
Bibliografía