Sie sind auf Seite 1von 35

ESTADÍSTICA

APLICADA 1
Semana 4
OBJETIVOS
• El alumno calcula las principales medidas de
dispersión con el auxilio de una hoja electrónica.
• El alumno interpretar las principales medidas de
dispersión y las utiliza en la toma de decisiones.

Imágenes Creative Commons CCO


MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central por si solas no brindan toda la información que se
requiere para analizar una muestra, se requiere de las medidas de dispersión para
tal efecto.
Ejemplo: Si a usted le dicen que en promedio puede ganar Q 5,000 al mes en
realidad no sabe si puede ganar el mínimo establecido por la ley o Q 15,000 pues
no conoce la dispersión de los datos.
RANGO
Se define como la diferencia entre el valor máximo
y el valor minino de los datos, es la medida de
dispersión mas fácil de calcular y de entender.
Rango = valor máximo- valor mínimo
Un problema del rango es que solo observa dos
datos y no toma en cuenta el resto.

Ejemplo: En un call center se tomo el tiempo con el


cual dos agentes telefónicos resolvieron
satisfactoriamente a los clientes que llamaron
RANGO
Ambos agentes telefónicos, atendieron a 5 clientes y el tiempo de respuesta en
minutos es el siguiente.
Operador A Operador B
4 5
6 6
7 9
10 9
12 10

Rango operador A = 12 – 4 = 8 minutos


Rango operador B = 10 – 5= 5 minutos
Esto indica que el operador B tiene menor variación en el tiempo de atención a los
clientes.
VARIANZA
Es una medida de dispersión que toma en cuenta todos los datos y se basa en la
diferencia de cada dato respecto de la media.
Varianza Poblacional
෌ X−𝜇 2
𝜎2 =
𝑁
En donde
𝜎 2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑋 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑁 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛.
VARIANZA POBLACIONAL
Ejemplo: En un curso de estadística se desea conocer cual es la varianza poblacional
de las notas del examen parcial. Las notas de los exámenes son las siguientes

23 45 67 78 79
68 83 80 83 72
89 95 90 45 64
Solución:
Paso 1: Se Obtiene la media aritmética de la población.
𝜇 = 70.73
VARIANZA POBLACIONAL
Paso 2: Se determina la diferencia de cada dato y la media aritmética, se puede
utilizar una tabla para este efecto.
Nota 𝜇
23 23-70.73 = -47.73
45 45-70.73 = -25.73
67 67-70.73 = -3.73
78 78-70.73 = 7.27
79 79-70.73 = 8.27
89 89-70.73 = 18.27
95 95-70.73 = 24.27
90 90-70.73 = 19.27
45 45-70.73 = -25.73
64 64-70.73 = -6.73
68 68-70.73 = -2.73
83 83-70.73 = 12.27
80 80-70.73 = 9.27
83 83-70.73 = 12.27
72 72-70.73 = 1.27
VARIANZA POBLACIONAL
Paso 3: Se eleva al cuadrado cada una de las diferencias, recordemos que cualquier
numero elevado al cuadrado siempre será positivo
𝜇 𝜇 2
Nota
23 23-70.73 = -47.73 2278.47
45 45-70.73 = -25.73 662.20
67 67-70.73 = -3.73 13.94
78 78-70.73 = 7.27 52.80
79 79-70.73 = 8.27 68.34
89 89-70.73 = 18.27 333.67
95 95-70.73 = 24.27 588.87
90 90-70.73 = 19.27 371.20
45 45-70.73 = -25.73 662.20
64 64-70.73 = -6.73 45.34
68 68-70.73 = -2.73 7.47
83 83-70.73 = 12.27 150.47
80 80-70.73 = 9.27 85.87
83 83-70.73 = 12.27 150.47
72 72-70.73 = 1.27 1.60
VARIANZA POBLACIONAL
Paso 4: Se realiza la sumatoria de todas las diferencias al cuadrado
𝜇 𝜇 2
Nota
23 23-70.73 = -47.73 2278.47
45 45-70.73 = -25.73 662.20
67 67-70.73 = -3.73 13.94
78 78-70.73 = 7.27 52.80
79 79-70.73 = 8.27 68.34
89 89-70.73 = 18.27 333.67
95 95-70.73 = 24.27 588.87
90 90-70.73 = 19.27 371.20
45 45-70.73 = -25.73 662.20
64 64-70.73 = -6.73 45.34
68 68-70.73 = -2.73 7.47
83 83-70.73 = 12.27 150.47
80 80-70.73 = 9.27 85.87
83 83-70.73 = 12.27 150.47
72 72-70.73 = 1.27 1.60
5472.93
VARIANZA POBLACIONAL

Paso 5: Finalmente se divide la sumatoria entre el total de datos en ese caso 15

5472.93
𝜎2 = = 364.90
15
DESVIACIÓN ESTÁNDAR POBLACIONAL
Una vez determinada la varianza se puede conocer cual es la desviación estándar,
la cual es una medida de dispersión muy útil, pues esta nos ayuda a comprender la
media aritmética.
La desviación estándar se define como la raíz cuadrada de la varianza
෌ X−𝜇 2
𝜎2 = σ =
𝑁

364.90 = 19.10
VARIANZA MUESTRAL
El procedimiento es muy parecido a la varianza de la población
෌ X−𝑋ത 2
𝑠2=
𝑛−1
En donde
𝑠 2 = 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑋 = 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛
𝑋ത = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑛 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
VARIANZA
MUESTRAL
Ejemplo: El gerente de un
supermercado desea conocer que
tan lejos (en kilómetros) viven los
clientes, por esta razón toma al
azar una muestra de clientes y se
les pregunta a que distancia
viven. Con estos datos determine
la varianza de la muestra
VARIANZA MUESTRAL
De la misma manera que con la varianza poblacional, se debe obtener la media
aritmética.
1.5 1.8 2.0 2.3 2.5 4.1 4.2 3.8 3.7 5.1
𝑋ത = 3.1 𝑘𝑖𝑙𝑜𝑚𝑒𝑡𝑟𝑜𝑠
VARIANZA MUESTRAL
Se determina la diferencia entre cada dato y la media de la muestra, esta
diferencia se eleva al cuadrado y se obtiene la sumatoria de estos datos.

Distancia 𝑋ത 𝑋ത 2

1.5 -1.6 2.56


1.8 -1.3 1.69
2.0 -1.1 1.21
2.3 -0.8 0.64
2.5 -0.6 0.36
4.1 1.0 1.00
4.2 1.1 1.21
3.8 0.7 0.49
3.7 0.6 0.36
5.1 2.0 4.00
∑ 13.52
VARIANZA MUESTRAL
A diferencia de la varianza poblacional, en la varianza muestral la sumatoria de las
diferencias al cuadrado se divide entre el numero total de datos de la muestra
menos 1
෌ X−𝑋ത 2
𝑠2=
𝑛−1
13.52
𝑠2=
10−1
13.52
𝑠2= =1.50
9
DESVIACIÓN ESTÁNDAR MUESTRAL
Nuevamente la desviación estándar muestral es la raíz cuadrada de la varianza.
෌ X−𝑋ത 2
s=
𝑛−1

𝑠 = 1.50 = 1.22 kilometros


TEOREMA DE CHEBYSHEV
Teorema propuesto por el matemático ruso Pafnuti
Lvóvich Chebyshov en el cual se establece qué
proporción de los datos que se tienen esta dentro
de k desviaciones estándar a partir de la media.

1
𝑇𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐶ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 = 1
𝐾2

Esta foto de Autor desconocido está bajo licencia CC BY-SA


TEOREMA DE CHEBYSHEV
1
𝑇𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐶ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 = 1
𝐾2
Por ejemplo si se toman 2 desviaciones estándar por debajo de la media y 2
desviaciones estándar por encima de la media.
k= numero de desviaciones estándar
1
𝑇𝑒𝑜𝑟𝑒𝑚𝑎 𝑑𝑒 𝐶ℎ𝑒𝑏𝑦𝑠ℎ𝑒𝑣 = 1
22
1
1
4
1- 0.25 = 0.75
Entonces al menos 75% de los datos están entre dos desviaciones estándar.
REGLA EMPÍRICA
En una distribución normal, la cual su gráfico tiene forma de campana, se puede
determinar con ayuda de la desviación estándar que
1. Aproximadamente el 68% de los datos están a una desviación estándar a la
derecha y a la izquierda de la media.
2. Aproximadamente el 95% de los datos están a dos deviaciones estándar a la
derecha y a la izquierda de la media.
3. Aproximadamente el 99.7% de los datos están a tres desviaciones estándar a la
derecha y a la izquierda de la media.
REGLA EMPÍRICA

68%
95%
99.7%
EJEMPLO REGLA EMPÍRICA
Ejemplo: El precio promedio de litro de leche es de Q 9.50
con desviación estándar de Q 0.75
a) ¿Entre qué dos precios se encuentra aproximadamente el
68% de los precios del litro de leche?
b) ¿Entre qué dos precios se encuentra aproximadamente el
95% de los precios del litro de leche?
c) ¿Entre qué dos precios se encuentra aproximadamente el
99.7% de los precios del litro de leche?
SOLUCIÓN
a) Como es el 68% entonces se suma y se resta una desviación estándar a la media
𝑋ത ± 𝑠 9.50±0.75
Entre Q 8.75 y Q10.25
b) Como es el 95% entonces se suma y se resta dos desviaciones estándar a la media
𝑋ത ± 2𝑠 9.50 ± 2 0.75
9.50 ± 1.50
Entre Q 8.00 y Q11.00
c) Como es el 99.7% entonces se suma y se resta tres desviaciones estándar a la media
𝑋ത ± 3𝑠 9.50 ± 2.25
Entre Q 7.25 y Q 11.75
MEDIA ARITMÉTICA DE DATOS AGRUPADOS
Cuando los datos se agrupan mediante tablas de frecuencias es posible determinar la media
aritmética y la desviación estándar, pero debemos aclarar que solo son una estimación de los
valores reales.
Media aritmética datos agrupados
Σ𝑓𝑀

𝑋=
𝑛
Donde
𝑋ത = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑓 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑀 = 𝑝𝑢𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑜 𝑜 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑛 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
Σ = 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠 𝑓𝑀
EJEMPLO
La siguiente distribución de frecuencias muestra el costo de venta de 85 artículos en
un pequeño almacén.
Limite inf Limite sup f
20 29 8
30 39 15
40 49 35
50 59 21
60 69 6

Determine la media aritmética del costo de los productos.


SOLUCIÓN
Paso 1. Se debe encontrar el punto medio o marca de clase M
Limite inf Limite sup f M
20 29 8 24.5
30 39 15 34.5
40 49 35 44.5
50 59 21 54.5
60 69 6 64.5
SOLUCIÓN
Paso 2:
Paso seguido se debe multiplicar cada frecuencia de clase por el punto medio y
obtener la sumatoria de todos los productos.
Limite inf Limite sup f M fM se obtiene de
20 29 8 24.5 196 =8x24.5
30 39 15 34.5 517.5 =15x34.5
40 49 35 44.5 1557.5 =35x44.5
50 59 21 54.5 1144.5 =21x54.5
60 69 6 64.5 387 =6x64.5
∑= 3802.5
SOLUCIÓN
Paso 3. Se divide la sumatoria de los productos fM entre el total de datos n
3802.50
𝑋ത =
85

La media aritmética de los costos de venta del almacén es Q 44.74


DESVIACIÓN ESTÁNDAR DE DATOS AGRUPADOS.
Para determinar la desviación estándar de una distribución de frecuencias se
utilizara la siguiente fórmula.
Σ𝑓 𝑀−𝑋ത 2
𝑠=
𝑛−1
Donde
𝑠 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑓 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑀 = 𝑝𝑢𝑛𝑡𝑜 𝑚𝑒𝑑𝑖𝑜 𝑜 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑋ത = 𝑚𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑛 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎𝑡𝑜𝑠
EJEMPLO
Determinar la desviación estándar del costo de venta de productos de un almacén
del cual sabemos que la media aritmética es Q 44.74

Limite inf Limite sup f M


20 29 8 24.5
30 39 15 34.5
40 49 35 44.5
50 59 21 54.5
60 69 6 64.5
SOLUCIÓN
Paso 1: Se determina la diferencia entre el punto medio y la media aritmética

Limite inf Limite sup f M 𝑀 𝑋ത


20 29 8 24.5 -20.24
30 39 15 34.5 -10.24
40 49 35 44.5 -0.24
50 59 21 54.5 9.76
60 69 6 64.5 19.76
SOLUCIÓN
Paso 2: Se eleva al cuadrado la diferencia entre el punto medio y la media
aritmética

Limite inf Limite sup f M 𝑀 𝑋ത 𝑀 𝑋ത 2

20 29 8 24.5 -20.24 409.66


30 39 15 34.5 -10.24 104.86
40 49 35 44.5 -0.24 0.06
50 59 21 54.5 9.76 95.26
60 69 6 64.5 19.76 390.46
SOLUCIÓN
Paso 3: Se multiplica cada frecuencia de clase con la diferencia al cuadrado y se
obtiene la sumatoria de dicha multiplicación

Limite inf Limite sup f M 𝑀 𝑋ത 𝑀 𝑋ത 2 𝑓 𝑀 𝑋ത 2

20 29 8 24.5 -20.24 409.66 3277.26


30 39 15 34.5 -10.24 104.86 1572.86
40 49 35 44.5 -0.24 0.06 2.02
50 59 21 54.5 9.76 95.26 2000.41
60 69 6 64.5 19.76 390.46 2342.75
9195.30
SOLUCIÓN
Paso 4: finalmente se divide entre el total de datos menos 1, el total de datos es
igual a la sumatoria de frecuencias 85

Σ𝑓 𝑀 𝑋ത 2 9195.30 9195.30
𝑠= 𝑠= 𝑠=
𝑛 1 85 84

𝑠 = 109.47 = 10.46

Por lo tanto la desviación estándar de los costos de venta del almacén es


Q 10.46

Das könnte Ihnen auch gefallen