Beruflich Dokumente
Kultur Dokumente
http://bit.ly/2F1s9Cx
http://bit.ly/2tYeciq
Tenga presente que para cada uno de los ejercicios debe ser explícito con la
solución que obtiene, son necesarios procedimientos.
Competencia
● Identifica variables constantes y parámetros, y las relaciones que pueden existir
entre ellos y su representación matemática.
● Desarrolla la estimación de parámetros mediante el uso de intervalos de confianza.
Objetivo
Comprender el procedimiento para construir intervalo de confianza para estimar la
diferencia de dos promedios poblacionales e interpretarlo.
Descripción
El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las
transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el
comportamiento de compra del cliente frente a diferentes productos. Específicamente, el
problema que estamos tratando de predecir la variable dependiente (el monto de la compra)
con la ayuda de la información contenida en las otras variables.
En relación a las variables dadas en la tabla anterior, responda y justifique los resultados:
Intervalos de confianza
Bibliografía
Dagdoug, M. (10 de Julio de 2019). Black Friday Sales: Analysis an Prediction. Obtenido
de Kaggle: https://www.kaggle.com/mehdidag/black-friday
DESARROLLO
𝑁𝑐 = 1 + 3.322 ∗ log(𝑛)
Entonces
n 537577
Máximo 23961
Mínimo 185
Rango 23776
Número de clases 20
Amplitud 1189
HISTOGRAMA DE FRECUENCIAS
80000
fRECUENCIA ABSOLUTA
70000
60000
50000
40000
30000
20000
10000
0
1968.5
3157.5
4346.5
5535.5
6724.5
7913.5
9102.5
779.5
10291.5
11480.5
12669.5
13858.5
15047.5
16236.5
17425.5
18614.5
19803.5
20992.5
22181.5
23370.5
PURCHASE (dólares)
La moda, la media y la mediana son medidas de tendencia central del conjunto de datos.
Así, se tiene que la moda representa el valor de compra con mayor frecuencia, la media
es el valor promedio de las compras para la muestra de clientes y la mediana se refiere
al punto medio donde la mitad de los datos está por debajo, y la otra mitad se encuentra
por encima, es decir que el 50% del valor de las compras está por debajo de los 8062
dólares y el otro 50% del valor de las compras es superior a este monto.
Ahora, con respecto a la desviación estándar de la muestra, se puede inferir una
variabilidad y una dispersión significativa entre los valores de compra del conjunto de
clientes y la media de esta variable. El coeficiente de variación, que tambien es una
medida de dispersión, permite inferir una variación o dispersión de los valores de las
compras con respecto a la media de la muestra del 53.4%.
3.
3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?
Categoría Frecuencia
Edad absoluta
0-17 14707
18-25 97634
26-35 214690
36-45 107499
46-50 44526
51-55 37618
55+ 20903
TOTAL 537577
Dada la frecuencia de cada categoría de edad, se encuentra que la categoría que más
realiza compras en el Black Friday es la de 26-35 años.
Los clientes de la categoría de edad entre 26 y 35 años, quienes son los que más compas
realizan, gastan en promedio 9314.6 dólares.
Los hombres gastan en promedio 9504.8 dólares y las mujeres gastan en promedio
8809.8 dólares.
4. Intervalos de confianza
𝑍2𝜎 2
𝑛= 2
𝑒
1.962 ∗ 48912
𝑛= = 2.38 ∗ 1011
0.022
Se usa Z=1.96 para una confianza de 95% y se usa el valor de la varianza para la
variable.
4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.
𝜎12 𝜎22
𝜇1 − 𝜇2 = 𝑥̅1 − 𝑥̅2 ± 𝑧 ∗ √ +
𝑛1 𝑛2
(5051.1)2 (4721.4)2
𝜇1 − 𝜇2 = (9504.8 − 8809.8) ± 1.96 ∗ √ +
405380 132197
655.2𝑑ó𝑙𝑎𝑟𝑒𝑠 ≤ 𝜇1 − 𝜇2 ≤ 724.8𝑑ó𝑙𝑎𝑟𝑒𝑠
El intervalo de confianza construido es un rango de valores en el cual se encuentra con
un nivel de confianza del 95% (alta probabilidad) el valor real de la diferencia de medias
poblacionales para el gasto promedio en compras entre hombres y mujeres en el Black
Friday, teniendo como base los parámetros muestrales.