Sie sind auf Seite 1von 10

FACULTAD DE

INGENIERÍA Y
CIENCIAS BÁSICAS

PROYECTO GRUPAL Institución Universitaria Politécnico Grancolombiano

ESTADISTICA INFERENCIAL SEMANAS 3, 4 Y 5

Perdomo Pedro Pablo

Parraga Florez Oscar Steven

Beltran Hinestroza Lewis

Hernandez Arias Jonathan David

INSTITUCIÓN UNIVERSITARIA POLITÉCNICO GRANCOLOMBIANO

FACULTAD DE INGENIERIA Y CIENCIAS BÁSICAS

ESTADÍSTICA INFERENCIAL

SUBGRUPO 33

2019
Contenido

1. INTRODUCCIÓN..........................................................................................................................3
1.1. OBJETIVO PRINCIPAL..........................................................................................................4
1.2. OBJETIVOS SECUNDARIOS..................................................................................................4
2. DESARROLLO..............................................................................................................................5
2.1. DESCRIPCIÓN......................................................................................................................5
3. RESULTADOS..............................................................................................................................6
4. INTERVALOS DE CONFIANZA......................................................................................................9
ANEXOS............................................................................................................................................10
1. INTRODUCCIÓN

La estadística inferencial es una materia que deriva de las matemáticas y la probabilidad de


resolución de problemas de estimación puntual y segmentada que favorecen la solución
dificultades de una población mediante características cuantitativas y cualitativas a nivel cotidiano
de los cuales se presentan a lo largo de la vida.

La inferencia es llegar a puntos objetivos, metas claras y cifras puntuales o bajo ciertos rangos
destinados a informar acerca de un comportamiento de una población mediante la extracción de
una muestra para posteriormente analizarla.
1.1. OBJETIVO PRINCIPAL

Comprender el procedimiento para construir intervalo de confianza para estimar la diferencia de


dos promedios poblacionales e interpretarlo.

1.2. OBJETIVOS SECUNDARIOS

 Identificar variables constantes y parámetros, y las relaciones que pueden existir entre
ellos y su representación matemática.
 Desarrollar la estimación de parámetros mediante el uso de intervalos de confianza.
2. DESARROLLO

2.1. DESCRIPCIÓN

El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las


transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el
comportamiento de compra del cliente frente a diferentes productos. Específicamente, el
problema que estamos tratando de predecir la variable dependiente (el monto de la compra)
con la ayuda de la información contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID Identificador único del comprador

Product_ID Identificador único del producto.

Gender Sexo del comprador

Age Edad del comprador dividida en


contenedores
Occupation Ocupación del comprador.

City_Category Lugar de residencia del comprador.

Stay_In_Current_City_Year Número de años en la ciudad actual.


s
Marital_Status Estado civil del comprador

Product_Category_1 Categoría de producto de compra

Product_Category_2 El producto puede pertenecer a otra


categoría
Product_Category_3 El producto puede pertenecer a otra
categoría
Purchase Valor de la compra en dólares
3. RESULTADOS

Por lo anterior se sugiere que realice la siguiente:

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1. Realice un histograma y explique la forma y la curtosis según el contexto.

El histograma y el polígono de frecuencia muestra una gran dispersión de los datos por lo que hay
que tener en cuenta todas las posibilidades de que pueden hacer que los datos varíen, aun así, se
puede apreciar la aproximadamente cual fue la marca de clase más relativa. Además de poder
deducir que la curtosis del contexto está bastante alejada a la media muestral.
2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e
interprete los resultados.

MODA 6,855.00
MEDIA 8,062.00
DESVIACIÓN 4,981.02
ESTÁNDAR
VARIANZA 24,810,535.33
CV 0.62
C. A 0.62

 Interpretación media: Según la tabla de frecuencia se puede decir que el valor promedio
de gasto en el blackfriday es de $ 8.062
 Interpretación desviación: los datos están dispersor aproximadamente en 4981.02 con
respecto a la media.
 Interpretación Coeficiente de desviación: la dispersión de los datos esta alrededor de un
62% lo que quiere decir que esta muestra no es la adecuada y que estos datos no son
fiables.

Con relación a las variables dadas en la tabla anterior, responda y justifique los resultados:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday?

Rango Edades Purchase


26-35 1,999,749,106
36-45 1,010,649,565
18-25 901,669,280
46-50 413,418,223
51-55 361,908,356
55+ 197,614,842
0-17 132,659,006
Total general 5,017,668,378.0
0
3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?

Rango Edades Prom. Gastos


26-35 9,314.6
Total general 9,314.6

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?

Gender Purchase % compra


F 1,164,624,021 23%
M 3,853,044,357 77%
Total general 5,017,668,378

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

Gender Prom. Gastos


F 8,809.8
M 9,504.8
Total general 9,333.9
4. INTERVALOS DE CONFIANZA

4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error relativo del 2% y un
nivel de confianza del 95%.

Utilizaremos la siguiente tabla como referencia

Promedio de Gastos Base de Datos / R


Mujeres 8809.761349
Hombres 9504.771713
Varianza.M 22291996.2
Varianza.H 25513179.4
Desviacion.M 4721.440055
Desviacion.H 5051.057256
N.M 132197
N.H 405380

Analizaremos el nivel de confianza, Entonces:

Interpretamos que de un este sería el resultado que se logra construir entre hombres y
mujeres, para el tamaño de la muestra se utilizara la siguiente formula

Sería el resultado del Tamaño de la Muestra, para la variable que se determinó.

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la
diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.

Calculo - Diferencia H&M

Interpretación: donde (p) la probabilidad de que una persona de escoger a una mujer, y donde (q)
la probabilidad de escoger a una persona que esta sea hombre.
ANEXOS

ANEXO 1. ARCHIVO EXCEL CON CÁLCULOS RELACIONADOS.

Das könnte Ihnen auch gefallen