Beruflich Dokumente
Kultur Dokumente
BÁSICAS
ESTADISTICA INFERENCIAL
TRABAJO COLABORATIVO
Integrantes:
Angie Lorena López Rodríguez (Código 1821982983)
Lina Marcela Rojas Morales (Código 1821980955)
Nelson Enrique castillo Quiñones (Código 1821980532)
Tutor:
Henry Bacca
30 de septiembre de 2019
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
TABLA DE CONTENIDO
INTRODUCCION.....................................................................................................................................3
OBJETIVO GENERAL:...........................................................................................................................4
Objetivos específicos:............................................................................................................................4
CONSOLIDADO DEL TRABAJO COLABORATIVO.........................................................................5
CONCLUSIONES...................................................................................................................................20
REFERENCIAS......................................................................................................................................21
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
INTRODUCCION
La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo dichas
deducciones, tales como pruebas de estimación puntual (o de intervalos de confianza), pruebas de
hipótesis, pruebas paramétricas (como de media, de diferencia de medias, proporciones, etc.) y no
paramétricas (como la prueba del chi-cuadrado, etc.). También le son útiles los análisis de correlación y
de regresión, las series cronológicas, el análisis de varianza, entre otros.
Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y tendencias, para
hacerse una idea posible de las acciones y reacciones de la misma de cara a condiciones específicas. Esto
no significa que se las pueda predecir fielmente, ni que estemos en presencia de una ciencia exacta, pero
sí de una aproximación posible al resultado final.
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
OBJETIVO GENERAL:
Analizar las variables de la población de la tabla entregada, para estimar cual es la tendencia de
comportamiento de dichas variables.
Objetivos específicos:
R// Para realizar el histograma es necesario primero realizar la tabla de frecuencia. Para el
desarrollo de esta se debe de identificar el número de clases la cual se determina aplicando la
regla de sturges:
k = 1 + 3.322 ⋅ L o g (N)
k = 1 + 3.322 ⋅ L o g (537577) = 20
Obtenido este valor se debe hallar la amplitud de clases mediante el rango sobre el número de
clases.
El rango es la diferencia entre el valor máximo y el valor mínimo y se calcula restando al valor
máximo el valor mínimo. entonces tenemos que:
A=RK
A=
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
Con estos valores, y según la base de datos dada en el ejercicio, se obtiene la siguiente tabla de
frecuencia:
Donde:
L i = Límite inferior
L s = Límite superior
f i = frecuencia absoluta
h i = frecuencia relativa
F i = Frecuencia absoluta acumulada
H i = Frecuencia relativa acumulada
Xi = Marca de clase
Clase N°1:
Li = dato con menor valor de la muestra
Ls = Li +A -1
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
Y analizando dicho histograma a simple vista se puede confundir con una distribución bimodal
ya que tiene más de una barra de frecuencia con cuantía semejantes de datos, para descartar este
análisis se recurre a la gráfica de distribución normal la cual evidencia, claramente, que se trata
de una asimetría positiva.
ende se trata de una distribución sesgada a la derecha. Otro método para establecer el tipo de
distribución es tener presente que cuando el promedio es mayor que la mediana también cumple
con esta característica de distribución.
Ahora bien, cuando se trata de la curtosis, se está hablando sobre el tipo de distribución
(concentración de los datos) entorno a la media.
Se halla la curtosis, teniendo en cuenta que los datos están agrupados en intervalos mediante una
tabla de frecuencia, utilizando la siguiente formula:
Donde:
Y a su vez es necesario identificar con anticipación la varianza muestral cuya formula es:
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
La media o promedio se calcula dividiendo la sumatoria de los valores de los datos entre el
número de datos
Para hallar dichas medidas de dispersión de puede completar la tabla de frecuencias agregando
más columnas al costado derecho aplicando cada formula anterior, pero esto genera que: los
datos a manejar sean números grandes en su valor y aumenta la probabilidad que un error
humano en el cálculo sea mayor, por este motivo se decide calcular las fórmulas dadas
anteriormente usando la herramienta ofimática Excel y sus funciones predeterminadas para
cálculos estadísticos, como lo son:
=CURTOSIS (curtosis)
Es así que realizando este cálculo se tiene que el valor de la curtosis es:
Ya que el valor de la curtosis es de -0,34, se está hablando de una distribución platicurtica pues
existe una baja concentración de los valores en torno a su media g2<3 ~ -0,34 < 3.
Planteándolo en un contexto "colonial"; por eso el histograma y polígono de frecuencia tiene una
forma "achatada" pues los datos se encuentran muy dispersos.
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
R// Cabe resaltar que Excel tiene una función llamada análisis de datos estadísticos (Data
Analysis, o DA) la cual nos permite optimizar tiempo ya que calcula todas las medidas de
dispersión y de tendencia analizando los datos en bruto con el fin de sacar conclusiones con base,
solo, en los datos recolectados.
A continuación, se adjunta tabla con dicho análisis, no obstante, se expondrá cada fórmula para
calcular dichas medidas.
o Mediana.
Formula:
Para lograr localizar el límite inferior de la clase donde se encuentra la mediana y la frecuencia
acumulada anterior a la clase de la mediana primero debemos de dividir el total de los datos entre
dos
y según el posicionamiento en el número de clases tomaremos ese límite inferior y esa frecuencia
anterior.
o Moda.
Formula:
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
o Coeficiente de variación
Formula:
Ahora bien, haciendo una recopilación de las fórmulas planteadas en el punto N° 1 y N° 2 y con
la ayuda de Excel y sus funciones como:
=PROMEDIO
=MEDIANA
=MODA.UNO
y aplicando directamente la formula del coeficiente de variación, ya que Excel no cuenta con una
función para esta mismas, se obtiene los siguientes valores
Medidas de dispersión
Media= 9334
Mediana = 8062
Moda= 6855
Varianza = 24810581,49
Desviacion estandar = 4981,02
54%
Coeficiente de variación =
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
4-Los datos de purchase presenta una variabilidad de $ 4,981.02 lo cual refleja que no son muy
uniformes.
5-Los datos de purchase tiene un coeficiente de variación del 54%; esto quiere decir que son
datos heterogéneos o que se encuentran muy dispersos.
Con base a los datos suministrados y para dar respuesta a la incógnita se clasificaron las edades
de acuerdo a sus respectivas compras, (tabla compras por edades), en la cual se identifica con
una frecuencia de 214690 y un total en compras de $ 1,999749,106 pertenecen a en un rango de
edad de 26 a 35 años siendo este el más significativo
F = 1164624021
M = 3853044357
Total = 5017668378
Según los datos obtenidos en la muestra, las mujeres tienen un promedio de gasto de 8809,8
mientras que los hombres tienen un promedio de 9504,8
4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.
Reemplazando:
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
Resultando lo siguiente:
.
Por tanto, se puede concluir que el intervalo de confianza es desde 48.8 % hasta 52.8 %.
CONCLUSIONES
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
Gran parte del éxito de un estudio como el que entregamos anteriormente depende en su mayoría
por el nivel de confianza que este pueda tener o brindar al lector. Ya que si el resultado es muy
amplio con respecto a los límites y su interacción con la media nos diría que la muestra escogida
no es la correcta y que deberíamos cambiar la forma en que seleccionamos la misma.
La viabilidad del estudio fue determinada por la exposición a las hipótesis planteadas y como
estas determinaron resultados coherentes con respecto a las pruebas y de esta forma descartar
cualquier tipo respuesta que afecte la finalidad del estudio estadístico.
FACULTAD DE INGENIERÍA Y CIENCIAS
BÁSICAS
REFERENCIAS
https://www.youtube.com/watch?v=CuKr7GzohbI
https://www.youtube.com/watch?v=ZAJJB7gbiBs
https://sites.google.com/view/matheuler/estad%C3%ADstica-inferencial