Sie sind auf Seite 1von 21

Jueves 17 de mayo 2018

Facultad de Ingeniería

INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO

Autores:
Diego Alejandro Flores Contreras
Felipe Gonzalo Sánchez Carrera
Rodrigo Esteban Solano Riquelme

Profesor:
Felipe Varas Concha
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 2

Resumen ejecutivo
El presente informe de análisis estadístico se ha elaborado a fin de representar por medio
del estudio de muestras, el comportamiento de determinadas poblaciones de la forma más cercana
a la realidad.
El objetivo del plan es tomar 2 muestras estadísticas de variables de nuestra vida diaria y
2 muestras de uso público idealmente relacionadas entre ellas. Cada una de estas variables
responde a una pregunta de investigación.
El plan de muestreo para la primera variable cotidiana: el número de las calorías
consumidas por día se llevará acabo registrando el tiempo de alimento y la cantidad en una
aplicación que calculará las calorías diariamente por un mes. Mientras que para la segunda
variable “tiempo entre la llegada de un vehículo a otro”, los datos serán observados y medidos
dentro de 40 minutos desde las 11:50 a 12:30 horas y anotados según la hora oficial del Servicio
hidrográfico y oceanográfico de la armada.
El plan de muestro para las variables públicas consistirá buscar los datos y extraerlos de
fuentes confiables en internet: los datos del valor diario del dólar en Chile serán tomados de
marzo a mayo de la página del Banco Central, mientras que los datos del cobre de la Comisión
Chilena del Cobre por el mismo periodo.
Para estas muestras se utilizarán los estadísticos para interpretar sus comportamientos y
relaciones, además de predecir sus distribuciones y realizar inferencias que nos ayudarán al
estudio de ellas. Además, en el informe se incluirán gráficos para representar sus frecuencias
dentro de ciertos rangos, su variabilidad en el tiempo y la diferencia que existen entre cada dato
de las distintas variables.
Finalmente, a partir de los planteamientos descritos de realizarán las conclusiones y
observaciones que consideramos pertinentes para caracterizar las variables elegidas.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 3

Índice

Introducción ........................................................................................................................................... 4

Variables aleatorias escogidas ............................................................................................................... 5

Inferencias de las variables .................................................................................................................. 17

Conclusiones ......................................................................................................................................... 20

Bibliografía........................................................................................................................................... 21
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 4

Introducción
La estadística descriptiva es una parte de la estadística la cual se encarga de recolectar,
analizar y caracterizar una serie de datos con el fin de describir sus rasgos y comportamientos por
medio de estadísticos, tablas y gráficos. El objetivo del siguiente informe es describir una serie de
datos medidos por cuenta propia y extraídos de fuentes públicas con el fin de responder a una
pregunta de investigación definida para cada variable.
Para cumplir este objetivo se han seleccionado dos variables tomadas por cuenta propia y
muestreados durante un periodo de treinta días entre los meses de abril y mayo del presente año
en conjunto con dos variables obtenidas en bases de datos de índole pública comprendidos en el
periodo marzo – mayo, también del presente año, los cuales van a ser graficados, observados y
analizados para poder extraer una conclusión para cada variable.
El informe está estructurado con una breve descripción de las variables y los factores que
la afectan, seguido de la clasificación del tipo de variable y su posible distribución en conjunto
con los gráficos que se han considerado necesarios para representar los datos. Es seguido por un
análisis de inferencia del comportamiento los datos. Este informe finaliza mostrando las
conclusiones pertinentes a cada variable muestreada y analizada, extrayendo las inferencias
principales.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 5

Variables aleatorias escogidas

Variable 1: Cantidad de calorías


La caloría (kcal) es una unidad de medida que representa el valor energético de un
alimento. Con esta variable buscamos responder la pregunta ¿Cuántas calorías consume un
estudiante cada día? y describir con una muestra la cantidad de energía que consume un hombre
en condiciones normales sin un habito de ejercicio regular. La información fue tomada en el
periodo de un mes cada día por dos de los integrantes del grupo.

Factores que afectan a la cantidad de calorías consumidas


Cantidad de tiempo: (Factor controlable) El tiempo disponible influye para la selección
de los alimentos (generalmente comida rápida o lista) y la cantidad.
Cantidad de dinero: (Factor controlable) La cantidad de dinero afecta directamente a la
cantidad y calidad de la comida, generalmente a mayor dinero mayor es la cantidad de
kilocalorías ingeridas.
Estado anímico: (Factor controlable) El estado del ánimo puede contribuir a consumir
menos o más alimentos, un estudiante con ansiedad puede estar constantemente consumiendo
energía.
Clima: (Factor incontrolable) El clima puede influenciar en el tipo de alimento que
consumen las personas, por ejemplo, un clima con bajas temperaturas favorece la ingesta de
comidas más calóricas que uno con altas temperaturas.
Energía consumida: (Factor controlable) La cantidad de energía gastada produce que el
cuerpo necesite más o menos alimentos que consumir. A menor perdida de energía menor deseo
de comer.
Factor social: (Factor controlable) El entorno social puede motivar o no a comer. Las
reuniones sociales en general llevan a las personas a consumir mayores cantidades de alimentos
sin que estos se percaten.

Tipo de variable
Esta variable cuantitativa es discreta debido a que los datos se midieron en números enteros,
quiere decir que este conjunto numerable no puede tomar valores entre 1 y 2, 3 y 4, 4 y 5, …etc.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 6

Tipo de distribución muestral que se espera obtener


En esta variable se espera una distribución tipo Poisson, esto se debe a que el histograma
presenta una distribución sesgada hacia la derecha, similar a la Poisson. Junto a ello hay que
agregar que la variable fue medida en función de una unidad de tiempo y que esta variable es
trabajada como una del tipo discreta, haciendo a Poisson el único candidato disponible para la
distribución de la variable.

Resumen de estadísticos y gráficos

Elegimos los gráficos de puntos para ver la tendencia de los datos a través del tiempo.

Calorías consumidas durante el día


5000
4000
Calorías

3000
2000
1000
0
10-abr 15-abr 20-abr 25-abr 30-abr 05-may 10-may 15-may
Tiempo [días]

calorías consumidas [kcal/día] Rodrigo calorías consumidas [kcal/día] Felipe


INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 7

Distribución probabilistica del consumo de calorías en un día


0,008
0,007
0,006
Probabilidad

0,005
0,004
0,003
0,002
0,001
0
500 1000 1500 2000 2500 3000 3500 4000
Calorías consumidas por día

Rodrigo Felipe

Los histogramas nos ayudan a ver la concentración de los datos en ciertos rangos y así
comparar las 2 muestras tomadas de Rodrigo y Felipe.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 8

Variable 2: Intervalo de tiempo entre la llegada de un vehículo a otro a la universidad


Los datos obtenidos desde las mediciones buscan responder la pregunta ¿Cada cuánto
tiempo ingresa un auto a la universidad? Y representar la frecuencia de entrada de los vehículos
al campus Los Niches de la Universidad de Talca. El tiempo en el que se tomó la muestra fue un
viernes entre las 11:50 horas y las 12:30 horas, tiempo en el que se podría decir que hay un alto
flujo de movimiento vehicular.

Factores que afectan el tiempo de llegada de los vehículos


Congestión vehicular: (Factor incontrolable) Dentro del trayecto en dicha ruta para llegar
a la universidad dependerá del tránsito vehicular si este está en una hora “Peak” donde hay un
gran porcentaje de automóviles, un tránsito normal o muy poco tránsito.
Accidente en ruta a universidad: (Factor incontrolable) Algún accidente en las cercanías
de las dependencias que afecten el transito normal a la universidad provocara un retraso en la
llegada de los automóviles.
Factores personales: (Factor controlable) Retrasos no programados de llegada por dichos
motivos personales que propician un retraso.
Actividades curriculares en la universidad: (Factor controlable) Las actividades en la
universidad son muy a menudo por lo que produce un aumento en el transito habitual en las
dependencias de la facultad.
Hora de actividad o clases en el establecimiento: (Factor controlable) Por distintos
motivos tanto los alumnos, profesores, administrativos, personal entre otros llegan a una hora
determinada lo cual puede ser igual o distinta en cualquiera de los casos.
Control de carabineros: (Factor incontrolable) Es algo imprevisto que puede suceder en
la ruta hacia la universidad o fuera de esta, que no se puede controlar porque depende de esta
institución externa.
Tipo de variable
El tipo de variable de estas mediciones es continua a causa de que el tiempo puede ser
representado en pequeñas cantidades, tanto como el instrumento de medición pueda evaluar. Y
siempre entre dos valores observables va a existir un tercer valor intermedio que también podría
tomar la variable continua.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 9

Tipo de distribución muestral que se espera obtener


Esta variable se espera que adquiera una distribución de tipo Exponencial. El hecho que
se haya medido la diferencia de tiempo entre entrada de vehículo hace que esta distribución sea
un candidato, debido a que la distribución ya mencionada se modela en función del tiempo hasta
encontrar un evento que interesa. Hay que agregar que el histograma presenta un sesgo hacia la
derecha, presentando un símil con el gráfico de distribución ya mencionada.

Resumen de estadísticos y gráficos

El gráfico de puntos en este caso nos permite ver que herramientas usar al momento de
realizar inferencias.

Tiempo transcurrido de ingreso de vehiculos


350
Difeerencia en segundos

300
250
200
150
100
50
0
11:50:00 12:00:00 12:10:00 12:20:00 12:30:00
Tiempo
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 10

Con el histograma obtenemos claramente el tipo de distribución de los datos, gracias a los
intervalos de cada barra.

Este otro gráfico de puntos representa más claramente la tendencia de la muestra y la


diferencia de entrada de los vehículos con respecto al tiempo.

Distribución Exponencial diferencia entrada de vehiculos


0,016

0,014

0,012

0,01
Probabilidad

0,008

0,006

0,004

0,002

0
0 50 100 150 200 250 300
diferencia de tiempo entre entrada de vehiculos [s]
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 11

Variable 3: Dólar observado


El dólar estadounidense es la moneda en circulación más extendida mundialmente y base
de la economía global. La información obtenida del precio del dólar en pesos chilenos (CLP) a
partir de un tramo de tiempo –de marzo a mayo de 2018– quiere responder a la pregunta ¿Cuánto
varió el dólar en el periodo de 3 meses? Y caracterizar el promedio ponderado de las operaciones
de cambio peso dólar.

Factores que afectan el valor del dólar


Cantidad de dólares: (Factor incontrolable) La cantidad de dólares dentro del país hace
variar su valor. Mientras más dólares circulan dentro del territorio el precio baja y en caso
contrario el precio se alza.
Demanda: (Factor incontrolable) El deseo de las personas por tener dólares afecta
también su precio. Dado que las personas están más dispuestas a pagar la divisa entonces su
precio sube y el precio disminuye cuando el interés por el dólar baja.
Exportación e inversión: (Factor controlable) Exportar una gran cantidad de productos
nacionales y atraer inversionistas al territorio aumenta el número de dólares aminorando el precio
de la moneda norteamericana.
Petróleo: (Factor incontrolable) El petróleo es una de las principales importaciones al
país y cuando el valor del petróleo sube entonces la demanda del dólar aumenta, afectando su
precio.
Cobre: (Factor incontrolable) El precio del cobre afecta directamente a la cantidad de
dólares que entran a la nación. Si el precio del cobre es alto el ingreso de la moneda americana es
mayor y disminuye en el caso contrario.
Tasa de interés: (Factor controlable) Cuando la diferencia de la tasa de interés de Chile
respecto a la de Estados Unidos es establemente mayor los inversionistas prefieren invertir su
dinero en el país ya que se pagan más intereses por el y se genera un aumento de la oferta de
dólares, produciendo que el valor del dólar se abarate.

Tipo de variable
El tipo de variable de estas mediciones es continua ya que el valor del dólar varia
porcentualmente y el cambio de una moneda a otra también afecta al valor decimal.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 12

Tipo de distribución muestral que se espera obtener


Esta muestra una distribución sesgada hacia la derecha. Es posible apreciar esta forma en
el momento de observar el histograma, el cual muestra un grupo de datos concentrado a la
izquierda y a medida que se mueve a la derecha su frecuencia disminuye. Debido al sesgo que
esta presenta es alto, no es posible utilizar normal en esta muestra. En razón a lo ya indicado se
ha escogido una distribución gamma, la cual por su versatilidad puede adaptarse a la forma que
presenta el histograma, abarcando de buena manera el sesgo que los datos presentan a momento
de calcular sus frecuencias.

Resumen de estadísticos

El histograma siguiente es muy claro al ver la concentración de los datos y cuya


interpretación es detallada anteriormente.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 13

Los puntos de esta gráfica nos permiten ver claramente donde se concentran con respecto
al valor del dólar, son pocos los datos que se escapan de la tendencia.

Distribución probabilistica precio del dólar


0,05
0,045
0,04
0,035
Probabilidad

0,03
0,025
0,02
0,015
0,01
0,005
0
590 595 600 605 610 615 620 625 630 635 640
precio del dolar [CLP]
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 14

Variable 4: Precio nominal cobre diario


El precio nominal es el valor actual del cobre (¢/lb) teniendo en cuenta los precios que
hay en el momento del estudio del mercado. Con las cifras adquiridas de un periodo de tiempo –
de marzo a mayo de 2018– se quiere responder a la pregunta ¿Cuánto vario el dólar en un periodo
de 3 meses? Y describir el precio del cobre en el mercado de valores.

Factores que afectan el precio del cobre


Demanda: (Factor incontrolable) La demanda de este material provoca tanto el aumento
como la disminución de su precio nominal, a mayor demanda se ve reflejado un aumento de su
valor y la disminución de su inventario. (ejemplo; la importancia de exportación de este material
con China)
Relación cobre-dólar: (Factor incontrolable) Dicha relación es determinante en saber el
aumento o disminución del valor tanto del cobre como del dólar, cuando el precio del cobre
aumenta el del dólar se ve claramente perjudicado por que este disminuye y lo vemos reflejado ya
que con los mismos dólares de antes no es posible comprar la misma cantidad de cobre por lo que
el precio nominal del dólar disminuyo.
Riesgos geopolíticos: (Factor incontrolable) Tiene que ver con acuerdos políticos,
negociaciones entre países o conflictos bélicos armados que influyen directamente en el precio de
este y repercuten en gran parte de la población mundial.
Riesgos políticos: (Factor controlable) Tiene que ver con problemas políticos internos
dentro del país en la relación del estado y los privados que trabajan en este rol.
Problema de relación Empresa- trabajadores: (Factor controlable) Exigencias de
trabajadores o respeto sobre sus derechos conllevan a tomar medidas necesarias como una huelga
para buscar una solución a sus problemas provocando menos producción en este rol o al contrario
un aumento por una buena relación que se refleja en la producción.
Aumento de las tecnologías: (Factor incontrolable) El aumento de las tecnologías es un
factor relevante ya que tiene directamente relación con este material, ya que el cobre en si forma
gran parte en la producción de diferentes artículos tecnológicos. Un claro ejemplo son los
automóviles eléctricos que componen 3 veces más cobres que uno normal.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 15

Tipo de variable
El tipo de variable de estas mediciones es continúa puesto que el precio del mercado varia
cada segundo en pequeños valores.

Tipo de distribución muestral que se espera obtener


Esta variable muestra una distribución Normal. Esto se logra ver al momento de observar
el histograma de la libra de cobre, ya que muestra que cierto grupo de datos se concentra en el
centro de este mientras que el resto de los datos se dispersan en cantidades menores entre las
demás categorías. Hay que agregar que la media aritmética y la mediana de los datos son
bastantes cercanas, situación que presentan las distribuciones que tienden ser del tipo Normal.

Resumen de estadísticos

Este histograma también es representativo para reconocer la distribución de los datos.


INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 16

Este tipo de gráficos nos permite ver más detalladamente la distribución Normal de los
datos.

Distribución probabilistica del cobre


0,45
0,4
0,35
0,3
Probablidad

0,25
0,2
0,15
0,1
0,05
0
2,95 3 3,05 3,1 3,15 3,2
precio de libra del cobre [USD]
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 17

Inferencias de las variables


Inferencia estadística del consume diario de 2 personas
Primero que todo se debe aclarar que tanto Rodrigo como Felipe tienen distintos
requerimientos, ya que estos tienen distinto peso, altura, edad y ámbitos alimenticios diferentes
para este caso ocuparemos el grafico de caja y bigote para comparar el consumo diario de 30 días
de nuestros 2 integrantes con el fin de analizar y sacar la mayor información de cómo se
comportan sus datos.

Al analizar los datos


calculados y el grafico de caja de
bigote podemos concluir que tanto
Felipe como Rodrigo tiene dietas
distintas y requerimientos
diferente Felipe por un lado tiene
una media mayor a su
requerimiento y tiene su gran parte
de los datos sobre estas, además
tiene 2 datos atípicos estos se
pueden explicar, ya que él no tiene
una dieta fija, es sedentario y
come comida chatarra con habitualidad y esos 2 días en especial el comió en exceso, por lo que él
debe corregir sus hábitos alimenticios, ya que los datos demuestran que el tendrá una tendencia a
subir de peso si el no cambia o sigue un tipo de dieta, en tanto Rodrigo tiene su media bajo los
requerimientos diarios y tiene gran parte de sus datos bajo estas por lo que se puede inferir que él
tiene una buena dieta que no supera los límites establecidos pero tiene un descuido el cual se ve
reflejado en el dato atípico que tiene, por tal motivo ese día consumió más de lo que debía,
Rodrigo tiende a bajar de peso lo cual no es tan positivo ya que debe estar cerca de sus
requerimientos lo cual se sugiere que aumente un poco el consumo.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 18

Inferencia del comportamiento del precio del cobre


Cabe destacar que existen varias razones por las fluctuaciones del cobre en el
tiempo y factores que tanto lo afectan o como lo potencian, sin embargo, tiene un tipo de
distribución que se le atribuye en este caso como grupo vemos que se comporta como una
distribución normal, pero con una varianza desconocida por lo que ocupado T-student para
calcular y además de buscar cómo se comporta este con algún test de hipótesis o un intervalo de
confianza.

Comportamiento cobre y dolar desde marzo a mayo


3,2 640,00
3,15 630,00
3,1 620,00
3,05 610,00
USD

3 600,00 CLP
2,95 590,00
2,9 580,00
2,85 570,00
18

18

18

18

18

18

18

18

18
3-

3-

3-

4-

4-

4-

4-

4-

5-
-0

-0

-0

-0

-0

-0

-0

-0

-0
12

19

26

02

09

16

23

30

07

Precio libra de cobre (USD) Precio dólar (CLP)

Calculamos su intervalo de confianza para saber si los valores dentro de estos 3


meses son aceptables o están fuera del rango aceptable en lo cual ocupamos la siguiente formula
con una confianza del 95%.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 19

𝛼 𝑆 𝛼 𝑆
𝑋−𝑇$ ' ≤ 𝜇 ≤ 𝑋+𝑇$ ' ≤
2 √𝑛 2 √𝑛

Donde obtenemos por los datos calculados y que están en el Excel de los datos que el
intervalo de confianza es el siguiente.

[3,05236149 , 3,08293119]

Teniendo estos datos podemos ver claramente que la media poblacional se encuentra
dentro de los parámetros razonables para esta distribución por lo que dentro de estos 3 meses el
precio promedio del cobre fue bastante aceptable, pero si existen datos que se escapan de estos
parámetros por lo que este tipo de datos no son controlables en el tiempo, ya que depende de
distintos factores explicados anteriormente.
Independiente de que la diferencia numérica de los intervalos no sea tan grande para el ámbito en
este caso del precio del cobre si es una diferencia relevante y preferentemente el intervalo debería
ser más acotado para no tener tantas fluctuaciones del precio del cobre en el tiempo como
muestran las gráficas ya que se podrían tener meses muy malos o muy bueno por lo que es
preferible tener un comportamiento más acotado.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 20

Conclusiones
A partir de los datos analizados se puede afirmar que el precio del cobre tiende a
permanecer estable en el tiempo, debido a que el precio en el mercado sufre pequeñas variaciones
en el día a día. Los datos del precio del cobre tienden a distribuir de forma normal por la pequeña
variación que los datos presentan, a consecuencia de ello la mayoría de los datos se acumulan en
cierto intervalo, dejando a los demás intervalos con frecuencias bajas.
Por el otro lado el precio del dólar sufre de una variación moderada durante el tiempo,
haciendo a largo plazo esta divisa inestable en el mercado. Por el tiempo observado los datos
presentan un sesgo hacia a derecha por lo que los mismos presentan una distribución del tipo
gamma, aunque es muy probable que distribuya normal en intervalos más pequeños de tiempo.
Entre ambas variables se puede observar una relación inversa mutua, siendo observable en
una serie de tiempo. A partir de este es posible concluir que el precio de una variable está en
función de la otra.
Con respecto al tiempo de entrada de cada vehículo se puede concluir que en ese periodo
de tiempo ingresa una gran cantidad de vehículos durante el intervalo observado, esto es posible
ver al momento de ver la frecuencia en el histograma y su probabilidad su distribución. Esto se
debe a la existencia de un evento durante el intervalo en donde se tomó las muestras y el hecho
que coincidió con la hora de entrada de estudiantes al bloque n° 4.
Al ver los consumos de calorías se puede deducir que ambos consumos son diferentes
entre sí, ya que cada individuo presenta diferentes necesidades de consumo debido a la estatura,
peso y actividades físicas que cada uno realiza. Al ver la serie de tiempo no se ve una relación
entre ambos datos, por lo que se puede afirmar que son independientes entre sí. También es
posible afirmar que el consumo diario de calorías de una persona es inestable, ya que presenta
una desviación estándar equivalente a aproximadamente la cuarta parte de la cantidad de calorías
recomendadas.
INFORME DE ANÁLISIS ESTADÍSTICO EXPLORATORIO 21

Bibliografía
Campos, N. Dólar: ¿qué factores han afectado su precio? - Universidad Católica de la Santísima
Concepción. Retrieved from http://www.ucsc.cl/blogs-academicos/dolar-que-factores-han-
afectado-su-precio/

Devore, J. (2010). Probabilidad y estadística para ingeniería y ciencias. 7e. Mexico: Cengage
Learning Editores S.A. de C.V.

Godoy, M. (2017). ¿Qué determina el precio del dólar?. Retrieved from https://blog.fol.cl/fondos-
mutuos/que-determina-el-precio-del-dolar/

Montgomery, D., & Runger, G. (2014). Applied statistics and probability for engineers (6th ed.).
Hoboken: Wiley.

Das könnte Ihnen auch gefallen