Beruflich Dokumente
Kultur Dokumente
Big Data
INTEGRANTES
Juan Pablo Segura Pizarro - U201301211
Larry Linares Canales - U201200341
Marzo 2016
INDICE
INDICE............................................................................................................ 2
INTRODUCCION.............................................................................................. 3
DEFINICION..................................................................................................... 4
INTRODUCCION
Big Data es un concepto que hace referencia a grandes cantidades de
informacin, disponibles en diversos formatos y tipos de estructuras,
recopilada principalmente a travs de Internet mediante la interaccin de
los usuarios de computadores, telfonos mviles y dispositivos GPS, entre
otros. Asimismo, es utilizada para describir enormes cantidades de datos
(estructurados, no estructurados y semi-estructurados) que tomara
demasiado tiempo y sera muy costoso cargarlos a una base de datos
relacional para su anlisis. De tal manera que, el concepto de Big Data
aplica para toda aquella informacin que no puede ser procesada o
analizada utilizando procesos o herramientas tradicionales. Sin embargo,
Big Data no se refiere a alguna cantidad en especfico, ya que es
usualmente utilizado cuando se habla en trminos de petabytes y exabytes
de datos. Adicionalmente, el concepto de volumen es muy variable y cada
da que pasa eleva lo que podemos considerar grandes volmenes de datos.
El objetivo de Big Data, al igual que los sistemas analticos convencionales,
es convertir el dato en informacin, ya que facilita la toma de decisiones,
incluso en tiempo real. Sin embargo, ms que una cuestin de tamao, es
una oportunidad de negocio. Las empresas ya estn utilizando Big Data para
DEFINICION
El concepto de grandes volmenes de datos no viene de la nada. De hecho,
no es nuevo, pero est recibiendo mucha atencin por varias razones, tales
como la baratura de almacenamiento de datos, la proliferacin de sensores
y tecnologa de captura de datos.
No existe una definicin precisa del trmino Big Data. IDC define de la
siguiente manera: "Las tecnologas Big Data describen una nueva
generacin de tecnologas y arquitecturas, diseados para extraer
econmicamente valor a partir de volmenes muy grandes de una amplia
variedad de datos, lo que permite la captura de alta velocidad,
descubrimiento y anlisis."
Otra definicin, realizado por McKinsey Global Institute, "Big Data se refiere
a conjuntos de datos cuyo tamao es ms all de las tpicas herramientas
de software de base de la capacidad de capturar, almacenar, gestionar y
analizar."
Entonces nos damos cuenta que no define Big Data slo en el tamao del
volumen de datos, sino la capacidad de manipularlos.
ANALISIS EN
TERMINOS DE
BYTES
El volumen de
datos generados
en todo el
mundo est
aumentando.
Un estudio
realizado por
IDC en 2011
muestra el
datos es
cada dos aos
zettabytes (1,8
gigabytes).
estamos
volumen de
ms del doble
y debe llegar a 11,8
billones de
Podemos decir que
experimentando una
explosin de datos.
De acuerdo con IBM, el 90%
de los datos
COMO FUNCIONA
El funcionamiento de Big Data est basado en el modelo de programacin
MapReduce. Este modelo es utilizado en procesos que pueden ser
paralelizados, como las consultas de Big Data, ya que las subdivide en
pequeas tareas ejecutables por varios procesadores. De esta forma, la
capacidad de procesamiento de datos aumenta tanto en tamao como en
rapidez, de ah que la cantidad de datos procesados en este tipo de
tecnologa sea muy superior a otras consultas que slo utilicen datos
estructurados.
Como usuarios, para utilizar el modelo MapReduce basta con usar Hadoop,
CLASIFICACION
Datos no
estructurados
Una posible definicin de datos no estructurados, son aquellos datos
no almacenados en una base de datos tradicional. La informacin no
estructurada no puede ser almacenada en estructuras de datos
relacionales predefinidas.
Se pueden establecer diferentes clasificaciones, vamos a considerar
dos de ellas.
SOFTWARE
1. Hadoop: Inspirada en el proyecto de Google File System (GFS), es un
proyecto de alto nivel Apache.
2. NoSQL: No solo SQL Utilizada por Facebook para almacenar solo los
50 TB de la bandeja de entrada de 1000 usuarios.
3. Cassandra: Basada en Hadoop y desarrollada en Java, es actualmente
utilizada en toda la red social twitter.
4. Oracle Data Integrator: Basada en Hadoop pero enfocada como una
solucin empresarial.
LAS TRES V
1. Volumen: quiz el ms llamativo por su aumento desmesurado
en los ltimos aos, aunque el menos importante en clave de
utilidad para la compaa. Es una consecuencia de las mejoras de
las redes de comunicaciones y de las mayores velocidades de los
accesos de banda ancha, pero la mayor cantidad de datos por s
sola no aporta un valor aadido. Es la causa que lleva a
preocuparse por los otros dos factores.
2. Variedad: ordenar e interpretar diferentes tipos de datos a la vez
puede generar grandes ventajas. Combinar datos de edad,
gnero, estado civil, situacin laboral, situacin geogrfica,
intereses, gustos... permite crear perfiles ms precisos de clientes
potenciales para realizar campaas de publicidad y mrketing
segmentadas. Aunque las ventajas de poder ajustar ms el punto
de mira en el blanco de la diana tambin puede tener una parte
negativa, si el cliente percibe una cierta invasin de su intimidad.
La sutileza es la gran virtud para que el valor aadido qeu ofrece
la varieda de datos conjuntados no se vuelva en contra.
3. Velocidad: se refiere a la vida til de los datos. No tiene sentido
conservar datos cuyo recorrido ha terminado y han quedado
obsoletos. Una de las claves para poder almacenar grandes
cantidades de datos de forma que sean tiles para la estrategia
comercial es que la utilidad de toda la informacin que se
VENTAJAS
1.
2.
3.
4.
5.
6.
DESVENTAJAS
1.
2.
3.
4.
CONCLUSIONES
La naturaleza de la informacin hoy es diferente a la informacin en el
pasado.
El uso de Big Data ha ayudado a los investigadores a descubrir cosas que
les podran haber tomado aos en descubrir por si mismos sin el uso de
estas herramientas, debido a la velocidad del anlisis, es posible que el
analista de datos pueda cambiar sus ideas basndose en el resultado
obtenido y retrabajar el procedimiento una y otra vez hasta encontrar el
verdadero valor al que se est tratando de llegar.
Si la informacin es poder, entonces Big Data se entiende como una gran
linterna que ilumina aquellos datos que estaban escondidos, facilitando
anlisis de datos que antes limitaba la tecnologa.
Debe existir el uso tico y legal de la informacin y esta debe ser regulado
por las autoridades, ya que el anlisis de toda la informacin que
generamos, ya sea en las redes sociales, en nuestros dispositivos mviles, o
en nuestras cuentas de correo, puede ser til para nosotros mismos, pero se
debe garantizar el consentimiento y el uso lcito de estos datos.
BIBLIOGRAFIA
https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/
http://elpais.com/elpais/2015/03/26/buenavida/1427382655_646798.html
https://www.enriquedans.com/2011/10/big-data-una-pequenaintroduccion.html
http://www.isaca.org/knowledgecenter/research/researchdeliverables/pages/big-data-impacts-andbenefits.aspx
http://www.oracle.com/lad/bigdata/products/index.html