Sie sind auf Seite 1von 6

UNIVERSIDAD DE LAS FUERZAS ARMADAS-ESPE

BASES DE DATOS II
Integrantes: Joel Rivera
Diego Tern
NRC: 1109
Fecha: 05-07-2016

Qu es Big Data?
Este trmino es usado en el rea de informtica o tecnologa y se relaciona con
la informacin o el grupo de datos que, debido a su gran tamao o volumen, su
diversidad y complejidad lo cual comprende un elevado grado de dificultad para
ser procesada e interpretada usando tcnicas y herramientas tradicionales.
Esta informacin es usada para la toma de decisiones, optimizacin de
procesos y oportunidades de negocio, pero para lograr ello es necesario lograr
distinguir la informacin vlida de la superficial para as obtener los resultados
correctos, para ello se ha desarrollado nuevas tcnicas y herramientas que
permiten la gestin de estas grandes cantidades de informacin.
La informacin relativa al Big Data proviene de varias fuentes en las cuales las
ms relevantes son:

Generados por las personas ya sea mediante mensajes de texto, notas de


voz o videos.
Transacciones realizadas en registros de facturacin y registros de llamadas
telefnicas.
Redes sociales y la web ya sea correos electrnicos, contenido almacenado
en las redes sociales, blogs e informacin en toda la web en general.

Caractersticas de Big Data


Dentro de Big Data existen tres caractersticas o llamadas dimensiones las
cuales son:

Volumen: referente al tamao o cantidad de informacin medido en bytes,


pero en cantidades grandes como terabytes (TB), petabytes (PB) e incluso
se lleg a zettabytes (ZB) en la actualidad, estas cantidades de informacin
son registradas por grandes empresas y creadas por personas o maquinas,
y dicha informacin se registra cada hora en el transcurso del da lo cual
evidencia el volumen que llega a alcanzar dicha informacin y su aumento
exponencial.
Variedad: este trmino se refiere a la heterogeneidad que poseen los datos,
as como la representacin y semntica de los mismos. Esto se relaciona

con el volumen directamente ya que conforme avanza la tecnologa se tiene


mayor cantidad de datos en diferentes formatos. Se tiene dos grandes
grupos dentro de la variedad los cuales son datos estructurados y no
estructurados, de los ltimos es lo que se tiene ms cantidad de informacin
y es ms compleja su interpretacin, pero su contenido puede ser de mucha
utilidad para toma de decisiones, predicciones, etc.
Velocidad: es la velocidad con la que la informacin se crea y se propaga
por el medio al cual este dirigido, as como la velocidad de procesamiento y
actuacin que se genera por la misma. Si hablamos de Big Data en internet,
la velocidad de propagacin es de manera inmediata a nivel mundial.

Este denominado conjunto de las 3V son la base fundamental que conforman y


dan una definicin como tal de Big Data al tener coherencia entre s y
complementarse una a la otra.
Pero con el avance de la tecnologa y los nuevos usos que se da a la
informacin han llevado a generar las nuevas 3V del Big Data los cuales son:

Veracidad: al tener gran cantidad de informacin procesndose a grandes


velocidades no tiene valor y significado si dicha informacin no es correcta,
ya que, si se procesa grandes cantidades de datos errneos, puede generar
que los resultados finales o los anlisis obtenidos generan una toma de
decisiones incorrecta causando varios problemas a las personas que
manejan dichos resultados.
Visualizacin: debido al gran tamao de la informacin se busca encontrar
la manera de representar dichos datos de una manera sencilla y entendible
para el usuario, debido a que se toman en cuenta un amplio nmero de
variables, las grficas obtenidas son complejas de leer por lo tanto se busca
la manera de que los resultados sean legibles y entendibles.
Valor: el valor de la informacin es diferente dependiendo de la organizacin
que la utilice y el fin con el que ser usado, el valor es generado a partir del
anlisis de los datos obtenidos y la manera en que la interpretacin de
dichos datos genera informacin y posterior conocimiento para el usuario.

Tcnicas de anlisis Big Data

Clasificacin: Son un conjunto de tcnicas las cuales ayudan a identificar


las categoras de los datos basado en un conjunto de pruebas que ya
contienen los parmetros para categorizar los datos.
Anlisis cluster (o de conglomerados): Es un mtodo estadstico el cual
agrupa datos de diversos grupos en grupos ms pequeos que tengan
caractersticas similares previamente conocidas.
Data mining: Este mtodo extrae patrones de grandes grupos de
informacin mediante la combinacin del aprendizaje autnomo y mtodos
estadsticos, data mining incluye tcnicas de aprendizaje de asociacin,
agrupamiento, clasificacin y regresin.

Aprendizaje automtico: Tambin conocido como inteligencia artificial, este


se ocupa de disear y desarrollar algoritmos que facilitan a los ordenadores
evolucionar sus comportamientos en base a datos empricos lo cual ayuda a
los sistemas a reconocer patrones complejos y tomar decisiones en base a
los datos analizados.
Simulacin: Utiliza modelos de sistemas para crear predicciones y
planificaciones de escenarios futuros lo cual crea una muestra del
histograma con la distribucin probabilstica de los resultados.

Para qu sirve Big Data?


Entendiendo y segmentando a los clientes
El rea de marketing es posiblemente el rea de mayor aplicacin de big data,
ya que los datos son utilizados para realizar anlisis y de esta manera entender
mejor a los clientes, sus necesidades, preferencias y comportamientos.
Actualmente las empresas han ampliado sus centros de datos tradicionales
para poder obtener un perfil ms completo de sus clientes y de esta manera
poder crear modelos predictivos y de esta manera poder ofertar sus productos
al mercado adecuado y el momento adecuado.
Extensin de la seguridad/inteligencia
Mediante el uso de Big Data y su capacidad de discernir las cantidades
masivas de datos es posible llagar a detectar relaciones ocultas o patrones de
conducta y de esta manera llegar a detectar posibles amenazas, as como de
fraudes ya que se llega a controlar historiales de actividad en tiempo real con lo
cual se facilita el controlar transacciones sospechosas o anormales de un
usuario. Existen tres aplicaciones principales para el Big Data dentro de la
seguridad:
1. Visin mejorada de inteligencia y vigilancia: mediante el monitoreo y
anlisis de datos para poder descubrir patrones de posibles ataques.
2. Previsin y atenuacin de ataques cibernticos en tiempo real: mediante
el anlisis del trfico de red se pueden llegar a detectar posibles ataques
cibernticos como espionaje en grandes empresas, ataques de hackers
y ciberterrorismo.
3. Prediccin y prevencin del crimen: mediante el anlisis de los datos de
las redes de telecomunicaciones, as como de redes sociales lo cual
permite predecir posibles amenazas y de esta manera adelantarse a las
mismas antes que sean realizadas.
Anlisis de Operaciones
Esto permite crear modelos en tiempo real de las operaciones que realiza un
cliente, as como de su experiencia su comportamiento y sus transacciones lo
cual se utiliza para optimizar esos mismos procesos lo cual incrementa la
eficiencia, investiga anomalas y monitoriza la infraestructura. Con estos
modelos se puede evitar la degradacin de los servicios.

Aumentar el almacn de datos o Data Warehouse


Esto implica el ampliar una estructura de almacenamiento de datos ya existente
en una ms amplia para incrementar su valor. Data Warehouse nace de dos
necesidades bsicas: el poder obtener la mayor cantidad de informacin de los
diferentes tipos de datos lo cual crea nuevas perspectivas de negocio, y la
optimizacin de estructuras de los datos lo cual facilita el almacenamiento lo
cual tambin conlleva un ahorro de costes.
Existen tres tipos de Data Warehouse:
1. Pre-Processing Hub (ncleo de pre-procesamiento): Esto proporciona
una visin previa de los datos antes de decidir cules son los relevantes
para su previo almacenamiento.
2. Discovery/Analytics (descubrimiento-anlisis): Este crea la capacidad de
analizar el Data Wharehouse nuevamente para crear modelos ms
ptimos del almacenamiento de los datos y dar la posibilidad a nuevos
tipos de anlisis.
Query-able Data Store (almacn de datos de consulta): Este permite almacenar
los datos que son usados con menos frecuencia o de una antigedad
considerable en espacios de almacenamiento de bajo costo, pero permitiendo
el acceso a los mismo en caso de ser necesarios.

Cundo utilizar Big Data?


Desde su aparicin Big Data ha pasado de ser un problema tanto en
implementacin y uso a ser una necesidad para las grandes organizaciones y
el maneja de grandes tamaos de informacin. Dentro de los campos en los
cuales se puede usar Big Data estn:

Comercio
Finanzas
Salud
Asuntos gubernamentales
Poltica
Servicios de la sociedad
Entre otros

A pesar de los grandes avances de esta tecnologa an queda muchas reas


ms por explorar y descubrir nueva informacin y conocimiento pero que an
no se ha puesto en marcha ya que la mayora de aplicaciones del Big Data est
enfocada asuntos ms comerciales. Esta tecnologa si se ampliara sus campos
de aplicacin se podra utilizar para generar respuestas y nuevas metodologas
que ayuden al incremento tanto de la productividad como de la eficacia, as
disminuyendo recursos en los procesos, en cualquier campo.
De manera que el Big Data puede aplicarse en cualquier campo en el cual se
busque obtener nuevas metodologas y conocimiento en base a gran cantidad

de datos, adems de realizar toma de decisiones que tenga un gran impacto,


predicciones en una cierta rea, etc.
Ventajas de Big Data
Entre las ventajas del uso de Big Data tenemos varias, pero dependiendo del
uso y el tipo de organizacin que lo use puede o no aplicar:

Con modelos predictivos en historial de transacciones para compra o venta


de productos y servicios se puede tener una probabilidad de que un cliente
adquiera dicho producto o servicio y mejorar las ventas y saber cul
producto es mejor para los distintos tipos de clientes.
Mejorar la capacidad de visibilidad en el negocio con la obtencin de
informes con resultados ms detallados referentes al funcionamiento de la
empresa.
Anlisis de redes sociales y determinar el comportamiento y gustos de los
usuarios, as como ver su nivel de influencia dentro de su crculo social.
Marketing viral en la web, conociendo los gustos tanto de productos como
servicios del usuario para as maximizar la difusin de publicidad.
Anlisis de datos de navegacin del usuario dentro de la web, tales como
palabras ms buscadas, pginas ms visitadas, tiempo de navegacin,
contenido ms visto.
Sistemas predictivos de anlisis y de cruce de datos el cual permita prevenir
eventos que pueden suceder a futuro en base a datos histricos registrados
sobre cierta actividad.
Anlisis de seguridad en base a patrones complejos que busquen
quebrantar las seguridades de software y as prevenir ciberataques.

Desventajas de Big Data


Pese a tener grandes ventajas esta tecnologa, igualmente posee sus
desventajas entre ellas tenemos:

Complicado proceso de adaptacin y rechazo por parte del personal.


Elevados costes de implementacin tanto de hardware como software.
Prdida econmica como tiempo de trabajo en capacitacin al personal.
Problemas de privacidad
Informacin desactualizada, esto influye por las fuentes de la informacin.
Filtrado de la informacin, ya que no todos los datos obtenidos se
transforman en informacin.

Conclusiones

Esta tecnologa es muy til para el anlisis de grandes cantidades de


informacin y grandes velocidades para con los resultados obtenidos poder

tomar las decisiones correctas y as preveer que se den ciertos hechos bajo
ciertas circunstancias.
Si se tiene una organizacin en la cual no se procese una gran cantidad de
informacin y adems dicha informacin este de manera estructurada no
sera eficiente usar Big Data ya que implicara un gasto elevado por una
tecnologa que no podra ejecutarse en su capacidad real.
El uso de Big Data ayuda a poder analizar grandes cantidades de datos en
tiempos cortos y de esta manera poder generar modelos en tiempo real para
poder realizar predicciones de comportamiento en reas especficas.

Bibliografa
Baoss. (04 de 07 de 2016). Baoss. Obtenido de http://www.baoss.es/tecnicasde-analisis-big-data/
Garca, D. L. (2013). Anlisis de las posibilidades de uso de Big Data en las
organizaciones. Cantabria.
IDATHA. (2014). Big Data-Conceptos Generales. Montevideo.
Informtica, T. (03 de 06 de 2016). Grupo TRC. Obtenido de
http://www.trc.es/pdf/descargas/big_data.pdf
Juan Jos Camargo-Vega, J. F.-O.-A. (2014). Conociendo Big Data.

Das könnte Ihnen auch gefallen