Beruflich Dokumente
Kultur Dokumente
BIG DATA
big data: la capacidad de producir correlaciones como resultado de almacenar grandes cantidades de datos de
diversos tipos y orígenes, que se producen a gran velocidad y que requieren de un tratamiento en tiempo real.
partamos de la pregunta
Generamos más datos que nunca,
tendencia que muestra un creci- formas de proceso de
más básica: ¿qué es un dato?
la palabra viene del latín
datum, que significa «lo que
miento exponencial. Nuestra capa-
cidad para procesar tantos datos
datos en big data
se da», y se refiere a una inaugura en sí una nueva etapa en la
correlación: los datos masivos causalidad: en el tiempo
representación simbólica de revolución digital. que se leen de diversas fuentes y del big data, la relación
un atributo o variable cuali- se combinan de forma casi instan- causal de los datos ya no
tativa o cuantitativa. es una «Big Data son recursos de tánea no miden subjetividades, es un factor relevante,
fracción de información que gran volumen, alta veloci- sino que producen tendencias y porque se considera que
se puede analizar, combinar, dad y variedad que exigen análisis sobre datos que quizá, entre muchos valores ni
almacenar o transmitir. po- formas rentables e innova- en términos causales, no habrían siquiera existe o no es im-
dría decirse que un dato es, doras de procesamiento sido tomados en cuenta. portante.
a la información, lo que una que permitan una mejor
molécula a la materia.
comprensión, toma de de-
cisiones y automatización
«Big Data trata de entender de procesos.» MINERÍA DE HERRAMIENTAS MÁS
IMPORTANTES DE LA
las relaciones que te unen Gartner it Glossary DATOS MINERÍA DE DATOS:
a las personas que te inte-
resan y el conocimiento del El intercambio de datos a través de La minería de datos o datamining B inteligencia artificial
potencial de esa relación» internet permite analizar la correla- es una herramienta que permite
C estadística
Joe Rospars. ción de datos en un número prác- identificar patrones en todos los
ticamente infinito de dimensiones, datos para ponerlos a disposición D sistemas de bases de datos
por lo que encuentra correlaciones del análisis y, finalmente, ayudar en
datos en el mundo digital: que de otra manera serían inimagi- la toma de decisiones.
B documentos nables para el ser humano. La corre- Lo que hace particulares a los UTILIDAD DE LA
lación se produce en un cruce de procesos de minería es que se pro- MINERÍA DE DATOS
C fotografías
datos que brinda información sobre ducen mediante algoritmos que se
D social media algo. insertan en estas grandes bases de
E fechas datos, que buscan tendencias, ano- funciona para predecir,
«Debemos dejar de hablar malías, desviaciones o situaciones al utilizar la información
F localizaciones geográficas para pronosticar valores
G transacciones de causalidades y pensar interesantes pero desconocidas, y
futuros.
en correlaciones.» otros eventos importantes.
H búsquedas Victor Mayer y Kennet
I visitas a sitios web Cukier
funciona para describir, al
big data: puede obtener presentar patrones descrip-
almacenamiento de datos información de datos tivos de la información para
estructurados, no que puedan ser interpreta-
formas tradicionales: formas digitales: estructurados y dos por seres humanos.
pinturas smartphones semiestructurados
códices computadoras
gráficas memorias de a partir de datos estructu-
almacenamiento minería de datos: se rados, presenta resultados
mapas masivo enfoca en el análisis de que son argumentados y
fotografías nube datos convencionales, en discutidos después de arro-
videos los que la información jar información en la que
está estructurada de no se propusieron hipótesis
grabaciones de audio forma homogénea previas.
delarivagroup.com dos | 11 de octubre 2017
Sin análisis de Big Data, las Con la infraestructura apropiada, los datos Boletín trimestral #3
empresas están ciegas y sordas. pueden transformarse en conocimiento, a SO WHAT?
menudo de forma sorprendente. editado por de la Riva group
10 27
de procesamiento que brontobyte Este será almacenamiento que no tiene una
intercambian datos. nuestro universo digital del
mañana identidad física para los usuarios;
c se utilizan para reconocer es una infraestructura distribuida
patrones, por ejemplo, en 2020 en internet. Estas plataformas
imágenes, manuscritos y permiten la distribución de datos
10 24
yottabyte Este es nuestro
secuencias de tiempo. universo digital actual y recursos de información en el
d tienen la capacidad de momento en que se requiera y de
aprender y mejorar su manera redundante, lo que hace
funcionamiento. 2015 que su disponibilidad sea segura
zettabyte 1.3 zb de tráfico en y confiable.
A partir del aprendizaje en instan-
cias repetitivas, se construyen y re-
10 21 la red en 2016
VENTAJAS DE LA NUBE:
fuerzan los conectores que fijan la B la información está siem-
información que va quedando en la exabyte 1eb es creado en pre disponible.
red neuronal como referente. 10 18 internet por día = 250 millones 2010 C los dispositivos ya no se
de dvds de información saturan de información.
ALGORITMOS
Un algoritmo, en su definición más bá- 10 15 petabyte El cern genera 1pb CARACTERÍSTICAS DE LA
sica, consiste en una serie de pasos por segundo NUBE:
para realizar una tarea. En las ciencias B on-demand self service:
10 12 terabyte Facebook consume
de la computación, son secuencias de 500tb de datos al día el consumidor accede y
operaciones que permiten solucionar utiliza los servicios según
un problema. Los algoritmos son autó- 10 9 gigabyte sus necesidades.
nomos y no dependen de lenguajes de 10
8
megabyte C broad network access:
programación, por lo que deben dise- servicios disponibles en
ñarse para ser leídos fácilmente. una red privada, comparti-
da o pública.
CARACTERÍSTICAS DE LOS ALGORITMOS D resource pooling: re-
cursos del hardware
como la capacidad de
finitud (finiteness): un te antes de que comience básicas para que en princi- procesamiento, asignación
algoritmo debe terminar el algoritmo. estas entra- pio puedan ser realizadas de memoria o almacena-
siempre después de un nú- das se toman de conjuntos exactamente y en un tiem- miento.
mero finito de pasos. de objetos especificados. po finito por un hombre
usando papel y lápiz. E rapid elasticity: des-
definición (definiteness): salida (output): cantida- pliegue y planificación de
cada paso de un algorit- des que tienen una rela- Hoy en día gran parte de nues- recursos.
mo debe ser definido con ción específica con las tras actividades están relacio-
Fuente: Donald Knuth
Bernard Marr
«Tras nuestra última investi- El uso del Big Data en política ha
BENEFICIOS futuro del big data:
gación hemos descubierto sido polémico. Esta tendencia ha
que las empresas utilizan Big permitido tener un mayor acer- DEL BIG DATA 1. Los volúmenes de datos seguirán cre-
ciendo.
Data para obtener resultados camiento al votante; además, los
centrados en el cliente, apro- partidos políticos aprenden a co- oportuno 2. Las formas de analizar los datos me-
vechar los datos internos y nocerse mejor. La lectura de da- e inmediato jorarán.
crear un mejor ecosistema de tos masivos se realiza, sobre todo, 3. Aparecerán más herramientas para el
información.» durante las campañas electorales, análisis (sin el analista).
porque se pueden identificar los accesible
ibm Institute for Business Value 4. La analítica prescriptiva se incorporará
perfiles de votantes para definir a
/ Escuela de Negocios Saïd en quiénes dirigirse y así capitalizar al software de análisis empresarial.
la Universidad de Oxford recursos en tiempo real. Es una es-
holístico 5. Además, la información en tiempo
trategia similar a como las empre- real sobre transmisión de datos será la
sas lanzan campañas publicitarias y pertinente característica distintiva de los ganadores
Según los especialistas Viktor posicionan sus productos. de datos en el futuro.
Mayer y Kenneth Cukier auto- seguro 6. El aprendizaje automático será una
res del libro seminal Big data. programas big data usados tendencia estratégica.
La revolución de los datos masi- en política:
7. Los grandes datos representarán enor-
vos, hay tres tipos de empresas 2008, barack obama, progra- preciso mes desafíos para los encargados de in-
que pueden identificarse en el ma narwhal terpretarlos.
mundo de los datos masivos: 2016, donald trump, cambrid- utilizable 8. Más compañías nombrarán un jefe de
B Las que tienen datos pero no ge analytica
datos.
tienen capacidades para ex-
traer el valor o construir ideas big data y gobierno ¿Qué es lo que nos depara el
9. «Los agentes autónomos y las cosas»
sobre ellos. El Big Data también ha empezado a seguirá siendo tendencia.
tener usos en las políticas públicas, futuro?
C Las que tienen las capacida- 10. Los científicos incluirán arquitectos
más allá de las coyunturas electo- La mayoría de los usuarios piensa y expertos en gestión de datos. Pero la
des, como las consultoras, que rales. La posibilidad de almacena- que Big Data revolucionará el
tienen el conocimiento para sa- gran crisis del talento puede disminuir a
miento, procesamiento y análisis de mundo de la misma forma que lo medida que las empresas emplean nue-
car conclusiones de los datos, datos masivos ha permitido un dise- hizo internet. Tendrá un mayor
pero que no los poseen. vas tácticas.
ño, ejecución y evaluación más co- impacto en:
rrectos de los proyectos. Así como 11. El modelo de negocio de datos como
D Las que tienen mentalidad Big
se hace en el ámbito empresarial, servicio está en el horizonte.
Data, como Google o Amazon,
en las que los datos y su aná- los gobiernos empiezan a usar da- 63% 12. Los mercados de algoritmos también
lisis son cruciales, ya que no tos acerca de las personas. surgirán.
sólo tienen los datos o saben El Big Data es una tendencia con- 13. La tecnología cognitiva será la nueva
analizarlos para tener éxito, sino la relación con los clientes moda.
solidada y, a la vez, en permanente
que tienen personal capaz de evolución. Se ha caracterizado por
desarrollar ideas sobre formas 14. Todas las empresas son negocios de
desarrollarse a la par de la inteli- 56% datos ahora.
de explorar los datos. gencia artificial y por conectarse
directamente con los avances en 15. Las empresas que utilicen datos verán
operaciones de cambio
Mientras más info tengo más inteligencia de negocios y con la $430 mil millones en beneficios de pro-
quiero a mis clientes analítica. Responder qué para con- ductividad en 2020.
solidar un cómo y proponer un 58% 16. «Datos rápidos» y «datos procesables»
Una de las cuestiones que ha reve- para qué, es hoy una opción posi- reemplazarán datos grandes, según algu-
lado el uso de Big Data es que las ble gracias al manejo y gestión de nos expertos.
compañías se están enfocando en co- datos masivos. desarrollo de productos
nocer mejor a sus usuarios o clientes.
El engagement que una marca tenga
dependerá de la cantidad de infor- Amazon, algoritmo filtrado Google, su algoritmo busca cal-
mación que obtenga de sus posibles colaborativo ítem por ítem cular la importancia de cada si-
clientes. para analizar grandes volú- tio web a partir de los vínculos
menes de datos. (links) que cada sitio recibe.