Beruflich Dokumente
Kultur Dokumente
Snchez-Prez
???????????????????????????????????????????????????????????????????
Ferrer-Sapena, Antonia; Snchez-Prez, Enrique A. (2013). Open data, big data: hacia
dnde nos dirigimos?. Anuario ThinkEPI, v. 7, pp. 150-156.
Est de moda todo aquello que lleve la palabra est vinculada a la transparencia de los procesos.
open, la palabra data, o ambas. Recurrente- En funcin de quien sea el productor de los datos
mente encontramos los trminos big data, open se hablar de transparencia en el gobierno, en la
data, data mining Ya no se trata slo de com- investigacin o en las empresas.
partir informacin o de permitir el libre acceso a
las publicaciones, ahora queremos que sean acce-
sibles tambin los datos, de manera libre y gratui-
ta. Los datos nos invaden en todos los contextos Open data son todos los datos que
de la sociedad, generados por las aplicaciones pueden ser utilizados, reutilizados y
de la web 2.0, los gobiernos, las investigaciones redistribuidos libremente por cualquier
cientficas, las publicaciones o las organizaciones. persona (OKF, 2012)
Todos estos datos se encuentran cada vez ms
ligados a los movimientos open. Aunque quizs
convendra aclarar las diferencias, implicaciones En el caso de la Administracin la apertura
y relaciones que pueden existir entre big data, suele ir unida a la creacin de servicios de valor
open data, data mining, open science, aqu ni- aadido, ya sea por parte de la propia Adminis-
camente abordaremos los dos primeros. tracin o de empresas que quieran crear nuevas
Se entiende como open data la apertura (o utilidades basadas en los datos. Pero el concepto
puesta a disposicin de cualquiera) de datos open data va ms all de la mera reutilizacin.
digitales, pero en este concepto tambin tiene Su filosofa pretende que los datos se encuentren
cabida la de datos en documentos impresos. Hay disponibles de manera libre para todo el mundo,
una enorme cantidad de datos depositados en sin restricciones de copyright. Actualmente este
archivos y bibliotecas que se han construido gra- tipo de datos abiertos son, mayoritariamente
cias a los impuestos de los ciudadanos que estn geogrficos, estadsticos, genmicos, mdicos y
150 sin digitalizar. La promocin del acceso, por tanto, biolgicos.
Gephi, Many eyes, NodeXL, Data-Driven Docu- las ventajas que produce el big data, pero no las
ments (d3), Axiis, Google fusion tables, Wordle, que puede proporcionar el open data todava. El
Dipity, Batchgeo, Twitter widgets, Google forms, estudio seala que la transparencia en las orga-
Trendistic. nizaciones ser vital para acercarse a los clientes,
http://www.doctormetrics.com/2012/08/29/herramientas- y esto ser posible con una buena estrategia para
visualizacion-datos compartir y controlar los datos que se ofrezcan en
http://www.periodismociudadano.com/2011/02/25/ abierto. Este proceso de apertura permitir a las
herramientas-para-el-periodismo-ciudadano- empresas conquistar a los clientes y generar ms
visualizacion-de-datos beneficios. La empresa debe tener una estrategia
clara en este sentido. La clave se encuentra en
conocer con quin se debe compartir los datos
La empresa tiene claras las ventajas para conseguir el mayor beneficio. Los datos
que produce el big data, pero no las hacen las organizaciones sean ms inteligentes,
que puede proporcionar el open data pero abiertos las hacen ms ricas (Newman,
2012). Segn Gartner, la apertura de datos es el
primer paso para conseguir la monetarizacin de
la informacin empresarial.
Otra herramienta interesante es la que ha
implementado LinkedIn para facilitar la visuali- Desmitificando el open data
zacin de las redes de colaboracin a travs del
Entre las ventajas del open data se han dado
mapeo de contactos, o la aplicacin gratuita de
por sobreentendidos determinados supuestos
tratamiento de datos Google refine.
que no son verdaderos. Una visin clara acerca de
http://inmaps.linkedinlabs.com/network
las posibilidades de este movimiento se ofrece en
http://code.google.com/p/google-refine
una reciente seleccin de opiniones recopiladas
en la web del Open data seminar (Farrell, 2012a),
En el contexto empresarial, qu es que recoge varias reflexiones de inters:
prioritario, open data o big data?
En relacin con la reutilizacin
Por supuesto, ambas tecnologas se pueden
implementar al mismo tiempo, pero puestos a Combinar distintos tipos de datos produce
priorizar se puede seguir un estudio de Gartner siempre un valor superior. Por ejemplo, los datos
(Bernal, 2012a), segn el cual exponer los datos del horario de autobuses con un mapa. Segn
en abierto proporcionar ms beneficios a las sealan Scassa y Campbell (2009), la combina-
empresas que el big data. La empresa tiene claras cin de elementos puede plantear problemas de
proteccin de datos ya que la infor-
macin recopilada para unos fines
especficos no debe ser utilizada
para otros sin consentimiento. Lo
ilustra con un ejemplo de la ciudad
de Ottawa, donde se encuentran
relacionados los crmenes y las lla-
madas a la polica a travs de
un mapa. Esta informacin podra
ser utilizada por las compaas
de seguros y hacer corresponder
las tasas de seguro con los ndi-
ces de criminalidad, o utilizarlos
para campaas de comercializacin
en funcin del nmero de robos.
Segn Campbell (Farrell, 2012a)
esta utilizacin viola las circunstan-
cias por las que se recopilaron estos
datos. Entonces, hasta qu punto
existe un conflicto entre las condi-
ciones del mercado y las iniciativas
ciudadanas de datos abiertos?
Jo Bates (2012), ms crtica,
considera que hay que analizar
hasta qu punto estas iniciativas
152 http://greatschools.org
Louis), asociada a Alfred (ArchivaL federal reserve c) No existe una clara diferenciacin entre lo
economic data) permite comparar series de datos que es sin nimo de lucro y lo que no.
econmicos. d) Aquellos que son buenos con los datos no
http://research.stlouisfed.org/fred2 son brillantes a la hora de contar historias. Pero
http://alfred.stlouisfed.org las personas no consumen hechos, consumen
historias. Quienes comprenden la importancia de
Ese tipo de bancos de datos se utilizan nor-
los datos, por lo general, son las personas ms
malmente para los escritos polticos de Joe Wei-
entusiastas acerca de su interpretacin y, como
senthal en Business insider, o en el blog de Paul
resultado, sistemticamente sobrestiman el inte-
Krugman en el New York times.
rs ciudadano por los datos. Un grfico sobre el
En este contexto se ve cmo el costo marginal
cambio climtico no es suficiente para que todos
de la transmisin de informacin se encuentra
los ciudadanos lo entiendan.
cada vez ms cerca de cero. As se producen dos
e) Las instituciones que cuentan buenas histo-
fenmenos paralelos:
rias no siempre tienen capacidad para el anlisis
cada vez es ms difcil internalizar el valor
de los datos. A las agencias de noticias se les
de produccin de la informacin debido a que los
paga por contar historias que son verdad, pero no
hechos una vez publicados tienden a extenderse
siempre estn informadas o tienen la capacidad
ms all del control del productor;
suficiente para la interpretacin de los datos.
la informacin se vuelve socialmente ms
f) La transparencia en ocasiones es slo trans-
valiosa.
lucidez. Existen muchos datos disponibles con
Expectativas generadas por el open data los que crear una ilusin de apertura de datos,
pero cuya utilidad resulta escasa y baja calidad,
Tras estas visiones relativamente optimistas frenando la exposicin de los datos significativos.
del movimiento open data, Clay Shirky (2012),
profesor de la University of New York y experto En relacin con la transparencia
en redes sociales, aclara los puntos que hay que Aaron Swartz (2012) indicaba que encontra-
conocer para no decepcionarnos por las expec- mos distintos tipos de personas que se entremez-
tativas generadas. Para este autor, sirve para clan en este contexto:
mejorar el servicio, pero no para acabar con la los curiosos que quieren conocer dnde van
corrupcin. Seala que debemos ser conscientes a parar sus impuestos;
de que: los activistas que creen que al revelar los
a) No es un movimiento poltico o cultural. En datos sobre lo que hace el Gobierno en realidad
sus fundamentos este movimiento no tiene obje- pueden detener la corrupcin; y
tivos polticos. Trata de mejorar los servicios que las empresas que pueden aprovecharlo para
se ofrecen al ciudadano. generar aplicaciones de valor aadido.
b) No se est haciendo nada por la transparen- Considera que nos debemos preguntar si real-
cia y la rendicin de cuentas del gobierno. mente el open data pretende alertarnos de las
infracciones cuando todo el mundo
intenta ocultarlas. Considera que las
organizaciones creadas especfica-
mente para perseguir la transparen-
cia gubernamental sern las nicas
capaces de conseguirlo, tal y como
hace por ejemplo la Sunlight Foun-
dation.
http://sunlightfoundation.com
En este contexto tambin se pre-
sentan dos visiones antagnicas pero
a la vez complementarias: las opti-
mistas acerca de los beneficios socia-
les de la tecnologa y la parte poltica
donde se encuentra una lucha entre
facciones con diferentes necesidades
e intereses. As, Henry Farrell (2012)
sostiene que la democracia tiene que
reducir al mnimo las disparidades
de poder y aprovechar la diversidad
cognitiva. En este contexto los datos
154 http://sunlightfoundation.com
abiertos pueden aportar tres ventajas: sociedad civil. Actualmente son probablemente
1. La principal ventaja de los grupos de presin las grandes empresas las nicas entidades con
es a menudo el control selectivo de la informacin los recursos suficientes para hacer algo con la
ms que el de la financiacin. Hacer que los datos informacin en bruto. Si los datos se encuentran
relevantes se encuentren disponibles puede ser en formato abierto, los innovadores pueden crear
aprovechado por los infrarrepresentados. nuevas visualizaciones para ayudar a los consu-
2. Los datos abiertos de calidad pueden ayudar midores a entender los costos y tomar decisiones
a limitar la tendencia de los partidos para crear su informadas. La web GreatSchools.org ayuda a
propia informacin y su interpretacin. los padres a elegir entre las escuelas pblicas
3. La apertura de algunos datos puede acercar- recopilando los datos de rendimiento escolar, en
nos a lo que se denominan procesos de cognicin cooperacin con el Departamento de Educacin
colectiva. de EUA.
En definitiva, tal y como expresa Tom Lee
(2012), pensamos en los datos abiertos con ten-
dencia a un excesivo optimismo, pero realmente
Los propietarios de datos han aportan beneficios a la democracia.
de liberar los datos a pesar de los
desafos polticos y tcnicos Conclusiones
Hasta ahora trabajar con datos era bastante
difcil por el coste que supona trasladarlos a
Innovacin abierta y democracia soportes informticos. Actualmente las estadsti-
cas y los estudios economtricos estn llegando
Beth Noveck (2012) ve los datos abiertos
de manera masiva al mundo open data; ejemplo
como fundamento de una democracia compleja y
de ello son los datos abiertos del Banco Mundial
como fuente y base de innovacin en el gobierno:
y de los distintos gobiernos. De hecho, en diciem-
conllevan un gobierno ms transparente y
bre de 2012 se lanz la versin beta del portal de
responsable;
datos abiertos de la Comisin Europea:
son ms significativos para el rediseo de
http://open-data.europa.eu/es
las instituciones que para hacer visibles malas
prcticas; Los distintos softwares en abierto permiten
proporcionan la base para el desarrollo de realizar anlisis cuantitativos de manera fcil des-
soluciones en conjunto; de cualquier ordenador. Ello est contribuyendo
posibilitan que participen terceros y es lo a que el nmero de trabajos se incremente de
que hace que stos tengan una opcin transfor- manera considerable. Sus ventajas son cuantiosas:
madora. eliminan redundancias, evitan tener que norma-
La organizacin que recopila y mantiene la lizar datos, permiten fusionarlos y localizarlos. Si
informacin no siempre se encuentra en posi- se comparte todo este trabajo habr ms tiempo
cin de utilizarla. Cuando los datos abiertos son para la investigacin.
procesables por mquinas, es posible crear herra- Los datos abiertos aseguran una asignacin
mientas, visualizaciones, modelos y anlisis que ms eficiente de los escasos recursos con los que
pueden hacer ms valiosa la informacin. contamos actualmente. Hasta ahora han sido tra-
Para resolver problemas complejos es necesa- tados, cuidados y protegido su acceso ya que ellos
rio que trabajen de manera conjunta personas han sido y son la base para nuestras investiga-
con distintas habilidades. Actualmente los gobier- ciones. Muchas veces no les sacamos ms partido
nos no suelen aprovechar el conocimiento colec- por no tener la suficiente capacidad o tiempo,
tivo para mejorar la gobernabilidad y resolver desaprovechando los conocimientos de otros.
problemas. En este contexto los hackathons1 se Esta apertura de datos tambin puede mejorar
convierten en un modelo para la accin, para la la transparencia, no slo en las polticas guber-
gobernanza participativa. Avanzar hacia la inno- namentales, sino tambin en las investigaciones,
vacin abierta como una forma predeterminada fomentando as el rigor cientfico.
de trabajar en el Gobierno no es fcil. Se necesita Junto a las ventajas sealadas y las prevencio-
persuadir a los propietarios de datos para que nes acerca de lo que se puede esperar actualmen-
transformen el papel al formato digital, y luego te del open data, hay que sealar las reflexiones
liberar los datos a pesar de los desafos polticos de Fritjof Capra y Evgeny Morozov.
y tcnicos. Fritjof Capra (2003) seala cmo las redes
La innovacin participativa es mucho ms que cambian la manera de entender la sociedad
la simple publicacin de datos conjuntos. Las actual, adems de que en nuestro escenario proli-
instituciones tienen que estar dispuestas a cola- feran y crecen los medios sociales de informacin
borar con los innovadores, con los activistas de la y de redes. Cada vez existe un mayor nmero de 155
tecnologas para la vida diaria y todo ello con- Federal Reserve Bank of St. Louis. Economic research -
tribuye a que haya un volumen de datos y de St. Louis Fed.
conexiones entre personas, redes e informaciones http://research.stlouisfed.org
con un crecimiento cuyos lmites an no se vislum- IBM (2012). IBM analytics conversations: social senti-
bran. Este crecimiento y la complejidad que van ment index United States. IBM.com.
generando las relaciones que se establecen son http://www.ibm.com/analytics/us/en/conversations/
un verdadero desafo. social-sentiment.html
Johnson, Steven B. (2012). Searching for John
Snows. Crooked timber, 27 June.
La apertura de datos puede mejorar http://crookedtimber.org/2012/06/27/searching-for-
john-snows
la transparencia tanto en las polticas
gubernamentales como en la Lee, Tom (2012). Open data: better politics, winning
investigacin, fomentando as el rigor politics but still politics. Crooked timber, 6 July.
cientfico http://crookedtimber.org/2012/07/06/open-data-better-
politics-winning-politics-but-still-politics
Capra, Fritjof (2003). Las conexiones ocultas. Anagra- Ticbeat (2012). La campaa de big data que dio la vic-
ma. ISBN: 978 84 339 6188 4 toria a Obama. TICbeat, 8 nov.
http://bigdata.ticbeat.com/campana-big-data-dio-
Farrell, Henry (2012a). Open data seminar. Crooked victoria-obama
timber, 17 July.
http://crookedtimber.org/2012/07/17/open-data- Wikipedia (2012). Datos abiertos.
seminar-2 http://es.wikipedia.org/w/index.php?title=Datos_abiertos
Farrell, Henry (2012b). Trish, Reiner and the politics Yglesias, Matthew (2012). Open data journalism.
of open data. Crooked timber, 4 July. Crooked timber, 28 June.
http://crookedtimber.org/2012/07/04/trish-reiner-and- http://crookedtimber.org/2012/06/28/open-data-
the-politics-of-open-data journalism
156