Sie sind auf Seite 1von 36

GUA DE

DATOS
ABIERTOS
EN COLOMBIA
PARA:
Abrirse a la innovacin.
Empoderar al ciudadano.
Medir el impacto de las polticas.
La transparencia y el control social.
Mejorar la eciencia y ecacia del Estado.
Mejorar o crear productos y modelos de negocio.
VERSIONES

VERSIN 1.

12/2016
Gua para la apertura de datos en Colombia
Dirigida a entidades del Estado para el desarrollo de procesos de
apertura de datos pblicos.

VERSIN 2.

06/2016
Gua de datos abiertos en Colombia
Dirigida a las entidades sujeto de aplicacin de la Ley 1712 de
2014 de Transparencia y Acceso a la Informacin Pblica, para la
aplicacin de orientaciones y buenas prcticas en el desarrollo de
estrategias de apertura y reuso de datos abiertos.

VERSIN 3.

06/2016
Gua de datos abiertos en Colombia
Modificaciones de diagramacin
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

00 INTRODUCCIN

Las formas tradicionales de Gobierno se han ido transformando hacia


gobiernos abiertos en donde la sociedad tiene un rol mucho ms activo y
colaborador, en dnde un problema de inters pblico ya no es solo asunto
de los funcionarios pblicos sino que tambin la ciudadana puede aportar
en su solucin, y en donde los actores de Gobierno son mucho ms
receptivos e interactan con la comunidad. En este nuevo modelo de
gobierno juegan un rol muy importante: la transparencia, la colaboracin y
la participacin y por esto es fundamental contar con acceso a la
informacin pblica.

En Colombia, el acceso a la informacin pblica es un derecho fundamental


que cumple al menos tres funciones esenciales:

Garantizar la participacin democrtica y el ejercicio de los derechos


polticos.
Ser un instrumento fundamental para el ejercicio de otros derechos
constitucionales, ya que permite conocer las condiciones necesarias
para su realizacin.
Garantizar la transparencia de la gestin pblica, y por lo tanto,
constituirse en un mecanismo de control ciudadano de la actividad
estatal.
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

Los datos abiertos hacen parte de la informacin pblica y representan un


gran potencial para el desarrollo de procesos de Gobierno Abierto (Open
Government)1, en la medida en que permiten reutilizar informacin de
diversas fuentes, sin restricciones de uso y en formatos de fcil lectura y
anlisis, de tal manera que se habilitan nuevas formas de tomar decisiones, de
resolver problemas pblicos, de entender determinados comportamientos
y hasta generar valor no solo social sino econmico a travs de la innovacin.

El objetivo del presente documento, es proporcionar orientaciones y buenas


prcticas para el desarrollo de estrategias de apertura y reuso de datos
abiertos, que estn orientadas a la generacin de valor en lo econmico,
social, poltico, cultural, ambiental, y en general, en los distintos mbitos de
la sociedad. Este documento comprende las siguientes temticas que pueden
navegarse desde el men superior:

1
Conjunto de polticas que buscan fomentar la construccin de un Estado ms transparente,
participativo y colaborativo en los asuntos pblicos.
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

01 QU SON los
DATOS ABIERTOS?

La Carta Internacional de Datos


Abiertos define los datos abiertos
como datos digitales que son puestos
a disposicin con las caractersticas
tcnicas y jurdicas necesarias para que
puedan ser usados, reutilizados y
redistribuidos libremente por cualquier
persona, en cualquier momento y en
cualquier lugar. A partir de ello, los
datos abiertos son considerados como
uno de los factores que impulsan la
transformacin global favorecida por la
tecnologa y los medios digitales y
permiten a los gobiernos, ciudadanos y
organizaciones de la sociedad civil y
del sector privado tomar mejores
decisiones informadas.

05
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

Por otra parte, el Banco Mundial en


el documento de diagnstico y
recomendaciones para la implementacin
de un programa de datos abiertos
realizado para Colombia en el ao
20152, define datos abiertos como los
datos publicados en formatos legibles
por mquinas, que estn disponibles
pblicamente bajo una licencia abierta
que asegura que pueden ser utilizados,
reutilizados o distribuidos libremente
por cualquier persona, para cualquier
propsito legal.

En Colombia la Ley de Transparencia y


Acceso a la Informacin, define los
datos abiertos como todos aquellos
datos primarios o sin procesar, que se
encuentran en formatos estndar e
interoperables que facilitan su acceso y
reutilizacin, los cuales estn bajo la
custodia de las entidades pblicas o
privadas que cumplen con funciones
pblicas y que son puestos a
disposicin de cualquier ciudadano, de
forma libre y sin restricciones, con el fin
de que terceros puedan reutilizarlos y
crear servicios derivados de los
mismos3.

2
Open Data Readiness Assessment (ODRA).
Estudio realizado en mayo Septiembre de 2015.
World Bank Group.
3
Ley 1712 de 2014. Literal J, artculo 6.
Definiciones.

06
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

02 CULES PRINCIPIOS
RIGEN LOS DATOS ABIERTOS?

PRIMARIOS ACCESIBLES COMPLETOS


Obtenerse en la fuente de Estar disponibles para el Reflejar la totalidad del
origen, con el ms alto rango ms amplio de tema y contener el mayor
nivel de detalle posible, no usuarios y para el rango detalle posible,
en forma agregada ni ms amplio de garantizando que la
modificada. propsitos. informacin suministrada
sea suficiente y
consistente y que no
contenga datos nulos.
Procesables NO PROPIETARIOS
por mquinas Estar disponibles en un
formato sobre el cual
Encontrarse en formatos
ninguna entidad tenga OPORTUNOS Y
que permitan el
procesamiento control exclusivo. ACTUALIZADOS
automtico. Estar disponible tan
rpido como sea
NO DISCRIMINADOS necesario para garantizar
su valor y mantener una
LICENCIADOS DE Estar disponibles para frecuencia de
FORMA ABIERTA cualquiera persona, sin actualizacin que
requerir registro o garantice la utilidad del
Los conjuntos de datos autenticacin.
publicados deben contar dato.
con trminos de uso y
licenciamiento abierto4. 4
Ver anexo 1. Uso de licencias
abiertas.

07
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

Licencia abierta es aquella


que permite de forma libre
y sin restricciones:
El uso
Extraccin Adaptacin
Transformacin Copia
Distribucin Redistribucin
Reutilizacin
Modificacin Compilacin
Difusin de los datos
publicados
Tales principios se encuentran en concordancia con la Carta Internacional
de Datos Abiertos, lanzada en la Cumbre de la Alianza por el Gobierno
Abierto en Octubre de 2015. Consltela en: http://opendatacharter.net .

08
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

03 POR QU es
importante abrir y
reutilizar DATOS?

Los datos abiertos pueden generar valor en diferentes


reas, dentro de las que se encuentran:

1. TRANSPARENCIA Y CONTROL SOCIAL


Se busca que la informacin de la
gestin pblica est completamente
visible y que permita realizar
acciones de control social. Un
ejemplo de esta aplicabilidad de los
datos es la realizada por proyectos
como Where does my money go?,
desarrollado por el Reino Unido, en
donde se exponen los datos de
cmo el Gobierno est invirtiendo el Where does my money go?
app.wheredoesmymoneygo.org
http://
dinero de los impuestos.

09
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

2. EMPODERAMIENTO
Los datos abiertos pueden ayudar a
que las personas tengan un rol ms
activo en la sociedad. Un ejemplo
de este empoderamiento es el caso
de San Francisco (EUA), en donde el
Gobierno publica los resultados de
las inspecciones sanitarias en los
restaurantes de la ciudad y a partir
de dicha informacin, los YELP
http:// www.yelp.com
ciudadanos deciden dnde comer y
los restaurantes se ven sujetos a
mejorar sus prcticas de manipulacin
de alimentos. Al final el beneficio se
observa en la mejora de la sanidad
pblica de la ciudad y en la
generacin de otras plataformas
que usan esta informacin.

Otro ejemplo de empoderamiento


ZAGAT
es el caso de los hospitales en www.zagat.com
http://

Londres, quienes publican cifras


sobre sus tasas de xito y fracaso
en la atencin, procedimientos y
personal mdico, con lo cual los
pacientes pueden decidir el hospital
o lugar ms conveniente para su
caso y los mdicos pueden
aprender de sus colegas mediante
el acceso a informacin especfica
de procedimientos mdicos. Hospital Data
http://www.telegraph.co.uk/news/health/expat-health/9479874/
Publish-hospital-data-and-save-thousands-of-lives.html

10
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

3. Mejoramiento o creacin de productos,


servicios y modelos de negocio innovadores
Los datos abiertos tienen un gran
potencial para generar valor
econmico a partir de su uso, pues
adems de generar beneficios a
nivel de transparencia y rendicin
de cuentas, tienen la posibilidad de
ser usados para mejorar o crear
nuevas empresas o productos. Por
ejemplo, servicios como Mapumental
en el Reino Unido o Mapnificent en
Alemania, permiten encontrar lugares Mapnificent
www.mapnificent.net
http://
donde vivir tomando en cuenta la
duracin del viaje hasta el trabajo,
precios de viviendas y belleza de la
zona.

El sitio dans Husetsweb ayuda a


encontrar maneras de mejorar la
eficiencia energtica en la vivienda,
incluyendo planificacin financiera
e informacin sobre constructores.
Est basado en informacin catastral
y sobre subsidios del gobierno, as HUSETSWEB
http:// www.husetsweb.dk
como en el registro de comercio local.

11
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

4. Mejoramiento en la eficiencia y eficacia de los


servicios ofrecidos por el Estado
Los datos abiertos son de gran
valor tambin para el Gobierno, en
la medida en que pueden mejorar la
eficiencia en la prestacin de los
servicios de las entidades. En
Holanda, el Ministerio de Educacin
public en Internet todos los datos
relacionados con educacin para
su reutilizacin. A partir de ello,
MYBUS
www.mybus.com.ar
http://

disminuy el nmero de preguntas


de los ciudadanos, reduciendo el de la Ciudad de Mar del Plata
volumen de trabajo. Otro ejemplo es Argentina, que ayuda a encontrar la
el caso de MyBus, un sitio web mejor forma para moverse en la
desarrollado por programadores ciudad.

5. Medicin predictiva del impacto de polticas


Los datos abiertos tambin pueden
ser usados para prever situaciones
futuras a partir del desarrollo de
polticas o proyectos de impacto
social. Un ejemplo es el caso de la
reforma educativa en Chile, que ha
sido desarrollada a partir de datos
abiertos provistos por el Gobierno y
mediante los que se han medido Big Data para la toma
aspectos del sistema educativo de decisiones en educacin
http://http://yogobierno.org/
como falta de equidad espacial o big-data-para-la-toma-de-decisiones-en-educacion/

cumplimiento de estndares mnimos


de aprendizaje y se han podido de alto impacto social como la
predecir y prevenir fenmenos desercin o el abandono escolar.

12
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

6. Nuevos conocimientos a partir de fuentes de


datos combinadas y generacin de patrones
en grandes volmenes de datos
La posibilidad de contar con grandes
volmenes de datos abiertos en
formato digital, permite que estos
puedan ser procesados fcilmente
y generar visualizaciones para
descubrir tendencias o identificar
nuevas perspectivas de un problema.
Este uso de los datos se presenta
en reas como el periodismo de
Sabe usted dnde se toma
datos, en donde se analizan la mejor y la peor agua del pas?
situaciones o se generan historias a http://www.eltiempo.com/multimedia/especiales/
calidad-del-agua-en-colombia/16555634/1

partir de la combinacin, anlisis, y


visualizacin de datos abiertos.

En Colombia a partir de datos


abiertos publicados por el Instituto
Nacional de Salud INS sobre
calidad del agua potable para el
consumo humano, el peridico El
Tiempo gener un anlisis sobre
municipios del pas en donde se
consume la mejor y la peor agua del
Shots heard around the District
Pas. Otro ejemplo es uno de los http://www.washingtonpost.com/wp-srv/
special/local/dc-shot-spotter/
artculos del peridico Washington
Post, en donde se cruzaron datos explicar en profundidad el problema
de asaltos con armas de fuego y de la criminalidad en algunas zonas
grabaciones de tiroteos, para de la ciudad.

13
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

7. Toma de decisiones
El anlisis de los datos abiertos
facilita la toma de decisiones no
slo por parte del Estado para la
definicin de polticas, sino por parte
de ciudadanos y empresas, en
materia de salud, educacin,
inversin, medio ambiente, etc.

En Nueva Orleans, el problema de


las propiedades que fueron
abandonadas despus del huracn
BlightStatus
blightstatus.nola.gov
http://

Katrina, se ha logrado resolver a


partir del anlisis de datos abiertos,
pues han permitido acelerar el
proceso de declaracin legal de una
propiedad abandonada y la
definicin de otros usos. En este
caso la ciudad ha transformado
ms de 13.000 de estas propiedades
y a travs del sitio web de
BlightStatus, las personas pueden
co m p rob a r el p rog reso de
transformacin de las propiedades
BlightStatus
en su vecindario. http://http://blightstatus.nola.gov/addresses/195374

14
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

Infraestructura
Institucional de Datos

Otros casos en el uso de


datos abiertos son:

CIUDATOS

http://www.humboldt.org.co/es/servicios/
infraestructura-institucional-de-datos

Es el catalogador de informacin
geogrfica y biolgica del Instituto
Alexander Von Humboldt, que ofrece
acceso a informacin generada por
el Instituto y por estudiantes,
ciudatos.com
http://
investigadores, entidades estatales
y ONG. Esta informacin interopera
Es la plataforma de datos abiertos con otros sistemas de informacin,
de la Red de Ciudades Cmo Vamos, como la del Sistema de Informacin
que proporciona informacin sobre Ambiental, la Infraestructura
cambios en la calidad de vida de 11 Colombiana de Datos, y la
ciudades, para consulta y anlisis Infraestructura Colombiana de
de todos los ciudadanos. Datos Espaciales.

15
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

04 cmo DESARROLLAR
UN PROCESO DE APERTURA
Y USO DE DATOS?

Un proceso exitoso para el uso de los datos abier tos requiere


comunicacin, flexibilidad, retroalimentacin e interaccin constante entre
quienes ofertan y quienes reutilizan los datos abiertos. En este sentido, se
pueden evidenciar los siguientes momentos en el proceso de apertura y uso
de los datos5:

TIFICAR Y PUBLICAR
DI EN AT O S
D RECUERDE:
Una estrategia de datos abiertos va ms
all de la preparacin y publicacin de los
COMUNICAR Y
ad y el uso

datos por parte de las entidades. Tambin


involucra acciones concretas para promover
OR

REU

el uso de los datos publicados, realizar


alid
AL

P
S
R

O seguimiento e identificar el valor agregado


OM
c

V
la

OV

ER
torear EL U
SO que se est generando con su utilizacin.
Moni

5
Definido a partir del crculo virtuoso de datos abiertos propuesto por el Banco Mundial para el
fortalecimiento de la iniciativa de datos abiertos en Colombia (Datos, reuso y valor) y los
momentos establecidos en el Manual de Gobierno en lnea para la apertura de datos.

16
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR
TIFICAR Y PUBLICAR
IDEN AT O S
D
Los datos abiertos son valiosos en
la medida en que sean exhaustivos,

COMUNICAR Y
ad y el uso

precisos, de alta calidad y que


respondan a necesidades concretas
OR

REU
de los usuarios.
alid
AL

P
S
R
O

OM
c

V
la

OV
r ER
itorea EL U
SO
Mon

El papel de las entidades que identifican y publican datos abiertos es


fundamental, pues la demanda de datos abiertos viene en constante
aumento y es cada vez ms exigente. Para lograr un mejor y mayor uso de
los datos es importante:

IDENTIFICAR cmo est GARANTIZAR que se pueda MEJORAR el proceso y los


conformada la demanda de acceder a los datos abiertos espacios de atencin a la
los datos abiertos de la de manera directa y sin demanda de datos abiertos y
entidad, sus necesidades y restricciones, evitando de respuesta a sus
expectativas. Recuerde que protocolos y procedimientos requerimientos. El objetivo
la demanda de datos puede innecesarios como es lograr una relacin de
venir de la sociedad civil, el convenios, solicitudes por colaboracin entre la entidad
sector privado, los email y luego mediante que identifica y publica los
organismos internacionales, derecho de peticin, datos y quienes hacen uso
la academia y grupos de incurriendo en de los mismos.
investigacin, las ONG o el demoras y costos
sector periodstico, entre PUBLICAR datos
adicionales.
otros. georreferenciados, lo cual
PUBLICAR los datos corresponde a la informacin
GARANTIZAR la peridicamente identificando geogrficamente referenciada
transparencia en el proceso aquellos que tienen mayor con el fin de resolver
de recogida, procesamiento demanda por usuario y/o problemas complejos de
y gestin de los conjuntos de grupo de inters. planificacin y gestin.
datos6 a publicar. Estos pueden ser
utilizados para generar IMPULSAR el uso de datos
IMPULSAR y dar a conocer tendencias, reportes, como una herramienta de
los beneficios del uso de los informes de seguimiento, mejora en la gestin de la
Datos abiertos. entre otros. entidad.

6
Conjunto de datos (Dataset): unidad mnima de informacin sujeta a carga, publicacin,
transformacin y descarga en la plataforma.

17
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Cmo identificar los datos a publicar?

Verifique cules son las solicitudes


de informacin ms recurrentes y
convirtalas en dato abierto.

Identifique informacin que ya est


publicada en el sitio web en formato
PDF PDF, Word, Excel, JPG o tablas
dinmicas y slo requiere
disponerse en formato abierto.

Identifique y publique datos de alto


impacto en salud, educacin,
impuestos, movilidad, seguridad
ciudadana, salud pblica, atencin y
reparacin a las vctimas y
ordenamiento territorial*.

Publique en formato abierto


informacin que ya se encuentra en
estudios, anlisis y estadsitcas,
validando el manejo adecuado de la
informacin confidencial.

*
Estos temas fueron priorizados en la Ruta de la Excelencia en Gobierno en Lnea (Mapa de Ruta
Decreto 1078 de 2015 Ttulo 9 - Captulo 1), por lo que debe estar atento a futuras actualizaciones.

18
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Aspectos legales a considerar


La Ley 1712 de 2014 de Transparencia y Acceso a la Informacin, establece
que la entidad debe contar con un Registro de Activos de Informacin7, que
es el inventario de la informacin pblica que genera, obtiene, adquiere,
transforma o controla la entidad. Este registro debe ser publicado en la
pgina web de la entidad y en el portal de datos www.datos.gov.co o el que
haga sus veces.

Dentro de la informacin que debe tener el Registro de Activos de


Informacin se encuentra:

Informacin relacionada con los trmites, servicios y procesos que


soportan el da a da del trabajo de la entidad.
Procesos encaminados en la mejora continua y el cumplimiento de los
objetivos estratgicos.
Informacin que soporta los procesos relacionados con la contratacin,
el recurso humano o la informacin financiera y contable.

As mismo, la ley tambin establece la realizacin de un ndice de


Informacin Clasificada y Reservada8, en donde la entidad identifica qu
informacin se debe ser clasificada como tal por motivos de proteccin de
datos personales o por motivos de defensa, seguridad nacional o
estabilidad econmica del Pas. Este ndice debe ser publicado en el sitio
web oficial de la entidad, as como en el portal de datos abiertos
www.datos.gov.co o el que haga sus veces.

7
Decreto 1081 de 2015 Cap. 5, Seccin 1 Art 2.1.1.5.1.1. Registro de Activos de Informacin.
8
Decreto 1081 de 2015 Gestin de la Informacin reservada Art. 2.1.1.4.1. ndice de
Informacin Clasificada y reservada Art. 2.1.1.5.2.1.

19
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

RECUERDE
Los datos abiertos no son contrarios a la proteccin de datos personales: si
existe informacin asociada a datos personales pero que puede ser valiosa
como dato abierto, adelante acciones de anonimizacin para eliminar
aquella informacin sensible que afecta a personas u organizaciones y cuya
identidad debe protegerse legalmente.

Antes de publicar cualquier informacin que sea sensible, considere otras


fuentes de informacin disponibles y evale si la combinacin de stas
pueden presentar algn riesgo. Con esto puede prevenir el efecto mosaico,
que ocurre cuando la informacin de una base de datos por s sola, no
genera un riesgo para la identificacin de individuos, pero al combinarse
con otra informacin disponible, puede generar tal riesgo.

En materia de datos abiertos, especficamente la Ley 1712 establece que


las entidades deben publicar datos abiertos, teniendo en cuenta las
excepciones de publicar informacin pblica clasificada o informacin
pblica reservada. Algunos ejemplos de esta informacin son los
siguientes:

INFORMACIN PBLICA INFORMACIN PBLICA


CLASIFICADA RESERVADA
Pone en riesgo la intimidad de las Defensa y seguridad Nacional y
personas. pblica.
Pone en riesgo la vida, salud o Relaciones internacionales.
seguridad de las personas. Debido proceso en los procesos
Afecta los secretos comerciales, judiciales.
industriales, profesionales. Derechos de la infancia y la
Afecta los derechos estipulados en el adolescencia.
pargrafo del Art. 77/ 1474 de 2011. Estabilidad macroeconmica y
financiera del pas.
Salud pblica.

Informacin pblica cuyo acceso libre puede Informacin pblica cuyo acceso
causar dao de derechos a personas libre puede causar dao a los
naturales o jurdicas. intereses pblicos.

20
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

CMO PUBLICAR DATOS ABIERTOS?

La publicacin de datos requiere una preparacin previa que tiene como


objetivo alistar los datos adecuadamente para que estos puedan ser
procesados y reutilizados por terceros. Este alistamiento incluye tres
actividades:

DOCUMENTACIN ESTRUCTURACIN CARGA DE DATOS

DOCUMENTACIN
La documentacin de los datos consiste en definir los metadatos que
tendr cada uno de los conjuntos de los datos o datasets a publicar. Los
metadatos son datos que describen los aspectos bsicos de un conjunto de
datos y son una herramienta fundamental para organizar, clasificar,
relacionar y encontrar los datos necesarios. La cantidad y calidad de
metadatos asociados a un conjunto de datos, permite una mejor
clasificacin y una mejor bsqueda y recuperacin de los datos. Algunos
metadatos generales son los siguientes:

Nombre del conjunto de datos:

Nombre definido para el dataset.

Descripcin: Categora:

Clasificacin conceptual bsica del dataset


en sistemas de categoras o taxonomas
Resumen descriptivo del conjunto de datos, disponibles.
en donde se explica su contenido, su contexto
y el detalle de lo que se encontrar, de Idioma:
manera que cualquier usuario se encuentre
informado sobre el contenido antes de
descargar el recurso. Idioma de los datos del conjunto de datos.

Entidad: Fecha de publicacin:

Nombre de la entidad o institucin que Fecha en la que se emiti el conjunto de


produce o controla la informacin. datos.

21
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

La cantidad y caractersticas de los metadatos, depender de la plataforma


en donde sern publicados los conjuntos de datos. Para el caso del Portal
de Datos del Estado Colombiano, se proporcionan los recursos necesarios
para realizar la documentacin de los datos, en: www.datos.gov.co.

RECUERDE
La documentacin de datos:

Permite a los usuarios entender el contenido y caractersticas de los


datos para generar mayor valor en su publicacin.
Permite identificar integracin y/o interoperabilidad con otras fuentes
de informacin

ESTRUCTURACIN
Consiste en la preparacin del conjunto de datos a publicar en un formato
estructurado. Para realizar esta actividad, la entidad debe elegir el formato
que considere ms adecuado, bajo criterios de menor esfuerzo y costo,
pero sin afectar la calidad y accesibilidad de los datos. Los formatos para la
publicacin de los conjuntos de datos se agrupan en tres tipos:

Formatos propietarios: Son formatos de archivo que requieren


herramientas licenciadas para acceder, visualizar o editar los datos.
Este tipo de formatos son por ejemplo .DOC, .XLS o .SHP.
Formatos libres: Son formatos de archivo que se pueden crear y
manipular para cualquier software, libre de restricciones legales y que
aumentan el nivel de reutilizacin de los datos. Este tipo de formatos
son por ejemplo .CSV, .TMX, .XML, .ODF, JSON.

22
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

RECUERDE
La estructuracin de datos:

Busca transformar el dato de formatos no-textuales a formatos que


permitan su manipulacin y su conexin con otros datos (datos
enlazados o linked data).
Existen diversos formatos para la estructuracin de datos, pero a la hora
de seleccionarlos se debe tener en cuenta que sean legibles
directamente por mquinas, que sean abiertos y permitan un uso sin
restricciones y que se encuentren dentro de los ms usados por los
reutilizadores.
Debe evitarse el uso de formatos no editables como el PDF.

CARGA DE DATOS
El cargue de datos se realiza a travs de su publicacin en una plataforma
que permita la organizacin y fcil acceso por parte de quienes van a
reutilizar los datos, de manera que se convierta en un sitio de acceso comn
y que tenga la posibilidad de hacer escalable la informacin publicada.

Portal de datos del Sitio creado por el Ministerio de


Estado Colombiano Tecnologas de la Informacin y las
Comunicaciones, en donde las
entidades pblicas del orden nacional
y territorial publican datos abiertos en
temas de su competencia y de inters
nacional. Este sitio cuenta con los
formatos y procedimientos
especficos para realizar la
documentacin estructuracin y
cargue y publicacin de la informacin.
www.datos.gov.co
http://

23
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Adicional a esta plataforma, en Colombia existen plataformas que han sido


desarrolladas por entidades pblicas y privadas, sin embargo, las entidades
pblicas que publiquen sus datos abiertos en sitios diferentes al portal de
Datos del Estado Colombiano debern garantizar que los datos estn
debidamente enlazados y referenciados en ste portal.

Algunas plataformas complementarias de publicacin


de datos abiertos son:

Portal de Datos
de Bogot
Contiene datos abiertos de la
Ciudad y de las entidades adscritas
al Distrito Capital.
datosabiertos.bogota.gov.co
http://

CIUdatos
Es el sitio de datos abier tos
desarrollado por la Red de
Ciudades Cmo Vamos, entidad de
la sociedad civil de Medelln.
ciudatos.com
http://

24
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

OData
portal de la Cmara de Comercio
Bogot que pone a disposicin de
los empresarios de Colombia datos
sociales, econmicos y de movilidad,
entre otros, para la toma de decisiones.
opendatabogota.ccb.org.co
http://

Datos abiertos del


Municipio de Tulu
es el sitio de la Alcalda de Tulu, en
donde se publican datos abiertos
en temas de salud, educacin,
agricultura, seguridad, turismo,
presupuesto y finanzas del municipio.
datos.tulua.gov.co
http://

Otros sistemas de publicacin:


Son lenguajes para consultar archivos, como el
SPARQL, WMS, WFS, WS-API, entre otros.

25
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Tenga en cuenta
Sobre el Portal de Datos del Estado Colombiano:

La Ley 1712 de 2014 y el Decreto 103 de 2015 (compilado en el Decreto


1081 de 2015), establecen que los sujetos obligados de estas normas
deben publicar en el Portal de Datos del Estado Colombiano:

El registro de activos de informacin.


El ndice de informacin clasificada y reservada.

Las entidades que publiquen sus datos abiertos en sitios diferentes al portal
de Datos del Estado Colombiano www.datos.gov.co o el que haga sus
veces, deben garantizar que dichos datos queden enlazados o relacionados
en el Portal de Datos, mediante estrategias de bases de datos federadas9.
Para mayor informacin, puede dirigir sus inquietudes al correo:
datosabiertos@mintic.gov.co

9
Ver definicin en el glosario.

26
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR
TIFICAR Y PUBLICAR
IDEN AT O S
D
El rol de las entidades del Estado en
el uso de datos abiertos no termina

COMUNICAR Y
ad y el uso
con su publicacin. Tambin deben
desempear un papel activo para
OR

REU
apoyar una reutilizacin eficaz e
alid
AL
innovadora de los mismos.

P
S
R
O

OM
c

V
la

OV
r ER
itorea EL U
SO
Mon

Cmo comunicar y promover el uso de los datos abiertos?


Una vez se cuenta con la publicacin de datos abiertos,
es necesario desarrollar un plan de comunicacin para:

Fomentar la oferta:
Facilitar la apertura de
datos.

Fomentar la demanda:
Facilitar la reutilizacin y
consumo de Datos
Abiertos.

Comunicar los resultados:


Sensibilizar sobre el uso de
datos abiertos y sus logros
y beneficios.

27
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Adems de la labor de comunicacin al exterior de la entidad, se debe


realizar una labor informativa dirigida a los empleados, a fin de transformar
el manejo tradicional de los datos pblicos en un manejo con mayor
apertura y orientado a que los datos sean lo ms ricos y completos posible.

A partir de tales objetivos, el plan de comunicaciones se podra plantear


sobre los siguientes momentos:

DAR A CONOCER VINCULACIN DE LOS AGENTES CONSOLIDACIN Y POSICIONAMIENTO

DAR A CONOCER
Contiene el conjunto de comunicaciones internas y externas de la entidad,
para sensibilizar sobre el uso de datos abiertos y sus beneficios, como
mejora en temas de transparencia y control social, toma de decisiones,
desarrollo de aplicaciones, mejora de servicios, periodismo de datos, entre otros.

Al respecto la entidad puede desarrollar estrategias de comunicacin


interna y externa as como hacer uso de redes sociales para difundir estos
mensajes. Algunas actividades especficas para dar a conocer los usos y
beneficios de los datos abiertos pueden ser:

Generar mensajes internos va intranet o e-mailing.


Realizar encuentros o reuniones internas.
Desarrollar campaas informativas con medios de comunicacin para
dar a conocer beneficios con el uso de los datos abiertos de la entidad.
Realizar campaas de comunicacin a travs de Urna de Cristal para
incentivar el uso de datos de la entidad y difundir soluciones
desarrolladas con datos abiertos de la entidad.

28
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Vinculacin de los agentes


Esta etapa tiene como objetivo adelantar actividades para vincular a
diferentes actores que promuevan la reutilizacin de datos de la entidad,
difundir soluciones desarrolladas con datos abiertos y desarrollar
actividades para identificar nuevas posibilidades con el uso de los datos.

Algunas actividades que se pueden adelantar para vincular a los agentes


pueden ser:

Desarrollar procesos de co-creacin de herramientas tecnolgicas o


aplicaciones para impulsar la reutilizacin de datos, con participacin
de desarrolladores y usuarios10.
Realizar talleres o encuentros con usuarios o grupos de inters para
generar propuestas de usos creativos con los datos abiertos.
Desarrollar planes o estrategias de incentivos para promover la
participacin de los empleados, usuarios y grupos de inters en el
desarrollo de las actividades que impulsen la identificacin y uso de
datos abiertos de la entidad.

RECUERDE
Hay un gran inters tanto en el acceso como en la reutilizacin de datos por
parte de muchas organizaciones y personas de la sociedad civil: Existen
varios referentes en materia de demanda de datos abiertos, como aquellos
que son grandes reutilizadores, saben hacer visualizaciones, promulgan los
beneficios de los datos abiertos o se relacionan con referentes
internacionales. Todos ellos aportan en la generacin de valor a partir del
uso de datos abiertos.

10
Para el desarrollo de esta actividad se puede tomar como referencia la Gua para Desarrollar
Ejercicios de Innovacin Abierta, en el sitio web del Centro de Innovacin:
http://centrodeinnovacion.gobiernoenlinea.gov.co/es/caja-herramientas/ejercicios-de-innovacion-abierta

29
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Consolidacin y posicionamiento
En esta etapa se busca que la entidad incorpore su estrategia de datos
abiertos como parte integral de sus planes estratgicos o planes de accin,
de manera que la apertura y uso de datos pasen de ser actividades
puntuales o iniciativas coyunturales, a iniciativas estructurales que cuentan
con el conocimiento y respaldo del nivel directivo, con la asignacin de
equipos responsables de liderar las actividades para identificar, publicar,
promover y hacer seguimiento al uso de los datos abiertos y con la
asignacin de recursos para adelantar estas actividades.

En esta etapa se espera que de forma permanente la entidad desarrolle


jornadas de sensibilizacin con usuarios internos y externos sobre los
beneficios de los datos abiertos, realice campaas de comunicacin sobre
soluciones desarrolladas a partir de datos abiertos, desarrolle procesos de
co-creacin para impulsar la reutilizacin, establezca contacto con medios
de comunicacin para difundir logros o beneficios obtenidos con el uso de
datos abiertos de la entidad, entre otros.

CINCO CLAVES

1 2
1. Promueva la reutilizacin de la 2. Seleccione los canales de difusin
informacin en formato abierto no ms apropiados segn el pblico
solo a usuarios externos, sino al potencial para el uso de los datos
interior de la entidad. abiertos.

3 3. Mencione a los usuarios de


manera explcita, los posibles
usos de los conjuntos de
datos de la entidad. Por
4
4. Mantenga actualizados los datos
publicados. El inters en el uso de
los mismos se mantendr si los
datos son pertinentes y oportunos.
ejemplo en la toma de
decisiones, la mejora de los

5
servicios de la entidad, usos 5. Contemple incentivos que pueda
en la academia y en la otorgar para el uso de los datos
investigacin, etc. abiertos

30
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR
TIFICAR Y PUBLICAR
IDEN AT O S
D
Generar mecanismos para reportar
hallazgos y hacer comentarios o

COMUNICAR Y
ad y el uso
sugerencias sobre los conjuntos de
datos, permite retroalimentar el
OR

REU
proceso de identificacin, promocin
alid
AL
y uso por parte de los usuarios.

P
S
R
O

OM
c

V
la

OV
r ER
itorea EL U
SO
Mon

El uso de los datos abiertos es un aspecto estrechamente ligado a su


calidad. En la medida en que se garantice que los datos abiertos publicados
son completos, oportunos y consistentes, es posible promover un su uso y
por lo tanto, generar valor a partir de ello.

Para monitorear el uso de los datos abiertos, es posible utilizar algunos


indicadores de tipo cuantitativo que permiten determinar su demanda y
nivel de uso. Algunos de estos pueden ser:

Nmero de solicitudes de apertura de datos.


Nmero de dependencias o reas de la entidad que abren datos.
Porcentaje de conjuntos de datos abiertos estratgicos publicados.
Nmero de conjuntos de datos descargados Vs. nmero de conjuntos
de datos publicados.
Nmero de aplicaciones generadas a partir de datos abiertos.
Nmero de publicaciones que hicieron uso de los conjuntos de datos
abiertos (papers, artculos, noticias, libros, etc.).

31
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

IDENTIFICAR
COMUNICAR
MONITOREAR

Por otra parte, las actividades de monitoreo tambin deben orientarse a


identificar el valor generado para ciudadanos, usuarios y grupos de inters
a partir de la publicacin de datos abiertos, con lo cual se apunta al
fortalecimiento de las acciones en materia de gobierno abierto. En este
sentido, el valor pblico puede ser identificado en los siguientes mbitos11:

Financiero: Impacto actual o futuro de ingresos, valor de activos,


pasivos o cualquier otro aspecto relacionado con la riqueza y el riesgo.
Poltico: Impacto en una persona o un grupo de influencia o partidos
polticos como producto de la accin del gobierno o su poltica.
Social: Impacto en las relaciones con la comunidad o familias, en la
movilidad social, estatus o identidad.
Estratgico: Impacto en personas o grupos econmicos relevantes en
sus objetivos y recursos para la innovacin o el planeamiento.
Ideolgico: Impacto en las creencias, en la moral o en los compromisos
ticos en la sociedad.
Legitimidad y Respeto: Impacto a nivel de la confianza, integridad y
legitimidad de entidades pblicas y privadas.

11
Tomado de Open Goverment and E-Goverment Democratic Challenges from a public
value perspective.

32
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

05 GLOSARIO

Anonimizar Catlogo de servicios de TI Datos enlazados


Proceso para remover datos Este catlogo recoge y describe o linked data
personales de una base de los servicios de TI que la Mtodo de publicacin de
datos, buscando la publicacin entidad presta actualmente a datos estructurados para que
segura de datos para el reuso. las dems entidades y al puedan ser interconectados y
pblico en general. ms tiles. Se basa en
Archivo de tecnologas Web estndar, tales
datos (dataset) Conjunto de datos como HTTP, RDF y los URI, pero
Un conjunto de datos que (Dataset) en vez de utilizarlos para servir
forman una unidad significativa Unidad mnima de informacin pginas web para los lectores
y que habitualmente pueden sujeta a carga, publicacin, humanos, las extiende para
ofrecerse con un fichero. transformacin y descarga en compartir informacin de una
la plataforma. manera que puede ser leda
automticamente por
Bases de datos ordenadores. Esto permite que
federadas (BDF) CSV (Valores sean conectados y consultados
Son vistas unificadas de bases separados por coma) datos de diferentes fuentes.
de datos independientes que Formato abierto y sencillo para
aparentan ser una sola base de representar datos en formato
datos, pero son una coleccin de tabla, en columnas Efecto mosaico
de sistemas de bases de datos separadas por comas (o punto Combinacin de informacin
independientes, cooperativos, y coma, donde la coma es el disponible de bases
heterogneos, que son separador decimal) y las filas anonimizadas que permite la
autnomos y que permiten son saltos de lnea. Los identificacin de los individuos.
compartir todos o algunos de campos que tienen una coma, Es importante evitar este efecto
sus datos. Una BDF aparenta un salto de lnea o una comilla para proteger los datos de las
ser una BD normal y corriente, doble, deben cerrarse entre personas.
pero no tiene existencia fsica, comillas dobles. Las
es una vista lgica. extensiones que se utilizan son
.csv y .txt.

33
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

Entidad PETI o PETIC Reutilizadores de datos


Organismos establecidos por la Plan Estratgico de Aquellas personas que con los
legislacin Colombiana, los Tecnologas de la Informacin Datos Abiertos como materia
cuales tienen la facultad de el cual define la estrategia de TI prima elaboran productos o
definir inventarios de datos y en la entidad para el periodo servicios, pueden ser tales
conjuntos de datos a publicar. correspondiente. En ocasiones como emprendedores,
este plan est incorporado empresas, ONGs, periodistas,
Formatos libres dentro del Plan Estratgico hackers cvicos, o cualquier
Son formatos de archivo que se Institucional. persona que tenga
pueden crear y manipular para conocimientos del tratamiento
cualquier software, libre de Reutilizacin de datos y la manipulacin de los datos.
restricciones legales. Producto que se elabora a
partir de los datos pblicos, URL
Formatos propietarios puede ser una visualizacin, Localizador de recursos
Son formatos de archivo que una aplicacin web, un servicio, uniforme, (sigla en ingls de
requieren herramientas que no un cuadro de mandos, una uniform resource locator), es
son pblicas. knoticia o una informacin, una una secuencia de caracteres,
grfica, un dibujo, una grfica de acuerdo a un formato
dinmica entre otras cosas. modlico y estndar, que se
Metadato usa para nombrar recursos en
Los metadatos son "datos
Internet para su localizacin o
sobre datos" - es decir, los
identificacin. Referencia.
datos que describen los
aspectos bsicos de un
conjunto de datos, por ejemplo,
cundo se cre el conjunto de
datos, cul es la agencia
responsable de la base de
datos, el formato de los datos,
etc.

34
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

ANEXO 1.
Uso de licencias abiertas
Las licencias estndar en el entorno internacional se han constituido en un
elemento de seguridad y de generacin de confianza en el uso de datos
abiertos gubernamentales, ya que estn concebidas como una forma de
proteccin de los derechos de autor y de apoyo al dominio pblico de las
obras protegas por ste, fomentando el acceso a la informacin pblica.

En la actualidad ms de 30 pases, y diferentes organizaciones


internacionales como el Banco Mundial y las Naciones Unidas, hacen uso
de licencias estndar para compartir sus trabajos12, por ello, para el
licenciamiento de los datos abiertos se recomienda usar licencias abiertas
tipo Creative Commons (CC), que proporcionan un conjunto estndar de
trminos y condiciones que los creadores y otros titulares de derechos,
pueden utilizar para compartir obras originales de su autora y cualquier otro
material sujeto a derechos de autor y a derechos conexos que se
especifican en la licencia pblica.

La Licencia Pblica CC tiene una vigencia de aplicacin igual al plazo de


proteccin de los Derechos de Autor y Derechos Conexos, en donde si el
licenciatario incumple las condiciones de la Licencia, stas terminarn
(informacin tomada de la traduccin de la versin 4.0 que actualmente
estn realizando los integrantes de CC Amrica latina, para mayor
informacin consultar: http://co.creativecommons.org/).

12
Para mayor informacin consultar
https://wiki.creativecommons.org/wiki/Government_use_of_Creative_Commons

35
00 INTRODUCCIN 01 DEFINICIN 02 PRINCIPIOS 03 IMPORTANCIA 04 DESARROLLO 05 GLOSARIO

ANEXO 1. Uso de licencias abiertas

De igual manera, con el fin de definir los trminos de uso y condiciones


generales para el uso de los datos publicados en los sitios web, es
importante definir una clusula de licencia abierta dentro de los siguientes
trminos:

Se podr hacer uso, transformacin, distribucin, redistribucin,


reutilizacin, compilacin, extraccin, copia, difusin, modificacin y/o
adaptacin de los datos y de la informacin publicada en este sitio web,
citando siempre la fuente de los datos. La entidad productora de los datos
no ser responsable de la utilizacin que hagan las personas que
transformen y/o usen dichos datos, ni tampoco de los daos sufridos o
prdidas econmicas que, de forma directa o indirecta, produzcan o puedan
producir perjuicios econmicos, materiales o sobre datos y aplicaciones,
provocados por el uso y/o transformacin de los datos. Esta licencia de uso
se rige por la legislacin colombiana, independientemente del entorno
jurdico del usuario, cualquier disputa que llegue a surgir en la interpretacin
de estos trminos se resolver bajo el amparo de la Ley colombiana.

En adicin a lo anterior, tambin se recomienda proteger las bases de datos


a travs de licencias abiertas estndar o Conformant Licenses, entre las
que se encuentran las licencias creative commons attribution 4.0. Este tipo
de licencia permite proteger la estructura de las bases de datos, sus
contenidos y garantizar que los usuarios de los datos atribuyan la titularidad
de sus derechos a los creadores cuando se haga reuso de los mismos.

36

Das könnte Ihnen auch gefallen