GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el...

55
GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA Dirección de Gobierno en línea @República de Colombia – Derechos Reservados Bogotá DC, Octubre de 2014

Transcript of GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el...

Page 1: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA

Dirección de Gobierno en línea @República de Colombia – Derechos Reservados

Bogotá DC, Octubre de 2014

Page 2: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

2

FORMATO PRELIMINAR AL DOCUMENTO

Título: Guía de implementación Datos Abiertos

Fecha elaboración aaaa-mm-dd:

2014-10-15

Sumario:

Palabras Claves: Open Data, Datos Abiertos, guías, normas, estándares.

Formato: Documento Lenguaje: Español

Dependencia: Dirección de Gobierno en Línea

Código: Versión: 1.0 Estado: Final

Categoría: Guía

Autor (es):

Firmas:

Aprobó:

Información Adicional:

Ubicación:

CONTROL DE CAMBIOS

VERSIÓN

FECHA RESPONSABLE DESCRIPCIÓN

1.0 2014-06-15 Creación del documento

Page 3: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

3

TABLA DE CONTENIDO

1 INTRODUCCION ...................................................................................................................... 5 2 OBJETIVOS DE LA GUIA ........................................................................................................ 6 3 APERTURA DE DATOS ........................................................................................................... 7

3.1 ¿Que son Datos Abiertos? ................................................................................................... 7

4 PREPARACION DE LA ENTIDAD ........................................................................................... 8 5 PASOS PARA LA APERTURA DE DATOS .......................................................................... 10

5.1 Paso 1: Registro de información ....................................................................................... 12

5.1.1 ¿Qué se busca con el Registro de Información? ............................................................... 12 5.1.2 Objetivo .............................................................................................................................. 12 5.1.3 Beneficios .......................................................................................................................... 12 5.1.4 ¿Cómo se realiza el Registro de Información? .................................................................. 13 5.1.5 ¿Cómo se realiza la identificación del inventario de información? ..................................... 14

5.2 Paso 2: Índice de Información ........................................................................................... 15

5.2.1 ¿Qué es el Indice de información? ..................................................................................... 15 5.2.2 Objetivo ................................................................................. ¡Error! Marcador no definido. 5.2.3 Beneficios .......................................................................................................................... 15 5.2.4 ¿Cómo realizo el análisis y el Índice de información de acuerdo a los criterios jurídicos? 16 5.2.5 ¿Cómo identifico la información publicable? ...................................................................... 17

5.3 Paso 3: Identificación y priorización de los conjuntos de datos .................................... 19

5.3.1 ¿Qué se busca con la identificación y priorización de los conjuntos de datos? ................. 19 5.3.2 Objetivos ............................................................................................................................ 19 5.3.3 Beneficios .......................................................................................................................... 19 5.3.4 ¿Cómo identifico el inventario de conjuntos de datos? ...................................................... 20 5.3.5 ¿Cuál es el parámetro de priorización de los conjuntos de datos? .................................... 21 5.3.6 ¿Cómo defino los criterios de evaluación y su valoración? ................................................ 21 5.3.7 ¿Cómo priorizar los conjuntos de datos a publicar? .......................................................... 23

5.4 Paso 4: Documentación de los conjuntos de datos ........................................................ 25

5.4.1 ¿Qué se busca con la documentación de los datos? ......................................................... 25 5.4.2 Objetivo .............................................................................................................................. 25 5.4.3 Beneficios .......................................................................................................................... 25 5.4.4 ¿Cómo se identifican los metadatos comunes y específicos de los conjuntos de datos? .. 26 5.4.5 ¿Cómo se aplica la licencia abierta a los datos? ............................................................... 30

Page 4: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

4

5.5 Paso 5: Estructuración, cargue y publicación de los conjuntos de datos .................... 31

5.5.1 ¿Qué se busca con la estructuración, cargue y publicación de los conjuntos de datos? ... 31 5.5.2 Objetivos ............................................................................................................................ 31 5.5.3 Beneficios .......................................................................................................................... 31 5.5.4 ¿Cómo identifico la estructura de los conjuntos de datos a cargar? .................................. 32 5.5.5 ¿Cuáles son los mecanismos de cargue y publicación de los conjuntos de datos? .......... 34 5.5.6 Otros medios de publicación en línea ................................................................................ 38

6 REUTILIZACION, PROMOCION Y USO DE DATOS ABIERTOS ......................................... 38

6.1.1 DATA JAM ......................................................................................................................... 39 6.1.2 DATAPALOOZA ................................................................................................................. 39 6.1.3 MARATÓN DE DESARROLLO ............................................. ¡Error! Marcador no definido. 6.1.4 COMUNIDADES EN LINEA ............................................................................................... 39 6.1.5 BARCAMP ......................................................................................................................... 40 6.1.6 DESCONFERENCIAS ....................................................................................................... 40 6.1.7 MASHUP CAMP ................................................................................................................ 40

7 ANEXOS ................................................................................................................................. 41

7.1.1 ANEXO 1 - Instrumento de la Guía para la Apertura de Datos en Colombia ..................... 41 7.1.2 ANEXO 2 - Ejemplo Paso 1 ............................................................................................... 41 7.1.3 ANEXO 3 - Ejemplo Paso 2 ............................................................................................... 43 7.1.4 ANEXO 4 - Ejemplo Paso 3 ............................................................................................... 45 7.1.5 ANEXO 5 - Ejemplo Paso 4 ............................................................................................... 48 7.1.6 ANEXO 6 - Ejemplo Paso 5 ............................................................................................... 50

8 TERMINOLOGÍA .................................................................................................................... 52

Page 5: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

1 INTRODUCCION La apertura de datos por parte del Gobierno es uno de los facilitadores más potentes para el desarrollo del denominado Open Government (Gobierno Abierto)1 en un país. En Colombia, la Dirección de Gobierno en línea del Ministerio de Tecnologías de la Información y las Comunicaciones ha promovido desde diferentes ámbitos el acceso a la información y la apertura de datos enfocado a tres objetivos principales: 1) Transparencia: Abrir datos de calidad supone: Ejercicios de democracia permanente por parte del gobierno Instrumentos efectivos para el control social

2) Eficiencia: La apertura metodológica de datos de calidad puede conducir a: La racionalización de los procesos administrativos La automatización de la colaboración interadministrativa

3) Innovación y crecimiento económico: La reutilización de los datos por parte del Sector Público impulsa: La creación de nuevos servicios y productos de valor agregado Nuevos negocios y puestos de trabajo

El propósito de esta guía, es contribuir al entendimiento, la apropiación y la ejecución de acciones concretas que permitan a las entidades hacer un mejor aprovechamiento de la información pública y de los datos, a su vez, facilitar la colaboración de terceros que apoyen el desarrollo y provisión de servicios para el beneficio de todos los ciudadanos y el logro de los objetivos mencionados. Se ha estructurado en torno a una serie de etapas y pasos que permiten desarrollar un proceso

progresivo y guiado hasta conseguir la publicación de datos en formato abierto.

1 Podemos entender el Open Government como un Gobierno basado en los principios de transparencia, colaboración y participación.

Un gobierno abierto se caracteriza por:

Promover la rendición de cuentas y facilitando el control social Establecer relaciones de cooperación con los ciudadanos y con todas las organizaciones de la sociedad.

Generar mecanismos para captar las opiniones e ideas de los ciudadanos, implicándolos en la identificación y solución de los problemas sociales y en la construcción colectiva de las políticas.

Page 6: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

6

2 OBJETIVOS DE LA GUIA La presente guía tiene como objetivo ofrecer herramientas prácticas que permitan a las entidades del Estado implementar procesos de apertura de datos en concordancia con la Ley de Transparencia 1712 de 2014, de forma que se logre promover la confianza de los ciudadanos y el desarrollo de servicios de valor agregado por parte de terceros. Para lograr el objetivo la guía establece una serie de etapas que buscan garantizar tres aspectos principales: Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán disponibles para todo tipo de audiencia, no tienen ninguna restricción, y se encuentran en formatos de fácil acceso, con el fin de generar nuevos servicios. Transparencia: Facilitar la alineación de la Entidad con iniciativas de gobierno abierto, en donde la transparencia, colaboración y participación constituyen mecanismos reales para su mejoramiento. Imagen de la Entidad: Mejorar la percepción administrativa y tecnológica de la Entidad a la ciudadanía, a través de los diferentes datos publicados en el portal Web de la Entidad o en la plataforma definida por el Estado Colombiano.

Page 7: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

7

3 APERTURA DE DATOS 3.1 ¿QUE SON DATOS ABIERTOS? Son todos aquellos datos primarios, sin procesar, en formatos estándar, estructurados e interoperables que facilitan su acceso y permiten su reutilización, los cuales están bajo la custodia de las entidades públicas y que pueden ser obtenidos y ofrecidos sin reserva alguna, de forma libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados de los mismos. Es necesario que los datos que se abren se presenten en formatos (XLS, ODF, CSV, XML, ATOM, JSON, TXT, RDF-XML, KML-KMZ, SHP, TMX, ZIP) y que sus contenidos sean estructurados mediante lenguajes procesables por aplicaciones informáticas. Para que un Dato sea considerado abierto es necesario que cumpla con las siguientes principios2: Completos: Todos los datos públicos deben estar disponibles. Los datos públicos son datos no sujetos a limitaciones de privacidad, seguridad o privilegios. Primarios: Los datos deben ser recolectados en la fuente de origen, con el nivel de granularidad más alto posible, no en forma agregada ni modificada. Oportunos: Los datos se pondrán a disposición tan rápido como sea necesario para garantizar el valor de los mismos. Accesibles: Los datos deben estar disponibles para el rango más amplio de usuarios y para el rango más amplio de propósitos. Procesables por máquinas: Los datos deben estar estructurados razonablemente para permitir un procesamiento automático. No discriminatorios: Los datos deben estar disponibles para cualquiera persona, sin requerir un registro. No propietarios: Los datos deben estar disponibles en un formato sobre el cual ninguna entidad tiene un control exclusivo. Libres de licencias: Los datos no deben estar sujetos a ningún derecho de autor, patente, marca registrada o regulaciones de acuerdo de secreto. Se podrán permitir restricciones razonables de privacidad, seguridad o privilegios.

2 Op.cit. “The 8 principles of Open Government Data”: http//www.opengovdata.org/home/8principles

Page 8: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

8

4PREPARACION DE LA ENTIDAD Previo al abordaje de las etapas que permitirán avanzar en la adopción de la iniciativa de Apertura de Datos, se recomienda ejecutar las siguientes actividades de preparación: Identificar el equipo de trabajo. Identificar Herramientas de seguimiento y control Elaborar un plan de trabajo.

¿Cómo puedo identificar mi equipo de trabajo? El abordar la iniciativa de Apertura de Datos implica una serie de acciones de análisis que incluyen aspectos tecnológicos, jurídicos y funcionales. Para adelantar este análisis es indispensable que su entidad conforme y cuente con el apoyo de un grupo de trabajo que lidere y soporte las acciones requeridas para avanzar en la adopción de la temática. En la siguiente gráfica se relacionan los roles que se recomiendan para la conformación del equipo de trabajo y se referencia en qué paso podrá intervenir cada uno.

Ilustración 1 - Equipo de trabajo y actividades necesarias para implementar la apertura de datos NOTA: Los pasos que se describen en la gráfica se detallan en la sección Pasos para la Apertura de Datos Cabe notar que un actor de acuerdo a su perfil, puede desempeñar más de un rol en la apertura de datos. A continuación se describen los aspectos a tener en cuenta para la selección de equipo de trabajo.

Page 9: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

ROL OBJETIVO ACTIVIDADES PERFIL

Funcional Facilitar el acceso a la información de la entidad y analizar los mejores usos de la misma, de manera que se convierta en un activo para la organización.

Identificación de la información. Análisis de información publicable. Priorización de la información.

Personal a cargo de procesos de negocio de la entidad que tiene el conocimiento de los mismos y de la información que se produce.

Técnico Facilitar y orientar el acceso a los sistemas y repositorios de información de la entidad y liderar la publicación de los datos en formatos abiertos.

Priorización de la información. Documentación y estructuración. Cargue y publicación.

Personal técnico, preferiblemente ingenieros de sistemas con conocimientos en estándares abiertos, identificación de información, extracción y manejo de bases de datos. Conocimiento en los requerimientos para la publicación y manejo del portal web de la entidad.

Seguridad Garantizar un manejo adecuado de los riesgos y las políticas de seguridad de la entidad para la protección de la información.

Análisis de la información publicable. Documentación y estructuración. Cargue y publicación.

Personal técnico, preferiblemente ingenieros de sistemas con conocimientos en aseguramiento de la calidad en la información e identificación de riesgos de seguridad.

Jurídico Analizar, asesorar, conceptualizar y orientar sobre los datos que son susceptibles de poner a disposición de cualquier persona, sin que esto implique la vulneración de los derechos fundamentales de los individuos y el incumplimiento de la normatividad, en cuanto a respetar la reserva legal que tienen algunos datos.

Análisis de la normatividad jurídica en cuanto información secreta, de reservada y confidencial para garantizar que los datos se pueden publicar.

Abogado o profesional con conocimientos en el marco jurídico de los proceso de la entidad y en temas relacionados con la transparencia y el acceso a la información pública, y con conocimiento en la reserva legal y protección que tienen algunos datos e información, en virtud de la Ley.

GEL Debe estar presente en la toma de las decisiones en cada uno de los procesos de la apertura de datos en lo concerniente a la entidad con el fin de articular los resultados con la estrategia de Gobierno en línea.El rol también tiene la responsabilidad de coordinar acciones al interior de la entidad.

Identificación de la información. Análisis de información publicable. Priorización de la información. Documentación y estructuración. Cargue y publicación.

CIO o servidor público delegado por la entidad con habilidades en coordinación y dinamización de equipos de trabajo.

¿Qué herramientas puedo utilizar para hacer seguimiento y control? Con el fin de garantizar la implementación exitosa de la iniciativa y realizar los ajustes necesarios durante el curso del proyecto, se debe disponer de mecanismos de monitoreo, presentación y evaluación de reportes. Estas medidas deben registrar el uso de los recursos, el desempeño basado en indicadores, y los resultados deseados y no deseados de la implementación.

Page 10: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

10

Se podrá utilizar la siguiente documentación que permitirá un mayor control y orden en la ejecución de las actividades para la apertura de datos: Planifique las actividades dirigidas a la apertura de datos a través de un Plan de Trabajo. Realice un Informes de seguimiento.

¿Cómo elaboro el plan de trabajo? El plan de trabajo cubre las actividades organizacionales necesarias para la implementación exitosa de la iniciativa. Esto implica establecer de la forma más precisa estimaciones de las tareas de la apertura de datos y determinar los recursos necesarios. Los objetivos del plan de trabajo son los siguientes: Planificar y documentar estimaciones de tiempo y actividades necesarias para la

identificación del inventario de datos. Acordar compromisos para el desarrollo de la fase inicial con todas las personas y áreas

involucradas de la entidad. Organizar todos los recursos que sean necesarios para la apertura de los primeros

conjuntos de datos. Este proceso proporciona una visión clara de las tareas que han de realizarse durante la ejecución del desarrollo del proceso y los recursos necesarios.

5PASOS PARA LA APERTURA DE DATOS Los siguientes pasos presentan un proceso ordenado para avanzar en la iniciativa de Apertura de Datos el cual puede ser desarrollado por cualquier entidad. Se presenta con consejos prácticos sobre la manera de abrir datos de gobierno siguiendo las recomendaciones de mejores prácticas establecidas por la comunidad internacional OGD. Este proceso incluye a su vez una cadena de valor, cuyos componentes se desarrollarán a lo largo del documento, con miras a facilitar un mejor entendimiento de la guía. Los datos están abiertos si cumplen las siguientes dos condiciones: Abiertos legalmente: Ya sea en el dominio público y marcado como tal o licenciado explícitamente de una manera que se permita el uso y reuso comercial y no comercial sin restricciones. Abiertos técnicamente: Disponible en formatos estándares abiertos legibles por máquina, que significa que pueden ser recuperados y procesados por una aplicación informática. El proceso de apertura de datos contempla los siguientes cinco pasos:

Page 11: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

11

Ilustración 2 - Pasos para avanzar en la implementación de la apertura de datos Paso 1: Registro de Información: En esta fase se busca identificar y caracterizar la información y las bases de datos sistematizadas con que cuenta su entidad. Paso 2: Análisis jurídico la información (Índice de Información): En esta fase se clasificar la información y los conjuntos de datos publicables y los que no, de acuerdo con el marco Jurídico establecido. Paso 3: Priorización de los conjuntos de datos: En esta fase se definen aquellos datos con los cuales se implementará el proceso de apertura, de acuerdo con un análisis estratégico y al mapa de ruta definido por Gobierno en línea para la apertura de datos. Al finalizar se obtienen los conjuntos de datos a publicar. Paso 4: Documentación de los conjuntos de datos: En esta fase se describen los datos a publicar, con el fin de hacerlos comprensibles y facilitar su búsqueda y uso. Paso 5: Estructuración, cargue y publicación de los conjuntos de datos: En esta fase se identifican los diferentes procesos de cargue y publicación de los datos en la plataforma tecnológica que permitirá el posterior acceso a los datos abiertos a los ciudadanos y a la sociedad en general.

Page 12: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

12

5.1 PASO 1: REGISTRO DE INFORMACIÓN

5.1.1 ¿Qué se busca con el Registro de Información?

Este paso le permite realizar el levantamiento de la información que administra la entidad y que puede llegar a convertirse en información publicable y en caso que esté estructurada puede iniciar el proceso para su apertura. Para efectos de realizar la identificación de la información que conformará el Registro de Información y de conformidad con lo establecido en la normatividad, se tendrá en cuenta la siguiente definición: Información pública: toda información que un sujeto obligado genere, obtenga, adquiera, o controle en su calidad de tal3.

5.1.2 Objetivo

Reunir toda la información sobre la cual se basan las fases siguientes del proceso de apertura de datos.

5.1.3 Beneficios

Realizar una identificación del inventario de información trae consigo los siguientes beneficios:

3 Ley de Transparencia 1712 de 2014 Artículo 6.

Page 13: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

13

Aumenta el conocimiento que la entidad tiene de sus activos de información. Ofrece elementos que permiten mejorar la comunicación entre la entidad y sus usuarios

consumidores de información. Ayuda a determinar las necesidades de los usuarios eficientemente para que puedan ser

satisfechas cuando soliciten algún tipo de información. Permite aumentar la percepción de confianza que los usuarios pueden tener de la entidad

y del Estado en general. Genera transparencia administrativa que conlleva además la no discriminación entre

empresas y particulares a la hora del acceso a la información.

5.1.4¿Cómo se realiza el Registro de Información?

La entidad debe verificar si dentro del marco de su política de seguridad de la información, ha hecho un trabajo de levantamiento del inventario de activos de información el cual puede ser mapeado con la información susceptible de ser abierta. En el caso en que no se haya realizado dicho inventario, se debe consultar con el Rol de Seguridad propuesto para conocer el estado de avance de la entidad. En todo caso la entidad debe establecer las fuentes de información y el contexto que desea levantar teniendo en cuenta los procesos de la entidad, los cuales pueden ser clasificados de la siguiente manera:

Ilustración 3 - Clasificación de Procesos al interior de la entidad Para cada tipo de proceso, la entidad debe tener en cuenta la información que está siendo generada: Procesos Misionales: En los procesos misionales la entidad debe verificar la información relacionada con los trámites, servicios y procesos que soportan el “día a día” de su trabajo, de acuerdo con sus funciones y competencias. La entidad debe incluir acá la información particular relacionada con los actores involucrados en dichos trámites y servicios así como los sujetos y dominios de negocio soportados.

Page 14: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

14

Procesos Estratégicos: La entidad deberá revisar dentro de su esquema de procesos, aquellos encaminados en la mejora continua y en el cumplimiento de sus objetivos estratégicos, que incluya información por ejemplo relacionada con la prestación de los servicios de la entidad, la atención a los usuarios, etc. Procesos de Apoyo: La entidad debe revisar la información que es generada y que soporta los procesos de apoyo relacionados con la contratación, el recurso humano, la información financiera y contable. Procesos de Evaluación: Se debe revisar la información que soporte la toma de decisiones y los procesos de monitoreo y evaluación dentro de la entidad. Las actividades relacionadas con el levantamiento de información a partir de los procesos, deben ser realizadas por el responsable y conocedor de los mismos dentro de la entidad (Ver Rol Funcional). Para el caso de nuevos procesos, el líder del proceso deberá entregar al grupo de apertura de datos toda la información necesaria para que esta sea integrada al inventario de la entidad y para que se realice el posterior análisis de la misma.

5.1.5¿Cómo se realiza la identificación del inventario o Registro de información?

Para realizar el Registro de Información es necesario que se detallen los siguientes aspectos

Elemento Concepto Nombre del activo de información Nombre de la información que tiene valor para la entidad.

Descripción del activo Describe en qué consiste o cuál es el alcance de la información

Propietario del activo El propietario se refiere a un proceso o área de la entidad que tiene la responsabilidad de controlar la producción, desarrollo, mantenimiento, uso y seguridad del activo de información.

Categorías de información Identificar a cuál categoría hace referencia principalmente la información:

Agricultura: cosechas, explotaciones, utilización de recursos, producción, precios, insumos.

Ambiente: datos meteorológicos, datos hidrográficos, uso de tierras.

Desarrollo Global: información relacionada con el avance en relación objetivos de desarrollo en pobreza, salud, educación y otros aspectos de alcance global.

Ciencia e Investigación: información de ciencia, innovación y tecnología.

Desarrollo económico: estadísticas económicas, tales como las referidas a inflación, desempleo; comercio internacional e interno.

Educación Energía: información relacionada con la producción y consumo

de energía y el desarrollo minero energético. Finanzas: servicios financieros, prestamos, pensiones,

inversiones, seguros. Geografía: mapas, direcciones, fotografías del territorio, datos

geológicos e hidrográficos, datos topográficos.

Page 15: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

15

Gobierno: comunicados de prensa, actas de las administraciones centrales y territoriales.

Industria y manufactura Infraestructura y transporte; vías, congestión vehicular, obras,

desvíos, cámaras en carretera, accidentes. Legal: decisiones legales o administrativas, normas y leyes. Salud: información relacionada a salud. Seguridad y defensa: seguridad ciudadana, criminalidad. Social: demografía, actitudes, salud, enfermedades, datos

censales. Territorial: información específica sobre ciudades y

departamentos. Trabajo y mercado laboral: información relacionada a la fuerza

de trabajo y el mercado laboral.

Idioma o lengua Establece el idioma o lengua en el que se encuentra la información.

Fuente primaria Identifica si la información es el resultado de procesos de consolidación, análisis o transformaciones; o si por el contrario esta no ha sido procesada y puede ser considerada información de fuente primaria.

Frecuencia de generación y actualización

Identifica la frecuencia con que se genera la información en la entidad, o la frecuencia con que la información cambia y es actualizada.

Soporte de información Establece si la información está soportada por un documento físico, por un medio digital o un sistema, o por algún otro tipo de formato audio visual.

La información está estructurada? La información es estructurada, semiestructurada, o no estructurada

Susceptible de estructurar? Si la información está semiestructurada o no estructurada, se identifica si se puede estructurar y por lo tanto quedar disponible para publicar como datos abiertos.

Culminada la descripción de los anteriores aspectos la entidad contará con el Registro de Activos de Información que le permitirá identificar las bases de datos sistematizadas con las que cuenta la entidad, para dar inicio a la apertura de datos. Ver ANEXO 2 Ejemplo Paso 1

5.2 PASO 2: ÍNDICE DE INFORMACIÓN

5.2.1¿Qué es el Índice de información?

Con base en la Ley de Transparencia se establece que el Índice de Información es el análisis de la información publicable o no de acuerdo con su carácter reservado o clasificado

5.2.2 Beneficios

Realizar el análisis de información trae consigo los siguientes beneficios:

Page 16: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

16

Ofrece una clasificación que ayuda a la identificación de niveles de seguridad de la información.

Aumenta el conocimiento de la normatividad que apoya a la administración de la información.

Garantiza la publicación bajo un análisis legal para su libre uso público sin repercusión en la publicación sobre la entidad.

Permite tener la certeza legal sobre la información que se puede publicar.

5.2.3¿Cómo realizo el análisis y el Índice de información de acuerdo a los criterios

jurídicos?

Con base en la Ley de Transparencia 1712 de 2014 se consideran las siguientes definiciones para calificar la información como clasificada o reservada: (ver Ilustración 4):

Información pública clasificada: información cuyo acceso podrá ser rechazado o denegado de manera motivada y por escrito, siempre que el acceso pudiere causar un daño a derechos de personas naturales o jurídicas. Tales derechos son: el derecho a la intimidad; el derecho a la vida, salud o seguridad; secretos comerciales, industriales y profesionales y los secretos estipulados en el parágrafo del artículo 77 de la ley 1474 de 2011 (en relación a proyectos de inversión de empresas industriales y comerciales del Estado y Sociedades de Economía Mixta). La información es pública si la persona natural o jurídica ha consentido en la revelación de sus datos.

Información pública reservada: información cuyo acceso podrá ser rechazado o denegado, siempre que dicho acceso sea prohibido por una norma legal o constitucional. Esta información hace referencia a intereses públicos: defensa y seguridad nacional; seguridad pública; relaciones internacionales; prevención, investigación y persecución de delitos y las faltas disciplinarias; debido proceso y la igualdad de las partes en los procesos judiciales; administración efectiva de la justicia; derechos de la infancia y la adolescencia; estabilidad macroeconómica y financiera del país; salud pública.

Page 17: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

17

Ilustración 4 – Índice de información

5.2.4 ¿Cómo identifico la información publicable?

Para calificar la información como clasificada o reservada se recomienda a la entidad revisar la Ley de Transparencia del 2014 en sus artículos 18, 19, 20, 21 y 22, lo cual corresponde a las definiciones indicadas anteriormente y otras disposiciones. Además, como criterios jurídicos la entidad debe tomar presente en cuenta normas legales, constitucionales y la Ley de Protección de Datos Personales (Ley 1581 de 2012). Nota: Para este segundo paso se tendrá como insumo el archivo adjunto en formato Excel para la apertura de datos que acompaña esta guía, en la pestaña Índice de Información.

Page 18: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

18

En este sentido, los aspectos a tener en cuenta son los siguientes: El Rol Jurídico debe Identificar junto con su equipo jurídico la normativa de la entidad que

regula el Registro de Activos de Información para calificarlos como clasificados o reservados.

Para el correcto diligenciamiento de la plantilla de Índice de Información se deben responder a los diferentes criterios para calificar la información como clasificada o reservada. Para ello responda SI, en el caso que la información corresponda a una de las categorías de información clasificada o reservada, NO en el caso que no corresponda y se pueda ser publicada totalmente y Parcialmente en el caso que la información sea calificada como clasificada o reservada, pero un subconjunto de esta información puede publicarse totalmente. Luego, diligencie la columna de acto o soporte jurídico teniendo en cuenta el ejercicio de calificación realizado. Adicionalmente, considerar indicar si la información clasificada o reservada se puede generalizar o anonimizar4 o resumir para reutilizarlos y publicarlos como datos abiertos.

Tanto la información publicable, como la que no es posible publicar, obedecen a la protección legal que se le da a los datos y a la información. En todos los casos, es necesario que la entidad, antes de entregar o publicar los datos o la información, efectúe la calificación y análisis de la misma, para verificar qué información pueden publicar, y cuál no, conforme a la normatividad vigente.

Tenga en cuenta que este Índice debe estar publicado en el sitio web que la Entidad con su respectiva descripción.

Nota: Las Entidades podrán realizar la publicación del inventario de información, en formatos

como: HTML, Excel, Flash o cualquier tipología que utilice la política de diseño gráfico de su portal. Se debe resaltar en esta sección un vínculo de enlace hacia el portal definido por el Estado Colombiano:

4 Eliminar o sustituir datos relativos a una persona jurídica o natural para eliminar su identidad, o eliminar o resumir datos del evento al cual se refiere la información de tal manera que sea publicable

Page 19: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

19

5.3 PASO 3: IDENTIFICACIÓN Y PRIORIZACIÓN DE LOS CONJUNTOS DE DATOS

5.3.1¿Qué se busca con la identificación y priorización de los conjuntos de datos?

La identificación y priorización de los conjuntos de datos, permite a la entidad definir los primeros conjuntos de datos que de acuerdo a su impacto y dificultad de implementación pueden llegar a ser publicados.

5.3.2 Objetivos

Identificar los conjuntos de datos de acuerdo al resultado del análisis jurídico del inventario de información. Definir los parámetros que van a permitir priorizar los datos a publicar en formato abierto, al igual que establecer el cronograma a corto, mediano y largo plazo, para la publicación.

5.3.3 Beneficios

Realizar la identificación y priorización de los conjuntos de datos trae consigo los siguientes beneficios: Ofrece elementos que permiten tomar decisión sobre cuáles son los conjuntos de datos

que debo enfocar primero mis esfuerzos en el proceso de apertura. Permite a la entidad definir su cronograma a corto mediano y largo plazo en la apertura de

datos.

Page 20: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

20

Identifica el impacto de la apertura de datos sobre el esfuerzo a realizar a nivel de la entidad.

5.3.4 ¿Cómo identifico el inventario de conjuntos de datos?

Para identificar el inventario de conjuntos de datos es necesario que la entidad ejecute las siguientes actividades: Identifique la información Publicable resultado del análisis jurídico al inventario de

información. Una vez se cuente con el listado de información publicable del (inventario) Registro de

información, es necesario que identifique como está estructurada, compuesta o segmentada.

Finalmente culminada la actividad anterior, la entidad podrá tomar esta información como su inventario de conjuntos de datos.

Para orientar la identificación del inventario de conjuntos de datos contaremos con el siguiente ejemplo ilustrativo.

Ilustración 5 - Ejemplo Inventario de conjuntos de datos

En este ejemplo se cuenta con un Inventario de Información donde se parte del hecho que la información Inversión tecnológica año 2012 y Estados financieros, son sujetas de publicación de acuerdo al análisis jurídico realizado por la entidad. Acto seguido la entidad identificará como puede estar segmentada esta información, para lo cual se evidencia que:

Page 21: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

21

Inversión año 2012, se encuentra segmentada por Desarrollo de software, compra de infraestructura y, soporte y Mantenimiento

Estados financieros, se encuentra segmentada por primer trimestre 2012, segundo semestre 2012, tercer trimestre 2012 y cuarto trimestre 2012.

Una vez se identifique la segmentación de la información se procede a conformar el inventario de conjuntos de datos, que no es más que la información segmentada como se evidencia en la gráfica de ejemplo.

5.3.5 ¿Cuál es el parámetro de priorización de los conjuntos de datos?

En el paso de priorización de los datos se puede usar el siguiente parámetro con el fin de identificar los primeros conjuntos de datos a publicar. Parámetro a priori: Esta categoría de parámetros son aplicados a todo el inventario de información y permite definir el cronograma de publicación de los conjuntos de datos. Incluye dos tipos de parámetros a evaluar que deben estar relacionados con el roadmap que define Gobierno en línea: Impacto: Mide la incidencia y los beneficios agregados de cada uno de los elementos del

inventario de información, sobre el ciudadano, sector privado, el Estado, entre otros. Ejemplo: La necesidad demandada de información a través de un número mayor de ciudadanos, puede generar mayor impacto; de manera similar, los datos que muestran situaciones a nivel de todo el territorio nacional pueden tener mayor impacto ya que abarca un mayor foco de interés.

Dificultad de implantación: Permite evaluar el grado de facilidad para el proceso de apertura de datos. Ejemplo: Si no se requiere hacer desarrollos para la extracción de los datos, no tiene dificultad o es mínima, mientras que si se requiere diseñar y estructurar nuevos procesos de extracción y depuración de la información habrá mayor dificultad.

5.3.6¿Cómo defino los criterios de evaluación y su valoración?

Los criterios de evaluación se definen de acuerdo a los parámetros a priori, cada parámetro puede tener varios criterios y a cada uno de ellos se les debe asignar una puntuación, dependiendo del número de criterios. Por ejemplo, si se identifican 4 criterios de “impacto”, entonces al criterio más importante se le asigna 4 puntos y al menos importante 1 punto. A continuación se presentan los criterios a evaluar para cada uno de los parámetros:

Page 22: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

22

Ilustración 6 - Criterios de Evaluación

Siguiendo con este ejemplo y con base en la gráfica anterior, a continuación se detalla el ejercicio de priorización:

Parámetros de Impacto

Criterio Escala Peso Descripción Calificación

Información que contribuye al crecimiento económico. 1-4 0,25

Aumentar la productividad de los diferentes sectores productivos del país.

uye al Sector en su crecimiento.

ampliamente al sector en su crecimiento.

Información que puede generar negocio de inmediato. 1-4 0,25

Genera nuevos modelos de negocio que pueden surgir a partir de la publicación del catálogo de datos generados.

el valor agregado.

Área de impacto. 1-4 0,25 Destino del beneficio de la apertura de datos.

tor

Privado.

Demanda de los datos. 1-4 0,25

Impacta en calidad de vida de los ciudadanos.

demanda de información.

la ciudadanía a través de la solicitud de peticiones o servicios.

desarrolladores.

Consultas propias de la entidad.

Page 23: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

23

Parámetros de Dificultad

Criterio Escala Peso Descripción Calificación

Esfuerzo requerido para publicar.

1-4 0,33 Dificultad a nivel de los procesos internos de la entidad para desarrollar la publicación por el equipo de sistemas.

desarrollo, se tienen las herramientas para extraer la información de las bases de datos.

uiere desarrollo (Construcción de ETL, BI, entre otros).

Fuente de datos. 1-4 0,33 Dificultad en los sistemas de información para la extracción de la información, debido a su funcionalidad operativa.

servidor con una base de datos de reportes e históricos.

servidor con una base de datos de transacciones diaria.

Calidad de la información.

1-4 0,33 Estado de la información para la publicación de los datos.

certificada. a calidad.

procesos de calidad de la información.

5.3.7¿Cómo priorizar los conjuntos de datos a publicar?

Para definir los conjuntos de datos a publicar se sugiere hacer uso del ANEXO 1 - Priorización de los datos, la cual es una herramienta que permite realizar el cálculo total de los criterios de evaluación para cada parámetro a priori (Impacto y Dificultad de implantación) y de esta forma obtener una valoración de cada conjunto de datos. Así mismo, una vez establecido la hoja de ruta de Gobierno en línea debe incorporarse sus especificaciones en la priorización de la información a abrir y publicar. A continuación se muestra un ejemplo del cálculo total de los criterios de evaluación:

Page 24: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

24

Ilustración 7 - Cálculo total de los criterios de evaluación Una vez obtenida la valoración de los conjuntos de datos estos son representados en la Matriz de Priorización, la cual toma como insumos el roadmap de gobierno en línea y muestra los parámetros de impacto y de dificultad de implementación, se debe agrupar dentro de los siguientes cuadrantes: Victoria Temprana (VT): En él se ubican aquellos datos cuya publicación tenga un gran impacto y una dificultad de implantación relativamente baja, con lo que la publicación se podrán implementar en el corto plazo. Medio Plazo (MP): Este cuadrante representa los datos que, debido a su alta dificultad de implantación y su alto o medio impacto, se deben implementar en el mediano plazo. Largo plazo (LP): En este cuadrante se ubican aquellos datos que tengan un bajo impacto y baja dificultad de implantación. No aporta valor (NV): En este cuadrante se ubican aquellos datos que por su escaso impacto y su elevada dificultad de implementación, se considera que no aportarían gran valor. A continuación se ejemplifica el resultado de valoración de los conjuntos de datos en la Matriz de Priorización.

Ilustración 8 - Matriz de priorización

Una vez priorizados todos los datos y definidos cuáles de ellos quedan agrupados dentro de los cuadrantes Victoria Temprana, Medio Plazo, Largo Plazo o No aporta Valor, el siguiente paso debe reflejar dicha priorización en un cronograma de publicación que determine en qué momento se debe realizar la publicación de los datos. Para ello identifique el orden de los conjuntos de datos empezando por los cuadrantes VT, seguido por MP, LP y finalmente NV.

Page 25: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

25

Ver ANEXO 4 – Ejemplo Paso 3

5.4PASO 4: DOCUMENTACIÓN DE LOS CONJUNTOS DE DATOS

5.4.1¿Qué se busca con la documentación de los datos?

La documentación de los datos permite a la entidad detallar los metadatos (común y específica) y los formatos en los cuales se publicarán los conjuntos de datos priorizados.

5.4.2Objetivo

Describir los datos identificados en la priorización de manera que sea comprensible para todos los usuarios.

5.4.3Beneficios

Realizar una documentación de los conjuntos de datos trae consigo los siguientes beneficios:

Permite entender a cualquier lector el contenido de los datos. Permite a la entidad saber las características y la ubicación de sus datos.

Page 26: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

26

Identifica al conjunto de datos para que pueda destacarse más fácilmente en las búsquedas en el Catálogo de datos del Estado Colombiano.

5.4.4¿Cómo se identifican los metadatos comunes y específicos de los conjuntos de

datos?

Un metadato no es más que un dato estructurado sobre la información, o sea, información sobre información, o de forma más simple, datos sobre datos. Otras definiciones los establecen como “descripciones estructuradas y opcionales que están disponibles de forma pública para ayudar a localizar objetos”, o como “datos estructurados y codificados que describen características de instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias descritas”. El objetivo básico de las etiquetas de documentación es aportar al catálogo de datos los metadatos asociados al propietario de los datos (entidad) y que posiblemente no se encuentra en el contenido de los datos; todo en beneficio de las búsquedas en el Catálogo de Datos. Ejemplo: Un contenido puede estar destinado a ciudadanos, siendo este un criterio que aporta la entidad (subjetivo) ya que puede que no se mencione la palabra “ciudadano” en dicho contenido. En este caso, el autor catalogará el contenido con la etiqueta “ciudadano” del eje “destinatarios”. Bajo estas condiciones, la función que caracteriza a los metadatos es la de localizar, identificar y describir recursos, legibles e interpretables por máquina. A continuación se describen los objetivos de la catalogación de los metadatos para la publicación de información del sector público.

Ilustración 9 - Objetivos de la catalogación los metadatos Interoperabilidad con otros conjuntos de metadatos: Permite la interacción entre los mismos y permite las búsquedas indexadas de los mismos.

Page 27: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

27

Extensibilidad: El diseño de conjuntos de metadatos debe ser capaz de incluir un núcleo central con conceptos básicos comunes al que se puedan sumar posteriormente (sin destruir la lógica del conjunto) elementos que cumplan necesidades descriptivas más específicas. La idea es que una aplicación que reconozca los metadatos básicos sea capaz de utilizarlos sin perder demasiada interoperabilidad. Modularidad: Permite combinaciones sintácticas (a nivel de lo que se busca literalmente) y semánticas (a nivel del significado de lo que se busca) con otros metadatos. Principio de utilidad: Se han identificado tres aspectos claves desde el punto de vista de la utilidad de las descripciones. La descripción de un activo de información cualquiera debe cumplir con tres requisitos:

Permitir el descubrimiento de activos de información: Esto implica la capacidad de utilizar mecanismos de búsqueda de activos de información, así como estructuras de navegación categorizada (directorios y listados).

Permitir la identificación y en menor medida la localización directa, de los activos de información.

Valoración de los recursos. Desde el punto de vista de la puesta a disposición de los recursos informativos, proporcionar al responsable de reutilizar la información la capacidad de valorar la pertinencia de un determinado activo es clave si se persigue hacerlo de manera “adecuada”.

Principio de simplicidad: La simplicidad debe perseguirse tanto de cara al proceso de descripción de activos de información que tendrá lugar en el ámbito de los generadores de información publicable, como en el proceso de recuperación e interacción con las descripciones que deberá afrontar el ciudadano. Desde el punto de vista de la descripción de la información es fundamental no establecer la obligatoriedad de campos descriptivos para los que frecuentemente no se posee una información completa. En el mismo sentido, el establecimiento de varios niveles descriptivos ayuda a la interoperabilidad con el resto de los datos cuando una descripción muy detallada no sea posible.

Estructura de metadatos

Cada metadato está compuesto por una serie de elementos que buscan dar respuesta clara a los siguientes interrogantes: ¿Quién?: Descripción de los protagonistas objeto de los conjuntos de datos. ¿Qué?: La descripción del contenido de los conjuntos de datos. ¿Cuándo?: La descripción de las variables de tiempo asociadas a los conjuntos de datos. ¿Dónde?: Las referencias de localización de los datos. ¿Por que?: La motivación para abrir dichos datos. ¿Cómo?: El procedimiento para la descarga de los datos.

Page 28: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

28

Adicionalmente se deben tener en cuenta elementos en el contexto de la Administración Pública como los siguientes: Referencias Institucionales: Referencias de autores o de las instituciones objeto o

protagonistas de los datos. Organismos productores: Entidades que suministran los datos. Localización: El lugar y modo de acceso a los datos, vínculos, protocolos de acceso

(FTP, SFTP) entre otros. Accesibilidad: La durabilidad y conservación temporal de los datos. Referencias Normativas: Las referencias de tipo legal que puedan desprenderse o sobre

las que estén basada

Para la iniciativa de Apertura de Datos estos elementos se agrupan en dos tipos de metadatos:

Metadatos comunes: Aquellos que tienen todos los contenidos, independientemente de su naturaleza. Por ejemplo, todas los documentos, eventos, informaciones, ayudas, etc. tienen asociado un nombre, una descripción, una tipología y en general una serie de metadatos comunes. Metadatos específicos: Aquellos propios del contenido en función de su naturaleza (tipología de contenido). Ejemplo: Las publicaciones tienen unos metadatos particulares como la fecha de la publicación del titular. Los procedimientos administrativos, a su vez, tienen unos metadatos particulares como el objeto, el estado de vigencia o el lugar de presentación.

A continuación se define la estructura y descripción de los Metadatos comunes y específicos:

Tipología Metadato Descripción Tipos de datos

Metadatos comúnes.

Título Nombre concreto del conjunto de datos. Texto.

Identificador Identificador único del conjunto de datos en la base de datos.

Texto (URI), numérico (ISBN, DOI, número local).

Descripción Descripción/resumen del conjunto de datos.

Texto.

Categoría Nombre(s) de categoría(s) o grupo(s) al cual pertenece el conjunto de datos.

Texto/lista de texto.

Autor Entidad y dependencia que origina el conjunto de datos.

Texto.

Idioma Idioma de los datos del conjunto de datos. Texto.

Audiencia Audiencia objetivo del conjunto de datos. Texto.

Palabras clave Palabras clave para la ser identificados en la búsqueda.

Texto separado por comas.

Ámbito Geográfico Identifica la catalogación de la información a nivel: Nacional, Departamental, Municipal, Distrital.

Texto/lista de texto.

Metadatos Fecha Publicación Fecha de la carga del conjunto de datos Fecha (AAAA-

Page 29: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

29

especificos. en el catálogo de datos. MM_DD)

Fecha Última Actualización

Fecha de última actualización del conjunto de datos en el catálogo de datos.

Fecha (AAAA- MM_DD).

Frecuencia Actualización

Frecuencia con la que se actualizan los datos del conjunto de datos en el catálogo de datos.

Texto.

Fecha Inicio Fecha desde la cual se tienen en cuenta datos para el conjunto de datos.

Fecha (AAAA- MM_DD)

Fecha Fin Fecha hasta la cual se tienen en cuenta datos para el conjunto de datos.

Fecha (AAAA- MM_DD).

Número de Versión

Número de la última versión del conjunto de datos en el catálogo de datos.

Texto/numérico.

URL Descarga URL en el que el conjunto de datos puede ser descargado.

Texto.

Formato Descarga Formatos en los que se encuentra disponible el conjunto de datos.

Texto/lista de texto.

Tamaño Descarga Tamaño del conjunto de datos en Kb. Numérico.

URL Esquema URL de acceso al esquema, diccionario de datos o descripción de los datos y la estructura del conjunto de datos.

Texto

URL Documentación

URL a documentación adicional sobre el conjunto de datos.

Numérico.

URL Programa URL a sitio web de la entidad que describe los programas o aplicaciones (hechos o por hacer) relacionados con el conjunto de datos.

Texto

Etiquetas Palabras clave del contenido del conjunto de datos.

Lista de texto

Licencia Tipo de licencia. Texto

URL Licencia URL de enlace a la descripción y detalles de la licencia.

Texto

Nombre Responsable

Nombre de la persona que administra el conjunto de datos.

Texto

Email Responsable

Email de la persona que administra el conjunto de datos.

Texto

Cobertura de conjunto de datos*

Delimitador de coordenadas según la NTC 4611.

Numérico

Metadatos adicionales*

Describir metadatos adicionales según la NTC 4611.

Texto

* Estos metadatos se deben adicionar a los Metadatos específicos si es un inventario geográfico. Sugerencia: Para la documentación de los conjuntos de datos se recomienda a la entidad hacer uso del Anexo 1: Instrumento de la Guía para la Apertura de Datos en Colombia y diligenciar la sección Descripción de metadatos.

Page 30: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

30

5.4.5¿Cómo se aplica la licencia abierta a los datos?

En Colombia existen los derechos de propiedad intelectual en la publicación de los datos, protegiendo que terceros los usen o reutilicen sin permiso manifiesto. La entidad debe declarar explícitamente, para renunciar a esta protección, que se acoge a un tipo de licencia. El procedimiento a seguir para disponibilizar o liberar los datos es aplicar una licencia abierta a los mismos. Las licencias a utilizar deben estar orientadas y adecuadas al uso y reuso de los datos abiertos si se desea que los datos sean de dominio público. Open Data Commons http://opendatacommons.org/ reúne un conjunto de instrumentos legales que ayudan a proporcionar y utilizar los datos abiertos. Los tipos de licencia que se pueden aplicar a los datos abiertos incluyen:

-Public Domain Dedication and License (PDDL) — “Public Domain for data/databases” -Attribution License (ODC-By) — “Attribution for data/databases” -Open Database License (ODC-ODbL) — “Attribution Share-Alike for data/databases”

Open Data Commons promueve la aplicación dos tipos de licencias personalizadas para datos abiertos:

Dominio Público: Aplicar la Public Domain Dedication and License

Exponer material en “Dominio Público”

Share-Alike (plus Attribution): Aplicar la Open Database License

Como GPL (o CC Attribution Share-Alike) requiere reuso público de datos para compartir

cambios de fondo (y atributos).

Para aplicar la licencia se debe añadir una sentencia a los datos como la siguiente (o colocarlo en la página donde está disponible): Public Domain Dedication and License This {DATA(BASE)-NAME} is made available under the Public Domain Dedication and License version v1.0 whose full text can be found at http://opendatacommons.org/licenses/pddl/ Open Database License This {DATA(BASE)-NAME} is made available under Open Database License whose full text can be found at http://opendatacommons.org/licenses/odbl/. Any rights in individual contents of the database are licensed under the Database Contents License whose text can be found http://opendatacommons.org/licenses/dbcl/

Page 31: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

31

Ver ANEXO 5 – Ejemplo Paso 4 5.5PASO 5: ESTRUCTURACIÓN, CARGUE Y PUBLICACIÓN DE LOS CONJUNTOS DE

DATOS

5.5.1¿Qué se busca con la estructuración, cargue y publicación de los conjuntos de datos?

Las Entidades serán las encargadas de organizar la estructura de los conjuntos de datos abiertos, con los formatos y lineamientos recomendados.

5.5.2Objetivos

Establecer la estructura de los conjuntos de datos. Definir los lineamientos para el cargue y publicación de los conjuntos de datos

identificados en la etapa de priorización.

5.5.3Beneficios

Ofrece mecanismos fáciles para la publicación de los conjuntos de datos. Permite identificar los conjuntos de datos generados por la Entidad. Permite tener la certeza legal sobre la información que se puede publicar.

Page 32: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

32

5.5.4¿Cómo identifico la estructura de los conjuntos de datos a cargar?

Esta actividad consiste en la preparación del archivo con el conjunto de datos a cargar en un formato estructurado. Para realizar dicha estructuración la entidad deberá tener en cuenta las siguientes actividades: Elegir el formato para la publicación de los datos: La entidad tendrá la autonomía para elegir el formato más adecuado para la publicación de sus datos. Lo anterior bajo criterios de menor esfuerzo y costo pero sin afectar la calidad de la información. Los formatos para la publicación de los conjuntos de datos se agrupan en tres tipos [1]:

Formatos propietarios: Son formatos de archivo que requieren herramientas licenciadas para acceder, visualizar o editar los datos que no son públicas.

Formatos libres: Son formatos de archivo que se pueden crear y manipular para cualquier software, libre de restricciones legales.

Sistemas de acceso: Lenguajes para consultar archivos.

Ilustración 10 - Formatos de apertura de datos A continuación se presentan ejemplos de cada uno de los tipos de formatos para la publicación de la información:

Page 33: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

33

Ilustración 11 - Ejemplos de formatos de conjuntos de datos La definición de cada uno de los formatos de la anterior gráfica se puede encontrar en la sección de Terminología. Estructuración del conjunto de datos: Para la estructuración es necesario que la entidad ejecute las siguientes actividades:

Diligenciar el encabezado para cada uno de los conjunto de datos y además se recomienda haber diligenciado la sección Descripción de Metadatos para su categorización y perfilamiento descrita en el Anexo 1: Instrumento de la Guía para la Apertura de Datos en Colombia A continuación se describen lo campos del Encabezado del conjunto de datos:

Nombre del campo: Este campo se debe diligenciar en mayúsculas y no se deben utilizar caracteres especiales, en caso de ser requerido un concatenador se debe utilizar el carácter línea baja (_) y su longitud es de máximo 20 caracteres.

Tipo de dato: Comprende los tipos Alfanumérico, Fecha y Numérico.

Alfanumérico: Los datos deberán cumplir el estándar unicode UTF-16 [2].

Fecha: Se deberán diligenciar con el formato DD-MM-AAAA. Si incluye hora, ésta deberá ser HH:mm:ss.

Numérico: Los valores de campos numéricos con fracciones deberán diligenciarse con . (punto) como separador de decimales.

Longitud: Esto es definido por la Entidad.

Acepta nulo: Si el campo pude ir vacío.

Formato: Es necesario que se defina el formato en que se expondrá el conjunto de datos, para esto se recomienda tener en cuenta lo descrito en el numeral 1 Elegir el formato para la publicación de los datos de esta sección.

Page 34: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

34

Descripción del campo: Breve descripción del contenido del campo.

Generación de archivo estructurado: Luego del diligenciamiento del encabezado de los datos, la entidad identifica y ejecuta el mecanismo más adecuado para la generación del archivo con los datos estructurados. NOTA: Este archivo debe estar estructurado con el mismo orden definido en el numeral 2

(Diligenciamiento del encabezado del archivo a cargar.). Los campos deben ir separados por comas y el contenido delimitado con comillas dobles: Ej."VALOR1","VALOR2","VALOR3","VALOR4". A continuación se plantean unas posibles alternativas para esta actividad:

Utilizar el administrador de la base de datos: Los datos almacenados en una base de datos son consultados a través de una funcionalidad de búsqueda (o consultas) y la generación de reportes.

Programación de un script para la extracción de datos: Consiste en el desarrollo de un programa para la extracción de la información requerida, la entidad podrá utilizar los frameworks y lenguajes de programación que considere (teniendo en cuenta la plataforma tecnológica que tenga).

Exportar a partir de un sistema de información: Generación de reportes estructurados sobre algún sistema de información existente en la Entidad.

Nota: Si dentro de la estructuración de los campos a cargar no se encuentra alguno relacionado con el Lenguaje Común de Intercambio de Información, se deberá seguir con el proceso de carga de la información e iniciar el procedimiento de estandarización e incorporación de campos al Lenguaje Común de Intercambio de Información, descrito en la Guía de uso del Lenguaje común de intercambio de información.

5.5.5¿Cuáles son los mecanismos de cargue y publicación de los conjuntos de datos?

Para el cargue y publicación de conjuntos de datos abiertos se han definido cuatro mecanismos. Dichos mecanismos podrán ser utilizados según el criterio de la Entidad, de acuerdo con la madurez tecnológica de la misma y las características de los datos a publicar. La herramienta principal para la oferta de datos abiertos será el portal Web (www.datos.gov.co), que contará con un catálogo de datos y centralizará el registro y búsqueda de todos los datos abiertos de las Entidades públicas del país, en la cual se encuentran definidos unos Términos de uso, que incorpora los principales aspectos legales a tener en cuenta al realizar la publicación de los conjuntos de datos, este contiene las condiciones generales que regulan el acceso y el uso del sitio Web, del que es titular el Ministerio de Tecnologías de la Información y las Comunicaciones -MINTIC.

Page 35: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

35

Ilustración 12 - Mecanismos de publicación de datos A continuación se detallan los cuatro mecanismos de cargue y publicación de los conjuntos de datos:

Carga de archivo de conjunto de datos

Ilustración 13 - Mecanismo - Carga de archivo de conjunto de datos

Descripción: La entidad carga el conjunto de datos al Catálogo de Datos

(www.datos.gov.co) y realiza la documentación del mismo manualmente. Criterios de utilización: Información con frecuencia de actualización anual o semestral.

La Entidad asume la responsabilidad de la actualización de los conjuntos de datos. Criterios tecnológicos: La entidad podrá utilizar este mecanismo cuando considere que

no cuenta con un servidor Web que soporte y aloje los datos a cargar. Así mismo la Entidad debe contar como mínimo con conexión a internet que permita el acceso a www.datos.gov.co o al portal de datos abiertos que la entidad desee.

Page 36: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

36

Referencia de archivo de conjuntos de datos

Ilustración 14 - Mecanismo – Referencia de archivo de conjuntos de datos

Descripción: La entidad carga el conjunto de datos en una URL pública, manual o automáticamente. Se crea una referencia a la URL en el Catálogo de Datos (www.datos.gov.co).

Criterios de utilización: Información con frecuencia de actualización anual o semestral. Si la carga es automática puede tener una mayor frecuencia. La Entidad asume la responsabilidad del alojamiento y la actualización del conjunto de datos.

Criterios tecnológicos: La entidad puede utilizar este mecanismo cuando cuenta con un servidor Web que soporte y aloje los datos a cargar. En este caso la entidad debe contar como mínimo con conexión a internet que permita el acceso a www.datos.gov.co o al portal de datos abiertos que la entidad desee y el servidor Web mencionado con salida a internet.

Transferencia de datos

Ilustración 15 - Mecanismo – Transferencia de datos

Page 37: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

37

Descripción: Se realiza una transferencia automática del archivo de conjunto de datos a un repositorio central para su publicación.

Criterios de utilización: Información con frecuencia de actualización semanal o diaria. Se cuenta con el conocimiento y la tecnología para realizar desarrollos a medida que permitan la transferencia de los mismos. La Entidad asume la responsabilidad del alojamiento y la actualización del conjunto de datos.

Criterios tecnológicos: La entidad puede utilizar este mecanismo cuando cuenta con el conocimiento para realizar desarrollo de software que permita la transferencia automática de los conjuntos de datos. En este caso la entidad debe contar como mínimo con conexión a internet que permita el acceso a www.datos.gov.co o al portal de datos abiertos que la entidad desee, y además debe disponer de las herramientas automáticas para la generación de los archivos de los conjuntos de datos y la transferencia automática de los mismos.

Servicio de información en línea

Ilustración 16 - Mecanismo – Servicio de información en línea

Descripción: La entidad realiza el desarrollo de un servicio de consulta de la información en línea y referencia el mismo por medio de una URL en el Catálogo de Datos (www.datos.gov.co).

Criterios de utilización: Información con frecuencia de actualización diaria o menor. La entidad asume la responsabilidad de la disponibilidad del servicio publicado.

Criterios tecnológicos: La entidad puede utilizar este mecanismo cuando considera que la transferencia de archivos puede ser muy lenta y además cuenta con un servidor Web que garantice la disponibilidad del servicio publicado. En este caso la entidad debe contar como mínimo con conexión a internet que permita el acceso a www.datos.gov.co o al portal de datos abiertos que la entidad desee y el servidor Web mencionado con salida a internet.

Page 38: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

38

5.5.6Otros medios de publicación en línea

Portales institucionales A través de los sitios web de las entidades públicas se cargan y disponibilizan los conjuntos de datos para que sean descargados por los usuarios. Uno de los retos asumidos con este enfoque es la dificultad para que un tercero pueda encontrar información actualizada, sobre todo cuando existe un gran volumen de datos para su descarga. Sitios de terceros Muchos repositorios se han convertido en centros de datos especializados en temáticas particulares. Por ejemplo, www.datamarket.com permite a las entidades públicas y privadas almacenar grandes cantidades de conjuntos de datos. Los sitios de terceros pueden ser muy útiles. La razón principal es la creación de comunidades con personas interesadas en varios conjuntos de datos. El uso de un servicio en línea de un tercero podría ser la mejor solución para que las entidades pequeñas que carecen de recursos e infraestructura puedan configurar y ejecutar sus propios sistemas. Via FTP Un método menos favorable para proporcionar el acceso a los archivos es a través del Protocolo de Transferencia de Archivos (FTP). Esto puede ser conveniente para una audiencia técnica, como desarrolladores de software y científicos. El sistema FTP funciona en lugar de HTTP, pero está diseñado específicamente para soportar la transferencia de archivos. Como API Los datos pueden ser publicados a través de una Interfaz de Programación de Aplicaciones (API). Estas interfaces permiten a los programadores seleccionar conjuntos específicos de datos, en vez del archivo de datos completos. Las APIs suelen estar conectadas a bases de datos que se actualizan en tiempo real. Esto significa que la información disponible a través de una API este actualizada. Ver ANEXO 6 – Ejemplo Paso 5

6REUTILIZACION, PROMOCION Y USO DE DATOS ABIERTOS

Page 39: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

39

En esta sección se presentan las actividades comúnmente desarrolladas como parte de la iniciativa de datos abiertos para promover su uso, estas incluyen: conferencias de Datos Abiertos de Gobierno, cursos virtuales, desconferencias, talleres y hackatones. Estas actividades suelen ser organizadas por las entidades públicas o comunidades interesadas a partir de datos que han sido publicados proactivamente por las entidades o hayan sido obtenidos mediante solicitudes o peticiones de información.

6.1.1DATA JAM

Es un evento de ideación por un día con desarrolladores, diseñadores y expertos temáticos concentrados en una temática con los conjuntos de datos abiertos relacionados. Objetivo: Conectar comunidades de tecnologías y de política y generar compromisos para desarrollar soluciones con datos abiertos, con el apoyo de la misión y las prioridades de la entidad.

6.1.2DATAPALOOZA

Una celebración abierta, demo day, y una plataforma para anunciar la exposición o las mejoras de datos abiertos del gobierno. Objetivo: Celebrar la implementación de herramientas de datos abiertos, entidades y compromisos y construir ideas para proyectos.

6.1.3 MARATON DE DESARROLLO

Un evento donde desarrolladores, diseñadores y colaboradores trabajan en equipos para resolver problemas con software para soluciones web y móviles y presentan un prototipo al final de la jornada. Ejemplo: Agrotón, Colombia APPcesible, APPuesta Social. Objetivo: Establecer relaciones con la comunidad de desarrolladores y enseñar herramientas y prototipos en corto tiempo.

6.1.4COMUNIDADES EN LINEA

Un sitio web, grupo de redes sociales y/o listas de distribución de correo electrónico donde los interesados en el uso de datos abiertos convergen para ofrecer retroalimentación, consejos, nuevos usos o reutilizaciones, peticiones de datos o estudios de caso. Ejemplos: Comunidades de datos.

Page 40: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

40

Objetivo: Construir y mantener relaciones permanentes con los medios de comunicación, organizaciones no lucrativas, buenos defensores del gobierno y tecnólogos cívicos.

6.1.5BARCAMP

Es una red internacional de "desconferencias" (eventos abiertos y participativos), cuyo contenido es provisto por los participantes. Se enfocan en aplicaciones web en estadios tempranos, tecnologías de código abierto y protocolos sociales. Sin embargo, este tipo de encuentros han ampliado su temática y actualmente incluyen eventos participativos y abiertos alrededor de temas sociales, artísticos, educativos... con fuertes componentes creativos e innovadores en los respectivos ámbitos.

6.1.6DESCONFERENCIAS

Una desconferencia, también llamado No-Congreso, es una conferencia en la que los propios participantes y asistentes toman un papel más participativo y activo. El término ha sido aplicado, ya sea total o parcialmente, a un amplio rango de tipos de reuniones en las que se intenta evitar uno o más aspectos de una conferencia convencional, como pueden ser las charlas de larga duración, los precios de entrada desproporcionados o las presentaciones comerciales.

6.1.7MASHUP CAMP

Campamento donde un grupo de desarrolladores, habilitadores de mashup, y observadores se reúnen para compartir ideas y mostrar demos de aplicaciones web que se mezclan juntos desde sitios y servicios web.

Page 41: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

41

7ANEXOS

7.1.1ANEXO 1 - Instrumento de la Guía para la Apertura de Datos en Colombia

7.1.2ANEXO 2 - Ejemplo Paso 1

NOTA: Se recomienda que para una mayor comprensión e interpretación del presente ejemplo los usuarios deben haber realizado la lectura de:

Guía de apertura de datos

Caso práctico Teniendo en cuenta la contextualización del Caso práctico, se procede a llevar a cabo la ejemplificación detallada para la temática de Apertura de Datos.

Ilustración 17 - Identificación del inventario de información La Oficina de Registro de Instrumentos Públicos por medio de su Rol Funcional indaga si dentro del marco de su política de seguridad de la información, se ha realizado un trabajo de

Page 42: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

42

levantamiento del inventario de activos de información, y evidencia que No se cuenta con este, por tanto procede identificar las fuentes de información de acuerdo a los procesos que maneja la entidad, resultado de esta labor el Rol Funcional identifica el inventario de información de la entidad en el cual se define que se trabajará con la información de Tradición y libertad del bien inmueble, paso seguido se realiza la descripción del inventario en la Planilla para la identificación del inventario de información donde se describe el detalle de la información a trabajar como se muestra en la siguiente gráfica.

Ilustración 18 - Planilla para la identificación del inventario de información

Page 43: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

43

7.1.3ANEXO 3 - Ejemplo Paso 2

Ilustración 19 - Análisis jurídico del inventario de información

Con el inventario de información identificado en el Ejemplo del PASO 1, los roles jurídico y de seguridad proceden a identificar la normatividad interna que regula la información de Tradición y libertad del bien inmueble, posteriormente se diligencia la Plantilla para el análisis jurídico del inventario de información respondiendo los diferentes criterios de información Secreta, Restringida o confidencial del Método de separación, para que finalmente la plantilla clasifique la información en Publicable y No publicable como se muestra en la siguiente gráfica.

Page 44: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

44

Ilustración 20 - Plantilla para el análisis jurídico del inventario de información

Con la información publicable identificada se procede a realizar la publicación del inventario de información en su sitio Web, en la sección denominada Atención a la ciudadanía.

Page 45: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

45

7.1.4ANEXO 4 - Ejemplo Paso 3

Ilustración 21 - Identificación del inventario de datos de la entidad Teniendo la información Tradición y libertad del bien inmueble clasificada como Publicable del Ejemplo del PASO 2, los roles Funcional y Técnico realizan el análisis de información e identifican que la información se encuentra segmentada por:

Page 46: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

46

Predios Embargados

Titulares de derecho real de dominio

Compraventas de bien inmueble de los últimos 5 años

Predios Hipotecados Lo cual permite definir que el inventario de datos estará conformado por la segmentación de la información que será equivalente a los conjuntos de datos. El inventario de datos se documenta en la Plantilla para la identificación del inventario de datos de la entidad, como se muestra en la siguiente gráfica.

Ilustración 22 - Plantilla para la identificación del inventario de datos de la entidad Paso seguido los roles Funcional y Técnico realizan el ejercicio de priorización de los conjuntos de datos de acuerdo a los criterios de Impacto y Dificultad de implementación, para esto es necesario diligenciar la Plantilla para la priorización de los conjuntos de datos la cual realiza automáticamente la ponderación de los anteriores criterios que servirán de insumo a la Matriz de priorización, como se muestra a continuación:

Page 47: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

47

Ilustración 23 - Plantilla para la priorización de los conjuntos de datos Finalmente se genera la Matriz de priorización, la cual gráfica y agrupa los conjuntos de datos dentro de los cuadrantes de Victoria Temprana (VT), Medio Plazo (MP), Largo plazo (LP) y No aporta valor (NV), indicando a los roles Funcional y Técnico que los primeros conjuntos de datos a publicar deben ser los que se encuentran en el cuadrante de Victoria Temprana (VT), para nuestro caso, Compraventas de bien inmueble de los últimos 5 años y Predios Hipotecados, como se muestra a continuación.

Ilustración 24 - Matriz de priorización

Page 48: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

48

7.1.5ANEXO 5 - Ejemplo Paso 4

Ilustración 25 - Descripción de metadatos de los conjuntos de datos

Los roles Técnico y de Seguridad toman los conjuntos de datos Compraventas de bienes inmuebles de los últimos 5 años y Predios Hipotecados clasificados en el Ejemplo del PASO 3 como Victoria Temprana (VT), y realizan el diligenciamiento de la Plantilla para la descripción de metadatos de los conjuntos de datos, en la cual para cada conjunto de datos se describen los metadatos comunes y específicos como se como se muestra a continuación.

Page 49: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

49

Ilustración 26 - Plantilla para la descripción de metadatos de los conjuntos de datos

Page 50: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

50

7.1.6ANEXO 6 - Ejemplo Paso 5

Ilustración 27 - Estructuración cargue y publicación de los conjuntos de datos Los roles Técnico y de Seguridad estructuran los conjuntos de datos (Compraventas de bienes inmuebles de los últimos 5 años y Predios Hipotecados) diligenciando Plantilla para la estructuración de los datos como se muestra a continuación.

Page 51: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

51

Ilustración 28 - Plantilla para la estructuración de los datos Acto seguido generan los archivos de los conjuntos de datos a cargar en formato (CSV) y proceden a realizar el cargue en el portal Web www.datos.gov.co de los archivos utilizando el mecanismo de “Carga de archivo de conjunto de datos”.

Page 52: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

52

8 Terminología API (Application Programming Interface): Es una interfaz de comunicación entre componentes de software, que ofrece un conjunto de llamadas a ciertas librerías de programación que dan acceso a ciertos servicios desde los procesos, consiguiendo la abstracción en la programación entre niveles inferiores y superiores del software. Centro de Contacto Ciudadano -CCC: Es el punto integrado de contacto donde, a través de diferentes canales como teléfono, correo electrónico, charlas interactivas y fax, se brinda atención, respuestas inmediatas y seguimiento a las solicitudes de los ciudadanos, empresas y servidores públicos. Centro de Datos: Es la infraestructura donde se concentran todos los recursos técnicos y humanos necesarios para el óptimo procesamiento, almacenamiento y publicación de la información de las entidades del Estado Colombiano. Conjunto de datos (Dataset): Unidad mínima de información sujeta a carga, publicación, transformación y descarga en la plataforma CSV (Valores separados por coma): Tipos de documentos en formato abierto sencillo para representar datos en formato de tabla, en columnas separadas por comas (o punto y coma, donde la coma es el separador decimal) y las filas son saltos de línea. Los campos que tienen una coma, un salto de línea o una comilla doble deben cerrarse entre comillas dobles. No indica un juego concreto de caracteres, ni cómo van situados los bytes, ni el formato para el salto de línea. Las extensiones que se utilizan son .csv y .txt. DOC (Microsoft Office Word): Formato cerrado para transferir textos formateados o sin formato. Puede contener textos, imágenes, gráficos y enlaces. Desde la versión 2007 se trabaja con un nuevo formato, docx, que es más avanzado y comprime más el documento. Entidad: Organismos establecidos por la legislación Colombiana, los cuales tendrá la facultad de definir inventarios de datos y conjuntos de datos a publicar. Formatos libres: Son formatos de archivo que se pueden crear y manipular para cualquier software, libre de restricciones legales. Formatos propietarios: Son formatos de archivo que requieren herramientas que no son públicas. Interoperabilidad: Propiedad o capacidad de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada. Infomediario/a: Término con el que se hace referencia a una empresa que reutiliza la información de las Administraciones para producir un servicio o una obra con valor añadido. Suele utilizarse en referencia a la Industria Infomediaria. Existen múltiples ejemplos de industrias infomediarias, como aquellas que editan bases de datos de legislación y jurisprudencia a partir de las sentencias y normas publicadas en los boletines oficiales, o las que trabajan con información de ámbito Meteorológico para realizar informes más específicos para las Administraciones con el fin de, por ejemplo, detectar riesgos de incendios forestales a través de datos de previsiones e históricos de situación meteorológica en un determinado territorio (por poner solo un par de casos). Inventario de datos: Hace referencia a un listado de conjunto de datos que expone una entidad y que podrían llegar a ser publicados en el catálogo de datos. JSON (Notación de Objetos de JavaScript): Formato ligero de intercambio de datos, fácil de entender para las personas, y ofrece sencillez a las máquinas en la generación e interpretación.

Page 53: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

53

Está basado en un subconjunto del lenguaje de programación JavaScript, adecuado para la programación por parte del cliente. KML-KMZ (Lenguaje de Etiquetado de Ojo de Cerradura): Gramática XML y formato de archivo para la creación de modelos y almacenamiento de funciones geográficas como puntos, líneas, imágenes, polígonos y modelos que se mostrarán principalmente en aplicaciones de mapas. Se utiliza para compartir lugares e información entre aplicaciones. Es el estándar del Open Geospatial Consortium y se puede utilizar a través de Google Earth. Los archivos KML se distribuyen comprimidos como archivos KMZ. Licencia de información (licencia tipo): Contrato mediante el cual una persona recibe de otra el derecho de uso de varios de sus bienes, normalmente de carácter no tangible o intelectual, a cambio del pago o no de una cantidad determinada por el uso de los mismos. Este tipo de contratos, con carácter general, recogen una serie de cláusulas que atienden a cuatro aspectos específicos: derechos sobre la obra, limitaciones y prohibiciones, garantías y responsabilidades, jurisdicción competente y derecho aplicable. La licencia de información es la modalidad que tienen los organismos del Sector Público para autorizar la publicación de documentos públicos de forma no exclusiva y no discriminatoria respecto a otros usuarios. Mediación: Expresión general utilizada para referirse a cualquier tratamiento de los datos o de la información como paso previo a su apertura. Casos concretos de mediación son "el podado", "un injerto" o "la anonimización". Metadato: Es información que describe otro dato y puede ser entendida por humanos y máquinas. Microformato: (A veces abreviado con μF o uF) Forma simple de agregar significado semántico a un contenido legible por un humano mientras que para una máquina puede ser sólo texto plano. Según el W3C, son conjuntos de formatos de datos abiertos y simples, desarrollados sobre estándares ya existentes, ampliamente adoptados, incluyendo XHTML (HTML y XML) y CSS. ODF (Formato de Documento Abierto para Aplicaciones Ofimáticas OASIS): Open Document es un formato de fichero estándar para el almacenamiento de contenidos ofimáticos como hojas de cálculo, gráficos y presentaciones. Es el estándar para el intercambio de texto con formato. Las extensiones son:

Texto: .odt

Hoja de cálculo: .ods

Dibujo: .odg

Gráfico: .odc

Fórmula matemática: .odf

Base de datos: .odb

Imagen: .odi

Documento maestro: .odm PDF (Formato de Documento Portátil): Documento de formato portable universal que mantiene la apariencia del documento independientemente del sistema operativo que se utilice (multiplataforma). Incluye cualquier combinación de texto, multimedia e hipertexto y además se puede cifrar el contenido y firmarlo digitalmente. Es el estándar ISO, desde 2008, para ficheros contenedores de documentos electrónicos de cara a la conservación de larga duración. Es una especificación que se puede crear, visualizar o modificar con herramientas de software libre. Este formato originalmente era propietario (hasta 2008).

Page 54: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

54

RAVEC: Es una red privada de última tecnología que interconecta a las instituciones públicas a altas velocidades, con altos niveles de disponibilidad y seguridad, proporcionándoles servicios convergentes y colaborativos, para permitir una transferencia eficiente de información entre organismos gubernamentales y para optimizar los servicios que se entregan a los ciudadanos. RDF-XML (Infraestructura para Descripción de Recursos): Modelo para la representación de los recursos de la web en expresiones con la forma sujeto-predicado-objeto. El sujeto es el recurso que se describe, el predicado es la propiedad sobre la que se quiere establecer el recurso y el objeto es el valor de la propiedad con el que se establece la relación. La combinación de RDF con otras herramientas permite añadir significado a las páginas y es una de las tecnologías esenciales para la web semántica. Para que sea interpretable, se representa en formato XML. REST (RepresentationalState Transfer): Cualquier interfaz web simple que utiliza XML y HTTP, sin las abstracciones adicionales de los protocolos basados en patrones de intercambio de mensajes como el protocolo de servicios web SOAP. RISP (Acrónimo de “Reutilización de la Información del Sector Público”):Se trata de un esfuerzo Jurídico y de las Administraciones para dar acceso a los documentos, información y datos de carácter público (es decir no sujetos a ninguna restricción legal) a ciudadanos y empresas para que éstos puedan usarlas como mejor les convenga, pero muy especialmente con la intención de que generen nuevos servicios y productos de valor añadido. Esta iniciativa se impulsó sobre todo a partir del año 2003 con una Directiva europea que todos los Estados Miembros de la Unión están transponiendo. Sistemas de acceso: Lenguajes para consultar archivos. SHP (ESRI): Shapefile es un formato propietario de datos espaciales que es el estándar para el intercambio de información geográfica entre Sistemas de Información Geográfica (GIS). Es un formato vectorial de almacenamiento digital donde se guarda la localización de elementos geográficos y los atributos asociados a ellos, pero sin capacidad para almacenar información topológica. Lo generan varios archivos, mínimo tres y tiene tres tipos de extensiones: .shp, .shx y .dbf SPARQL (SPARQLProtocol and RDF QueryLanguage): Es un conjunto de especificaciones que proporcionan lenguajes y protocolos para consultar y manipular el contenido gráfico de RDF en la Web o en una tienda de RDF Tienda de Aplicaciones de Datos Abiertos: Solución en la que se publican las aplicaciones construidas por desarrolladores (colaboradores) que reutilizan los datos cargados y expuestos en el plataforma de de datos abiertos en la web. TMX (Translation Memory eXchange): Estándar de XML, que es un DTD que sirve para el intercambio de memorias de traducción. Creado por el comité OSCAR (Open Standards for Container/Content Allowing Re-use). Web services - API (Interfaz de programación de aplicaciones): Son interfaces de programación de aplicaciones (API) o la API de la web que se accede a través de HTTP y se ejecuta en un sistema remoto de alojamiento de los servicios solicitados. Los servicios web son sistemas de software diseñados para apoyar la interacción interoperable máquina a máquina sobre una red. Tiene una interfaz descrita en un formato procesable por una máquina y otros sistemas interactúan con el servicio web de una manera prescrita por su descripción utilizando mensajes SOAP, transmitido a través de HTTP con una serialización XML en conjunto con otras normas relacionadas con la web. WMS (Servicio de Mapas Web): Formato que produce mapas de datos referenciados espacialmente, de forma dinámica, a partir de información geográfica. Es estándar internacional.

Page 55: GUÍA PARA LA APERTURA DE DATOS EN COLOMBIA · Calidad: Permitir de manera incremental el mejoramiento en la calidad de los datos administrados por la Entidad, estos datos estarán

55

Los mapas WMS se generan normalmente en un formato de imagen como PNG, GIF o JPG, y opcionalmente como gráficos vectoriales en formato SVD o WebCGM. W3C (World Wide Web Consortium): Es un consorcio internacional de reconocido prestigio donde las organizaciones miembro, el personal a tiempo completo y el público en general, trabajan conjuntamente para desarrollar estándares Web. XLS (Microsoft Office Excel): Contiene filas y columnas de celdas y cada una puede incluir datos, que pueden ser palabras, números o fórmulas que tengan datos y resolver ecuaciones dinámicamente. Las hojas de cálculo XLS también pueden contener tablas y gráficos que muestran todas las secciones o de los datos seleccionados. XML (Lenguaje de Etiquetado Extensible): Es un metalenguaje simple pero estricto, desarrollado por W3C. Desarrolla un papel fundamental en el intercambio de una gran variedad de datos. XML es un formato que permite la interpretación de datos a través de varias aplicaciones. Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos. En realidad, XML es una manera de definir lenguajes para diferentes necesidades.