Datos abiertos: Reutilización de información en el sector público

44
Datos abiertos: Reutilización de información en el sector público Jose Emilio Labra Gayo Universidad of Oviedo, Spain http://www.di.uniovi.es/~labra

description

Presentación realizada por Jose Emilio Labra Gayo para las Jornadas "Empleo y Universidad" organizadas por la Universidad de Oviedo, los días 9 y 10 de Junio de 2010

Transcript of Datos abiertos: Reutilización de información en el sector público

Page 1: Datos abiertos: Reutilización de información en el sector público

Datos abiertos: Reutilización de información

en el sector público

Jose Emilio Labra Gayo

Universidad of Oviedo, Spainhttp://www.di.uniovi.es/~labra

Page 2: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Esquema

Explosión de datos

Razones para publicar los datos

¿Cómo publicar los datos?Datos abiertos vs datos enlazados

Page 3: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Explosión de datosContenido generado por usuarios

Información de los gobiernos

Internet de las cosas

Page 4: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Facilitan la investigación

Tasa de descubrimiento se acelera con mejores accesos a los datos

Por el bien común de la humanidad

Page 5: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Los sistemas abiertos facilitan las contribuciones externas

Page 6: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Datos = base para la cooperación Para realizar tareas

comunitarias se requiere acceso a datos comunes

Page 7: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Eficiencia y calidad de los sistemas

Hay muchos datos comunes que no están publicados

Ej. ¿Lista de municipios?

Page 8: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

TrasparenciaFomentar participación

Generar confianza

Evaluar al gobierno

Page 9: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Razones para liberar datos

Esta presentación hubiera sido muchísimo más aburrida si no hubiese tenido acceso a los datos parcial o totalmente abiertos de Google, Flickr,

Wikipedia, Slideshare y muchos otros proyectos…

Page 10: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Si realmente quieres algo…

…déjalo libre

Page 11: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Como ciudadanos…

…también podemos demandar datos abiertos…

Page 12: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando los datos pertenecen a la humanidad

Page 13: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando son hechos independientes y verificables ó de conocimiento común

Ejemplo: conocimiento científico

Page 14: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

…demandar datos abiertos

Cuando los datos han sido creados con dinero públicoSon nuestros datos

Los han pagado nuestros impuestos

Page 15: Datos abiertos: Reutilización de información en el sector público

OK, ¡vivan los datos abiertos!pero…

¿Cómo publicarlos?

Page 16: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

El mayor reto = IntegraciónEn general, el problema no es informatizar algo

El problema es integrar los sistemas

Interoperabilidad

No basta con publicar datos…

Page 17: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Modelo de Estrellas*

★ Publicar los datos (en cualquier formato)

★★ Utilizar formato estructurado (Excel en lugar de imágenes escaneadas)

★★★ Usar formatos no propietarios (CSV en lugar de Excel)

★★★★ Usar URIs para identificar datos (otros sistemas puedan enlazar nuestros datos)

★★★★★ Enlazar con otros datos externos (proporcionar contexto)

* Enunciado por TimBerners Lee en Gov 2.0 Expo 2010

http://www.youtube.com/watch?v=ga1aSJXCFe0

Page 18: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos no estructurados

Formatos “caja negra”: Imágenes, vídeos, música, etc.

Formatos binarios: PDF, PS, etc.

Requieren técnicas de tratamiento de la señal, reconocimiento de patrones, etc.

Page 19: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejemplo: Servicio Público de Empleo

http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/

Page 20: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos estructurados

Los datos tienen una estructura

Ejemplo: Hojas de cálculoProblema con formatos propietarios

Requieren herramientas que no son públicas

★ ★

Page 21: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejemplo: Servicio Público de empleo

http://www.sepe.es/contenidos/cifras/datos_estadisticos/municipios/9

★ ★

Page 22: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Formatos no propietarios

Utilizar formatos abiertos estructurados

Ejemplos: CSV, HTML

Problema: Contenido depende del contexto

★ ★ ★

Page 23: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

CSV

“Comma separated values” valores delimitados por comas

★ ★ ★

Page 24: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

HTML

HTML está pensado para representar información que se visualiza en el navegador

El procesamiento puede requerir “screen scrapping”

★ ★ ★

Page 25: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

URIs para identificar datos

Utilizar una URI para identificar un dato

Diferentes representaciones para cada tipo de dato

Negociación de contenido

★ ★ ★ ★

http://puzzles.org/pieza23471

Page 26: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

XML

XML permite representar información estructurada

Los documentos pueden validarse (XML Schema)

El significado de las etiquetas depende de la aplicación

★ ★ ★ ★

Page 27: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Negociación de contenido

El protocolo de comunicación permite que el navegador informe al servidor del tipo de contenido que prefiere

El servidor devuelve una representación diferente según las preferencias del cliente

★ ★ ★ ★

cliente servidor

Page 28: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

¿2 representaciones para lo mismo?

Ejemplo: Códigos de barras

★ ★ ★ ★

Page 29: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Enlazar con otros datos

Enlazar datos identificados mediante URIs

Objetivo: Facilitar la identificación de nuevos conjuntos de datosNuevo conocimiento

★ ★ ★ ★ ★

Page 30: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF

RDF es un modelo de representación en forma de grafo

RDF (Resource Description Framework)

Las propiedades tienen valores globales (URIs)

★ ★ ★ ★ ★

dato4530

Oviedo 2009

http://obs.org#totalDesempleados

http://obs.org#añohttp://obs.org#municipio

Page 31: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF es composicional

2 grafos independientes pueden componerse

★ ★ ★ ★ ★

El lenguaje SPARQL permite realizar consultas a grafos

Page 32: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

RDF como representación

Negociación de contenidoHTML: información para navegadores

RDF: información para sistemas automáticos

★ ★ ★ ★ ★

http://tiempo.com/prevision/oviedoURI

303 See Other http://tiempo.com/prevision/Oviedo/informe.html

303 See Other http://tiempo.com/prevision/Oviedo/informe.rdf

Page 33: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Proyecto Linking Open Data

★ ★ ★ ★ ★

Page 34: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

De Wikipedia a DBPediaInfoset

★ ★ ★ ★ ★

Page 35: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

De Wikipedia a DBPedia

★ ★ ★ ★ ★

Page 36: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Un pequeño ejercicio

Obtener datos de desempleo en municipios asturianos

Excel RDF

HTML + Google Maps

Page 37: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: Ejemplo de Excel

Page 38: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: RDF

Page 39: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Ejercicio: HTML

Page 40: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Iniciativas para datos abiertos

Page 41: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Algunas iniciativas en España

Page 42: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Conclusiones

Publicación de datos abiertos

De datos abiertos a datos enlazados

Nuevos retos:Legalidad: licencias, copyrights,

patentes…

Privacidad

Temporalidad

Semántica e inferencia

Page 43: Datos abiertos: Reutilización de información en el sector público

Fin de la presentación

Más información: http://www.di.uniovi.es/~labra

Page 44: Datos abiertos: Reutilización de información en el sector público

Jose Emilio Labra Gayo, http://www.di.uniovi.es/~labra

Agradecimientos

Algunas ideas o partes de esta presentación han sido tomadas de otras presentaciones similares de:

Ivan Hermann, Jacco van Ossenbruggen, Nova Spivak, Ian Horrocks, Tim Berners-Lee, Jose Manuel Alonso, Svein-Magnus Sørensen, Jose Luis Marín.

También se han utilizado datos accesibles en Google, Flickr, Wikipedia, Slideshare, etc. a cuyos autores originales me hubiera gustado citar.