Linked Data:¿qué es y qué nos ofrece?

41
Linked Data: ¿qué es y qué nos ofrece? Daniel Vila-Suero Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net [email protected] Agradecimientos: A. Gómez-Pérez. Seminario web Linked Open Data@AIMS FAO Martes 11 de Diciembre de 2012

description

Presentacion realizada por Daniel Vila Suero (Facultad de Informática, Universidad Politécnica de Madrid) durante los seminarios web Linked Open Data @ AIMS http://aims.fao.org/linked-open-data-webinars-at-aims Resumen En este seminario se introducirán los conceptos básicos relacionados con Linked Data. En primer lugar, explicaremos qué supone el paradigma de Linked Data, sus diferencias con el paradigma tradicional de publicación de información en la Web y qué beneficios ofrece, especialmente para los gestores de información. Seguidamente, trataremos los conceptos y tecnologías básicas que nos permitirán mostrar a través de ejemplos cómo publicar Linked Data en la Web. Por último, mostraremos una serie de proyectos, conjuntos de datos y herramientas para acercarnos a las tendencias actuales en Linked Data, permitirnos fijar los conceptos aprendidos y servir cómo punto de partida para continuar aprendiendo sobre el tema.

Transcript of Linked Data:¿qué es y qué nos ofrece?

Page 1: Linked Data:¿qué es y qué nos ofrece?

Linked Data:¿qué es y qué nos ofrece?

Daniel Vila-SueroFacultad de Informática, Universidad Politécnica de Madrid

Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid

http://www.oeg-upm.net

[email protected]

Agradecimientos: A. Gómez-Pérez.

Seminario web Linked Open Data@AIMS FAOMartes 11 de Diciembre de 2012

Page 2: Linked Data:¿qué es y qué nos ofrece?

Contenido

• Produciendo y consumiendo información en la Web • Linked Data• Conceptos básicos a través de un ejemplo• Lecturas

2

Page 3: Linked Data:¿qué es y qué nos ofrece?

Produciendo y consumiendo

información en la Web

3

Page 4: Linked Data:¿qué es y qué nos ofrece?

La Web desde dos perspectivas

4

PRODUCTORINFORMACIÓN

CONSUMIDORINFORMACIÓN

WWW

• Dos roles con fronteras cada día más diluídas• Usuarios:

• Consumimos a diario información de wikipedia, prensa, twitter, facebook, etc.

• Producimos información en twitter, wikipedia, facebook, comentamos noticias, etc.

• Una organización (empresa, institución pública):• Produce información y ofrece servicios (compra-venta,

agregación información, etc.)• Consume información para mejorar sus servicios/oferta

Page 5: Linked Data:¿qué es y qué nos ofrece?

Consumidores

5

CONSUMIDORES WWW

• Cuando usamos la Web:

• Consultamos varias fuentes de información:• Para organizar un viaje: compra de billetes, hotel, sitios

de interés, etc.• Para comprar un libro: desde un autor que nos gusta a

un tema determinado• Los servicios más exitosos son aquellos que son capaces

de agregar/derivar información que nos interesa: google, twitter, etc.

• Muchas veces resulta tedioso/difícil encontrar lo que buscamos

Page 6: Linked Data:¿qué es y qué nos ofrece?

Productores

6

PRODUCTORES WWW

• Necesitan que su información/servicio sea visible, útil y relevante

• Reutilizar información de otros aumenta las capacidades del servicio

• Compartir información de una manera sencilla y

estándar amplía el potencial de la misma y la visibilidad de la organización

Page 7: Linked Data:¿qué es y qué nos ofrece?

Produciendo información en la Web

7

WWWWeb 1.0

AUTOR

EDITOR

LIBRO

IDIOMA

Page 8: Linked Data:¿qué es y qué nos ofrece?

Produciendo información en la Web

8

WWWWeb 1.0

Web 2.0WWW

AUTOR

EDITOR

LIBRO

IDIOMA

HTML

HTML, XML, servicios web

Page 9: Linked Data:¿qué es y qué nos ofrece?

Produciendo información en la Web

9

WWWWeb 1.0

Web 2.0WWW

WWW

Linked Data

WWW

AUTOR

EDITOR

LIBRO

IDIOMA

HTML

HTML, XML, servicios web

Page 10: Linked Data:¿qué es y qué nos ofrece?

Produciendo información en la Web

10

WWWWeb 1.0

Web 2.0WWW

WWW

Linked Data

WWW

HTML

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”

Page 11: Linked Data:¿qué es y qué nos ofrece?

Limitaciones

• El sistema actual (HTML + Servicios Web) no facilita la reutilización ni la generación de nuevo conocimiento

• HTML: Es un formato para estructurar documentos, no datos

• Servicios Web: Aunque estructuran los datos, no especifican el modelo de una manera estándar (e.g. es Eduardo Mendoza una persona? )

11

Page 12: Linked Data:¿qué es y qué nos ofrece?

Linked Data

12

Page 13: Linked Data:¿qué es y qué nos ofrece?

Comparte tus datos y reutiliza los de otros

13

WWW

Linked Data

WWW

Page 14: Linked Data:¿qué es y qué nos ofrece?

Idea básica

14

WWW

Mantén el modelo de tus datos cuando publiquesinformación en la Web

AUTOR

EDITOR

LIBRO IDIOMA

LIBRO

AUTOR

Estar en la Web……..

Page 15: Linked Data:¿qué es y qué nos ofrece?

Idea básica

15

WWW

WWW

Mantén el modelo de tus datos cuando publiquesinformación en la Web

AUTOR

EDITOR

LIBRO IDIOMA

LIBRO

AUTOR

… ser parte de la Web.

Page 16: Linked Data:¿qué es y qué nos ofrece?

Linked Data

• Publicación de datos en la Web:

• Usando las tecnologías de la Web: HTTP, URL/URI, DNS• Con un modelo de datos explícito: RDF + vocabularios (o

esquemas, ontologías..) en RDF Schema o OWL

• Permite compartir (aumentar) tus datos

• Permite reutilizar datos de otros para enriquecer tu información, reducir costes, y ofrecer mejores servicios

16

Page 17: Linked Data:¿qué es y qué nos ofrece?

¿Qué podemos publicar usando Linked Data?

• Información sobre cualquier cosa:

17

AMORhttp://dbpedia.org/resource/Love

Eduardo Mendoza

http://datos.bne.es//resource/XX1013037

Barcelona

http://geo.linkeddata.es/resource/Provincia/Barcelona

Page 18: Linked Data:¿qué es y qué nos ofrece?

Los 4 Principios*

18

1. Utilizar URIs para nombrar cosas (recursos)

http://dbpedia.org/resource/Love

http://geo.linkeddata.es/resource/Provincia/Barcelona

2. Usar el protocolo HTTP para publicar/recuperar recursos

3. Describir datos en un formato estándar (RDF)

4. Enlazar con otros recursos a través de URIs

dbpedia:Tim_Berners-Lee rdf:type foaf:Person

foaf:surname "Berners-Lee"@en ;foaf:givenName "Tim"@en ;

*http://www.w3.org/DesignIssues/LinkedData

Page 19: Linked Data:¿qué es y qué nos ofrece?

¿Qué necesitamos? (1)

• Bloque básico: tripletas RDF

Sujeto Predicado Objeto

Eduardo Mendoza es autor de La ciudad de los prodigios

Barcelona forma parte de Catalunya

• Sujeto y predicado son URIs

• El objeto puede ser una URI o un literal

19

Page 20: Linked Data:¿qué es y qué nos ofrece?

¿Qué necesitamos? (2)

• Vocabularios para:

• Indicar de qué tipo son nuestros recursos (CLASES):

• Describir nuestros recursos (PROPIEDADES):• Tiene nombre, nº de páginas, etc.

• Existen multitud de vocabularios (http://lov.okfn.org/) para describir todo tipo de cosas en la Web

20

Eduardo Mendoza es Persona

Barcelona es Municipio

Page 21: Linked Data:¿qué es y qué nos ofrece?

El modelo (vocabulario) y los datos

21

Obra

Lengua

Traducción

Año

Fecha de Publicación

Biblioteca

Ubicado en

Persona

Es autor

Tiene como materia

El Quijote Cervantes

Es autor

Catalán

Traducción

1960

Fecha de Publicación

BNE

Ubicado en

Tiene como materia

Vida de Cervantes

Vocab

Datos

Page 22: Linked Data:¿qué es y qué nos ofrece?

22

Ejemplo*:

2 recursos

3 conjuntos de datos

*Basado en la presentación de Tom Baker@FAO-AIMS: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web

Page 23: Linked Data:¿qué es y qué nos ofrece?

Descripción en Google Knowledge Graph

23

Recurso A: Eduardo Mendoza

Page 24: Linked Data:¿qué es y qué nos ofrece?

Bloque básico para describir el recurso: Tripletas

24

Sujeto Predicado Objeto

Eduardo Mendoza Nacido en Barcelona

Eduardo Mendoza Fecha de nacimiento 01-11-1943

Eduardo Mendoza Profesión Escritor

Eduardo Mendoza Autor de La ciudad de los prodigios

Sujeto Predicado Objeto

Page 25: Linked Data:¿qué es y qué nos ofrece?

Triplificando la descripción

25

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en Barcelonadbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento 01-11-1943dbpedia:Eduardo_Mendoza_Garriga Profesión Escritordbpedia:Eduardo_Mendoza_Garriga Autor de La ciudad de los prodigios

Identificamos el sujeto con una URI

La URI completa es http://dbpedia.org/resource/Eduardo_Mendoza_Garriga pero utilizamos la abreviación dbpedia:

Page 26: Linked Data:¿qué es y qué nos ofrece?

Triplificando la descripción: Usando otros conjuntos de datos

26

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga Es una foaf:Person

dbpedia:Eduardo_Mendoza_Garriga Autor de bne:XX1892304

Los objetos pueden ser URIs o literales

La URI completa es http://datos.bne.es/resource/XX1892304 pero utilizamos la abreviación bne:

Page 27: Linked Data:¿qué es y qué nos ofrece?

Triplificando la descripción: Usando vocabularios

27

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

Los predicados SON URIs

(de uno o varios vocabularios)

Foaf es un vocabulario para describir personas (fecha y lugar de nacimiento por ejemplo).

rdf:type asigna un tipo al recurso

Page 28: Linked Data:¿qué es y qué nos ofrece?

Al usar recursos de otros conjuntos: ampliamos la información

28

bne:XX1892304 es la URI que identifica la obra con titulo "La ciudad de los prodigios" en el portal de datos de la BNE (datos.bne.es)

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

Page 29: Linked Data:¿qué es y qué nos ofrece?

Las tripletas conforman un grafo

29

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

dbpedia:Eduardo_Mendoza…

geoes:Barcelona01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlacefoaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

Page 30: Linked Data:¿qué es y qué nos ofrece?

Descripción en Google Knowledge Graph

30

Recurso B: Barcelona

Page 31: Linked Data:¿qué es y qué nos ofrece?

Explorando el grafo

31

Sujeto Predicado Objeto

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

geoes:Barcelona

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:latgeoes:formaParteDe

geo:long

rdf:type

Page 32: Linked Data:¿qué es y qué nos ofrece?

Aumentando el grafo

32

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

Uniendo las tripletas del recurso A

Page 33: Linked Data:¿qué es y qué nos ofrece?

Aumentando el grafo

33

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

Con las tripletas del recurso B

Page 34: Linked Data:¿qué es y qué nos ofrece?

URIs: integrando datos en la WWW

34

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

Con las tripletas del recurso B

Page 35: Linked Data:¿qué es y qué nos ofrece?

Las URIs

35

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Barcelona

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:latgeoes:formaParteDe

geo:long

rdf:type

Page 36: Linked Data:¿qué es y qué nos ofrece?

Creando un grafo de datos

36

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Page 37: Linked Data:¿qué es y qué nos ofrece?

Generando valor a través del enlazado

37

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Page 38: Linked Data:¿qué es y qué nos ofrece?

Ampliando la red de datos

38

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Page 39: Linked Data:¿qué es y qué nos ofrece?

Lecciones aprendidas

• Nombrar nuestros recursos usando HTTP URIs, describirlos usando vocabularios (RDFS y OWL), enlazar nuestros datos usando URIs de otros proveedores de datos.

• Receta básica:1. Entender nuestro modelo de datos de origen

2. Crear un espacio de URIs gestionadas por la organización y que identifiquen univocamente nuestros recursos

3. Seleccionar los vocabularios adecuados (http://lov.okfn.org/dataset/lov). Mantener el modelo claro y sencillo

4. Describir nuestros recursos usando tripletas RDF y los vocabularios

5. Usar URIs de otros para describir nuestros datos complementando y aumentando nuestros recursos

39

Page 40: Linked Data:¿qué es y qué nos ofrece?

Lecturas

• Informes del W3C Library Linked Data Incubator Group:• Inglés:http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/• Español y otros idiomas:

http://www.w3.org/2003/03/Translations/byTechnology?technology=lld-reports

• Linked Data book, Heath and Bizer:• http://linkeddatabook.com/editions/1.0/

• Artículo sobre la publicación de datos de la BNE:• http://semantic-web-journal.net/content/datosbnees-library-linked-

data-dataset

40

Page 41: Linked Data:¿qué es y qué nos ofrece?

Muchas gracias!

Email: [email protected]

Twitter: @dvilasuero

41