Linked Data:¿qué es y qué nos ofrece?

41
Linked Data: ¿qué es y qué nos ofrece? Daniel Vila-Suero Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net [email protected] Agradecimientos: A. Gómez-Pérez. Seminario web Linked Open Data@AIMS FAO Martes 11 de Diciembre de 2012

Transcript of Linked Data:¿qué es y qué nos ofrece?

Linked Data:¿qué es y qué nos ofrece?

Daniel Vila-SueroFacultad de Informática, Universidad Politécnica de Madrid

Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid

http://www.oeg-upm.net

[email protected]

Agradecimientos: A. Gómez-Pérez.

Seminario web Linked Open Data@AIMS FAOMartes 11 de Diciembre de 2012

Contenido

• Produciendo y consumiendo información en la Web • Linked Data• Conceptos básicos a través de un ejemplo• Lecturas

2

Produciendo y consumiendo

información en la Web

3

La Web desde dos perspectivas

4

PRODUCTORINFORMACIÓN

CONSUMIDORINFORMACIÓN

WWW

• Dos roles con fronteras cada día más diluídas• Usuarios:

• Consumimos a diario información de wikipedia, prensa, twitter, facebook, etc.

• Producimos información en twitter, wikipedia, facebook, comentamos noticias, etc.

• Una organización (empresa, institución pública):• Produce información y ofrece servicios (compra-venta,

agregación información, etc.)• Consume información para mejorar sus servicios/oferta

Consumidores

5

CONSUMIDORES WWW

• Cuando usamos la Web:

• Consultamos varias fuentes de información:• Para organizar un viaje: compra de billetes, hotel, sitios

de interés, etc.• Para comprar un libro: desde un autor que nos gusta a

un tema determinado• Los servicios más exitosos son aquellos que son capaces

de agregar/derivar información que nos interesa: google, twitter, etc.

• Muchas veces resulta tedioso/difícil encontrar lo que buscamos

Productores

6

PRODUCTORES WWW

• Necesitan que su información/servicio sea visible, útil y relevante

• Reutilizar información de otros aumenta las capacidades del servicio

• Compartir información de una manera sencilla y

estándar amplía el potencial de la misma y la visibilidad de la organización

Produciendo información en la Web

7

WWWWeb 1.0

AUTOR

EDITOR

LIBRO

IDIOMA

Produciendo información en la Web

8

WWWWeb 1.0

Web 2.0WWW

AUTOR

EDITOR

LIBRO

IDIOMA

HTML

HTML, XML, servicios web

Produciendo información en la Web

9

WWWWeb 1.0

Web 2.0WWW

WWW

Linked Data

WWW

AUTOR

EDITOR

LIBRO

IDIOMA

HTML

HTML, XML, servicios web

Produciendo información en la Web

10

WWWWeb 1.0

Web 2.0WWW

WWW

Linked Data

WWW

HTML

“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”

Limitaciones

• El sistema actual (HTML + Servicios Web) no facilita la reutilización ni la generación de nuevo conocimiento

• HTML: Es un formato para estructurar documentos, no datos

• Servicios Web: Aunque estructuran los datos, no especifican el modelo de una manera estándar (e.g. es Eduardo Mendoza una persona? )

11

Linked Data

12

Comparte tus datos y reutiliza los de otros

13

WWW

Linked Data

WWW

Idea básica

14

WWW

Mantén el modelo de tus datos cuando publiquesinformación en la Web

AUTOR

EDITOR

LIBRO IDIOMA

LIBRO

AUTOR

Estar en la Web……..

Idea básica

15

WWW

WWW

Mantén el modelo de tus datos cuando publiquesinformación en la Web

AUTOR

EDITOR

LIBRO IDIOMA

LIBRO

AUTOR

… ser parte de la Web.

Linked Data

• Publicación de datos en la Web:

• Usando las tecnologías de la Web: HTTP, URL/URI, DNS• Con un modelo de datos explícito: RDF + vocabularios (o

esquemas, ontologías..) en RDF Schema o OWL

• Permite compartir (aumentar) tus datos

• Permite reutilizar datos de otros para enriquecer tu información, reducir costes, y ofrecer mejores servicios

16

¿Qué podemos publicar usando Linked Data?

• Información sobre cualquier cosa:

17

AMORhttp://dbpedia.org/resource/Love

Eduardo Mendoza

http://datos.bne.es//resource/XX1013037

Barcelona

http://geo.linkeddata.es/resource/Provincia/Barcelona

Los 4 Principios*

18

1. Utilizar URIs para nombrar cosas (recursos)

http://dbpedia.org/resource/Love

http://geo.linkeddata.es/resource/Provincia/Barcelona

2. Usar el protocolo HTTP para publicar/recuperar recursos

3. Describir datos en un formato estándar (RDF)

4. Enlazar con otros recursos a través de URIs

dbpedia:Tim_Berners-Lee rdf:type foaf:Person

foaf:surname "Berners-Lee"@en ;foaf:givenName "Tim"@en ;

*http://www.w3.org/DesignIssues/LinkedData

¿Qué necesitamos? (1)

• Bloque básico: tripletas RDF

Sujeto Predicado Objeto

Eduardo Mendoza es autor de La ciudad de los prodigios

Barcelona forma parte de Catalunya

• Sujeto y predicado son URIs

• El objeto puede ser una URI o un literal

19

¿Qué necesitamos? (2)

• Vocabularios para:

• Indicar de qué tipo son nuestros recursos (CLASES):

• Describir nuestros recursos (PROPIEDADES):• Tiene nombre, nº de páginas, etc.

• Existen multitud de vocabularios (http://lov.okfn.org/) para describir todo tipo de cosas en la Web

20

Eduardo Mendoza es Persona

Barcelona es Municipio

El modelo (vocabulario) y los datos

21

Obra

Lengua

Traducción

Año

Fecha de Publicación

Biblioteca

Ubicado en

Persona

Es autor

Tiene como materia

El Quijote Cervantes

Es autor

Catalán

Traducción

1960

Fecha de Publicación

BNE

Ubicado en

Tiene como materia

Vida de Cervantes

Vocab

Datos

22

Ejemplo*:

2 recursos

3 conjuntos de datos

*Basado en la presentación de Tom Baker@FAO-AIMS: http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web

Descripción en Google Knowledge Graph

23

Recurso A: Eduardo Mendoza

Bloque básico para describir el recurso: Tripletas

24

Sujeto Predicado Objeto

Eduardo Mendoza Nacido en Barcelona

Eduardo Mendoza Fecha de nacimiento 01-11-1943

Eduardo Mendoza Profesión Escritor

Eduardo Mendoza Autor de La ciudad de los prodigios

Sujeto Predicado Objeto

Triplificando la descripción

25

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en Barcelonadbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento 01-11-1943dbpedia:Eduardo_Mendoza_Garriga Profesión Escritordbpedia:Eduardo_Mendoza_Garriga Autor de La ciudad de los prodigios

Identificamos el sujeto con una URI

La URI completa es http://dbpedia.org/resource/Eduardo_Mendoza_Garriga pero utilizamos la abreviación dbpedia:

Triplificando la descripción: Usando otros conjuntos de datos

26

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga Nacido en geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga Es una foaf:Person

dbpedia:Eduardo_Mendoza_Garriga Autor de bne:XX1892304

Los objetos pueden ser URIs o literales

La URI completa es http://datos.bne.es/resource/XX1892304 pero utilizamos la abreviación bne:

Triplificando la descripción: Usando vocabularios

27

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

Los predicados SON URIs

(de uno o varios vocabularios)

Foaf es un vocabulario para describir personas (fecha y lugar de nacimiento por ejemplo).

rdf:type asigna un tipo al recurso

Al usar recursos de otros conjuntos: ampliamos la información

28

bne:XX1892304 es la URI que identifica la obra con titulo "La ciudad de los prodigios" en el portal de datos de la BNE (datos.bne.es)

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

Las tripletas conforman un grafo

29

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

dbpedia:Eduardo_Mendoza…

geoes:Barcelona01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlacefoaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

Descripción en Google Knowledge Graph

30

Recurso B: Barcelona

Explorando el grafo

31

Sujeto Predicado Objeto

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

geoes:Barcelona

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:latgeoes:formaParteDe

geo:long

rdf:type

Aumentando el grafo

32

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

Uniendo las tripletas del recurso A

Aumentando el grafo

33

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

Con las tripletas del recurso B

URIs: integrando datos en la WWW

34

Sujeto Predicado Objetodbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona

dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person

dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304

bne:XX1892304 dc:title La ciudad de los prodigios

geoes:Barcelona http://geo.linkeddata.es/ontology/formaParteDe

http://geo.linkeddata.es/page/resource/ComunidadAutónoma/

Cataluña

geoes:Barcelona geo:lat 41.3833333333333

geoes:Barcelona geo:long 2.16666666666667

geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/Provincia

Con las tripletas del recurso B

Las URIs

35

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Barcelona

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:latgeoes:formaParteDe

geo:long

rdf:type

Creando un grafo de datos

36

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Generando valor a través del enlazado

37

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Ampliando la red de datos

38

dbpedia:Eduardo_Mendoza…

geoes:Barcelona

01-11-1943

foaf:Person

bne:XX1892304

La ciudad de los prodigios

foaf:birthPlace

foaf:birthDate

rdf:type

frbr:isCreatorOf

dc:title

geoes:Cataluña

41.3833333333333

geoes:Provincia

2.16666666666667

geo:lat

geoes:formaParteDe

geo:longrdf:type

Lecciones aprendidas

• Nombrar nuestros recursos usando HTTP URIs, describirlos usando vocabularios (RDFS y OWL), enlazar nuestros datos usando URIs de otros proveedores de datos.

• Receta básica:1. Entender nuestro modelo de datos de origen

2. Crear un espacio de URIs gestionadas por la organización y que identifiquen univocamente nuestros recursos

3. Seleccionar los vocabularios adecuados (http://lov.okfn.org/dataset/lov). Mantener el modelo claro y sencillo

4. Describir nuestros recursos usando tripletas RDF y los vocabularios

5. Usar URIs de otros para describir nuestros datos complementando y aumentando nuestros recursos

39

Lecturas

• Informes del W3C Library Linked Data Incubator Group:• Inglés:http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/• Español y otros idiomas:

http://www.w3.org/2003/03/Translations/byTechnology?technology=lld-reports

• Linked Data book, Heath and Bizer:• http://linkeddatabook.com/editions/1.0/

• Artículo sobre la publicación de datos de la BNE:• http://semantic-web-journal.net/content/datosbnees-library-linked-

data-dataset

40

Muchas gracias!

Email: [email protected]

Twitter: @dvilasuero

41