Herramientas para linked data

Post on 16-Dec-2014

127 views 1 download

description

Herramientas para la publicación y consumo de linked data

Transcript of Herramientas para linked data

Iván Ruiz Rube

Herramientas para la publicación y consulta de Linked Open Data

25 de Abril de 2013

Desarrollo de software orientado a servicios y procesos de aprendizajeItinerario de Doctorado en Modelado, Simulación y Pruebas de Procesos y Tratamiento de Señales y Datos

Introducción• La Web de Linked Data promueve la integración de datos entre diferentes sistemas (LD o no LD).– Interoperabilidad sintáctica: formato RDF

– Interoperabilidad semántica: ontologías o vocabularios RDF

• Se necesitan herramientas para la publicación y la utilización de datos de datasets RDF.

Contenidos• Diseño de ontologías• Generación de datos• Gestión de datos• Exposición de datos• Consumo de datos• Plataformas Linked Data

Diseño de ontologías

• ¿Cómo construir vocabularios?– Herramientas específicas

• Herramientas completas OWL• Editores de vocabularios RDF

– Herramientas de modelado UML• Soporte al perfil ODM

– Herramientas genéricas• Editores de texto XML, JSON, Turtle/N3

– Ingeniería inversa• Base de datos• ORM

Herramientas OWL: Protégé

Herramientas RDF: Neologism

Herramientas UML: Enterprise Architect

Herramientas edición: RDF Validator Service

Herramientas Ingeniería Inversa

Generación de datos

• ¿Cómo generar datos RDF?– Herramientas genéricas

• Editores de texto XML, JSON, Turtle/N3

– Herramientas especificas de dominio• Editores SKOS, Dublin Core, etc.

– Herramientas de anotación automática• API Wrappers• RDB Wrappers• Structured Data Extractos• Textual Content Extractors

Herramientas específicas de dominio

Herramientas de anotación automática

Herramientas de anotación automática

20082008

JournalSemanticWebJournalSemanticWeb

W3CW3C

The Story So Far

The Story So Far

Berners-LeeBerners-LeeLinkedDataLinkedData

API Wrappers: Virtuoso RDF Proxy

Relational Databases Wrappers: D2RQ

map:OrganisationUnits a d2rq:ClassMap;d2rq:dataStorage map:database;d2rq:class cerif:Organization;d2rq:uriPattern "organizations/@@ORGANISATIONS.ACRONYM@@";d2rq:condition "ORGANISATIONS.ACRONYM <> ''“ .

map:OrganisationUnits_Headcount a d2rq:PropertyBridge;d2rq:belongsToClassMap map:OrganisationUnits;d2rq:property cerif:headcount;d2rq:column "ORGANISATIONS.HEADCOUNT “ .

http://dataset.org/organizations/UCAhttp://dataset.org/organizations/UCA

http://www.eurocris.org/cerif/1.3#Organization

http://www.eurocris.org/cerif/1.3#Organization

rdf:typecerif:headcount

24002400

Structured Content Extractors: Open Refine (RDF ext.)

Textual Content Extractors: Apache Stanbol

Gestión de datos• ¿Dónde viven los datos RDF?

– Directorio del servidor web • Ficheros RDF (XML, N3, etc.)• Ficheros HTML+RDFa

– RDF Store• Almacén de tripletas Subject-Predicate-Object

– No se almacenan• Cuando se utilizan wrappers (on-the-fly)

• Razonamiento

RDF Stores

Razonadores

($p http://www.w3.org/2000/01/rdf-schema#domain $d), ($1 $p $2) ($1 http://www.w3.org/1999/02/22-rdf-syntax-ns#type $d)

($p http://www.w3.org/2000/01/rdf-schema#domain $d), ($1 $p $2) ($1 http://www.w3.org/1999/02/22-rdf-syntax-ns#type $d)

Exposición de datos

• Linked Data Interface– URIs deferenciables– Read Write Linked Data

• Linked Data Endpoint– SPARQL – SPARQL/Update

URIs deferenciables (fichero HTML)

http://publisher.org/Papers/Paper12345

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html

<html><head><link rel="alternate" type="application/rdf+xml"

href=”Paper12345.rdf"></head><body><h1>Linked Data – The Story So Far</h1><h2><a href=“http://ijswis.org”>International Journal on

Semantic Web and Information Systems (IJSWIS)</a></h2>

<h3>Published on 2008-01-01 </h3><h3>Author: Tim Berners-Lee</h3> </body>

<html><head><link rel="alternate" type="application/rdf+xml"

href=”Paper12345.rdf"></head><body><h1>Linked Data – The Story So Far</h1><h2><a href=“http://ijswis.org”>International Journal on

Semantic Web and Information Systems (IJSWIS)</a></h2>

<h3>Published on 2008-01-01 </h3><h3>Author: Tim Berners-Lee</h3> </body>

URIs deferenciables (fichero XML)

http://publisher.org/Papers/Paper12345

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: application/rdf+xml

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: application/rdf+xml

<rdf:Description rdf:about="http://publisher.org/Papers/Paper12345">

<title>Linked Data - The Story So Far</title>

<year>2008-01-01</year>

<author rdf:resource="http://w3.org/People/Berners-Lee" />

<publishedIn rdf:resource="http://publisher.org/Journal/JournalSWIS" />

</rdf:Description>

<rdf:Description rdf:about="http://publisher.org/Papers/Paper12345">

<title>Linked Data - The Story So Far</title>

<year>2008-01-01</year>

<author rdf:resource="http://w3.org/People/Berners-Lee" />

<publishedIn rdf:resource="http://publisher.org/Journal/JournalSWIS" />

</rdf:Description>

URIs deferenciables (fichero N3)

http://publisher.org/Papers/Paper12345

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/n3

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/n3

<http://publisher.org/Papers/Paper12345>title "Linked Data - The Story So Far";year "2008-01-01";author <http://w3.org/People/Berners-Lee>;publishedIn <http://publisher.org/Journal/JournalSWIS> .

<http://publisher.org/Papers/Paper12345>title "Linked Data - The Story So Far";year "2008-01-01";author <http://w3.org/People/Berners-Lee>;publishedIn <http://publisher.org/Journal/JournalSWIS> .

URIs deferenciables (fichero HTML con RDFa)

http://publisher.org/Papers/Paper12345

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html

GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html

<html><head><title>About Paper 12345</title><link rel="rdf:type" href="foaf:Document" /></head><body><div about=”#Paper12345" typeof=”bo:Article”><h1><span property=”dc:title">Linked Data – The Story So

Far</span></h1><h1><span property=”dc:date">March 23,

2004</span></h1><h2><a href=”http://ijswis.org"

rel=”bo:sdfsdf">International Journal on Semantic Web and Information Systems (IJSWIS)</a></h2>

</body>

<html><head><title>About Paper 12345</title><link rel="rdf:type" href="foaf:Document" /></head><body><div about=”#Paper12345" typeof=”bo:Article”><h1><span property=”dc:title">Linked Data – The Story So

Far</span></h1><h1><span property=”dc:date">March 23,

2004</span></h1><h2><a href=”http://ijswis.org"

rel=”bo:sdfsdf">International Journal on Semantic Web and Information Systems (IJSWIS)</a></h2>

</body>

Read Write Linked Data

Endpoint SPARQL

Exposición de datos

Legacy Data

Consumo de datos• ¿Cómo consumir los datos RDF?

– Navegadores para Linked Data– Motores de búsquedas

• Propósito específico• Propósito general

– Librerías para Linked Data

Navegadores para Linked Data

Motores de búsqueda general: Google

Motores de búsqueda específico: VOA3R

Librerías para Linked Data

Plataformas Linked Data

• Existen plataformas que integran varios servicios semánticos:– Anotación automática (legacy data)– Almacén de datos RDF– Control de versiones– Razonamiento– Linked Data Interfaces – Endpoint SPARQL– Semantic Search– Etc.

Plataformas Linked Data

Iván Ruiz RubeIvan.ruiz@uca.es