Post on 16-Dec-2014
description
Iván Ruiz Rube
Herramientas para la publicación y consulta de Linked Open Data
25 de Abril de 2013
Desarrollo de software orientado a servicios y procesos de aprendizajeItinerario de Doctorado en Modelado, Simulación y Pruebas de Procesos y Tratamiento de Señales y Datos
Introducción• La Web de Linked Data promueve la integración de datos entre diferentes sistemas (LD o no LD).– Interoperabilidad sintáctica: formato RDF
– Interoperabilidad semántica: ontologías o vocabularios RDF
• Se necesitan herramientas para la publicación y la utilización de datos de datasets RDF.
Contenidos• Diseño de ontologías• Generación de datos• Gestión de datos• Exposición de datos• Consumo de datos• Plataformas Linked Data
Diseño de ontologías
• ¿Cómo construir vocabularios?– Herramientas específicas
• Herramientas completas OWL• Editores de vocabularios RDF
– Herramientas de modelado UML• Soporte al perfil ODM
– Herramientas genéricas• Editores de texto XML, JSON, Turtle/N3
– Ingeniería inversa• Base de datos• ORM
Herramientas OWL: Protégé
Herramientas RDF: Neologism
Herramientas UML: Enterprise Architect
Herramientas edición: RDF Validator Service
Herramientas Ingeniería Inversa
Generación de datos
• ¿Cómo generar datos RDF?– Herramientas genéricas
• Editores de texto XML, JSON, Turtle/N3
– Herramientas especificas de dominio• Editores SKOS, Dublin Core, etc.
– Herramientas de anotación automática• API Wrappers• RDB Wrappers• Structured Data Extractos• Textual Content Extractors
Herramientas específicas de dominio
Herramientas de anotación automática
Herramientas de anotación automática
20082008
JournalSemanticWebJournalSemanticWeb
W3CW3C
The Story So Far
The Story So Far
Berners-LeeBerners-LeeLinkedDataLinkedData
API Wrappers: Virtuoso RDF Proxy
Relational Databases Wrappers: D2RQ
map:OrganisationUnits a d2rq:ClassMap;d2rq:dataStorage map:database;d2rq:class cerif:Organization;d2rq:uriPattern "organizations/@@ORGANISATIONS.ACRONYM@@";d2rq:condition "ORGANISATIONS.ACRONYM <> ''“ .
map:OrganisationUnits_Headcount a d2rq:PropertyBridge;d2rq:belongsToClassMap map:OrganisationUnits;d2rq:property cerif:headcount;d2rq:column "ORGANISATIONS.HEADCOUNT “ .
http://dataset.org/organizations/UCAhttp://dataset.org/organizations/UCA
http://www.eurocris.org/cerif/1.3#Organization
http://www.eurocris.org/cerif/1.3#Organization
rdf:typecerif:headcount
24002400
Structured Content Extractors: Open Refine (RDF ext.)
Textual Content Extractors: Apache Stanbol
Gestión de datos• ¿Dónde viven los datos RDF?
– Directorio del servidor web • Ficheros RDF (XML, N3, etc.)• Ficheros HTML+RDFa
– RDF Store• Almacén de tripletas Subject-Predicate-Object
– No se almacenan• Cuando se utilizan wrappers (on-the-fly)
• Razonamiento
RDF Stores
Razonadores
($p http://www.w3.org/2000/01/rdf-schema#domain $d), ($1 $p $2) ($1 http://www.w3.org/1999/02/22-rdf-syntax-ns#type $d)
($p http://www.w3.org/2000/01/rdf-schema#domain $d), ($1 $p $2) ($1 http://www.w3.org/1999/02/22-rdf-syntax-ns#type $d)
Exposición de datos
• Linked Data Interface– URIs deferenciables– Read Write Linked Data
• Linked Data Endpoint– SPARQL – SPARQL/Update
URIs deferenciables (fichero HTML)
http://publisher.org/Papers/Paper12345
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html
<html><head><link rel="alternate" type="application/rdf+xml"
href=”Paper12345.rdf"></head><body><h1>Linked Data – The Story So Far</h1><h2><a href=“http://ijswis.org”>International Journal on
Semantic Web and Information Systems (IJSWIS)</a></h2>
<h3>Published on 2008-01-01 </h3><h3>Author: Tim Berners-Lee</h3> </body>
<html><head><link rel="alternate" type="application/rdf+xml"
href=”Paper12345.rdf"></head><body><h1>Linked Data – The Story So Far</h1><h2><a href=“http://ijswis.org”>International Journal on
Semantic Web and Information Systems (IJSWIS)</a></h2>
<h3>Published on 2008-01-01 </h3><h3>Author: Tim Berners-Lee</h3> </body>
URIs deferenciables (fichero XML)
http://publisher.org/Papers/Paper12345
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: application/rdf+xml
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: application/rdf+xml
<rdf:Description rdf:about="http://publisher.org/Papers/Paper12345">
<title>Linked Data - The Story So Far</title>
<year>2008-01-01</year>
<author rdf:resource="http://w3.org/People/Berners-Lee" />
<publishedIn rdf:resource="http://publisher.org/Journal/JournalSWIS" />
</rdf:Description>
<rdf:Description rdf:about="http://publisher.org/Papers/Paper12345">
<title>Linked Data - The Story So Far</title>
<year>2008-01-01</year>
<author rdf:resource="http://w3.org/People/Berners-Lee" />
<publishedIn rdf:resource="http://publisher.org/Journal/JournalSWIS" />
</rdf:Description>
URIs deferenciables (fichero N3)
http://publisher.org/Papers/Paper12345
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/n3
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/n3
<http://publisher.org/Papers/Paper12345>title "Linked Data - The Story So Far";year "2008-01-01";author <http://w3.org/People/Berners-Lee>;publishedIn <http://publisher.org/Journal/JournalSWIS> .
<http://publisher.org/Papers/Paper12345>title "Linked Data - The Story So Far";year "2008-01-01";author <http://w3.org/People/Berners-Lee>;publishedIn <http://publisher.org/Journal/JournalSWIS> .
URIs deferenciables (fichero HTML con RDFa)
http://publisher.org/Papers/Paper12345
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html
GET /Papers/Paper12345 HTTP/1.1Host: publisher.orgAccept: text/html
<html><head><title>About Paper 12345</title><link rel="rdf:type" href="foaf:Document" /></head><body><div about=”#Paper12345" typeof=”bo:Article”><h1><span property=”dc:title">Linked Data – The Story So
Far</span></h1><h1><span property=”dc:date">March 23,
2004</span></h1><h2><a href=”http://ijswis.org"
rel=”bo:sdfsdf">International Journal on Semantic Web and Information Systems (IJSWIS)</a></h2>
</body>
<html><head><title>About Paper 12345</title><link rel="rdf:type" href="foaf:Document" /></head><body><div about=”#Paper12345" typeof=”bo:Article”><h1><span property=”dc:title">Linked Data – The Story So
Far</span></h1><h1><span property=”dc:date">March 23,
2004</span></h1><h2><a href=”http://ijswis.org"
rel=”bo:sdfsdf">International Journal on Semantic Web and Information Systems (IJSWIS)</a></h2>
</body>
Read Write Linked Data
Endpoint SPARQL
Exposición de datos
Legacy Data
Consumo de datos• ¿Cómo consumir los datos RDF?
– Navegadores para Linked Data– Motores de búsquedas
• Propósito específico• Propósito general
– Librerías para Linked Data
Navegadores para Linked Data
Motores de búsqueda general: Google
Motores de búsqueda específico: VOA3R
Librerías para Linked Data
Plataformas Linked Data
• Existen plataformas que integran varios servicios semánticos:– Anotación automática (legacy data)– Almacén de datos RDF– Control de versiones– Razonamiento– Linked Data Interfaces – Endpoint SPARQL– Semantic Search– Etc.
Plataformas Linked Data