Linked data de información geográfica Colombia conforme a GeoSPARQL

42
LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL AUTOR: Jhonny Alexis Saavedra Velásquez TUTORES: Luis Manuel Vilches Blázquez Oscar Corcho García Septiembre, 2011 Caso de aplicación: División territorial y administrativa de Colombia Universidad Politécnica de Madrid Máster en Tecnologías de la Información Jhonny Saavedra

Transcript of Linked data de información geográfica Colombia conforme a GeoSPARQL

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

AUTOR: Jhonny Alexis Saavedra VelásquezTUTORES: Luis Manuel Vilches Blázquez

Oscar Corcho García

Septiembre, 2011

Caso de aplicación: División territorial y administrativa de Colombia

Universidad Politécnica de Madrid

Máster en Tecnologías de la Información

Jhonny Saavedra

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Introducción

• Estado de la cuestión

• Planteamiento

• Contribuciones• Desarrollo de recursos ontológicos

• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 2

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Introducción

Jhonny Saavedra 3

80%

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Linked Data

• Representación gráfica de la localización de datos

• Análisis espaciales

Geomática

• Accesibilidad

• Análisis automáticos

• Integración de fuentes diferentes

Introducción

Jhonny Saavedra 4

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Introducción

• Estado de la cuestión

• Planteamiento

• Contribuciones• Desarrollo de recursos ontológicos

• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 5

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Tipos de representación

• Geometría

• Relaciones espaciales

• Sistema de referencia

• Topónimos

• Tipos de objetos

• Metadatos

Estado de la cuestión

Datos Geoespaciales

Jhonny Saavedra 6

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Categoria Geometria WKT GML GeoRSS GeoJSON WGS84 NeoGeo GeoSPARQL

Point X X X X X X X

Curve X X X

LineString X X X X X X

Line X X X

Orientable Curve X X

Solid X X

Orientable Surface X X

Surface X X X

Polygon X X X X X X

PolyhedralSurface X X X

Triangle X X X

TIN X X X

Circle X X X

ArcString X X

Ring - LinearRing X X X X

Envelope X X X

MultiCurve X X X

MultiLineString X X X X X

MultiPoint X X X X X

MultiSolid X X X

MultiPolygon X X X X X

MultiGeometry X X

Composite X X

CompositePoint X X

CompositeCurve X X

CompositeSurface X X

CompositeSolid X X

X X X

WGS84 X X X X X X X

Otros X X X

Relaciones Espaciales

Sistemas de

Referencia

Primitive

Aggregate

Complex

Formatos de representación Vocabularios RDF

Estado de la cuestiónCaracteristicas geométricas

Jhonny Saavedra 7

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Dbpedia GeoNames OS OpenDATA LinkedGeoData GeoLinkedData

Punto X X X X X

Primitivas X X X

Agregadas X

WKT X

GML X

GeoRSS X

WGS84 X X X X X

Propio X

WGS84 X X X

Otros X

D. Territorial o

A. Adm. X X X

TemáticosInformación

generalPuntos de interes

Hidrografía,

Topografía,

Geografía fisica,

Geográfia humana,

Información

Estadistica

SF OGC X

ERF

RCC8.

Otras X

Topónimos X X X

Triple Store Virtuoso RDF Dump Talis Virtuoso Virtuoso

Aspectos

Geometría

Relaciones

Espaciales

Tipos de objetos

Sistema de

Referencia

Formato de

implementación

Geometría

Estado de la cuestiónIniciativas Linked Data geográfico

Jhonny Saavedra 8

Dbpedia GeoNames OS OpenDATA LinkedGeoData GeoLinkedData

Punto X X X X X

Primitivas X X X

Agregadas X

WKT X

GML X

GeoRSS X

WGS84 X X X X X

Propio X

WGS84 X X X

Otros X

Aspectos

Geometría

Iniciativas Linked Data geográfico

Sistema de

Referencia

Formato de

implementación

Geometría

Dbpedia GeoNames OS OpenDATA LinkedGeoData GeoLinkedData

D. Territorial X X X

TemáticosInformación

generalPuntos de interes

Hidrografía,

Topografía,

Geografía

fisica,

Geográfia

humana,

Información

Estadistica

SF OGC X

ERF

RCC8.

Otras X

Topónimos X X X

Triple Store Virtuoso RDF Dump Talis Virtuoso Virtuoso

Aspectos

Relaciones

Espaciales

Tipos de objetos

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Introducción

• Estado de la cuestión

• Planteamiento

• Contribuciones• Desarrollo de recursos ontológicos

• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 9

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Planteamiento

Generar y publicar Linked Datageográfico de la divisiónterritorial y administrativa deColombia conforme con laespecificación GeoSPARQL.

Objetivo General

Jhonny Saavedra 10

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Planteamiento

Objetivos específicos y resultados

Jhonny Saavedra 11

Objetivos Resultados

Desarrollar la red de ontologías base para la generación del Linked Data.

Red de ontologías que integra:- Ontología aspectos geométricos- Ontología del dominio

Generar conjuntos de datos en formato RDF

Datos en formato RDF

Geometry2RDF (extensión)

Publicar la información conforme a los requerimientos de Linked Data

Linked Data geográfico de la división territorial y administrativa de Colombia

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Contexto

• Planteamiento

• Estado de la cuestión

• Contribuciones

• Desarrollo de recursos ontológicos• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 12

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Metodología

Desarrollo de recursos ontológicos

Jhonny Saavedra 13

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Desarrollo de recursos ontológicos

14Jhonny Saavedra

Esp. requerimientos

Planeación

Búsqueda recursos

E1

Escenario 1

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Desarrollo de recursos ontológicos

Recursos

Jhonny Saavedra 15

Catálogo de objetos (IGAC)

Ley Orgánica de Ordenamiento Territorial

Ontología GML

Ontología Geopolítica.

GeoSPARQL

Simple FeatureDIVIPOLA (DANE)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Desarrollo de recursos ontológicos

16Jhonny Saavedra

GML GeopoliticalSimple Feature GeoSPARQL C.Objetos Ley O.T.

DIVIPOLA

Esp. requerimientos

Planeación

Búsqueda recursos

E1

Ingeniería inversa

Transformación

GeneraciónGeoCol

E2

GeopoliticalC. formato

C. URI

Geopolitical

Extracción RDF-S

E2

SimpleFeatureGeoSPARQL

E4

E3

GeoSPARQLGeoLinkedCol

E3

Proceso

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Desarrollo de recursos ontológicos

Escenario 2

Jhonny Saavedra 17

Entidad Territorial

País Departamento Distrito Municipio Territorio indígena

Área Metropolitana

Asociación E.T.

A. Muncipios A. Departamentos A. Distritos A. Áreas

Metropolitanas Provincia Región

estaFormadoPor

esParteDe estaFormadoPor

esParteDe

estaFormadoPor

esParteDe

Código DANE

Ley de Creación

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI18Jhonny Saavedra

Desarrollo de recursos ontológicos

Escenario 2

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Ontología en RDF-S GML del OGC.

http://schemas.opengis.net/gml/1.0.0/gml.rdfs

Escenario 4

Desarrollo de recursos ontológicos

Jhonny Saavedra 19

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Escenario 3

Feature

Geometry

GML

GeoCol GeoSPARQL

SimpleFeature

owl:equivalentClass

rdf:subClassOf

GeoLinkedCol

Geopolitical

Territory

rdf:subClassOf

Geo:hasGeometry

Desarrollo de recursos ontológicos

Jhonny Saavedra 20

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Contexto

• Planteamiento

• Estado de la cuestión

• Contribuciones

• Desarrollo de recursos ontológicos

• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 21

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Generación y publicación del Linked Data

1. Identificación de recursos de datos

2. Desarrollo del vocabulario (recursos ontológicos)

3. Generación de Datos RDF.

4. Publicación de Datos RDF (Triple store)

5. Vinculación de datos.

Pasos para el desarrollo del Linked Data

Jhonny Saavedra 22

http://geo.linkeddata.es

De León, Alexander, et al. (2010) Geographical Linked Data: a Spanish Use Case, I-SEMANTICS 6th International Conference on Semantic Systems. Graz, Austria.

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Generación y publicación del Linked Data

1. Identificación de recursos de Datos

Jhonny Saavedra 23

Datos división territorial (IGAC)

Datos básicos de población del CENSO 2005 (DANE)

DIVIPOLA (DANE)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Generación y publicación del Linked Data

2. Desarrollo vocabulario

Jhonny Saavedra 24

Feature

Geometry

GML

GeoCol GeoSPARQL

SimpleFeature

owl:equivalentClass

rdf:subClassOf

GeoLinkedCol

Geopolitical

Territory

rdf:subClassOf

Geo:hasGeometry

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

3. Generación de datos: Geometrías

GeoSPARQL

Generación y publicación del Linked Data

Jhonny Saavedra 25

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Especificación OGC (en desarrollo). Establece:

• Un vocabulario para representar objetos, geometrías, y sus relaciones (RDF-S).

• Las funciones espaciales para su uso en consultas SPARQL.

• Un conjunto de reglas de transformación de consulta que permite interactuar con los tipos de objetos y sus geometrías.

Recursos: características geométricas - GeoSPARQL

Desarrollo de recursos ontológicos

Jhonny Saavedra 26

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Desarrollo de recursos ontológicos

27Jhonny Saavedra

3. Generación de datos: Geometrías (2)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

3. Generación de datos en RDF - geometry2RDF

3. Generación de datos: Geometrías (3)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Generación y publicación del Linked Data

Jhonny Saavedra 29

BARRANQUILLA Geometry1

http://geo.linkeddata.es/Barranquilla

rdf.type geontology:Municipio

rdf.type simpleFeature:Multipolygonrdfs:label geo:defaultGeometry

MULTIPOLYGON ((-73.49226890599994 8.422333902000048H))

geo:asWKT

rdf.type simpleFeature:WKTLiteral

Geometry2 Geometry3

geo:sf-overlapsgeo:sf-intersects

3. Generación de datos: Geometrías (4)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

3. Generación RDF: otros atributos

Generación y publicación del Linked Data

Jhonny Saavedra 30

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Generación y publicación del Linked Data

Jhonny Saavedra 31

1.345.678 0500345

http://geo.linkeddata.es/Barranquilla

rdf.type geontology:Municipio

geontology:Población geontology:CódigoDANE

672980

672700geontology:hombres

geontology:mujeres

3. Generación RDF: otros atributos (2)

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Características\Triple Store Virtuoso OWLIM AllegroGraph OpenSahara Parliament

Vocabulario WGS84 WGS84 Propio Propio GeoSPARQL

Geometrías Puntos Puntos Primitivas Todas Todas

Serialización No No No Si Si

Relaciones espaciales No No Si Si Si

Funciones espaciales Si Si Si Si Si

Generación y publicación del Linked Data

4. Publicación de datos

Jhonny Saavedra 32

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

4. Publicación de datos (2)

Triple store Open Source desarrollado por RaytheonBBN Technologies.

• Compilación e instalación

• Inserción de datos RDF generados.

• Pruebas de funcionamiento.

Generación y publicación del Linked Data

Jhonny Saavedra 33

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

4. Publicación de datos (3)

Generación y publicación del Linked Data

Jhonny Saavedra 34

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

4. Publicación de datos (4)

Generación y publicación del Linked Data

Jhonny Saavedra 35

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI36Jhonny Saavedra

4. Publicación de datos (5)

Generación y publicación del Linked Data

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

5. Vinculación de datosSILKGeneración y publicación del Linked Data

Jhonny Saavedra 37

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Control de enlaces5. Vinculación de datos

Generación y publicación del Linked Data

Jhonny Saavedra 38

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

• Introducción

• Planteamiento

• Estado de la cuestión

• Desarrollo de recursos ontológicos

• Generación y publicación del Linked Data

• Conclusiones resultados y líneas futuras

Contenido

Jhonny Saavedra 39

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Conclusiones, resultados, y líneas futuras

Conclusiones: Vocabularios y ontologías geoespaciales

• La especificación mas completa es GeoSPARQL. Esta recoge muchos de los aspectos desarrollados por otras iniciativas de Linked Data geográfico.

• Las divisiones territorialesinsumo básico generar Linked Data.

• La red de ontologías generada es un recurso reutilizable en otros proyectos de Linked Data.

Jhonny Saavedra 40

• Parliament implementa GeoSPARQL, y puede realizar consultas espaciales.

• Geometry2RDF, genera RDF según GeoSPARQL

• El que Geometry2RDF soporte archivos de tipo shapefilesimplifica el proceso de conversión de geometrías a RDF

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Conclusiones, resultados y líneas futuras

Líneas Futuras

• Opción de serializar solo geometrías simples yrepresentar las compuestas como un conjunto deestas GeoSPARQL.

• Implementación de GeoSPARQL en otros Triplestore.

• Desarrollo de herramienta de visualización dedatos.

Jhonny Saavedra 41

LINKED DATA GEOGRÁFICO CONFORME A GEOSPARQL

Tesis Máster TI

Motivation

Gracias

[email protected]

Jhonny Saavedra 42