ARTICULO-12_05_22-MC-V1

10
Bases de Datos Espaciales: Conceptos Fundamentales Resumen El mayor uso de tecnologías de información como es el caso de los Sistemas de Información Geográfica (SIG), junto con el surgimiento en la última década de aplicaciones y servicios en la Web basados en el componente geográfico ha impactado notoriamente tanto a grandes organizaciones como a personas del común que ven como la parte espacial se integra en las decisiones que toman a diario para el cumplimiento de sus diversos fines. De acuerdo a lo anterior, cada vez es mayor la cantidad de información geográfica que se dispone y por ende también es mayor la necesidad de contar con un sistema adecuado que se encargue del almacenamiento y disposición de los datos generados. Este artículo hace una relación de los conceptos básicos que se tienen en cuenta a la hora de definir y clasificar las bases de datos espaciales, teniendo en cuenta además la evolución histórica y el modelamiento propio en las bases de datos espaciales más importantes hoy en día como son la Geodatabase (GDB), Middleware y Nativa. Palabras clave: dato espacial, base de datos, modelo de datos, geometría, topología, almacenamiento, DBMS, SDBMS, RDBMS. SPATIAL DATABASES: Fundamental Concepts Abstract The vast use of information technologies like Geographic Information Systems (GIS) together with the raise in the last decade of applications and geographic Web based services has notoriously impacted both organizations and common persons who seen how the spatial is integrated in the diary decisions for the accomplishment of its various purposes. According to the above, each time is greater the quantity of the geographic information disposed and therefore is greater the needed of have an adequate system to be responsible of the storage and disposition of the generated data. This article makes a relation of the basic concepts to be considered at the moment of define and classify the spatial databases, taking into account 1 Luz Carolina Galvis Huertas 1 Monica del Pilar Gamba 2

description

BD spacial

Transcript of ARTICULO-12_05_22-MC-V1

Gua para la elaboracin de

Bases de Datos Espaciales:

Conceptos FundamentalesResumenEl mayor uso de tecnologas de informacin como es el caso de los Sistemas de Informacin Geogrfica (SIG), junto con el surgimiento en la ltima dcada de aplicaciones y servicios en la Web basados en el componente geogrfico ha impactado notoriamente tanto a grandes organizaciones como a personas del comn que ven como la parte espacial se integra en las decisiones que toman a diario para el cumplimiento de sus diversos fines. De acuerdo a lo anterior, cada vez es mayor la cantidad de informacin geogrfica que se dispone y por ende tambin es mayor la necesidad de contar con un sistema adecuado que se encargue del almacenamiento y disposicin de los datos generados.

Este artculo hace una relacin de los conceptos bsicos que se tienen en cuenta a la hora de definir y clasificar las bases de datos espaciales, teniendo en cuenta adems la evolucin histrica y el modelamiento propio en las bases de datos espaciales ms importantes hoy en da como son la Geodatabase (GDB), Middleware y Nativa. Palabras clave: dato espacial, base de datos, modelo de datos, geometra, topologa, almacenamiento, DBMS, SDBMS, RDBMS. SPATIAL DATABASES:

Fundamental Concepts Abstract

The vast use of information technologies like Geographic Information Systems (GIS) together with the raise in the last decade of applications and geographic Web based services has notoriously impacted both organizations and common persons who seen how the spatial is integrated in the diary decisions for the accomplishment of its various purposes.According to the above, each time is greater the quantity of the geographic information disposed and therefore is greater the needed of have an adequate system to be responsible of the storage and disposition of the generated data. This article makes a relation of the basic concepts to be considered at the moment of define and classify the spatial databases, taking into account the historical evolution and the own modeling in the most important spatial databases today: Geodatabase (GDB), Middleware and Native. Key Words: spatial data, database, data model, geometry, topology, storage, DBMS, SDBMS, RDBMS. 1. Introduccin Con el desarrollo de tecnologas de la informacin se genera simultneamente un crecimiento en las tcnicas de recoleccin y anlisis de datos. Es as que las bases de datos almacenan, clasifican y procesan grandes cantidades de informacin, beneficiando a diversos sectores ya que su uso organizado conlleva a la optimizacin de tiempo y dinero gracias al reconocimiento de sus propios recursos.

De otra parte, los datos geogrficos que son adquiridos y manipulados a travs de diferentes medios como son los sensores remotos, Sistemas Globales de Navegacin Satelital (GNSS), cartografa anloga, aplicativos SIG y otros, requieren de una forma de almacenamiento que simbolice de forma fiable y precisa el mundo real que representa. Como forma de integrar los datos espaciales con la informacin alfanumrica, se presenta el concepto de base de datos espacial (BDE), que se conforma por un conjunto de datos espaciales (puntos, lneas, polgonos, raster, etc.), y se organizan de acuerdo al contexto de los datos, como las que definen el espacio fsico y los objetos relacionados en l, este conjunto de datos son procesados para ser expresados en informacin manipulable de programas informticos [1].Aunque desde la segunda mitad del siglo XX se desarroll la forma de almacenamiento y organizacin en archivos planos as como la creacin de diferentes modelos de datos (jerrquico, red, relacional, entidad-relacin y orientado a objetos), es a partir de la dcada de los noventa que se empez a recorrer el camino de la inclusin del componente geogrfico dentro de las bases de datos tradicionales con el fin de beneficiarse de las operaciones comunes a toda base de datos como puede ser la administracin, acceso, integridad de los datos y seguridad, por citar algunos. Cabe mencionar algunas soluciones de almacenamiento de datos geogrficos que surgieron a mediados de los noventa como es el caso del motor de almacenamiento de datos Spatial Database Engine (SDE) de la empresa ESRI. Por parte de la empresa Oracle se desarroll la extensin conocida como Spatial Data Option (Oracle Spatial). Y a comienzos del siglo XX surge como complemento al Sistema Gestor de Base de datos postgreSQL la extensin espacial denominada PostGIS.Finalmente, a nivel de estandarizacin en la definicin de objetos, operaciones y mtodos de manipulacin de los datos espaciales dentro de las bases de datos, se crea en 1994 la Open Geospatial Consortium (OGC) como organizacin que agrupa diversas entidades, universidades y empresas dedicadas a facilitar la implementacin e intercambio de la informacin geogrfica integrada en las diferentes bases de datos existentes en el mercado.2. Modelando DatosEn las bases de datos se intenta reproducir una informacin real que sea de fcil manipulacin, para esto en el modelamiento de datos es necesario generar reglas que aseguren la integridad de la informacin, y que a su vez contenga un esquema de relaciones lgicas que automaticen tareas, relacionen y procesos que funcionen dentro del sistema de informacin geogrfica. [2]2.1 El Modelo Conceptual

Como punto de partida, se tiene el modelo conceptual, el cual tiene como fin generar un esquema conceptual en la base de datos que traduzca los requerimientos del problema generados en el mundo real, as este no se concentra en la implementacin si no en el entendimiento del problema, es por esto que el modelo es independiente de cualquier aplicacin del software.

Entonces se tienen dos elementos bsicos: la entidad y la relacin entre entidades: La entidad es tomada como el objeto del mundo real que tiene sus propias caractersticas propias (atributos) y rango de valores (dominios).

La relacin entre entidades, que se caracterizan por el grado do multiplicidad en el nmero de entidades que se relacionan [3].

En el caso de las bases de datos espaciales los atributos se definen igual que los atributos no espaciales, pero en el caso de las relaciones espaciales, estas se denominan operadores racionales topolgicos.2.2 El Modelo Lgico

En el modelo lgico se especifica el almacenamiento de datos en la memoria del computador, que organiza el conjunto de entidades, atributos y relaciones relevantes dentro de la base de datos, y establece el concepto de integridad mediante claves primarias a nivel de entidad, claves forneas a nivel referencial y restricciones de chequeo a nivel de dominio [2]. El modelo lgico es consecuencia del modelo conceptual previo.2.3 El Modelo Fsico

El modelo fsico representa el esquema de cmo sern almacenados, manejados y accedidos los datos por el software DBMS. Adicional de la definicin de entidades y relaciones, se establecen tambin las integridades a nivel de claves primarias, forneas y de restricciones de chequeo. 3. Tipos de Modelos de Datos

Los diversos modelos de datos cuentan con caractersticas que dependiendo a la estructura de los datos y el grado de asociacin entre ellos pueden ayudar a una mejor aproximacin y entendimiento del mundo que quieren representar, por consiguiente es necesario utilizar un modelo apropiado de acuerdo a las necesidades de organizacin de la base de datos correspondiente.3.1 Modelo de Datos Relacional

En este modelo se relacionan los datos en forma de tablas o relaciones, que se componen de atributos (columnas), dominios (conjunto de valores que puede tomar el atributo) y tuplas (registros que contiene cada instancia de relacin). En el almacenamiento de datos espaciales este modelo es muy utilizado debido a la facilidad en el manejo de los datos, ya que la estructura es flexible al poder ingresar primero los datos y luego las relaciones, lo que facilita las bsquedas siempre y cuando existan campos comunes entre las tablas. Los inconvenientes que presenta el modelo son la implementacin un poco dispendiosa, lento desempeo por el aumento de confrontaciones entre tablas vinculadas, la representacin restringida del mundo real y la limitada flexibilidad en las consultas y administracin de los datos [4].3.2 Modelo de Datos Orientado a Objetos

En este modelo, los datos se almacenan en objetos, que son descritos tanto en su estado (atributos) y comportamiento (mtodos) para hacer una representacin ms compleja y detallada del mundo real.Este tipo de modelos posee una estructura de datos basada en el diagrama de clases definido segn el estndar UML (Unified Modelling Language), que en esencia se refiere a: Objetos: representaciones del mundo real compuestos por propiedades, mtodos y mensajes para interactuar con otros objetos.

Atributos: propiedades, que definen el estado de un objeto. Pueden ser simples o compuestos.

Mtodos: representan operaciones, funciones y procedimientos para cada objeto.

Asociaciones: representan relaciones entre clases de multiplicidad y asociaciones en trminos de herencia, instanciacin, agregacin y composicin [5].Entre las ventajas de este modelo se puede encontrar un grado de modelamiento ms fiel a la realidad, con un lenguaje ms sencillo, y con un grado de integridad mayor gracias al encapsulamiento de cada uno de los datos como objetos y la reduccin de repeticin de la informacin por agrupacin de clases que mejora el tiempo de desarrollo. Por otra parte los inconvenientes que se presentan son la dificultad en el diseo y creacin y sobretodo el difcil intercambio de informacin con bases de datos relacionales que son las ms comunes en el mercado.3.3 Modelo de Datos Objeto RelacionalEste modelo es una mezcla entre el modelo relacional y el modelo orientado a objetos. En este modelo el usuario puede crear sus propios tipos de datos y generar funciones a partir de cada uno, adems de gestionar y almacenar datos complejos, lo que proporciona mayor flexibilidad y seguridad que el modelo relacional. Las bases de datos objeto relacionales conservan el acceso por medio de SQL, los datos se almacenan en tablas pero se utilizan mecanismos de orientacin de objetos para definir y acceder a los datos, lo que en principio le confiere mayor capacidad de representacin del mundo real [6].3. Datos Espaciales

Se consideran datos espaciales a la informacin recopilada en un punto geogrfico que estn relacionados con diversos factores medio ambientales, representados en una figura geomtrica que puede ser punto, lnea y polgono principalmente y que requiere para su anlisis y almacenamiento de un sistema de informacin especial [1].Los datos espaciales al provenir de diferentes fuentes y ser representados de diversas formas deben ser almacenados y manipulados en la base de datos espacial a travs de un correcto modelamiento que corresponda con la realidad que representa, aspecto que ser detallado a continuacin.

5. Bases de Datos Espaciales

Las bases de datos espaciales permiten de forma organizada almacenar y consultar datos espacialmente referenciados, estos objetos muestran atributos, localizacin (geometra y ubicacin del objeto) y topologa (relaciones espaciales entre objetos). Las bases de datos espaciales se administran en un sistema de gestin de bases de datos espacial (SDBMS) que almacena la descripcin de los objetos y el lenguaje de consulta se extiende para manejar nuevos tipos de datos y diversas funciones utilizando criterios espaciales como algoritmos, joins y reglas de dominio especificas que permiten la optimizacin de consultas, seleccin y recuperacin de datos [7]. Al igual que una base de datos tradicional, en una base de datos espacial tambin soporta polticas de integridad de los datos, seguridad y concurrencia. Una ventaja de la base de datos espacial radica fundamentalmente en la capacidad de ejecutar operaciones espaciales para geometras simples, u operadores bsicos (referencia espacial, envolvente, lmite, etc.) y entre varias geometras u operadores topolgicos (interseccin, interior, contenencia, etc.) y de anlisis espacial (distancia, buffer, unin, diferencia), de acuerdo a la clasificacin establecida por la OGC para operadores espaciales [8]. 5.1 Tipos de Bases de Datos

5.1.1 GeodatabaseUna Geodatabase es considerada como un tipo de base de datos espacial objeto relacional, el cual permite el almacenamiento de numerosos tipos de datos geogrficos a travs de geometras, topologas, tablas, etc., permitiendo el almacenamiento de los datos alfanumricos en tablas INFO y DBF y espaciales en formato vector, raster y TIN. Este tipo de base de datos espacial fue introducido por la empresa ESRI desde el programa ArcInfo a finales de los aos noventa y es de las de ms amplio uso por la posicin de la marca comercial en muchos pases.

Al interior de la Geodatabase se tienen elementos denominados Feature Classes, que son objetos que poseen atributos y comportamientos con el mismo tipo de geometra, atributos y referencia espacial. A su vez, los Features Classes que comparten la misma temtica, sistema de referencia espacial y participan en relaciones topolgicas y de edicin se agrupan en colecciones denominadas Feature Datasets. Tambin se puede agrupar en un mismo Feature Dataset redes geomtricas, relaciones no espaciales y topologa.

Las Geodatabases se clasifican segn el tipo de DBMS, tamao de almacenamiento, edicin multiusuario, entre otros:

Personal: almacenadas en Microsoft Access, con capacidad mxima de 2GB.

File: permite edicin monousuario, sin lmite en el tamao de almacenamiento.

Enterprise: el almacenamiento se da en los ms comunes DBMS sin lmite del tamao y permite edicin mltiple.

Algo importante dentro de la Geodatabase es el papel de la topologa ya que es la que se encarga de determinar las relaciones de adyacencia y conectividad entre elementos espaciales. La topologa se emplea con el fin de integrar y validar la geometra de cada feature, controlar las labores de edicin, definir las relaciones entre features y sobretodo, asegurar la integridad y calidad de los datos [10].

Para la creacin avanzada de la Geodatabase esta se hace a travs de un software tipo CASE como Microsoft Visio o IBM Rational Rose, estas herramientas permiten generar un esquema de base de datos y desarrollar el modelo fsico, controlando posibles errores antes de su implementacin. En el caso de Visio, esto se desarrolla a partir de una plantilla UML en donde se generan paquetes para los Feature Datasets y Feature Class y se modelan los atributos, relaciones, dominios y dems reglas de asociacin entre clases. Posteriormente se genera un documento intermedio en un archivo XML que es validado y exportado en el software ArcGis como esquema de Geodatabase.

Como ventajas en el uso de las geodatabases tienen que ver con la amplia difusin a nivel mundial, suficiente documentacin, mayor facilidad de modelamiento de la realidad del problema, portabilidad en los diferentes DBMS que soporta y el almacenamiento de gran cantidad de tipos de datos, topologa avanzada y edicin multiusuario, entre otros.

La gran desventaja del uso de este tipo de base de datos espacial recae en el uso exclusivo del software propietario para la elaboracin de los modelos (CASE) as como en las herramientas propias de la firma ESRI, del DBMS que se utilice segn el tamao del proyecto y finalmente se tiene que el modelado no sigue en su totalidad los estndares UML, as como el acceso de los datos no es a travs del DBMS utilizado si no a travs de la herramienta SIG de ESRI.

5.1.2 Middleware

El trmino Middleware hace referencia a una aplicacin para interactuar o comunicarse con otras aplicaciones [9]. Aplicado a las bases de datos espaciales, el Middleware es una aplicacin intermediaria entre el RDBMS y la aplicacin cliente, integrando en un solo cuerpo la informacin alfanumrica y la espacial, ya que el entiende y maneja la lgica espacial.

Dentro de este tipo de Middleware la ms importante corresponde a ArcSDE (Spatial Database Engine) de la empresa ESRI. Esta aplicacin permite almacenar en las tablas denominadas layers que estn de un RDBMS, atributos alfanumricos y espaciales. Para poder consultar y operar estos layers, se hace por medio de una serie de comandos desde Command Prompt (smbolo del sistema) del sistema operativo utilizado.El proceso de implementacin de la tabla espacial comienza con la creacin de la tabla y el atributo espacial y los alfanumricos. Para el caso del atributo espacial, este se hace teniendo en cuenta una serie de parmetros como el nombre del layer, geometra (punto, lnea, espagueti, polgono, anotacin, CAD, 3D), dominio espacial, grilla, sistema de coordenadas y precisin, principalmente. Posteriormente se realiza el cargue de los datos a travs del comando SHP2SDE, el cual tambin utiliza una serie de parmetros. Con este comando es posible exportar informacin de archivos shape a una clase con su correspondiente geometra y atributos en ArcSDE, Como ventaja del uso de este tipo de datos se encuentran en el aprovechamiento de las capacidades de la base de datos relacional, la administracin centralizada de las transacciones del aspecto espacial y atributivo. Otro aspecto a resaltar tiene que ver con la edicin multiusuario simultnea. En cuanto a las desventajas se tienen la administracin compleja por parte de personal altamente calificado, tiempos de procesamiento y ejecucin algo lentos, alto costo de la herramienta y el uso de lenguajes de acceso y consulta propios y no basados en estndares aceptados. 5.1.3 Base de Datos NativaEn la base de datos nativa, el dato espacial es integrado y tratado en la base de datos como un atributo ms, es decir que la geometra y los dems atributos (numricos, texto, fecha, etc.) se encuentran al mismo nivel, de ah su nombre.

De las bases de datos nativas ms importantes en el mercado cabe mencionar Oracle con su componente Oracle Spatial. En esta base de datos el atributo espacial se almacena a travs de la definicin de su geometra en una columna denominada SDO_GEOMETRY (que puede almacenar puntos, curvas, polgonos, entre otros) y el cual es conformado a travs de la definicin de dos tipos de datos: abstractos (ADT) y el definido por el usuario (UDT), aadiendo el primero a los tipos de datos existentes y el segundo como producto de las funciones de los mismos. La creacin y manipulacin se realiza de la misma manera para los datos tradicionales, a travs de sentencias DDL y DML.

De igual manera, la base de datos nativa soporta aparte de las consultas entre elementos tradicionales, consultas entre las geometras de los objetos espaciales, basadas en el cumplimiento de los estndares establecidos por parte de la OGC, como Envolvente, Referencia Espacial, Interseccin (geometra), Distancia, Buffer, Unin, Diferencia (localizacin).

Finalmente y sumado a lo anterior, este tipo de base de datos posee poderosos mecanismos de filtrado espacial basado en la reduccin de rectngulos limitantes y de bsqueda basado en ndices espaciales (Grid, R-Tree, B-Tree).

En cuanto a las ventajas en el uso de este tipo de bases de datos espaciales se encuentran el soporte de tipos de geometras como puntos, arcos, crculos, multipolgonos y otros ms, la creacin y ajuste de ndices espaciales que mejora el rendimiento y las consultas en la base de datos, el uso del estndar SQL extendido para consulta y manejo de los elementos espaciales y el soporte en el control de accesos, integridad de datos y seguridad, entre otros.

Por otra parte, las desventajas se encuentran en el alto costo de la herramienta (aunque existen alternativas de carcter libre y cdigo abierto) as como su difcil implementacin, rigidez en la estructura de los datos y especializada administracin por personal altamente calificado.CONCLUSIONES

La representacin de la realidad en un modelo computacional que lo explique de la forma ms fiel posible es descrita en el presente artculo a travs de una serie de modelamientos e implementaciones en los tipos de bases de datos espaciales ms usados actualmente. Antes de llevar a cabo el diseo e implementacin de una base de datos en cualquier organizacin, cabe preguntarse cual es el alcance del mismo, las ventajas en el modelamiento utilizado, ya sea que se escoja la opcin de hacerla por medio de los modelos conceptual, lgico o fsico (para el caso de las bases de datos nativa o Middleware) o a travs del diagrama de clases UML (Geodatabase), el costo econmico que implica la eleccin del sistema manejador de base de datos (Nativa, Middleware y Geodatabase), el software Middleware o las herramientas de desarrollo e implementacin de los modelos UML (Geodatabase), as como el seguimiento de estndares adoptados por la comunidad internacional, la experticia del personal encargado de la administracin y mantenimiento y la facilidad de la escalabilidad hacia soluciones ms robustas, seguras y giles que demande el mercado hoy en da. Estas y otras ms cuestiones por supuesto, ayudarn a que la solucin que se escoja sea la ms adecuada para las necesidades de la organizacin y sea llevada con mayores posibilidades de xito. REFERENCIAS BIBLIOGRFICAS

[1] Franco Rodolfo, Sistemas de Informacin Geogrfica, 2010, disponible en

http://gemini.udistrital.edu.co/comunidad/profesores/rfranco/intro.htm]

[2] ESRI Chile, disponible en http://www.esri-chile.com/biblioteca/Que_es_un_SIG.pdf[3] Merchn Oswaldo, Fundamentos de bases de datos, 2004, disponible en http://www.uazuay.edu.ec/isi/Fundamentos%20de%20Bases%20de%20Datos.pdf[4] El modelo relacional. Fundamentos de diseo de bases de datos, disponible en

http://elvex.ugr.es/idbis/db/docs/intro/D%20Modelo%20relacional.pdf[5] Zeiler Michael, Modelling Our World, ESRI Press, 1999

[6] Costilla Carmen, Modelo de Datos Objeto-Relacional, 2009, disponible en http://sinbad.dit.upm.es/docencia/grado/curso0910/TemaV%20SQL/3%20Docu%20BDOR%20Parte%202%20-%20Nov%202009.pdf.[7] Gutirrez Mariela, El rol de las Bases de Datos Espaciales en una Infraestructura de Datos, 2006, disponible en http://www.cp-idea.org/documentos/tecnologia/Rol%20de%20las%20bases%20de%20datos%20espaciales%20en%20una%20IDE.pdf[8] Spatial Query Operatorsfrom SQL/MM and others, 2008, disponible en http://portal.opengeospatial.org/files/?artifact_id=30402[9] Karne Bishop, A Survey of the Middleware, disponible en ton.towson.edu/~karne/research/middlew/surveym.pdf[10] Zwicker Colin, Pierce Brent, Geodatabase An Introduction, disponible en http://www.cica.es/PDFS/Impresos/ESRI/CD_1/tws/tw_685.pdfAutoresLuz Carolina Galvis HuertasNaci en Bogot, Colombia. Es Ingeniera Catastral y Geodesta de la Universidad Distrital, de Bogot, Colombia.

Actualmente se desempea como profesional en el rea de Cartografa y Geografa del Instituto geogrfico Agustn Codazzi y es estudiante de la Especializacin en Sistemas de Informacin Geogrfica en la Universidad Distrital Francisco Jos de Caldas de Bogot, Colombia.

e-mail: [email protected] del Pilar Gamba

Naci en Bogot, Colombia. Es Ingeniera Catastral y Geodesta de la Universidad Distrital, Francisco Jos de Caldas de Bogot, Colombia.

Actualmente se desempea como tcnico grado 16 en el Servicio Geolgico Colombiano (SGC) y es estudiante de la Especializacin en Sistemas de Informacin Geogrfica en la Universidad Distrital Francisco Jos de Caldas de Bogot, Colombia.

e-mail: [email protected]

Luz Carolina Galvis Huertas1

Monica del Pilar Gamba2

1Estudiante de Especializacin en Sistemas de Informacin Geogrfica, Universidad Distrital.

PAGE 1