Seminario Almacenamiento de Datos Ambientales Hoy

56
Almacenamiento de Datos Ambientales Hoy Portada Isaac Francés – Balbino Fernández Almacenamiento de Datos Ambientales Hoy

Transcript of Seminario Almacenamiento de Datos Ambientales Hoy

Page 1: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Portada Isaac Francés – Balbino Fernández

Almacenamiento de Datos Ambientales Hoy

Page 2: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

2

Ciencia y SIG

!   La actividad científica genera infinidad de datos

Page 3: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

3

Los Datos

!   Datos de campo !   Datos de laboratorio

!   Datos que tienen una representación espacial

Page 4: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

4

Guardando los datos

!   Los investigadores y las investigadoras guardamos estos datos de muchas maneras.

!   EN PAPEL !   DIGITALES

Page 5: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

5

Base de Datos Geográfica (BDG)

!   Si guardo los datos como yo quiero….

!   NO LOS PUEDO COMPARTIR !   NO FACILITO LA COLABORACIÓN – EL TRABAJO EN

GRUPO

!   Lo mejor es usar una BASE DE DATOS GEOGRÁFICA y seguir una serie de estándares.

Page 6: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

6

COMPLEJIDAD

!   La experiencia nos dice que trabajar con bases de datos geográficas…

ES UN TEMA……

¡¡¡¡DIFÍCIL!!!!

Page 7: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Definición de SIG

!   Un sistema para entrada, almacenamiento, manipulación y salida de información geográfica

!   Un tipo de software !   Un ejemplo práctico de SIG combina software con

hardware, datos, usuarios, etc., para resolver un problema, ayudar a la toma de decisiones, el planeamiento y la gestión

“La tecnología SIG es al análisis geográfico lo que el microscopio y los ordenadores han sido para otras ciencias” (Gutiérrez y Gould, 1994, p. 38)

Page 8: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Definición de SIG

Un sistema de hardware, software y procedimientos elaborados para facilitar la obtención, gestión, manipulación, análisis, modelado, representación y salida de datos espacialmente referenciados, para resolver problemas complejos de planificación y gestión (NCGIA, 1990)

Page 9: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Funciones de los SIG

ENTRADA DE INFORMACIÓN

GESTIÓN

FUNCIONES DE ANÁLISIS

SALIDA GRÁFICA Y CARTOGRAFICA

Almacenamiento Actualización Recuperación

Conversión / transformación de información geográfica a formato digital

SIG como “máquina de simulación”

Page 10: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Tipo de cuestiones que un SIG puede responder

!   LOCALIZACIÓN: ¿Qué hay en…? !   CONDICIÓN: ¿Dónde se cumple qué…? !   PATRONES DE DISTRIBUCIÓN !   TENDENCIAS/ANÁLISIS DE CAMBIOS !   RUTAS ÓPTIMAS/ANÁLISIS DE REDES !   MODELOS/SIMULACIONES

Page 11: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

Etapas de un proyecto SIG

!   Definición de objetivos !   Recogida de datos existentes !   Creación de nuevos datos !   Integración de datos !   Corrección de errores !   Manipulación de coordenadas !   Análisis (espacial, geoestadístico, 3D) !   Representación !   Mantenimiento

Page 12: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

12

Tipos de Usuarios SIG

! Usuario instrumental: utilización de un programa o

programas para realizar tareas concretas. ! Analista SIG temático: conocimiento no sólo de los

programas, sino de las técnicas SIG en general y/o aplicadas a un campo temático determinado. Los SIG como forma de pensar sobre los datos geográficos.

! Analista de datos y arquitectura de BDG: capacidad de entender un problema desde una perspectiva territorial y modelar una solución normalizada en una BDG.

! Arquitectura de IDE: capacidad de creación de Infraestructuras de Datos Espaciales.

Page 13: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

13

Page 14: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

14

Transmisión del Conocimiento

Page 15: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

15

DATO – INFORMACIÓN - CONOCIMIENTO

!   Dato: mediciones y magnitudes, ya sean cualitativas o cuantitativas, que representan atributos de un conjunto de variables observables, mesurables o estimables, de la realidad. E.g.: presencia de una especie en un punto, temperatura en ese punto

!   Información: los datos relacionados y sometidos a análisis producen información. Por ejemplo: presencia media de esa especie en ese paraje; temperatura media anual

!   Conocimiento: la información en acción, la información en movimiento, la información interrelacionada y puesta en práctica para un uso concreto constituye el conocimiento. Nivel máximo de abstracción de los datos, que nos permite intentar crear leyes científicas predictivas y descriptivas de los fenómenos observados. E.g.: se constata que el número de animales de una especie medio en ese punto se redujo al aumentar la temperatura.

Las bases de datos juegan un papel trascendental en el proceso que permite transformar un dato en conocimiento.

41001002301

Page 16: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

16

Idea Clave

Una base de datos se encarga de ordenar los datos de forma que les podamos hacer preguntas y realizar análisis. Pero para que nos ofrezca las respuestas precisas y los resultados óptimos es fundamental diseñar bien previamente, y eso es lo único que no te enseñan en el curso: se aprende enfrentándote a muchos (cuantos más mejor) de casos.

Page 17: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

17

Filosofía de los Seminarios

!   Se hace este seminario porque uno de los miembros del CAESCG asistió al curso… (Carátula del curso de Granada)

!   Cada curso desembocará en 1 seminario

!   Cada nuevo conocimiento adquirido que tenga que ver con las T.I. se trasladará a los G.I. mediante la web (webminarios, tutoriales, blog).

!   CONTAR MOVIDAS

Page 18: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

18

Definiciones de Bases de datos

El medio computerizado más potente y utilizado para la gestión de la información alfanumérica es la BASE DE DATOS:

!   Una base de datos es la organización de una colección de datos que se interrelacionan, se comparten y se controlan" (G. W. y J. V. Hansen, "Diseño y administración de bases de datos", 1997)

!   "Una base de datos es una colección de datos organizada de forma sistemática, de manera que un programa de ordenador puede consultarlos para ofrecer respuestas" (Wikipedia, 2006)

De las definiciones anteriores extraemos que una base de datos debe...

!   albergar datos según una estructura conveniente diseñada de antemano que propicie la interrelación de hechos para producir información;

!   tener control sobre la naturaleza y formato de los datos que se incorporan a ella, de manera que se garantice la calidad de los mismos;

!   controlar el acceso de diferentes perfiles de usuario a sus datos y estructura.

Page 19: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

19

¿Por qué son importantes?

!   Son uno de los sectores de las ciencias de la computación más transversales y con más impacto global en nuestro día a día.

!   Permite la creación de almacenes de datos distribuidos y multiconcurrentes. Propicia la computación distribuida.

!   Enorme flexibilidad ante el planteamiento de problemas complejos. Mímesis de los procesos lógicos que ocurren en la realidad gracias a la modelización de sistemas reales.

!   Últimas depositarias de los datos producto de procesos de recogida que pueden ser extraordinariamente costosos.

!   Se encuentran en la base de la gran mayoría de las aplicaciones informáticas presentes en la administración y en todo tipo de organizaciones, independientemente de su tamaño.

!   Guardan lo más preciado: los datos. Las aplicaciones van y vienen, pero los datos son para siempre.

Page 20: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

20

Diseño de la base de datos

!   Coger un PROBLEMA, una REALIDAD COMPLEJA. Por ejemplo, una biblioteca, un trámite administrativo o un proceso de recogida y análisis de muestras de campo.

!   Estudiarla, sistematizarla y modelarla en una abstracción conceptual llamada MODELO DE BASE DE DATOS RELACIONAL

!   Plasmar el MODELO DE BASE DE DATOS RELACIONAL anterior

en un MODELO FÍSICO gracias a un programa de ordenador llamado SISTEMA GESTOR DE BASE DE DATOS, que a su vez funciona sobre una COMPUTADORA, para conseguir aprovechar la extrema capacidad de calculo y relación lógica de las computadoras para el almacenamiento, ordenación, gestión y análisis masivo y automático de datos.

Page 21: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

21

Tareas del diseñador

Son tareas del analista-diseñador:

!  determinar cuales son las variables relevantes para describir la realidad que pretende analizar;

!  determinar cual es el nivel de desagregación relevante para el problema que se tiene entre manos;

!  determinar el formato en el que dichos datos deben ser codificados, para que la codificación de los mismos sea segura, sencilla y eficaz.

Page 22: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

22

Un trabajo en equipo

! Suele ser un equipo multidisciplinar de expertos temáticos e ingenieros de software;

!   Debe entender el problema y tratar con los que lo conocen para extraer toda la información necesaria para crear el modelo;

!   Debe conocer la máquina, para adaptar el problema a un lenguaje que ésta entienda;

!   Debe entender las necesidades de los usuarios finales: qué esperan del sistema y cómo se supone que deben interaccionar con la información.

En resumen: debe poner los medios para expresar el problema en el lenguaje de la máquina para que sea entendido en lenguaje humano.

Fuente: Juan Pedro Pérez Alcántara - Geographica Studio

Page 23: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

23

¿Cómo abordamos el diseño?

!   No se puede modelar lo que no se conoce. !   No existe una solución única para un problema de modelado, tan sólo

existen soluciones convenientes. !   El problema nunca se soluciona a la primera, es un proceso iterativo,

reiterativo y evolutivo que puede llegar a ser muy costoso en el tiempo. Se trabaja en el modelo, se somete a prueba, se corrige, se vuelve a probar... iterativamente. El problema ha de ser discutido con especialistas diferentes y visto desde todos los puntos de vista que se consideren necesarios. Es una labor de equipo. No se puede modelar con prisa. Es un proceso que hay que hacer con reposo.

!   Hay que ser ordenado. Hay que darle un nombre bien descriptivo y significativo a los componentes del modelo y documentarlo profusamente. Debe ser elegante, legible y sencillo, hasta donde el problema lo permita, claro.

Page 24: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

24

LOS PELIGROS

!   Efecto “POYAQUE”

!   NORMALIZACIÓN

!   Falta de atomización !   Redundancia

Page 25: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

25

¿Cómo afrontamos el diseño?

Existen multitud de metodologías de diseño-modelado. Usaremos un método iterativo de refinamiento por pasos, basado en la metodología de modelado de entidad-relación, en la que aplicaremos una serie de normas. !   Paso 1: Comprensión del problema: a efectos prácticos, muchas reuniones,

mucho pensar y mucho papel garabateado. !   Paso 2: Identificación de los elementos del sistema y sus relaciones: a partir

del paso 1, análisis y planteamiento inicial de los componentes básicos del sistema descrito.

!   Paso 3: Iteraciones de normalización: el sistema es sometido a sucesivos ciclos de estudio, análisis y cambios hasta alcanzar un estado plenamente normalizado en el que todas las necesidades de información son satisfechas.

Page 26: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

26

Paso 1: Comprensión del problema

Sin comprender el problema no hay nada que modelar. Hay que describir el problema, los procesos y los elementos del sistema lo más detalladamente posible. Una técnica fundamental es escribirlo en papel, descriptivamente, exponiendo literalmente el problema. Esta descripción literal surge de un proceso de discusión con los especialistas temáticos. De este proceso de discusión se obtienen los siguientes productos, llamados en su conjunto Documentos de diseño:

!   una descripción de los elementos, flujos, relaciones entre elementos y procesos que se dan dentro del sistema que se quiere modelar;

!   un documento en el que se perfilan las necesidades de información que debe satisfacer el sistema, es decir, la lista de preguntas mínimas que el sistema debe ser capaz de responder de forma veraz.

Page 27: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

27

Objetivos de la base de datos

!   Albergar la información del problema a tratar en una forma conveniente

para su tratamiento. Esta forma es un modelo entidad-relación que reproduce los flujos y la estructura de la información del problema real.

!   Controlar la introducción de datos en la base, de forma que la información contenida en ella sea consistente, atómica y no redundante:

!   consistente: la información almacenada no puede ser contradictoria entre sí; atómica: la información debe estar en el nivel de desagregación más conveniente;

!   no redundante: un dato en concreto debe estar recogido en la base de datos una sóla vez, y no varias, so pena de incurrir en inconsistencias.

!   Permitir el análisis y recuperación de datos en condiciones adecuadas y con flexibilidad.

Page 28: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

28

¿Qué hacemos con la base de datos?

El diseño desemboca en un modo particular de almacenar y organizar los datos para que puedan ser utilizados con eficacia (base de datos). Para ello usamos un sistema gestor de base de datos (SGBD), un Software especializado en la creación, gestión, administración, utilización y mantenimiento de bases de datos. Ejemplos: PostgreSQL, Oracle, MySQL, OpenOffice Base, SQL Server, Access, etc. En conclusión: utilizamos bases de datos para poner orden allí donde no lo hay y propiciar de esta manera la resolución de preguntas y análisis sobre los datos que se recogen en nuestra actividad científico-técnica diaria.

Page 29: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

29

Objetivos del SGBD !   Plantear la infraestructura software necesaria para apoyar todas las

necesidades de uso y gestión de las bases de datos que contiene. !   Tareas de definición de datos. Creación de las estructuras de datos

(modelos) que albergarán la información. Modelado visual. Lenguaje SQL / DDL (Data Definition Language).

!   Tareas administrativas. Gestión de accesos, permisos, usuarios, cuotas, copias de seguridad, exportaciones, importaciones, encriptación, etc. Lenguaje SQL / DBA (Database Administration).

!   Tareas de edición de datos. Inserción, modificación y borrado de datos. Control de concurrencia por transacciones. Lenguaje SQL / DML (Data Manipulation Language).

!   Tareas de recuperación y consulta de datos. Creación de consultas sobre los datos. Lenguaje SQL / DML. Ordenación (índices) de los datos y recuperación selectiva de los mismos.

!   Tareas programáticas avanzadas. Creación de programas complejos dentro de la base de datos para la manipulación avanzada de datos. Lenguajes como PL/SQL, PL/pgSQL, SQL/PSM, T-SQL, Java, etc..

Page 30: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

30

Los SGBD

!  ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente.

!  FOSS: Free and Open Source Software, software libre y abierto. Fuente: Juan Pedro Pérez Alcántara - Geographica Studio

Page 31: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

31

¿Qué diferencia hay entre una base de datos convencional y una base de datos geográfica?

!   La información geográfica tiene una doble componente: temática y espacial. !   La vertiente temática caracteriza las propiedades de los objetos geográficos. !   La vertiente espacial caracteriza la geometría (extensión, forma, orientación, etc.) de los

objetos geográficos.

!   El diseñador de bases de datos geográficas debe ser consciente en todo momento de este hecho para explotarlo en beneficio del modelo. Debe siempre cuestionarse la naturaleza geográfica de los componentes del sistema que pretende modelar.

!   “Para trabajar con un SIG es necesario en primer lugar introducir la información geográfica en un sistema de información y realizar una modelización de la realidad” (Lantada y Núñez, 2002).

Page 32: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

32

Componentes del datos geográfico en un SIG

TEMÁTICO propiedades, atributos de los

objetos espaciales

ESPACIAL elemento del mundo real localizado en el espacio

Page 33: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

33

Tipo de objeto geográfico

!   La información puede ser estructurada según el tipo de objeto geográfico como puntos, líneas y polígonos.

!   Puntos – 0 dimensiones, descrito por par de coordenadas x,y !   Líneas – 1 dimensión, descritas por sucesión de coordenadas

puntuales !   Polígonos - 2 dimensiones, descritos por sucesión cerrada de

coordenadas puntuales !   Volúmenes – 2.5 / 3 dimensiones, descritos por superficie triangulada

Polígono Línea Punto

Page 34: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

34

El concepto de capa

!   Cada una de las variables incorporadas al SIG, que almacena un tipo de objeto espacial (punto, línea, polígono)

!   Todas con el mismo sistema de referencia espacial, lo que permite realizar superposiciones entre capas, cálculo de distancias, etc.

Page 35: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

35

!   En definitiva, los campos y los tipos de datos geométricos, la información que contienen y el uso que se hace de ellos constituyen (entre otras muchas cosas) la marca de identidad de las bases de datos geográficas.

Page 36: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

36

Simplificando

!   “De una manera más inmediata un SIG se puede contemplar como un conjunto de mapas de la misma porción del territorio, donde un lugar concreto tiene la misma localización (las mismas coordenadas) en todos los mapas incluidos en el sistema de información. De este modo, resulta posible realizar análisis de sus características espaciales y temáticas para obtener un mejor conocimiento de esa zona” (Bosque, 1997).

Page 37: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

37

Topología

!   Las entidades geométricas de los modelos geográficos, sólo por el hecho de existir sobre el territorio, ya comparten una clave primaria común a todas ellas, independiente totalmente de su naturaleza temática: el espacio geográfico.

!   Por lo tanto, los hechos territoriales pueden ser modelados como entidades geométricas en los modelos de bases de datos geográficas que: !   Tienen una caracterización temática gracias a un conjunto de campos. !   Poseen uno o varios campos geométricos donde se alberga un conjunto de puntos, líneas y

polígonos que describen la realidad física del hecho territorial.

!   La topología es el conjunto de las relaciones espaciales impuestas por la función distancia que se dan entre los objetos que están sobre el espacio geográfico.

Page 38: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

38

Interoperabilidad

!   Las BDG son una forma de base de datos extremadamente poderosa puesto que juegan con una clave primaria universal compartida por todas las entidades geométricas existentes en cualquier base de datos geográfica del mundo: EL ESPACIO. Esta clave primaria universal permite conectar información contenida en distintas bases de datos a partir del vínculo topológico que comparten las geometrías en ellas contenidas.

!   Por todo ello, es deber de los diseñadores de BDG aprovechar al máximo las posibilidades que nos brinda el modelado geográfico: haremos nuestros datos mucho más versátiles y por tanto mucho más interoperables con otras bases de datos vecinas, actuales y, sobre todo, futuras.

Page 39: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

39

Similitudes y diferencias con las BD no geográficas

!   Básicamente, como idea central, hay que tener claro que: !   Las BDG son un subconjunto especializado de las BD no geográficas. Por tanto, en esencia

son bases de datos relacionales a todos los efectos. !   Están planteadas, en la mayoría de los casos, como extensiones a los SGBD que

incrementan sus capacidades para hacer posible el almacenamiento, edición, manipulación y recuperación de información geométrica, siempre con criterios topológicos.

!   Dicho esto: !   las bases de datos geográficas son bases de datos relacionales normales en lo que a sus

datos alfanuméricos se refieren; !   se diseñan y se conciben igual que las no geográficas, pero teniendo en cuenta las

peculiaridades del modelado geográfico ya comentadas; !   se gestionan igual que las no geográficas, con las peculiaridades impuestas por el

tratamiento de los datos vectoriales; !   se explotan igual que las no geográficas, con el añadido de poseer SQL espacial; !   físicamente, se basan en los mismos sistemas de hardware. En cuanto al software, es el

mismo, con los añadidos propios destinados a la gestión de las geometrías.

Page 40: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

40

Peculiaridades del modelo geográfico

!   En esencia, el modelado geográfico sigue los mismos pasos y fases que el modelado relacional convencional.

!   El diseñador geográfico debe tener en cuenta, sin embargo, que: !   Las entidades pueden tener campos para albergar atributos geométricos (puntos, líneas,

polígonos) con tipos de datos adaptados a la gestión de geometrías. !   Entre las entidades con atributos geométricos se pueden establecer relaciones topológicas,

que pueden llegar a sustituir a relaciones convencionales y/o coexistir con las mismas (aunque se corre el peligro de caer en redundancia).

!   El diseñador geográfico debe tener en cuenta todas las reglas de normalización ya explicadas en el caso del modelado convencional, pero además, debe asegurarse de estudiar y poner las bases para garantizar la integridad topológica de los datos geométricos.

Page 41: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

41

¿Por qué diseñar bases de datos relacionales geográficas?

!   Porque posibilitan la creación de modelos geográficos basados en el paradigma entidad-relación imposibles de realizar con sistemas basados en ficheros con larga tradición en el mundo SIG, como los workspace GRASS y ArcInfo o las shapes.

!   Porque es la mejor manera de conseguir multiconcurrencia a datos geográficos.

!   Porque es el medio ideal para crear sistemas distribuidos de información geográfica.

!   Porque es un componente central en las IDE. !   Porque posibilita el análisis de los datos mediante SQL tradicional y

espacial. !   Porque existe falta de expertos temáticos con formación en el diseño de

bases de datos geográficas: es una actividad crítica y que siempre será necesaria.

Page 42: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

42

Algunos sistemas de bases de datos geográficas

Fuente: Juan Pedro Pérez Alcántara - Geographica Studio

Page 43: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

43

PostrgreSQL

!  ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente.

!  FOSS: Free and Open Source Software, software libre y abierto.

!   Base de datos FOSS más importante junto a MySQL !   ACID: Multiconcurrente, control de transacciones,

arquitectura cliente - servidor !   Lenguajes C / C++ !   Versión actual: 9 !   Linux, FreeBSD, Solaris, Mac OS, Windows !   Antecesores tecnológicos: Ingres (1982, Universidad de Berkeley) !   Lenguajes de programación internos: Pl/pgSQL, Pl/Perl, Pl/Ruby,

Pl/Python !   Front-ends de gestión y administración: PgAdmin3 (Linux,

Windows), Kpogre (Linux), phpPgAdmin (web), psql (Linux, Windows)

Page 44: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

44

PostGIS

!   Programa adicional (extensión) instalable sobre PostgreSQL para gestionar

información geográfica !   Lenguajes C / C++ !   Versión actual: 1.4.5 !   Desarrollo liderado desde 2000 por la empresa canadiense Refractions

Research Basado en librerías OS adicionales: !   GEOS: motor topológico !   Proj4: trabajo con proyecciones cartográficas

!   Extensiones a PostGIS: PgRoute (análisis de redes)

Page 45: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

45

PostGIS

Características: !   Gestión y almacenamiento de geometrías vectoriales !   Gestión de relaciones topológicas entre geometrías (GEOS) Reproyecciones

(Proj4) !   Utilización de varios formatos: WKT (Well Known Text, OGC), WKB (Well

Known Binary, OGC), GeoJson, GML (Geographic Mark-up Language, OGC), KML (Keyhole Mark-up Language, Google)

Clientes: !   Servidores de información geografica (para IDE): MapServer, GeoServer

GIS !   OS de escritorio: Quantum GIS / GRASS, Kosmo, gvSIG, uDig, OpenJump !   GIS propietarios de escritorio: Manifold System, MapInfo, ArcGIS (a duras

penas, con ZigGIS o ArcServer / ArcSDE)

Page 46: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

46

Instalación

! PostgreSQL: la base de datos sobre la que se asienta PostGIS. ! PostGIS: extensión espacial. ! psql: cliente de línea de comando de PostgreSQL. !   pgAdmin3: cliente GUI de PostgreSQL. !   QGIS: cliente pesado de escritorio GIS, muy útil para el trabajo con

PostGIS. !   Visual Studio 2008 Express Edition: necesario para compilar ZigGIS. ! ZigGIS: extensión para ArcGIS para conectar con PostGIS.

Page 47: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

47

Funcionamiento

Fuente: Juan Pedro Pérez Alcántara - Geographica Studio

Page 48: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

48

Carácter distribuido de la información geográfica

Fuente: Juan Pedro Pérez Alcántara - Geographica Studio

Page 49: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

49

OGC

!   Open Geospatial Consortium ! www.geoespatial.org !   Organización internacional no lucrativa cuyo fin es la definición de

estándares abiertos e interoperables dentro de los SIG. !   Creada en 1994 agrupa a + de 250 organizaciones públicas y privadas !   Persigue acuerdos entre las diferentes empresas del sector que posibiliten la

interoperación de sus sistemas de geoprocesamiento y facilitar el intercambio de información geográfica en beneficio de los usuarios.

!   Estándares más importantes surgidos del OGC: !   GML (Geographic Markup Language) !   WMS (Web Map Service) !   WFS (Web Feature Service) !   WCS (Web Coverage Service) !   Catalogue Service

Page 50: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

50

Infraestructura de Datos Espaciales (IDE)

!   Una IDE es un sistema informático integrado por un conjunto de recursos (catálogos, servidores, programas, datos, aplicaciones, páginas Web,...) dedicados a gestionar Información Geográfica (mapas, ortofotos, imágenes de satélite, topónimos,...), disponibles en Internet, que cumplen una serie de condiciones de interoperabilidad (normas, especificaciones, protocolos, interfaces,...) que permiten que un usuario, utilizando un simple navegador, pueda utilizarlos y combinarlos según sus necesidades.

!   Organización de los datos e información. !   ¿Donde están? !   ¿Quién los tiene? !   ¿A quién pertenecen? !   ¿Cuándo y como se obtuvieron?

Page 51: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

51

Componentes de una IDE

!   Datos !   Datos de referencia: Constituyen el marco de referencia que proporciona el contexto

geográfico a cualquier aplicación. Sistema de Coordenadas. - Cuadrículas Geográficas. - Nombres geográficos. Unidades Administrativas. - Redes de Transporte. - Hidrografía. - Lugares Protegidos. Elevación. - Identificadores de Propiedad. - Parcelas Catastrales. - Cubierta Terrestre. Ortoimágenes.

!   Datos temáticos: Incluyen valores cualitativos y cuantitativos que se corresponden con atributos asociados a los datos de referencia como por ejemplo: vegetación, geología, clima, tráfico, contaminación, etc.

!   Metadatos: !   Hay que diferenciar claramente los datos de los metadatos: los datos describen el mundo

real y son un modelo de la realidad; los metadatos describen los datos y se utilizan para tomar decisiones acerca de los mismos.

!   Servicios !   Servicio de Mapas en Web (WMS) !   Servicio de Fenómenos en Web (WFS) !   Servicio de Coberturas en Web (WCS) !   Servicio de Catálogo en Web

Page 52: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

52

Principios Comunes

!   Marco Institucional: !   Definición de estándares:

!   El establecimiento de normas a las que deberá ajustarse la información geográfica, los intercambios de esta y la interoperación de los sistemas que la manejan.

!   Tecnología: !   El establecimiento de la red y mecanismos informáticos que permitan: buscar, consultar,

encontrar, acceder, suministrar y usar los datos espaciales o geográficos. Como por ejemplo permitir incorporar los metadatos organizados en catálogos y ofrecerlos en la red a través de servidores.

!   Política de datos: !   El establecimiento de las políticas, alianzas y acuerdos de colaboración necesarios para

aumentar la disponibilidad de datos espaciales y compartir los desarrollos tecnológicos.

Page 53: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

53

En busca de la interoperabilidad

Page 54: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

54

Arquitectura INSPIRE

Fuente: Diego Padrón – Dpto. Geografía – Universidad de Alcalá

Page 55: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

55

CRÉDITOS – AGRADECIMIENTOS

Ilustración página 54: Diego Padrón – Dpto. Geografía – Universidad de Alcalá

Textos páginas 11-12, 15 y 18-29 e ilustraciones páginas 22, 30, 42, 47, 48: Juan Pedro Pérez Alcántara - Geographica Studio

Page 56: Seminario Almacenamiento de Datos Ambientales Hoy

Almacenamiento de Datos Ambientales Hoy

56

Contraportada