Seminario Almacenamiento Datos Hoy - 13/12/10

54
Almacenamiento de Datos Ambientales Hoy Portada Isaac Francés Balbino Fernández Almacenamiento de Datos Ambientales Hoy

Transcript of Seminario Almacenamiento Datos Hoy - 13/12/10

Page 1: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

PortadaIsaac Francés – Balbino Fernández

Almacenamiento de Datos

Ambientales Hoy

Page 2: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

2

Ciencia y SIG

La actividad científica genera infinidad de datos

Page 3: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

3

Los Datos

Datos de campo

Datos de laboratorio

Datos que tienen una representación espacial

Page 4: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

4

Guardando los datos

Los investigadores y las investigadoras guardamos

estos datos de muchas maneras.

EN PAPEL

DIGITALES

Page 5: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

5

Base de Datos Geográfica (BDG)

Si guardo los datos como yo quiero….

NO LOS PUEDO COMPARTIR

NO FACILITO LA COLABORACIÓN – EL TRABAJO EN

GRUPO

Lo mejor es usar una BASE DE DATOS

GEOGRÁFICA y seguir una serie de estándares.

Page 6: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

6

COMPLEJIDAD

La experiencia nos dice que trabajar con bases de

datos geográficas…

ES UN TEMA……

¡¡¡¡DIFÍCIL!!!!

Page 7: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

Definición de SIG

Un sistema para entrada, almacenamiento,

manipulación y salida de información geográfica

Un tipo de software

Un ejemplo práctico de SIG combina software con

hardware, datos, usuarios, etc., para resolver un

problema, ayudar a la toma de decisiones, el

planeamiento y la gestión

“La tecnología SIG es al análisis

geográfico lo que el microscopio

y los ordenadores han sido para

otras ciencias”

(Gutiérrez y Gould, 1994, p. 38)

Page 8: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

Definición de SIG

Un sistema de hardware, software y procedimientos

elaborados para facilitar la obtención, gestión, manipulación,

análisis, modelado, representación y salida de datos

espacialmente referenciados, para resolver problemas

complejos de planificación y gestión (NCGIA, 1990)

Page 9: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

Funciones de los SIG

ENTRADA DE

INFORMACIÓN

GESTIÓN

FUNCIONES DE

ANÁLISIS

SALIDA GRÁFICA Y

CARTOGRAFICA

Almacenamiento

Actualización

Recuperación

Conversión / transformación de información

geográfica a formato digital

SIG como “máquina de simulación”

Page 10: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

Tipo de cuestiones que un SIG puede responder

LOCALIZACIÓN: ¿Qué hay en…?

CONDICIÓN: ¿Dónde se cumple qué…?

PATRONES DE DISTRIBUCIÓN

TENDENCIAS/ANÁLISIS DE CAMBIOS

RUTAS ÓPTIMAS/ANÁLISIS DE REDES

MODELOS/SIMULACIONES

Page 11: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

Etapas de un proyecto SIG

Definición de objetivos

Recogida de datos existentes

Creación de nuevos datos

Integración de datos

Corrección de errores

Manipulación de coordenadas

Análisis (espacial, geoestadístico, 3D)

Representación

Mantenimiento

Page 12: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

12

Tipos de Usuarios SIG

Usuario instrumental: utilización de un programa o

programas para realizar tareas concretas.

Analista SIG temático: conocimiento no sólo de los

programas, sino de las técnicas SIG en general y/o

aplicadas a un campo temático determinado. Los

SIG como forma de pensar sobre los datos

geográficos.

Analista de datos y arquitectura de BDG:

capacidad de entender un problema desde una

perspectiva territorial y modelar una solución

normalizada en una BDG.

Arquitectura de IDE: capacidad de creación de

Infraestructuras de Datos Espaciales.

Page 13: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

13

Page 14: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

14

Transmisión del Conocimiento

Page 15: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

15

DATO – INFORMACIÓN - CONOCIMIENTO

Dato: mediciones y magnitudes, ya sean cualitativas

o cuantitativas, que representan atributos de un

conjunto de variables observables, mesurables o

estimables, de la realidad. E.g.: presencia de una

especie en un punto, temperatura en ese punto

Información: los datos relacionados y sometidos a

análisis producen información. Por ejemplo:

presencia media de esa especie en ese paraje;

temperatura media anual

Conocimiento: la información en acción, la

información en movimiento, la información

interrelacionada y puesta en práctica para un uso

concreto constituye el conocimiento. Nivel máximo de

abstracción de los datos, que nos permite intentar

crear leyes científicas predictivas y descriptivas de

los fenómenos observados. E.g.: se constata que el

número de animales de una especie medio en ese

punto se redujo al aumentar la temperatura.

Las bases de datos juegan un papel trascendental en el proceso

que permite transformar un dato en conocimiento.

41001002301

Page 16: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

16

Idea Clave

Una base de datos se encarga de ordenar los datos de forma que

les podamos hacer preguntas y realizar análisis. Pero para que

nos ofrezca las respuestas precisas y los resultados óptimos es

fundamental diseñar bien previamente, y eso es lo único que

no te enseñan en el curso: se aprende enfrentándote a

muchos (cuantos más mejor) de casos.

Page 17: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

18

Definiciones de Bases de datos

El medio computerizado más potente y utilizado para la gestión de

la información alfanumérica es la BASE DE DATOS:

Una base de datos es la organización de una colección de datos que se

interrelacionan, se comparten y se controlan" (G. W. y J. V. Hansen,

"Diseño y administración de bases de datos", 1997)

"Una base de datos es una colección de datos organizada de forma

sistemática, de manera que un programa de ordenador puede consultarlos

para ofrecer respuestas" (Wikipedia, 2006)

De las definiciones anteriores extraemos que una base de datos

debe...

albergar datos según una estructura conveniente diseñada de antemano

que propicie la interrelación de hechos para producir información;

tener control sobre la naturaleza y formato de los datos que se incorporan a

ella, de manera que se garantice la calidad de los mismos;

controlar el acceso de diferentes perfiles de usuario a sus datos y

estructura.

Page 18: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

19

¿Por qué son importantes?

Son uno de los sectores de las ciencias de la computación más

transversales y con más impacto global en nuestro día a día.

Permite la creación de almacenes de datos distribuidos y

multiconcurrentes. Propicia la computación distribuida.

Enorme flexibilidad ante el planteamiento de problemas

complejos. Mímesis de los procesos lógicos que ocurren en la

realidad gracias a la modelización de sistemas reales.

Últimas depositarias de los datos producto de procesos de

recogida que pueden ser extraordinariamente costosos.

Se encuentran en la base de la gran mayoría de las

aplicaciones informáticas presentes en la administración y en

todo tipo de organizaciones, independientemente de su tamaño.

Guardan lo más preciado: los datos. Las aplicaciones van y

vienen, pero los datos son para siempre.

Page 19: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

20

Diseño de la base de datos

Coger un PROBLEMA, una REALIDAD COMPLEJA. Por

ejemplo, una biblioteca, un trámite administrativo o un proceso

de recogida y análisis de muestras de campo.

Estudiarla, sistematizarla y modelarla en una abstracción

conceptual llamada MODELO DE BASE DE DATOS

RELACIONAL

Plasmar el MODELO DE BASE DE DATOS RELACIONAL

anterior en un MODELO FÍSICO gracias a un programa de

ordenador llamado SISTEMA GESTOR DE BASE DE DATOS,

que a su vez funciona sobre una COMPUTADORA, para

conseguir aprovechar la extrema capacidad de calculo y

relación lógica de las computadoras para el almacenamiento,

ordenación, gestión y análisis masivo y automático de datos.

Page 20: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

21

Tareas del diseñador

Son tareas del analista-diseñador:

determinar cuales son las variables relevantes

para describir la realidad que pretende analizar;

determinar cual es el nivel de desagregación

relevante para el problema que se tiene entre

manos;

determinar el formato en el que dichos datos

deben ser codificados, para que la codificación de

los mismos sea segura, sencilla y eficaz.

Page 21: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

22

Un trabajo en equipo

Suele ser un equipo multidisciplinar de

expertos temáticos e ingenieros de

software;

Debe entender el problema y tratar con

los que lo conocen para extraer toda la

información necesaria para crear el

modelo;

Debe conocer la máquina, para adaptar el

problema a un lenguaje que ésta

entienda;

Debe entender las necesidades de los

usuarios finales: qué esperan del sistema

y cómo se supone que deben

interaccionar con la información.

En resumen: debe poner los medios para

expresar el problema en el lenguaje de la

máquina para que sea entendido en lenguaje

humano.

Page 22: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

23

¿Cómo abordamos el diseño?

No se puede modelar lo que no se conoce.

No existe una solución única para un problema de modelado, tan sólo

existen soluciones convenientes.

El problema nunca se soluciona a la primera, es un proceso iterativo,

reiterativo y evolutivo que puede llegar a ser muy costoso en el tiempo.

Se trabaja en el modelo, se somete a prueba, se corrige, se vuelve a

probar... iterativamente. El problema ha de ser discutido con

especialistas diferentes y visto desde todos los puntos de vista que se

consideren necesarios. Es una labor de equipo. No se puede modelar

con prisa. Es un proceso que hay que hacer con reposo.

Hay que ser ordenado. Hay que darle un nombre bien descriptivo y

significativo a los componentes del modelo y documentarlo

profusamente. Debe ser elegante, legible y sencillo, hasta donde el

problema lo permita, claro.

Page 23: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

24

LOS PELIGROS

Efecto “POYAQUE”

NORMALIZACIÓN

Falta de atomización

Redundancia

Page 24: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

25

¿Cómo afrontamos el diseño?

Existen multitud de metodologías de diseño-modelado.

Usaremos un método iterativo de refinamiento por pasos, basado en la

metodología de modelado de entidad-relación, en la que aplicaremos una

serie de normas.

Paso 1: Comprensión del problema: a efectos prácticos, muchas

reuniones, mucho pensar y mucho papel garabateado.

Paso 2: Identificación de los elementos del sistema y sus relaciones: a

partir del paso 1, análisis y planteamiento inicial de los componentes

básicos del sistema descrito.

Paso 3: Iteraciones de normalización: el sistema es sometido a

sucesivos ciclos de estudio, análisis y cambios hasta alcanzar un

estado plenamente normalizado en el que todas las necesidades de

información son satisfechas.

Page 25: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

26

Paso 1: Comprensión del problema

Sin comprender el problema no hay nada que modelar. Hay que describir

el problema, los procesos y los elementos del sistema lo más

detalladamente posible. Una técnica fundamental es escribirlo en papel,

descriptivamente, exponiendo literalmente el problema. Esta descripción

literal surge de un proceso de discusión con los especialistas temáticos.

De este proceso de discusión se obtienen los siguientes productos,

llamados en su conjunto Documentos de diseño:

una descripción de los elementos, flujos, relaciones entre elementos y procesos que

se dan dentro del sistema que se quiere modelar;

un documento en el que se perfilan las necesidades de información que debe

satisfacer el sistema, es decir, la lista de preguntas mínimas que el sistema debe ser

capaz de responder de forma veraz.

Page 26: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

27

Objetivos de la base de datos

Albergar la información del problema a tratar en una forma conveniente

para su tratamiento. Esta forma es un modelo entidad-relación que

reproduce los flujos y la estructura de la información del problema real.

Controlar la introducción de datos en la base, de forma que la

información contenida en ella sea consistente, atómica y no

redundante:

consistente: la información almacenada no puede ser contradictoria entre sí; atómica:

la información debe estar en el nivel de desagregación más conveniente;

no redundante: un dato en concreto debe estar recogido en la base de datos una sóla

vez, y no varias, so pena de incurrir en inconsistencias.

Permitir el análisis y recuperación de datos en condiciones adecuadas y con

flexibilidad.

Page 27: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

28

¿Qué hacemos con la base de datos?

El diseño desemboca en un modo particular de almacenar y organizar los

datos para que puedan ser utilizados con eficacia (base de datos).

Para ello usamos un sistema gestor de base de datos (SGBD), un

Software especializado en la creación, gestión, administración, utilización

y mantenimiento de bases de datos. Ejemplos: PostgreSQL, Oracle,

MySQL, OpenOffice Base, SQL Server, Access, etc.

En conclusión: utilizamos bases de datos para poner orden allí donde no

lo hay y propiciar de esta manera la resolución de preguntas y análisis

sobre los datos que se recogen en nuestra actividad científico-técnica

diaria.

Page 28: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

29

Objetivos del SGBD

Plantear la infraestructura software necesaria para apoyar todas las

necesidades de uso y gestión de las bases de datos que contiene.

Tareas de definición de datos. Creación de las estructuras de datos

(modelos) que albergarán la información. Modelado visual. Lenguaje

SQL / DDL (Data Definition Language).

Tareas administrativas. Gestión de accesos, permisos, usuarios,

cuotas, copias de seguridad, exportaciones, importaciones,

encriptación, etc. Lenguaje SQL / DBA (Database Administration).

Tareas de edición de datos. Inserción, modificación y borrado de datos.

Control de concurrencia por transacciones. Lenguaje SQL / DML (Data

Manipulation Language).

Tareas de recuperación y consulta de datos. Creación de consultas

sobre los datos. Lenguaje SQL / DML. Ordenación (índices) de los

datos y recuperación selectiva de los mismos.

Tareas programáticas avanzadas. Creación de programas complejos

dentro de la base de datos para la manipulación avanzada de datos.

Lenguajes como PL/SQL, PL/pgSQL, SQL/PSM, T-SQL, Java, etc..

Page 29: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

30

Los SGBD

ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por

lo que es multiconcurrente.

FOSS: Free and Open Source Software, software libre y abierto.

Page 30: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

31

¿Qué diferencia hay entre una base de datos

convencional y una base de datos geográfica?

La información geográfica tiene una doble componente: temática y

espacial.La vertiente temática caracteriza las propiedades de los objetos geográficos.

La vertiente espacial caracteriza la geometría (extensión, forma, orientación, etc.) de

los objetos geográficos.

El diseñador de bases de datos geográficas debe ser consciente en

todo momento de este hecho para explotarlo en beneficio del modelo.

Debe siempre cuestionarse la naturaleza geográfica de los

componentes del sistema que pretende modelar.

“Para trabajar con un SIG es necesario en primer lugar introducir la información geográfica

en un sistema de información y realizar una modelización de la realidad” (Lantada y Núñez,

2002).

Page 31: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

32

Componentes del datos geográfico en un SIG

TEMÁTICOpropiedades, atributos de los

objetos espaciales

ESPACIALelemento del mundo real

localizado en el espacio

Page 32: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

33

Tipo de objeto geográfico

La información puede ser estructurada según el tipo de objetogeográfico como puntos, líneas y polígonos.

Puntos – 0 dimensiones, descrito por par de coordenadas x,y

Líneas – 1 dimensión, descritas por sucesión de coordenadas puntuales

Polígonos - 2 dimensiones, descritos por sucesión cerrada de coordenadas puntuales

Volúmenes – 2.5 / 3 dimensiones, descritos por superficie triangulada

PolígonoLíneaPunto

Page 33: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

34

El concepto de capa

Cada una de las variables incorporadas al SIG, que almacena un tipo de objeto espacial (punto, línea, polígono)

Todas con el mismo sistema de referencia espacial, lo que permite realizar superposiciones entre capas, cálculo de distancias, etc.

Page 34: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

35

En definitiva, los campos y los tipos de datos geométricos, la

información que contienen y el uso que se hace de ellos constituyen

(entre otras muchas cosas) la marca de identidad de las bases de

datos geográficas.

Page 35: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

36

Simplificando

“De una manera más inmediata un SIG se puede contemplar como un

conjunto de mapas de la misma porción del territorio, donde un lugar

concreto tiene la misma localización (las mismas coordenadas) en

todos los mapas incluidos en el sistema de información. De este modo,

resulta posible realizar análisis de sus características espaciales y

temáticas para obtener un mejor conocimiento de esa zona” (Bosque,

1997).

Page 36: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

37

Topología

Las entidades geométricas de los modelos geográficos, sólo por el

hecho de existir sobre el territorio, ya comparten una clave primaria

común a todas ellas, independiente totalmente de su naturaleza

temática: el espacio geográfico.

Por lo tanto, los hechos territoriales pueden ser modelados como

entidades geométricas en los modelos de bases de datos geográficas

que:Tienen una caracterización temática gracias a un conjunto de campos.

Poseen uno o varios campos geométricos donde se alberga un conjunto de puntos,

líneas y polígonos que describen la realidad física del hecho territorial.

La topología es el conjunto de las relaciones espaciales impuestas por

la función distancia que se dan entre los objetos que están sobre el

espacio geográfico.

Page 37: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

38

Interoperabilidad

Las BDG son una forma de base de datos extremadamente poderosa

puesto que juegan con una clave primaria universal compartida por

todas las entidades geométricas existentes en cualquier base de datos

geográfica del mundo: EL ESPACIO. Esta clave primaria universal

permite conectar información contenida en distintas bases de datos a

partir del vínculo topológico que comparten las geometrías en ellas

contenidas.

Por todo ello, es deber de los diseñadores de BDG aprovechar al

máximo las posibilidades que nos brinda el modelado geográfico:

haremos nuestros datos mucho más versátiles y por tanto mucho más

interoperables con otras bases de datos vecinas, actuales y, sobre

todo, futuras.

Page 38: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

39

Similitudes y diferencias con las BD no geográficas

Básicamente, como idea central, hay que tener claro que: Las BDG son un subconjunto especializado de las BD no geográficas. Por tanto, en

esencia son bases de datos relacionales a todos los efectos.

Están planteadas, en la mayoría de los casos, como extensiones a los SGBD que

incrementan sus capacidades para hacer posible el almacenamiento, edición,

manipulación y recuperación de información geométrica, siempre con criterios

topológicos.

Dicho esto:las bases de datos geográficas son bases de datos relacionales normales en lo que a

sus datos alfanuméricos se refieren;

se diseñan y se conciben igual que las no geográficas, pero teniendo en cuenta las

peculiaridades del modelado geográfico ya comentadas;

se gestionan igual que las no geográficas, con las peculiaridades impuestas por el

tratamiento de los datos vectoriales;

se explotan igual que las no geográficas, con el añadido de poseer SQL espacial;

físicamente, se basan en los mismos sistemas de hardware. En cuanto al software, es

el mismo, con los añadidos propios destinados a la gestión de las geometrías.

Page 39: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

40

Peculiaridades del modelo geográfico

En esencia, el modelado geográfico sigue los mismos pasos y fases

que el modelado relacional convencional.

El diseñador geográfico debe tener en cuenta, sin embargo, que:Las entidades pueden tener campos para albergar atributos geométricos (puntos,

líneas, polígonos) con tipos de datos adaptados a la gestión de geometrías.

Entre las entidades con atributos geométricos se pueden establecer relaciones

topológicas, que pueden llegar a sustituir a relaciones convencionales y/o coexistir con

las mismas (aunque se corre el peligro de caer en redundancia).

El diseñador geográfico debe tener en cuenta todas las reglas de normalización ya

explicadas en el caso del modelado convencional, pero además, debe asegurarse de

estudiar y poner las bases para garantizar la integridad topológica de los datos

geométricos.

Page 40: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

41

¿Por qué diseñar bases de datos relacionales geográficas?

Porque posibilitan la creación de modelos geográficos basados en el

paradigma entidad-relación imposibles de realizar con sistemas

basados en ficheros con larga tradición en el mundo SIG, como los

workspace GRASS y ArcInfo o las shapes.

Porque es la mejor manera de conseguir multiconcurrencia a datos

geográficos.

Porque es el medio ideal para crear sistemas distribuidos de

información geográfica.

Porque es un componente central en las IDE.

Porque posibilita el análisis de los datos mediante SQL tradicional y

espacial.

Porque existe falta de expertos temáticos con formación en el diseño

de bases de datos geográficas: es una actividad crítica y que siempre

será necesaria.

Page 41: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

42

Algunos sistemas de bases de datos geográficas

Page 42: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

43

PostrgreSQL

ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por

lo que es multiconcurrente.

FOSS: Free and Open Source Software, software libre y abierto.

Base de datos FOSS más importante junto a MySQL

ACID: Multiconcurrente, control de transacciones,

arquitectura cliente - servidor

Lenguajes C / C++

Versión actual: 9

Linux, FreeBSD, Solaris, Mac OS, Windows

Antecesores tecnológicos: Ingres (1982, Universidad de

Berkeley)

Lenguajes de programación internos: Pl/pgSQL, Pl/Perl,

Pl/Ruby, Pl/Python

Front-ends de gestión y administración: PgAdmin3 (Linux,

Windows), Kpogre (Linux), phpPgAdmin (web), psql (Linux,

Windows)

Page 43: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

44

PostGIS

Programa adicional (extensión) instalable sobre PostgreSQL para

gestionar información geográfica

Lenguajes C / C++

Versión actual: 1.4.5

Desarrollo liderado desde 2000 por la empresa canadiense Refractions

Research Basado en librerías OS adicionales:GEOS: motor topológico

Proj4: trabajo con proyecciones cartográficas

Extensiones a PostGIS: PgRoute (análisis de redes)

Page 44: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

45

PostGIS

Características:

Gestión y almacenamiento de geometrías vectoriales

Gestión de relaciones topológicas entre geometrías (GEOS)

Reproyecciones (Proj4)

Utilización de varios formatos: WKT (Well Known Text, OGC), WKB

(Well Known Binary, OGC), GeoJson, GML (Geographic Mark-up

Language, OGC), KML (Keyhole Mark-up Language, Google)

Clientes:

Servidores de información geografica (para IDE): MapServer,

GeoServer GIS

OS de escritorio: Quantum GIS / GRASS, Kosmo, gvSIG, uDig,

OpenJump

GIS propietarios de escritorio: Manifold System, MapInfo, ArcGIS (a

duras penas, con ZigGIS o ArcServer / ArcSDE)

Page 45: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

46

Instalación

PostgreSQL: la base de datos sobre la que se asienta PostGIS.

PostGIS: extensión espacial.

psql: cliente de línea de comando de PostgreSQL.

pgAdmin3: cliente GUI de PostgreSQL.

QGIS: cliente pesado de escritorio GIS, muy útil para el trabajo con

PostGIS.

Visual Studio 2008 Express Edition: necesario para compilar ZigGIS.

ZigGIS: extensión para ArcGIS para conectar con PostGIS.

Page 46: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

47

Funcionamiento

Page 47: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

48

Carácter distribuido de la información geográfica

Page 48: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

49

OGC

Open Geospatial Consortium

www.geoespatial.org

Organización internacional no lucrativa cuyo fin es la definición de

estándares abiertos e interoperables dentro de los SIG.

Creada en 1994 agrupa a + de 250 organizaciones públicas y privadas

Persigue acuerdos entre las diferentes empresas del sector que

posibiliten la interoperación de sus sistemas de geoprocesamiento y

facilitar el intercambio de información geográfica en beneficio de los

usuarios.

Estándares más importantes surgidos del OGC:GML (Geographic Markup Language)

WMS (Web Map Service)

WFS (Web Feature Service)

WCS (Web Coverage Service)

Catalogue Service

Page 49: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

50

Infraestructura de Datos Espaciales (IDE)

Una IDE es un sistema informático integrado por un conjunto de

recursos (catálogos, servidores, programas, datos, aplicaciones,

páginas Web,...) dedicados a gestionar Información Geográfica

(mapas, ortofotos, imágenes de satélite, topónimos,...), disponibles en

Internet, que cumplen una serie de condiciones de interoperabilidad

(normas, especificaciones, protocolos, interfaces,...) que permiten que

un usuario, utilizando un simple navegador, pueda utilizarlos y

combinarlos según sus necesidades.

Organización de los datos e información.¿Donde están?

¿Quién los tiene?

¿A quién pertenecen?

¿Cuándo y como se obtuvieron?

Page 50: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

51

Componentes de una IDE

DatosDatos de referencia: Constituyen el marco de referencia que proporciona el contexto

geográfico a cualquier aplicación. Sistema de Coordenadas. - Cuadrículas

Geográficas. - Nombres geográficos. Unidades Administrativas. - Redes de

Transporte. - Hidrografía. - Lugares Protegidos. Elevación. - Identificadores de

Propiedad. - Parcelas Catastrales. - Cubierta Terrestre. Ortoimágenes.

Datos temáticos: Incluyen valores cualitativos y cuantitativos que se corresponden

con atributos asociados a los datos de referencia como por ejemplo: vegetación,

geología, clima, tráfico, contaminación, etc.

Metadatos: Hay que diferenciar claramente los datos de los metadatos: los datos describen el

mundo real y son un modelo de la realidad; los metadatos describen los datos y se

utilizan para tomar decisiones acerca de los mismos.

ServiciosServicio de Mapas en Web (WMS)

Servicio de Fenómenos en Web (WFS)

Servicio de Coberturas en Web (WCS)

Servicio de Catálogo en Web

Page 51: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

52

Principios Comunes

Marco Institucional:

Definición de estándares:El establecimiento de normas a las que deberá ajustarse la información geográfica, los

intercambios de esta y la interoperación de los sistemas que la manejan.

Tecnología: El establecimiento de la red y mecanismos informáticos que permitan: buscar,

consultar, encontrar, acceder, suministrar y usar los datos espaciales o geográficos.

Como por ejemplo permitir incorporar los metadatos organizados en catálogos y

ofrecerlos en la red a través de servidores.

Política de datos:El establecimiento de las políticas, alianzas y acuerdos de colaboración necesarios

para aumentar la disponibilidad de datos espaciales y compartir los desarrollos

tecnológicos.

Page 52: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

53

En busca de la interoperabilidad

Page 53: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

54

Arquitectura INSPIRE

Page 54: Seminario Almacenamiento Datos Hoy - 13/12/10

Almacenamiento de Datos Ambientales Hoy

55

Contraportada