1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de...

30
1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo de colecciones de datos científicos en la Web I Jornadas de Divulgación de Tecnologías de Información y Comunicaciones y el Desarrollo Sostenible DTIC-UCV Caracas Julio 2005 Rodrigo Torréns, Zulay Méndez, Magdiel Ablan, Rigoberto Andressen Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Transcript of 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de...

Page 1: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

1

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Manejo de colecciones de datos científicos en la Web

I Jornadas de Divulgación de Tecnologías de Información y Comunicaciones y el Desarrollo Sostenible

DTIC-UCVCaracas Julio 2005

Rodrigo Torréns, Zulay Méndez, Magdiel Ablan, Rigoberto Andressen

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Page 2: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

2

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Introducción:

Comentarios iniciales sobre:

• Manejo de colecciones de datos en Venezuela• Red de Estaciones Bio-climáticas de Mérida• ECO-RED Venezuela• Red ILTER (International Long Term Ecological Research Network)

Page 3: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

3

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

• Los datos que yo necesito, existen?

• Dónde están?

• Cómo los obtengo?

Los datos producto de una investigación científica

Uso de tecnologías de información para:

• Ubicar

• Accesar

• Recuperar

• Compartir

…datos

Page 4: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

4

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Objetivos

Para lograr el…

Uso secundario y a largo plazo de colecciones de datos científicos

Se debe…

Ubicar y recuperar información

Garantizar permanencia de los datos en el tiempo

Herramientas organizativas y tecnológicas que pueden hacer esto posible:

Uso de metadatos y estándares de intercambio de información

Page 5: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

5

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Herramientas

Herramientas organizativas y tecnológicas que pueden hacer esto posible:

Uso de metadatos y estándares de intercambio de información

Tecnologías de Información y Comunicaciones

Formación de Redes de colaboración entre científicos y entre usuarios de información

Page 6: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

6

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Qué significa la palabra “metadatos”?

• " Datos sobre los datos " .

• "Nivel superior de la información, o instrucciones que describen el contenido, contexto, calidad, estructura, y accesibilidad de una colección de datos específica" (J.K. Michener 1997).

D

M

D

M1

D

M2

Mc

D

M

a) b) c)

Metadatos como parte de los datos

Metadatos externos al recurso de información

Meta-metadatos (colecciones de metadatos)

Page 7: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

7

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Para qué “metadatos”?

Preguntas que se deberían poder responder usando metadatos:

•Qué datos describe una colección de datos científicos?

•Quien produjo la colección?

•Porqué fue creada la colección?

•Cómo fue creada la colección?

•Cuan confiables son los datos. Qué problemas persisten en la colección?

•Cómo alguien puede obtener una copia de la colección?

•Quien escribió los metadatos?

Page 8: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

8

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Ejemplos de metadatos y de comunidades

que usan metadatos

Muestra datos NBIIhttp://www.nbii.gov/

Documentación de datos geoespaciales (estándar FGDC) http://cndg.clearinghouse.gub.uy

Page 9: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

9

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Ejemplos de metadatos y de comunidades

que usan metadatosDocumentación de datos geoespaciales (Interfaz a Clearinghouse FGDC y GCMD Data Documenter)

Page 10: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

10

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Algunos de los estándares para metadatos geoespaciales, biológicos y ambientales

más usados

 

•FGDC-CSDGM. Content Standard for Digital Geospatial Metadata. Federal

Geographic Data Committe (1994): Datos geoespaciales. [www.fgdc.gov]

•FGDC-NBII. Perfil Biológico de FGDC. Biología y ciencias naturales. [www.nbii.gov].

•Global Change Master Directory Interchange Format – DIF. (1993) Ciencias de la

Tierra. [gcmd.gsfc.nasa.gov]

•Darwin Core (DwC). Colecciones de Historia Natural.

•Descriptores para Metadatos no-geoespaciales. NCEAS-LTER (1997) Datos

ecológicos. Base del estándar EML. [lternet.washington.edu]

Page 11: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

11

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Manejo de colecciones de datos científicos. Algunas experiencias locales

Red de Estaciones Ecológicas de Venezuela (ECORED)

Red de Estaciones Bioclimáticas del Estado Mérida (redbc)

Page 12: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

12

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Red de Estaciones

Bio-climáticas del Estado Mérida

(redbc)

Justificación

• Dificultades que existen en Venezuela para ubicar y usar colecciones de datos bio-climáticos.

• Interés de organizaciones, instituciones y personas que tienen datos históricos los cuales desean preservar o compartir para su uso a largo plazo.

• Necesidad de implementar un sistema de información que permita realizar análisis y descubrir correlaciones entre diferentes conjuntos de información, que ayuden a la toma de decisiones e investigación científica.

Page 13: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

13

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

La Experiencia de la Red de Estaciones

Bio-climáticas del Estado Mérida

(redbc)

• Manejo, identificación, y preservación en el tiempo, de recursos de información relacionados con la biología y el clima usando estándares internacionales de formato y contenidos.

• Generación de un Sistema de Información a través del Web que permita el facil acceso de investigadores, productores y organizaciones que necesiten la información producida por la red de estaciones.

Objetivos principales

Page 14: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

14

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

La Experiencia de la Red de Estaciones

Bio-climáticas del Estado Mérida

(redbc)

• Mantener en el tiempo las colecciones de datos y desarrollar mecanismos de almacenamiento, catalogación y distribución de la información generada.

• Realizar permanentemente labores de identificación de nuevas fuentes de información que puedan incorporarse a las colecciones existentes.

• Concientizar a los científicos sobre la importancia de la preservación de los datos generados en sus investigaciones.

Objetivos secundarios

Page 15: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

15

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Estaciones de la redbc

• Estación INIA-Chama, Sur del Lago de Maracaibo

• Estación Ciplat, Sur del Lago de Maracaibo

• Estación La Hechicera, Mérida

• Estación Mucujún, Mérida

• Estación Santa Rosa, Mérida

• Estación San Juan, Mérida

Page 16: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

16

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Instituciones afiliadas actualmente la redbc

•Centro Internacional del Plátano (CIPLAT)

•Instituto Nacional de Investigaciones Agrícolas (INIA)- Chama, Sur del Lago

•Instituto de Ciencias Ambientales y Ecológicas (ICAE) de la ULA

•Instituto de Investigaciones Agropecuarlas de la ULA (IIAULA)

Page 17: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

17

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Funcionamiento de la redbc

Sistema de Información Bioclimático basado en el web

• Ubicación de características de colecciones de datos.

• Utilización de tecnologías Internet-Web, que aceleran y facilitan grandemente el proceso de captura, actualización y difusión de la información bio-climática, permitiendo varios niveles de acceso y recuperación de dicha información.

• Actualmente sólo se proveen datos sin procesar (archivos de datos provenientes de las estaciones meteorológicas) y sus respectivos metadatos. En el futuro se podrá acceder a información previamente procesada (gráficos, tablas, etc).

• Libre acceso a colecciones de datos (datasets) producidos por miembros de la red y (en lo posible) por cualquier persona o institución que los necesite.

Page 18: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

18

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Internet

Miembros de la REDBC

Servidor (CECALCULA)

Funcionamiento de la redredbcbc Sistema de manejo de datos:

Datos llegan por varias vías (enviados por gerentes locales de información):

-E-mail -Web

-CD-Entregas personales

Gerentes Centrales de información los procesan de ser necesario y los publican en Internet

Page 19: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

19

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Consultando las colecciones de datos

Es

Ejemplo: Colección de datos Estación Chama

Page 20: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

20

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Enlace

Consultando las colecciones de datosEjemplo: Colección de datos Estación Chama

Presentación de datos

•Datos originales (sin procesar)

•Datos ordenados (Por año y por mes)

•html

•xml (EML: Ecological Metadata Language)

•txt

Formato de metadatos

Page 21: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

21

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Metadatos html(para visualización por Web)

Metadatos xml (EML) (para intercambio con otros sistemas y procesamiento automático)

Consultando las colecciones de datosEjemplo: Colección de datos Estación Chama

Page 22: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

22

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Consultando las colecciones de datosEjemplo: Colección de datos Estación Chama

Interfaces Web: Datos originales

Page 23: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

23

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Consultando las colecciones de datosEjemplo: Colección de datos Estación Chama

Datos originales

Datos sin procesar, tal como vienen de los instrumentos o científicos que los capturan

Page 24: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

24

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Consultando las colecciones de datosEjemplo: Colección de datos Estación Chama

Datos ordenados

Datos con algún tipo de procesamiento

Page 25: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

25

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Consultando las colecciones de datosEjemplo: Consulta en KNB

Datos enviados a KNB:

http://knb.ecoinformatics.org

Page 26: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

26

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Formas de envío y publicación de metadatos y datos?

Afiliarse a la redbc

Llenar Planilla de documentación de datos proporcionada por el gerente central de información.

Se pueden configurar planillas de diferentes tipos: Web, Word, txt, etc.

Documentar los datos

•Contactar por e-mail o teléfono al Proveedor de metadatos

Page 27: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

27

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Dificultades en el desarrollo de proyectos de este tipo

• Escaso conocimiento de la importancia de la preservación y posibilidades de uso secundario de los datos.

• Poca disposición de los científicos para compartir los datos.• Poca receptividad para aportar metadatos que documenten las colecciones de

datos.• Confusiones que tienen que ver con los derechos de propiedad y uso de los

datos.• Información incorrecta sobre la calidad y cantidad de información que dicen

poseer algunas instituciones (entorpece la investigación).• Bajo interés por parte de algunos gerentes de información local en publicar

sus colecciones de datos (retardo en envío de datos-pérdida de información).• Algunos gerentes locales no disponen de conexión a internet.• Costos de los instrumentos de captura de datos.• No existe la figura de “gerente local de información”.

Page 28: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

28

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

El Futuro

Usos futuros:

• Redes de manejo de conocimientos basadas en datos y metadatos (intención de KNB)

• Acceso a herramientas analíticas "en-línea" para integrar varias herramientas como SAS, MATLAB, etc. con acceso a datos de red de científicos (LTER)

• Herramientas para producir formas alternativas de metadatos que permitan a cualquier sitio participar fácilmente en otras bases de datos internacionales y Clearinghouses de datos (FGDC, GCMD, NBII, etc.)

Page 29: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

29

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

Referencias

•Clearinghouse Federal Geographic Data Commite (FGDC,NBII)http://www.fgdc.gov/clearinghouse/

•Global Change Master Directory (GCMD, DIF)http://gcmd.gsfc.nasa.gov

•Long Term Ecological Research Network (LTER, EML)http://lternet.edu

•Knowledge Network of Biocomplexity

http://knb.ecoinformatics.org

•National Center for Ecological Analysis and Synthesiswww.nceas.gov

Page 30: 1 Manejo de colecciones de datos científicos en la web Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida Manejo.

30

Manejo de colecciones de datos científicos en la web

Universidad de Los Andes, Centro Nacional de Cálculo Científico, Parque Tecnológico de Mérida

www.cecalc.ula.ve/redbc/