BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” –...

37
BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO I JULIO 2015 Ana Lucía Delgado Delgado

Transcript of BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” –...

Page 1: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

BIBLIOTECA NACIONAL “EUGENIO ESPEJO” –CASA DE LA CULTURA ECUATORIANA

DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO I

JULIO 2015

Ana Lucía Delgado Delgado

Page 2: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

En un proyecto que involucre la digitalización de documentos, sedebe tomar en cuenta los siguientes aspectos:

• Los objetivos del proyecto• Los estándares tecnológicos• El acceso a las imágenes y a los índices de datos• La calidad de las imágenes• La funcionalidad del sistema• La protección de la información digitalizada• La evolución de las tecnologías de la información

Page 3: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

LOS OBJETIVOS DEL PROYECTO En el marco del proyecto de digitalización del Fondo Ecuatoriano Republicano I (FER I), hemos priorizado los siguientes objetivos:

‐ El acceso a largo plazo de la información digitalizada ‐ La calidad de las imágenes digitalizadas‐ La seguridad y la confidencialidad de la información ‐ La funcionalidad continua del repositorio

Page 4: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

LOS ESTÁNDARES TECNOLÓGICOSEl uso de un conjunto de estándares tecnológicos, definitivamente contribuye  a lograr los objetivos propuestos.  El Archivo Nacional de Québec recomienda tener en cuenta los siguientes estándares: 

‐ La Norma ISO 9660 para el registro y lectura de los datos en discos ópticos con el fin de asegurar su migración a diferentes ambientes tecnológicos. 

‐ El formato TIFF para la toma de imágenes. ‐ La Norma ISO 19005‐1:2008, que define el uso del 

formato PDF, como un estándar para el archivo y conservación de documento a largo plazo.

Page 5: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

EL ACCESO A LAS IMÁGENES El acceso a la información conservada en discos ópticos supone que esa información permanecerá legible, inteligible y recuperable. 

La legibilidad significa la posibilidad de acceder en todo momento, presente o futuro a la información digitalizada sin ninguna pérdida de datos. 

Page 6: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Generalmente, la imposibilidad de acceso a la información proviene de la obsolescencia del material.  

La recuperación de la información implica la posibilidad de encontrar la información almacenada en los discos ópticos y acceder fácilmente. 

Page 7: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Para garantizar el acceso a la información, se deben respetar las  siguientes reglas:

• Establecer una estrategia de migración que permita la evolución del equipo, los programas informáticos y los soportes de almacenamiento de los datos al ritmo de los cambios tecnológicos. 

• Flacso Andes tiene un plan de respaldo de todos los contenidos digita

Page 8: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

LA CALIDAD DE LAS IMÁGENES 1. La verificación de la calidad de las imágenes se 

hace mediante tres operaciones: 

• La toma de las imágenes • Su mejoramiento • La compresión y descompresión de los datos 

digitalizados. 

Page 9: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Para obtener una buena calidad de la imagen se deben respetar cuatro reglas: 

1. El equipo (unidad de disco óptico y escáner) debe ser calibrado correctamente de acuerdo con las instrucciones del productor y ajustado de acuerdo con las necesidades del usuario. 

Efectuar una prueba con un muestreo de documentos antes de iniciar la digitalización de todo un fondo documental.

Page 10: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

2. La densidad de la digitalización se da en función de la calidad de la imagen y de la capacidad de almacenamiento que se desean. Se debe tener en cuenta la capacidad de memoria de los discos ópticos. 

3. Para mejorar una imagen digitalizada se puede hacer una edición para limpiar la imagen, suprimiendo los datos de una forma selectiva o automática. En algunos casos, esto puede provocar una pérdida significativa de detalles, es por esto que, cuando se utiliza este procedimiento, se debe conservar un respaldo de la imagen original no mejorada 

Para los documentos que tienen valor de prueba o valor científico‐cultural, se debe conservar siempre una imagen no retocada. 

Page 11: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

4. La compresión y la descompresión de los datos. La compresión reduce enormemente el volumen de las imágenes digitalizadas por medio de fórmulas matemáticas. Estas fórmulas pueden ser comerciales o estándar. 

Si se utiliza este procedimiento de compresión y descompresión, se debe procurar realizarlo sin pérdida de datos. 

Page 12: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

LA FUNCIONALIDAD DEL SISTEMA DE DIGITALIZACIÓN 

La funcionalidad de un sistema de digitalización depende principalmente del uso de una arquitectura abierta y que sea compatible. 

Una arquitectura abierta permite:

• Mejorar los componentes del sistema sin degradar sus funciones y sin perder información 

• Importar y exportar los datos 

Page 13: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

PROTECCIÓN DE LA INFORMACIÓN DIGITALIZADA Para proteger los documentos digitalizados de una forma adecuada, es necesario: • La adquisición de soportes y tecnología de registro y 

almacenamiento de alta calidad • El control de la cantidad de los datos almacenados 

en el soporte • Generar respaldos de la información documental de 

forma periódica, utilizando formatos homogéneos en los datos y la documentación, procurando establecer un solo medio de respaldo electrónico, por ejemplo, los discos compactos no  regrabables. 

Page 14: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

EVOLUCIÓN DE LAS TECNOLOGÍAS DE INFORMACIÓN 

Este aspecto exige una constante actualización tecnológica con el fin de conocer los nuevos equipos y programas que aparecen en el  mercado para asegurar la migración de la información digitalizada

Page 15: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

FORMATOS DE ARCHIVOS DIGITALES ‐ FLACSO Andes

TIFF (Tagged Image File Format) – (formato de archivo de imagen etiquetado)Es un formato de fichero digital que acepta a compresión sin  pérdidas,  por  lo  que  se conserva  la  información  original completa. Se trata de un formato estándar y de uso libre, y es el más utilizado con  fines  de  conservación.  

Page 16: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

JPEG  (Joint Photographic Experts Group):  Se  trata  de  un  formato  de  gran calidad   para   imágenes   en   color   (24   bits) que ofrece  un   alto   grado   de compresión, aunque ésta siempre es con pérdidas. Es un formato estándar muy usado. 

Page 17: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

PDF  (Portable  Document Format):  Es  un  formato  de  almacenamiento  de documentos  compuesto  (imagen  vectorial,  mapa  de  bits  y  texto).  Es  un  estándar  muy  extendido  y mantiene  una  calidad  muy  buena.  El  PDF es  idóneo  para  imprimir  y  crear documentos  secuenciales  con  páginas  múltiples.El  PDF/A,  basado  en  un  subconjunto  del  formato  PDF,  es  el estándar  ISO  (ISO  19005‐1:2005)  para  la  preservación  de  los  documentos electrónicos a largo plazo.

Page 18: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

FASES DEL PROCESO DE DIGITALIZACION DE DOCUMENTOS

1. Identificación. 2. Clasificación. 3. Transporte y Recepción del material. 4. Preparación 5. Digitalización o captura. 6. Reconocimiento del texto. 7. Indexación. 

Page 19: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

1. IDENTIFICACIÓN. 

Tarea que le corresponde al personal técnico de la Biblioteca Nacional, luego de realizar una selección exahustiva del material bibliográfico que contiene el FER I, determinan que material va a ser enviado a Flacso Andes para ser digitalizado

Page 20: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

2. CLASIFICACIÓN. 

Lo realiza el personal técnico de la Biblioteca Nacional y consiste en: el ordenamiento del material bibliográfico, preparación del listado de los libros que serán enviados a digitalizarse y el correcto embalaje del material, para luego ser transportado a Flacso Andes.

Page 21: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

3. TRANSPORTE Y RECEPCIÓN DEL MATERIAL.

La Biblioteca Nacional ha asumido el compromiso de transportar el material bibliográfico que va a ser digitalizado, hasta las instalaciones de FlacsoAndes.

Page 22: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

4. PREPARACIÓN DE LOS DOCUMENTOS HA SER DIGITALIZADOS.

En esta fase se prepara la documentación a capturar, revisando uno a uno  los documentos, deshaciéndose de cualquier elemento que impida la ágil captura de las mismas o que puedan entorpecer o imposibilitar el proceso de digitalización.  

Page 23: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Las tareas más significativas a realizar en la fase de Preparación son: 

• Quitar clips, en el caso que se encontraren.  

• Separar documentos con varias páginas unidas. 

• Revisión de los documentos en su integralidad.

Page 24: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

5. DIGITALIZACIÓN  

Los documentos del FER I, se digitalizan en el escáner ATIZ BOOKDRIVE PRO, que es un escáner especializado para la digitalización de documentación histórica, cuya principal característica es que el documento no tiene que ser desencuadernado para ser escaneado.

Page 25: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Esta fase tiene una índole técnica muy importante, por lo que es necesario realizar durante la misma las siguientes tareas:

• Definir el formato del fichero que contiene la imagen digitalizada del documento original en papel. 

• Establecer los parámetros de digitalización (resolución, profundidad de bits, etc.).

Page 26: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

• Garantizar el equilibrio entre una calidad visual aceptable para el usuario y el tamaño del fichero. 

• Decidir si se va a crear un único fichero (con una o varias páginas) por cada documento original o varios ficheros (una por cada página). Para la carga de un documento en el Repositorio Digital es recomendable que el formato final del mismo sea un PDF (multipáginas).

Page 27: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

ESCANER ATIZ BOOKDRIVE PRO

Page 28: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

La captura de las imágenes en el escáner ATIZ se la realiza en el formato RAW,  dicho formato (a ser entendido como "formato de imagen sin modificaciones"), es un formato de archivo digital de imágenes que contiene la totalidad de los datos de la imagen tal y como ha sido captada por el sensor digital de la cámara fotográfica.

Son archivos que tienen un peso considerable, pero es porque almacenan mucha más información de: luz, detalle y color de la imagen que cualquier otro formato.

Page 29: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

6. RECONOCIMIENTO DEL TEXTO  

La fase de reconocimiento del texto está indiscutiblemente relacionada con la de digitalización y en muchos casos se realiza simultáneamente en el tiempo. 

Page 30: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

El reconocimiento automático de datos que realizamos con los archivos digitales en FlacsoAndes, es el OCR (optical character recognition). En este tipo de reconocimiento se harán uso de técnicas para la extracción automatizada de los datos significativos del documento. La utilización de OCR, proporciona la habilidad de convertir imágenes de caracteres en letra de máquina, en caracteres capaces de ser interpretados o reconocidos por un ordenador. 

Page 31: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

7. INDEXACIÓN 

En esta fase de Indexación se reúne toda la información identificatoria de los documentos junto con la información necesaria para su incorporación al Repositorio Digital, es decir, en esta etapa se debe obtener toda la información necesaria para la carga de la documentación en el repositorio. 

Page 32: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

PROCESO DE CATALOGACIÓN Y CARGA DE ARCHIVOS DIGITALES

Para la descripción de metadatos utilizamos el formato “DUBLIN CORE” (DC), constituido por quince metadatos básicos, los cuales se dividen en tres apartados: Contenido (Título, Tema, Descripción, Fuente, Lengua, Relación, Cobertura); Propiedad Intelectual (Autor, Editor, Colaborador, Derechos); y Creación e identidad (Fecha, Tipo, Formato, Identificador).

Page 33: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

DUBLIN CORE es un modelo de metadatos elaborado y auspiciado por la DCMI (Dublin Core Metadata Initiative), una organización dedicada a fomentar la adopción extensa de estándares interoperables de metadatos.

Page 34: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

VENTAJAS DEL USO DE DUBLIN CORE

• La simplicidad• La flexibilidad• La interoperabilidad semántica• Alto nivel de normalización formal• Crecimiento y evolución del estándar a 

través de una institución formal consorciada: la DCMI.

• Es un formato de uso por consenso internacional.

Page 35: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

REPOSITORIO FLACSO ANDESwww.repositorio.flacsoandes.edu.ec

Page 36: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

Descripción del Fondo Ecuatoriano Republicano I

Page 37: BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA …...BIBLIOTECA NACIONAL “EUGENIO ESPEJO” – CASA DE LA CULTURA ECUATORIANA DIGITALIZACIÓN DEL FONDO ECUATORIANO REPUBLICANO

GRACIAS