Bases de datos y recursos digitales para el estudio de los incunables clásicos en España....

45
Bases de datos y recursos digitales para el estudio de los incunables clásicos en España. Perspectivas de investigación a la luz de la tecnología Elena González-Blanco García [email protected] LOS CLÁSICOS LATINOS EN LOS ORÍGENES DE LA IMPRENTA: TEXTOS, CONTEXTOS Y CULTURA IMPRESA (CA. 1450-1540)” UNED. 19-21 de noviembre de 2014.

Transcript of Bases de datos y recursos digitales para el estudio de los incunables clásicos en España....

Bases de datos y recursos digitales

para el estudio de los incunables

clásicos en España. Perspectivas de

investigación a la luz de la tecnología

Elena González-Blanco García

[email protected]

“LOS CLÁSICOS LATINOS EN LOS

ORÍGENES DE LA IMPRENTA:

TEXTOS, CONTEXTOS Y CULTURA

IMPRESA (CA. 1450-1540)”

UNED. 19-21 de noviembre de 2014.

Perspectivas de análisis desde

las Humanidades DigitalesCambios en la aproximación al estudio de los

incunables y de los clásicos

Evolución de la web

1949…

5

Era del PC

Web 1.0

Web 2.0:Web social

Web 3.0: web de datos enlazados

Digital Incunabula metaphorGregory Crane et al, 2006. “Beyond Digital Incunabula: Modeling

the Next Generation of Digital Libraries”. Lecture Notes in

Computer Science Volume 4172, 2006, pp 353-366,

http://www.eecs.tufts.edu/~dsculley/papers/incunabula.pdf

Web 1.0 – web estáticaModelos “incunables” = primeras bibliotecas digitales

Los modelos digitales solucionan los problemas pero imitan las realidades que los preceden (el papel).

• Publicaciones en PDF o HTML que siguen la estructura del papel: encabezado, pie de página, notas, bibliografía.

• Los metadatos siguen las clasificaciones en papel de las signaturas de las bibliotecas

• Las primeras bibliotecas digitales son estáticas y no son capaces de generar nuevo contenido por sí solas ni de aprender

Catálogos digitalizados

Catálogos en pdf colgados en

internet• García Romero: Catálogo de incunables de la Real

Academia de la Historia,

1921http://ia600604.us.archive.org/5/items/catlogodelosi

n00garc/catlogodelosin00garc.pdf

• Catálogo de incunables y obras impresas del siglo XV

de la Biblioteca Municipal de Madrid,

2002.http://www.memoriademadrid.es/fondos/BH/docum

entos/BHM_CatalogoIncunables.pdf

• Catálogo de incunables de la Biblioteca Foral de

Navarrahttp://www.unav.es/biblioteca/jmtorres_publicaci

ones/pdf/INCU.PDF

Catálogo de Martín Abad

Un paso más: bases de datosCreación de catálogos locales en las bibliotecas

• Disponibles online

• Acceso libre

• Permiten búsquedas de complejidad creciente en

distintos campos

Listados de catálogos

http://www.utm.edu/staff/bobp/vlibrary/15ercatalogs.shtml

Bayerische Stadtbibliothek

Bayerische Staatbibliothek BSB: http://inkunabeln.digitale-

sammlungen.de/start.html

Inkunabel Zensus Österreich

http://aleph.onb.ac.at/F?func=find-

b&local_base=ink

Interoperabilidad

Gesamtkatalog der Wiegendrücke

36,000 descripciones de incunables, con más de 3,900 artículos

http://www.gesamtkatalogderwiegendrucke.de

ISTC: Incunabula Short Title Catalog

En 2008 29,777 registros, incluyendo impresos del siglo XVI

http://www.bl.uk/catalogues/istc/

Catálogos… y másImágenes de las obras

Enlaces a otras bases de datos

Otros elementos adyacentes: encuadernaciones,

poseedores

Sistemas de localización geográfica…

Digital gallery of rare books &

special collections, Keio

University Library

http://project.lib.keio.ac.jp/dg_kul/incunabula_tbl.php?lang=en

Proyecto vdIb - Verteilte

Digitale Inkunabelbibliothek

http://inkunabeln.ub.uni-koeln.de

IPI Index Possessorum

Incunabulorum

http://ipi.cerl.org/cgi-bin/search.pl parte de CERL (Catalog of European Research Libraries)

Typenrepertorium der

Wiegendrücke

http://tw.staatsbibliothek-

berlin.de/html/type.xql

Base de datos de

encuadernaciones de la RB

http://encuadernacion.realbiblioteca.es/index.ph

p

Portales monográficos:

Dawn of Western Printingde Dawn of western printing, elaborada por la

National Diet Library de Tokio, Japón, incluye desde

un sencillo panorama histórico sobre el proceso de

fabricación de estos libros hasta un complejo índice

de tipos utilizados por los distintos impresores.

http://www.ndl.go.jp/incunabula/e/index.html

Atlas of Early Printings, Iowa

http://atlas.lib.uiowa.edu

Traducciones de textos latinos:

BUDE♦ Europa Humanistica

♦ Tradlat

Web 2.0• Portales “nodo” de catálogos de incunables

• Listas de correo:

[email protected]

• Digital Classicist

• Digital Medievalist

• Blogs: http://www.stoa.org

Las bibliotecas “post-incunables”

• Granularidad: los diferentes items bibliográficos inclyenelementos que facilitan la búsqueda y la accesibilidad a la información cuando son enlazados: Marcado, procesamiento automático, estructuración de los documentos y uso de convenciones para el intercambio de datos.

• Autonomía inteligente: sistemas que “aprenden” de sus contenidos y se ponen en relación con fuentes o recursos similares.

• Colaboración de la comunidad de usuarios: modelo Wikipedia.

• Creación de bibliotecas orientadas a las necesidades del usuario y personalizables que auto-aprendan de sus preferencias

Web semántica o web 3.0

¿Qué es la web semántica?• La web pasa de convertirse en una web de

documentos a una web de DATOS.

• Los datos son reutilizables y se conectan

• Los datos se relacionan, no hay datos aislados

• Existen vocabularios controlados para describir el

mismo tipo de información

• Informáticamente, se codifican como “tripletas”

SUBJECT-PROPERTY-OBJECT

LOD principles

Information is available on the Web (any format)

under an open license

Information is available as structured data (e.g. Excel

instead of an image scan of a table)

Non-proprietary formats are used (e.g. CSV instead

of Excel)

URI identification is used so that people can point at

individual data

Data is linked to other data to provide context

¿Quién?: BNE, BNF…

Digitalización + Linked Data

EDM main properties Modelo de www.europeana.eu

Vocabularios controlados

Los grandes proyectos

http://www.biblissima-condorcet.fr

Para los incunables…

Los Clásicos

Los “hijos” de Perseus

http://sites.tufts.edu/perseids/

Una mirada hacia el futuro…

Líneas estratégicas de avance:

• Digitalización y procesamiento de imágenes con

OCR avanzados y específicos

• Creación de colecciones documentales digitales

utilizando estándares y en acceso abierto

• Enlace de las diferentes bases de datos y recursos

mediante las tecnologías de la web semántica

Digitalización y procesamiento

de imágenes• Captura

• Presentación y Preservación

• Puesta en web: colecciones digitales

• Almacenamiento a mayor calidad (másteres)

• Reconocimiento y tratamiento

• Imágenes digitalizadas

• Imágenes + Metadatos

• Reconocimiento con OCR (DAG-CVC)

• Transcripción manual y edición crítica digital

• Enlace y visibilidad

Referencias bibliográficasMonfort, Marie-Laure. Où en est le catalogue mondial des incunables?. Bulletin des bibliothèques de France [en ligne], n° 5, 1995 [consulté le 20 novembre 2014]. Disponible sur le Web : <http://bbf.enssib.fr/consulter/bbf-1995-05-0042-003>. ISSN 1292-8399.

Digitizing Latin Incunabula: Challenges, Methods, and Possibilities

Jeffrey A. Rydberg-Cox <rydbergcoxj_at_umkc_dot_edu>, University of Missouri-Kansas City, Changing the Center of Gravity: TransformingClassical Studies Through Cyberinfrastructure 2009 Volume 3 Number 1 http://www.digitalhumanities.org/dhq/vol/3/1/000027/000027.html#

Beyond Digital Incunabula: Modeling the Next Generation of Digital Libraries⋆ Gregory Crane, David Bamman, Lisa Cerrato, Alison Jones, David Mimno, Adrian Packel, David Sculley, and Gabriel Weaver. Perseus Project, Tufts University. En Research and Advanced Technology for Digital Libraries

Lecture Notes in Computer Science Volume 4172, 2006, pp 353-366, texto completo en http://www.eecs.tufts.edu/~dsculley/papers/incunabula.pdf