Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se...

9
Boletín de DIGIBÍS ® . Nº 8. Julio-Diciembre, 2012. Información sobre Digitalización, Bibliotecas Virtuales, Desarrollos Informáticos Propios y Servicios Documentales para Archivos y Bibliotecas. Enriquecimiento semántico Red Linked Open Data que permite el enriquecimiento semántico mediante vinculación de contenidos. La OCLC ha emprendido una estrategia idéntica .

Transcript of Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se...

Page 1: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012.

Información sobre Digitalización, Bibliotecas Virtuales,Desarrollos Informáticos Propios y

Servicios Documentales para Archivos y Bibliotecas.

Enriquecimiento semántico

Red Linked Open Data que permite el enriquecimientosemántico mediante vinculación de contenidos. La OCLC ha emprendido una estrategia idéntica .

Page 2: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

Editorial 3

I N T E R N A C I O N A LEuropeanaEuropeana Business Plan para 2013 4DIGIBÍS vincula la DPLA y Europeana 5NormativaRDA: Año 0 6Avances en BIBFRAME 7

B I B L I O T E C A SDesarrollos propiosNuevos avances en ENUMERATE 8Fondo Documental Histórico de Las Cortes de Aragón 9La Biblioteca Virtual de la Escuela de Traductores de Toledo 10

E V E N T O SPresentacionesI Jornadas de Patrimonio Cultural de Defensa 12La Fundación Ignacio Larramendi y el XI Encuentro de la Sociedad Civil 13Ferias y CongresosAsamblea General de Europeana 14NoticiasDIGIBíS® y las industrias culturales 16

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 3

SUMARIO EDITORIAL

DIGICLICBoletín de DIGIBÍS®

Directora GeneralTachi Hernando de Larramendi

Director de ProyectosXavier Agenjo Bullón

Directora FinancieraNuria Ruano Penas

Director Dpto. InformáticaJesús L. Domínguez Muriel

Director de ArteAntonio Otiñano Martínez

Director ComercialJavier Mas García

Coordinación TecnológicaFrancisca Hernández Carrascal

AdministraciónMaría Luz Ruiz Rodríguez (coord.)José María Alcega Barroeta

Dpto. de InformáticaAndrés Viedma Peláez (coord.)Feli Matarranz de Antonio (coord.)Andrés Felipe Botero Zapata

Julio Diago GarcíaMercedes Marcos SantosAndrés Moreno GarcíaRafael Roldán TejedorFernando Román Ortega

Dpto. de InnovaciónPaulo César Juanes Hernández (coord.)

Noemí Barbero UrbanoMaría Isabel Campillejo SuárezSusana Hernández RubioMontserrat Martínez Guerra

Dpto. de DigitalizaciónFrancisco Viso Parra (coord.)María José Escuté SerranoÁlvaro Hernáez Ríos

Amando Martínez CatalánJavier Ramos Altamira

Dpto. de DocumentaciónIsabel Martín Tirado

Beatriz Pascual FernándezAlicia Varela Villafranca

Luis Fernando Méndez Prado

Dpto. ComercialJosé María Tijerín Gómez

Coordinación con la Fundación Ignacio Larramendi

Patricia Juez García

DIGIBÍS®

C/ Claudio Coello, 123, 1ª planta28006 MadridTel.: 91 432 08 88Fax: 91 432 11 13

[email protected] | www.digibis.com

Depósito Legal: M-18050-2009ISSN (impreso): 1889-4968ISSN (en línea): 1989-5194

U na de las características más importantes que conlleva la aplica-ción del modelo de datos abiertos y vinculados (LOD) es la posibi-lidad de enriquecer semánticamente todos y cada uno de los regis-

tros de una aplicación bibliográfica, archivística o museológica. En efecto.los modelos de metadatos de los registros bibliográficos, de los archivísti-cos y de los museológicos permiten disponer de etiquetas apropiadas paraestablecer vínculos con recursos también en LOD.El caso más claro podría ser el enriquecimiento semántico de registros

MARC: disponen de un campo, el 024, en el que es posible registrar la direc-ción URI de otro recurso LOD y permiten especificar, a partir del subcampo“$2”, que el vínculo que hemos registrado corresponde a una estructura URI.Veamos como ejemplo el Fichero Virtual e Internacional de Autoridades,

conocido por sus siglas VIAF: cada una de las entradas de este riquísimo re-curso informático está compuesto por una serie de campos en los que cons-tan las distintas formas autorizadas del nombre de un autor procedentes dela transformación de la información que envían las bibliotecas nacionales;pues bien, si esa información se registra en el campo 024, se establece unavinculación entre el registro de autoridades de nuestra biblioteca virtual y el

denominado VIAF; lo mismo puede hacerse con losficheros o registros o recursos de autoridades LCSH(Library of Congress Subject Headings), los de laDBpedia o los de la Lista de Encabezamientos deMateria (LEM) para bibliotecas públicas que el Mi-nisterio de Educación, Cultura y Deportes ha trans-formado recientemente al modelo SKOS.Por ejemplo, la Lista de Encabezamientos de

Materia del Ministerio de Educación, Cultura y Deportes está vinculada alas respectivas listas de encabezamientos de materia de Estados Unidos,Francia o Alemania, al menos cuando se escribe este editorial. Por lo tan-to, un registro MARC, al estar vinculado a su vez, por el procedimiento men-cionado en el segundo párrafo, con registros de esas listas de encabeza-miento de materias, también en modelo SKOS, permitirá navegar a otrosregistros similares. Es obvio que la vinculación relaciona los conceptos sal-vando las diferencias lingüísticas.Los recursos mencionados están, a su vez, vinculados con otros siguiendo

las técnicas específicas de los sistemas sencillos de organización del conoci-miento y, como a su vez, esos recursos están vinculados con registros biblio-gráficos el lector, que es en último término para quien se trabaja, se ve bene-ficiado por el acceso a una información más rica e incluso inesperada.

Enriquecimiento semántico

Estrategias básicaspara acceder de formaautomatizada a toda lainformación disponible

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 20122

Page 3: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

4 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 5DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

EUROPEANA EUROPEANA

INTERNACIONAL I

NTERNACIONAL

DIGIBÍS® vincula la DPLA y Europeana

U no de los mayores acontecimientos delsegundo semestre de 2012 ha sido elanuncio del próximo lanzamiento de la

Digital Public Library of America (DPLA), un pro-yecto análogo a Europeana comunicado a losmiembros de la Task Force de Europeana en lareunión celebrada en Viena en otoño de 2011. De hecho, toma explícitamente por modelo a

Europeana y ha previsto la realización y la imple-mentación de sus fondos utilizando procedimien-tos análogos a los que utiliza ésta. No puede caberninguna duda de que se trata de un reforzamientoy de un afianzamiento de la metodología generalde Europeana y supone un respaldo sin preceden-tes en el modo de hacer de la UE.Así, el modelo de la aplicación de la DPLA, que

en su versión tres se asemeja considerablementeal Europeana Data Model (EDM), se ha beneficia-do de la aportación de los técnicos de Europeanaque han participado en su redacción. También, através de su lista de correo especializada, ha sidoposible llevar a cabo sugerencias y modificacio-nes a esta estructura de información.

Desarrollo informático de DIGIBÍS para las API de la DPLA y Europeana

Un aspecto esencial de todo ello, desde el pun-to de vista de DIGIBÍS®, ha sido el desarrollo deuna herramienta informática (API) muy útil tantopara la DPLA como para Europeana. DIGIBÍS®, a través de su departamento de In-

formática, consideró oportuno llevar a cabo undesarrollo específico que permitiera utilizar deforma conjunta la API de Europeana así como elprototipo de la API de la DPLA, lo que se comuni-có tanto a la directora de la DPLA, Maura Marx,como a la directora de Europeana, Jill Cousins, yse dio a conocer a través de la lista de correos delas Technical Task Forces. El desarrollo ha obte-nido el beneplácito de ambas instituciones.

Ya antes de que la DPLA echara a andar se dis-ponía de una herramienta desarrollada en códigoabierto por DIGIBÍS® para consultar simultánea-mente dos grandes bibliotecas digitales. DIGIBÍS®

previó su importancia no sólo para facilitar al lec-tor la consulta de una biblioteca digital muy gran-de, por sus siglas en inglés VLDL, sino porque yase preveía la ventaja de consultar una segundaVLDL con la misma ecuación de búsqueda.La Fundación Europeana ha solicitado a DIGI-

BÍS® que prepare una entrada para el blog de Eu-ropeana Professional sobre nuestro desarrollo yla DPLA ha anunciado su lanzamiento para el 18de abril de 2013. Sin duda alguna se convertirá, como ya lo es

Europeana, en un recurso de información de pri-mera categoría y en una muestra más de coope-ración en el entorno Linked Open Data tanto enEuropa como en Estados Unidos, lo que no dejaráde tener una influencia considerable en el restodel mundo. En las páginas que en este DIGICLIC®

se dedican a la Asamblea General de Europeana,se da cuenta del acuerdo establecido con NuevaZelanda y con Corea, extendiendo así un modelode datos que, en sus sucesivas actualizaciones,cada vez resulta más útil y preciso para la ediciónLinked Open Data de datos bibliográficos, archi-vísticos y museológicos.

Europeana Business Plan para 2013

A unque estas páginas se escriben, comoes natural, ya vencido el año 2012 y va-rias semanas después todavía no se co-

noce el contenido exacto del Europeana BusinessPlan para 2013, lo cierto es que sí se pueden darunas pinceladas generales sobre cuál va ser sucontenido.En efecto, a lo largo de 2012 se han celebrado

distintos talleres destinados a precisar diferentesaspectos de lo que habrá de ser el EuropeanaBusiness Plan para 2013 y, sobre todo, en laAsamblea General de Europeana (AGE) se terminóde perfilar el borrador sobre el que trabajará

finalmente el personal de la Fundación Europeanay de la Europeana Network. Lo hizo HarryVerwayen, quien en su larga presentación (99 dia-positivas) sobre el Business Plan en el AnnualGeneral Meeting Europeana Network, celebradoen Berlín el 28 de noviembre de 2012, dejaba lugara pocas dudas.Lo primero que hay que señalar es que se han

precisado los objetivos estratégicos para 2011-2015 y se prevé que a lo largo de 2013 se alcancenlos 27 millones de objetos digitales.Los tres puntos más destacados son:Primero: la consideración de Europeana como

un ecosistema de información que se expande demodo constante.Segundo: la consideración de Europeana como

un Core Service Platform para todo el sector delpatrimonio cultural europeo (expresión quepodría traducirse como que Europeana actúacomo una plataforma que constituye el núcleo de

un servicio que cataliza y promueve los cambiostécnicos en el sector).Tercero: la consideración de Europeana como

un proyecto que pone de manifiesto la importan-cia del valor de la información ahora que los obje-tos digitales que la constituyen disponen de unalicencia CC0, ya que resultan aplicables sobre eseinmenso conjunto de datos todo tipo de API y téc-nicas LOD de vinculación y reutilización de conte-nidos.Además de estas grandes líneas estratégicas,

se han fijado una serie de objetivos importantes,entre ellos el de potenciar el diálogo entre las ofi-cinas centrales de Europeana y los grandes agre-gadores, bien sean transversales, como TheEuropeana Library, o de carácter nacional, habién-dose citado de modo expreso al agregador nacio-nal, Hispana.No ha vuelto a mencionarse ESE debido a la

fuerte apuesta por EDM, que encaja perfecta-mente con las directrices del W3C LLD y que haobtenido un respaldo importantísimo con suadopción parcial por parte de la DPLA. Se han previsto así mismo algunos refinamien-

tos y progresos en EDM. En especial, en lo que serefiere a los Objetos Jerárquicos (iniciativa en laque participa el director de Proyectos de laFundación Ignacio Larramendi con una propuestade EDM diseñada a partir del Archivo Montiano), yal establecimiento de mayores vinculacionessiguiendo la tecnología LOD. También está previs-to utilizar schema.org.

data.europeana.eu es accesible con unSPARQL end-pointdesde el 21-XII-2012

Detalle del borrador del Europeana Business Plan 2013.

Digital Public Library of America. Prototipo del sitio web .

Page 4: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 7

NORMATIVA

INTERNACIONAL

P or parte de de los especialistas en la au-tomatización de bibliotecas siempre haexistido una fuerte reticencia a la utiliza-

ción del formato MARC. Mucho menor que la delos propios bibliotecarios que, transcurrido unbreve periodo de entrenamiento, son perfecta-mente capaces de catalogar un registro bibliográ-fico con los códigos necesarios; es decir, en elformato MARC; es decir, un conjun-to de metadatos perfectamentepredefinido que el ordenador es ca-paz de entender y que el ordenadores capaz de transmitir, haciendoque proyectos como el Control Bi-bliográfico Universal, sean en cier-ta medida una realidad, pues per-miten la reutilización delos objetos creados con-forme a ese formato. Alredactar así este párrafocasi parece que se estáuno refiriendo a las másmodernas tendencias Lin-ked Open Data puesto quese habla de un conjunto demetadatos inteligible por un ordenador y, por otraparte, perfectamente reutilizable por terceros.Una ventaja añadida del formato MARC es que

utiliza códigos numéricos para las distintas áreasde la catalogación, lo que ha facilitado extraordi-nariamente su extensión planetaria al no vinculara una lengua determinada los códigos particula-res para cada uno de los campos.

Migración de MARC a un nuevo modelo

Sin embargo, es cierto que el formato MARCparte de una realidad catalográfica muy antigua yque, sin duda, no se acomoda con perfección a loque podría ser la Web en la actualidad y muy enparticular a la tecnología de los datos abiertos yvinculados. En especial, su distinción entre campoy subcampo resulta particularmente difícil de tra-

tar o, por ser más precisos, dificulta un tratamien-to más flexible de la información bibliográfica.La Biblioteca del Congreso inició hace ya algu-

nos años un proyecto, denominado BIBFRAME,para migrar la antigua estructura del formatoMARC a otra radicalmente diferente, basada enformatos conformes con la red semántica; el pro-ceso va a ser largo sin duda alguna, mucho más

de lo que algunos ingenuos previe-ron cuando se hizo el anuncio deeste proyecto de migración.Por otro lado, es muy interesan-

te aprovechar el momento precisoen el que lo que habían sido laAACR2, e iban a ser las AACR3, lle-garon a convertirse en un nuevo

modelo radicalmente dis-tinto de catalogación co-nocido por sus siglas RDA.Si a esto se une el avanceverdaderamente conside-rable, desde un punto devista cualitativo, de las bi-bliotecas virtuales o digi-tales, el cambio de una

estructura de datos a otra no podía ser más opor-tuno.Sin embargo, queda mucho por hacer. Periódi-

camente se van conociendo nuevos avances enesta tecnología y en esta nueva definición de da-tos y existen varias listas de correo en las que losmejores expertos del mundo en el campo de lacatalogación y de la automatización de bibliotecasproporcionan una discusión riquísima desde elpunto de vista conceptual y suministran todo tipode ejemplos que afirman o contradicen de unamanera dialéctica el proceso de la creación de lanueva normativa. Por eso ha sido muy acertadopor parte de la Biblioteca del Congreso de los Es-tados Unidos la creación de una página web en laque se reúnen y se actualizan los diferentes avan-ces en el proyecto.Es, pues, una página de referencia ineludible.

Avances en BIBFRAME

6 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

NORMATIVA

INTERNACIONAL

C omo es sabido, la RDA es el nombre queterminó por adoptar la nueva versión o,por mejor decir, edición de las AACR2.

Parte de los desarrollos conceptuales que su-puso el modelo FRBR, así como la adopción delos Principios Internacionales de Catalogación,movieron al Comité Permanente de Revisión delas Reglas de Catalogación Anglo-Americanas apreparar una reforma mucho más radical que laprevista (sin duda, el desarrollo gigantesco de laweb también influyó considerablemente). El re-sultado de esta revisión radical ha sido la RDA. Sin embargo, es preciso tener en cuenta que

para llevar a cabo una catalogación automatizadaes necesario que cualquier código catalográfico seajuste a una codificación, es decir a unos metada-tos que, en el caso de las bibliotecas, conformanel formato MARC. Por ello, y a partir de la actuali-zación número nueve del formato MARC 21, co-menzaron a introducirse nuevos campos y sub-campos para reflejar las futuras prácticas catalo-gráficas y, sobre todo, las concepciones bibliográ-ficas que subyacen en el proceso de creación delos registros.También hubo de tomarse una importante de-

cisión. Se trataba de prever una fecha a partir dela cual el proceso de catalogación según lasACCR2 fuera sustituido por el proceso de catalo-

gación conforme a la RDA. Después de ampliasdeliberaciones se tomó la decisión de posponerhasta como mínimo enero de 2013 la entrada enproducción de la catalogación, no sólo con la RDAsino también con el formato MARC actualizado.La fecha final será el 31 de marzo de 2013.

En ese sentido las tres grandes bibliotecas na-cionales o que juegan el papel de tales en los Es-tados Unidos de América fueron cruciales. La Bi-blioteca del Congreso, la Biblioteca Nacional deAgricultura y la Biblioteca Nacional de Medicinaelaboraron un proyecto conjunto de formación queha durado prácticamente dos años.A esa iniciativa se han unido la Biblioteca Na-

cional del Canadá y la Biblioteca Nacional de Aus-tralia, y pronto se sumó la Biblioteca Nacional deGran Bretaña. Por último, se adhirió también aese proceso la Biblioteca Nacional de Alemania.En el resto de Europa se creó un grupo de tra-

bajo, denominado EURIG, con el objetivo de aunaresfuerzos y llegar a acuerdos para la realizaciónde un proceso similar al de los Estados Unidos,que permita la puesta en producción de las RDAen Europa. Conviene señalar que en ese grupo detrabajo figuró prácticamente desde un primermomento el director de Proyectos de la Funda-ción Ignacio Larramendi y de DIGIBÍS®, XavierAgenjo.A lo largo de estos años DIGIBÍS® se ha esfor-

zado en la implementación sistemática de las va-riaciones del formato MARC para dar cabida a lasnuevas reglas estructuradas en las RDA. De he-cho, la Biblioteca Virtual Larramendi de Polígra-fos, accesible desde la web de la Fundación Igna-cio Larramendi, la utiliza de forma habitual.

RDA: Año 0

Página dedicada al proceso de implementación de las RDA.

La Library of Congresspublicó el documentoen inglés y en español

BIBFRAME: apócope de Bibliographical

Framework Transition Initiative

Page 5: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

E l proyecto de la creación de un recurso di-gital para el Fondo Documental Históricode las Cortes de Aragón es un ejemplo

más, aunque especialmente sofisticado, de la ca-pacidad de DIGIBÍS® para transformar unos pro-yectos de digitalización que no habían conseguidoni la visibilidad ni la accesibilidad deseada, en unrecurso digital completamente estándar, ajustadoa la normativa prescrita internacionalmente, loque permite que pueda ser recolectado por losagregadores internacionales. Además, el ajustede los esquemas de metadatos del recurso a lanormativa última le hace capaz de adaptarse a losavances que se vayan produciendo en este campo.El proyecto partía de dos bases de datos diferen-

tes: una, de gestión bibliográfica, y otra, de gestiónarchivística. Por lo tanto, fue preciso llevar a caboun proceso complejo de transformación de la infor-mación en cada una de las dos bases de datos a losestándares actuales, lo que permitió ver claramen-te hasta qué punto es ineficaz separar los procesosde digitalización –y la inversión realizada en ellos–de los de creación de objetos digitales y de bases dedatos normalizadas que permitan su explotación dela manera más rica posible.

Proceso único de creación del recurso digital

DIGIBÍS® comprueba con frecuencia que seinvierte mucho más dinero y que se utilizan unospresupuestos mucho más altos al dividir la crea-ción de un recurso digital en diversos procesos:por un lado, la digitalización; por otro lado, la crea -ción de los registros que no están verdaderamentevinculados con las imágenes digitalizadas y, porúltimo, la integración de esos registros y de esasimágenes en una base de datos capaz de sacartodo el partido posible al esfuerzo realizado.En este caso, y como es frecuente y ya habitual

en sus procesos de creación de recursos digitales,DIGIBÍS® creó una base de datos para tratar los

distintos tipos de materiales manuscritos, impre-sos antiguos, cartográficos… de que se componeel Fondo Documental Histórico de Las Cortes deAragón, implementando además un repositorioOAI que se actualiza dinámicamente desde la basede datos y, por lo tanto, es recolectable por cual-quiera de los agregadores más importantes.Así ocurrió en este caso, y los recursos digita-

les, los objetos digitales patrimoniales, para usarla terminología de Europeana, se generaron diná-micamente utilizando el sistema de gestión de lainformación de DIGIBÍS® con su correspondienterepositorio OAI y con la generación de unosesquemas de metadatos verdaderamente ricos:lo que significa, en estos momentos, mediante laaplicación del Europeana Data Model. Como resultado de todo ello, el Fondo Docu -

mental Histórico de Las Cortes de Aragón no sóloes accesible en la página web que el lector puedever impresa en estas páginas sino desde Hispana,que lo recolectó a las pocas semanas de habersedado de alta, y desde Europeana, que lo recolectóposteriormente desde Hispana.

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 9

DESARROLLOSPROPIOS

BIBLIOTECAS

8 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

E l proyecto ENUMERATE ha tenido un signi-ficativo avance en el segundo trimestre de2012. En efecto, el Consorcio ha publicado

una base de datos con el resultado de la encues-ta realizada así como con el tratamiento informá-tico y estadístico del proyecto y de la encuesta.

Actuación decisiva de DIGIBÍS®

El tratamiento estadístico de 1950 respuestasfue realizado por la empresa holandesa Panteia,especializada en este sector, pero sin duda algunala actuación más significativa fue la de DIGIBÍS®,que creó en una página web una base de datos quepermite la consulta de toda la información recogi-da hasta el momento. Este trabajo, cuya utilidadha sido explícitamente valorada en público y en lared de forma muy elogiosa por los miembros delconsorcio y muy en particular por Nick Poole, essin duda un trabajo de grandísima utilidad. Deberecordarse que Nick Poole no sólo es el CEO delCollections Trust y del propio Consorcio ENUME-RATE, sino que preside en estos momentos laEuropeana Network.

No resultó extraño por lo tanto que, como seindica en las páginas de este DIGICLIC® dedica-das a la Asamblea General de Europeana, losdatos obtenidos por ENUMERATE se sacaran acolación durante la propia Asamblea, indicándosecomo una preocupación y una prioridad la consi-derable diferencia entre la estimación de los

datos obtenidos por ENUMERATE y los que dispo-nía Europeana en ese momento.De hecho, en el blog de Europeana Professio -

nal se publicó una entrada en la cual el ConsorcioENUMERATE urgía a Europeana a tener en cuen-ta los datos estadísticos obtenidos, pues sin dudaalguna toda planificación futura debería estarbasada sobre el conocimiento de la realidad. Aun -que no pueda afirmarse que los datos suministra-dos por ENUMERATE sean precisos de una formaabsoluta, sí se puede decir que van mucho másallá que una estimación como la que utilizabaEuropeana antes de la elaboración, la cumpli-mentación y el análisis de la encuesta y la publi-cación en la base de datos.El hecho de que los datos estén accesibles

para su consulta por todo el mundo que se hayainteresado en ello permite tener una idea correc-ta de cual es la realidad del proyecto Europeanaen lo que se refiere tanto al fondo que debe digi-talizarse como a los metadatos de los que se dis-pone y a los recursos informáticos, repositorio oagregador OAI y tecnología Linked Open Data,coincidentes con los objetivos estratégicos queprevé el proyecto Europeana.Está previsto llevar a cabo una segunda en -

cuesta a lo largo del año 2013, lo que permitiráaquilatar hasta qué punto los datos de los que sedispone son relevantes y se corresponden con larealidad.

DESARROLLOSPROPIOS

BIBLIOTECAS Nuevos avances en ENUMERATE Fondo Documental Histórico

de las Cortes de Aragón

De los 2200 proveedoresde datos con que cuenta Europeana, 1950 contestaron la

encuesta de ENUMERATE

La base de datos está en:enumeratedataplatform.digibis.com/datasets.

Page 6: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

10 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

T ras el considerable éxito académico y deconsultas que supuso la creación en 2011de la Biblioteca Virtual de la Escuela de

Salamanca, el Patronato de la Fundación IgnacioLarramendi decidió emprender en 2012 un pro-yecto aún más ambicioso, una biblioteca virtualde la antigua Escuela de Traductores de Toledo.El proyecto cuenta, como en el caso anterior, conla cofinanciación de la Fundación MAPFRE y se habuscado la colaboración de la Universidad deCastilla-La Mancha, institución de la que depen-de la nueva Escuela de Traductores de Toledocreada en 1994.Si bien el descubrimiento, o redescubrimiento,

de la Escuela de Traductores de Toledo tuvo lugaren el siglo XIX con unas obras que ya son clásicas,a partir de la segunda mitad del siglo XX empezó aponerse en duda la existencia de la propia escue-la de traductores basándose en el hecho de queno había sido constituida formalmente como tal yque no podía asemejarse ni a un estudio generalni a una universidad.

Si bien todo ello es cierto, no cabe duda de quedichas escuelas existieron; y decimos escuelasporque puede hablarse de al menos dos periodosen los cuales se llevó a cabo una acción sistemá-tica de traducción de textos árabes, y en menormedida hebreos, bajo el patronazgo de dos perso-nas fundamentales: el arzobispo de Toledo y elrey Alfonso X el Sabio. Incluso puede hablarse deuna etapa intermedia en la que otro arzobispo deToledo, Jiménez de Rada, impulsó este tipo de es-tudios.

Toledo, que presentaba unas condiciones ex-cepcionales para servir de correa de transmisiónde la cultura clásica grecolatina a Occidente,también transmitió la cultura de los árabes, enor-memente pujante en ese momento y sumamentecreativa, que además incorporaba considerablesrealizaciones de la cultura persa e incluso de lacultura india. En Toledo había quienes conocíantodas esas lenguas. especialmente el árabe, elhebreo, el latín y el romance castellano. Y a Tole-do vinieron procedentes de toda Europa y alcan-zaron apoyo y ayuda sabios que deseaban incor-porar ese conocimiento que, en cierto modo, sehabía perdido en el Occidente europeo.

El micrositio

La Fundación Ignacio Larramendi decidió im-plementar en su sitio web un micrositio denomi-

DESARROLLOSPROPIOS

DESARROLLOSPROPIOS

BIBLIOTECAS La Biblioteca Virtual de la Escuela de Traductores de Toledo

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 11

nado Biblioteca Virtual de la Escuela de Traducto-res de Toledo en el que figuran todos los autoresque formaron parte de la escuela o escuelas deToledo con unos registros de autoridad enorme-mente enriquecidos y muy fructíferos a la hora derecuperar la información. También se decidióañadir, de forma radicalmente novedosa, algunosautores y traductores árabes o hebreos –muchosde los hebreos escribían en árabe directamente–que habían traducido a los autores greco-latinosy habían incorporado al mismo tiempo grandesdosis de conocimientos a sus traducciones me-diante comentarios y trabajo original. Los registros de autoridades se han realizado

utilizando la última versión del formato MARC 21,es decir, la número 15, que contiene multitud decampos para acomodar en ellos datos e informa-ciones sobre la persona, es decir, el autor. Hastaesta nueva concepción, basada directamente enRDA, los registros de autoridades proporcionabaninformación sobre el nombre de la persona y notanto sobre la persona en sí misma. Así, al poderproporcionar información sobre el autor era posi-ble adscribirlo a diversas escuelas de pensamien-to, vincularlo a determinados autores, a la escri-tura en ciertas lenguas, a su procedencia geográ-

fica, a la época concreta en la que actuaron. Todoello se recoge en los campos 37X del formatoMARC 21 de autoridades, definidos específica-mente para acoger la nueva filosofía de la catalo-gación que procede de RDA, como se ha indicadoen la página 6.

Enriquecimiento semántico

Un aspecto crucial ha sido el enriquecimientosemántico de los registros. Se han es tablecidosistemáticamente vínculos con el VIAF (Virtual In-ternational Authority File), que se recomienda ex-plícitamente entre los datasets preconizados porel W3C. Los vínculos están expresados medianteURI y proporcionan muchas variantes. Ello es fundamental en autores medievales cu-

yos nombres fueron trascritos de muy diversasmaneras a lo largo de los siglos y, dado el carác-ter árabe o hebreo de algunos, escrito en ambosidiomas. Así, hasta el siglo XIX ibn Gabirol y Avice-brón se consideraban autores diferentes.

Se ha añadido también a cada uno de los regis-tros de autoridad de los autores, comentaristas otraductores de la Escuela de Toledo el vínculo a laDBpedia. Resulta muy útil dado el multilingüismode este recurso y el gran número de enlaces aotras fuertes de información. El tratamiento, se-gún la tecnología Linked Open Data de las autori-dades de la Escuela de Traductores de Toledo y, engeneral, de la Biblioteca Virtual de Polígrafos Es-pañoles ha permitido crear un dataset en The DataHub: Polymath Virtual Library (Authority Data).

BIBLIOTECAS

Theorica planetarium, atribuido a Gerardo de Cremona.

Alfonso X en el Libro de juegos.

La Europeana API hapermitido agregar

1500 nuevos registros bibliográficos

No se trata de unaEscuela formal sino detalleres, como los deno-minó Menéndez Pelayo

Page 7: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

12 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

PRESENTACIONES

EVENTOS

S in duda como consecuencia del éxito de lacreación de la Biblioteca Virtual de Defensa,

la Subdirección General de Publicaciones y Patri-monio decidió preparar estas Jornadas para dar aconocer su plan estratégico a medio plazo.A pesar de que Margarita García Moreno y Pilar

Domínguez tuvieron que organizar las Jornadas enun plazo de tiempo muy breve, acudieron a ellasdestacados especialistas del Ministerio de Cultura:María Luisa Martínez-Conde habló de los proyec-tos de digitalización del patrimonio bibliográfico;Leticia de Frutos, de los proyectos de digitalizacióndel patrimonio artístico y Alfonso Sánchez Maire-na, del patrimonio archivístico. Antes de estos es-pecialistas, intervinieron las organizadoras de lasJornadas, que esbozaron los proyectos de la Sub-dirección General e hicieron lógicamente referen-

cia al proyecto de la Biblioteca Virtual de Defensa,presentado el semestre anterior.Cerró esa sesión el director de Proyectos de la

Fundación Ignacio Larramendi, que insistió en lanecesidad de contar con un Punto Único de con-sulta para bibliotecas, archivos y museos, perosin que ello suponga un tratamiento común de losdistintos tipos de materiales patrimoniales sinotodo lo contrario. Sería el mínimo común denomi-nador de un esquema de metadatos que facilita-ría la consulta. En último término, ese es el análisis funcional

tanto de Europeana como de la DPLA, siguiendo enambos casos las recomendaciones del W3C LLD.

La sesión de la tarde, moderada por Elena Es-colano, permitió que los responsables de los nu-merosos archivos, bibliotecas, y museos de De-fensa proporcionaran información sobre el estadoen el que se encuentran sus diferentes coleccio-nes. Resultó interesante comprobar cómo se hanllevado en el pasado un número considerable deproyectos de digitalización o de automatización o,incluso, de ambos proyectos enlazados, aunquecarentes de la normalización necesaria, lo que sepretende solventar ahora.Tanto la moderadora de la sesión como el direc-

tor de Proyectos de la Fundación Ignacio Larra-mendi insistieron en que verdaderamente no supo-ne ninguna dificultad insalvable la realización delos correspondientes mapeos de información parasu posterior integración en la Biblioteca Virtual deDefensa, cada uno de ellos con su esquema de me-tadatos específico. Es decir, el formato MARC paralas bibliotecas, el formato EAD/EAC para archivosy el formato LIDO para los museos. Si toda esa información digital se integrara en la

Biblioteca Virtual de Defensa sería fácil lograr lamáxima visibilidad y accesibilidad posible para lasriquísimas colecciones patrimoniales del Ministe-rio, pues ya desde el primer semestre de 2012 laBiblioteca Virtual de Defensa ha sido recolectada (ylo seguirá siendo) por Hispana y por Europeana.

I Jornadas de Patrimonio Cultural de Defensa

Mesa de la sesión de la mañana de las Jornadas.

Todos los proyectos secaracterizan por el cumplimiento de la

normativa internacional

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 13

PRESENTACIONES

EVENTOS

C omo bien se afirma en la sección de noti-cias de la página web de la Fundación Ig-nacio Larramendi, ésta quiso coger el

testigo de la intervención del propio Ignacio Her-nando de Larramendi, su fundador, en el II En-cuentro de la Sociedad Civil que tuvo lugar enGuadalajara, México, en 1994. En la web se recogen fotografías de aquella in-

tervención, en la que también estuvo presente laactual presidenta de la Fundación, Lourdes Mar-tínez, Vda. de Larramendi, todo lo cual pone demanifiesto un interés continuado en las activida-des de la sociedad civil, incluyendo el fomento delas mismas. De hecho, en los Objetivos básicos dela Fundación, figuran explícitamente de la si-guiente manera:

“2. Análisis de la función de las institucionesindependientes como medio de optimización derecursos y dinamización de la sociedad”.Así, no es de extrañar que la Fundación Ignacio

Larramendi participara activamente en el XI En-cuentro Iberoamericano de la Sociedad Civil que

tuvo lugar en Madrid los días 15 y 16 de octubre de2012, patrocinando junto con otras importantesfundaciones españolas las actividades que se cele-braron en las instalaciones de la Fundación ONCE.

El modelo de la Agenda Digital para Europa

La Fundación Ignacio Larramendi contribuyó ala celebración de las jornadas con una ponencia ti-

tulada La cultura como eje dinamizador de la so-ciedad cuya presentación corrió a cargo de su di-rector de Proyectos, Xavier Agenjo.La ponencia, de marcado sesgo tecnológico,

hacía hincapié en el modelo que supone la Agen-da Digital para Europa (2020) y señalaba que unade las acciones clave, la número 15, está dedica-da específicamente a la creación de Europeana,la biblioteca, archivo y museo digital de Europa enla que la Fundación Ignacio Larramendi y DIGI-BÍS® están jugando tan importante papel.El aspecto esencial de la comunicación está ba-

sado en la aplicación de la tecnología Linked OpenData y en la reutilización de contenidos en otrasáreas de la actuación social, como pueden ser lajusticia, la salud, el comercio o la administración.

La Fundación Ignacio Larramendi y el XI Encuentro de la Sociedad Civil

Arriba: Juan Andrés García, director de la AEF, Rosa María Pulido, vicepresidenta ejecutiva de la Fundación Eugenio de Mendoza y presidenta del

próximo Encuentro, y Carmen Hernando de Larramendi,patrona de la Fundación Ignacio Larramendi.

Abajo, comenzando por la derecha, sus hermanos y tambiénpatronos de la Fundación, Miguel, Margarita y Tachi,

esta última directora general de DIGIBÍS, y Xavier Agenjo,director de Proyectos de la Fundación y de DIGIBÍS. Fruto de la ponencia,

surgió el proyecto deorganizar una Jornadasobre la salud en elmarco de la AEF

Page 8: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

sión, que ha tenido lugar dentro de la Task Forcede Hierarchical Objects, dará lugar a un informede análisis y recomendaciones que se publicaráen los primeros meses de 2013.Volviendo a otros aspectos esenciales de la

Asamblea General de Europeana, Max Kaiserprestó una atención especial a todo lo relaciona-do con la versión dos de Europeana, conocidacomo Europeanav2, que entrará en funciona-miento a lo largo de 2013. Es uno de los objetivosdel Business Plan para ese año. Algunos de susaspectos de carácter técnico están ya disponiblesen Europeana Preview.

Encuentros bilaterales y grupos de trabajo

Como es costumbre en este tipo de reuniones,se llevaron a cabo todo tipo de encuentros bilate-rales entre proveedores de datos de Europeana.También se formaron grupos de trabajo dedicadosa los distintos aspectos técnicos del proyecto, ac-tuando según la metodología ya descrita en oca-

siones anteriores. Consiste en enumerar una seriede líneas de actuación muy precisas y posterior-mente presentarlas al conjunto de la Asamblea;aquellos puntos que resultan más significativos orelevantes para los miembros de la Asamblea sonlos que se reflejarán en el Business Plan anual.Conviene destacar que también hubo una serie

de sesiones dedicadas a la presentación breve dealgunos proyectos, destacando entre ellos el de lacreación de una aplicación muy compleja realiza-do por la empresa OntoText para crear un servicioSPARQL que acceda a los datos de Europeana yadisponibles como Linked Open Data. Mariana Da-mova, que presentó el proyecto, comentó y discu-tió con el director de Proyectos de la FundaciónIgnacio Larramendi la posibilidad de colaborarconjuntamente en un proyecto de estas caracte-rísticas. A pesar de la escasez de tiempo, la cola-boración se concretó unas semanas más tarde enun proyecto denominado HOLE y, aunque no seaposible afirmar que vaya a ser financiado por laUnión Europea, sí es una buena prueba de quetanto la Fundación Ignacio Larramendi como DI-GIBÍS® resultan cada vez más conocidas a los dis-tintos miembros de la Europeana Network. También se trató de la posibilidad de extender

a otros países el software OAsIs®, es decir, el sis-tema de información desarrollado por DIGIBÍS®

que combina repositorios y recolectores OAI quese alimentan recíprocamente de forma dinámicay que es, por ejemplo, la base técnica del muy va-lorado agregador español Hispana.

DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012 1514 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

E l día 27 de noviembre de 2012 tuvo lugar laAsamblea General de Europeana, acogidaen esta ocasión por la hospitalidad de di-

versas instituciones de la ciudad de Berlín.Ha sido una ocasión particularmente fructífe-

ra, pues la madurez del proyecto –asentada sóli-damente en la importante cantidad de objetos di-gitales disponibles en el portal de Europeana–demuestra hasta qué punto se encamina cada vezmás, con paso firme, hacia los objetivos que mar-có el Plan Estratégico 2011-2015.

La primera parte de la sesión estuvo dedicadaal análisis del borrador del Plan de Negocio parael año 2013. En ese borrador se fijan los objetivosque, aunque ambiciosos, son perfectamente fac-tibles. En este caso la presentación corrió a cargode Harry Verwayen.También resultó particularmente útil la infor-

mación de Louise Edwards acerca de la Funda-ción Europeana, que constituye, junto a Europea-na Network, los dos pilares organizativos de Eu-ropeana sin perder de vista, por supuesto, losproyectos individuales o específicos que se vandesarrollando asimismo con objetivos muy con-cretos. Edwards desarrolló el concepto commonsaplicado a Europeana y lo que ello conlleva.

FRBRoo, enlaces persistentes y objetos jerárquicos

El día anterior tuvo lugar una sesión de traba-jo muy intensa de las Task Forces de Europeanadedicadas a diferentes cuestiones como el uso deFRBRoo, los enlaces persistentes y los objetos je-rárquicos. El director de Proyectos de la Funda-ción Ignacio Larramendi, que forma parte de esteúltimo grupo, presentó un modelo de trabajo y unesquema de metadatos basado en una reflexióndetallada sobre el Europeana Data Model para losobjetos jerárquicos. Aplicó la reflexión a un caso particular: el Ar-

chivo Familiar Montiano, una de las bases de da-

tos que componen la web de la Fundación IgnacioLarramendi.

Los archivos digitales producidos por DIGIBÍS®

entre los pocos que ha recolectado Europeana

El archivo Montiano –que Ignacio Hernando deLarramendi poseía como heredero y descendientedirecto de Agustín Montiano y Luyando, creador yprimer director de la Real Academia de la Histo-

ria–, está estructurado conforme a EAD y EAC; seha establecido un crosswalk entre esos estánda-res archivísticos y el formato MARC de autorida-des y de registros bibliográficos respectivamente. La información puede visualizarse así mismo

utilizando la normativa ISAD (G) e ISAAR (CPF).Aunque todavía queda mucho para alcanzar unresultado satisfactorio conviene destacar queeste archivo, al igual que el “Archivo de la pala-bra” y el “Archivo de la imagen” de la Junta de Co-munidades de Castilla-La Mancha, ha sido reco-lectado por Europeana. Los tres archivos mencio-nados –producidos todos por DIGIBÍS®– se hansumado así al escaso número de archivos que Eu-ropeana ha podido incorporar hasta la fecha.Uno de los mayores problema radica en la po-

sibilidad de establecer jerarquías ajustadas alEuropeana Data Model, y eso fue justamente loque la Fundación Ignacio Larramendi presentó enla reunión del 26 de noviembre pasado. La discu-

FERIAS YCONGRESOS

EVENTOS

El proyecto EuropeanaAwarness pretende dara conocer la BibliotecaVirtual Europea al másamplio público posible

Se trató la posibilidadde extender el softwareOAsIs, de DIGIBÍS, basetécnica de Hispana

Asamblea General de Europ eana

FERIAS YCONGRESOS

Diversosmomentos

de laAsamblea.

EVENTOS

Page 9: Enriquecimiento semántico - DIGIBIS · 2018. 5. 31. · Asamblea General de Europeana (AGE) se terminó de perfilar el borrador sobre el que trabajará finalmente el personal de

16 DIGICLIC®. Boletín de DIGIBÍS®. Nº 8. Julio-Diciembre, 2012

EL TÍTULOEN VERSALITAS

D IGIBÍS® es una empresa que se caracte-riza, entre otras particularidades, por suapuesta decidida por el I+D+i. De ello ya

se ha dado cuenta en anteriores números publi-cados de DIGICLIC®.Así, DIGIBÍS® acudió a la convocatoria para

creación de software para la difusión internacionaldel patrimonio cultural español con una propuestapara desarrollar un producto específico al que de-nominó “OAsIs Museos”, resultando adjudicatariadel mismo, según el expediente 622/51 07 con unacantidad presupuestada, de 65.000 euros.Con esta ayuda y, sobre todo, en el marco del

desarrollo de las industrias culturales, DIGIBÍS®seplanteó el desarrollo de una aplicación completa-mente reescrita de su programa DIGIMUS® quecontara con funcionalidades tan eficaces como dis-poner de un repositorio OAI alimentado dinámica-mente desde la base de datos museológica que ge-nera Europeana Data Model (EDM). Se eligió comomodelo de datos para este proyecto el esquemaLIDO (Lightweight Information Describing Objects)que es el estándar internacional para la recolecciónde datos de museos promovido por el Consejo In-ternacional de Museos (ICOM, por sus siglas en in-glés). El proyecto está ya muy avanzado y se dispo-ne de una versión alpha con la que se están reali-zando ya ambiciosos proyectos.La circunstancia ha permitido el desarrollo de

un nuevo producto comercial (que se denominarápor razones de estrategia empresarial como elanterior: DIGIMUS 2.0®), lo que ha resultado muyoportuno porque DIGIBÍS® ha sido adjudicatariade dos consultorías para la creación de un puntoúnico de consulta para los archivos, bibliotecas ymuseos del Ministerio de Defensa.También se ha confiado a DIGIBÍS® la redac-

ción de la primera fase de un sistema de informa-ción desarrollado específicamente para que sirvade apoyo y reúna toda la información existente del

Greco, ya que se da la circunstancia de que el año2014 se conmemorará el cuarto centenario de sumuerte.De esta manera, se dispondrá de un nuevo pro-

grama, muy avanzado, que contará con las funcio-nalidades más importantes para el intercambio deinformación; de entre ellas, las más destacadasson las que se han reseñado antes, es decir, OAI yEDM, así como los diferentes módulos de inter-cambio de información basados fundamentalmen-te en METS que, como se sabe, es un encapsuladorde diferentes tipos de metadatos entre los que hayque destacar Dublin Core y, en el campo museoló-gico, los ya reseñados LIDO y EDM, así comoMETSrigths, METS/ALTO, PREMIS, etcétera.A la vista de las consultorías indicadas, queda

claro que el modelo de datos, las especificacionesfuncionales y los estándares que promueve Euro-peana, así como el W3C LLD (accesibles en la pá-gina web de la Fundación Ignacio Larramendi tan-to en inglés como en su traducción española) estáncada día más extendidos en España. DIGIBÍS® sealegra de haber contribuido a ello de una maneradestacada como prueban las aplicaciones (y lasestadísticas) existentes en España y que se reflejanen la aportación española a Europeana.

NOTICIAS

DIGIBÍS® y las industrias culturales

DIGICLIC nº 8 IN ENGLISH

ONLINE EDITION

You can read DIGICLIC nº 8 on our Website:http://www.digibis.com/digiclic.html

EVENTOS

Actividad subvencionada por el Ministerio de Educación,Cultura y Deporte.