EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...

36
EPIHUM: Desarrollo del corpus online de inscripciones latinas de España y Portugal durante el Renacimiento Prof. Manuel Blázquez Ochando. Dpto. Biblioteconomía y Documentación Universidad Complutense de Madrid [email protected] Prof. Manuel Ramírez Sánchez. Instituto Universitario de Análisis y Aplicaciones Textuales Universidad de Las Palmas de Gran Canaria. [email protected] Profa. Catarina Gaspar. Centro de Estudos Clássicos Universidade de Lisboa. [email protected]

Transcript of EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...

Page 1: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EPIHUM:DesarrollodelcorpusonlinedeinscripcioneslatinasdeEspañayPortugalduranteelRenacimiento

Prof.ManuelBlázquezOchando.Dpto.BiblioteconomíayDocumentació[email protected]

Prof.ManuelRamírezSánchez.InstitutoUniversitariodeAnálisisyAplicacionesTextualesUniversidaddeLasPalmasdeGranCanaria.manuel.ramirez@ulpgc.es

Profa.CatarinaGaspar.CentrodeEstudos ClássicosUniversidade [email protected]

Page 2: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Índice

� Introducción, orígenes, motivaciones

� Objeto de estudio

� Estado de la cuestión: fuentes

� Metodología

� Desarrollo, dificultades y soluciones

� Programa EPIBASE

� Conclusiones

Page 3: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Introducción, orígenes, motivaciones

Page 4: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Introducción,orígenes,motivaciones1/3

• El proyecto EPIBASE para desarrollar un sistema de catalogaciónexhaustiva, catálogo y sistema de recuperación especializado endocumentos epigráficos, tiene su origen en el proyecto deinvestigación HAR2015-63637-P aprobado por el Ministerio deEconomía y Competitividad, bajo el título “Escritura expuesta ypoder en España y Portugal (Siglos XVI-XVII): Catálogo epigráficoOn-Line”.

• El proyecto HAR2015-63637-P fue originalmente planteado ydiseñado por el profesor Manuel Ramírez Sánchez de laUniversidad de las Palmas de Gran Canaria.

Page 5: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Introducción,orígenes,motivaciones2/3

Proyectoprincipal• EscrituraexpuestaypoderenEspañayPortugal(siglosXVI-XVII):Catálogoepigráficoon-line

Subproyecto• SistemadecatalogaciónexhaustivadedocumentosepigráficosEPIBASE

Page 6: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Introducción,orígenes,motivaciones3/3

• Elproyectoprincipal,tieneporobjetoelestudiodelasprimerasinscripcioneshumanísticasenlapenínsulaibérica ysuevolución.

• ElperiodoepigráficocomprendidoentrelossiglosXVIyXVII esunodelosmenosestudiadosyelloplanteaunainvestigaciónespecífica.

• Conelobjetivodeproporcionarcoberturatécnicaalosprocesosdecatalogaciónynormalización delosdocumentosepigráficos,seideaunambiciosoplandeingenieríadesoftwareparacrearlamejorbasededatosepigráficaon-line.

Page 7: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Objeto de estudio

Page 8: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Objetodeestudio1/2

• Crearunsistemadecatalogaciónespecializadoendocumentosepigráficos,conlaexperienciadelaCienciadelaDocumentación

• Usarunmodelodedescripciónexhaustivo,extensibleynormalizado

• Proporcionarunaherramientaquepermitalacatalogacióndedetalles

• CompatibilidadconTEI-XML

Page 9: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Objetodeestudio2/2

• Proporcionarbuscadoratextocompleto paraelcatálogoepigráfico

• Gestióndedocumentosepigráficos,fotografíasdedocumentosepigráficos,autoridades,localizaciones,etiquetas,fuentes/bibliografía,migracióndedatos,parámetros,traducciónygestióndeusuarios

• Satisfacerlasnecesidadesdelosinvestigadores

Page 10: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Estado de la cuestión: fuentes

Page 11: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Estadodelacuestión:fuentes1/2

• Epigraphic Database Heidelberg(EDH)- http://edh-www.adw.uni-heidelberg.de/home

• Epigraphic Database Roma(EDR)- http://www.edr-edr.it/en/present_en.php

• HispaniaEpigraphica (EDA-BEA)- http://eda-bea.es/pub/search_select.php?newlang=es

Page 12: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Estadodelacuestión:Fuentes2/2

• TEI:TextEncoding Initiative - http://www.tei-c.org/index.xml

• EpiDoc:Epigraphic Documents inTEIXML-https://sourceforge.net/p/epidoc/wiki/Home/

Page 13: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Metodología

Page 14: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Metodología1/4

• AnálisisdelasbasesdedatosEDH,EDRyEDA-BEA,observandolossiguientesaspectos:

• Característicasprincipales• Funcionalidadesyopciones• Camposdedescripciónparalacatalogacióndedocumentosepigráficos• Gradodenormalización• Compatibilidadconestándares

Page 15: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Metodología2/4

EDH EDR EDA-BEA

Camposdedescripción

Permalink, Transcripción,Mapa,Datación,Textoinscripción,Variantes,Lugardelhallazgo,Lugardeconservación,Idioma,Tipodeinscripción,Material,Descripciónfísica,Técnica,Anotaciones,Autoridades,Nºderegistro,Estadodelaficha,Fechadeactualización,Autordelaficha,Fuentesrelacionadas,Imagen

Nº deregistro,Lugardelhallazgo,Lugardeconservación,Material,Tipodeobjeto,Técnicadeescritura,Idioma,Tipodeinscripción,Bibliografía,Textoinscripción,Variantes,Datación,Autordelaficha,Fechadeactualización,Imagen

Títuloatribuido,nº deregistro,Tipodeobjeto,Palabrasclave,Descripción,Tipodesoporte,Dimensiones,Conservación,Notas,Bibliografía,Autor,Fuentedeinformaciónprincipal,Tipodeinscripción,Textoinscripción,Variantes,Traducción,Descripciónfísica,Datación,Cronología,Lugardehallazgo,Lugardeconservación,Imagen

Nºdecampos 22 15 22

Page 16: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Metodología3/4

EDH EDR EDA-BEA

Funciones Feedback,EpidocXML,Exportación JSON,ExportaciónRDF,Geoposicionamiento,Gestiónbibliográfica,Gestiónfotográfica,Búsquedasencilla,Búsquedaavanzada,Modosdevisualizaciónderesultados

Búsquedasencilla,Búsquedaavanzada,Feedback

Búsquedasencilla,Búsquedaavanzada, Modosdevisualizaciónderesultados

Nºdefunciones 10 3 3

Normalización EpidocXML,JSON,RDF,Pleiades Stoa,EagleNetwork,GeoNames,Trismegistos Geo

Eagle Network,TrismegistosGeo

Eagle Network

NºNormalizaciones 7 2 1

Compatibilidad Sí No No

Page 17: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Metodología4/4

EDH EDR EDA-BEA

Exportación Sí No No

Websemántica Sí No No

Documentosepigráficos 74.606 82.933 30.798

Fotografías 37.683 54.376 30.798?

Fuente:Elaboraciónpropia– 13/10/2017

Page 18: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EDH

Page 19: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EDR

Page 20: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EDA-BEA

Page 21: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo, dificultades y soluciones

Page 22: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo,dificultadesysoluciones1/5Desarrollo

• Entornodedesarrollo:Apache,PHP,MySQL

• Opciones:Catalogación,Fototeca,Autoridades,Etiquetas,Fuentes,Lugares,Migración,Mantenimiento,Buscador/Catálogo,Parámetros,Traducción/Multilingüe,Gestióndeusuarios

• Tablasdebasededatos:Autoridades,Catálogo,Categorías,Etiquetas,Fuentes

Page 23: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo,dificultadesysoluciones2/5Aspectosdiferenciadores

• MétododedescripciónbasadoenlosprincipiosdelaDocumentaciónylaEpigrafía

• Altoniveldenormalización.Epidoc-XML,RDF,SQL,CSV,EagleNetwork,GoogleMaps,Pleiades Stoa,GeoNames,Trismegistos Geo

• GeneraciónautomáticadearchivosEpidoc-XML

• MétododepreservacióndigitaldeimágenesmediantecodificaciónBASE64

Page 24: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo,dificultadesysoluciones3/5• Gestióndefotografíasycatalogacióndedetallesbasadosenmicrofotografías

• Recuperaciónbasadaenfichasepigráficas,autoridades,fuentes,lugares,fotografíasysusdetalles

• Aplicaciónconeditorgráficoparalosrecortesdedetalles

Dificultades

• Gestióndeidentificadoresdedetallesdelasfotografías

Page 25: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo,dificultadesysoluciones4/5• DesarrollodeexpresionesregulareseinteligenciaartificialparareconocerlasinscripcionesygenerarlosarchivosEpidoc-XML

• ComplejidaddelformatoEpidoc-XML,altísimoniveldejerarquización deetiquetas

Soluciones

• Creacióndeunapantalladecatalogaciónintegradacongestióndeautoridades,localizaciones,etiquetas,fotografías,detallesybibliografía

Page 26: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Desarrollo,dificultadesysoluciones5/5• Diseñodeunesquemadecatalogacióncompatible conloscamposdedescripciónpresentesenEDH,EDR,EDA-BEA

• DesarrollodeunnuevomodeloderepresentaciónXML,paradocumentosepigráficosfundamentadoenEpidocyTEI,quesimplifiquelajerarquizaciónylecturadelainformación

• Gestiónintegraldeparámetrosinvolucradosenlacatalogación:Idioma,Limbo,Material,Tipodematerial,Ocupación,Culto/Religión,Estadodeconservación,Estadodelaficha,Técnica,Tipodeautoridad,Tipodedocumento,Tipodeinscripción,Tipodeobjeto,Tipodelugar.

Page 27: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Programa EPIBASE

Page 28: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

ProgramaEPIBASE1/2

Esquemadecatalogación

URLimagenenaltaresolución,CódigodelaimagenenBase64,Identificadoresdedetalles,Estadodelaficha,Camposdecontrol1-5,Títulopropiamentedicho,Otrostítulos,Descripcióngeneral,Inscripción,Transliteración,Traducción,Datación,Contextossocial-político-económico-legal-histórico-militar-geográfico-religioso,Autoridades,Palabrasclave,Tipodeobjeto,Material-Soporte,Técnica,Religión,Tipodeinscripción,Idioma,Lugardelhallazgo,Lugardepreservación,Estadodeconservación,Descripciónfísica,Bibliografía

Page 29: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EPIBASE

Pantallaprincipaldecatalogación

Page 30: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Pantalladeedicióndeparámetros

Page 31: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

EstructuradelatabladecatalogacióndelprogramaEPIBASE.Disponede48camposdedescripción.

Page 32: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

ProgramaEPIBASE2/2

VisióndelprogramaEPIBASE

VisióncompletadelapantallaDecatalogaciónyparametrización

Page 33: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Conclusiones

Page 34: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Conclusiones1/2

• ElproyectoEPIBASEplanteaunmodelodecatalogaciónexhaustivadedocumentosepigráficos,normalizado,interoperableycompatibleconotrosproyectoseuropeos.

• EPIBASEproyectamejorescapacidadesderecuperaciónalproporcionarrecortesdelasfotografías,detalles catalogados,quepermitengenerarnuevasrelacionessemánticasentreelementossemejantes.Estacaracterísticaabriránuevasvíasdeinvestigaciónyanálisisdelosdocumentosepigráficos.

Page 35: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Conclusiones2/2

• ElprogramaEPIBASEplanteamétodosdepreservacióninnovadoresbasadosenlacodificacióndelasimágenesenformatotextoBASE64quepermiteguardarlasimágenessinpérdidadecalidad,tantoenbasededatos,comoenarchivodetexto.

• EldesarrollodelprogramaEPIBASEplantearáunasolucióntécnicaalageneraciónautomáticadearchivosEpidoc-XML.Sinembargo,sepropondráeintegraráunnuevométododerepresentaciónXMLmássencilloyfácilmentelegibleporprogramasPARSEReinvestigadores.

Page 36: EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. · Introducción, orígenes, motivaciones 3/3 •El proyecto principal, tiene por objeto el

Prof. Manuel Blázquez Ochando. Dpto. Biblioteconomía yDocumentación. Universidad Complutense de [email protected]

Prof. Manuel Ramírez Sánchez. Instituto Universitario deAnálisis y Aplicaciones Textuales. Universidad de Las Palmasde Gran Canaria. [email protected]

Profa. Catarina Gaspar. Centro de Estudos Clássicos.Universidade de Lisboa. [email protected]