EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...
Transcript of EPIHUM: Desarrollo del corpus online de inscripciones latinas de … · 2020. 10. 23. ·...
EPIHUM:DesarrollodelcorpusonlinedeinscripcioneslatinasdeEspañayPortugalduranteelRenacimiento
Prof.ManuelBlázquezOchando.Dpto.BiblioteconomíayDocumentació[email protected]
Prof.ManuelRamírezSánchez.InstitutoUniversitariodeAnálisisyAplicacionesTextualesUniversidaddeLasPalmasdeGranCanaria.manuel.ramirez@ulpgc.es
Profa.CatarinaGaspar.CentrodeEstudos ClássicosUniversidade [email protected]
Índice
� Introducción, orígenes, motivaciones
� Objeto de estudio
� Estado de la cuestión: fuentes
� Metodología
� Desarrollo, dificultades y soluciones
� Programa EPIBASE
� Conclusiones
Introducción, orígenes, motivaciones
Introducción,orígenes,motivaciones1/3
• El proyecto EPIBASE para desarrollar un sistema de catalogaciónexhaustiva, catálogo y sistema de recuperación especializado endocumentos epigráficos, tiene su origen en el proyecto deinvestigación HAR2015-63637-P aprobado por el Ministerio deEconomía y Competitividad, bajo el título “Escritura expuesta ypoder en España y Portugal (Siglos XVI-XVII): Catálogo epigráficoOn-Line”.
• El proyecto HAR2015-63637-P fue originalmente planteado ydiseñado por el profesor Manuel Ramírez Sánchez de laUniversidad de las Palmas de Gran Canaria.
Introducción,orígenes,motivaciones2/3
Proyectoprincipal• EscrituraexpuestaypoderenEspañayPortugal(siglosXVI-XVII):Catálogoepigráficoon-line
Subproyecto• SistemadecatalogaciónexhaustivadedocumentosepigráficosEPIBASE
Introducción,orígenes,motivaciones3/3
• Elproyectoprincipal,tieneporobjetoelestudiodelasprimerasinscripcioneshumanísticasenlapenínsulaibérica ysuevolución.
• ElperiodoepigráficocomprendidoentrelossiglosXVIyXVII esunodelosmenosestudiadosyelloplanteaunainvestigaciónespecífica.
• Conelobjetivodeproporcionarcoberturatécnicaalosprocesosdecatalogaciónynormalización delosdocumentosepigráficos,seideaunambiciosoplandeingenieríadesoftwareparacrearlamejorbasededatosepigráficaon-line.
Objeto de estudio
Objetodeestudio1/2
• Crearunsistemadecatalogaciónespecializadoendocumentosepigráficos,conlaexperienciadelaCienciadelaDocumentación
• Usarunmodelodedescripciónexhaustivo,extensibleynormalizado
• Proporcionarunaherramientaquepermitalacatalogacióndedetalles
• CompatibilidadconTEI-XML
Objetodeestudio2/2
• Proporcionarbuscadoratextocompleto paraelcatálogoepigráfico
• Gestióndedocumentosepigráficos,fotografíasdedocumentosepigráficos,autoridades,localizaciones,etiquetas,fuentes/bibliografía,migracióndedatos,parámetros,traducciónygestióndeusuarios
• Satisfacerlasnecesidadesdelosinvestigadores
Estado de la cuestión: fuentes
Estadodelacuestión:fuentes1/2
• Epigraphic Database Heidelberg(EDH)- http://edh-www.adw.uni-heidelberg.de/home
• Epigraphic Database Roma(EDR)- http://www.edr-edr.it/en/present_en.php
• HispaniaEpigraphica (EDA-BEA)- http://eda-bea.es/pub/search_select.php?newlang=es
Estadodelacuestión:Fuentes2/2
• TEI:TextEncoding Initiative - http://www.tei-c.org/index.xml
• EpiDoc:Epigraphic Documents inTEIXML-https://sourceforge.net/p/epidoc/wiki/Home/
Metodología
Metodología1/4
• AnálisisdelasbasesdedatosEDH,EDRyEDA-BEA,observandolossiguientesaspectos:
• Característicasprincipales• Funcionalidadesyopciones• Camposdedescripciónparalacatalogacióndedocumentosepigráficos• Gradodenormalización• Compatibilidadconestándares
Metodología2/4
EDH EDR EDA-BEA
Camposdedescripción
Permalink, Transcripción,Mapa,Datación,Textoinscripción,Variantes,Lugardelhallazgo,Lugardeconservación,Idioma,Tipodeinscripción,Material,Descripciónfísica,Técnica,Anotaciones,Autoridades,Nºderegistro,Estadodelaficha,Fechadeactualización,Autordelaficha,Fuentesrelacionadas,Imagen
Nº deregistro,Lugardelhallazgo,Lugardeconservación,Material,Tipodeobjeto,Técnicadeescritura,Idioma,Tipodeinscripción,Bibliografía,Textoinscripción,Variantes,Datación,Autordelaficha,Fechadeactualización,Imagen
Títuloatribuido,nº deregistro,Tipodeobjeto,Palabrasclave,Descripción,Tipodesoporte,Dimensiones,Conservación,Notas,Bibliografía,Autor,Fuentedeinformaciónprincipal,Tipodeinscripción,Textoinscripción,Variantes,Traducción,Descripciónfísica,Datación,Cronología,Lugardehallazgo,Lugardeconservación,Imagen
Nºdecampos 22 15 22
Metodología3/4
EDH EDR EDA-BEA
Funciones Feedback,EpidocXML,Exportación JSON,ExportaciónRDF,Geoposicionamiento,Gestiónbibliográfica,Gestiónfotográfica,Búsquedasencilla,Búsquedaavanzada,Modosdevisualizaciónderesultados
Búsquedasencilla,Búsquedaavanzada,Feedback
Búsquedasencilla,Búsquedaavanzada, Modosdevisualizaciónderesultados
Nºdefunciones 10 3 3
Normalización EpidocXML,JSON,RDF,Pleiades Stoa,EagleNetwork,GeoNames,Trismegistos Geo
Eagle Network,TrismegistosGeo
Eagle Network
NºNormalizaciones 7 2 1
Compatibilidad Sí No No
Metodología4/4
EDH EDR EDA-BEA
Exportación Sí No No
Websemántica Sí No No
Documentosepigráficos 74.606 82.933 30.798
Fotografías 37.683 54.376 30.798?
Fuente:Elaboraciónpropia– 13/10/2017
EDH
EDR
EDA-BEA
Desarrollo, dificultades y soluciones
Desarrollo,dificultadesysoluciones1/5Desarrollo
• Entornodedesarrollo:Apache,PHP,MySQL
• Opciones:Catalogación,Fototeca,Autoridades,Etiquetas,Fuentes,Lugares,Migración,Mantenimiento,Buscador/Catálogo,Parámetros,Traducción/Multilingüe,Gestióndeusuarios
• Tablasdebasededatos:Autoridades,Catálogo,Categorías,Etiquetas,Fuentes
Desarrollo,dificultadesysoluciones2/5Aspectosdiferenciadores
• MétododedescripciónbasadoenlosprincipiosdelaDocumentaciónylaEpigrafía
• Altoniveldenormalización.Epidoc-XML,RDF,SQL,CSV,EagleNetwork,GoogleMaps,Pleiades Stoa,GeoNames,Trismegistos Geo
• GeneraciónautomáticadearchivosEpidoc-XML
• MétododepreservacióndigitaldeimágenesmediantecodificaciónBASE64
Desarrollo,dificultadesysoluciones3/5• Gestióndefotografíasycatalogacióndedetallesbasadosenmicrofotografías
• Recuperaciónbasadaenfichasepigráficas,autoridades,fuentes,lugares,fotografíasysusdetalles
• Aplicaciónconeditorgráficoparalosrecortesdedetalles
Dificultades
• Gestióndeidentificadoresdedetallesdelasfotografías
Desarrollo,dificultadesysoluciones4/5• DesarrollodeexpresionesregulareseinteligenciaartificialparareconocerlasinscripcionesygenerarlosarchivosEpidoc-XML
• ComplejidaddelformatoEpidoc-XML,altísimoniveldejerarquización deetiquetas
Soluciones
• Creacióndeunapantalladecatalogaciónintegradacongestióndeautoridades,localizaciones,etiquetas,fotografías,detallesybibliografía
Desarrollo,dificultadesysoluciones5/5• Diseñodeunesquemadecatalogacióncompatible conloscamposdedescripciónpresentesenEDH,EDR,EDA-BEA
• DesarrollodeunnuevomodeloderepresentaciónXML,paradocumentosepigráficosfundamentadoenEpidocyTEI,quesimplifiquelajerarquizaciónylecturadelainformación
• Gestiónintegraldeparámetrosinvolucradosenlacatalogación:Idioma,Limbo,Material,Tipodematerial,Ocupación,Culto/Religión,Estadodeconservación,Estadodelaficha,Técnica,Tipodeautoridad,Tipodedocumento,Tipodeinscripción,Tipodeobjeto,Tipodelugar.
Programa EPIBASE
ProgramaEPIBASE1/2
Esquemadecatalogación
URLimagenenaltaresolución,CódigodelaimagenenBase64,Identificadoresdedetalles,Estadodelaficha,Camposdecontrol1-5,Títulopropiamentedicho,Otrostítulos,Descripcióngeneral,Inscripción,Transliteración,Traducción,Datación,Contextossocial-político-económico-legal-histórico-militar-geográfico-religioso,Autoridades,Palabrasclave,Tipodeobjeto,Material-Soporte,Técnica,Religión,Tipodeinscripción,Idioma,Lugardelhallazgo,Lugardepreservación,Estadodeconservación,Descripciónfísica,Bibliografía
EPIBASE
Pantallaprincipaldecatalogación
Pantalladeedicióndeparámetros
EstructuradelatabladecatalogacióndelprogramaEPIBASE.Disponede48camposdedescripción.
ProgramaEPIBASE2/2
VisióndelprogramaEPIBASE
VisióncompletadelapantallaDecatalogaciónyparametrización
Conclusiones
Conclusiones1/2
• ElproyectoEPIBASEplanteaunmodelodecatalogaciónexhaustivadedocumentosepigráficos,normalizado,interoperableycompatibleconotrosproyectoseuropeos.
• EPIBASEproyectamejorescapacidadesderecuperaciónalproporcionarrecortesdelasfotografías,detalles catalogados,quepermitengenerarnuevasrelacionessemánticasentreelementossemejantes.Estacaracterísticaabriránuevasvíasdeinvestigaciónyanálisisdelosdocumentosepigráficos.
Conclusiones2/2
• ElprogramaEPIBASEplanteamétodosdepreservacióninnovadoresbasadosenlacodificacióndelasimágenesenformatotextoBASE64quepermiteguardarlasimágenessinpérdidadecalidad,tantoenbasededatos,comoenarchivodetexto.
• EldesarrollodelprogramaEPIBASEplantearáunasolucióntécnicaalageneraciónautomáticadearchivosEpidoc-XML.Sinembargo,sepropondráeintegraráunnuevométododerepresentaciónXMLmássencilloyfácilmentelegibleporprogramasPARSEReinvestigadores.
Prof. Manuel Blázquez Ochando. Dpto. Biblioteconomía yDocumentación. Universidad Complutense de [email protected]
Prof. Manuel Ramírez Sánchez. Instituto Universitario deAnálisis y Aplicaciones Textuales. Universidad de Las Palmasde Gran Canaria. [email protected]
Profa. Catarina Gaspar. Centro de Estudos Clássicos.Universidade de Lisboa. [email protected]