TECNOLOGÍAS DE APOYO PARA LA PRESERVACIÓN DIGITAL EN REVISTAS

Post on 02-Jul-2022

5 views 0 download

Transcript of TECNOLOGÍAS DE APOYO PARA LA PRESERVACIÓN DIGITAL EN REVISTAS

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

TECNOLOGÍAS DE APOYO PARA LA PRESERVACIÓN DIGITAL EN REVISTAS

JOEL TORRES

1

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Introducción

Breve introducción que nos

permitirá conocer acerca de

este interesante tema.

Convert2XML

Preparación, descarga,

instalación, configuración y

uso del sistema.

Marcalyc

Preparación, descarga,

instalación, configuración y

uso del sistema.

Más opciones

Visores, otros convertidores,

otras herramientas, etc.

01 02 03 04

Temas a conversarLista de temas a conversar durante la sesión de hoy

2

><

01Reflexión inicial

Breve introducción que nos permitirá conocer acerca de este interesante tema.

Introducción

3

Fuente de las imágenes: Revista InfoWorld (19-Feb-1990) pp. 82-83 / Revista PC Magazine (May 30,1989) pp.12 / PC Magazine (13-Dec-1988) pp.21

a)CÓMO FUNCIONA EL INTERNET Y LA WEB

><

Es una red de computadoras

Consecuencia de la Guerra Fría

Creada en 1969 en Estados Unidos: se llamó Arpanet

Cooperación de las universidades y el Departamento de Defensa

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es el Internet?

5

><

Correo electrónico. 1971, Ray Tomlinson

Chat (o IRC).1988, en Finlandia

Transferencia de archivos

Foros de discusión

World Wide Web, 1989, Tim Berners Lee

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Incluye muchos servicios

6

><

En 1980, cubría casi todo EEUU y llegaba a Londres. Eran 200 computadoras conectadas.

Fines de 1985, eran 2.000 computadoras.

1983, se crea Milnet para uso militar y Arpanet queda para uso científico

Primeras redes comerciales: Compuserve (1979), America Online (1985) y Prodigy (1986).

A partir de 1991, se integran todas en Internet.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Evolución de Internet

7

><

“La cara gráfica de Internet” (Piscitelli).

La parte multimedia de Internet.

Es un espacio de almacenamiento y un sistema de publicación mundial al que se accede en cualquier momento y desde cualquier lugar.

Compuesta por millones de sitios web, cada uno de los cuales puede tener varias páginas.

Web: Hipertexto + Internet.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es la Web?

8

><

Se inventó en 1989, en el CERN (Suiza)

Tres inventos: - el HTTP: lenguaje para comunicarse entre las computadoras - UN TUBO

- PUERTOS = Varios CANALES (tubos pequeños) / estaciones de radio / Whats

- la URL : localizador de la información - UNA SALIDA

-el HTML: el lenguaje hipertextual - EL CONTENIDO DEL TUBO

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es la Web?

9

Tim Berners-Lee (1955)

><

1993: navegador Mosaic (Marc Andreessen)

1994: navegador Netscape

1995: salto espectacular

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Varios años hasta que se popularizó

10

a)¿QUÉ ES UN SERVIDOR WEB?

><

Una computadora que tiene un sistema que puede almacenar las páginas.

Esa computadora está siempre conectada a la red y encendida = Escuchando

Cuando alguien escribe una URL, SIEMPRE llega a un servidor.

El servidor usa HTTP para enviar las páginas (la información) que contiene a la computadora de un usuario.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es un servidor web?

12

><

Linux = Apache

Microsoft = Internet Information Server (IIS)

ANTES = Línea de comandos

AHORA = Interfase gráfica

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es un servidor web?

13

a)¿WEBSERVICE? ¿PLUG-IN?

><

Webservice = Un sistema alojado en un servidor web, que está “escuchando” a que otros sistemas de Internet le pidan cosas. Es un sistema que atiende a muchos sistemas. Ej. DOI / HANDLE

Plug In = Un módulo que se instala dentro de un sistema, que extiende sus capacidades o sus funciones. Ej. Mendeley dentro de Word.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 15

a)SOFTWARE LIBRE

a)¿QUÉ ES GITHUB?

><

UN REPOSITORIO DE SOFTWARE

Documentación

Colaboradores

Control de versiones

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 18

a)LA PUBLICACIÓN CIENTÍFICA EN LÍNEA

><

Web - 1990 - Solo se publicaba texto

Web 2.0 - Promueve interacción social

Web semántica - Metadatos y significado a la información publicada

Web ubicua - Portabilidad de los contenidos en cualquier dispositivo y lugar donde el usuario se encuentre

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 20

a)

HTML / XML FORMATOS ABIERTOS

><

Acuerdos

Interoperabilidad

Evita apropiaciones por parte de la industria privada

Acceso abierto - no cajas negras

Obligado - Gobiernos, iniciativas públicas, etc.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Por qué son importantes los estándares abiertos

22

><

Comúnmente se requiere combinar datos en Internet

Los humanos entendemos cómo combinar información

Las máquinas no son lo suficientemente inteligentes

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Semántica en la información

23

><

Analogía de lo que le decimos a un perro:

Lo que el humano dice: "No te acerques a la basura Lucky, ni se te ocurra sacarla del cesto"

Lo que el perro escucha "Bla Bla Bla Bla Bla Lucky, Bla Bla Bla Bla"

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Por qué las máquinas no entienden?

24

a)VENTAJAS DEL XML

><

Lenguaje de meta-marcado

Método uniforme para describir e intercambiar datos estructurados

Describe la estructura y semántica (contenido)

NO DESCRIBE EL FORMATO

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

¿Qué es el XML?

26

><

El contenido es separado de cualquier noción de presentación

Estándar internacional independiente de las plataformas

XML formato abierto que puede ser interpretado por cualquier aplicación

XML es comunicación en un mismo lenguaje

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Importancia

27

><

El XML se prevé más duradero que los formatos de programas de propiedad por lo tanto es útil para la preservación digital

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

XML en la preservación digital

28

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

XML en la recuperación de información

29

><

Estándar técnico que define formato XML para describir una estructura, semántica y metadatos para contenido digital científico

Provee conjunto de elementos y atributos XML para describir contenido gráfico y de texto de artículos de revista.

Es usado por; Publicaciones académicas Bibliotecas y archivos Sistemas de indización Comunidades de preservación Proveedores de servicio de publicación Editores académicos

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

XML - JATS : Revistas científicas

30

><

02Convert2XML

Convert2XML

• Funcionalidad y características31

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

010203

2011

Iniciamos trabajo con las revistas mexicanas y con su transición hacia OJS

2014

A c e r c a m i e n t o c o n S c i E L O M é x i c o y nacimiento de la idea

2015

Se inician trabajos de desarrollo para liberar una primera versión

040506

2015

Primera versión, que convierte por completo y hace un marcado básico

2016

Problema de diseño, era necesario modificar una liga

2017

Se libera versión 1.6, que opera transparente y más ágil

Convert2XML

32

https://github.com/escire/Convert2XML

><

f in t @ f in t @ f in t @

Libertad

Es un plugin desarrollado por eScire bajo licencia GNU GPL que funciona desde OJS versión 2.8.X

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Simplicidad

Parte de un archivo en Word formateado en el esquema del Scielo Publishing Schema (SPS)

Interoperabilidad

Resultado: XML-JATS que puede integrarse a OJS y que es interoperable con PubMed y Redalyc, así como cualquier otra plataforma que acepte este formato

Principales características

33

01 02 03

><

1. Webservice instalado y configurado en un servidor en línea.

2. Plugin Convert2XML instalado y configurado en el OJS de la revista.

3. Plugin

Requerimientos

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

><

Instalación del Webservice

01Instalación de

PlugIns

02Preparación de archivos

03

Servidor Windows Open Journal Systems MS Word

IIS Express (Freeware) GitHub / PKP Scielo Publishing Schema

Personal de informática Editor de la revista Equipo editorial

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

><

Instalación del Webservice

011. Descarga de Convert2XML

1.1. Descargar desde Github 1.2. Se acomoda en Raíz

2. Descarga de IIS Express 2.1. Instalación 2.2. Edición de archivo de configuración

2.2.1. Sección <Sites> 2.2.2.Sección <bindings)

3. Configuración de Conver2XML 3.1. Edición del archivo Webconfig.

3.1.1. Creación de carpetas de datos. 3.1.2. Configuración de URL pública. 3.1.3. Ajustes a la sección de sinónimos. 3.1.4. Ajustes a la sección de formatos de archivo. 3.1.5. Ajustes a la sección de personalización de errores. 3.1.6. Creación de archivo .bat

3.2. Alta de la aplicación en IIS Express 4. Confirmación del servicio en línea

><

1. Descarga el archivo convert2xml.tar.gz 2. En OJS - Liga para administrar como gestor 3. Seleccionar - Módulos del sistema / Instalar un nuevo módulo 4. Subir e instalar el archivo convert2xml.tar.gz 5. Regresar a la gestión de módulos y elegir módulos genéricos 6. Ubicar el modulo de Convert2XML, dar clic en Habilitar 7. Configuración del módulo Convert2XML 8. Cambiar la URL del servicio (webservice) 9. Comprobar que los requisitos se cumplan 10.Regresar a la gestión de módulos y elegir módulos genéricos. 11.Ubicar el módulo de galerada XML y dar clic en Habilitar. 12.Al recargarse la página dar clic en Configuración del módulo de galerada XML 13.Hoja de estilo XSL, seleccionar Hoja de estilos XSL personalizada 14.Página del proyecto Convert2XML en Github, descargar el archivo jats-html.xsl 15.Volver a OJS y en la opción para subir la hoja personalizada, seleccionar la

descargada de Github y cargarla

Instalación de PlugIns

02

><

1. En OJS / Área personal / Gestor de la revista 2. Opción Importar/Exportar datos y elegir la opción Módulo QuickSubmit 3. Cargar un archivo Word de prueba, para metadatos, el archivo se borrará 4. Ir al Área personal y seleccionar el enlace de Editor/a 5. Elegir el enlace de Números anteriores 6. Ubicar el número y articulo que se cargo, dar clic en el titulo del articulo 7. En la página que se carga, dar clic en Edición 8. Ubicar el plugin Convert2XML y dar clic en su enlace Convertir articulo 9. Se descarga un comprimido en formato zip - descomprimirlo 10.En la sección Maquetación hay que ubicar el archivo que se subió

previamente y eliminarlo 11.En la sección Maquetación cargar archivo elegir Galerada, seleccionar y cargar

el archivo XML que se descargo en el paquete generado por el convertidor 12.En la siguiente página modificar los datos del articulo de acuerdo a sus

necesidades, e ir a la sección imágenes para cargar desde ahí todas las imágenes que se descargaron en el mismo paquete generado por el convertidor.

13.Ir a la sección Archivos, ubicar el número y articulo que se subió 14.Dar clic en la visualización XML del articulo que se subió 15.Comprobar la estructura del articulo que haya sido detectada correctamente

Preparación de archivos

03

><

1.Instalación del Plug-In 2.Preparado de archivos 3.Conversión

Ejercicio

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL 40

Marcalyc

AccesibleDesarrollada por Redalyc para revistas de esta colección

En líneaFunciona desde el sitio de Redalyc con una cuenta por cada revista

EstandarizadaConversión a XML JATS a partir de HTML que puede ser construido desde Word o InDesign

PortableA partir del archivo final en

XML JATS es factible recuperar: PDF, ePub, HTML

InteroperableLos productos que se recuperan a partir del

XML JATS e incluso el mismo XML puede llevarse hacia OJS

NavegableRedalyc ofrece un visor

inteligente para las revistas que ya

entreguen sus artículos en XML JATS

http://marcalyc.redalyc.org/

><

04Conclusiones

Otras opciones que es necesario mencionar

Más opciones

41

><

Convertidor de PKP.

Visores de XML.

Formatos de salida.

III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

Más opciones

42

><III SEMINARIO INTERNACIONAL DE PRESERVACIÓN DIGITAL

OBRIGADOJOEL TORRES

43